JPH041827A - Fault restoration system for computer - Google Patents

Fault restoration system for computer

Info

Publication number
JPH041827A
JPH041827A JP2103795A JP10379590A JPH041827A JP H041827 A JPH041827 A JP H041827A JP 2103795 A JP2103795 A JP 2103795A JP 10379590 A JP10379590 A JP 10379590A JP H041827 A JPH041827 A JP H041827A
Authority
JP
Japan
Prior art keywords
package
robot
computer system
computer
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2103795A
Other languages
Japanese (ja)
Inventor
Hiroshi Hasegawa
宏 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2103795A priority Critical patent/JPH041827A/en
Publication of JPH041827A publication Critical patent/JPH041827A/en
Pending legal-status Critical Current

Links

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

PURPOSE:To automatically, quickly and accurately restore a hardware fault by combining the output of a diagnostic program with an unmanned robot which switches a fault suspected package to a stand-by package. CONSTITUTION:A fully automatic fault restoring robot 3 starts a manual diagnostic program of a computer system 1 via an interface device 2 for robot 3. The computer system 1 transmits the running result of the manual diagnostic program to the robot 3 via the device 2. Thus the robot 3 stops its operation when deciding that the fault of the system 1 is restored. If the robot 3 decides that the fault of the system 1 is not restored yet, the robot 3 takes successively the stand-by packages out of a stand-by package store shelf 4 in response to other fault suspected packages and repeats the same operations. As a result, a hardware fault is automatically, quickly and accurately restored.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はコンピュータの障害復旧システムに関し、特に
コンピュータシステムのハードウェア障害時、自動診断
プログラムにより指摘される被疑パッケージ情報に従い
障害パッケージを取替え、障害を復旧するコンピュータ
の障害復旧システムに関する。
[Detailed Description of the Invention] [Field of Industrial Application] The present invention relates to a computer failure recovery system, and in particular, when a computer system hardware failure occurs, the failure package is replaced according to suspect package information pointed out by an automatic diagnostic program, and the failure recovery system is performed. Concerning a computer disaster recovery system for recovering.

〔従来の技術〕[Conventional technology]

従来、この種の障害復旧システムでは、コンピュータシ
ステムのハードウェア障害時に自動診断プログラムによ
り指摘される被疑障害ノ<・ソケージ情報に従い、コン
ピュータシステムの保守員が、診断辞書及びパッケージ
実装図を索引、参照してパッケージ名とその実装位置を
知り、障害パッケージを取替え障害を復旧する方式とな
っている。
Conventionally, in this type of failure recovery system, computer system maintenance personnel index and refer to diagnostic dictionaries and package implementation diagrams in accordance with suspected failure information pointed out by an automatic diagnostic program when a computer system hardware failure occurs. The system uses this method to learn the package name and its implementation location, and then replace the faulty package to recover from the fault.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

上述したように従来の障害復旧システムでは、保守員が
自動診断プログラムにより指摘される被疑障害パッケー
ジを取替え、障害を復旧させる方式となっているので、
保守員が不慣れの場合には作業ミスを誘発することがあ
り、又、障害復旧のためにはパッケージ交換を行う保守
員をコンピュータシステムの設置場所へ派遣する必要が
あるため、特に、コンピュータシステムの遠隔保守を行
う場合、障害復旧に時間がかかるとし)う問題点がある
As mentioned above, in conventional fault recovery systems, maintenance personnel replace the suspected faulty package pointed out by an automatic diagnostic program to recover from the fault.
If maintenance personnel are inexperienced, this may lead to work errors, and in order to recover from failures, maintenance personnel must be dispatched to the computer system installation site to replace the package. When performing remote maintenance, there is a problem that failure recovery takes time.

本発明の目的は、コンビュータシステムノ1−ドウエア
の障害復旧を自動的に短時間に且つ正確に行うことがで
きるコンピュータの障害復旧システムを提供することに
ある。
An object of the present invention is to provide a computer failure recovery system that can automatically perform failure recovery of computer system hardware in a short time and accurately.

〔課題を解決するための手段〕[Means to solve the problem]

本発明のコンピュータの障害復旧システムは、ハードウ
ェア障害発生時、自動診断プログラムによって指摘され
る被疑障害パッケージ情報にもとづき被疑障害パッケー
ジを取替え、障害を復旧するコンピュータの障害復旧シ
ステムにおいて、前記被疑パッケージ情報を出力するコ
ンピュータシステムと: 前記コンピュータシステムに実装されている全てのパッ
ケージの実装位置情報と、保管棚に保管されている全て
の予備パッケージの前記保管棚における位置情報と、パ
ッケージ交換のための移動。
The computer failure recovery system of the present invention replaces a suspected failure package based on the suspected failure package information pointed out by an automatic diagnostic program when a hardware failure occurs, and recovers from the failure. and a computer system that outputs: mounting position information of all packages mounted in the computer system, position information of all spare packages stored in storage shelves on the storage shelves, and movement for package replacement. .

取出し、挿入動作を行う手段及びその動作のための情報
とを有し、前記コンピュータシステムから出力された被
疑障害パッケージ情報を受信し、前記保管棚まで移動し
該当の予備パッケージを取出し保持すると共に前記被疑
パッケージの実装位置まで移動し前記被疑パッケージを
前記該当の予備パッケージに交換後、前記コンピュータ
の手動診断プログラムを起動し、障害復旧を確認する無
人ロボットと。
It has means for performing ejecting and inserting operations and information for the operations, and receives information on suspected defective packages output from the computer system, moves to the storage shelf, takes out and holds the corresponding spare package, and An unmanned robot that moves to a mounting position of a suspect package, replaces the suspect package with the corresponding spare package, then starts a manual diagnosis program of the computer and confirms failure recovery.

前記コンピュータシステムと前記無人口ボ・ノドとの間
の情報伝達を行うインタフェース装置と;前記無人ロボ
ットが前記コンピュータシステムと前記保管棚との間を
移動するためのレールとを備える構成である。
The present invention is configured to include an interface device for transmitting information between the computer system and the unmanned robot; and a rail for the unmanned robot to move between the computer system and the storage shelf.

〔実施例〕〔Example〕

次に、本発明の実施例について図面を参照して説明する
6 第1図は本発明の一実施例を説明するための図である。
Next, an embodiment of the present invention will be described with reference to the drawings.6 FIG. 1 is a diagram for explaining an embodiment of the present invention.

コンピュータの障害復旧システムは、コンピュータシス
テム1と、障害復旧ロボ・7ト用インタフエース装W2
と、無人の全自動障害復旧ロボット3と、予備パッケー
ジ保管fll14と、移動用レール5とを備える。コン
ピュータシステム1は、ハードウェア障害発生時に自動
診断を行い、被疑障害パッケージに関する情報を障害復
旧ロボット用インタフェース装置2を介して全自動障害
復旧ロボット3へ出力する機能を有する。全自動障害復
旧ロボット3は、コンピュータシステム1に実装されて
いるパッケージの実装位置情報。
The computer failure recovery system includes a computer system 1 and a failure recovery robot/interface unit W2.
, an unmanned fully automatic failure recovery robot 3, a spare package storage 14, and a moving rail 5. The computer system 1 has a function of automatically diagnosing a hardware fault when it occurs and outputting information regarding a suspected faulty package to a fully automatic fault recovery robot 3 via a fault recovery robot interface device 2 . The fully automatic failure recovery robot 3 provides mounting position information of packages installed in the computer system 1.

予備バラゲージ保管棚4内の全ての予備パッケージ実装
位置情報、コンピュータシステム1内の被疑障害パッケ
ージ実装位置及び予備パッケージ保管棚4内の予備パッ
ケージ実装位置まで移動用レール5の上を移動するため
の機能、パッケージ取外し挿入を行う腕とその動作のた
めの情報及びコンピュータシステム1の手動診断プログ
ラムを起動し障害復旧を確認する機能を有する。予備パ
ッケージ保管棚4には、コンピュータシステム1に実装
されている全てのパッケージの予備が保管され、コンピ
ュータシステム1の障害復旧のために予備パッケージが
使用された場合には保守者が該当パッケージを補充する
こととし、コンピュータシステム1に実装されている全
てのパッケージの予備が、常時ある一定数量保管されて
いるものとする。
A function for moving on the moving rail 5 to all the spare package mounting position information in the spare package storage shelf 4, the suspected failure package mounting position in the computer system 1, and the spare package mounting position in the spare package storage shelf 4. , an arm for removing and inserting a package, information for its operation, and a function for starting a manual diagnosis program of the computer system 1 and confirming failure recovery. The spare package storage shelf 4 stores spares of all the packages installed in the computer system 1, and when a spare package is used for failure recovery of the computer system 1, a maintenance person replenishes the corresponding package. It is assumed that a certain number of spares of all the packages installed in the computer system 1 are always stored.

以下に動作を説明する。コンピュータシステム1におい
てハードウェア障害が発生した場合、コンピュータシス
テム1は自動診断プログラムを起動し、それにより得ら
れる被疑障害パッケージ情報を障害復旧ロボット用イン
タフェース装M2を介して全自動障害復旧ロボット3へ
出力する。全自動障害復旧ロボット3は、移動用レール
5の上を予備パッケージ保管棚4の場所まで移動し被疑
障害パッケージ情報をもとに被疑障害パッケージの予備
パッケージを自身の腕により取出し保持する。次に、全
自動障害復旧ロボット3は、被疑障害パッケージ情報を
もとにコンピュータシステム1の被疑障害パッケージ位
置まで移動用レール5の上を移動し、被疑障害パッケー
ジを自身の腕により取出し、保持している予備パッケー
ジを自身の腕により該当の位置へ挿入する0次に、全自
動障害復旧ロボット3はコンピュータシステム1の手動
診断プログラムを障害復旧ロボット用インタフェース装
置2を介して起動し、コンピュータシステム1は手動診
断プログラムの走行結果を障害復旧ロボット用インタフ
ェース装置2を介して全自動障害復旧ロボット3へ伝達
する。その結果、全自動障害復旧ロボット3はコンピュ
ータシステム1の障害が復旧したと判断した場合には、
動作を停止し、又、復旧していないと判断した場合には
、順次、他の被疑障害パッケージに対応して、予備パラ
ゲージ保管棚4に保管されている予備パッケージを取出
し、前述したと同様な動作を繰返す。
The operation will be explained below. When a hardware failure occurs in the computer system 1, the computer system 1 starts an automatic diagnosis program and outputs the suspected failure package information obtained thereby to the fully automatic failure recovery robot 3 via the failure recovery robot interface M2. do. The fully automatic failure recovery robot 3 moves on the moving rail 5 to the location of the spare package storage shelf 4, and uses its arm to take out and hold the spare package of the suspected failure package based on the suspected failure package information. Next, the fully automatic fault recovery robot 3 moves on the moving rail 5 to the position of the suspected faulty package in the computer system 1 based on the suspected faulty package information, takes out the suspected faulty package with its own arm, and holds it. Then, the fully automatic failure recovery robot 3 starts the manual diagnosis program of the computer system 1 via the failure recovery robot interface device 2, and then inserts the spare package into the corresponding position with its own arm. transmits the running results of the manual diagnosis program to the fully automatic fault recovery robot 3 via the fault recovery robot interface device 2. As a result, if the fully automatic failure recovery robot 3 determines that the failure of the computer system 1 has been recovered,
If it is determined that the operation has stopped or has not recovered, take out the spare packages stored in the spare package storage shelf 4 in response to other suspected failure packages and carry out the same procedure as described above. Repeat the action.

〔発明の効果〕〔Effect of the invention〕

本発明は以上説明したように、コンピュータシステムの
ハードウェア障害が発生した場合、コンピュータシステ
ムに有する被疑障害パッケージを指摘する診断プログラ
ムの出力と、被疑障害パッケージを予備パッケージに取
替える無人ロボットとを組合せてハードウェア障害を復
旧させる構成にすることにより、コンピュータシステム
ハードウェアの障害復旧を自動的に短時間に且つ正確に
行うことができる。
As explained above, when a hardware failure occurs in a computer system, the present invention combines the output of a diagnostic program that points out a suspected faulty package in the computer system and an unmanned robot that replaces the suspected faulty package with a spare package. By configuring the system to recover from hardware failures, it is possible to automatically recover from computer system hardware failures in a short time and accurately.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例を説明するための図である。 1・・・・・・コンピュータシステム、2・・・・・・
障害復旧ロボット用インタフェース装置、3・・・・・
・全自動障害復旧ロボット、4・・・・・・予備パッケ
ージ保管棚、5・・・・・・移動用レール。
FIG. 1 is a diagram for explaining one embodiment of the present invention. 1... Computer system, 2...
Interface device for failure recovery robot, 3...
・Fully automatic failure recovery robot, 4...Spare package storage shelf, 5...Movement rail.

Claims (1)

【特許請求の範囲】  ハードウェア障害発生時、自動診断プログラムによっ
て指摘される被疑障害パッケージ情報にもとづき被疑障
害パッケージを取替え、障害を復旧するコンピュータの
障害復旧システムにおいて、前記被疑パッケージ情報を
出力するコンピュータシステムと; 前記コンピュータシステムに実装されている全てのパッ
ケージの実装位置情報と、保管棚に保管されている全て
の予備パッケージの前記保管棚における位置情報と、パ
ッケージ交換のための移動、取出し、挿入動作を行う手
段及びその動作のための情報とを有し、前記コンピュー
タシステムから出力された被疑障害パッケージ情報を受
信し、前記保管棚まで移動し該当の予備パッケージを取
出し保持すると共に前記被疑パッケージの実装位置まで
移動し前記被疑パッケージを前記該当の予備パッケージ
に交換後、前記コンピュータの手動診断プログラムを起
動し、障害復旧を確認する無人ロボットと; 前記コンピュータシステムと前記無人ロボットとの間の
情報伝達を行うインタフェース装置と;前記無人ロボッ
トが前記コンピュータシステムと前記保管棚との間を移
動するためのレールとを備えたことを特徴とするコンピ
ュータの障害復旧システム。
[Scope of Claims] In a computer failure recovery system that replaces a suspected faulty package based on suspected faulty package information pointed out by an automatic diagnostic program and recovers from the fault when a hardware fault occurs, a computer that outputs the suspected faulty package information. a system; mounting position information of all packages installed in the computer system; position information of all spare packages stored in storage shelves; and movement, removal, and insertion for package replacement; It has a means for performing an operation and information for the operation, and receives the suspected failure package information output from the computer system, moves to the storage shelf, takes out and holds the corresponding spare package, and also removes the suspect package from the storage shelf. an unmanned robot that moves to a mounting position and replaces the suspect package with the corresponding spare package, then starts a manual diagnosis program of the computer and confirms failure recovery; information transmission between the computer system and the unmanned robot; A computer failure recovery system comprising: an interface device for performing the following; and a rail for the unmanned robot to move between the computer system and the storage shelf.
JP2103795A 1990-04-19 1990-04-19 Fault restoration system for computer Pending JPH041827A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2103795A JPH041827A (en) 1990-04-19 1990-04-19 Fault restoration system for computer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2103795A JPH041827A (en) 1990-04-19 1990-04-19 Fault restoration system for computer

Publications (1)

Publication Number Publication Date
JPH041827A true JPH041827A (en) 1992-01-07

Family

ID=14363335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2103795A Pending JPH041827A (en) 1990-04-19 1990-04-19 Fault restoration system for computer

Country Status (1)

Country Link
JP (1) JPH041827A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015151273A (en) * 2014-02-18 2015-08-24 廣達電腦股▲ふん▼有限公司 Robot type carrying body, data center, and maintenance method of data center

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015151273A (en) * 2014-02-18 2015-08-24 廣達電腦股▲ふん▼有限公司 Robot type carrying body, data center, and maintenance method of data center

Similar Documents

Publication Publication Date Title
KR100728220B1 (en) Apparatus and Method of Fault Diagnosis and Data Management for Satellite Ground Station
CN100394394C (en) Fault tolerant duplex computer system and its control method
CN104794028A (en) Disaster tolerance processing method and device, main data center and backup data center
CN108847879B (en) Double-machine fault detection and recovery method based on bus controller
CN100520724C (en) Failure switch recovery realization network system and method
CN103701655A (en) Fault self-diagnosis and self-recovery method and system for interchanger
CN109117317A (en) A kind of clustering fault restoration methods and relevant apparatus
AU674231B2 (en) Fault-tolerant computer systems
JPH041827A (en) Fault restoration system for computer
JP2007257581A (en) Failure analysis device
JP2559771B2 (en) Line logging automatic stop control method
JPS61292457A (en) Diagnosing method for electronic exchange
JPS603225B2 (en) Main storage information recovery method
JP2001337189A (en) Plant control device and its test system
JP3328403B2 (en) Failure detection method
JPH0442632A (en) System management system
JPH0528544B2 (en)
JPH01205210A (en) Control facilities trouble monitor
JPH1029181A (en) Data restoring method for robot control system and robot control system
JPS58222354A (en) Controller having self-diagnostic function
JP2001016296A (en) Fault standardizing method
JPH02213248A (en) Redundant constitution system
JPH02137057A (en) Restoring device
JPS6358545A (en) Information processing system
JPH04102906A (en) Device for monitoring failure of control equipment