JP3109572B2 - Failure recovery device, failure recovery method, and storage medium storing failure recovery program - Google Patents

Failure recovery device, failure recovery method, and storage medium storing failure recovery program

Info

Publication number
JP3109572B2
JP3109572B2 JP08245076A JP24507696A JP3109572B2 JP 3109572 B2 JP3109572 B2 JP 3109572B2 JP 08245076 A JP08245076 A JP 08245076A JP 24507696 A JP24507696 A JP 24507696A JP 3109572 B2 JP3109572 B2 JP 3109572B2
Authority
JP
Japan
Prior art keywords
failure
recovery procedure
recovery
fault
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP08245076A
Other languages
Japanese (ja)
Other versions
JPH1091475A (en
Inventor
智子 岩崎
純一 嶋貫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP08245076A priority Critical patent/JP3109572B2/en
Publication of JPH1091475A publication Critical patent/JPH1091475A/en
Application granted granted Critical
Publication of JP3109572B2 publication Critical patent/JP3109572B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、コンピュータシス
テムにおいて障害が発生した場合に、その障害の種別に
応じた復旧手順で障害の自動復旧を行う障害復旧装置、
障害復旧方法および障害復旧用プログラムを記憶した記
憶媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a failure recovery apparatus for automatically recovering from a failure in a computer system in a recovery procedure according to the type of the failure.
The present invention relates to a failure recovery method and a storage medium storing a failure recovery program.

【0002】[0002]

【従来の技術】特開平03−102534号公報には、
障害が発生すると、過去に発生した障害とその障害の復
旧手順を解析し、発生した障害に応じた復旧処理プログ
ラムを起動させることにより、障害復旧の迅速化を図る
障害復旧方式が記載されている。この従来の障害復旧方
式は、障害事例判定処理部が障害情報通知受け処理部か
ら受けたメッセージをキーとして障害事象・対応アクシ
ョンテーブルをサーチし、障害であるかどうかを判断す
る。障害であると判断された場合、リカバリジョブ起動
通知処理部が動作し、障害事象・対応アクションをリカ
バリジョブ起動処理手段に通知する。リカバリジョブ起
動処理手段は障害事象・対応アクションを受けると、リ
カバリジョブ起動通知受け処理部が動作し、リカバリジ
ョブ起動処理部に通知内容を渡す。リカバリジョブ起動
処理部は通知を受け、障害事象・リカバリジョブ部の該
当するジョブを起動する。
2. Description of the Related Art Japanese Patent Application Laid-Open No. 03-102534 discloses that
When a failure occurs, a failure recovery method is described that analyzes the failure that occurred in the past and the recovery procedure for that failure, and activates a recovery processing program according to the failure that occurred, thereby speeding up failure recovery. . In this conventional failure recovery method, the failure case determination processing unit searches the failure event / correspondence action table using the message received from the failure information notification reception processing unit as a key, and determines whether the failure is a failure. If it is determined that a failure has occurred, the recovery job activation notification processing unit operates and notifies the recovery job activation processing means of the failure event / action. When the recovery job activation processing means receives the failure event / correspondence action, the recovery job activation notification receiving processing unit operates and passes the notification contents to the recovery job activation processing unit. The recovery job activation processing unit receives the notification, and activates the job corresponding to the failure event / recovery job unit.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、この従
来の技術では、復旧手順が登録されていない新たな障害
に対して操作者が適切な判断をし復旧措置を講じたとし
ても、同じ障害が再度発生した場合には、操作者は改め
て復旧手順を考え、同様の復旧措置を講じなければなら
ないという問題点があった。
However, according to this conventional technique, even if the operator makes an appropriate judgment and takes a recovery measure for a new failure for which a recovery procedure is not registered, the same failure occurs again. When this occurs, there is a problem that the operator must consider the recovery procedure again and take the same recovery measures.

【0004】本発明の目的は、復旧手順が登録されてい
ない新たな障害に対する復旧手順を、同じ障害が再度発
生した場合のために登録しておくことができる障害復旧
装置、障害復旧方法および障害復旧用プログラムを記憶
した記憶媒体を提供することにある。
An object of the present invention is to provide a failure recovery apparatus, a failure recovery method, and a failure recovery method that can register a recovery procedure for a new failure for which a recovery procedure has not been registered, in case the same failure occurs again. An object of the present invention is to provide a storage medium storing a recovery program.

【0005】また、本発明の他の目的は、復旧手順が登
録されていない新たな障害に対する復旧手順のうち、同
じ障害が再度発生した場合にこの障害を確実に復旧する
ことができる復旧手順のみを登録することができる障害
復旧装置、障害復旧方法および障害復旧用プログラムを
記憶した記憶媒体を提供することにある。
Another object of the present invention is to provide only a recovery procedure for a new failure for which a recovery procedure has not been registered, which can reliably recover the same failure when the same failure occurs again. Recovery apparatus, a failure recovery method, and a storage medium that stores a failure recovery program that can register a failure recovery program.

【0006】[0006]

【課題を解決するための手段】本発明の第1の障害復旧
装置は、障害種別と復旧手順との対応を障害情報として
記憶する障害情報記憶部と、障害が発生すると、該障害
の前記障害情報が前記障害情報記憶部に記憶されている
かどうかを判定する障害解析部と、前記障害解析部によ
って該障害の前記障害情報が前記障害情報記憶部に記憶
されていると判定された場合に、該障害情報より該障害
に対応する復旧手順を取得し、該復旧手順により復旧を
行うコマンド制御部と、障害種別と復旧手順との対応を
一時的に蓄積する復旧手順記憶部と、前記障害解析部に
よって該障害の前記障害情報が前記障害情報記憶部に記
憶されていないと判定された場合に、操作者が該障害に
対してとった復旧手順を、該障害の障害種別と対応づけ
て前記復旧手順記憶部に蓄積する復旧手順取得部と、前
記復旧手順記憶部に蓄積されている障害種別と復旧手順
との対応を定期的に障害情報として前記障害情報記憶部
に登録する復旧手順登録部とを備えている。
According to a first aspect of the present invention, there is provided a fault recovery apparatus comprising: a fault information storage unit for storing, as fault information, a correspondence between a fault type and a recovery procedure; A failure analysis unit that determines whether information is stored in the failure information storage unit, and when the failure analysis unit determines that the failure information of the failure is stored in the failure information storage unit, A command control unit that obtains a recovery procedure corresponding to the failure from the failure information and performs recovery according to the recovery procedure; a recovery procedure storage unit that temporarily stores the correspondence between the failure type and the recovery procedure; If the unit determines that the fault information of the fault is not stored in the fault information storage unit, the recovery procedure taken by the operator for the fault is associated with the fault type of the fault and Recovery procedure notes A restoration procedure acquisition unit that accumulates in the unit, and a restoration procedure registration unit that periodically registers the correspondence between the failure type and the restoration procedure stored in the restoration procedure storage unit as failure information in the failure information storage unit. ing.

【0007】本発明の第2の障害復旧装置は、障害種別
と復旧手順との対応を障害情報として記憶する障害情報
記憶部と、障害が発生すると、該障害の前記障害情報が
前記障害情報記憶部に記憶されているかどうかを判定す
る障害解析部と、前記障害解析部によって該障害の前記
障害情報が前記障害情報記憶部に記憶されていると判定
された場合に、該障害情報より該障害に対応する復旧手
順を取得し、該復旧手順により復旧を行うコマンド制御
部と、障害種別と復旧手順と障害発生回数との対応を一
時的に蓄積する復旧手順記憶部と、前記障害解析部によ
って該障害の前記障害情報が前記障害情報記憶部に記憶
されていないと判定された場合に、操作者が該障害に対
してとった復旧手順と、該障害と障害種別が同一の障害
の発生回数とを、該障害の障害種別と対応づけて前記復
旧手順記憶部に蓄積する復旧手順取得部と、前記復旧手
順記憶部に蓄積されている障害種別と復旧手順との対応
を、前記復旧手順記憶部に記憶されている前記障害発生
回数が所定の回数を超えた場合に、障害情報として前記
障害情報記憶部に登録する復旧手順登録部とを備えてい
る。
A second fault recovery apparatus according to the present invention includes a fault information storage unit for storing a correspondence between a fault type and a recovery procedure as fault information, and when a fault occurs, the fault information of the fault is stored in the fault information storage. A failure analysis unit that determines whether the failure information is stored in the failure information unit; and if the failure analysis unit determines that the failure information of the failure is stored in the failure information storage unit, A command control unit that obtains a recovery procedure corresponding to the above, recovers according to the recovery procedure, a recovery procedure storage unit that temporarily stores the correspondence between the failure type, the recovery procedure, and the number of times of failure occurrence, and the failure analysis unit. If it is determined that the fault information of the fault is not stored in the fault information storage unit, a recovery procedure taken by the operator for the fault, and the number of occurrences of the fault having the same fault type as the fault And A restoration procedure acquisition unit that accumulates in the restoration procedure storage unit in association with the failure type of the failure, and a correspondence between the failure type and the restoration procedure stored in the restoration procedure storage unit are stored in the restoration procedure storage unit. And a recovery procedure registration unit that registers the failure information in the failure information storage unit when the number of times of occurrence of the failure exceeds a predetermined number.

【0008】本発明の第3の障害復旧装置は、上記第2
の障害復旧装置において、前記復旧手順登録部は、前記
復旧手順記憶部に蓄積されている障害種別と復旧手順と
障害発生回数との対応を表示して、該障害種別と該復旧
手順との対応を前記障害情報記憶部に登録するか否かを
操作者に問い合わせ、操作者より登録する旨の指示があ
った場合にのみ、該障害種別と該復旧手順との対応を障
害情報として前記障害情報記憶部に登録する。
[0008] The third failure recovery device of the present invention is the second failure recovery device.
The recovery procedure registration unit displays the correspondence between the failure type, the recovery procedure, and the number of times of failure stored in the recovery procedure storage unit, and displays the correspondence between the failure type and the recovery procedure. The operator inquires whether or not to register the failure information in the failure information storage unit, and only when the operator gives an instruction to register, the correspondence between the failure type and the recovery procedure is regarded as the failure information, Register in the storage unit.

【0009】本発明の第1の障害復旧方法は、障害が発
生すると、該障害の障害種別と復旧手順との対応が障害
情報として記憶されているかどうかを判定する障害解析
ステップと、前記障害解析ステップで該障害の前記障害
情報が記憶されていると判定された場合に、該障害情報
より該障害に対応する復旧手順を取得し、該復旧手順に
より復旧を行うコマンド制御ステップと、前記障害解析
ステップで該障害の前記障害情報が記憶されていないと
判定された場合に、操作者が該障害に対してとった復旧
手順を、該障害の障害種別と対応づけて一時的に蓄積す
る復旧手順取得ステップと、前記一時的に蓄積された障
害種別と復旧手順との対応を定期的に障害情報として登
録する復旧手順登録ステップとを含んでいる。
A first failure recovery method according to the present invention includes a failure analysis step of determining, when a failure occurs, whether the correspondence between the failure type of the failure and the recovery procedure is stored as failure information, When it is determined in step that the fault information of the fault is stored, a command control step of acquiring a recovery procedure corresponding to the fault from the fault information and performing recovery by the recovery procedure; When it is determined in step that the failure information of the failure is not stored, the recovery procedure that the operator takes for the failure is temporarily stored in association with the failure type of the failure. An acquisition step and a restoration procedure registration step of periodically registering the correspondence between the temporarily accumulated failure type and the restoration procedure as failure information.

【0010】本発明の第2の障害復旧方法は、障害が発
生すると、該障害の障害種別と復旧手順との対応が障害
情報として記憶されているかどうかを判定する障害解析
ステップと、前記障害解析ステップで該障害の前記障害
情報が記憶されていると判定された場合に、該障害情報
より該障害に対応する復旧手順を取得し、該復旧手順に
より復旧を行うコマンド制御ステップと、前記障害解析
ステップで該障害の前記障害情報が記憶されていないと
判定された場合に、操作者が該障害に対してとった復旧
手順と、該障害と障害種別が同一の障害の発生回数と
を、該障害の障害種別と対応づけて一時的に蓄積する復
旧手順取得ステップと、前記一時的に蓄積された障害種
別と復旧手順との対応を、前記一時的に蓄積された前記
障害発生回数が所定の回数を超えた場合に、障害情報と
して登録する復旧手順登録ステップとを含んでいる。
A second failure recovery method according to the present invention is characterized in that, when a failure occurs, a failure analysis step of determining whether or not the correspondence between the failure type of the failure and the recovery procedure is stored as failure information; When it is determined in step that the fault information of the fault is stored, a command control step of acquiring a recovery procedure corresponding to the fault from the fault information and performing recovery by the recovery procedure; If it is determined in step that the failure information of the failure is not stored, the recovery procedure taken by the operator for the failure and the number of occurrences of the failure having the same failure type as the failure are determined. A recovery procedure obtaining step of temporarily storing the fault type in association with the fault type of the fault, and determining the correspondence between the temporarily stored fault type and the recovery procedure by setting the temporarily stored fault occurrence count to a predetermined value. If it exceeds the number of times, and a recovery procedure registration step of registering as failure information.

【0011】本発明の第3の障害復旧方法は、上記第2
の障害復旧方法において、前記復旧手順登録ステップ
で、前記一時的に蓄積された障害種別と復旧手順と障害
発生回数との対応を表示して、該障害種別と該復旧手順
との対応を登録するか否かを操作者に問い合わせ、操作
者より登録する旨の指示があった場合にのみ、該障害種
別と該復旧手順との対応を障害情報として登録する。
[0011] The third failure recovery method of the present invention is the same as the second failure recovery method.
In the failure recovery method of the above, in the recovery procedure registration step, the correspondence between the temporarily stored failure type, the recovery procedure, and the number of failure occurrences is displayed, and the correspondence between the failure type and the recovery procedure is registered. The operator is inquired as to whether or not the error has occurred, and only when the operator instructs registration, the correspondence between the fault type and the recovery procedure is registered as fault information.

【0012】本発明の第1の記憶媒体は、障害が発生す
ると、該障害の障害種別と復旧手順との対応が障害情報
として記憶されているかどうかを判定する障害解析処理
と、前記障害解析処理で該障害の前記障害情報が記憶さ
れていると判定された場合に、該障害情報より該障害に
対応する復旧手順を取得し、該復旧手順により復旧を行
うコマンド制御処理と、前記障害解析処理で該障害の前
記障害情報が記憶されていないと判定された場合に、操
作者が該障害に対してとった復旧手順を、該障害の障害
種別と対応づけて一時的に蓄積する復旧手順取得処理
と、前記一時的に蓄積された障害種別と復旧手順との対
応を定期的に障害情報として登録する復旧手順登録処理
と、をコンピュータシステムに実行させるコンピュータ
プログラムを記憶している。
In the first storage medium of the present invention, when a failure occurs, a failure analysis process for determining whether or not a correspondence between the failure type of the failure and a recovery procedure is stored as failure information; When it is determined that the fault information of the fault is stored, a command control process for acquiring a recovery procedure corresponding to the fault from the fault information and performing recovery by the recovery procedure, and the fault analysis process When it is determined that the fault information of the fault is not stored, the recovery procedure that the operator takes for the fault is temporarily stored in association with the fault type of the fault. A computer program for causing the computer system to execute a process and a recovery procedure registration process for periodically registering the correspondence between the temporarily stored fault type and the recovery procedure as fault information. There.

【0013】本発明の第2の記憶媒体は、障害が発生す
ると、該障害の障害種別と復旧手順との対応が障害情報
として記憶されているかどうかを判定する障害解析処理
と、前記障害解析処理で該障害の前記障害情報が記憶さ
れていると判定された場合に、該障害情報より該障害に
対応する復旧手順を取得し、該復旧手順により復旧を行
うコマンド制御処理と、前記障害解析処理で該障害の前
記障害情報が記憶されていないと判定された場合に、操
作者が該障害に対してとった復旧手順と、該障害と障害
種別が同一の障害の発生回数とを、該障害の障害種別と
対応づけて一時的に蓄積する復旧手順取得処理と、前記
一時的に蓄積された障害種別と復旧手順との対応を、前
記一時的に蓄積された前記障害発生回数が所定の回数を
超えた場合に、障害情報として登録する復旧手順登録処
理と、をコンピュータシステムに実行させるコンピュー
タプログラムを記憶している。
In the second storage medium of the present invention, when a failure occurs, a failure analysis process for determining whether or not the correspondence between the failure type of the failure and a recovery procedure is stored as failure information; When it is determined that the fault information of the fault is stored, a command control process for acquiring a recovery procedure corresponding to the fault from the fault information and performing recovery by the recovery procedure, and the fault analysis process When it is determined that the fault information of the fault is not stored in the storage device, the recovery procedure taken by the operator for the fault and the number of times of occurrence of the fault having the same fault type as the fault are stored in the fault information. A recovery procedure acquisition process for temporarily storing the failure type in association with the failure type, and a correspondence between the temporarily stored failure type and the recovery procedure, wherein the temporarily stored failure occurrence count is a predetermined number of times. Is exceeded. It stores a computer program for executing a recovery procedure registration processing for registering as information, to the computer system.

【0014】本発明の第3の記憶媒体は、上記第2の記
憶媒体において、前記復旧手順登録処理で、前記一時的
に蓄積された障害種別と復旧手順と障害発生回数との対
応を表示して、該障害種別と該復旧手順との対応を登録
するか否かを操作者に問い合わせ、操作者より登録する
旨の指示があった場合にのみ、該障害種別と該復旧手順
との対応を障害情報として登録する。
The third storage medium of the present invention, in the second storage medium, displays the correspondence between the temporarily stored fault type, the recovery procedure, and the number of times of occurrence of the fault in the recovery procedure registration processing. The operator inquires whether or not to register the correspondence between the failure type and the recovery procedure, and determines the correspondence between the failure type and the recovery procedure only when instructed by the operator to register. Register as failure information.

【0015】[0015]

【発明の実施の形態】次に本発明の実施の形態について
図面を参照して詳細に説明する。
Embodiments of the present invention will now be described in detail with reference to the drawings.

【0016】図1を参照すると、本発明の第1の実施の
形態は、障害解析部11と、障害情報記憶部12と、コ
マンド作成部13と、コマンド発行部14と、復旧手順
取得部15と、復旧手順記憶部16と、復旧手順登録部
17と、キーボード等の入力装置18と、ディスプレイ
装置や印刷装置等の出力装置19から構成される。
Referring to FIG. 1, in a first embodiment of the present invention, a failure analysis unit 11, a failure information storage unit 12, a command creation unit 13, a command issue unit 14, a recovery procedure acquisition unit 15 And a recovery procedure storage section 16, a recovery procedure registration section 17, an input device 18 such as a keyboard, and an output device 19 such as a display device or a printing device.

【0017】障害情報記憶部12は、過去に発生した障
害の障害種別を示すメッセージ等とその障害を復旧する
ためのコマンド等との対応を障害情報として格納してい
る。
The failure information storage unit 12 stores, as failure information, correspondence between a message or the like indicating a failure type of a failure that has occurred in the past and a command or the like for recovering the failure.

【0018】障害解析部11は、障害が発生したという
通知を契機に、障害メッセージをキーとして、障害情報
記憶部12を検索し、障害情報記憶部12に記憶されて
いる障害かどうかを判定する。
The failure analysis unit 11 searches the failure information storage unit 12 using the failure message as a key, upon the notification that a failure has occurred, and determines whether the failure is stored in the failure information storage unit 12. .

【0019】コマンド作成部13は、障害解析部11で
障害情報記憶部12に記憶されている障害であると判定
された場合に、障害情報記憶部12に記憶された障害情
報をもとにその障害を復旧するためのコマンドを作成す
る。
When the failure analysis unit 11 determines that the failure is a failure stored in the failure information storage unit 12, the command creation unit 13 generates the command based on the failure information stored in the failure information storage unit 12. Create a command to recover from a failure.

【0020】コマンド発行部14は、コマンド作成部1
3で作成されたコマンドを発行する。
The command issuing unit 14 includes the command creating unit 1
Issue the command created in step 3.

【0021】復旧手順取得部15は、障害解析部11で
障害情報記憶部12に記憶されていない障害であると判
定された場合に、障害のメッセージ、および入力装置1
8より入力した障害を復旧するためのコマンドを取得
し、これらを障害に対する復旧手順として復旧手順記憶
部16に記憶する。
When the failure analysis unit 11 determines that the failure is not stored in the failure information storage unit 12, the recovery procedure acquisition unit 15 outputs a failure message and the input device 1
The command for recovering the failure input from the server 8 is acquired, and these are stored in the recovery procedure storage unit 16 as a recovery procedure for the failure.

【0022】復旧手順登録部17は、入力装置18から
の指示により、復旧手順記憶部16に蓄積されている復
旧手順を出力装置19に出力する。また、操作者による
登録可否の判断に基づいて入力装置18より指示された
復旧手順を、復旧手順記憶部16より取得し、障害情報
記憶部12に登録する。
The recovery procedure registration unit 17 outputs the recovery procedure stored in the recovery procedure storage unit 16 to the output device 19 in response to an instruction from the input device 18. Further, the recovery procedure instructed by the input device 18 based on the determination of whether or not registration is possible by the operator is obtained from the recovery procedure storage unit 16 and registered in the failure information storage unit 12.

【0023】次に、図1〜図3を参照して、本発明の実
施の形態の動作について説明する。
Next, the operation of the embodiment of the present invention will be described with reference to FIGS.

【0024】図2を参照すると、障害が発生した場合に
はまず、障害解析部11に障害メッセージが通知され
る。障害解析部11は、この障害メッセージを受信し
(ステップ201)、この障害メッセージをもとに障害
情報記憶部12を検索する(ステップ202)。
Referring to FIG. 2, when a failure occurs, a failure message is first sent to the failure analysis unit 11. The failure analysis unit 11 receives the failure message (Step 201), and searches the failure information storage unit 12 based on the failure message (Step 202).

【0025】障害解析部11は、同じ障害メッセージを
含む障害情報が障害情報記憶部12に格納されているか
どうかを判定し(ステップ203)、該当する障害情報
が障害情報記憶部12に格納されていた場合はコマンド
作成部13に処理が移り、コマンド作成部13は、障害
情報記憶部12に記憶された当該障害情報中の障害復旧
コマンドに基づいて、コマンドを作成する(ステップ2
04)。コマンド発行部14は、このコマンドを発行
し、障害の自動復旧を行う(ステップ205)。
The failure analysis unit 11 determines whether failure information including the same failure message is stored in the failure information storage unit 12 (step 203), and the corresponding failure information is stored in the failure information storage unit 12. In this case, the process proceeds to the command creation unit 13, and the command creation unit 13 creates a command based on the failure recovery command in the failure information stored in the failure information storage unit 12 (step 2).
04). The command issuing unit 14 issues this command and performs automatic recovery from the failure (Step 205).

【0026】また、ステップ203で障害情報記憶部1
2に同じ障害メッセージが格納されていないと判断され
た場合は、復旧手順取得部15に処理が移る。復旧手順
取得部15は、障害のメッセージと入力装置18から入
力した障害復旧のためのコマンドを取得し(ステップ2
06)、復旧手順記憶部16に格納する(ステップ20
7)。このとき格納する障害メッセージと障害復旧コマ
ンドが、既に復旧手順記憶部16に格納されている障害
メッセージと障害復旧コマンドのいずれか一組と一致す
るかどうか判定する(ステップ208)。いずれか一組
と一致した場合には、その障害メッセージと復旧手順の
組の発生回数を累計する(ステップ209)。
In step 203, the fault information storage unit 1
If it is determined that the same failure message is not stored in 2, the process proceeds to the recovery procedure acquisition unit 15. The recovery procedure obtaining unit 15 obtains a failure message and a failure recovery command input from the input device 18 (step 2).
06), and store it in the recovery procedure storage unit 16 (step 20).
7). At this time, it is determined whether or not the stored fault message and the fault recovery command match any one set of the fault message and the fault recovery command already stored in the recovery procedure storage unit 16 (step 208). If any one of the sets matches, the number of occurrences of the set of the fault message and the recovery procedure is accumulated (step 209).

【0027】その後、復旧手順記憶部16に十分な量の
障害及びその復旧手順が蓄積された場合には、図3を参
照すると、復旧手順登録部17は、操作者に障害情報の
登録を指示する(ステップ301)。
Thereafter, when a sufficient amount of faults and their recovery procedures are stored in the recovery procedure storage section 16, referring to FIG. 3, the recovery procedure registration section 17 instructs the operator to register fault information. (Step 301).

【0028】操作者が入力装置18から障害情報記憶部
12への障害情報の登録を指示すると、復旧手順登録部
17は、障害メッセージ、その復旧手順およびその障害
の発生回数を復旧手順記憶部16より取得し、出力装置
19に表示する(ステップ302)。復旧手順登録部1
7は、この表示された情報をもとに障害情報記憶部12
に登録できる障害かどうかを操作者に判断させる(ステ
ップ303)。
When the operator instructs the failure information storage unit 12 to register failure information from the input device 18, the recovery procedure registration unit 17 stores the failure message, its recovery procedure and the number of occurrences of the failure in the recovery procedure storage unit 16. And displays it on the output device 19 (step 302). Restoration procedure registration unit 1
7 is a failure information storage unit 12 based on the displayed information.
(Step 303).

【0029】操作者がこの障害メッセージ、その復旧手
順および障害の発生回数が登録可能であると判断し、入
力装置18から登録の指示を行った場合、復旧手順登録
部17は、復旧手順記憶部16に格納されている復旧手
順を障害情報として障害情報記憶部12に追加登録する
(ステップ304)。さらに、追加登録した障害情報に
対応する復旧手順記憶部16内の復旧手順を復旧手順記
憶部16から削除する(ステップ305)。なお、復旧
手順記憶部16の内容は、入力装置18からの指示によ
り復旧手順登録部17が随時出力装置19に表示するこ
とが可能である。
When the operator determines that the failure message, its recovery procedure, and the number of occurrences of the failure can be registered, and issues an instruction for registration from the input device 18, the recovery procedure registration unit 17 stores the recovery procedure in the recovery procedure storage unit. 16 is additionally registered in the failure information storage unit 12 as failure information (step 304). Further, the recovery procedure in the recovery procedure storage unit 16 corresponding to the additionally registered fault information is deleted from the recovery procedure storage unit 16 (Step 305). Note that the contents of the restoration procedure storage unit 16 can be displayed on the output device 19 by the restoration procedure registration unit 17 at any time in accordance with an instruction from the input device 18.

【0030】以上により、本発明の実施の形態の動作が
終了する。
With the above, the operation of the embodiment of the present invention ends.

【0031】なお、本実施の形態では、復旧手順登録部
17は、人間の判断により起動されるようにしたが、同
一障害がn回発生した時点で自動的に起動がかかるよう
にすることも可能である。回数はパラメータとして自由
に設定できる。
In the present embodiment, the recovery procedure registration unit 17 is activated by human judgment. However, the activation procedure registration unit 17 may be automatically activated when the same failure occurs n times. It is possible. The number of times can be freely set as a parameter.

【0032】本実施の形態は、新たに発生した障害の復
旧手順をその発生回数とともに蓄積する復旧手順記憶部
を設けたことにより、復旧手順が登録されていない新た
な障害に対する復旧手順を、同じ障害が再度発生した場
合のために登録しておくことができるという効果を有し
ている。
In the present embodiment, a recovery procedure storage unit for storing a recovery procedure for a newly-generated fault together with the number of occurrences is provided, so that a recovery procedure for a new fault for which a recovery procedure is not registered is the same. This has the effect that registration can be made in case a failure occurs again.

【0033】また、新たに発生した障害の復旧手順の追
加登録をする際に操作者に登録可否の判断を促すように
したことにより、復旧手順が登録されていない新たな障
害に対する復旧手順のうち、同じ障害が再度発生した場
合にこの障害を確実に復旧することができる復旧手順の
みを登録することができるという効果を有している。
In addition, when an additional registration of a recovery procedure for a newly-generated fault is made, the operator is prompted to determine whether or not registration is possible. This has the effect that only a recovery procedure that can reliably recover from the failure when the same failure occurs again can be registered.

【0034】[0034]

【実施例】次に、本発明の実施の形態の一実施例の動作
を図4〜図6を参照して詳細に説明する。
Next, the operation of an embodiment of the present invention will be described in detail with reference to FIGS.

【0035】図4のように、障害メッセージが”AA
A”という障害が発生したとする。このとき、障害解析
部11は、”AAA”をキーとして、障害情報記憶部1
2を検索する。障害メッセージ”AAA”は障害情報記
憶部12に存在するので、処理はコマンド作成部13に
移る。コマンド作成部13は、障害情報記憶部12か
ら、障害メッセージ”AAA”に対する障害復旧コマン
ド”aaa1”〜”aaa3”取得し、コマンド群を作
成する。コマンド発行部14はこのコマンド群を発行
し、自動的に障害を復旧する。
As shown in FIG. 4, the failure message is "AA"
In this case, the failure analysis unit 11 uses the “AAA” as a key to generate the failure information storage unit 1.
Search for 2. Since the failure message “AAA” exists in the failure information storage unit 12, the process proceeds to the command creation unit 13. The command creation unit 13 acquires the failure recovery commands “aaa1” to “aaa3” for the failure message “AAA” from the failure information storage unit 12, and creates a command group. The command issuing unit 14 issues this command group and automatically recovers from the failure.

【0036】一方、図5のように、障害メッセージが”
CCC”という障害が発生したとする。このとき、障害
解析部11は、”CCC”をキーとして、障害情報記憶
部12を検索する。障害メッセージ”CCC”は障害情
報記憶部12に存在しないので、処理は復旧手順取得部
15に移る。復旧手順取得部15では、入力装置18か
ら入力される障害復旧コマンド”ccc1”〜”ccc
2”を取得し、障害メッセージ”CCC”とともに、復
旧手順記憶部16に格納する。その際、すでに復旧手順
記憶部16に格納されている障害メッセージと障害復旧
コマンドの組に同じものがあるかどうかを確認する。同
じものがあった場合には、既に格納されていた復旧手順
の項番を、今回発生した障害に対応する復旧手順に対応
する発生回数の欄に格納する。また、同じものがなかっ
た場合には、今回発生した障害に対応する発生回数の欄
には、自身の障害の項番を格納する。
On the other hand, as shown in FIG.
At this time, the failure analysis unit 11 searches for the failure information storage unit 12 using “CCC” as a key, since the failure message “CCC” does not exist in the failure information storage unit 12. The processing shifts to the restoration procedure acquisition unit 15. In the restoration procedure acquisition unit 15, the failure restoration commands “ccc1” to “ccc” input from the input device 18 are input.
2 ”is acquired and stored together with the failure message“ CCC ”in the recovery procedure storage unit 16. At this time, is there a set of the same failure message and failure recovery command already stored in the recovery procedure storage unit 16? If there is the same one, store the item number of the recovery procedure already stored in the column of the number of occurrences corresponding to the recovery procedure corresponding to the failure that occurred this time. If there is no error, the item number of the own failure is stored in the column of the number of occurrences corresponding to the failure that has occurred this time.

【0037】さらに、図6のように、復旧手順記憶部1
6に十分な量の復旧手順が蓄積されたら、入力装置18
から、障害情報記憶部12への登録の指示を与える。復
旧手順登録部17は、復旧手順記憶部16に格納されて
いる情報をもとに、障害メッセージ、復旧手順、発生回
数を出力装置19に出力する。表示された障害のう
ち、”CCC”を障害情報記憶部12に登録したい場合
は、入力装置18から”CCC”を登録するように指示
する。復旧手順登録部17は、障害メッセージ”CC
C”とその復旧手順”ccc1”〜”ccc2”を障害
情報記憶部12に追加登録した後、復旧手順記憶部16
の障害メッセージ”CCC”に関する情報を復旧手順記
憶部16から削除する。
Further, as shown in FIG.
When a sufficient amount of restoration procedures have been accumulated in the
Gives an instruction of registration to the failure information storage unit 12. The restoration procedure registration unit 17 outputs a failure message, a restoration procedure, and the number of occurrences to the output device 19 based on the information stored in the restoration procedure storage unit 16. When it is desired to register “CCC” in the failure information storage unit 12 among the displayed failures, the input device 18 instructs to register “CCC”. The restoration procedure registration unit 17 receives the failure message “CC
C "and its restoration procedure" ccc1 "to" ccc2 "are additionally registered in the failure information storage unit 12, and then the restoration procedure storage unit 16
The information relating to the failure message “CCC” is deleted from the recovery procedure storage unit 16.

【0038】[0038]

【発明の効果】以上説明したように、本発明には、復旧
手順が登録されていない新たな障害に対する復旧手順
を、同じ障害が再度発生した場合のために登録しておく
ことができるという効果がある。
As described above, according to the present invention, a recovery procedure for a new failure for which a recovery procedure has not been registered can be registered in case the same failure occurs again. There is.

【0039】また、本発明には、復旧手順が登録されて
いない新たな障害に対する復旧手順のうち、同じ障害が
再度発生した場合にこの障害を確実に復旧することがで
きる復旧手順のみを登録することができるという効果も
ある。
Further, in the present invention, among the recovery procedures for a new failure for which a recovery procedure has not been registered, only the recovery procedure that can surely recover this failure when the same failure occurs again is registered. There is also an effect that can be done.

【図面の簡単な説明】[Brief description of the drawings]

【図1】図1は本発明の実施の形態の構成を示すブロッ
ク図である。
FIG. 1 is a block diagram showing a configuration of an embodiment of the present invention.

【図2】図2は本発明の実施の形態の動作を示す流れ図
である。
FIG. 2 is a flowchart showing the operation of the embodiment of the present invention.

【図3】図3は本発明の実施の形態の動作を示す流れ図
である。
FIG. 3 is a flowchart showing the operation of the embodiment of the present invention.

【図4】図4は本発明の一実施例の動作を示す図であ
る。
FIG. 4 is a diagram showing the operation of one embodiment of the present invention.

【図5】図5は本発明の一実施例の動作を示す図であ
る。
FIG. 5 is a diagram showing the operation of one embodiment of the present invention.

【図6】図6は本発明の一実施例の動作を示す図であ
る。
FIG. 6 is a diagram showing the operation of one embodiment of the present invention.

【符号の説明】[Explanation of symbols]

11 障害解析部 12 障害情報記憶部 13 コマンド作成部 14 コマンド発行部 15 復旧手順取得部 16 復旧手順記憶部 17 復旧手順登録部 18 入力装置 19 出力装置 REFERENCE SIGNS LIST 11 failure analysis unit 12 failure information storage unit 13 command creation unit 14 command issue unit 15 restoration procedure acquisition unit 16 restoration procedure storage unit 17 restoration procedure registration unit 18 input device 19 output device

フロントページの続き (56)参考文献 特開 平7−36729(JP,A) 特開 平1−244545(JP,A) 特開 昭62−34248(JP,A) 特開 昭64−4842(JP,A) 特開 平3−271922(JP,A) 特開 平1−118934(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 11/22 - 11/34 Continuation of the front page (56) References JP-A-7-36729 (JP, A) JP-A-1-244545 (JP, A) JP-A-62-34248 (JP, A) JP-A 64-4842 (JP) JP-A-3-271922 (JP, A) JP-A-1-118934 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB name) G06F 11/22-11/34

Claims (6)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 障害種別と復旧手順との対応を障害情報
として記憶する障害情報記憶部と、 障害が発生すると、該障害の前記障害情報が前記障害情
報記憶部に記憶されているかどうかを判定する障害解析
部と、 前記障害解析部によって該障害の前記障害情報が前記障
害情報記憶部に記憶されていると判定された場合に、該
障害情報より該障害に対応する復旧手順を取得し、該復
旧手順により復旧を行うコマンド制御部と、 障害種別と復旧手順と障害発生回数との対応を一時的に
蓄積する復旧手順記憶部と、 前記障害解析部によって該障害の前記障害情報が前記障
害情報記憶部に記憶されていないと判定された場合に、
操作者が該障害に対してとった復旧手順と、該障害と障
害種別が同一の障害の発生回数とを、該障害の障害種別
と対応づけて前記復旧手順記憶部に蓄積する復旧手順取
得部と、 前記復旧手順記憶部に蓄積されている障害種別と復旧手
順との対応を、前記復旧手順記憶部に記憶されている前
記障害発生回数が所定の回数を超えた場合に、障害情報
として前記障害情報記憶部に登録する復旧手順登録部と
を備えたことを特徴とする障害復旧装置。
Determination and 1. A fault information storage unit for storing a correspondence between fault type and recovery procedure as failure information, a failure occurs, whether the fault information of the failure is stored in the fault information storing unit When the failure analysis unit determines that the failure information of the failure is stored in the failure information storage unit, the failure analysis unit acquires a recovery procedure corresponding to the failure from the failure information, A command control unit for performing recovery according to the recovery procedure; a recovery procedure storage unit for temporarily storing a correspondence between a failure type, a recovery procedure, and the number of times of occurrence of the failure; If it is determined that the information is not stored in the information storage unit,
A recovery procedure acquisition unit that stores, in the recovery procedure storage unit, a recovery procedure taken by the operator for the failure and the number of occurrences of the failure having the same failure type as the failure, in association with the failure type of the failure The correspondence between the failure type and the restoration procedure stored in the restoration procedure storage unit, if the number of failure occurrences stored in the restoration procedure storage unit exceeds a predetermined number, the failure information as A failure recovery device, comprising: a recovery procedure registration unit that registers in a failure information storage unit.
【請求項2】 前記復旧手順登録部は、前記復旧手順記
憶部に蓄積されている障害種別と復旧手順と障害発生回
数との対応を表示して、該障害種別と該復旧手順との対
応を前記障害情報記憶部に登録するか否かを操作者に問
い合わせ、操作者より登録する旨の指示があった場合に
のみ、該障害種別と該復旧手順との対応を障害情報とし
て前記障害情報記憶部に登録することを特徴とする請求
項1に記載の障害復旧装置。
2. The recovery procedure registering section displays a correspondence between a failure type, a recovery procedure, and a failure occurrence number stored in the recovery procedure storage section, and determines a correspondence between the failure type and the recovery procedure. The operator inquires whether to register in the failure information storage unit, and only when the operator instructs to register, the correspondence between the failure type and the recovery procedure is stored as failure information in the failure information storage. Claims to register in the department
Item 2. The failure recovery device according to Item 1 .
【請求項3】 障害が発生すると、該障害の障害種別と
復旧手順との対応が障害情報として記憶されているかど
うかを判定する障害解析ステップと、 前記障害解析ステップで該障害の前記障害情報が記憶さ
れていると判定された場合に、該障害情報より該障害に
対応する復旧手順を取得し、該復旧手順により復旧を行
うコマンド制御ステップと、 前記障害解析ステップで該障害の前記障害情報が記憶さ
れていないと判定された場合に、操作者が該障害に対し
てとった復旧手順と、該障害と障害種別が同一の障害の
発生回数とを、該障害の障害種別と対応づけて一時的に
蓄積する復旧手順取得ステップと、 前記一時的に蓄積された障害種別と復旧手順との対応
を、前記一時的に蓄積された前記障害発生回数が所定の
回数を超えた場合に、障害情報として登録する復旧手順
登録ステップとを含むことを特徴とする障害復旧方法。
3. When a failure occurs, a failure analysis step of determining whether the correspondence between the failure type and the recovery procedure of the failure is stored as failure information, and in the failure analysis step, the failure information of the failure is If it is determined that the information is stored, a recovery procedure corresponding to the failure is obtained from the failure information, and a command control step of performing recovery by the recovery procedure; If it is determined that the failure is not stored, the recovery procedure taken by the operator for the failure and the number of occurrences of the failure having the same failure type as the failure are temporarily associated with the failure type of the failure. A recovery procedure acquiring step for temporarily storing the fault type and a recovery procedure for the temporarily stored fault type, the fault information being stored when the temporarily stored fault occurrence count exceeds a predetermined number. Error recovery method, which comprises a recovery procedure registration step of registering as a.
【請求項4】 前記復旧手順登録ステップで、前記一時
的に蓄積された障害種別と復旧手順と障害発生回数との
対応を表示して、該障害種別と該復旧手順との対応を登
録するか否かを操作者に問い合わせ、操作者より登録す
る旨の指示があった場合にのみ、該障害種別と該復旧手
順との対応を障害情報として登録することを特徴とする
請求項3に記載の障害復旧方法。
In wherein said recovery procedure registration step, to display the corresponding of the temporarily stored fault type and recovery procedures and number of errors or not to register the correspondence between the fault type and該復old procedures It is characterized in that the correspondence between the fault type and the recovery procedure is registered as fault information only when the operator is inquired about whether or not the fault is to be registered.
The failure recovery method according to claim 3 .
【請求項5】 障害が発生すると、該障害の障害種別と
復旧手順との対応が障害情報として記憶されているかど
うかを判定する障害解析処理と、 前記障害解析処理で該障害の前記障害情報が記憶されて
いると判定された場合に、該障害情報より該障害に対応
する復旧手順を取得し、該復旧手順により復旧を行うコ
マンド制御処理と、 前記障害解析処理で該障害の前記障害情報が記憶されて
いないと判定された場合に、操作者が該障害に対してと
った復旧手順と、該障害と障害種別が同一の障害の発生
回数とを、該障害の障害種別と対応づけて一時的に蓄積
する復旧手順取得処理と、 前記一時的に蓄積された障害種別と復旧手順との対応
を、前記一時的に蓄積された前記障害発生回数が所定の
回数を超えた場合に、障害情報として登録する復旧手順
登録処理と、 をコンピュータシステムに実行させるコンピュータプロ
グラムを記憶することを特徴とする記憶媒体。
5. When a failure occurs, a failure analysis process for determining whether or not the correspondence between the failure type of the failure and the recovery procedure is stored as failure information; When it is determined that the failure information is stored, a recovery procedure corresponding to the failure is acquired from the failure information, and a command control process for performing recovery according to the recovery procedure; If it is determined that the failure is not stored, the recovery procedure taken by the operator for the failure and the number of occurrences of the failure having the same failure type as the failure are temporarily associated with the failure type of the failure. Recovery procedure acquisition processing for temporarily storing, and the correspondence between the temporarily stored fault type and the recovery procedure, when the temporarily stored fault occurrence count exceeds a predetermined number, the fault information Register as recovery Storage medium characterized by storing a computer program for executing the order registration process, to the computer system.
【請求項6】 前記復旧手順登録処理で、前記一時的に
蓄積された障害種別と復旧手順と障害発生回数との対応
を表示して、該障害種別と該復旧手順との対応を登録す
るか否かを操作者に問い合わせ、操作者より登録する旨
の指示があった場合にのみ、該障害種別と該復旧手順と
の対応を障害情報として登録することを特徴とする請求
項5に記載の記憶媒体。
In wherein said recovery procedure registration processing, and displays the corresponding of the temporarily stored fault type and recovery procedures and number of errors or not to register the correspondence between the fault type and該復old procedures query whether the operator only if there is an instruction to register from the operator, claims and registers the correspondence between the fault type and該復former procedure as a failure information
Item 6. The storage medium according to Item 5 .
JP08245076A 1996-09-17 1996-09-17 Failure recovery device, failure recovery method, and storage medium storing failure recovery program Expired - Fee Related JP3109572B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08245076A JP3109572B2 (en) 1996-09-17 1996-09-17 Failure recovery device, failure recovery method, and storage medium storing failure recovery program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08245076A JP3109572B2 (en) 1996-09-17 1996-09-17 Failure recovery device, failure recovery method, and storage medium storing failure recovery program

Publications (2)

Publication Number Publication Date
JPH1091475A JPH1091475A (en) 1998-04-10
JP3109572B2 true JP3109572B2 (en) 2000-11-20

Family

ID=17128246

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08245076A Expired - Fee Related JP3109572B2 (en) 1996-09-17 1996-09-17 Failure recovery device, failure recovery method, and storage medium storing failure recovery program

Country Status (1)

Country Link
JP (1) JP3109572B2 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006219258A (en) * 2005-02-10 2006-08-24 Hitachi Plant Technologies Ltd Work support system of facility device
JP4617937B2 (en) * 2005-03-15 2011-01-26 日本電気株式会社 System operation management support device, system operation management support method, and system operation management support program
JP2007183730A (en) * 2006-01-05 2007-07-19 Hitachi Electronics Service Co Ltd Autonomy promotion system
JP4858031B2 (en) * 2006-09-13 2012-01-18 コニカミノルタビジネステクノロジーズ株式会社 Image forming apparatus
JP4887238B2 (en) * 2007-08-20 2012-02-29 株式会社日立情報システムズ System failure recovery apparatus, command generation method thereof, and program thereof
JP2009259161A (en) * 2008-04-21 2009-11-05 Nec Corp Knowledge-based failure recovery support system, user terminal, relay server and knowledge supply server, and data relay method
JP5353063B2 (en) * 2008-05-30 2013-11-27 富士通株式会社 Coping knowledge generation program, coping knowledge generation device, and coping knowledge generation method
JP5588295B2 (en) * 2010-10-05 2014-09-10 株式会社日立システムズ Information processing apparatus and failure recovery method

Also Published As

Publication number Publication date
JPH1091475A (en) 1998-04-10

Similar Documents

Publication Publication Date Title
JP3109572B2 (en) Failure recovery device, failure recovery method, and storage medium storing failure recovery program
JP3182111B2 (en) Program test support device
JP2002351701A (en) System failure response supporting method
JP3867868B2 (en) Fault integrated management device
JP3099770B2 (en) Fault information management method in network monitoring system
JPH0594353A (en) Database management system
JP3357777B2 (en) Program control system
JP2000250748A (en) Influence propagation detector
JP2003208333A (en) Trace information searching device and method therefor
JP3022709B2 (en) Fault information output method in network management system
JP2792383B2 (en) Verification method of processing result of batch processing system
JP3018320B2 (en) Data processing device
JPH0581388A (en) Graphic information display function insepcting system
JP2831782B2 (en) Plant alarm diagnostic display
JPH0497445A (en) Diagnostic system for information processor
JPH10143562A (en) Medical treatment action input device
JP2004046310A (en) Fault repair program application method, execution device of the same, and processing program of the same
JPH07319818A (en) Reprocessing method for on-line application system
JP2002318712A (en) Program running history analyzing method
JPH0296864A (en) Device and method for updating data
JPS63177299A (en) Transaction processor
JP2006350896A (en) System and program for supporting collection of information for prerequisite investigation
JP2000330626A (en) Monitor controlling device and method and recording medium for recording monitor program
JP2002108610A (en) Problem management system and managing method
JPS61208516A (en) Supervisory unit

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000816

LAPS Cancellation because of no payment of annual fees