JP2003085003A - Fault restoration assist method and fault restoration assist system - Google Patents

Fault restoration assist method and fault restoration assist system

Info

Publication number
JP2003085003A
JP2003085003A JP2001271069A JP2001271069A JP2003085003A JP 2003085003 A JP2003085003 A JP 2003085003A JP 2001271069 A JP2001271069 A JP 2001271069A JP 2001271069 A JP2001271069 A JP 2001271069A JP 2003085003 A JP2003085003 A JP 2003085003A
Authority
JP
Japan
Prior art keywords
failure
recovery
information
status information
failure status
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001271069A
Other languages
Japanese (ja)
Inventor
Takamasa Maeda
崇雅 前田
Hisaaki Saeki
尚晃 佐伯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2001271069A priority Critical patent/JP2003085003A/en
Publication of JP2003085003A publication Critical patent/JP2003085003A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a system for collecting the fault state of a system wherein a fault occurs and presenting quickly a restoration method to a user. SOLUTION: When a fault occurs in another system 101, occurrence of the fault is detected by a system monitoring part 102, and fault state information 103 including an error code or the like is corrected by the system monitoring part 102, and the fault state information 103 is transmitted to a fault state information receiving part 104. A fault information retrieval part 106 retrieves a restoration information accumulation part 105 based on the fault state information 103 received by the fault state information receiving part 104, and a restoration information transmission part 107 transmits the acquired restoration information to another system 101.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、システムの障害発
生に対して、その障害からの復旧方法説明する復旧情報
を提示する方法とシステムとに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method and a system for presenting recovery information for explaining a recovery method from a failure of a system.

【0002】[0002]

【従来の技術】従来、コンピュータシステムなどのシス
テムに障害が発生する場合に備えて、障害に対応する要
員をシステムのそばに常駐させることや、障害の発生を
認めたシステムのユーザがサポートセンタに連絡をし、
サポートセンタが障害からの復旧の手順をシステムのユ
ーザにアドバイスしたり、サポートセンタが遠隔地から
システムの復旧を行ったりすることが行われていた。
2. Description of the Related Art Conventionally, in case a failure occurs in a system such as a computer system, a person who responds to the failure is always stationed near the system, and a user of the system that has recognized the failure is assigned to a support center. Contact me,
The support center has advised the user of the system of the procedure for recovery from a failure, and the support center has performed recovery of the system from a remote location.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、障害に
対応する要員をシステムのそばに常駐させることは、人
件費の負担が重く、相当に大規模なシステムでないと実
行できない。
However, it is not possible to make the personnel who respond to a failure resident near the system impose a heavy labor cost on the system and must be a fairly large-scale system.

【0004】また、システムのユーザがサポートセンタ
に連絡をしてくるようにすれば、人件費は低く抑えるこ
とができ、一つのサポートセンタで複数のシステムの対
応ができるので、人件費などの費用の点では利点があ
る。しかし、システムのユーザは障害発生時にどのよう
な障害が発生したかをサポートセンタに連絡し、障害の
内容を正しく説明しなければならないが、システムのユ
ーザは、そのシステムの内部に精通している場合は少な
く、障害の内容を正確にサポートセンタに伝えるのは困
難である。また、サポートセンタの側でも、連絡を受け
る者がシステム全てを理解している場合は少なく、障害
の発生を連絡してきたユーザにその場で復旧方法を提示
できる場合は少なく、連絡を受けた者から更に別の人間
に障害内容が伝えられて、ユーザへ復旧方法が提示され
る場合がほとんどであり、復旧方法がシステムのユーザ
に伝えられるまで時間がかかっていた。
Further, if the user of the system contacts the support center, the labor cost can be kept low, and one support center can handle a plurality of systems. There are advantages in terms of. However, the user of the system must inform the support center of what kind of failure occurred at the time of failure and explain the details of the failure correctly, but the user of the system is familiar with the inside of the system. In many cases, it is difficult to accurately inform the support center of the details of the failure. Also, even on the side of the support center, it is rare for the contactee to understand the entire system, and it is rare for the user who has contacted the failure occurrence to be able to present a recovery method on the spot. In most cases, the content of the failure is communicated to another person and the recovery method is presented to the user, and it took time until the recovery method was communicated to the user of the system.

【0005】そこで、本発明は、費用を少なくしつつ、
障害の発生したシステムのユーザに迅速に復旧方法を記
述する復旧方法を提示する方法、及び、システムを提供
する。
Therefore, the present invention reduces the cost while
(EN) A method of presenting a recovery method describing a recovery method to a user of a system in which a failure has occurred, and a system.

【0006】[0006]

【課題を解決するための手段】上記の課題を解決するた
めに、本発明は、第一に、障害が発生していないか監視
を行い、障害が発生した場合には、その障害を記述する
障害状況情報を受信し、蓄積された障害からの復旧方法
を記述する復旧情報を検索し、得られた復旧情報を他シ
ステムに送信する障害復旧援助方法、及び、障害復旧援
助システムを提供する。これにより、障害が発生した場
合に障害の内容を記述した情報が得られ、なおかつ、そ
の情報により復旧情報を検索し、他システムに送信され
るので、障害発生時に迅速に復旧情報を提示することが
できる。
In order to solve the above problems, the present invention firstly monitors whether or not a failure has occurred, and when the failure has occurred, describes the failure. Provided are a failure recovery assistance method and a failure recovery assistance system for receiving failure status information, searching for recovery information describing a recovery method from accumulated failures, and transmitting the obtained recovery information to another system. As a result, when a failure occurs, information describing the details of the failure can be obtained, and the recovery information is searched based on that information and sent to other systems, so the recovery information should be presented promptly when the failure occurs. You can

【0007】第二に、受信した障害状況情報を出力し、
その障害状況情報で記述される障害からの復旧のための
復旧情報を受け付け、受信した障害状況情報と関連付け
て蓄積することを更に行う障害復旧援助方法、及び、障
害復旧援助システムを提供する。これにより、障害状況
情報により復旧情報を検索しても検索結果が得られなか
った場合に、復旧情報を追加することができ、将来、同
じ障害が発生した場合に備えることができる。
Secondly, the received fault status information is output,
There is provided a failure recovery assistance method and a failure recovery assistance system which further accepts recovery information for recovery from a failure described by the failure status information, and further stores the recovery information in association with the received failure status information. As a result, the recovery information can be added when the search result is not obtained even when the recovery information is searched by the failure status information, and the same failure can be prepared in the future.

【0008】第三に、受け付けた復旧情報を障害の発生
した他システムへ送信することを更に行う障害復旧援助
方法、及び、障害復旧援助システムを提供する。これに
より、復旧のための復旧情報を蓄積するとともに障害の
発生した他システムへの送信も行われ、検索されなかっ
た場合でも、復旧情報が迅速に提示することができる。
Thirdly, there is provided a failure recovery assistance method and a failure recovery assistance system for further transmitting the received recovery information to another system in which a failure has occurred. As a result, the restoration information for restoration is stored and transmitted to the other system in which the failure has occurred, and the restoration information can be promptly presented even if it is not searched.

【0009】第四に、障害の中には、一定の時間間隔で
発生するものもあるので、受信した障害状況情報を蓄積
し、蓄積された障害状況情報を分析することにより、次
回の障害の発生がいつごろ発生するかを予測し、その結
果を出力する障害復旧援助システムを提供する。これに
より、次回の障害発生が予測でき、前もって対策を講じ
ることができる。
Fourthly, some of the failures occur at regular time intervals. Therefore, the received failure status information is accumulated and the accumulated failure status information is analyzed to detect the next failure. Provide a disaster recovery assistance system that predicts when an occurrence will occur and outputs the result. As a result, the occurrence of the next failure can be predicted, and countermeasures can be taken in advance.

【0010】第五に、蓄積された障害からの復旧方法を
記述する復旧情報を検索する条件を受け付け、検索を実
行し、その結果を出力する障害復旧援助システムを提供
する。これにより、サポートセンタの人間や、他システ
ムのユーザが手動で復旧情報を検索することができ、特
に、他システムがセキュリティ上の問題でネットワーク
に接続されていない場合に復旧情報の検索が可能とな
る。
Fifth, there is provided a failure recovery assistance system which accepts a condition for searching recovery information describing a method of recovering from a stored failure, executes the search, and outputs the result. This allows support center personnel and users of other systems to search for recovery information manually, especially when other systems are not connected to the network due to security issues. Become.

【0011】なお、本発明において、障害状況情報は、
エラーコード、エラーメッセージ、エラー発生プログラ
ムファイル名、エラー発生行番号、スタックトレースの
うち一または二以上の組み合わせで表現できる。また、
障害状況情報には他システムのログ情報を含ませること
もでき、復旧情報の検索の際には、パターンマッチを行
うことも可能である。
In the present invention, the failure status information is
It can be expressed by one or a combination of error code, error message, error occurrence program file name, error occurrence line number, and stack trace. Also,
The failure status information may include log information of other systems, and pattern matching may be performed when searching for recovery information.

【0012】[0012]

【発明の実施の形態】以下、本発明の実施の形態につい
て、図1から図15を用いて説明する。なお、本発明
は、これら実施の形態に何ら限定されるものではなく、
その要旨を逸脱しない範囲において、種々なる形態で実
施し得る。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to FIGS. The present invention is not limited to these embodiments,
It may be implemented in various forms without departing from the spirit of the invention.

【0013】<実施の形態1>図1は、本発明の実施の
形態1における障害復旧援助システムの機能ブロック図
である。本実施の形態において、障害復旧援助システム
100は、他システム101と、システム監視部102
と、障害状況情報受信部104と、復旧情報蓄積部10
5と、復旧情報検索部106と、復旧情報送信部107
からなる。
<First Embodiment> FIG. 1 is a functional block diagram of a failure recovery assistance system according to a first embodiment of the present invention. In the present embodiment, the disaster recovery assistance system 100 includes another system 101 and a system monitoring unit 102.
And the failure status information receiving unit 104 and the recovery information storage unit 10
5, a recovery information search unit 106, and a recovery information transmission unit 107
Consists of.

【0014】他システム101は、後述のシステム監視
部102の監視対象であり、障害の発生を知らせること
のできる機能を有しているシステムである。特にコンピ
ュータシステムに限られるものではなく、故障を知らせ
る機能を持つ機械システムであってもよい。ただし、近
年では、障害の検出は計算機に接続されたセンサーによ
り行われることが多く、以下の説明においては、計算機
を用いたシステムを用いて説明するが、電子回路のみか
らなるシステム、純粋な機械システム、化学プラントな
どにも本発明は応用可能である。計算機を用いたシステ
ムの例としては、図書管理システム、データベース管理
システム、オンラインシステム、ネットワークシステ
ム、コンピュータシステムを挙げることができる。な
お、本発明において、他システム101は、特定の装置
に限定されることはなく、先に挙げたシステムが納入さ
れた部屋や建物を含む場合もある。
The other system 101 is a system to be monitored by a system monitoring unit 102, which will be described later, and has a function of notifying the occurrence of a failure. The system is not limited to a computer system in particular, and may be a mechanical system having a function of notifying a failure. However, in recent years, failure detection is often performed by a sensor connected to a computer, and in the following description, a system using a computer will be described, but a system consisting only of electronic circuits, a pure machine. The present invention can be applied to a system, a chemical plant, etc. Examples of systems using computers include book management systems, database management systems, online systems, network systems, and computer systems. In addition, in the present invention, the other system 101 is not limited to a specific device, and may include a room or a building to which the above-mentioned system is delivered.

【0015】システム監視部102は、他システム10
1の障害発生を監視する。図1において、システム監視
部102は、他システム101と独立して図示されてい
るが、他システム101の一部として動作している場合
もある。例えば、他システムが計算機で構成されている
場合には、その計算機で動作してシステムの機能を提供
する特定のプロセスの停止や終了時の状態を示すコード
を受理する別プロセスであってもよい。このようなコー
ドはプロセス間通信によって得ることや、オペレーティ
ングシステムを経由して得ることができる。また、ある
計算機で動作しているプロセスが出力するログが別の計
算機に送信されるようになっており、その別の計算機で
ログを読むプロセスがシステム監視部102である場合
もある。
The system monitoring unit 102 is the other system 10
Monitor the failure occurrence of 1. Although the system monitoring unit 102 is illustrated as being independent of the other system 101 in FIG. 1, it may also operate as a part of the other system 101. For example, when the other system is composed of a computer, it may be a separate process that operates on the computer and receives a code indicating the state at the time of termination or termination of a specific process that provides the system function. . Such code can be obtained by interprocess communication or via the operating system. Further, the log output by the process running on a certain computer may be transmitted to another computer, and the process of reading the log on the other computer may be the system monitoring unit 102.

【0016】図2は、システム監視部102の動作を説
明するフローチャートである。まず、ステップS201
において、他システム101で障害が発生するまで待つ
ことを行う。前述のように、同じ計算機で動作するプロ
セスの停止や終了時のコードを取得するまで待つこと
や、別の計算機で動作するプロセスが生成するログを読
み、障害の発生を示す内容が得られるまで待つことを行
う。
FIG. 2 is a flow chart for explaining the operation of the system monitoring unit 102. First, step S201
At, the system waits until a failure occurs in the other system 101. As described above, wait until you get the code for stopping or exiting the process running on the same computer, or read the log generated by the process running on another computer until you get the content that indicates the occurrence of the failure. Do the wait.

【0017】他システム101において障害が発生する
と、ステップS202に移行し、障害状況を収集する。
例えば、プロセスの停止や終了時のコードを取得した
り、障害発生に至るまでのログを収集したりする。特
に、障害におけるエラーコード、エラーメッセージ、エ
ラー発生プログラムファイル名、エラー発生行番号、ス
タックトレースなどの障害状況を示す情報を収集する。
エラーコードとは、他システムが自ら障害を検出した場
合、その障害を分類するために、あらかじめ定義された
番号あるいは符号のことである。エラーメッセージと
は、エラーコードが発生した状況を説明するメッセージ
である。エラー発生プログラムファイル名とは、エラー
が発生したときにプロセスが実行していたプログラムの
部分が記述されたファイル名であり、エラー発生行番号
とは、エラー発生プログラムファイル名の中の障害が発
生したプログラムの部分が記述されている行番号であ
る。スタックトレースとは、プログラムの実行により呼
び出された関数、手続き、サブルーチンの履歴の一つの
形態である。また、これ以外にも、システムに障害が発
生した時におけるプロセスのメモリーの内容を、障害状
況として収集すべきものとして挙げることもできる。ま
た、障害が発生した場合の他システム101を運用して
いたユーザの操作履歴や、ユーザの行動を記録したビデ
オテープも収集すべきものの例として挙げることができ
る。
When a failure occurs in the other system 101, the process proceeds to step S202 and the failure status is collected.
For example, the code at the time of stopping or terminating the process is acquired, or the log up to the occurrence of a failure is collected. In particular, information indicating the failure status such as error code, error message, error occurrence program file name, error occurrence line number, stack trace, etc. is collected.
The error code is a number or code defined in advance to classify the fault when another system detects the fault by itself. The error message is a message explaining the situation where the error code occurs. The error occurrence program file name is the file name that describes the part of the program that the process was executing when the error occurred, and the error occurrence line number is the error occurrence program file name error This is the line number where the part of the program that was written is described. A stack trace is a form of history of functions, procedures, and subroutines called by executing a program. In addition to this, the contents of the memory of the process when a failure occurs in the system can be listed as the failure status to be collected. In addition, an operation history of a user who is operating the other system 101 when a failure occurs, and a video tape recording a user's behavior can be cited as an example of what should be collected.

【0018】なお、障害状況の収集は、常に同じものを
収集するのではなく、障害に応じて、例えば、エラーコ
ードに応じて、適切な障害状況が収集されるよう収集の
対象を変化させてもよい。
It should be noted that the collection of the failure status is not always the same, but the collection target is changed so that an appropriate failure status is collected according to the failure, for example, the error code. Good.

【0019】障害状況の収集が終了すると、ステップS
203に移行し、収集した障害状況を障害状況情報とし
て障害状況情報受信部104へ送信する。
When the collection of fault conditions is completed, step S
In step 203, the collected failure status is transmitted to the failure status information receiving unit 104 as failure status information.

【0020】図3は障害状況情報受信部104へ送信さ
れる障害状況情報103の一つの例を示している。この
例では、XMLに似た構文により障害状況情報が示され
ており、「<...>」と「</...>」とが括弧のように
対応し、これらによって、はさまれる部分の意味
を「...」が表している。例えば、「<発生日時>」と
「</発生日時>」とが対応し、これらによって、はさ
まれる部分が障害の発生日時であることを示している。
図3の例では、エラーコードが7であり、エラーメッセ
ージがMemory Exhausted、エラー発生
プログラムファイル名がalloc.cpp、エラー発
生行番号が2167、スタックトレースが、main、
Form_Load、allocList、mmAll
ocという関数が順に呼ばれたことを示している。
FIG. 3 shows an example of the failure status information 103 transmitted to the failure status information receiving section 104. In this example, the failure status information is shown by a syntax similar to XML, and "<...>" and "</ ...>" correspond like parentheses and are sandwiched between them. "..." represents the meaning of the part. For example, “<occurrence date and time>” and “</ occurrence date and time>” correspond to each other, and these indicate that the sandwiched portion is the fault occurrence date and time.
In the example of FIG. 3, the error code is 7, the error message is Memory Exhausted, and the error occurrence program file name is alloc. cpp, error line number is 2167, stack trace is main,
Form_Load, allocList, mmAll
It indicates that the function oc was called in order.

【0021】障害状況情報受信部104は、システム監
視部102から送られる障害状況情報103を受信す
る。システム監視部102と障害状況情報受信部104
とが一つのプログラムで実行される場合には、障害状況
情報受信部104の機能を実現する関数、手続き、ある
いはサブルーチンの引数として障害状況情報103を渡
すようにすればよい。また、システム監視部102と障
害状況情報受信部104とが別の機械にある場合には、
インターネットなどの通信を用いて障害状況情報103
が送られる。
The failure status information receiving section 104 receives the failure status information 103 sent from the system monitoring section 102. System monitoring unit 102 and failure status information receiving unit 104
When and are executed by one program, the failure status information 103 may be passed as an argument of a function, procedure, or subroutine that realizes the function of the failure status information receiving unit 104. If the system monitoring unit 102 and the failure status information receiving unit 104 are on different machines,
Failure status information 103 using communication such as the Internet
Will be sent.

【0022】復旧情報蓄積部105は、障害からの復旧
方法を記述する復旧情報を蓄積する。障害からの復旧方
法とは、他システム101で発生した障害からシステム
を復旧させる方法であり、復旧情報蓄積部105は、こ
のような方法を障害状況情報と関連付けて蓄積し、障害
状況情報から検索ができるように蓄積する。
The recovery information storage unit 105 stores recovery information that describes a recovery method from a failure. The method for recovering from a failure is a method for recovering a system from a failure that has occurred in another system 101, and the recovery information storage unit 105 stores such a method in association with failure status information and retrieves it from the failure status information. Accumulate so that you can.

【0023】図5は、復旧情報蓄積部105が障害状況
情報と関連付けて、障害からの復旧方法を蓄積した例で
ある。この例では、障害状況情報としては、エラーコー
ドを用いている場合を示しており、例えば、7というエ
ラーコードには、「メモリーが足りません。システムを
再起動して下さい。」という障害からの復旧方法が関連
付けられている。もちろん、エラーコード以外にも障害
状況情報として、エラーメッセージ、エラー発生プログ
ラムファイル名、エラー発生行番号、スタックトレース
などと障害からの復旧方法を関連付けて蓄積することも
可能であり、また、これらの組み合わせと関連付けて蓄
積することもできる。
FIG. 5 is an example in which the recovery information storage unit 105 stores the recovery method from a failure in association with the failure status information. This example shows the case where an error code is used as the failure status information. For example, the error code 7 indicates that there is not enough memory. Please restart the system. Associated recovery methods. Of course, in addition to the error code, it is also possible to store error messages, error occurrence program file names, error occurrence line numbers, stack traces, etc. as failure condition information in association with each other, and to accumulate these. It can also be stored in association with a combination.

【0024】復旧情報検索部106は、障害状況情報受
信部104で受信された障害状況情報103から復旧情
報蓄積部105に蓄積された復旧情報を検索する。例え
ば、図3に示される形式によって障害状況情報受信部1
04が受信した場合には、この形式から障害状況情報を
抽出し、復旧情報蓄積部105を検索する。例えば、復
旧情報蓄積部105に図5に示す形式で復旧情報が蓄積
されている場合には、エラーコードを抽出し、エラーコ
ードで検索を行う。
The recovery information searching unit 106 searches the failure status information 103 received by the failure status information receiving unit 104 for the recovery information stored in the recovery information storage unit 105. For example, the failure status information receiving unit 1 according to the format shown in FIG.
When 04 is received, the failure status information is extracted from this format and the recovery information storage unit 105 is searched. For example, when the recovery information storage unit 105 stores the recovery information in the format shown in FIG. 5, an error code is extracted and a search is performed using the error code.

【0025】復旧情報送信部107は、復旧情報検索部
106での検索結果を他システム101へ向けて送信す
る。この場合の「検索結果」とは、復旧情報蓄積部10
5に蓄積された復旧情報を検索した結果である。また、
先述のように他システム101が、システムが納入され
た部屋や建物を含む意味として解釈すれば、その部屋や
建物に備えられたファクシミリ受信装置に検索結果であ
る復旧情報を送信したり、その部屋や建物にいる人物に
自動で電話をかけて音声合成によって復旧情報を読み上
げたりすることを行うことも送信に含まれる。
The recovery information transmission unit 107 transmits the search result of the recovery information search unit 106 to the other system 101. In this case, the "search result" means the recovery information storage unit 10
It is the result of searching the recovery information accumulated in 5. Also,
As described above, if the other system 101 interprets the meaning as including the room or building to which the system is delivered, it sends the restoration information as a search result to the facsimile receiving device provided in the room or building, or the room. It also includes automatically calling the person in the building and reading the restoration information by voice synthesis.

【0026】図4は、障害状況情報受信部104、復旧
情報蓄積部105、復旧情報検索部106、復旧情報送
信部107の動作を説明するフローチャートである。ス
テップS401は障害状況情報受信ステップであり、障
害状況情報受信部104が障害状況情報を受信するまで
待つ。障害状況情報を受信すると、ステップS402で
ある検索ステップへ移行し、復旧情報検索部106が障
害状況情報に基づき、復旧情報蓄積部105に蓄積され
た復旧方法を検索する。そして、ステップS403であ
る送信ステップへ移行し、復旧情報送信部107が検索
された復旧方法を他システム101へ送信する。
FIG. 4 is a flow chart for explaining the operations of the failure status information receiving unit 104, the restoration information storage unit 105, the restoration information search unit 106, and the restoration information transmission unit 107. Step S401 is a failure status information reception step, and waits until the failure status information receiving unit 104 receives the failure status information. When the failure status information is received, the process moves to the search step, which is step S402, and the recovery information search unit 106 searches for the recovery method stored in the recovery information storage unit 105 based on the failure status information. Then, the process proceeds to the transmitting step which is step S403, and the recovery information transmitting unit 107 transmits the retrieved recovery method to the other system 101.

【0027】図15は、復旧情報送信部107が送信す
る復旧情報の一例を示しており、「障害内容」の欄の
「障害内容及び復旧手順」に復旧の手順が提示されてい
る。復旧情報送信部107は、このようなフォームを他
システム101へFAXにより送信したり、E−MAI
Lで送信したりする。また、音声合成により他システム
101のユーザへ電話で伝えるようにしてもよい。
FIG. 15 shows an example of the restoration information transmitted by the restoration information transmission unit 107, and the restoration procedure is presented in the “fault content and restoration procedure” in the “fault content” column. The restoration information transmission unit 107 transmits such a form to the other system 101 by FAX, or the E-MAI.
Send with L. In addition, the user of the other system 101 may be notified by telephone by voice synthesis.

【0028】このような障害状況情報受信部104、復
旧情報蓄積部105、復旧情報検索部106、復旧情報
送信部107は、図6に示す計算機600で実現するこ
とが可能である。計算機600は、CPU601、RA
M(Random Access Memory)60
2、HDD(Hard Disk Drive)60
3、入出力装置604、通信インターフェース607が
相互にバスにより接続された形態である。HDD603
に図4に示すフローチャートの各ステップを計算機60
0に実行させるプログラムが格納され、RAM602に
ロードされ、CPU601により実行可能となる。ま
た、HDD603には、復旧情報が蓄積される。入出力
装置604は、キーボードやマウスなどの入力装置とデ
ィスプレイの出力装置からなり、計算機600の状況を
表示したり、計算機600の保守のための操作を行う機
能を提供したりする。通信インターフェース607は、
通信回線608を介して他システム101と接続され、
他システム101でシステム監視部102が動作する場
合には、障害状況情報を受信し、また、システム監視部
102が計算機600で実現される場合には、他システ
ムから送られるログ情報を受信したり、他システムに定
期的に稼動状況を調べる信号を送信したりする。また、
ステップS403である送信ステップにおいて、他シス
テム101へ検索結果を送信することも行う。
The failure status information receiving unit 104, the restoration information storage unit 105, the restoration information searching unit 106, and the restoration information transmitting unit 107 can be realized by the computer 600 shown in FIG. The computer 600 has a CPU 601 and RA
M (Random Access Memory) 60
2. HDD (Hard Disk Drive) 60
3, the input / output device 604 and the communication interface 607 are mutually connected by a bus. HDD603
The steps of the flowchart shown in FIG.
A program to be executed by 0 is stored, loaded into the RAM 602, and can be executed by the CPU 601. Further, the HDD 603 stores recovery information. The input / output device 604 is composed of an input device such as a keyboard and a mouse and an output device of a display, and provides a function of displaying the status of the computer 600 and performing an operation for maintenance of the computer 600. The communication interface 607 is
Connected to another system 101 via a communication line 608,
When the system monitoring unit 102 operates in the other system 101, failure status information is received, and when the system monitoring unit 102 is realized by the computer 600, log information sent from the other system is received. , Sends a signal to other systems to periodically check the operating status. Also,
In the transmitting step which is step S403, the search result is also transmitted to the other system 101.

【0029】以上説明した実施の形態1における障害復
旧援助システムによれば、他システム101で障害が発
生した場合には、システム監視部102によって障害の
発生が検出され、障害状況情報の収集が行われ、障害状
況情報受信部104へ送信され、復旧情報検索部106
により復旧方法の検索が行われ、その検索結果が他シス
テム101へ送信されるので、迅速に障害からの復旧方
法が提示される。また、他システム101のユーザやサ
ポートセンタの人員が他システム101の障害状況を調
べる手間を省くことができる。
According to the failure recovery assistance system in the first embodiment described above, when a failure occurs in the other system 101, the system monitoring unit 102 detects the occurrence of the failure and collects the failure status information. Is sent to the failure status information receiving unit 104, and the recovery information searching unit 106
The recovery method is searched by and the search result is transmitted to the other system 101, so that the recovery method from the failure is promptly presented. Further, it is possible to save the user of the other system 101 and the staff of the support center from having to check the failure status of the other system 101.

【0030】また、実施の形態1における障害復旧援助
システム100は、システム監視ステップ、障害状況情
報送信ステップ、障害状況情報受信ステップ、復旧情報
蓄積ステップ、復旧情報検索ステップ、復旧情報送信ス
テップを含む障害復旧援助方法を実現するシステムとみ
なすこともできる。システム監視ステップは他システム
の障害発生を監視するステップであり、障害状況情報送
信ステップは他システムで発生した障害を記述する障害
状況情報を収集し送信するステップであり、障害状況情
報受信ステップは障害状況情報送信ステップで送信され
た障害状況情報を受信するステップであり、復旧情報蓄
積ステップは障害からの復旧方法を記述する復旧情報を
蓄積するステップであり、復旧情報検索ステップは障害
状況情報受信ステップで受信された障害状況情報から復
旧情報蓄積ステップにより蓄積されている復旧情報を検
索ステップであり、復旧情報送信ステップは復旧情報検
索ステップでの検索結果を他システムへ向けて送信する
ステップである。すなわち、システム監視部102が他
システム101の障害の発生を監視する動作がシステム
監視ステップであり、システム監視部102が他システ
ム101の障害の発生を検出し、障害状況を収集し送信
する動作が障害状況情報送信ステップである。また、障
害状況情報受信ステップは障害状況情報受信部104に
よって実現され、復旧情報蓄積ステップは、復旧情報蓄
積部105によって実現され、復旧情報検索ステップは
復旧情報検索部106により実現され、復旧情報送信ス
テップは、復旧情報送信部107によって実現される。
Further, the failure recovery assistance system 100 according to the first embodiment includes a failure including a system monitoring step, a failure status information transmitting step, a failure status information receiving step, a recovery information accumulating step, a recovery information searching step, and a recovery information transmitting step. It can be regarded as a system that realizes the recovery assistance method. The system monitoring step is a step of monitoring the occurrence of a failure in another system, the failure status information sending step is a step of collecting and sending failure status information describing a failure that occurred in another system, and the failure status information receiving step is a failure step. The step of receiving the failure status information transmitted in the status information transmitting step is the step of accumulating the recovery information describing the recovery method from the failure in the recovery information accumulating step, and the failure status information receiving step is the recovery information searching step. The recovery information accumulating step is a search step for the recovery information accumulating step received from the failure status information received in step 1, and the recovery information transmitting step is a step for transmitting the search result in the recovery information searching step to another system. That is, the operation of the system monitoring unit 102 to monitor the occurrence of a failure in the other system 101 is a system monitoring step, and the operation of the system monitoring unit 102 to detect the occurrence of a failure in the other system 101 and collect and transmit the failure status It is a failure status information transmitting step. Further, the failure status information receiving step is realized by the failure status information receiving unit 104, the restoration information storage step is realized by the restoration information storage unit 105, the restoration information search step is realized by the restoration information search unit 106, and the restoration information transmission is performed. The steps are realized by the recovery information transmission unit 107.

【0031】<実施の形態2>実施の形態2において
は、障害復旧援助システムは、実施の形態1からさらに
障害状況情報出力部と復旧情報受付部を備えている。図
7は、実施の形態2における障害復旧援助システムの機
能ブロック図を示す。
<Second Embodiment> In the second embodiment, the failure recovery assistance system further includes a failure status information output unit and a recovery information reception unit as compared with the first embodiment. FIG. 7 is a functional block diagram of the disaster recovery assistance system according to the second embodiment.

【0032】障害状況情報出力部701は、障害状況情
報を出力することを行う。例えば、障害復旧援助システ
ム100が計算機600で実現される場合には、入出力
装置604に障害状況情報を出力する。
The fault status information output unit 701 outputs fault status information. For example, when the failure recovery assistance system 100 is realized by the computer 600, the failure status information is output to the input / output device 604.

【0033】復旧情報受付部702は、障害状況情報出
力部701で出力された障害状況情報で記述される障害
からの復旧方法を記述する復旧情報を受け付け、復旧情
報蓄積部105に障害状況情報と復旧情報とを関連付け
て復旧情報蓄積部105に蓄積することを行う。障害復
旧援助システム100が計算機600で実現される場合
には、入出力装置604で復旧情報を受け付け、HDD
603に障害状況情報と関連付けて蓄積し、次に同じ障
害状況情報が受信され、検索が行われた際には、受け付
けられた復旧情報が検索されるようにする。したがっ
て、復旧情報受付部702は、復旧情報検索部106で
復旧情報を検索した結果、検索結果が得られなかった場
合に復旧情報を受け付けることになるので、障害状況情
報出力部701は、障害状況情報受信部104で受信さ
れた障害状況情報を全て出力するよりも、復旧情報検索
部106で復旧情報を検索した結果、検索結果が得られ
なかった場合に障害状況情報を出力するようにするのが
よい。そこで、図7においては、障害状況情報出力部7
01は復旧情報検索部106と線で結ばれて図示されて
いる。
The recovery information receiving unit 702 receives the recovery information describing the method of recovering from the failure described in the failure status information output by the failure status information output unit 701, and the recovery information accumulating unit 105 stores the failure status information. The recovery information is stored in the recovery information storage unit 105 in association with the recovery information. When the disaster recovery assistance system 100 is realized by the computer 600, the input / output device 604 receives the recovery information, and the HDD
When the same failure status information is received next and a search is performed, the received recovery information is searched for in the 603 stored in association with the failure status information. Therefore, since the recovery information receiving unit 702 receives the recovery information when the search result is not obtained as a result of searching the recovery information by the recovery information searching unit 106, the failure status information output unit 701 determines the failure status. Rather than outputting all the failure status information received by the information receiving unit 104, the failure status information is output when the search result is not obtained as a result of searching the recovery information by the recovery information searching unit 106. Is good. Therefore, in FIG. 7, the failure status information output unit 7
Reference numeral 01 is illustrated as being connected to the recovery information search unit 106 by a line.

【0034】図8は、本実施の形態における障害復旧援
助システム100の動作を説明するフローチャートであ
る。ステップS801は、ステップS401である障害
状況情報受信ステップである。ステップS802は、ス
テップ402である検索ステップである。
FIG. 8 is a flow chart for explaining the operation of the failure recovery assistance system 100 in this embodiment. Step S801 is a failure status information receiving step which is Step S401. Step S802 is a search step which is Step 402.

【0035】ステップ803は、判断ステップであり、
検索ステップによって復旧情報が入手できたかどうかが
判断される。もし、入手できたのであればステップS8
04へ移行し、そうでなければステップS805へ移行
する。ステップS804は、ステップS403である送
信ステップである。
Step 803 is a judgment step,
The search step determines if the recovery information is available. If available, step S8
04, otherwise, to step S805. Step S804 is a transmission step which is step S403.

【0036】ステップS805は、出力ステップであ
り、障害状況情報出力部701により、受信された障害
状況情報を出力することが行われる。
Step S805 is an output step in which the failure status information output unit 701 outputs the received failure status information.

【0037】ステップS806は、受付ステップであ
り、復旧情報受付部702により、ステップS805で
出力された障害状況情報で記述される障害からの復旧方
法を記述する復旧情報を受け付けて、復旧情報蓄積部1
05に障害状況情報と関連付けて蓄積することが行われ
る。
In step S806, which is a receiving step, the recovery information receiving unit 702 receives the recovery information describing the method of recovering from the failure described in the failure status information output in step S805, and the recovery information storage unit 1
05 is stored in association with the failure status information.

【0038】また、ステップS806の実行が行われた
後で、ステップS806において受け付けられ蓄積され
た復旧情報を他システム101へ送信するようにしても
よい。
After execution of step S806, the recovery information received and accumulated in step S806 may be transmitted to the other system 101.

【0039】以上説明した実施の形態2の復旧情報援助
システムによれば、復旧情報蓄積部105に復旧方法が
蓄積されていない障害状況情報が受信されても、それが
障害状況情報出力部701に出力がされ、その障害状況
情報によって記述される障害からの復旧方法を記述する
復旧情報が復旧情報受付部702により受け付けられ、
復旧情報蓄積部105に蓄積されるので、次に同じ障害
が発生した場合に復旧情報が送信されることになる。ま
た、復旧情報が復旧情報蓄積部105に蓄積されるとと
もに他システム101に送信されることにより、新たに
蓄積された復旧情報を他システム101のユーザに提示
することが可能となる。
According to the recovery information support system of the second embodiment described above, even if the failure status information for which the recovery method is not stored in the recovery information storage section 105 is received, it is sent to the failure status information output section 701. The recovery information receiving unit 702 receives the recovery information that is output and describes the recovery method from the failure described by the failure status information,
Since the recovery information is stored in the recovery information storage unit 105, the recovery information will be transmitted when the same failure occurs next time. Further, the restoration information is stored in the restoration information storage unit 105 and is transmitted to the other system 101, so that the newly stored restoration information can be presented to the user of the other system 101.

【0040】また、本実施の形態における障害復旧援助
システム100は、実施の形態1における障害復旧援助
方法に、さらに障害状況情報出力ステップと復旧情報受
付ステップとを含ませた障害復旧援助方法実現するシス
テムである。障害状況情報出力ステップは、障害状況情
報受信ステップで受信された障害状況情報を出力するス
テップであり、復旧情報受付ステップは、障害状況情報
出力ステップで出力された障害状況情報で記述される障
害からの復旧方法を記述する復旧情報を受け付け障害状
況情報と復旧情報とを関連付けて蓄積するステップであ
る。すなわち障害状況情報出力部701により、障害状
況情報出力ステップが実現され、復旧情報受付部702
によって復旧情報受付ステップが実現される。
Further, the failure recovery assistance system 100 in the present embodiment realizes the failure recovery assistance method in which the failure recovery assistance method in Embodiment 1 further includes a failure status information output step and a recovery information acceptance step. System. The failure status information output step is a step of outputting the failure status information received in the failure status information reception step, and the restoration information reception step is performed from the failure described in the failure status information output in the failure status information output step. This is a step of receiving the recovery information describing the recovery method of (1) and associating the failure status information with the recovery information and accumulating them. That is, the failure status information output unit 701 realizes the failure status information output step, and the recovery information reception unit 702.
The recovery information reception step is realized by.

【0041】<実施の形態3>図9は、本発明の実施3
の形態にかかわる障害復旧援助システムの機能ブロック
図である。実施の形態1の障害復旧援助システムに、障
害状況情報蓄積部901と、障害発生予測部902と、
障害発生予測出力部903が追加されている。
<Third Embodiment> FIG. 9 shows a third embodiment of the present invention.
FIG. 3 is a functional block diagram of a disaster recovery assistance system related to the form of FIG. The failure recovery support system according to the first embodiment includes a failure status information storage unit 901, a failure occurrence prediction unit 902,
A failure occurrence prediction output unit 903 is added.

【0042】障害状況情報蓄積部901は、障害状況情
報受信部104が受信した障害状況情報を、その障害の
発生したシステム別に蓄積する。「システム別に蓄積す
る」とは、障害状況情報を蓄積する際に、どのシステム
でその障害が発生したかを付加して蓄積することであ
る。
The failure status information storage unit 901 stores the failure status information received by the failure status information receiving unit 104 for each system in which the failure has occurred. “Accumulating by system” means that when the failure status information is stored, the system in which the failure has occurred is added.

【0043】障害発生予測部902は、障害状況情報蓄
積部901により蓄積された障害状況情報を統計的に分
析し、次回の障害発生を予測する。「統計的に分析し」
とは、多数の蓄積された障害状況情報から傾向として得
られる特徴を抽出する操作である。
The failure occurrence predicting section 902 statistically analyzes the failure status information accumulated by the failure status information accumulating section 901 and predicts the next failure occurrence. "Statistically analyzed"
Is an operation of extracting a feature obtained as a tendency from a large number of accumulated failure situation information.

【0044】障害発生予測出力部903は、障害発生予
測部902で予測された障害発生を出力する。
The failure occurrence prediction output unit 903 outputs the failure occurrence predicted by the failure occurrence prediction unit 902.

【0045】本実施の形態の障害復旧援助システム10
0が計算機600により実現される場合には、障害状況
情報蓄積部901は、障害状況情報をHDD603に蓄
積するプログラムによって実現され、障害発生予測部9
02は、HDD603に蓄積された障害状況情報を統計
的に処理するプログラムによって実現され、障害発生予
測出力部903は、障害発生予測部902で予測された
結果を入出力装置604に出力するプログラムによって
実現される。
Fault recovery assistance system 10 of the present embodiment
When 0 is realized by the computer 600, the failure status information storage unit 901 is realized by a program that stores failure status information in the HDD 603, and the failure occurrence prediction unit 9
02 is realized by a program that statistically processes the failure status information accumulated in the HDD 603, and the failure occurrence prediction output unit 903 uses a program that outputs the result predicted by the failure occurrence prediction unit 902 to the input / output device 604. Will be realized.

【0046】図10は、障害状況情報を、その障害の発
生したシステム別に蓄積した例であり、「システム名」
の列によって、その障害状況情報がどのシステムで発生
した障害を記述しているかを示している。
FIG. 10 shows an example in which the failure status information is accumulated for each system in which the failure has occurred.
The column indicates the system in which the failure status information describes the failure that occurred.

【0047】図11は、障害発生予測部902が障害状
況情報蓄積部901により蓄積された障害状況情報を統
計的に分析し、次回の障害発生を予測する処理の一例を
説明するフローチャートである。
FIG. 11 is a flow chart for explaining an example of processing in which the failure occurrence prediction unit 902 statistically analyzes the failure status information accumulated by the failure status information accumulation unit 901 and predicts the next failure occurrence.

【0048】ステップS1101において、蓄積された
障害状況情報をシステム名別にグルーピングすることを
行い、障害日時順に並びかえる。「システム名別にグル
ーピングする」とは、同じシステム名が付加された障害
状況情報を集めることを意味し、「障害日時順に並びか
える」とは、同じシステム名が付加された障害状況情報
を障害日時の順に並び変えることを意味する。
In step S1101, the accumulated failure status information is grouped by system name and rearranged in order of failure date and time. "Group by system name" means to collect the failure status information with the same system name added, and "Sort in order of failure date and time" means failure status information with the same system name added as failure time and date. Means rearranged in the order of.

【0049】ステップS1102において、隣接する行
の障害日時の差を求めることを行う。これにより、同一
のシステムで発生した障害の時間間隔が求められる。
In step S1102, the difference in failure date and time between adjacent rows is calculated. By this, the time interval of the failure that occurred in the same system can be obtained.

【0050】ステップS1103において、ステップS
1102で求められた時間間隔が同じかどうかを判断す
る。ここで「同じかどうかを判断する」には、正確に秒
単位まで一致することを意味しているとは限らず、ある
程度の誤差を伴って同じかどうかを判断する。例えば、
誤差を24時間とした場合、時間間隔として、10時
間、30時間、14時間が得られたとすると、これら3
つの時間間隔は、20時間を中心とする前後12時間で
ある24時間の誤差に入るので、同じと見なされる。時
間間隔が同じであると判断された場合には、ステップS
1104に移行し、そうでなければステップS1105
へ移行する。
In step S1103, step S
It is determined whether the time intervals obtained in 1102 are the same. Here, "determining whether or not they are the same" does not necessarily mean that they are exactly the same in seconds, but whether or not they are the same is determined with some error. For example,
If the error is 24 hours, and the time interval is 10 hours, 30 hours, and 14 hours, these 3
The two time intervals are considered to be the same, as they fall within a 24 hour error, which is 12 hours around 12 hours centered around 20 hours. If it is determined that the time intervals are the same, step S
1104, otherwise step S1105
Move to.

【0051】ステップS1104においては、差が同じ
と判断されたので、最後の障害日時に差である時間間隔
を加えた日時を出力する。時間間隔にはある程度の誤差
を含んでいるので、加える時間間隔には、平均値を用い
てもよい。また、誤差を求めて、出力された日時ととも
にその誤差を表示してもよい。
In step S1104, since it is determined that the difference is the same, the date and time obtained by adding the time interval of the difference to the last failure date and time is output. Since the time interval includes a certain amount of error, an average value may be used for the time interval to be added. Further, the error may be obtained and the error may be displayed together with the output date and time.

【0052】ステップS1105においては、種々の原
因による障害により障害発生日時が等間隔に発生しなか
ったと考えられるので、更に障害の原因を絞り込んで時
間間隔を求めるために、システム名別にグルーピングす
るのみならず、さらにエラー番号でグルーピングして障
害日時順に並びかえることを行う。
In step S1105, it is considered that the fault occurrence dates and times did not occur at equal intervals due to faults due to various causes. Therefore, in order to narrow down the cause of the fault and obtain the time interval, it is only necessary to group by system name. Instead, they are further grouped by error number and sorted in order of failure date and time.

【0053】ステップS1106においては、隣接する
行の障害日時の差を求め、時間間隔を求めることを行
う。
In step S1106, the difference between the failure dates and times of the adjacent rows is calculated, and the time interval is calculated.

【0054】ステップS1107においては、時間間隔
が同じかどうかをステップS1103と同じように判断
する。その結果、同じと判断されれば、ステップS11
08へ移行し、最後の障害日時に時間間隔を加えて出力
する。このとき、エラー番号でグルーピングしたこと
と、どのエラー番号の障害が発生したこととを出力する
ようにしてもよい。
In step S1107, it is determined whether the time intervals are the same as in step S1103. As a result, if it is determined that they are the same, step S11
08, the time and date are added to the last failure date and time and output. At this time, it is possible to output that the grouping is performed by the error number and the fault of which error number has occurred.

【0055】ステップS1107において、差が同じで
ないと判断された場合には、さらに別の障害状況情報を
構成する項目でグルーピングを行い、時間間隔を求める
ことを行う。
If it is determined in step S1107 that the differences are not the same, grouping is performed on items constituting another failure condition information, and time intervals are determined.

【0056】このように、障害発生を予測することによ
り、前もって他システムのユーザに復旧方法を知らせる
ことができ、スムーズな復旧が可能となる。また、障害
の原因が不明である場合には、障害発生が予測された日
時に人員を他システムへ派遣しておくことにより、障害
の原因を調査することが可能となる。
As described above, by predicting the occurrence of a failure, the user of another system can be informed in advance of the recovery method, and smooth recovery is possible. In addition, when the cause of the failure is unknown, it is possible to investigate the cause of the failure by dispatching personnel to another system at the date and time when the failure is predicted.

【0057】また、本実施の形態の障害復旧援助システ
ムは、実施の形態2における障害復旧援助方法に障害状
況情報蓄積ステップと障害発生予測ステップと障害発生
予測出力ステップを含ませた方法を実現するシステムで
ある。障害状況情報蓄積ステップは、障害状況情報受信
ステップで受信された障害状況情報をその障害の発生し
たシステム別に蓄積するステップであり、障害発生予測
ステップは、障害状況情報蓄積ステップで蓄積された障
害状況情報を統計的に分析し、次回の障害発生を予測す
るステップであり、障害発生予測出力ステップは、障害
発生予測ステップで予測された障害発生を出力するステ
ップである。すなわち障害状況情報蓄積ステップは、障
害状況情報蓄積部901により実現され、障害発生予測
ステップは障害発生予測部902により実現され、障害
発生予測出力ステップは、障害発生予測出力部903に
より実現される。
Further, the failure recovery assistance system of the present embodiment realizes a method in which the failure recovery assistance method of the second embodiment includes a failure status information accumulation step, a failure occurrence prediction step, and a failure occurrence prediction output step. System. The failure status information accumulation step is a step of accumulating the failure status information received in the failure status information reception step for each system in which the failure has occurred, and the failure occurrence prediction step is the failure status information accumulated in the failure status information accumulation step. This is a step of statistically analyzing the information and predicting the next failure occurrence. The failure occurrence prediction output step is a step of outputting the failure occurrence predicted in the failure occurrence prediction step. That is, the failure status information storage step is realized by the failure status information storage unit 901, the failure occurrence prediction step is realized by the failure occurrence prediction unit 902, and the failure occurrence prediction output step is realized by the failure occurrence prediction output unit 903.

【0058】<実施の形態4>本実施の形態において
は、障害状況情報は、他システムのログ情報を含み、復
旧情報検索部106は、障害状況情報に含まれるログ情
報に対してパターンマッチを行って復旧情報蓄積部10
5に蓄積された復旧情報を検索する。
<Embodiment 4> In the present embodiment, the failure status information includes log information of another system, and the recovery information retrieval unit 106 performs pattern matching on the log information included in the failure status information. Go and restore information storage unit 10
The recovery information accumulated in 5 is searched.

【0059】「他システムのログ情報」とは、他システ
ムの動作の状況を時系列で記録したものである。例え
ば、プログラムの実行では、特定の関数に文字列を渡す
ことにより、プログラムがどのような動作を行ったかを
出力するようになっている場合があり、このような出力
を集めたものがログ情報であり、このログ情報を調べる
ことにより、障害の原因を特定することができる。
The "log information of another system" is a time-series record of the operation status of the other system. For example, when executing a program, passing a character string to a specific function may output the behavior of the program. A collection of such output may be used as log information. Therefore, the cause of the failure can be identified by examining this log information.

【0060】「パターンマッチ」とは、パターンを記述
したものに、文字列などの表現物が該当するかどうかを
調べる操作である。パターンは、正規表現などの文法に
より記述され、その文法で生成される文の集合の中に表
現物が属するかどうかを判定することにより、パターン
マッチが行われる。このように文法で生成される文の集
合の中に表現物が属する場合、その表現物がパターンに
マッチすると言う。例えば正規表現の場合には、その正
規表現に対応した有限状態オートマトンをつくり、文字
列をその有限状態オートマトンに入力し、受理状態に到
達するかどうかにより、パターンにマッチするかどうか
を判定する。
"Pattern matching" is an operation for checking whether or not an expression such as a character string corresponds to what describes a pattern. The pattern is described by a grammar such as a regular expression, and pattern matching is performed by determining whether or not the expression belongs to a set of sentences generated by the grammar. When an expression belongs to the set of sentences generated by the grammar, it is said that the expression matches the pattern. For example, in the case of a regular expression, a finite state automaton corresponding to the regular expression is created, a character string is input to the finite state automaton, and it is determined whether or not the pattern is matched depending on whether or not the acceptance state is reached.

【0061】本実施の形態においては、パターンとその
パターンにログ情報がマッチした場合の復旧情報とを関
連付けて蓄積し、ログ情報が与えられた時に、順次パタ
ーンにマッチするかどうかを調べ、マッチしたパターン
に関連付けられた復旧情報を他システムに送信すること
を行う。
In the present embodiment, the pattern and the recovery information when the log information matches the pattern are stored in association with each other, and when the log information is given, it is checked whether or not the pattern is sequentially matched and the match is performed. The recovery information associated with the selected pattern is transmitted to another system.

【0062】本実施の形態におけるパターンの例として
は、「LogicalLog.cppの1044行目を
実行したことを示すメッセージの3行後に、TextS
torage.cppの512行目を実行したことを示
すメッセージが現れる」を正規表現で表したものが挙げ
られ、「LogicalLog.cpp:1044[^
¥n]*¥n[^¥n]*¥n[^¥n]*¥n[^¥
n]*¥nTextStorage.cpp:512」
というパターンがその一例である。ここに「¥n」は改
行の文字を表し、「[^¥n]」は改行以外の一文字を
表し、「[^¥n]*」は改行以外の文字が0文字以上
並ぶ文字列を表す。
As an example of the pattern in the present embodiment, "TextS, 3 lines after the message indicating that the 1044th line of LogicalLog.cpp has been executed,
storage. A message that indicates that the 512th line of the cpp has been executed appears in the regular expression. “LogicalLog.cpp: 1044 [^
\ N] * \ n [^ \ n] * \ n [^ \ n] * \ n [^ \
n] * \ nTextStorage. cpp: 512 "
The pattern is an example. Here, "\ n" represents a line feed character, "[^ \ n]" represents one character other than the line feed, and "[^ \ n] *" represents a character string in which zero or more characters other than the line feed are lined up. .

【0063】図12は、ターンとそのパターンにログ情
報がマッチした場合の復旧情報とを関連付けて蓄積して
いる表の一例である。「ログパターン」の列にパターン
が格納され、「応答メッセージ」の列にパターンにマッ
チした場合の復旧情報が格納されている。例えば、「パ
ターン1」にログ情報がマッチすると「プリンターのス
イッチが入っていません」という復旧情報が関連付けら
れている。
FIG. 12 is an example of a table in which turns and recovery information when log information matches the pattern are stored in association with each other. The "log pattern" column stores the pattern, and the "response message" column stores recovery information when the pattern matches. For example, when the log information matches the “pattern 1”, the recovery information “the printer is not switched on” is associated.

【0064】図13は、パターンと復旧情報が図12の
ように蓄積されている場合に、障害状況情報としてログ
情報が受信された場合の復旧情報検索部106と復旧情
報送信部107の動作を説明するフローチャートであ
る。
FIG. 13 shows the operation of the recovery information retrieval unit 106 and the recovery information transmission unit 107 when the log information is received as the failure status information when the pattern and the recovery information are accumulated as shown in FIG. It is a flowchart explaining.

【0065】ステップS1301において、最初のパタ
ーンが格納されている行へカーソルをセットする。カー
ソルとは、表の行を指し示すものであり、このカーソル
を通して指し示されている行に格納されているデータを
得ることができる。
In step S1301, the cursor is set to the line where the first pattern is stored. A cursor points to a row of a table, and the data stored in the row pointed to by the cursor can be obtained.

【0066】本フローチャートにおいては、カーソルは
表の最初の行から最後の行へ向けて移動して行くので、
ステップS1302において、カーソルが最後の行を通
過していないかどうかを調べ、もし、通過していれば処
理を終了し、最後の行を通過していなければステップS
1303へ移動する。
In this flowchart, since the cursor moves from the first row to the last row of the table,
In step S1302, it is checked whether or not the cursor has passed the last line. If the cursor has passed, the process is terminated, and if the cursor has not passed the last line, step S1302 is performed.
Move to 1303.

【0067】ステップS1303においては、カーソル
の指し示している行のパターンを得て、そのパターンを
ログ情報に適用する。「適用する」とは、ログ情報がパ
ターンにマッチするかどうかを調べることである。
In step S1303, the pattern of the line pointed by the cursor is obtained and the pattern is applied to the log information. “Apply” means to check whether the log information matches the pattern.

【0068】ステップS1304において、マッチした
かどうかを判定し、もし、マッチしたのであれば、ステ
ップS1305へ移行し、「応答メッセージ」の列に格
納されている復旧情報を得て、他システム101へ送信
する。
In step S1304, it is determined whether or not there is a match, and if there is a match, the process moves to step S1305, the recovery information stored in the column of "response message" is obtained, and it is sent to another system 101. Send.

【0069】マッチしていなければ、ステップS130
6へ移行し、次の行へカーソルを進めることを行い、ス
テップS1302へ移行する。
If they do not match, step S130.
6, the cursor is advanced to the next line, and the process proceeds to step S1302.

【0070】このようにログ情報に対してパターンマッ
チを行うことにより、大量に出力されたログ情報の中か
ら障害を特定し、復旧情報を得ることができる。
By performing the pattern matching on the log information in this way, it is possible to specify the failure from the log information output in a large amount and obtain the recovery information.

【0071】<実施の形態5>実施の形態5は、障害復
旧援助システムが、検索受付部と検索結果出力部を備え
た実施の形態であり、サポートセンタの人間や、他シス
テムのユーザが手動で復旧情報を検索することができ、
特に、他システムがセキュリティ上の問題でネットワー
クに接続されていない場合に復旧情報の検索が可能とな
る実施の形態である。
<Fifth Embodiment> A fifth embodiment is an embodiment in which the failure recovery assistance system is provided with a search acceptance unit and a search result output unit, and is manually operated by a support center person or a user of another system. You can search the recovery information with
In particular, this is an embodiment in which the recovery information can be searched when the other system is not connected to the network due to security problems.

【0072】図14が本実施の形態における障害復旧援
助システム100の機能ブロック図であり、実施の形態
1のものに、検索受付部1401と検索実行部1402
と検索結果出力部1403とが追加されている。
FIG. 14 is a functional block diagram of the disaster recovery assistance system 100 according to the present embodiment. In the first embodiment, the search acceptance unit 1401 and the search execution unit 1402 are added.
And a search result output unit 1403 are added.

【0073】検索受付部1401は、復旧情報蓄積部1
05に蓄積されている復旧情報を検索する条件を受け付
ける。例えば、復旧情報がエラー番号と関連付けて蓄積
されている場合には、エラー番号を条件として受け付け
る。
The search acceptance unit 1401 is the restoration information storage unit 1
The condition for searching the recovery information accumulated in 05 is accepted. For example, when the recovery information is stored in association with the error number, the error number is accepted as a condition.

【0074】検索実行部1402は、検索受付部140
1で受け付けた条件により復旧情報蓄積部に蓄積されて
いる復旧情報を検索することを行う。
The search execution unit 1402 is a search reception unit 140.
The recovery information stored in the recovery information storage unit is searched according to the condition accepted in 1.

【0075】検索結果出力部1403は、検索実行部1
402で得られた復旧情報を出力することを行う。
The search result output unit 1403 is the search execution unit 1
The recovery information obtained in 402 is output.

【0076】障害復旧援助システム100が計算機60
0により実現される場合には、検索受付部1401は、
入出力装置604より条件を受け付けるプログラムによ
り実現される。この場合には、検索結果出力部1403
は、入出力装置604へ復旧情報を出力するプログラム
によって実現される。また、計算機600に通信回線6
08を介して接続された端末、あるいは、計算機から条
件を受け付けるようにしてもよい。この場合には、検索
結果出力部1403は、その端末、あるいは、計算機に
対して復旧情報を出力するプログラムによって実現され
る。
The disaster recovery assistance system 100 is a computer 60.
When realized by 0, the search receiving unit 1401
It is realized by a program that receives conditions from the input / output device 604. In this case, the search result output unit 1403
Is realized by a program that outputs recovery information to the input / output device 604. In addition, the computer 600 has a communication line 6
The conditions may be accepted from a terminal connected via 08 or a computer. In this case, the search result output unit 1403 is realized by the program that outputs the recovery information to the terminal or the computer.

【0077】これにより、サポートセンタの人間や、他
システムのユーザが手動で復旧情報を検索することがで
き、特に、他システムがセキュリティ上の問題でネット
ワークに接続されていない場合に復旧情報の検索が可能
となる。
As a result, a person at the support center or a user of another system can manually retrieve the recovery information, and particularly when the other system is not connected to the network due to security problems, the recovery information is retrieved. Is possible.

【0078】[0078]

【発明の効果】以上のように本発明によれば、第一に、
他システム101で障害が発生した場合には、システム
監視部102によって障害の発生が検出され、障害状況
情報の収集が行われ、障害状況情報受信部104へ送信
され、復旧情報検索部106により復旧方法の検索が行
われ、その検索結果が他システム101へ送信されるの
で、迅速に障害からの復旧方法が提示される。また、他
システム101のユーザやサポートセンタの人員が他シ
ステム101の障害状況を調べる手間を省くことができ
る。
As described above, according to the present invention, firstly,
When a failure occurs in the other system 101, the system monitoring unit 102 detects the occurrence of the failure, collects the failure status information, transmits it to the failure status information receiving unit 104, and restores it by the recovery information searching unit 106. A method is searched, and the search result is transmitted to the other system 101, so that a method for recovering from a failure is promptly presented. Further, it is possible to save the user of the other system 101 and the staff of the support center from having to check the failure status of the other system 101.

【0079】第二に、復旧情報蓄積部105に復旧方法
が蓄積されていない障害状況情報が受信されても、それ
が障害状況情報出力部701に出力がされ、その障害状
況情報によって記述される障害からの復旧方法を記述す
る復旧情報が復旧情報受付部702により受け付けら
れ、復旧情報蓄積部105に蓄積されるので、次に同じ
障害が発生した場合に復旧情報が送信されることにな
る。また、復旧情報が復旧情報蓄積部105に蓄積され
るとともに他システム101に送信されることにより、
新たに蓄積された復旧情報を他システム101のユーザ
に提示することが可能となる。
Second, even if the failure status information for which the recovery method is not stored in the recovery information storage section 105 is received, it is output to the failure status information output section 701 and described by the failure status information. The recovery information describing the recovery method from the failure is received by the recovery information receiving unit 702 and accumulated in the recovery information accumulating unit 105, so that the recovery information will be transmitted when the same failure occurs next time. In addition, the restoration information is stored in the restoration information storage unit 105 and transmitted to the other system 101,
It is possible to present the newly accumulated restoration information to the user of the other system 101.

【0080】第三に、障害発生を予測することにより、
前もって他システムのユーザに復旧方法を知らせること
ができ、スムーズな復旧が可能となる。また、障害の原
因が不明である場合には、障害発生が予測された日時に
人員を他システムへ派遣しておくことにより、障害の原
因を調査することが可能となる。
Third, by predicting the occurrence of failure,
Users of other systems can be notified in advance of the recovery method, and smooth recovery is possible. In addition, when the cause of the failure is unknown, it is possible to investigate the cause of the failure by dispatching personnel to another system at the date and time when the failure is predicted.

【0081】第四に、ログ情報に対してパターンマッチ
を行うことにより、大量に出力されたログ情報の中から
障害を特定し、復旧情報を得ることができる。
Fourthly, by performing pattern matching on the log information, it is possible to specify a failure from a large amount of output log information and obtain recovery information.

【0082】第五に、サポートセンタの人間や、他シス
テムのユーザが手動で復旧情報を検索することができ、
特に、他システムがセキュリティ上の問題でネットワー
クに接続されていない場合に復旧情報の検索が可能とな
る。
Fifth, a person at the support center or a user of another system can manually retrieve the recovery information,
In particular, the recovery information can be retrieved when the other system is not connected to the network due to security problems.

【図面の簡単な説明】[Brief description of drawings]

【図1】実施の形態1における障害復旧援助システムの
機能ブロック図
FIG. 1 is a functional block diagram of a disaster recovery assistance system according to a first embodiment.

【図2】システム監視部の動作を説明するフローチャー
FIG. 2 is a flowchart illustrating the operation of a system monitoring unit.

【図3】障害状況情報の一例を示す図FIG. 3 is a diagram showing an example of failure status information.

【図4】実施の形態1における障害復旧援助システムの
動作を説明するフローチャート
FIG. 4 is a flowchart illustrating the operation of the failure recovery assistance system according to the first embodiment.

【図5】蓄積された復旧情報の一例を示す図FIG. 5 is a diagram showing an example of accumulated recovery information.

【図6】障害復旧援助システムを実現する計算機の機能
ブロック図
FIG. 6 is a functional block diagram of a computer that realizes a disaster recovery assistance system.

【図7】実施の形態2における障害復旧援助システムの
機能ブロック図
FIG. 7 is a functional block diagram of the disaster recovery assistance system according to the second embodiment.

【図8】実施の形態2における障害復旧援助システムの
動作を説明するフローチャート
FIG. 8 is a flowchart illustrating the operation of the failure recovery assistance system according to the second embodiment.

【図9】実施の形態3における障害復旧援助システムの
機能ブロック図
FIG. 9 is a functional block diagram of the disaster recovery assistance system according to the third embodiment.

【図10】システム名を付加して蓄積された障害状況情
報の一例を示す図
FIG. 10 is a diagram showing an example of failure status information accumulated by adding a system name.

【図11】障害状況情報を統計的に分析し次回の障害の
発生を予測する処理の一例を説明するフローチャート
FIG. 11 is a flowchart illustrating an example of processing for statistically analyzing failure status information and predicting the occurrence of the next failure.

【図12】パターンと応答メッセージを関連付けて蓄積
した表の一例を示す図
FIG. 12 is a diagram showing an example of a table in which patterns and response messages are associated and accumulated.

【図13】実施の形態4における障害復旧援助システム
の動作を説明するフローチャート
FIG. 13 is a flowchart illustrating the operation of the disaster recovery assistance system according to the fourth embodiment.

【図14】実施の形態5における障害復旧援助システム
の機能ブロック図
FIG. 14 is a functional block diagram of the disaster recovery assistance system according to the fifth embodiment.

【図15】他システムへ送信される復旧情報の一例を示
す図
FIG. 15 is a diagram showing an example of restoration information transmitted to another system.

【符号の説明】[Explanation of symbols]

100 障害復旧援助システム 101 他システム 102 システム監視部 103 障害状況情報 104 障害状況情報受信部 105 復旧情報蓄積部 106 復旧情報検索部 107 復旧情報送信部 100 disaster recovery assistance system 101 Other system 102 System monitoring unit 103 Failure status information 104 Failure status information receiver 105 Recovery information storage unit 106 Recovery Information Search Section 107 Recovery Information Transmission Unit

フロントページの続き Fターム(参考) 5B042 GA12 JJ02 KK12 KK17 MA09 MC07 MC12 MC16 MC17 MC37 5B085 AC11 AC16 CA04 CE10 Continued front page    F term (reference) 5B042 GA12 JJ02 KK12 KK17 MA09                       MC07 MC12 MC16 MC17 MC37                 5B085 AC11 AC16 CA04 CE10

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】他システムの障害発生を監視するシステム
監視ステップと、前記他システムで発生した障害を記述
する障害状況情報を収集し送信する障害状況情報送信ス
テップと、前記障害状況情報送信ステップで送信された
障害状況情報を受信する障害状況情報受信ステップと、 障害からの復旧方法を記述する復旧情報を蓄積する復旧
情報蓄積ステップと、 前記障害状況情報受信ステップで受信された障害状況情
報から前記復旧情報蓄積ステップによって蓄積されてい
る復旧情報を検索する復旧情報検索ステップと、 前記復旧情報検索ステップでの検索結果を前記他システ
ムへ向けて送信する復旧情報送信ステップとを含む障害
復旧援助方法。
1. A system monitoring step for monitoring the occurrence of a failure in another system, a failure status information sending step for collecting and sending failure status information describing a failure occurring in the other system, and a failure status information sending step. A failure status information receiving step of receiving the failure status information transmitted, a recovery information accumulation step of accumulating recovery information describing a recovery method from the failure, and a failure status information received in the failure status information receiving step from the failure status information A failure recovery assistance method comprising: a recovery information search step of searching for recovery information stored in the recovery information storage step; and a recovery information transmission step of transmitting the search result of the recovery information search step to the other system.
【請求項2】前記障害状況情報受信ステップで受信され
た障害状況情報を出力する障害状況情報出力ステップ
と、 前記障害状況情報出力ステップで出力された障害状況情
報で記述される障害からの復旧方法を記述する復旧情報
を受け付け、前記障害状況情報と前記復旧情報とを関連
付けて蓄積する復旧情報受付ステップとをさらに含む請
求項1の障害復旧援助方法。
2. A failure status information output step for outputting the failure status information received at the failure status information receiving step, and a recovery method from a failure described by the failure status information output at the failure status information output step. The failure recovery assistance method according to claim 1, further comprising: a recovery information receiving step of receiving recovery information describing the above, and storing the failure status information and the recovery information in association with each other.
【請求項3】前記障害状況情報受信ステップで受信され
た障害状況情報を、その障害の発生したシステム別に蓄
積する障害状況情報蓄積ステップと、前記障害状況情報
蓄積ステップで蓄積された障害状況情報を統計的に分析
し、次回の障害発生を予測する障害発生予測ステップ
と、前記障害発生予測ステップで予測された障害発生を
出力する障害発生予測出力ステップとをさらに含む請求
項1に記載の障害復旧援助方法。
3. A failure status information accumulating step of accumulating the failure status information received in the failure status information receiving step for each system in which the failure has occurred, and failure status information accumulated in the failure status information accumulating step. The failure recovery according to claim 1, further comprising: a failure occurrence prediction step of statistically analyzing and predicting the next failure occurrence; and a failure occurrence prediction output step of outputting the failure occurrence predicted in the failure occurrence prediction step. How to help.
【請求項4】他システムの障害発生を監視するシステム
監視部から送られ、前記他システムで発生した障害を記
述する障害状況情報を受信する障害状況情報受信部と、 障害からの復旧方法を記述する復旧情報を蓄積する復旧
情報蓄積部と、 前記障害状況情報受信部で受信された障害状況情報から
前記復旧情報蓄積部に蓄積されている復旧情報を検索す
る復旧情報検索部と、前記復旧情報検索部での検索結果
を前記他システムへ向けて送信する復旧情報送信部とを
備えた障害復旧援助システム。
4. A failure status information receiving section for receiving failure status information sent from a system monitoring section that monitors the occurrence of a failure in another system and describing a failure that has occurred in the other system, and a recovery method from the failure. Recovery information storage unit that stores recovery information, a recovery information search unit that searches the recovery information stored in the recovery information storage unit from the failure status information received by the failure status information reception unit, and the recovery information A failure recovery assistance system comprising: a recovery information transmission unit for transmitting a search result from a search unit to the other system.
【請求項5】前記障害状況情報受信部により受信された
障害状況情報を出力する障害状況情報出力部と、 前記障害状況情報出力部で出力された障害状況情報で記
述される障害からの復旧方法を記述する復旧情報を受け
付け、当該障害状況情報と当該復旧情報とを関連付けて
前記復旧情報蓄積部に蓄積する復旧情報受付部を備えた
請求項4の障害復旧援助システム。
5. A failure status information output unit that outputs the failure status information received by the failure status information receiving unit, and a recovery method from a failure described by the failure status information output by the failure status information output unit. 5. The disaster recovery assistance system according to claim 4, further comprising: a recovery information receiving unit that receives recovery information describing the above, and stores the failure status information and the recovery information in the recovery information storage unit in association with each other.
【請求項6】前記復旧情報送信部は、前記復旧情報受付
部により受け付けられた復旧情報を前記他システムへ向
けて送信する請求項5に記載の障害復旧援助システム。
6. The failure recovery assistance system according to claim 5, wherein the recovery information transmitting unit transmits the recovery information received by the recovery information receiving unit to the other system.
【請求項7】前記障害状況情報受信部が受信した障害状
況情報を、その障害の発生したシステム別に蓄積する障
害状況情報蓄積部と、前記障害状況情報蓄積部により蓄
積された障害状況情報を統計的に分析し、次回の障害発
生を予測する障害発生予測部と、前記障害発生予測部で
予測された障害発生を出力する障害発生予測出力部とを
備えた請求項4に記載の障害復旧援助システム。
7. A failure status information accumulating section for accumulating the failure status information received by the failure status information receiving section for each system in which the failure has occurred, and statistics of the failure status information accumulated by the failure status information accumulating section. 5. The failure recovery assistance according to claim 4, further comprising: a failure occurrence prediction unit that predicts a failure occurrence next time, and a failure occurrence prediction output unit that outputs the failure occurrence predicted by the failure occurrence prediction unit. system.
【請求項8】前記障害状況情報は他システムで発生した
障害におけるエラーコード、エラーメッセージ、エラー
発生プログラムファイル名、エラー発生行番号、スタッ
クトレースのうち一または二以上の組み合わせである請
求項4ないし請求項7のいずれか一に記載の障害復旧援
助システム。
8. The failure status information is one or a combination of two or more of an error code, an error message, an error occurrence program file name, an error occurrence line number, and a stack trace in a failure occurred in another system. The disaster recovery assistance system according to claim 7.
【請求項9】前記障害状況情報は他システムのログ情報
を含み、前記復旧情報検索部は、障害状況情報に含まれ
るログ情報に対してパターンマッチを行って前記復旧情
報蓄積部に蓄積された復旧情報を検索する請求項4ない
し請求項7のいずれか一に記載の障害復旧援助システ
ム。
9. The failure status information includes log information of another system, and the recovery information search unit performs pattern matching on the log information included in the failure status information and stores the pattern information in the recovery information storage unit. The disaster recovery assistance system according to any one of claims 4 to 7, which searches for recovery information.
【請求項10】前記復旧情報蓄積部に蓄積されている復
旧情報を検索する条件を受け付ける検索受付部と前記検
索受付部で受け付けた条件により前記復旧情報蓄積部に
蓄積されている復旧情報を検索する検索実行部と前記検
索実行部で得られた復旧情報を出力する検索結果出力部
とを備えた請求項4に記載の障害復旧援助システム。
10. A search acceptance unit that accepts a condition for retrieving the recovery information accumulated in the restoration information accumulation unit, and a search for the restoration information accumulated in the restoration information accumulation unit according to the condition accepted by the search acceptance unit. The failure recovery assistance system according to claim 4, further comprising a search execution unit that performs the search and a search result output unit that outputs the recovery information obtained by the search execution unit.
JP2001271069A 2001-09-06 2001-09-06 Fault restoration assist method and fault restoration assist system Pending JP2003085003A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001271069A JP2003085003A (en) 2001-09-06 2001-09-06 Fault restoration assist method and fault restoration assist system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001271069A JP2003085003A (en) 2001-09-06 2001-09-06 Fault restoration assist method and fault restoration assist system

Publications (1)

Publication Number Publication Date
JP2003085003A true JP2003085003A (en) 2003-03-20

Family

ID=19096622

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001271069A Pending JP2003085003A (en) 2001-09-06 2001-09-06 Fault restoration assist method and fault restoration assist system

Country Status (1)

Country Link
JP (1) JP2003085003A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006092183A (en) * 2004-09-22 2006-04-06 Fuji Xerox Co Ltd Failure recovery system and method of image forming apparatus
JP2006236199A (en) * 2005-02-28 2006-09-07 Japan Research Institute Ltd Printing method and printing program of work instruction list
JP2010086516A (en) * 2008-09-04 2010-04-15 Hitachi Ltd Method for analyzing fault caused in virtualized environment, management server, and program
JP2012094049A (en) * 2010-10-28 2012-05-17 Nomura Research Institute Ltd Incident management system and incident management program
JP2013527957A (en) * 2010-04-21 2013-07-04 マイクロソフト コーポレーション Automated recovery and escalation in complex distributed applications
WO2018042584A1 (en) * 2016-09-01 2018-03-08 株式会社日立製作所 Inquiry handling system and method
WO2019112986A1 (en) * 2017-12-04 2019-06-13 Nec Laboratories America, Inc. Efficient event searching
JP7477572B2 (en) 2018-07-02 2024-05-01 アテラ ネットワークス リミテッド AUTOMATED CONTROL OF DISTRIBUTED COMPUTING DEVICES - Patent application

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006092183A (en) * 2004-09-22 2006-04-06 Fuji Xerox Co Ltd Failure recovery system and method of image forming apparatus
JP4506376B2 (en) * 2004-09-22 2010-07-21 富士ゼロックス株式会社 Image forming apparatus fault handling system, image forming apparatus, management apparatus, image forming apparatus fault handling system control method, and management apparatus control method
JP2006236199A (en) * 2005-02-28 2006-09-07 Japan Research Institute Ltd Printing method and printing program of work instruction list
JP4571521B2 (en) * 2005-02-28 2010-10-27 株式会社日本総合研究所 Work instruction list printing method and printing program
JP2010086516A (en) * 2008-09-04 2010-04-15 Hitachi Ltd Method for analyzing fault caused in virtualized environment, management server, and program
JP2013527957A (en) * 2010-04-21 2013-07-04 マイクロソフト コーポレーション Automated recovery and escalation in complex distributed applications
JP2012094049A (en) * 2010-10-28 2012-05-17 Nomura Research Institute Ltd Incident management system and incident management program
WO2018042584A1 (en) * 2016-09-01 2018-03-08 株式会社日立製作所 Inquiry handling system and method
JPWO2018042584A1 (en) * 2016-09-01 2018-12-06 株式会社日立製作所 Inquiry handling system and method
WO2019112986A1 (en) * 2017-12-04 2019-06-13 Nec Laboratories America, Inc. Efficient event searching
JP7477572B2 (en) 2018-07-02 2024-05-01 アテラ ネットワークス リミテッド AUTOMATED CONTROL OF DISTRIBUTED COMPUTING DEVICES - Patent application

Similar Documents

Publication Publication Date Title
EP1983686B1 (en) Mobile terminal apparatus and diagnosis method for mobile terminal apparatus
JP6669156B2 (en) Application automatic control system, application automatic control method and program
US7941707B2 (en) Gathering information for use in diagnostic data dumping upon failure occurrence
CN100405311C (en) Error monitoring of partitions in a computer system using supervisor partitions
US8938533B1 (en) Automatic capture of diagnostic data based on transaction behavior learning
US20110314138A1 (en) Method and apparatus for cause analysis configuration change
US20080065928A1 (en) Technique for supporting finding of location of cause of failure occurrence
WO2014117245A1 (en) Faults and performance issue prediction
JP6655001B2 (en) Failure support server and failure support method
JP2009238010A (en) Trouble coping apparatus, troubleshooting method for information technology system, and program therefor
JP2007241872A (en) Program for monitoring change in computer resource on network
US9461879B2 (en) Apparatus and method for system error monitoring
CN111327685A (en) Data processing method, device and equipment of distributed storage system and storage medium
JP2003085003A (en) Fault restoration assist method and fault restoration assist system
JP2010061569A (en) Failure handling management server and failure handling management program
JP2010066841A (en) Help desk support system
JP2007241873A (en) Program for monitoring change in computer resource on network
JP3867868B2 (en) Fault integrated management device
CN115102838A (en) Emergency processing method and device for server downtime risk and electronic equipment
CN112988442B (en) Method and equipment for transmitting fault information in server operation stage
CN104823406A (en) Identifying reports to address network issues
CN111835566A (en) System fault management method, device and system
JPH1069400A (en) Computer system and its fault recovery support method
EP3820655B1 (en) Diagnosis method and apparatus
CN112799957A (en) User behavior based fault handling method, system, device and medium