JP2009026052A - Fault monitoring system, manager device, fault monitoring method, and program - Google Patents

Fault monitoring system, manager device, fault monitoring method, and program Download PDF

Info

Publication number
JP2009026052A
JP2009026052A JP2007188222A JP2007188222A JP2009026052A JP 2009026052 A JP2009026052 A JP 2009026052A JP 2007188222 A JP2007188222 A JP 2007188222A JP 2007188222 A JP2007188222 A JP 2007188222A JP 2009026052 A JP2009026052 A JP 2009026052A
Authority
JP
Japan
Prior art keywords
message
state
group
classification
classified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007188222A
Other languages
Japanese (ja)
Inventor
Akinori Ito
晃典 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007188222A priority Critical patent/JP2009026052A/en
Publication of JP2009026052A publication Critical patent/JP2009026052A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To enable a manager to quickly recognize the type of countermeasures for recovery from a failure in an agent device. <P>SOLUTION: The state of a state group defined for every type of countermeasures for recovery from failure is displayed on a display device 14 in a manager device 1, and classification definition for classifying messages into state groups related therewith is registered in a classification definition storage part 13. When receiving the messages showing the states from an agent device 2, a message classification means 11 classifies the messages into one or more state groups according to the classification definition registered in the classification definition storage part 13, and a state display changing part 12 changes the state of the state group into which the message has been classified by the message classification means 11 among the states of the state groups displayed on the display device 14. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、マネージャ装置がエージェント装置から送られてくるメッセージに基づいて、エージェント装置の状態を監視する障害監視技術に関し、特に、エージェント装置に障害が発生した場合、障害を復旧するためにどのような種別の対処法を実施したら良いのかを、マネージャ装置の管理者が短時間で認識することができる障害監視技術に関する。   The present invention relates to a failure monitoring technique in which a manager device monitors the state of an agent device based on a message sent from the agent device, and more particularly, how to recover a failure when a failure occurs in the agent device. The present invention relates to a failure monitoring technique that enables a manager of a manager device to recognize in a short time whether or not to cope with various types of countermeasures.

マネージャ装置においてエージェント装置の状態を監視するために、エージェント装置からマネージャ装置に対して、エージェント装置の状態を示すメッセージを送信し、マネージャ装置においてエージェント装置から送られてきたメッセージを表示するということが従来から行われている。しかし、エージェント装置から送られてきたメッセージを単に表示するだけでは、マネージャ装置の管理者自身が表示されたメッセージに基づいてエージェント装置に障害が発生したか否かを判定し、障害が発生したと判断した場合には、対処法を決定することが必要になるため、管理者の負担が大きくなるという問題があると共に、高度な専門知識が必要になるという問題がある。   In order for the manager device to monitor the state of the agent device, the agent device sends a message indicating the state of the agent device to the manager device, and the manager device displays the message sent from the agent device. Traditionally done. However, by simply displaying the message sent from the agent device, the manager of the manager device itself determines whether or not a failure has occurred in the agent device based on the displayed message. When it is determined, it is necessary to determine a countermeasure, and thus there is a problem that the burden on the administrator is increased, and there is a problem that a high level of expertise is required.

そこで、このような問題を解決するため、次のような技術が提案されている(例えば、特許文献1、2参照)。   In order to solve such problems, the following techniques have been proposed (see, for example, Patent Documents 1 and 2).

特許文献1では、マネージャ装置に、メッセージIDに対応付けて障害の復旧方法などを示すガイドメッセージが登録されたデータベースを設け、エージェント装置からメッセージが送られてきたとき、そのメッセージIDによってデータベースを検索し、検索したガイドメッセージを表示するようにしている。   In Patent Document 1, a manager device is provided with a database in which a guide message indicating a failure recovery method is registered in association with a message ID. When a message is sent from an agent device, the database is searched by the message ID. The searched guide message is displayed.

また、特許文献2では、マネージャ装置に、メッセージIDに対応付け連絡先及び障害に関する関連文書を登録したデータベースを設け、エージェント装置からメッセージが送られてきたとき、そのメッセージIDに対応付けて登録されている連絡先に関連文書を送信するようにしている。   Further, in Patent Document 2, the manager device is provided with a database in which associated contact addresses and related documents relating to failures are registered in the message ID, and when a message is sent from the agent device, it is registered in association with the message ID. I am trying to send related documents to my contacts.

特開2004−178296号公報JP 2004-178296 A 特開2005−276042号公報JP 2005-276042 A

特許文献1、2に記載されている技術によれば、エージェント装置から障害発生を示すメッセージが送られてきたとき、そのメッセージに関連するガイドメッセージや関連文書が自動的に提示されるので、管理者にかかる負担は軽減し、高度な専門知識も不要になる。   According to the techniques described in Patent Literatures 1 and 2, when a message indicating the occurrence of a failure is sent from the agent device, a guide message and related documents related to the message are automatically presented, so that management is possible. The burden on the workers is reduced and advanced expertise is no longer required.

しかし、特許文献1、2に記載されている技術では、提示されたガイドメッセージや関連文書を読まなければ、どのような種別の対処法を実施すれば良いのかを判断することができないため、復旧作業を開始するまでに時間がかかるという問題がある。   However, with the techniques described in Patent Documents 1 and 2, it is impossible to determine what type of countermeasure should be implemented unless the presented guide message or related document is read. There is a problem that it takes time to start the work.

〔発明の目的〕
そこで、本発明の目的は、エージェント装置に障害が発生した場合、障害を復旧するためにどのような種別の対処法を実施したら良いのかを短時間で認識できるようにすることにより、復旧作業を開始するまでに要する時間を短縮化することにある。
(Object of invention)
Therefore, an object of the present invention is to make it possible to recognize in a short time what type of countermeasures should be implemented in order to recover from a failure when a failure occurs in an agent device. The purpose is to shorten the time required to start.

本発明にかかる第1の障害監視システムは、
エージェント装置とマネージャ装置とを備えた障害監視システムにおいて、
前記エージェント装置が、
自装置の状態を示すメッセージを前記マネージャ装置に対して送信する監視手段を備え、
前記マネージャ装置が、
障害を回復するための対処法の種別毎に定義された状態グループの状態を表示する表示装置と、
前記メッセージをそれが関連する前記状態グループに分類するための分類定義が登録された分類定義蓄積部と、
前記エージェント装置から受信したメッセージを前記分類定義に従って1以上の前記状態グループに分類する分類手段と、
前記表示装置に表示された状態グループの状態の内、前記分類手段によって前記メッセージが分類された状態グループの状態を変更する状態表示変更手段とを備えたことを特徴とする。
The first fault monitoring system according to the present invention is:
In a fault monitoring system comprising an agent device and a manager device,
The agent device is
Comprising monitoring means for transmitting a message indicating the status of the own device to the manager device;
The manager device is
A display device that displays the status of the status group defined for each type of countermeasure to recover from the failure;
A classification definition storage unit in which a classification definition for classifying the message into the state group to which the message relates is registered;
Classification means for classifying messages received from the agent device into one or more state groups according to the classification definition;
State display change means for changing the state of the state group in which the message is classified by the classification means among the states of the state group displayed on the display device is provided.

本発明にかかる第1のマネージャ装置は、
障害を回復するための対処法の種別毎に定義された状態グループの状態を表示する表示装置と、
メッセージをそれが関連する前記状態グループに分類するための分類定義が登録された分類定義蓄積部と、
エージェント装置から受信した、前記エージェント装置の状態を示すメッセージを前記分類定義に従って1以上の前記状態グループに分類する分類手段と、
前記表示装置に表示された状態グループの状態の内、前記分類手段によって前記メッセージが分類された状態グループの状態を変更する状態表示変更手段とを備えたことを特徴とする。
The first manager device according to the present invention includes:
A display device that displays the status of the status group defined for each type of countermeasure to recover from the failure;
A classification definition storage unit in which a classification definition for classifying a message into the state group to which the message is related is registered;
Classification means for classifying a message indicating the state of the agent device received from an agent device into one or more state groups according to the classification definition;
State display change means for changing the state of the state group in which the message is classified by the classification means among the states of the state group displayed on the display device is provided.

本発明にかかる第1の障害監視方法は、
障害を回復するための対処法の種別毎に定義された状態グループの状態を表示する表示装置と、メッセージをそれが関連する前記状態グループに分類するための分類定義が登録された分類定義蓄積部とを備えたコンピュータが、エージェント装置から受信した、前記エージェント装置の状態を示すメッセージを前記分類定義に従って1以上の前記状態グループに分類する分類ステップと、
前記コンピュータが、前記表示装置に表示された状態グループの状態の内、前記分類ステップによって前記メッセージが分類された状態グループの状態を変更する状態表示変更ステップとを含むことを特徴とする。
A first failure monitoring method according to the present invention includes:
A display device that displays the state of a state group defined for each type of coping method for recovering a failure, and a category definition storage unit in which a category definition for classifying a message into the state group to which the message relates is registered A step of classifying a message indicating the state of the agent device received from the agent device into one or more state groups according to the classification definition;
The computer includes a state display changing step of changing a state of the state group in which the message is classified by the classification step among the states of the state group displayed on the display device.

本発明にかかる第1のプログラムは、
障害を回復するための対処法の種別毎に定義された状態グループの状態を表示する表示装置と、メッセージをそれが関連する前記状態グループに分類するための分類定義が登録された分類定義蓄積部とを備えたコンピュータを、
エージェント装置から受信した、前記エージェント装置の状態を示すメッセージを前記分類定義に従って1以上の前記状態グループに分類する分類手段、
前記表示装置に表示された状態グループの状態の内、前記分類手段によって前記メッセージが分類された状態グループの状態を変更する状態表示変更手段として機能させる。
The first program according to the present invention is:
A display device that displays the state of a state group defined for each type of coping method for recovering a failure, and a category definition storage unit in which a category definition for classifying a message into the state group to which the message relates is registered A computer with
Classification means for classifying a message indicating the state of the agent device received from an agent device into one or more state groups according to the classification definition;
Among the states of the state group displayed on the display device, the state group is made to function as a state display changing unit that changes the state of the state group into which the message is classified by the classification unit.

本発明によれば、エージェント装置に障害が発生した場合、障害を復旧するためにどのような種別の対処法を実施したら良いのかを短時間で認識することができるので、復旧作業を開始するまでに要する時間を短縮化することができる。   According to the present invention, when a failure occurs in the agent device, it is possible to recognize in a short time what type of countermeasure should be performed to recover from the failure, so that the recovery operation is started. Can be shortened.

次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。   Next, the best mode for carrying out the present invention will be described in detail with reference to the drawings.

〔第1の実施例〕
図1は本発明にかかる障害監視システムの第1の実施例のブロック図であり、管理装置として機能するマネージャ装置1と、被監視装置として機能するエージェント装置2とから構成され、両者はインターネット等のネットワーク(図示を省略)を介して相互に接続されている。なお、図1ではエージェント装置2を1台しか図示していないが、複数台であっても構わない。
[First embodiment]
FIG. 1 is a block diagram of a first embodiment of a failure monitoring system according to the present invention, which comprises a manager device 1 that functions as a management device and an agent device 2 that functions as a monitored device, both of which are the Internet and the like. Are connected to each other via a network (not shown). Although only one agent device 2 is shown in FIG. 1, a plurality of agent devices 2 may be used.

エージェント装置2は、自装置の状態を示すメッセージをマネージャ装置1へ送信する監視手段21を備えている。メッセージは、例えば、メッセージID、メッセージ本文およびリソースから構成される。リソースは、メッセージの発生元を示す情報であり、例えば、プログラム名、プロセス名、機器名などが設定される。   The agent device 2 includes monitoring means 21 that transmits a message indicating the state of the own device to the manager device 1. The message is composed of, for example, a message ID, a message body, and a resource. The resource is information indicating the source of the message. For example, a program name, a process name, a device name, and the like are set.

マネージャ装置1は、メッセージ分類手段11と、状態表示変更手段12と、分類定義蓄積部13と、LCD等の表示装置14とを備えている。   The manager device 1 includes a message classification unit 11, a status display change unit 12, a classification definition storage unit 13, and a display device 14 such as an LCD.

分類定義蓄積部13には、エージェント装置2から送られてきたメッセージを、そのメッセージが関連する状態グループに分類するための分類定義が登録されている。状態グループとは、障害を回復するための対処法の種別毎に定義されたグループである。   In the category definition storage unit 13, a category definition for classifying the message sent from the agent device 2 into a state group to which the message is related is registered. A state group is a group defined for each type of countermeasure for recovering from a failure.

図2は分類定義蓄積部13の内容例を示す図であり、分類定義として、分類条件と、その分類条件を満たすメッセージの分類先となる状態グループとが登録されている。同図の例は、メッセージID=0001のメッセージ(システムエラーの発生を示すメッセージ)は、グループ番号=T1の状態グループ(対処法の種別がシステム再起動)に分類され、メッセージID=0043のメッセージはグループ番号T2の状態グループ(対処法の種別がサブシステムA再起動)に分類されることを示している。また、メッセージID=0050のメッセージは、グループ番号=T3の状態グループ(対処法の種別がAPaの再起動)とグループ番号=T4の状態グループ(対処法の種別がAPbの再起動)との2つの状態グループに分類されることを示している。なお、図2の例では、メッセージIDによりメッセージを分類するようにしたが、メッセージ本文に含まれる文字列によりメッセージを分類するなど、他の方法を採用することもできる。例えば、分類条件「ID=0001」の代わりに、分類条件「TEXT=“システムエラー”」等を使用することもできる。なお、グループ番号「Tα」の状態グループを状態グループTαと記す場合もある。   FIG. 2 is a diagram illustrating an example of the contents of the classification definition storage unit 13 in which classification conditions and a state group that is a classification destination of a message that satisfies the classification conditions are registered as the classification definition. In the example of the figure, a message with message ID = 0001 (message indicating the occurrence of a system error) is classified into a state group with group number = T1 (the type of countermeasure is system restart), and a message with message ID = 0043. Indicates that it is classified into the state group of group number T2 (the type of countermeasure is the restart of subsystem A). In addition, the message with message ID = 0050 has two status groups, group number = T3 (reaction type is APa) and group number = T4 state group (reaction type is APb). It is classified into one state group. In the example of FIG. 2, the messages are classified based on the message ID, but other methods such as classifying the messages based on the character strings included in the message body may be employed. For example, in place of the classification condition “ID = 0001”, the classification condition “TEXT =“ system error ”” or the like may be used. The state group with the group number “Tα” may be referred to as a state group Tα.

メッセージ分類手段11は、エージェント装置2から送られてきたメッセージを、分類定義蓄積部13に登録されている分類定義に従ってグループ分けする機能を有する。例えば、分類定義蓄積部13の内容が図2に示すものであり、エージェント装置2から送られてきたメッセージのメッセージIDが「0043」であれば、第2番目の分類条件「ID=0043」が満たされるので、上記メッセージはグループ番号「T2」の状態グループに分類されることになる。   The message classification unit 11 has a function of grouping the messages sent from the agent device 2 according to the classification definition registered in the classification definition storage unit 13. For example, if the content of the classification definition storage unit 13 is as shown in FIG. 2 and the message ID of the message sent from the agent device 2 is “0043”, the second classification condition “ID = 0043” is set. Since the message is satisfied, the message is classified into the state group having the group number “T2”.

表示装置14には、各状態グループの状態を示す状態一覧表示画面が表示される。ここで、状態グループの状態は、その状態グループに割り当てられている種別の対処法をエージェント装置2において実施することが必要になったか否かを示すものである。言い換えれば、状態グループの状態は、その状態グループに割り当てられている種別の対処法を実施しなければならない障害が、エージェント装置2において発生しているか否かを示すものである。本実施例では、状態グループの状態を「正常」、「異常」の2つの状態で表現する。状態「正常」は、状態グループに割り当てられている種別の対処法を実施することが不要なことを示し、状態「異常」は状態グループに割り当てられている種別の対処法を実施することが必要なことを示す。   On the display device 14, a state list display screen showing the state of each state group is displayed. Here, the state of the state group indicates whether or not the agent device 2 needs to implement a countermeasure for the type assigned to the state group. In other words, the state of the state group indicates whether or not a failure in the agent device 2 has to be implemented for the type of countermeasure assigned to the state group. In this embodiment, the state group state is expressed by two states, “normal” and “abnormal”. The status “normal” indicates that it is not necessary to implement the type of action assigned to the state group, and the state “abnormal” requires the type of action assigned to the state group. Indicates that

図3(A)は、状態一覧表示画面141の一例を示す図であり、状態グループのグループ番号に対応付けて、状態と対処法の種別とが表示されている。なお、図3(A)は、初期状態における状態一覧表示画面141を示しており、初期状態においては各状態グループの状態は全て「正常」になっている。即ち、エージェント装置2においては、障害が発生していないことを示している。   FIG. 3A is a diagram showing an example of the state list display screen 141, in which the state and the type of countermeasure are displayed in association with the group number of the state group. FIG. 3A shows the state list display screen 141 in the initial state. In the initial state, the states of all the state groups are all “normal”. That is, the agent device 2 indicates that no failure has occurred.

状態表示変更手段12は、状態一覧表示画面141に表示されている各状態グループの状態の内、メッセージ分類手段11によりメッセージの分類先にされた状態グループの状態を、「正常」から「異常」に変更する機能を有する。なお、状態グループの状態を変更する際、表示色、輝度などの表示属性も併せて変更するようにしても良い。   The status display changing means 12 changes the status of each status group displayed on the status list display screen 141 from “normal” to “abnormal” as the status of the status group that has been classified by the message classification means 11. The function to change to. When changing the state of the state group, display attributes such as display color and brightness may be changed together.

マネージャ装置1は、コンピュータにより実現可能であり、コンピュータにより実現する場合は、例えば、次のようにする。コンピュータをマネージャ装置1として機能させるためのプログラムを記録したディスク、半導体メモリ、その他の記録媒体を用意し、コンピュータに上記プログラムを読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、メッセージ分類手段11および状態表示変更手段12を実現する。   The manager device 1 can be realized by a computer, and when realized by a computer, for example, is as follows. A disk, a semiconductor memory, and other recording media recording a program for causing the computer to function as the manager device 1 are prepared, and the computer is caused to read the program. The computer controls the operation of the computer according to the read program, thereby realizing the message classification unit 11 and the status display change unit 12 on the computer.

〔第1の実施例の動作の説明〕
次に、本実施例の動作について詳細に説明する。
[Description of Operation of First Embodiment]
Next, the operation of this embodiment will be described in detail.

エージェント装置2内の監視手段21は、自装置2の状態を示すメッセージをマネージャ装置1へ送信する。   The monitoring unit 21 in the agent device 2 transmits a message indicating the state of the own device 2 to the manager device 1.

マネージャ装置1内のメッセージ分類手段11は、エージェント装置2からのメッセージを受信すると(図4のステップS41がYES)、分類定義蓄積部13に登録されている分類定義に従って上記メッセージを該当する状態グループにグループ分けし、その状態グループのグループ番号を状態表示変更手段12に渡す(ステップS42)。これにより、状態表示変更手段12は、状態一覧表示画面141に表示されている各状態グループの状態の内、メッセージ分類手段11から渡されたグループ番号によって示される状態グループの状態を「正常」から「異常」に変更する(ステップS43)。   When the message classification means 11 in the manager device 1 receives the message from the agent device 2 (YES in step S41 in FIG. 4), the message classification means 11 applies the above message to the corresponding state group according to the classification definition registered in the classification definition storage unit 13. And the group number of the state group is passed to the state display changing unit 12 (step S42). As a result, the state display changing unit 12 changes the state of the state group indicated by the group number passed from the message classification unit 11 from “normal” among the states of the state groups displayed on the state list display screen 141. Change to “abnormal” (step S43).

例えば、分類定義蓄積部13の内容が図2に示すものであり、エージェント装置2から送られてきたメッセージのメッセージIDが「0050」であるとすると、メッセージ分類手段11が、分類定義蓄積部13に登録されている第3番目の分類条件に従って上記メッセージをグループ番号「T3,T4」の状態グループにグループ分けし、状態表示変更手段12が、グループ番号「T3,T4」の状態グループの状態を「正常」から「異常」に変更するので、状態一覧表示画面141は、図3(A)に示すものから同図(B)に示すものに変更される。このように変更が行われることにより、管理者は、アプリケーションプログラムAPa、APbの再起動が必要となる障害がエージェント装置2において発生していることを一目で認識することができるので、障害に迅速に対応することが可能になる。また、状態グループの状態を変更する際に、表示色などの表示属性も併せて変更するようにすれば、状態が変更された状態グループをより確実且つ容易に認識することが可能になる。   For example, if the contents of the classification definition storage unit 13 are as shown in FIG. 2 and the message ID of the message sent from the agent device 2 is “0050”, the message classification unit 11 causes the classification definition storage unit 13 to The above messages are grouped into state groups with group numbers “T3, T4” according to the third classification condition registered in, and the state display changing means 12 determines the state of the state group with group numbers “T3, T4”. Since the state is changed from “normal” to “abnormal”, the state list display screen 141 is changed from the one shown in FIG. 3A to the one shown in FIG. By making the change in this way, the administrator can recognize at a glance that a failure requiring restart of the application programs APa and APb has occurred in the agent device 2, so that the failure can be quickly resolved. It becomes possible to cope with. In addition, when changing the state group state, if the display attributes such as the display color are also changed, the state group whose state has been changed can be more reliably and easily recognized.

〔第1の実施例の効果〕
本実施例によれば、エージェント装置2に障害が発生した場合、障害を復旧するためにどのような種別の対処法を実施したら良いのかを短時間で認識することができるので、復旧作業を開始するまでに要する時間を短縮化することができる。その理由は、障害を回復するために対処法の種別毎に定義された状態グループの状態を表示装置14に表示するようにし、メッセージ分類手段11が、エージェント装置2から送られてきたメッセージをそのメッセージに関連する状態グループに分類し、状態表示変更手段12が、表示装置14に表示されている状態グループの状態の内、メッセージ分類手段11によって分類先にされた状態グループの状態を変更するようにしているからである。
[Effect of the first embodiment]
According to the present embodiment, when a failure occurs in the agent device 2, it is possible to recognize in a short time what kind of countermeasure should be performed in order to recover the failure. The time required to do so can be shortened. The reason is that the state of the state group defined for each type of countermeasure to recover from the failure is displayed on the display device 14, and the message classification means 11 sends the message sent from the agent device 2 to the message. The status group is classified into the status groups related to the message, and the status display changing unit 12 changes the status group status classified by the message classifying unit 11 among the status group statuses displayed on the display device 14. Because it is.

〔第2の実施例〕
次に、本発明にかかる障害監視システムの第2の実施例について詳細に説明する。本実施例は、状態を「異常」に変更された状態グループに関し、その状態グループに割り当てられている種別の対処法が実施されたら、上記状態グループの状態を自動的に「正常」に戻せるようにしたことを特徴とする。更に、本実施例は、状態を「異常」に変更された状態グループに関し、その状態グループにグループ分けされたメッセージの組み合わせに基づいて、より詳細な対処法などを管理者に提示できるようにしたことを特徴とする。
[Second Embodiment]
Next, a second embodiment of the failure monitoring system according to the present invention will be described in detail. In this embodiment, with respect to a state group whose state has been changed to “abnormal”, the state of the state group can be automatically returned to “normal” when a countermeasure for the type assigned to the state group is implemented. It is characterized by that. Furthermore, in this embodiment, regarding the status group whose status has been changed to “abnormal”, it is possible to present more detailed countermeasures and the like to the administrator based on the combination of messages grouped into the status group. It is characterized by that.

〔第2の実施例の構成の説明〕
図5は本発明にかかる障害監視システムの第2の実施例の構成例を示すブロック図であり、管理装置として機能するマネージャ装置3と、被監視装置として機能するエージェント装置4とから構成され、両者はインターネットなどのネットワーク(図示を省略)を介して相互に接続されている。
[Description of Configuration of Second Embodiment]
FIG. 5 is a block diagram showing a configuration example of the second embodiment of the failure monitoring system according to the present invention, which is composed of a manager device 3 functioning as a management device and an agent device 4 functioning as a monitored device, Both are connected to each other via a network such as the Internet (not shown).

エージェント装置4は、監視手段41と、制御手段42とを備えている。監視手段41は、第1の実施例における監視手段21と同様の機能を有する。制御手段42は、マネージャ装置3から送られてきた対処法に応じたコマンドを実行する機能を有する。   The agent device 4 includes a monitoring unit 41 and a control unit 42. The monitoring means 41 has the same function as the monitoring means 21 in the first embodiment. The control means 42 has a function of executing a command according to the countermeasure sent from the manager device 3.

マネージャ装置3は、メッセージ収集手段301と、メッセージ分類手段302と、ナレッジ情報蓄積部303と、状態表示変更手段304と、対処履歴表示手段305と、ナレッジ情報登録手段306と、コマンド送信手段307と、メッセージ蓄積部308と、分類定義蓄積部309と、状態テーブル310と、LCD等の表示装置311と、キーボード等の入力装置312とを備えている。   The manager device 3 includes a message collection unit 301, a message classification unit 302, a knowledge information storage unit 303, a state display change unit 304, a handling history display unit 305, a knowledge information registration unit 306, and a command transmission unit 307. , A message storage unit 308, a classification definition storage unit 309, a status table 310, a display device 311 such as an LCD, and an input device 312 such as a keyboard.

メッセージ収集手段301は、エージェント装置4から送られてきたメッセージに現在時刻を付加してメッセージ蓄積部308に登録する機能や、エージェント装置4から送られてきたメッセージをメッセージ分類手段302に渡す機能を有する。   The message collecting unit 301 has a function of adding the current time to a message sent from the agent device 4 and registering it in the message storage unit 308, and a function of passing the message sent from the agent device 4 to the message classification unit 302. Have.

分類定義蓄積部309には、メッセージを、それが関連する状態グループに分類するための分類定義が登録されると共に、分類先の状態グループの状態を「正常」にするのか「異常」にするのかを示す情報が登録されている。分類されるメッセージが障害メッセージ(障害が発生したことを示すメッセージ)である場合には、分類先の状態グループの状態を「異常」にすることを示す情報が登録され、分類されるメッセージが回復メッセージ(障害回復のための処置がとられたことを示すメッセージ)である場合には、分類先の状態グループの状態を「正常」にすることを示す情報が登録されている。   In the category definition storage unit 309, a category definition for classifying a message into a status group to which the message is related is registered, and whether the status of the status group to be classified is set to “normal” or “abnormal”. Is registered. If the message to be classified is a failure message (message indicating that a failure has occurred), information indicating that the status of the status group at the classification destination is set to "abnormal" is registered, and the classified message is recovered. In the case of a message (a message indicating that an action has been taken to recover from a failure), information indicating that the state of the state group at the classification destination is set to “normal” is registered.

図6は、分類定義蓄積部309の内容例を示す図であり、分類定義番号に対応付けて、分類条件と、分類条件を満たすメッセージの分類先にする状態グループのグループ番号と、分類先の状態グループの状態とが登録されている。なお、分類定義は、分類条件とグループ番号とから構成される。   FIG. 6 is a diagram illustrating an example of the contents of the classification definition storage unit 309. In association with the classification definition number, the classification condition, the group number of the state group that is the classification destination of the message that satisfies the classification condition, and the classification destination The status group status is registered. The classification definition includes a classification condition and a group number.

図6の例えば分類定義番号B1に対応する情報は、メッセージIDが「0001」のメッセージ(システムエラーの発生を示す障害メッセージ)は、グループ番号「T1」の状態グループT1に分類され、上記メッセージが送られてきたときは状態グループT1の状態を「異常」に変更することを示している。また、分類定義番号B2に対応する情報は、メッセージIDが「0002」のメッセージ(障害回復のための処置がとられたことによりシステム処理が再開されたことを示す回復メッセージ)は、グループ番号「T1,T2,T3,T4」の状態グループに分類され、上記メッセージが送られてきたときは状態グループT1,T2,T3,T4の状態を「正常」に変更することを示している。なお、図6の例では、メッセージIDによりメッセージを分類するようにしたが、メッセージに含まれる文字列により分類するなど、他の方法を採用することもできる。   For example, the information corresponding to the classification definition number B1 in FIG. 6 is that the message with the message ID “0001” (failure message indicating the occurrence of the system error) is classified into the state group T1 with the group number “T1”. When sent, it indicates that the state of the state group T1 is changed to “abnormal”. The information corresponding to the classification definition number B2 includes a message with a message ID “0002” (a recovery message indicating that the system processing has been resumed due to the action taken for failure recovery), and the group number “ When the message is sent to the state group of “T1, T2, T3, T4”, it indicates that the state of the state group T1, T2, T3, T4 is changed to “normal”. In the example of FIG. 6, the messages are classified based on the message ID, but other methods such as classification based on the character strings included in the message may be employed.

メッセージ分類手段302は、メッセージ収集手段301から渡されたメッセージの分類先にする状態グループを分類定義蓄積部309に登録されている分類定義に従って決定すると共に、上記メッセージの分類先の状態グループの状態を分類定義蓄積部309から取得し、上記メッセージのメッセージIDと、分類先に決定した状態グループのグループ番号と、分類先にした状態グループの状態と、分類先を決定する際に使用した分類定義の分類定義番号とを状態表示変更手段304に渡す機能を有する。   The message classification unit 302 determines a state group to be a classification destination of the message passed from the message collection unit 301 according to the classification definition registered in the classification definition storage unit 309, and the state of the state group to which the message is classified Is obtained from the classification definition storage unit 309, the message ID of the message, the group number of the state group determined as the classification destination, the state of the state group determined as the classification destination, and the classification definition used in determining the classification destination And a function for transferring the classification definition number to the status display changing means 304.

図7は、状態グループとメッセージとの対応関係を示した図であり、各メッセージは、矢印で結ばれている状態グループに分類される。同図に示すように、メッセージの中には複数の状態グループに分類されるものもある。また、同図には示していないが、どの状態グループにも分類されないメッセージも存在する。なお、同図の左側に示した各メッセージは、分類先の状態を「異常」にする障害メッセージであり、右側に示した各メッセージは、分類先の状態を「正常」にする回復メッセージである。   FIG. 7 is a diagram showing the correspondence between state groups and messages, and each message is classified into state groups connected by arrows. As shown in the figure, some messages are classified into a plurality of state groups. Although not shown in the figure, there are messages that are not classified into any state group. Each message shown on the left side of the figure is a failure message that sets the classification destination state to "abnormal", and each message shown on the right side is a recovery message that sets the classification destination state to "normal". .

状態テーブル310には、状態グループ毎に、その状態グループに割り当てられている対処法をエージェント装置4において実施しなければならないか否かを示す状態と、その状態グループに分類されたメッセージのメッセージIDと、メッセージをその状態グループに分類する際に使用した分類定義の分類定義番号とが登録される。   In the state table 310, for each state group, a state indicating whether or not the agent apparatus 4 must implement a countermeasure assigned to the state group, and a message ID of a message classified into the state group And the classification definition number of the classification definition used when classifying the message into the state group are registered.

図8は状態テーブル310の内容例を示した図であり、状態グループのグループ番号に対応付けて、状態グループの状態と、メッセージIDと、分類定義番号とが登録されている。図8の例えば第1行目は、グループ番号「T1」の状態グループに割り当てられている対処法をエージェント装置4において実施する必要がないことを示している。また、例えば、第4行目は、グループ番号「T4」の状態グループに割り当てられている対処法をエージェント装置4において実施することが必要なことを示している。更に、状態グループT4にはメッセージID「0050」のメッセージが分類され、そのメッセージを分類する際に使用した分類定義の分類定義番号が「B4」であることを示している。   FIG. 8 is a diagram showing an example of the contents of the state table 310, in which the state group state, message ID, and classification definition number are registered in association with the group number of the state group. For example, the first line in FIG. 8 indicates that the agent apparatus 4 does not need to implement the countermeasure assigned to the state group with the group number “T1”. Further, for example, the fourth line indicates that the agent apparatus 4 needs to implement the countermeasure assigned to the state group with the group number “T4”. Further, it is indicated that the message with the message ID “0050” is classified into the state group T4, and the classification definition number of the classification definition used when classifying the message is “B4”.

表示装置311には、図9に示すように、状態表示変更手段304によって状態一覧表示画面311aが表示されると共に、対処履歴表示手段305によって対処履歴表示画面311bが表示される。   As shown in FIG. 9, on the display device 311, a status list display screen 311 a is displayed by the status display changing unit 304, and a handling history display screen 311 b is displayed by the handling history display unit 305.

状態表示変更手段304は、次のような機能を有する。   The status display changing unit 304 has the following functions.

・状態テーブル310の内容を状態一覧表示画面311aに表示する機能。
・状態テーブル310の内容をメッセージ分類手段302から渡されたグループ番号、状態グループの状態、メッセージIDおよび分類定義番号に従って変更する機能。より具体的には、メッセージ分類手段302から渡された状態グループの状態が「正常」の場合には、それと一緒に渡されたグループ番号と対応付けて登録されている状態グループの状態を「正常」に変更すると共に、上記グループ番号に対応付けて登録されているメッセージIDおよび分類定義番号を削除する。また、メッセージ分類手段302から渡された状態グループの状態が「異常」の場合には、それと一緒に渡されたグループ番号に対応付けて登録されている状態グループの状態を「異常」に変更すると共に、一緒に渡されたメッセージIDおよび分類定義番号を状態テーブル310に追加登録する。
・状態が「異常」になっている状態グループのグループ番号およびその状態グループに分類されているメッセージのメッセージIDを対処履歴表示手段305に渡す機能。
A function for displaying the contents of the status table 310 on the status list display screen 311a.
A function of changing the contents of the state table 310 according to the group number, the state group state, the message ID, and the classification definition number passed from the message classification unit 302. More specifically, when the state group state passed from the message classification unit 302 is “normal”, the state group state registered in association with the group number passed together with the state group state is “normal”. And the message ID and classification definition number registered in association with the group number are deleted. When the state group state passed from the message classification unit 302 is “abnormal”, the state group state registered in association with the group number passed with the state group is changed to “abnormal”. At the same time, the message ID and classification definition number delivered together are additionally registered in the status table 310.
A function of passing the group number of the state group in which the state is “abnormal” and the message ID of the message classified into the state group to the handling history display unit 305.

ナレッジ情報蓄積部303には、過去に発生した障害に対して管理者が実施した具体的な対処法などを示す管理者のコメントと、管理者が上記障害に対して付与した障害名称とが、上記障害の発生時にメッセージが分類された状態グループと、その状態グループに分類されたメッセージの組とに紐付けされて登録されている。   In the knowledge information storage unit 303, an administrator's comment indicating a specific countermeasure taken by the administrator for a failure that occurred in the past, and a failure name given to the failure by the administrator, The message is registered in association with the state group into which the message is classified when the failure occurs and the group of messages classified into the state group.

図10は、ナレッジ情報蓄積部303の内容例を示す図であり、グループ番号とメッセージIDとの組み合わせに対応付けて、障害名称とコメントとが登録されている。同図の例の第1番目のコメントは、過去にグループ番号「T20」の状態グループに、メッセージID「6012」「6023」「6005」のメッセージが分類されるという障害が発生したときに管理者が実施した具体的な対処法などを示している。また、同図の例の第2番目のコメントは、過去にグループ番号「T30」の状態グループに、メッセージID「9056」「14002」「5011」のメッセージが分類されるという障害が発生したときに管理者が実施した具体的な対処法などを示している。   FIG. 10 is a diagram illustrating an example of the contents of the knowledge information storage unit 303, in which a failure name and a comment are registered in association with a combination of a group number and a message ID. The first comment in the example in the figure is an administrator when a failure has occurred in which messages with message IDs “6012”, “6023”, and “6005” have been classified into the state group with the group number “T20” in the past. Shows the specific countermeasures implemented by. Also, the second comment in the example in the figure shows that when a failure has occurred in which messages with message IDs “9056”, “14002”, and “5011” have been classified into the state group with group number “T30” in the past. It shows the specific measures taken by the administrator.

対処履歴表示手段305は、状態表示変更手段304から渡された状態グループのグループ番号とメッセージIDとの組み合わせに対応付けて登録されているコメントおよび障害名称をナレッジ情報蓄積部303から検索して対処履歴表示画面311bに表示すると共に、上記メッセージIDに対応するメッセージをメッセージ蓄積部308から検索して対処履歴表示画面311bに表示する機能を有する。   The response history display unit 305 searches the knowledge information storage unit 303 for a comment and a failure name registered in association with the combination of the group number of the state group and the message ID passed from the state display change unit 304. In addition to being displayed on the history display screen 311b, a message corresponding to the message ID is retrieved from the message storage unit 308 and displayed on the handling history display screen 311b.

ナレッジ情報登録手段306は、管理者によって入力装置312から入力されたコメントおよび障害名称を、管理者によって入力装置312から入力されたグループ番号とメッセージIDとの組み合わせに対応付けてナレッジ情報蓄積部303に登録する機能を有する。   The knowledge information registration unit 306 associates the comment and the failure name input from the input device 312 by the administrator with the combination of the group number and the message ID input from the input device 312 by the administrator, and the knowledge information storage unit 303. It has a function to register with.

コマンド送信手段307は、管理者がエージェント装置4の障害を回復するために、入力装置312から入力したコマンドをエージェント装置4へ送信する機能を有する。   The command transmission unit 307 has a function of transmitting a command input from the input device 312 to the agent device 4 in order for the administrator to recover the failure of the agent device 4.

なお、マネージャ装置3はコンピュータにより実現可能であり、コンピュータによって実現する場合は、例えば、次のようにする。コンピュータをマネージャ装置3として機能させるプログラムを記録したディスク、半導体メモリ、その他の記録媒体を用意し、コンピュータに上記プログラムを読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、メッセージ収集手段301、メッセージ分類手段302、状態表示変更手段304、対処履歴表示手段305、ナレッジ情報登録手段306、およびコマンド送信手段307を実現する。   The manager device 3 can be realized by a computer. When the manager device 3 is realized by a computer, for example, the following is performed. A disk, a semiconductor memory, and other recording media recording a program that causes the computer to function as the manager device 3 are prepared, and the computer reads the program. The computer controls its own operation according to the read program, so that a message collection unit 301, a message classification unit 302, a status display change unit 304, a handling history display unit 305, a knowledge information registration unit 306, and A command transmission unit 307 is realized.

〔第2の実施例の動作の説明〕
次に、本実施例の動作について詳細に説明する。
[Description of Operation of Second Embodiment]
Next, the operation of this embodiment will be described in detail.

今、エージェント装置4内の監視手段41が図11(A)に示すメッセージa1〜a5を順次マネージャ装置3に送信したとする。なお、メッセージa1〜a4は障害メッセージに分類され、メッセージa5は回復メッセージに分類されるものである。   Now, it is assumed that the monitoring unit 41 in the agent device 4 sequentially transmits the messages a1 to a5 shown in FIG. Messages a1 to a4 are classified as failure messages, and message a5 is classified as a recovery message.

マネージャ装置3内のメッセージ収集手段301は、メッセージa1を受信すると(図12のステップS1201がYES)、それに現在時刻を付加してメッセージ蓄積部308に登録すると共に、メッセージa1をメッセージ分類手段302に渡す(ステップS1202)。   When the message collection unit 301 in the manager device 3 receives the message a1 (YES in step S1201 in FIG. 12), it adds the current time to the message storage unit 308 and registers the message a1 in the message classification unit 302. Pass (step S1202).

これにより、メッセージ分類手段302は、分類定義蓄積部309に登録されている分類定義に従ってメッセージa1の分類先にする状態グループを決定し、更に、分類定義蓄積部309からメッセージの分類先の状態グループの状態を取得する(ステップS1203、S1204)。その後、メッセージ分類手段302は、メッセージa1のメッセージID「6012」と、分類先にした状態グループのグループ番号(例えば、「T20」とする)と、メッセージの分類先の状態グループT20の状態(例えば「異常」とする)と、分類先を決定する際に使用した分類定義の分類定義番号(例えば「B10」とする)とを状態表示変更手段304に対して出力する(ステップS1205)。   As a result, the message classification unit 302 determines a state group to be the classification destination of the message a1 according to the classification definition registered in the classification definition accumulation unit 309, and further from the classification definition accumulation unit 309 to the state group to which the message is classified. Are acquired (steps S1203 and S1204). After that, the message classification unit 302 sends the message ID “6012” of the message a1, the group number of the state group that is the classification destination (for example, “T20”), and the state of the state group T20 that is the classification destination of the message (for example, ("Abnormal") and the classification definition number (for example, "B10") of the classification definition used when determining the classification destination are output to the status display changing unit 304 (step S1205).

これにより、状態表示変更手段304は、メッセージ分類手段302から渡された各情報に従って状態テーブル310の内容を更新する(ステップS1206)。具体的には、図13(A)に示すように、グループ番号「T20」に対応付けて登録されている状態グループの状態を「異常」に変更すると共に、グループ番号「T20」に対応付けてメッセージID「6012」および分類定義番号「B10」を追加登録する。   As a result, the status display changing means 304 updates the contents of the status table 310 according to each information passed from the message classification means 302 (step S1206). Specifically, as shown in FIG. 13A, the state of the state group registered in association with the group number “T20” is changed to “abnormal” and is associated with the group number “T20”. The message ID “6012” and the classification definition number “B10” are additionally registered.

その後、状態表示変更手段304は、状態一覧表示画面311aの表示内容を、更新後の状態テーブル310の内容を示すものに変更する(ステップS1207)。これにより、グループ番号「T20」に対応付けて表示されている状態グループT20の状態が「異常」に変更されるので、管理者は、状態グループT20に割り当てられている対処法をエージェント装置4において実施しなければならないと直ちに認識することができる。なお、状態グループの状態を変更する際、第1の実施例と同様に、表示色などの表示属性を併せて変更するようにしても良い。更に、ステップS1207においては、状態を変更した状態グループのグループ番号「T20」およびその状態グループT20に分類されているメッセージのメッセージID「6012」を対処履歴表示手段305に渡す処理も行う。   Thereafter, the status display changing unit 304 changes the display content of the status list display screen 311a to indicate the content of the updated status table 310 (step S1207). As a result, since the state of the state group T20 displayed in association with the group number “T20” is changed to “abnormal”, the administrator uses the agent device 4 to determine the countermeasure assigned to the state group T20. You can immediately recognize that you have to do it. When changing the state of the state group, the display attributes such as the display color may be changed together as in the first embodiment. Further, in step S1207, a process of passing the group number “T20” of the state group whose state has been changed and the message ID “6012” of the message classified into the state group T20 to the handling history display unit 305 is also performed.

これにより、対処履歴表示手段305は、図14に示す対処履歴表示処理を行う(ステップS1208)。先ず、対処履歴表示手段305は、状態表示変更手段304から渡されたグループ番号「T20」およびメッセージID「6012」をキーにしてナレッジ情報蓄積部303を検索する(図14のステップS1401)。そして、上記キーに対応付けて登録されているコメント及び障害名称が存在する場合(ステップS1402がYES)は、上記コメント及び障害名称と、メッセージID「6012」のメッセージとを対処履歴表示画面311bに表示する(ステップS1403)。なお、メッセージはメッセージ蓄積部308から入力して表示する。これに対して、該当する情報が登録されていない場合(ステップS1402がNO)は、処理を終了する。今、例えば、ナレッジ情報蓄積部303の内容が図10に示すものであり、グループ番号「T20」に関しては、メッセージID「6012、6023、6005」に対応する情報しか登録されていないとすると、ステップS1402の判断結果がNOとなり、対処履歴表示画面311bに対する表示は行われない。   Thereby, the handling history display unit 305 performs the handling history display process shown in FIG. 14 (step S1208). First, the handling history display unit 305 searches the knowledge information storage unit 303 using the group number “T20” and the message ID “6012” passed from the state display change unit 304 as keys (step S1401 in FIG. 14). If there is a comment and a failure name registered in association with the key (YES in step S1402), the comment and the failure name and the message with the message ID “6012” are displayed on the handling history display screen 311b. It is displayed (step S1403). The message is input from the message storage unit 308 and displayed. On the other hand, if the corresponding information is not registered (NO in step S1402), the process ends. Now, for example, if the content of the knowledge information storage unit 303 is as shown in FIG. 10, and only the information corresponding to the message ID “6012, 6023, 6005” is registered for the group number “T20”, the step The determination result in S1402 is NO, and no display on the handling history display screen 311b is performed.

その後、図11に示すメッセージa2を受信した場合も、メッセージa1を受信した場合と同様の処理が行われる。   Thereafter, when the message a2 shown in FIG. 11 is received, the same processing as when the message a1 is received is performed.

更に、メッセージa3を受信した場合には(ステップS1201がYES)は、ステップS1202〜S1206において、メッセージa1、a2を受信した場合と同様の処理が行われる。この結果、状態テーブル310の内容は、図13(B)に示すものになる。   Further, when the message a3 is received (step S1201 is YES), the same processing as when the messages a1 and a2 are received is performed in steps S1202 to S1206. As a result, the contents of the status table 310 are as shown in FIG.

その後、状態表示変更手段304は、状態一覧表示画面311aの表示内容を更新後の状態テーブル310の内容を示すものに変更し、更に、状態を変更した状態グループのグループ番号「T20」およびその状態グループに分類されているメッセージのメッセージID「6012、6023、6005」を対処履歴表示手段305に渡す(ステップS1207)。管理者は、状態一覧表示画面311aの表示内容に基づいて、状態グループT20にメッセージID「6012、6023、6005」のメッセージが分類されていることを認識することができる。即ち、メッセージID「6012、6023、6005」のメッセージは、関連するメッセージであることを認識することができる。   Thereafter, the status display changing unit 304 changes the display content of the status list display screen 311a to indicate the content of the updated status table 310, and further, the group number “T20” of the status group whose status has been changed and its status The message IDs “6012, 6023, 6005” of the messages classified into the group are passed to the handling history display unit 305 (step S1207). The administrator can recognize that the messages with the message IDs “6012, 6023, 6005” are classified in the state group T20 based on the display contents of the state list display screen 311a. That is, it can be recognized that the message with the message ID “6012, 6023, 6005” is a related message.

対処履歴表示手段305は、グループ番号およびメッセージIDが渡されると、図14に示す対処履歴表示処理を行う(ステップS1208)。対処履歴表示手段305は、先ず、状態表示変更手段304から渡されたグループ番号「T20」及びメッセージID「6012、6023、6005」をキーにしてナレッジ情報蓄積部303を検索する(ステップS1401)。この場合、図10に示すように、ナレッジ情報蓄積部303には、グループ番号「T20」及びメッセージID「6012、6023、6005」に対応付けて障害名称「外部要因によるプロセスP1停止」及びコメント「2005/12/10 16:55 管理者X プロセスP1がオペレーションミス等の…」が登録されているので、図15に示すように、対処履歴表示画面311bに、障害名称、メッセージIDが「6012、6023、6005」のメッセージ及びコメントが表示される。   When the group number and the message ID are passed, the handling history display unit 305 performs a handling history display process shown in FIG. 14 (step S1208). First, the response history display unit 305 searches the knowledge information storage unit 303 using the group number “T20” and the message IDs “6012, 6023, 6005” passed from the state display change unit 304 as keys (step S1401). In this case, as illustrated in FIG. 10, the knowledge information storage unit 303 stores the failure name “process P1 stop by an external factor” and the comment “in correspondence with the group number“ T20 ”and the message IDs“ 6012, 6023, 6005 ”. 2005/12/10 16:55 Since the administrator X process P1 has registered an operation error, etc., as shown in FIG. 15, the trouble history and message ID are “6012, 6023, 6005 "message and comment are displayed.

管理者は、対処履歴表示画面311bに表示された、過去に管理者が入力したコメントに基づいて、具体的な対処法を認識すると、例えば、入力装置312からコマンド送信手段307に対して、アプリケーションプログラムA1を再起動させるためのコマンドを入力する。このコマンドは、エージェント装置4に送られ、エージェント装置4内の制御手段42は、上記コマンドに従ってアプリケーションプログラムA1を再起動する。   When the administrator recognizes a specific countermeasure based on a comment input by the administrator in the past displayed on the countermeasure history display screen 311b, for example, the application sends an application to the command transmission unit 307 from the input device 312. A command for restarting the program A1 is input. This command is sent to the agent device 4, and the control means 42 in the agent device 4 restarts the application program A1 according to the command.

アプリケーションプログラムA1が再起動されることにより、エージェント装置4内の監視手段41は、図11(A)に示すメッセージa4、a5を順次マネージャ装置3に対して送信する。なお、分類定義蓄積部309には、メッセージa4のメッセージID「6002」が分類条件として登録されており、その分類先の状態グループのグループ番号、状態としてそれぞれ「T20」「異常」が登録されているとする。また、分類定義蓄積部309には、メッセージa5のメッセージID「6001」が分類条件として登録されており、その分類先のグループ番号、状態としてそれぞれ「T20」「正常」が登録されているとする。   When the application program A1 is restarted, the monitoring unit 41 in the agent device 4 sequentially transmits messages a4 and a5 shown in FIG. 11A to the manager device 3. In the category definition storage unit 309, the message ID “6002” of the message a4 is registered as a classification condition, and “T20” and “abnormal” are registered as the group number and state of the classification destination state group, respectively. Suppose that Further, it is assumed that the message ID “6001” of the message a5 is registered as a classification condition in the classification definition accumulation unit 309, and “T20” and “normal” are registered as the group number and state of the classification destination, respectively. .

マネージャ装置3は、メッセージa4を受信した場合は、メッセージa1、a2を受信した場合と同様の処理を行う(図12のステップS1201〜S1208)。メッセージa5を受信した場合は、図12のステップS1204で取得する状態グループの状態が「正常」となるので、ステップS1206では、グループ番号「T20」に対応付けて状態テーブル310に登録されている状態情報を「正常」に変更する処理を行うと共に、グループ番号「T20」に対応付けて登録されているメッセージID及び分類定義番号を削除する処理(消し込み処理)を行う。このように、メッセージa5が発生した場合、自動的に状態グループの状態を「正常」にすると共に、メッセージID及び分類定義番号を消し込むようにしているので、或る管理者がアプリケーションプログラムA1の再起動という対処を行った後、他の管理者が再び同様の対処を行うことがなくなる。   When the manager device 3 receives the message a4, the manager device 3 performs the same processing as when the messages a1 and a2 are received (steps S1201 to S1208 in FIG. 12). When the message a5 is received, the state of the state group acquired in step S1204 in FIG. 12 is “normal”. Therefore, in step S1206, the state registered in the state table 310 in association with the group number “T20”. A process of changing the information to “normal” is performed, and a process of deleting the message ID and the classification definition number registered in association with the group number “T20” (an erase process) is performed. As described above, when the message a5 occurs, the state of the state group is automatically set to “normal” and the message ID and the classification definition number are deleted, so that a certain administrator restarts the application program A1. After the above action is taken, other managers will not take the same action again.

管理者はエージェント装置4の状態が正常になったことを確認すると、必要に応じて、今回行った対処法やログから判明した障害原因などをコメントとしてナレッジ情報蓄積部303に登録する。   Upon confirming that the state of the agent device 4 is normal, the administrator registers the current countermeasure and the cause of failure found from the log as a comment in the knowledge information storage unit 303 as necessary.

ナレッジ情報蓄積部303にコメントを登録する場合には、管理者は、入力装置312を用いてナレッジ情報登録手段306を起動する。これにより、ナレッジ情報登録手段306は、図16に示すようなコメント登録画面161を表示する。コメント登録画面161には、グループ番号の入力欄162と、メッセージIDの入力欄163と、障害名称の入力欄164と、コメントの入力欄165と、登録ボタン166が設けられている。   When registering a comment in the knowledge information storage unit 303, the administrator activates the knowledge information registration unit 306 using the input device 312. As a result, the knowledge information registration unit 306 displays a comment registration screen 161 as shown in FIG. The comment registration screen 161 includes a group number input field 162, a message ID input field 163, a failure name input field 164, a comment input field 165, and a registration button 166.

今、例えば、管理者が状況によってはメッセージa1、a2だけが発生し、メッセージa3が発生しない場合もあると判断したとする。即ち、グループ番号「T20」の状態グループにメッセージa1、a2、a3が分類された時点ではなく、上記状態グループにメッセージa1、a2が分類された時点で、対処履歴表示画面311bにコメントを表示させる必要があると判断したとする。この場合、管理者は、グループ番号の入力欄162に「T20」を、メッセージIDの入力欄163にメッセージa1、a2のメッセージID「6012、6023」を、障害名称の入力欄164に「外部要因によるプロセスP1停止」、コメントの入力欄165にコメントを入力した後、登録ボタン166を操作する。これにより、ナレッジ情報登録手段306は、ナレッジ情報蓄積部303に管理者によって入力された各情報を対応付けて登録する。   Now, for example, it is assumed that, depending on the situation, the administrator determines that only the messages a1 and a2 are generated and the message a3 is not generated. That is, the comment is displayed on the response history display screen 311b when the messages a1, a2, and a3 are classified into the state group, not when the messages a1, a2, and a3 are classified into the state group with the group number “T20”. Suppose that it is necessary. In this case, the administrator sets “T20” in the group number input field 162, the message IDs “6012, 6023” in the message a1 and a2 in the message ID input field 163, and “external factor” in the failure name input field 164. After inputting the comment in the comment input field 165, the registration button 166 is operated. Thereby, the knowledge information registration unit 306 registers each information input by the administrator in the knowledge information storage unit 303 in association with each other.

次に、エージェント装置4内の監視手段41から図11(B)に示すメッセージb1〜b4がエージェント装置3に対して送信された場合の動作について説明する。なお、分類定義蓄積部309には、メッセージb1〜b4をグループ番号「T30」の状態グループに分類するための分類定義が登録され、メッセージb1〜b3の発生時には、上記状態グループの状態を「異常」に、メッセージb4の発生時には、上記状態グループの状態を「正常」にする情報が登録されているとする。また、ナレッジ情報蓄積部303には、図10に示すように、グループ番号「T30」に関しては、メッセージID「9056、14002、5011」に関する情報しか登録されていないとする。   Next, an operation when the messages b1 to b4 shown in FIG. 11B are transmitted from the monitoring unit 41 in the agent device 4 to the agent device 3 will be described. The classification definition storage unit 309 registers a classification definition for classifying the messages b1 to b4 into the status group with the group number “T30”. When the messages b1 to b3 are generated, the status of the status group is set to “abnormal”. ", When the message b4 occurs, it is assumed that information for setting the state of the state group to" normal "is registered. Further, as shown in FIG. 10, it is assumed that only information related to message IDs “9056, 14002, 5011” is registered in knowledge information storage unit 303 with respect to group number “T30”.

マネージャ装置3は、メッセージb1を受信すると(図12のステップS1201がYES)、メッセージa1を受信した場合と同様の処理を行う(ステップS1202〜1208)。但し、メッセージb1は、グループ番号「T30」の状態グループに分類されるものであるので、状態一覧表示画面311aに表示されている各状態グループの状態情報の内、グループ番号「T30」に対応するものだけが「異常」に変更される(ステップS1207)。   When manager device 3 receives message b1 (YES in step S1201 in FIG. 12), manager device 3 performs the same processing as when message a1 is received (steps S1202 to 1208). However, since the message b1 is classified into the state group of the group number “T30”, the message b1 corresponds to the group number “T30” among the state information of each state group displayed on the state list display screen 311a. Only the thing is changed to “abnormal” (step S1207).

メッセージb2を受信した場合は、マネージャ装置3はメッセージb1を受信した場合と同様の処理を行う。メッセージb3を受信した場合は、ステップS1202〜S1207では、メッセージb1、b2を受信した場合と同様の処理を行い、ステップS1208では、図17に示すような、障害名称、イベント発生状況、コメントを対処履歴表示画面311bに表示する。   When the message b2 is received, the manager device 3 performs the same process as when the message b1 is received. When the message b3 is received, in steps S1202 to S1207, the same processing as when the messages b1 and b2 are received is performed, and in step S1208, the failure name, event occurrence status, and comment are dealt with as shown in FIG. It is displayed on the history display screen 311b.

この表示を見て管理者は、OSを再起動させるためのコマンドをエージェント装置4へ送信する。エージェント装置4内の制御手段42は、マネージャ装置3から送られてきたコマンドに従ってOSを起動し、これにより、監視手段41は、メッセージb4をマネージャ装置3へ送信する。   The administrator sees this display and transmits a command for restarting the OS to the agent device 4. The control means 42 in the agent device 4 activates the OS according to the command sent from the manager device 3, whereby the monitoring means 41 transmits the message b 4 to the manager device 3.

マネージャ装置3では、メッセージb4が送られてくると、メッセージa5が送られてきた場合と同様の処理(消し込み処理)を行う。   When the message b4 is sent, the manager device 3 performs the same processing (erasing process) as when the message a5 is sent.

その後、管理者は、エージェント装置4の状態が正常になったことを確認すると、必要に応じてコメント等をナレッジ情報登録手段306によりナレッジ情報蓄積部303に登録する。   Thereafter, when the administrator confirms that the state of the agent device 4 is normal, the administrator registers a comment or the like in the knowledge information storage unit 303 by the knowledge information registration unit 306 as necessary.

次に、エージェント装置4内の監視手段41から図11(C)に示すメッセージc1〜c3が順次送られてきた場合の動作を説明する。なお、分類定義蓄積部309には、メッセージc1〜c3をグループ番号「T40」の状態グループに分類するための分類定義が登録され、メッセージc1〜c3発生時には、上記状態グループの状態を「異常」にするための情報が登録されているとする。また、ナレッジ情報蓄積部303には、グループ番号「T40」に関する情報は全く登録されていないとする。また、グループ番号「T40」の状態グループは、自動消し込みを行わない状態グループであるとする。   Next, an operation when the messages c1 to c3 shown in FIG. 11C are sequentially sent from the monitoring unit 41 in the agent device 4 will be described. The classification definition storage unit 309 registers a classification definition for classifying the messages c1 to c3 into the status group of the group number “T40”. When the messages c1 to c3 are generated, the status of the status group is set to “abnormal”. Suppose that the information to be registered is registered. Also, it is assumed that no information related to the group number “T40” is registered in the knowledge information storage unit 303. Further, it is assumed that the state group with the group number “T40” is a state group that is not automatically deleted.

マネージャ装置3は、メッセージc1を受信すると、メッセージa1を受信した場合と同様の処理を行う(図12のステップS1202〜S1208)。但し、メッセージc1はグループ番号「T40」の状態グループに分類されるものであるので、状態一覧表示画面311aに表示されている状態グループの状態の内、グループ番号「T40」に対応するものだけが「異常」に変更される(ステップS1207)。マネージャ装置3は、メッセージc2、c3を受信した場合もメッセージc1を受信した場合と同様の処理を行う。   When manager device 3 receives message c1, manager device 3 performs the same processing as when message a1 is received (steps S1202 to S1208 in FIG. 12). However, since the message c1 is classified into the state group with the group number “T40”, only the state corresponding to the group number “T40” among the states of the state group displayed on the state list display screen 311a is displayed. It is changed to “abnormal” (step S1207). The manager device 3 performs the same processing as when the message c1 is received when the messages c2 and c3 are received.

マネージャ情報蓄積部303には、グループ番号「T40」に関する情報は全く登録されていないので、メッセージc1〜c3を受信しても、対処履歴表示画面311bには、何の表示も行われない。   Since no information related to the group number “T40” is registered in the manager information storage unit 303, even if the messages c1 to c3 are received, nothing is displayed on the handling history display screen 311b.

その後、管理者が調査を行い、ホストH2、H3、H4が接続されているスイッチが故障していることが判明したとする。管理者はスイッチを交換し、障害が復旧したことを確認すると、状態テーブル310に登録されている状態情報の内、グループ番号「T40」に対応付けて登録されている状態情報を手動で「正常」に変更すると共に、グループ番号「T40」に対応付けて登録されているメッセージID及び分類定義番号を削除する。その後、管理者は、ナレッジ情報登録手段306を用いて、「ホストH2、H3、H4に障害が発生した際には、これらに共通するスイッチを確かめるべき」とのコメントを、グループ番号「T40」及びメッセージc1〜c3のメッセージ識別子「4004、4005、4006」に対応付けてナレッジ情報蓄積部303に登録する。   Thereafter, it is assumed that the administrator conducts an investigation and finds that the switch to which the hosts H2, H3, and H4 are connected has failed. When the administrator replaces the switch and confirms that the failure has been recovered, the status information registered in association with the group number “T40” in the status information registered in the status table 310 is manually set to “normal”. And the message ID and classification definition number registered in association with the group number “T40” are deleted. Thereafter, the administrator uses the knowledge information registration means 306 to comment that “when a failure occurs in the hosts H2, H3, and H4, check the switches common to these hosts” with the group number “T40”. And registered in the knowledge information storage unit 303 in association with the message identifiers “4004, 4005, 4006” of the messages c1 to c3.

〔第2の実施例の効果〕
本実施例によれば、第1の実施例で得られる効果に加え、次のような効果を得ることができる。
[Effect of the second embodiment]
According to the present embodiment, in addition to the effects obtained in the first embodiment, the following effects can be obtained.

本実施例は、メッセージ分類手段302で分類したメッセージが回復メッセージである場合には、メッセージの分類先の状態を「正常」に戻すようにしているので、或る管理者が障害回復のための処置をとった後、他の管理者が再び障害回復のための処置を行うということがなくなる。   In this embodiment, when the message classified by the message classification means 302 is a recovery message, the state of the message classification destination is returned to “normal”, so that a certain administrator can recover the failure. After taking the action, other managers will not take another action to recover from the failure.

また、本実施例は、状態グループとメッセージとの組み合わせに対応付けて具体的な対処法などを示すコメントが登録されたナレッジ情報蓄積部303と、メッセージ分類手段302によってメッセージが分類された状態グループとその状態グループに分類されたメッセージとの組み合わせに対応付けて登録されているコメントをナレッジ情報蓄積部303から検索し、検索したコメントを表示装置311に表示する対処履歴表示手段306とを備えているので、今回発生した障害に対する適切なコメントを管理者に提示することが可能になる。   Also, in this embodiment, the knowledge information storage unit 303 in which comments indicating a specific countermeasure or the like are registered in association with the combination of the state group and the message, and the state group in which the message is classified by the message classification unit 302 And a response history display unit 306 for searching the knowledge information storage unit 303 for a comment registered in association with the combination of the message and the message classified into the state group, and displaying the searched comment on the display device 311. Therefore, it is possible to present an appropriate comment to the administrator regarding the failure that occurred this time.

マネージャ装置がネットワークを介してエージェント装置の状態を管理する障害監視システムに適用すると好適である。   The present invention is preferably applied to a failure monitoring system in which a manager device manages the state of an agent device via a network.

本発明にかかる障害監視システムの第1の実施例の構成例を示すブロック図である。It is a block diagram which shows the structural example of the 1st Example of the failure monitoring system concerning this invention. 分類定義蓄積部13の内容例を示す図である。It is a figure which shows the example of the content of the classification definition storage part 13. FIG. 状態一覧表示画面141の一例を示す図である。It is a figure which shows an example of the state list display screen. 第1の実施例の処理例を示すフローチャートである。It is a flowchart which shows the process example of a 1st Example. 本発明にかかる障害監視システムの第2の実施例の構成例を示すブロック図である。It is a block diagram which shows the structural example of the 2nd Example of the failure monitoring system concerning this invention. 分類定義蓄積部309の内容例を示す図である。It is a figure which shows the example of the content of the classification definition storage part 309. メッセージと状態グループとの対応関係を示す図である。It is a figure which shows the correspondence of a message and a state group. 状態テーブル310の内容例を示す図である。It is a figure which shows the example of the content of the state table. 表示装置311の表示例を示す図である。11 is a diagram showing a display example of the display device 311. FIG. ナレッジ情報蓄積部303の内容例を示す図である。6 is a diagram illustrating an example of the contents of a knowledge information storage unit 303. FIG. エージェント装置4からマネージャ装置3へ送られたメッセージの一例を示す図である。6 is a diagram illustrating an example of a message sent from the agent device 4 to the manager device 3. FIG. 第2の実施例の処理例を示すフローチャートである。It is a flowchart which shows the process example of a 2nd Example. 状態テーブル310の内容例を示す図である。It is a figure which shows the example of the content of the state table. 対処履歴表示処理の一例を示すフローチャートである。It is a flowchart which shows an example of a countermeasure history display process. 対処履歴表示画面311bの表示内容例を示す図である。It is a figure which shows the example of a display content of the countermeasure log | history display screen 311b. コメント登録画面の一例を示す図である。It is a figure which shows an example of a comment registration screen. 対処履歴表示画面311bの表示内容例を示す図である。It is a figure which shows the example of a display content of the countermeasure log | history display screen 311b.

符号の説明Explanation of symbols

1…マネージャ装置
11…メッセージ分類手段
12…状態表示変更手段
13…分類定義蓄積部
14…表示装置
2…エージェント装置
21…監視手段
3…マネージャ装置
301…メッセージ収集手段
302…メッセージ分類手段
303…ナレッジ情報蓄積部
304…状態表示変更手段
305…対処履歴表示手段
306…ナレッジ情報登録手段
307…コマンド送信手段
308…メッセージ蓄積部
309…分類定義蓄積部
310…状態テーブル
311…表示装置
312…入力装置
4…エージェント装置
41…監視手段
42…制御手段
DESCRIPTION OF SYMBOLS 1 ... Manager apparatus 11 ... Message classification means 12 ... Status display change means 13 ... Classification definition accumulation | storage part 14 ... Display apparatus 2 ... Agent apparatus 21 ... Monitoring means 3 ... Manager apparatus 301 ... Message collection means 302 ... Message classification means 303 ... Knowledge Information storage unit 304 ... Status display change unit 305 ... Dealing history display unit 306 ... Knowledge information registration unit 307 ... Command transmission unit 308 ... Message storage unit 309 ... Classification definition storage unit 310 ... Status table 311 ... Display device 312 ... Input device 4 ... Agent device 41 ... Monitoring means 42 ... Control means

Claims (28)

エージェント装置とマネージャ装置とを備えた障害監視システムにおいて、
前記エージェント装置が、
自装置の状態を示すメッセージを前記マネージャ装置に対して送信する監視手段を備え、
前記マネージャ装置が、
障害を回復するための対処法の種別毎に定義された状態グループの状態を表示する表示装置と、
前記メッセージをそれが関連する前記状態グループに分類するための分類定義が登録された分類定義蓄積部と、
前記エージェント装置から受信したメッセージを前記分類定義に従って1以上の前記状態グループに分類する分類手段と、
前記表示装置に表示された状態グループの状態の内、前記分類手段によって前記メッセージが分類された状態グループの状態を変更する状態表示変更手段とを備えたことを特徴とする障害監視システム。
In a fault monitoring system comprising an agent device and a manager device,
The agent device is
Comprising monitoring means for transmitting a message indicating the status of the own device to the manager device;
The manager device is
A display device that displays the status of the status group defined for each type of countermeasure to recover from the failure;
A classification definition storage unit in which a classification definition for classifying the message into the state group to which the message relates is registered;
Classification means for classifying messages received from the agent device into one or more state groups according to the classification definition;
A fault monitoring system comprising: a state display changing unit that changes a state of the state group in which the message is classified by the classification unit among the states of the state group displayed on the display device.
請求項1記載の障害監視システムにおいて、
前記状態表示変更手段は、前記メッセージが障害の発生を示す障害メッセージである場合は、前記分類手段によって前記メッセージが分類された状態グループの状態を、その状態グループに割り当てられている種別の対処法を実施することが必要な障害が発生したことを示すものに変更することを特徴とする障害監視システム。
The failure monitoring system according to claim 1,
If the message is a failure message indicating the occurrence of a failure, the state display change unit may change the state of the state group into which the message is classified by the classification unit to the type assigned to the state group. The fault monitoring system is characterized in that it is changed to one that indicates that a fault that needs to be implemented has occurred.
請求項1または2記載の障害監視システムにおいて、
前記状態表示変更手段は、前記メッセージが障害回復のための処置がとられたことを示す回復メッセージである場合は、前記分類手段によって前記メッセージが分類された状態グループの状態を、障害が回復したことを示すものに変更することを特徴とする障害監視システム。
The failure monitoring system according to claim 1 or 2,
When the message is a recovery message indicating that a measure for recovery from a failure has been taken, the status display change unit has recovered the status of the status group into which the message has been classified by the classification unit. A fault monitoring system characterized by changing to one that indicates
請求項1乃至3の何れか1項に記載の障害監視システムにおいて、
前記状態表示変更手段は、前記分類手段によって分類された前記メッセージを示す情報と、前記メッセージの分類先となった状態グループを示す情報とを前記表示装置に表示することを特徴とする障害監視システム。
The failure monitoring system according to any one of claims 1 to 3,
The status display changing means displays on the display device information indicating the message classified by the classification means and information indicating a status group to which the message is classified. .
請求項1乃至4の何れか1項に記載の障害監視システムにおいて、
状態グループとメッセージとの組み合わせに対応付けてコメントが登録されたナレッジ情報蓄積部と、
前記分類手段によって前記メッセージが分類された状態グループとその状態グループに分類されたメッセージとの組み合わせに対応付けて登録されているコメントを前記ナレッジ情報蓄積部から検索し、該検索したコメントを前記表示装置に表示する対処履歴表示手段とを備えたことを特徴とする障害監視システム。
The failure monitoring system according to any one of claims 1 to 4,
A knowledge information storage unit in which comments are registered in association with combinations of state groups and messages;
A comment registered in association with a combination of a state group in which the message is classified by the classification unit and a message classified in the state group is searched from the knowledge information storage unit, and the searched comment is displayed in the display. A fault monitoring system comprising a handling history display means for displaying on a device.
請求項5記載の障害監視システムにおいて、
管理者によって入力されたコメントを、前記管理者によって指定された状態グループとメッセージとの組み合わせに対応付けて前記ナレッジ情報蓄積部に登録するナレッジ情報登録手段を備えたことを特徴とする障害監視システム。
The fault monitoring system according to claim 5, wherein
A failure monitoring system comprising knowledge information registration means for registering a comment input by an administrator in the knowledge information storage unit in association with a combination of a state group and a message specified by the administrator .
請求項1乃至6の何れか1項に記載の障害監視システムにおいて、
前記状態表示変更手段は、状態グループの状態を変更する際、その表示属性を変更することを特徴とする障害監視システム。
The failure monitoring system according to any one of claims 1 to 6,
The state display changing means changes the display attribute when changing the state of the state group.
障害を回復するための対処法の種別毎に定義された状態グループの状態を表示する表示装置と、
メッセージをそれが関連する前記状態グループに分類するための分類定義が登録された分類定義蓄積部と、
エージェント装置から受信した、前記エージェント装置の状態を示すメッセージを前記分類定義に従って1以上の前記状態グループに分類する分類手段と、
前記表示装置に表示された状態グループの状態の内、前記分類手段によって前記メッセージが分類された状態グループの状態を変更する状態表示変更手段とを備えたことを特徴とするマネージャ装置。
A display device that displays the status of the status group defined for each type of countermeasure to recover from the failure;
A classification definition storage unit in which a classification definition for classifying a message into the state group to which the message is related is registered;
Classification means for classifying a message indicating the state of the agent device received from an agent device into one or more state groups according to the classification definition;
A manager device comprising: a state display changing unit that changes a state of the state group in which the message is classified by the classification unit among the states of the state group displayed on the display device.
請求項8記載のマネージャ装置において、
前記状態表示変更手段は、前記メッセージが障害の発生を示す障害メッセージである場合は、前記分類手段によって前記メッセージが分類された状態グループの状態を、その状態グループに割り当てられている種別の対処法を実施することが必要な障害が発生したことを示すものに変更することを特徴とするマネージャ装置。
The manager device according to claim 8, wherein
If the message is a failure message indicating the occurrence of a failure, the state display change unit may change the state of the state group into which the message is classified by the classification unit to the type assigned to the state group. The manager device is characterized in that it is changed to one indicating that a failure requiring execution has occurred.
請求項8または9記載のマネージャ装置において、
前記状態表示変更手段は、前記メッセージが障害回復のための処置がとられたことを示す回復メッセージである場合は、前記分類手段によって前記メッセージが分類された状態グループの状態を、障害が回復したことを示すものに変更することを特徴とするマネージャ装置。
The manager device according to claim 8 or 9,
When the message is a recovery message indicating that a measure for recovery from a failure has been taken, the status display change unit has recovered the status of the status group into which the message has been classified by the classification unit. A manager device characterized in that the manager device is changed to one indicating the above.
請求項8乃至10の何れか1項に記載のマネージャ装置において、
前記状態表示変更手段は、前記分類手段によって分類された前記メッセージを示す情報と、前記メッセージの分類先となった状態グループを示す情報とを前記表示装置に表示することを特徴とするマネージャ装置。
The manager device according to any one of claims 8 to 10,
The manager device characterized in that the status display change means displays information indicating the message classified by the classification means and information indicating a status group to which the message is classified on the display device.
請求項8乃至11の何れか1項に記載のマネージャ装置において、
状態グループとメッセージとの組み合わせに対応付けてコメントが登録されたナレッジ情報蓄積部と、
前記分類手段によって前記メッセージが分類された状態グループとその状態グループに分類されたメッセージとの組み合わせに対応付けて登録されているコメントを前記ナレッジ情報蓄積部から検索し、該検索したコメントを前記表示装置に表示する対処履歴表示手段とを備えたことを特徴とするマネージャ装置。
The manager device according to any one of claims 8 to 11,
A knowledge information storage unit in which comments are registered in association with combinations of state groups and messages;
A comment registered in association with a combination of a state group in which the message is classified by the classification unit and a message classified in the state group is searched from the knowledge information storage unit, and the searched comment is displayed in the display. A manager device comprising a handling history display means for displaying on the device.
請求項12記載のマネージャ装置において、
管理者によって入力されたコメントを、前記管理者によって指定された状態グループとメッセージとの組み合わせに対応付けて前記ナレッジ情報蓄積部に登録するナレッジ情報登録手段を備えたことを特徴とするマネージャ装置。
The manager device according to claim 12, wherein
A manager device comprising knowledge information registration means for registering a comment input by an administrator in the knowledge information storage unit in association with a combination of a state group and a message specified by the administrator.
請求項8乃至13の何れか1項に記載のマネージャ装置において、
前記状態表示変更手段は、状態グループの状態を変更する際、その表示属性を変更することを特徴とするマネージャ装置。
The manager device according to any one of claims 8 to 13,
The manager device characterized in that the state display changing means changes the display attribute when changing the state of the state group.
障害を回復するための対処法の種別毎に定義された状態グループの状態を表示する表示装置と、メッセージをそれが関連する前記状態グループに分類するための分類定義が登録された分類定義蓄積部とを備えたコンピュータが、エージェント装置から受信した、前記エージェント装置の状態を示すメッセージを前記分類定義に従って1以上の前記状態グループに分類する分類ステップと、
前記コンピュータが、前記表示装置に表示された状態グループの状態の内、前記分類ステップによって前記メッセージが分類された状態グループの状態を変更する状態表示変更ステップとを含むことを特徴とする障害監視方法。
A display device that displays the state of a state group defined for each type of coping method for recovering a failure, and a category definition storage unit in which a category definition for classifying a message into the state group to which the message relates is registered A step of classifying a message indicating the state of the agent device received from the agent device into one or more state groups according to the classification definition;
A fault monitoring method comprising: a state display changing step in which the computer changes a state of a state group in which the message is classified by the classification step among states of the state group displayed on the display device. .
請求項15記載の障害監視方法において、
前記状態表示変更ステップでは、前記メッセージが障害の発生を示す障害メッセージである場合は、前記分類ステップによって前記メッセージが分類された状態グループの状態を、その状態グループに割り当てられている種別の対処法を実施することが必要な障害が発生したことを示すものに変更することを特徴とする障害監視方法。
The fault monitoring method according to claim 15, wherein
In the state display change step, if the message is a failure message indicating the occurrence of a failure, the state of the state group into which the message has been classified by the classification step is treated as the type assigned to the state group. The fault monitoring method is characterized in that a change is made to indicate that a fault that needs to be carried out has occurred.
請求項15または16記載の障害監視方法において、
前記状態表示変更ステップでは、前記メッセージが障害回復のための処置がとられたことを示す回復メッセージである場合は、前記分類ステップによって前記メッセージが分類された状態グループの状態を、障害が回復したことを示すものに変更することを特徴とする障害監視方法。
The fault monitoring method according to claim 15 or 16,
In the status display change step, when the message is a recovery message indicating that a measure for recovery from a failure has been taken, the status has recovered from the status of the status group into which the message has been classified by the classification step. A fault monitoring method, characterized in that the fault monitoring method is changed to one indicating the above.
請求項15乃至17の何れか1項に記載の障害監視方法において、
前記状態表示変更ステップでは、前記分類ステップによって分類された前記メッセージを示す情報と、前記メッセージの分類先となった状態グループを示す情報とを前記表示装置に表示することを特徴とする障害監視方法。
The fault monitoring method according to any one of claims 15 to 17,
In the status display changing step, a failure monitoring method characterized in that information indicating the message classified by the classification step and information indicating a status group to which the message is classified are displayed on the display device. .
請求項15乃至18の何れか1項に記載の障害監視方法において、
前記コンピュータが、状態グループとメッセージとの組み合わせに対応付けてコメントが登録されたナレッジ情報蓄積部を備え、且つ、
前記コンピュータが、前記分類ステップによって前記メッセージが分類された状態グループとその状態グループに分類された前記メッセージとの組み合わせに対応付けて登録されているコメントを前記ナレッジ情報蓄積部から検索し、該検索したコメントを前記表示装置に表示する対処履歴表示ステップとを含むことを特徴とする障害監視方法。
The failure monitoring method according to any one of claims 15 to 18,
The computer includes a knowledge information storage unit in which a comment is registered in association with a combination of a state group and a message; and
The computer searches the knowledge information storage unit for a comment registered in association with a combination of a state group in which the message is classified in the classification step and the message classified in the state group, and the search A failure monitoring method comprising: a handling history display step for displaying a comment made on the display device.
請求項19記載の障害監視方法において、
前記コンピュータが、管理者によって入力されたコメントを、前記管理者によって指定された状態グループとメッセージとの組み合わせに対応付けて前記ナレッジ情報蓄積部に登録するナレッジ情報登録ステップを含むことを特徴とする障害監視方法。
The fault monitoring method according to claim 19, wherein
The computer includes a knowledge information registration step of registering a comment input by an administrator in the knowledge information storage unit in association with a combination of a state group and a message designated by the administrator. Fault monitoring method.
請求項15乃至20の何れか1項に記載の障害監視方法において、
前記状態表示変更ステップでは、状態グループの状態を変更する際、その表示属性を変更することを特徴とする障害監視方法。
The failure monitoring method according to any one of claims 15 to 20,
In the state display change step, when changing the state of the state group, the display attribute is changed.
障害を回復するための対処法の種別毎に定義された状態グループの状態を表示する表示装置と、メッセージをそれが関連する前記状態グループに分類するための分類定義が登録された分類定義蓄積部とを備えたコンピュータを、
エージェント装置から受信した、前記エージェント装置の状態を示すメッセージを前記分類定義に従って1以上の前記状態グループに分類する分類手段、
前記表示装置に表示された状態グループの状態の内、前記分類手段によって前記メッセージが分類された状態グループの状態を変更する状態表示変更手段として機能させるためのプログラム。
A display device that displays the state of a state group defined for each type of coping method for recovering a failure, and a category definition storage unit in which a category definition for classifying a message into the state group to which the message relates is registered A computer with
Classification means for classifying a message indicating the state of the agent device received from an agent device into one or more state groups according to the classification definition;
A program for functioning as a state display changing unit for changing a state of a state group in which the message is classified by the classification unit among the states of the state group displayed on the display device.
請求項22記載のプログラムにおいて、
前記状態表示変更手段は、前記メッセージが障害の発生を示す障害メッセージである場合は、前記分類手段によって前記メッセージが分類された状態グループの状態を、その状態グループに割り当てられている種別の対処法を実施することが必要な障害が発生したことを示すものに変更することを特徴とするプログラム。
The program according to claim 22, wherein
If the message is a failure message indicating the occurrence of a failure, the state display change unit may change the state of the state group into which the message is classified by the classification unit to the type assigned to the state group. A program characterized in that it is changed to indicate that a failure has occurred that is necessary to be executed.
請求項22または23記載のプログラムにおいて、
前記状態表示変更手段は、前記メッセージが障害回復のための処置がとられたことを示す回復メッセージである場合は、前記分類手段によって前記メッセージが分類された状態グループの状態を、障害が回復したことを示すものに変更することを特徴とするプログラム。
24. The program according to claim 22 or 23, wherein:
When the message is a recovery message indicating that a measure for recovery from a failure has been taken, the status display change unit has recovered the status of the status group into which the message has been classified by the classification unit. A program characterized by changing to something that indicates
請求項22乃至24の何れか1項に記載のプログラムにおいて、
前記状態表示変更手段は、前記分類手段によって分類された前記メッセージを示す情報と、前記メッセージの分類先となった状態グループを示す情報とを前記表示装置に表示することを特徴とするプログラム。
The program according to any one of claims 22 to 24,
The status display change means displays information indicating the message classified by the classification means and information indicating a status group to which the message is classified on the display device.
請求項22乃至25の何れか1項に記載のプログラムにおいて、
前記コンピュータが、状態グループとメッセージとの組み合わせに対応付けてコメントが登録されたナレッジ情報蓄積部を備え、且つ、
前記コンピュータを、前記分類手段によってメッセージが分類された状態グループとその状態グループに分類されたメッセージとの組み合わせに対応付けて登録されているコメントを前記ナレッジ情報蓄積部から検索し、該検索したコメントを前記表示装置に表示する対処履歴表示手段として機能させるためのプログラム。
The program according to any one of claims 22 to 25,
The computer includes a knowledge information storage unit in which a comment is registered in association with a combination of a state group and a message; and
The computer searches the knowledge information storage unit for a comment registered in association with a combination of the state group into which the message is classified by the classification unit and the message classified into the state group, and the searched comment For functioning as coping history display means for displaying a message on the display device.
請求項26記載のプログラムにおいて、
前記コンピュータを、管理者によって入力されたコメントを、前記管理者によって指定された状態グループとメッセージとの組み合わせに対応付けて前記ナレッジ情報蓄積部に登録するナレッジ情報登録手段として機能させるためのプログラム。
The program according to claim 26,
A program for causing the computer to function as knowledge information registration means for registering a comment input by an administrator in the knowledge information storage unit in association with a combination of a state group and a message specified by the administrator.
請求項22乃至27の何れか1項に記載のプログラムにおいて、
前記状態表示変更手段は、状態グループの状態を変更する際、その表示属性を変更することを特徴とするプログラム。
The program according to any one of claims 22 to 27,
The state display changing means changes the display attribute when changing the state of the state group.
JP2007188222A 2007-07-19 2007-07-19 Fault monitoring system, manager device, fault monitoring method, and program Pending JP2009026052A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007188222A JP2009026052A (en) 2007-07-19 2007-07-19 Fault monitoring system, manager device, fault monitoring method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007188222A JP2009026052A (en) 2007-07-19 2007-07-19 Fault monitoring system, manager device, fault monitoring method, and program

Publications (1)

Publication Number Publication Date
JP2009026052A true JP2009026052A (en) 2009-02-05

Family

ID=40397808

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007188222A Pending JP2009026052A (en) 2007-07-19 2007-07-19 Fault monitoring system, manager device, fault monitoring method, and program

Country Status (1)

Country Link
JP (1) JP2009026052A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017069912A (en) * 2015-10-02 2017-04-06 日本電信電話株式会社 Network monitoring device and network monitoring method
WO2023157076A1 (en) * 2022-02-15 2023-08-24 日本電信電話株式会社 Control apparatus, control method, and control program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0595355A (en) * 1991-10-01 1993-04-16 Nec Corp Network monitor system
JP2000040021A (en) * 1998-07-23 2000-02-08 Ntt Data Corp Monitoring display system and record medium
JP2006023910A (en) * 2004-07-07 2006-01-26 Hitachi Ltd Server fault recovery method and server fault recovery system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0595355A (en) * 1991-10-01 1993-04-16 Nec Corp Network monitor system
JP2000040021A (en) * 1998-07-23 2000-02-08 Ntt Data Corp Monitoring display system and record medium
JP2006023910A (en) * 2004-07-07 2006-01-26 Hitachi Ltd Server fault recovery method and server fault recovery system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017069912A (en) * 2015-10-02 2017-04-06 日本電信電話株式会社 Network monitoring device and network monitoring method
WO2023157076A1 (en) * 2022-02-15 2023-08-24 日本電信電話株式会社 Control apparatus, control method, and control program

Similar Documents

Publication Publication Date Title
JP5325981B2 (en) Management server and management system
US20080065928A1 (en) Technique for supporting finding of location of cause of failure occurrence
JP2017509262A (en) Identify network failure troubleshooting options
JP7423942B2 (en) information processing system
JP2019057139A (en) Operation management system, monitoring server, method and program
JP3916232B2 (en) Knowledge-type operation management system, method and program
JP5983102B2 (en) Monitoring program, method and apparatus
WO2018135254A1 (en) Area of influence specifying program, area of influence specifying method, and area of influence specifying device
US10558513B2 (en) System management apparatus and system management method
JP2007079896A (en) Monitoring device and monitoring method
JP2009211611A (en) Operation management system, method, and program
WO2013124947A1 (en) Information system management device and information system management method and program
US6966014B2 (en) Method for system obstacle correspondence support
JP2009026052A (en) Fault monitoring system, manager device, fault monitoring method, and program
JP2016134721A (en) Information processing system, control method of information processing system and control program of management device
US8667340B2 (en) Method and system for distributed processing of alerts
US8473788B2 (en) Monitoring program, monitoring apparatus, and monitoring method
JP5313465B2 (en) Network management program and network management method
JP5623950B2 (en) IT failure sign detection device and program
JP6547649B2 (en) INFORMATION PROCESSING APPARATUS AND INFORMATION PROCESSING PROGRAM
JP2007072545A (en) Monitoring device and monitoring method
JP5088738B2 (en) Fault monitoring apparatus, fault monitoring method, and program therefor
JP2007072546A (en) Flow editing device and flow editing method
CN104823406A (en) Identifying reports to address network issues
US20070214396A1 (en) Round-trip resolution of customer error reports

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090721

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101228