JP2009026052A - Fault monitoring system, manager device, fault monitoring method, and program - Google Patents
Fault monitoring system, manager device, fault monitoring method, and program Download PDFInfo
- Publication number
- JP2009026052A JP2009026052A JP2007188222A JP2007188222A JP2009026052A JP 2009026052 A JP2009026052 A JP 2009026052A JP 2007188222 A JP2007188222 A JP 2007188222A JP 2007188222 A JP2007188222 A JP 2007188222A JP 2009026052 A JP2009026052 A JP 2009026052A
- Authority
- JP
- Japan
- Prior art keywords
- message
- state
- group
- classification
- classified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Computer And Data Communications (AREA)
Abstract
Description
本発明は、マネージャ装置がエージェント装置から送られてくるメッセージに基づいて、エージェント装置の状態を監視する障害監視技術に関し、特に、エージェント装置に障害が発生した場合、障害を復旧するためにどのような種別の対処法を実施したら良いのかを、マネージャ装置の管理者が短時間で認識することができる障害監視技術に関する。 The present invention relates to a failure monitoring technique in which a manager device monitors the state of an agent device based on a message sent from the agent device, and more particularly, how to recover a failure when a failure occurs in the agent device. The present invention relates to a failure monitoring technique that enables a manager of a manager device to recognize in a short time whether or not to cope with various types of countermeasures.
マネージャ装置においてエージェント装置の状態を監視するために、エージェント装置からマネージャ装置に対して、エージェント装置の状態を示すメッセージを送信し、マネージャ装置においてエージェント装置から送られてきたメッセージを表示するということが従来から行われている。しかし、エージェント装置から送られてきたメッセージを単に表示するだけでは、マネージャ装置の管理者自身が表示されたメッセージに基づいてエージェント装置に障害が発生したか否かを判定し、障害が発生したと判断した場合には、対処法を決定することが必要になるため、管理者の負担が大きくなるという問題があると共に、高度な専門知識が必要になるという問題がある。 In order for the manager device to monitor the state of the agent device, the agent device sends a message indicating the state of the agent device to the manager device, and the manager device displays the message sent from the agent device. Traditionally done. However, by simply displaying the message sent from the agent device, the manager of the manager device itself determines whether or not a failure has occurred in the agent device based on the displayed message. When it is determined, it is necessary to determine a countermeasure, and thus there is a problem that the burden on the administrator is increased, and there is a problem that a high level of expertise is required.
そこで、このような問題を解決するため、次のような技術が提案されている(例えば、特許文献1、2参照)。
In order to solve such problems, the following techniques have been proposed (see, for example,
特許文献1では、マネージャ装置に、メッセージIDに対応付けて障害の復旧方法などを示すガイドメッセージが登録されたデータベースを設け、エージェント装置からメッセージが送られてきたとき、そのメッセージIDによってデータベースを検索し、検索したガイドメッセージを表示するようにしている。
In
また、特許文献2では、マネージャ装置に、メッセージIDに対応付け連絡先及び障害に関する関連文書を登録したデータベースを設け、エージェント装置からメッセージが送られてきたとき、そのメッセージIDに対応付けて登録されている連絡先に関連文書を送信するようにしている。 Further, in Patent Document 2, the manager device is provided with a database in which associated contact addresses and related documents relating to failures are registered in the message ID, and when a message is sent from the agent device, it is registered in association with the message ID. I am trying to send related documents to my contacts.
特許文献1、2に記載されている技術によれば、エージェント装置から障害発生を示すメッセージが送られてきたとき、そのメッセージに関連するガイドメッセージや関連文書が自動的に提示されるので、管理者にかかる負担は軽減し、高度な専門知識も不要になる。
According to the techniques described in
しかし、特許文献1、2に記載されている技術では、提示されたガイドメッセージや関連文書を読まなければ、どのような種別の対処法を実施すれば良いのかを判断することができないため、復旧作業を開始するまでに時間がかかるという問題がある。
However, with the techniques described in
〔発明の目的〕
そこで、本発明の目的は、エージェント装置に障害が発生した場合、障害を復旧するためにどのような種別の対処法を実施したら良いのかを短時間で認識できるようにすることにより、復旧作業を開始するまでに要する時間を短縮化することにある。
(Object of invention)
Therefore, an object of the present invention is to make it possible to recognize in a short time what type of countermeasures should be implemented in order to recover from a failure when a failure occurs in an agent device. The purpose is to shorten the time required to start.
本発明にかかる第1の障害監視システムは、
エージェント装置とマネージャ装置とを備えた障害監視システムにおいて、
前記エージェント装置が、
自装置の状態を示すメッセージを前記マネージャ装置に対して送信する監視手段を備え、
前記マネージャ装置が、
障害を回復するための対処法の種別毎に定義された状態グループの状態を表示する表示装置と、
前記メッセージをそれが関連する前記状態グループに分類するための分類定義が登録された分類定義蓄積部と、
前記エージェント装置から受信したメッセージを前記分類定義に従って1以上の前記状態グループに分類する分類手段と、
前記表示装置に表示された状態グループの状態の内、前記分類手段によって前記メッセージが分類された状態グループの状態を変更する状態表示変更手段とを備えたことを特徴とする。
The first fault monitoring system according to the present invention is:
In a fault monitoring system comprising an agent device and a manager device,
The agent device is
Comprising monitoring means for transmitting a message indicating the status of the own device to the manager device;
The manager device is
A display device that displays the status of the status group defined for each type of countermeasure to recover from the failure;
A classification definition storage unit in which a classification definition for classifying the message into the state group to which the message relates is registered;
Classification means for classifying messages received from the agent device into one or more state groups according to the classification definition;
State display change means for changing the state of the state group in which the message is classified by the classification means among the states of the state group displayed on the display device is provided.
本発明にかかる第1のマネージャ装置は、
障害を回復するための対処法の種別毎に定義された状態グループの状態を表示する表示装置と、
メッセージをそれが関連する前記状態グループに分類するための分類定義が登録された分類定義蓄積部と、
エージェント装置から受信した、前記エージェント装置の状態を示すメッセージを前記分類定義に従って1以上の前記状態グループに分類する分類手段と、
前記表示装置に表示された状態グループの状態の内、前記分類手段によって前記メッセージが分類された状態グループの状態を変更する状態表示変更手段とを備えたことを特徴とする。
The first manager device according to the present invention includes:
A display device that displays the status of the status group defined for each type of countermeasure to recover from the failure;
A classification definition storage unit in which a classification definition for classifying a message into the state group to which the message is related is registered;
Classification means for classifying a message indicating the state of the agent device received from an agent device into one or more state groups according to the classification definition;
State display change means for changing the state of the state group in which the message is classified by the classification means among the states of the state group displayed on the display device is provided.
本発明にかかる第1の障害監視方法は、
障害を回復するための対処法の種別毎に定義された状態グループの状態を表示する表示装置と、メッセージをそれが関連する前記状態グループに分類するための分類定義が登録された分類定義蓄積部とを備えたコンピュータが、エージェント装置から受信した、前記エージェント装置の状態を示すメッセージを前記分類定義に従って1以上の前記状態グループに分類する分類ステップと、
前記コンピュータが、前記表示装置に表示された状態グループの状態の内、前記分類ステップによって前記メッセージが分類された状態グループの状態を変更する状態表示変更ステップとを含むことを特徴とする。
A first failure monitoring method according to the present invention includes:
A display device that displays the state of a state group defined for each type of coping method for recovering a failure, and a category definition storage unit in which a category definition for classifying a message into the state group to which the message relates is registered A step of classifying a message indicating the state of the agent device received from the agent device into one or more state groups according to the classification definition;
The computer includes a state display changing step of changing a state of the state group in which the message is classified by the classification step among the states of the state group displayed on the display device.
本発明にかかる第1のプログラムは、
障害を回復するための対処法の種別毎に定義された状態グループの状態を表示する表示装置と、メッセージをそれが関連する前記状態グループに分類するための分類定義が登録された分類定義蓄積部とを備えたコンピュータを、
エージェント装置から受信した、前記エージェント装置の状態を示すメッセージを前記分類定義に従って1以上の前記状態グループに分類する分類手段、
前記表示装置に表示された状態グループの状態の内、前記分類手段によって前記メッセージが分類された状態グループの状態を変更する状態表示変更手段として機能させる。
The first program according to the present invention is:
A display device that displays the state of a state group defined for each type of coping method for recovering a failure, and a category definition storage unit in which a category definition for classifying a message into the state group to which the message relates is registered A computer with
Classification means for classifying a message indicating the state of the agent device received from an agent device into one or more state groups according to the classification definition;
Among the states of the state group displayed on the display device, the state group is made to function as a state display changing unit that changes the state of the state group into which the message is classified by the classification unit.
本発明によれば、エージェント装置に障害が発生した場合、障害を復旧するためにどのような種別の対処法を実施したら良いのかを短時間で認識することができるので、復旧作業を開始するまでに要する時間を短縮化することができる。 According to the present invention, when a failure occurs in the agent device, it is possible to recognize in a short time what type of countermeasure should be performed to recover from the failure, so that the recovery operation is started. Can be shortened.
次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。 Next, the best mode for carrying out the present invention will be described in detail with reference to the drawings.
〔第1の実施例〕
図1は本発明にかかる障害監視システムの第1の実施例のブロック図であり、管理装置として機能するマネージャ装置1と、被監視装置として機能するエージェント装置2とから構成され、両者はインターネット等のネットワーク(図示を省略)を介して相互に接続されている。なお、図1ではエージェント装置2を1台しか図示していないが、複数台であっても構わない。
[First embodiment]
FIG. 1 is a block diagram of a first embodiment of a failure monitoring system according to the present invention, which comprises a
エージェント装置2は、自装置の状態を示すメッセージをマネージャ装置1へ送信する監視手段21を備えている。メッセージは、例えば、メッセージID、メッセージ本文およびリソースから構成される。リソースは、メッセージの発生元を示す情報であり、例えば、プログラム名、プロセス名、機器名などが設定される。
The agent device 2 includes monitoring means 21 that transmits a message indicating the state of the own device to the
マネージャ装置1は、メッセージ分類手段11と、状態表示変更手段12と、分類定義蓄積部13と、LCD等の表示装置14とを備えている。
The
分類定義蓄積部13には、エージェント装置2から送られてきたメッセージを、そのメッセージが関連する状態グループに分類するための分類定義が登録されている。状態グループとは、障害を回復するための対処法の種別毎に定義されたグループである。
In the category
図2は分類定義蓄積部13の内容例を示す図であり、分類定義として、分類条件と、その分類条件を満たすメッセージの分類先となる状態グループとが登録されている。同図の例は、メッセージID=0001のメッセージ(システムエラーの発生を示すメッセージ)は、グループ番号=T1の状態グループ(対処法の種別がシステム再起動)に分類され、メッセージID=0043のメッセージはグループ番号T2の状態グループ(対処法の種別がサブシステムA再起動)に分類されることを示している。また、メッセージID=0050のメッセージは、グループ番号=T3の状態グループ(対処法の種別がAPaの再起動)とグループ番号=T4の状態グループ(対処法の種別がAPbの再起動)との2つの状態グループに分類されることを示している。なお、図2の例では、メッセージIDによりメッセージを分類するようにしたが、メッセージ本文に含まれる文字列によりメッセージを分類するなど、他の方法を採用することもできる。例えば、分類条件「ID=0001」の代わりに、分類条件「TEXT=“システムエラー”」等を使用することもできる。なお、グループ番号「Tα」の状態グループを状態グループTαと記す場合もある。
FIG. 2 is a diagram illustrating an example of the contents of the classification
メッセージ分類手段11は、エージェント装置2から送られてきたメッセージを、分類定義蓄積部13に登録されている分類定義に従ってグループ分けする機能を有する。例えば、分類定義蓄積部13の内容が図2に示すものであり、エージェント装置2から送られてきたメッセージのメッセージIDが「0043」であれば、第2番目の分類条件「ID=0043」が満たされるので、上記メッセージはグループ番号「T2」の状態グループに分類されることになる。
The
表示装置14には、各状態グループの状態を示す状態一覧表示画面が表示される。ここで、状態グループの状態は、その状態グループに割り当てられている種別の対処法をエージェント装置2において実施することが必要になったか否かを示すものである。言い換えれば、状態グループの状態は、その状態グループに割り当てられている種別の対処法を実施しなければならない障害が、エージェント装置2において発生しているか否かを示すものである。本実施例では、状態グループの状態を「正常」、「異常」の2つの状態で表現する。状態「正常」は、状態グループに割り当てられている種別の対処法を実施することが不要なことを示し、状態「異常」は状態グループに割り当てられている種別の対処法を実施することが必要なことを示す。
On the
図3(A)は、状態一覧表示画面141の一例を示す図であり、状態グループのグループ番号に対応付けて、状態と対処法の種別とが表示されている。なお、図3(A)は、初期状態における状態一覧表示画面141を示しており、初期状態においては各状態グループの状態は全て「正常」になっている。即ち、エージェント装置2においては、障害が発生していないことを示している。 FIG. 3A is a diagram showing an example of the state list display screen 141, in which the state and the type of countermeasure are displayed in association with the group number of the state group. FIG. 3A shows the state list display screen 141 in the initial state. In the initial state, the states of all the state groups are all “normal”. That is, the agent device 2 indicates that no failure has occurred.
状態表示変更手段12は、状態一覧表示画面141に表示されている各状態グループの状態の内、メッセージ分類手段11によりメッセージの分類先にされた状態グループの状態を、「正常」から「異常」に変更する機能を有する。なお、状態グループの状態を変更する際、表示色、輝度などの表示属性も併せて変更するようにしても良い。 The status display changing means 12 changes the status of each status group displayed on the status list display screen 141 from “normal” to “abnormal” as the status of the status group that has been classified by the message classification means 11. The function to change to. When changing the state of the state group, display attributes such as display color and brightness may be changed together.
マネージャ装置1は、コンピュータにより実現可能であり、コンピュータにより実現する場合は、例えば、次のようにする。コンピュータをマネージャ装置1として機能させるためのプログラムを記録したディスク、半導体メモリ、その他の記録媒体を用意し、コンピュータに上記プログラムを読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、メッセージ分類手段11および状態表示変更手段12を実現する。
The
〔第1の実施例の動作の説明〕
次に、本実施例の動作について詳細に説明する。
[Description of Operation of First Embodiment]
Next, the operation of this embodiment will be described in detail.
エージェント装置2内の監視手段21は、自装置2の状態を示すメッセージをマネージャ装置1へ送信する。
The
マネージャ装置1内のメッセージ分類手段11は、エージェント装置2からのメッセージを受信すると(図4のステップS41がYES)、分類定義蓄積部13に登録されている分類定義に従って上記メッセージを該当する状態グループにグループ分けし、その状態グループのグループ番号を状態表示変更手段12に渡す(ステップS42)。これにより、状態表示変更手段12は、状態一覧表示画面141に表示されている各状態グループの状態の内、メッセージ分類手段11から渡されたグループ番号によって示される状態グループの状態を「正常」から「異常」に変更する(ステップS43)。
When the message classification means 11 in the
例えば、分類定義蓄積部13の内容が図2に示すものであり、エージェント装置2から送られてきたメッセージのメッセージIDが「0050」であるとすると、メッセージ分類手段11が、分類定義蓄積部13に登録されている第3番目の分類条件に従って上記メッセージをグループ番号「T3,T4」の状態グループにグループ分けし、状態表示変更手段12が、グループ番号「T3,T4」の状態グループの状態を「正常」から「異常」に変更するので、状態一覧表示画面141は、図3(A)に示すものから同図(B)に示すものに変更される。このように変更が行われることにより、管理者は、アプリケーションプログラムAPa、APbの再起動が必要となる障害がエージェント装置2において発生していることを一目で認識することができるので、障害に迅速に対応することが可能になる。また、状態グループの状態を変更する際に、表示色などの表示属性も併せて変更するようにすれば、状態が変更された状態グループをより確実且つ容易に認識することが可能になる。
For example, if the contents of the classification
〔第1の実施例の効果〕
本実施例によれば、エージェント装置2に障害が発生した場合、障害を復旧するためにどのような種別の対処法を実施したら良いのかを短時間で認識することができるので、復旧作業を開始するまでに要する時間を短縮化することができる。その理由は、障害を回復するために対処法の種別毎に定義された状態グループの状態を表示装置14に表示するようにし、メッセージ分類手段11が、エージェント装置2から送られてきたメッセージをそのメッセージに関連する状態グループに分類し、状態表示変更手段12が、表示装置14に表示されている状態グループの状態の内、メッセージ分類手段11によって分類先にされた状態グループの状態を変更するようにしているからである。
[Effect of the first embodiment]
According to the present embodiment, when a failure occurs in the agent device 2, it is possible to recognize in a short time what kind of countermeasure should be performed in order to recover the failure. The time required to do so can be shortened. The reason is that the state of the state group defined for each type of countermeasure to recover from the failure is displayed on the
〔第2の実施例〕
次に、本発明にかかる障害監視システムの第2の実施例について詳細に説明する。本実施例は、状態を「異常」に変更された状態グループに関し、その状態グループに割り当てられている種別の対処法が実施されたら、上記状態グループの状態を自動的に「正常」に戻せるようにしたことを特徴とする。更に、本実施例は、状態を「異常」に変更された状態グループに関し、その状態グループにグループ分けされたメッセージの組み合わせに基づいて、より詳細な対処法などを管理者に提示できるようにしたことを特徴とする。
[Second Embodiment]
Next, a second embodiment of the failure monitoring system according to the present invention will be described in detail. In this embodiment, with respect to a state group whose state has been changed to “abnormal”, the state of the state group can be automatically returned to “normal” when a countermeasure for the type assigned to the state group is implemented. It is characterized by that. Furthermore, in this embodiment, regarding the status group whose status has been changed to “abnormal”, it is possible to present more detailed countermeasures and the like to the administrator based on the combination of messages grouped into the status group. It is characterized by that.
〔第2の実施例の構成の説明〕
図5は本発明にかかる障害監視システムの第2の実施例の構成例を示すブロック図であり、管理装置として機能するマネージャ装置3と、被監視装置として機能するエージェント装置4とから構成され、両者はインターネットなどのネットワーク(図示を省略)を介して相互に接続されている。
[Description of Configuration of Second Embodiment]
FIG. 5 is a block diagram showing a configuration example of the second embodiment of the failure monitoring system according to the present invention, which is composed of a manager device 3 functioning as a management device and an agent device 4 functioning as a monitored device, Both are connected to each other via a network such as the Internet (not shown).
エージェント装置4は、監視手段41と、制御手段42とを備えている。監視手段41は、第1の実施例における監視手段21と同様の機能を有する。制御手段42は、マネージャ装置3から送られてきた対処法に応じたコマンドを実行する機能を有する。
The agent device 4 includes a
マネージャ装置3は、メッセージ収集手段301と、メッセージ分類手段302と、ナレッジ情報蓄積部303と、状態表示変更手段304と、対処履歴表示手段305と、ナレッジ情報登録手段306と、コマンド送信手段307と、メッセージ蓄積部308と、分類定義蓄積部309と、状態テーブル310と、LCD等の表示装置311と、キーボード等の入力装置312とを備えている。
The manager device 3 includes a
メッセージ収集手段301は、エージェント装置4から送られてきたメッセージに現在時刻を付加してメッセージ蓄積部308に登録する機能や、エージェント装置4から送られてきたメッセージをメッセージ分類手段302に渡す機能を有する。
The
分類定義蓄積部309には、メッセージを、それが関連する状態グループに分類するための分類定義が登録されると共に、分類先の状態グループの状態を「正常」にするのか「異常」にするのかを示す情報が登録されている。分類されるメッセージが障害メッセージ(障害が発生したことを示すメッセージ)である場合には、分類先の状態グループの状態を「異常」にすることを示す情報が登録され、分類されるメッセージが回復メッセージ(障害回復のための処置がとられたことを示すメッセージ)である場合には、分類先の状態グループの状態を「正常」にすることを示す情報が登録されている。
In the category
図6は、分類定義蓄積部309の内容例を示す図であり、分類定義番号に対応付けて、分類条件と、分類条件を満たすメッセージの分類先にする状態グループのグループ番号と、分類先の状態グループの状態とが登録されている。なお、分類定義は、分類条件とグループ番号とから構成される。
FIG. 6 is a diagram illustrating an example of the contents of the classification
図6の例えば分類定義番号B1に対応する情報は、メッセージIDが「0001」のメッセージ(システムエラーの発生を示す障害メッセージ)は、グループ番号「T1」の状態グループT1に分類され、上記メッセージが送られてきたときは状態グループT1の状態を「異常」に変更することを示している。また、分類定義番号B2に対応する情報は、メッセージIDが「0002」のメッセージ(障害回復のための処置がとられたことによりシステム処理が再開されたことを示す回復メッセージ)は、グループ番号「T1,T2,T3,T4」の状態グループに分類され、上記メッセージが送られてきたときは状態グループT1,T2,T3,T4の状態を「正常」に変更することを示している。なお、図6の例では、メッセージIDによりメッセージを分類するようにしたが、メッセージに含まれる文字列により分類するなど、他の方法を採用することもできる。 For example, the information corresponding to the classification definition number B1 in FIG. 6 is that the message with the message ID “0001” (failure message indicating the occurrence of the system error) is classified into the state group T1 with the group number “T1”. When sent, it indicates that the state of the state group T1 is changed to “abnormal”. The information corresponding to the classification definition number B2 includes a message with a message ID “0002” (a recovery message indicating that the system processing has been resumed due to the action taken for failure recovery), and the group number “ When the message is sent to the state group of “T1, T2, T3, T4”, it indicates that the state of the state group T1, T2, T3, T4 is changed to “normal”. In the example of FIG. 6, the messages are classified based on the message ID, but other methods such as classification based on the character strings included in the message may be employed.
メッセージ分類手段302は、メッセージ収集手段301から渡されたメッセージの分類先にする状態グループを分類定義蓄積部309に登録されている分類定義に従って決定すると共に、上記メッセージの分類先の状態グループの状態を分類定義蓄積部309から取得し、上記メッセージのメッセージIDと、分類先に決定した状態グループのグループ番号と、分類先にした状態グループの状態と、分類先を決定する際に使用した分類定義の分類定義番号とを状態表示変更手段304に渡す機能を有する。
The
図7は、状態グループとメッセージとの対応関係を示した図であり、各メッセージは、矢印で結ばれている状態グループに分類される。同図に示すように、メッセージの中には複数の状態グループに分類されるものもある。また、同図には示していないが、どの状態グループにも分類されないメッセージも存在する。なお、同図の左側に示した各メッセージは、分類先の状態を「異常」にする障害メッセージであり、右側に示した各メッセージは、分類先の状態を「正常」にする回復メッセージである。 FIG. 7 is a diagram showing the correspondence between state groups and messages, and each message is classified into state groups connected by arrows. As shown in the figure, some messages are classified into a plurality of state groups. Although not shown in the figure, there are messages that are not classified into any state group. Each message shown on the left side of the figure is a failure message that sets the classification destination state to "abnormal", and each message shown on the right side is a recovery message that sets the classification destination state to "normal". .
状態テーブル310には、状態グループ毎に、その状態グループに割り当てられている対処法をエージェント装置4において実施しなければならないか否かを示す状態と、その状態グループに分類されたメッセージのメッセージIDと、メッセージをその状態グループに分類する際に使用した分類定義の分類定義番号とが登録される。 In the state table 310, for each state group, a state indicating whether or not the agent apparatus 4 must implement a countermeasure assigned to the state group, and a message ID of a message classified into the state group And the classification definition number of the classification definition used when classifying the message into the state group are registered.
図8は状態テーブル310の内容例を示した図であり、状態グループのグループ番号に対応付けて、状態グループの状態と、メッセージIDと、分類定義番号とが登録されている。図8の例えば第1行目は、グループ番号「T1」の状態グループに割り当てられている対処法をエージェント装置4において実施する必要がないことを示している。また、例えば、第4行目は、グループ番号「T4」の状態グループに割り当てられている対処法をエージェント装置4において実施することが必要なことを示している。更に、状態グループT4にはメッセージID「0050」のメッセージが分類され、そのメッセージを分類する際に使用した分類定義の分類定義番号が「B4」であることを示している。 FIG. 8 is a diagram showing an example of the contents of the state table 310, in which the state group state, message ID, and classification definition number are registered in association with the group number of the state group. For example, the first line in FIG. 8 indicates that the agent apparatus 4 does not need to implement the countermeasure assigned to the state group with the group number “T1”. Further, for example, the fourth line indicates that the agent apparatus 4 needs to implement the countermeasure assigned to the state group with the group number “T4”. Further, it is indicated that the message with the message ID “0050” is classified into the state group T4, and the classification definition number of the classification definition used when classifying the message is “B4”.
表示装置311には、図9に示すように、状態表示変更手段304によって状態一覧表示画面311aが表示されると共に、対処履歴表示手段305によって対処履歴表示画面311bが表示される。
As shown in FIG. 9, on the
状態表示変更手段304は、次のような機能を有する。
The status
・状態テーブル310の内容を状態一覧表示画面311aに表示する機能。
・状態テーブル310の内容をメッセージ分類手段302から渡されたグループ番号、状態グループの状態、メッセージIDおよび分類定義番号に従って変更する機能。より具体的には、メッセージ分類手段302から渡された状態グループの状態が「正常」の場合には、それと一緒に渡されたグループ番号と対応付けて登録されている状態グループの状態を「正常」に変更すると共に、上記グループ番号に対応付けて登録されているメッセージIDおよび分類定義番号を削除する。また、メッセージ分類手段302から渡された状態グループの状態が「異常」の場合には、それと一緒に渡されたグループ番号に対応付けて登録されている状態グループの状態を「異常」に変更すると共に、一緒に渡されたメッセージIDおよび分類定義番号を状態テーブル310に追加登録する。
・状態が「異常」になっている状態グループのグループ番号およびその状態グループに分類されているメッセージのメッセージIDを対処履歴表示手段305に渡す機能。
A function for displaying the contents of the status table 310 on the status
A function of changing the contents of the state table 310 according to the group number, the state group state, the message ID, and the classification definition number passed from the
A function of passing the group number of the state group in which the state is “abnormal” and the message ID of the message classified into the state group to the handling
ナレッジ情報蓄積部303には、過去に発生した障害に対して管理者が実施した具体的な対処法などを示す管理者のコメントと、管理者が上記障害に対して付与した障害名称とが、上記障害の発生時にメッセージが分類された状態グループと、その状態グループに分類されたメッセージの組とに紐付けされて登録されている。
In the knowledge
図10は、ナレッジ情報蓄積部303の内容例を示す図であり、グループ番号とメッセージIDとの組み合わせに対応付けて、障害名称とコメントとが登録されている。同図の例の第1番目のコメントは、過去にグループ番号「T20」の状態グループに、メッセージID「6012」「6023」「6005」のメッセージが分類されるという障害が発生したときに管理者が実施した具体的な対処法などを示している。また、同図の例の第2番目のコメントは、過去にグループ番号「T30」の状態グループに、メッセージID「9056」「14002」「5011」のメッセージが分類されるという障害が発生したときに管理者が実施した具体的な対処法などを示している。
FIG. 10 is a diagram illustrating an example of the contents of the knowledge
対処履歴表示手段305は、状態表示変更手段304から渡された状態グループのグループ番号とメッセージIDとの組み合わせに対応付けて登録されているコメントおよび障害名称をナレッジ情報蓄積部303から検索して対処履歴表示画面311bに表示すると共に、上記メッセージIDに対応するメッセージをメッセージ蓄積部308から検索して対処履歴表示画面311bに表示する機能を有する。
The response
ナレッジ情報登録手段306は、管理者によって入力装置312から入力されたコメントおよび障害名称を、管理者によって入力装置312から入力されたグループ番号とメッセージIDとの組み合わせに対応付けてナレッジ情報蓄積部303に登録する機能を有する。
The knowledge
コマンド送信手段307は、管理者がエージェント装置4の障害を回復するために、入力装置312から入力したコマンドをエージェント装置4へ送信する機能を有する。
The
なお、マネージャ装置3はコンピュータにより実現可能であり、コンピュータによって実現する場合は、例えば、次のようにする。コンピュータをマネージャ装置3として機能させるプログラムを記録したディスク、半導体メモリ、その他の記録媒体を用意し、コンピュータに上記プログラムを読み取らせる。コンピュータは、読み取ったプログラムに従って自身の動作を制御することにより、自コンピュータ上に、メッセージ収集手段301、メッセージ分類手段302、状態表示変更手段304、対処履歴表示手段305、ナレッジ情報登録手段306、およびコマンド送信手段307を実現する。
The manager device 3 can be realized by a computer. When the manager device 3 is realized by a computer, for example, the following is performed. A disk, a semiconductor memory, and other recording media recording a program that causes the computer to function as the manager device 3 are prepared, and the computer reads the program. The computer controls its own operation according to the read program, so that a
〔第2の実施例の動作の説明〕
次に、本実施例の動作について詳細に説明する。
[Description of Operation of Second Embodiment]
Next, the operation of this embodiment will be described in detail.
今、エージェント装置4内の監視手段41が図11(A)に示すメッセージa1〜a5を順次マネージャ装置3に送信したとする。なお、メッセージa1〜a4は障害メッセージに分類され、メッセージa5は回復メッセージに分類されるものである。
Now, it is assumed that the
マネージャ装置3内のメッセージ収集手段301は、メッセージa1を受信すると(図12のステップS1201がYES)、それに現在時刻を付加してメッセージ蓄積部308に登録すると共に、メッセージa1をメッセージ分類手段302に渡す(ステップS1202)。
When the
これにより、メッセージ分類手段302は、分類定義蓄積部309に登録されている分類定義に従ってメッセージa1の分類先にする状態グループを決定し、更に、分類定義蓄積部309からメッセージの分類先の状態グループの状態を取得する(ステップS1203、S1204)。その後、メッセージ分類手段302は、メッセージa1のメッセージID「6012」と、分類先にした状態グループのグループ番号(例えば、「T20」とする)と、メッセージの分類先の状態グループT20の状態(例えば「異常」とする)と、分類先を決定する際に使用した分類定義の分類定義番号(例えば「B10」とする)とを状態表示変更手段304に対して出力する(ステップS1205)。
As a result, the
これにより、状態表示変更手段304は、メッセージ分類手段302から渡された各情報に従って状態テーブル310の内容を更新する(ステップS1206)。具体的には、図13(A)に示すように、グループ番号「T20」に対応付けて登録されている状態グループの状態を「異常」に変更すると共に、グループ番号「T20」に対応付けてメッセージID「6012」および分類定義番号「B10」を追加登録する。 As a result, the status display changing means 304 updates the contents of the status table 310 according to each information passed from the message classification means 302 (step S1206). Specifically, as shown in FIG. 13A, the state of the state group registered in association with the group number “T20” is changed to “abnormal” and is associated with the group number “T20”. The message ID “6012” and the classification definition number “B10” are additionally registered.
その後、状態表示変更手段304は、状態一覧表示画面311aの表示内容を、更新後の状態テーブル310の内容を示すものに変更する(ステップS1207)。これにより、グループ番号「T20」に対応付けて表示されている状態グループT20の状態が「異常」に変更されるので、管理者は、状態グループT20に割り当てられている対処法をエージェント装置4において実施しなければならないと直ちに認識することができる。なお、状態グループの状態を変更する際、第1の実施例と同様に、表示色などの表示属性を併せて変更するようにしても良い。更に、ステップS1207においては、状態を変更した状態グループのグループ番号「T20」およびその状態グループT20に分類されているメッセージのメッセージID「6012」を対処履歴表示手段305に渡す処理も行う。
Thereafter, the status
これにより、対処履歴表示手段305は、図14に示す対処履歴表示処理を行う(ステップS1208)。先ず、対処履歴表示手段305は、状態表示変更手段304から渡されたグループ番号「T20」およびメッセージID「6012」をキーにしてナレッジ情報蓄積部303を検索する(図14のステップS1401)。そして、上記キーに対応付けて登録されているコメント及び障害名称が存在する場合(ステップS1402がYES)は、上記コメント及び障害名称と、メッセージID「6012」のメッセージとを対処履歴表示画面311bに表示する(ステップS1403)。なお、メッセージはメッセージ蓄積部308から入力して表示する。これに対して、該当する情報が登録されていない場合(ステップS1402がNO)は、処理を終了する。今、例えば、ナレッジ情報蓄積部303の内容が図10に示すものであり、グループ番号「T20」に関しては、メッセージID「6012、6023、6005」に対応する情報しか登録されていないとすると、ステップS1402の判断結果がNOとなり、対処履歴表示画面311bに対する表示は行われない。
Thereby, the handling
その後、図11に示すメッセージa2を受信した場合も、メッセージa1を受信した場合と同様の処理が行われる。 Thereafter, when the message a2 shown in FIG. 11 is received, the same processing as when the message a1 is received is performed.
更に、メッセージa3を受信した場合には(ステップS1201がYES)は、ステップS1202〜S1206において、メッセージa1、a2を受信した場合と同様の処理が行われる。この結果、状態テーブル310の内容は、図13(B)に示すものになる。 Further, when the message a3 is received (step S1201 is YES), the same processing as when the messages a1 and a2 are received is performed in steps S1202 to S1206. As a result, the contents of the status table 310 are as shown in FIG.
その後、状態表示変更手段304は、状態一覧表示画面311aの表示内容を更新後の状態テーブル310の内容を示すものに変更し、更に、状態を変更した状態グループのグループ番号「T20」およびその状態グループに分類されているメッセージのメッセージID「6012、6023、6005」を対処履歴表示手段305に渡す(ステップS1207)。管理者は、状態一覧表示画面311aの表示内容に基づいて、状態グループT20にメッセージID「6012、6023、6005」のメッセージが分類されていることを認識することができる。即ち、メッセージID「6012、6023、6005」のメッセージは、関連するメッセージであることを認識することができる。
Thereafter, the status
対処履歴表示手段305は、グループ番号およびメッセージIDが渡されると、図14に示す対処履歴表示処理を行う(ステップS1208)。対処履歴表示手段305は、先ず、状態表示変更手段304から渡されたグループ番号「T20」及びメッセージID「6012、6023、6005」をキーにしてナレッジ情報蓄積部303を検索する(ステップS1401)。この場合、図10に示すように、ナレッジ情報蓄積部303には、グループ番号「T20」及びメッセージID「6012、6023、6005」に対応付けて障害名称「外部要因によるプロセスP1停止」及びコメント「2005/12/10 16:55 管理者X プロセスP1がオペレーションミス等の…」が登録されているので、図15に示すように、対処履歴表示画面311bに、障害名称、メッセージIDが「6012、6023、6005」のメッセージ及びコメントが表示される。
When the group number and the message ID are passed, the handling
管理者は、対処履歴表示画面311bに表示された、過去に管理者が入力したコメントに基づいて、具体的な対処法を認識すると、例えば、入力装置312からコマンド送信手段307に対して、アプリケーションプログラムA1を再起動させるためのコマンドを入力する。このコマンドは、エージェント装置4に送られ、エージェント装置4内の制御手段42は、上記コマンドに従ってアプリケーションプログラムA1を再起動する。
When the administrator recognizes a specific countermeasure based on a comment input by the administrator in the past displayed on the countermeasure
アプリケーションプログラムA1が再起動されることにより、エージェント装置4内の監視手段41は、図11(A)に示すメッセージa4、a5を順次マネージャ装置3に対して送信する。なお、分類定義蓄積部309には、メッセージa4のメッセージID「6002」が分類条件として登録されており、その分類先の状態グループのグループ番号、状態としてそれぞれ「T20」「異常」が登録されているとする。また、分類定義蓄積部309には、メッセージa5のメッセージID「6001」が分類条件として登録されており、その分類先のグループ番号、状態としてそれぞれ「T20」「正常」が登録されているとする。
When the application program A1 is restarted, the
マネージャ装置3は、メッセージa4を受信した場合は、メッセージa1、a2を受信した場合と同様の処理を行う(図12のステップS1201〜S1208)。メッセージa5を受信した場合は、図12のステップS1204で取得する状態グループの状態が「正常」となるので、ステップS1206では、グループ番号「T20」に対応付けて状態テーブル310に登録されている状態情報を「正常」に変更する処理を行うと共に、グループ番号「T20」に対応付けて登録されているメッセージID及び分類定義番号を削除する処理(消し込み処理)を行う。このように、メッセージa5が発生した場合、自動的に状態グループの状態を「正常」にすると共に、メッセージID及び分類定義番号を消し込むようにしているので、或る管理者がアプリケーションプログラムA1の再起動という対処を行った後、他の管理者が再び同様の対処を行うことがなくなる。 When the manager device 3 receives the message a4, the manager device 3 performs the same processing as when the messages a1 and a2 are received (steps S1201 to S1208 in FIG. 12). When the message a5 is received, the state of the state group acquired in step S1204 in FIG. 12 is “normal”. Therefore, in step S1206, the state registered in the state table 310 in association with the group number “T20”. A process of changing the information to “normal” is performed, and a process of deleting the message ID and the classification definition number registered in association with the group number “T20” (an erase process) is performed. As described above, when the message a5 occurs, the state of the state group is automatically set to “normal” and the message ID and the classification definition number are deleted, so that a certain administrator restarts the application program A1. After the above action is taken, other managers will not take the same action again.
管理者はエージェント装置4の状態が正常になったことを確認すると、必要に応じて、今回行った対処法やログから判明した障害原因などをコメントとしてナレッジ情報蓄積部303に登録する。
Upon confirming that the state of the agent device 4 is normal, the administrator registers the current countermeasure and the cause of failure found from the log as a comment in the knowledge
ナレッジ情報蓄積部303にコメントを登録する場合には、管理者は、入力装置312を用いてナレッジ情報登録手段306を起動する。これにより、ナレッジ情報登録手段306は、図16に示すようなコメント登録画面161を表示する。コメント登録画面161には、グループ番号の入力欄162と、メッセージIDの入力欄163と、障害名称の入力欄164と、コメントの入力欄165と、登録ボタン166が設けられている。
When registering a comment in the knowledge
今、例えば、管理者が状況によってはメッセージa1、a2だけが発生し、メッセージa3が発生しない場合もあると判断したとする。即ち、グループ番号「T20」の状態グループにメッセージa1、a2、a3が分類された時点ではなく、上記状態グループにメッセージa1、a2が分類された時点で、対処履歴表示画面311bにコメントを表示させる必要があると判断したとする。この場合、管理者は、グループ番号の入力欄162に「T20」を、メッセージIDの入力欄163にメッセージa1、a2のメッセージID「6012、6023」を、障害名称の入力欄164に「外部要因によるプロセスP1停止」、コメントの入力欄165にコメントを入力した後、登録ボタン166を操作する。これにより、ナレッジ情報登録手段306は、ナレッジ情報蓄積部303に管理者によって入力された各情報を対応付けて登録する。
Now, for example, it is assumed that, depending on the situation, the administrator determines that only the messages a1 and a2 are generated and the message a3 is not generated. That is, the comment is displayed on the response
次に、エージェント装置4内の監視手段41から図11(B)に示すメッセージb1〜b4がエージェント装置3に対して送信された場合の動作について説明する。なお、分類定義蓄積部309には、メッセージb1〜b4をグループ番号「T30」の状態グループに分類するための分類定義が登録され、メッセージb1〜b3の発生時には、上記状態グループの状態を「異常」に、メッセージb4の発生時には、上記状態グループの状態を「正常」にする情報が登録されているとする。また、ナレッジ情報蓄積部303には、図10に示すように、グループ番号「T30」に関しては、メッセージID「9056、14002、5011」に関する情報しか登録されていないとする。
Next, an operation when the messages b1 to b4 shown in FIG. 11B are transmitted from the
マネージャ装置3は、メッセージb1を受信すると(図12のステップS1201がYES)、メッセージa1を受信した場合と同様の処理を行う(ステップS1202〜1208)。但し、メッセージb1は、グループ番号「T30」の状態グループに分類されるものであるので、状態一覧表示画面311aに表示されている各状態グループの状態情報の内、グループ番号「T30」に対応するものだけが「異常」に変更される(ステップS1207)。
When manager device 3 receives message b1 (YES in step S1201 in FIG. 12), manager device 3 performs the same processing as when message a1 is received (steps S1202 to 1208). However, since the message b1 is classified into the state group of the group number “T30”, the message b1 corresponds to the group number “T30” among the state information of each state group displayed on the state
メッセージb2を受信した場合は、マネージャ装置3はメッセージb1を受信した場合と同様の処理を行う。メッセージb3を受信した場合は、ステップS1202〜S1207では、メッセージb1、b2を受信した場合と同様の処理を行い、ステップS1208では、図17に示すような、障害名称、イベント発生状況、コメントを対処履歴表示画面311bに表示する。
When the message b2 is received, the manager device 3 performs the same process as when the message b1 is received. When the message b3 is received, in steps S1202 to S1207, the same processing as when the messages b1 and b2 are received is performed, and in step S1208, the failure name, event occurrence status, and comment are dealt with as shown in FIG. It is displayed on the
この表示を見て管理者は、OSを再起動させるためのコマンドをエージェント装置4へ送信する。エージェント装置4内の制御手段42は、マネージャ装置3から送られてきたコマンドに従ってOSを起動し、これにより、監視手段41は、メッセージb4をマネージャ装置3へ送信する。 The administrator sees this display and transmits a command for restarting the OS to the agent device 4. The control means 42 in the agent device 4 activates the OS according to the command sent from the manager device 3, whereby the monitoring means 41 transmits the message b 4 to the manager device 3.
マネージャ装置3では、メッセージb4が送られてくると、メッセージa5が送られてきた場合と同様の処理(消し込み処理)を行う。 When the message b4 is sent, the manager device 3 performs the same processing (erasing process) as when the message a5 is sent.
その後、管理者は、エージェント装置4の状態が正常になったことを確認すると、必要に応じてコメント等をナレッジ情報登録手段306によりナレッジ情報蓄積部303に登録する。
Thereafter, when the administrator confirms that the state of the agent device 4 is normal, the administrator registers a comment or the like in the knowledge
次に、エージェント装置4内の監視手段41から図11(C)に示すメッセージc1〜c3が順次送られてきた場合の動作を説明する。なお、分類定義蓄積部309には、メッセージc1〜c3をグループ番号「T40」の状態グループに分類するための分類定義が登録され、メッセージc1〜c3発生時には、上記状態グループの状態を「異常」にするための情報が登録されているとする。また、ナレッジ情報蓄積部303には、グループ番号「T40」に関する情報は全く登録されていないとする。また、グループ番号「T40」の状態グループは、自動消し込みを行わない状態グループであるとする。
Next, an operation when the messages c1 to c3 shown in FIG. 11C are sequentially sent from the
マネージャ装置3は、メッセージc1を受信すると、メッセージa1を受信した場合と同様の処理を行う(図12のステップS1202〜S1208)。但し、メッセージc1はグループ番号「T40」の状態グループに分類されるものであるので、状態一覧表示画面311aに表示されている状態グループの状態の内、グループ番号「T40」に対応するものだけが「異常」に変更される(ステップS1207)。マネージャ装置3は、メッセージc2、c3を受信した場合もメッセージc1を受信した場合と同様の処理を行う。
When manager device 3 receives message c1, manager device 3 performs the same processing as when message a1 is received (steps S1202 to S1208 in FIG. 12). However, since the message c1 is classified into the state group with the group number “T40”, only the state corresponding to the group number “T40” among the states of the state group displayed on the state
マネージャ情報蓄積部303には、グループ番号「T40」に関する情報は全く登録されていないので、メッセージc1〜c3を受信しても、対処履歴表示画面311bには、何の表示も行われない。
Since no information related to the group number “T40” is registered in the manager
その後、管理者が調査を行い、ホストH2、H3、H4が接続されているスイッチが故障していることが判明したとする。管理者はスイッチを交換し、障害が復旧したことを確認すると、状態テーブル310に登録されている状態情報の内、グループ番号「T40」に対応付けて登録されている状態情報を手動で「正常」に変更すると共に、グループ番号「T40」に対応付けて登録されているメッセージID及び分類定義番号を削除する。その後、管理者は、ナレッジ情報登録手段306を用いて、「ホストH2、H3、H4に障害が発生した際には、これらに共通するスイッチを確かめるべき」とのコメントを、グループ番号「T40」及びメッセージc1〜c3のメッセージ識別子「4004、4005、4006」に対応付けてナレッジ情報蓄積部303に登録する。
Thereafter, it is assumed that the administrator conducts an investigation and finds that the switch to which the hosts H2, H3, and H4 are connected has failed. When the administrator replaces the switch and confirms that the failure has been recovered, the status information registered in association with the group number “T40” in the status information registered in the status table 310 is manually set to “normal”. And the message ID and classification definition number registered in association with the group number “T40” are deleted. Thereafter, the administrator uses the knowledge information registration means 306 to comment that “when a failure occurs in the hosts H2, H3, and H4, check the switches common to these hosts” with the group number “T40”. And registered in the knowledge
〔第2の実施例の効果〕
本実施例によれば、第1の実施例で得られる効果に加え、次のような効果を得ることができる。
[Effect of the second embodiment]
According to the present embodiment, in addition to the effects obtained in the first embodiment, the following effects can be obtained.
本実施例は、メッセージ分類手段302で分類したメッセージが回復メッセージである場合には、メッセージの分類先の状態を「正常」に戻すようにしているので、或る管理者が障害回復のための処置をとった後、他の管理者が再び障害回復のための処置を行うということがなくなる。 In this embodiment, when the message classified by the message classification means 302 is a recovery message, the state of the message classification destination is returned to “normal”, so that a certain administrator can recover the failure. After taking the action, other managers will not take another action to recover from the failure.
また、本実施例は、状態グループとメッセージとの組み合わせに対応付けて具体的な対処法などを示すコメントが登録されたナレッジ情報蓄積部303と、メッセージ分類手段302によってメッセージが分類された状態グループとその状態グループに分類されたメッセージとの組み合わせに対応付けて登録されているコメントをナレッジ情報蓄積部303から検索し、検索したコメントを表示装置311に表示する対処履歴表示手段306とを備えているので、今回発生した障害に対する適切なコメントを管理者に提示することが可能になる。
Also, in this embodiment, the knowledge
マネージャ装置がネットワークを介してエージェント装置の状態を管理する障害監視システムに適用すると好適である。 The present invention is preferably applied to a failure monitoring system in which a manager device manages the state of an agent device via a network.
1…マネージャ装置
11…メッセージ分類手段
12…状態表示変更手段
13…分類定義蓄積部
14…表示装置
2…エージェント装置
21…監視手段
3…マネージャ装置
301…メッセージ収集手段
302…メッセージ分類手段
303…ナレッジ情報蓄積部
304…状態表示変更手段
305…対処履歴表示手段
306…ナレッジ情報登録手段
307…コマンド送信手段
308…メッセージ蓄積部
309…分類定義蓄積部
310…状態テーブル
311…表示装置
312…入力装置
4…エージェント装置
41…監視手段
42…制御手段
DESCRIPTION OF
Claims (28)
前記エージェント装置が、
自装置の状態を示すメッセージを前記マネージャ装置に対して送信する監視手段を備え、
前記マネージャ装置が、
障害を回復するための対処法の種別毎に定義された状態グループの状態を表示する表示装置と、
前記メッセージをそれが関連する前記状態グループに分類するための分類定義が登録された分類定義蓄積部と、
前記エージェント装置から受信したメッセージを前記分類定義に従って1以上の前記状態グループに分類する分類手段と、
前記表示装置に表示された状態グループの状態の内、前記分類手段によって前記メッセージが分類された状態グループの状態を変更する状態表示変更手段とを備えたことを特徴とする障害監視システム。 In a fault monitoring system comprising an agent device and a manager device,
The agent device is
Comprising monitoring means for transmitting a message indicating the status of the own device to the manager device;
The manager device is
A display device that displays the status of the status group defined for each type of countermeasure to recover from the failure;
A classification definition storage unit in which a classification definition for classifying the message into the state group to which the message relates is registered;
Classification means for classifying messages received from the agent device into one or more state groups according to the classification definition;
A fault monitoring system comprising: a state display changing unit that changes a state of the state group in which the message is classified by the classification unit among the states of the state group displayed on the display device.
前記状態表示変更手段は、前記メッセージが障害の発生を示す障害メッセージである場合は、前記分類手段によって前記メッセージが分類された状態グループの状態を、その状態グループに割り当てられている種別の対処法を実施することが必要な障害が発生したことを示すものに変更することを特徴とする障害監視システム。 The failure monitoring system according to claim 1,
If the message is a failure message indicating the occurrence of a failure, the state display change unit may change the state of the state group into which the message is classified by the classification unit to the type assigned to the state group. The fault monitoring system is characterized in that it is changed to one that indicates that a fault that needs to be implemented has occurred.
前記状態表示変更手段は、前記メッセージが障害回復のための処置がとられたことを示す回復メッセージである場合は、前記分類手段によって前記メッセージが分類された状態グループの状態を、障害が回復したことを示すものに変更することを特徴とする障害監視システム。 The failure monitoring system according to claim 1 or 2,
When the message is a recovery message indicating that a measure for recovery from a failure has been taken, the status display change unit has recovered the status of the status group into which the message has been classified by the classification unit. A fault monitoring system characterized by changing to one that indicates
前記状態表示変更手段は、前記分類手段によって分類された前記メッセージを示す情報と、前記メッセージの分類先となった状態グループを示す情報とを前記表示装置に表示することを特徴とする障害監視システム。 The failure monitoring system according to any one of claims 1 to 3,
The status display changing means displays on the display device information indicating the message classified by the classification means and information indicating a status group to which the message is classified. .
状態グループとメッセージとの組み合わせに対応付けてコメントが登録されたナレッジ情報蓄積部と、
前記分類手段によって前記メッセージが分類された状態グループとその状態グループに分類されたメッセージとの組み合わせに対応付けて登録されているコメントを前記ナレッジ情報蓄積部から検索し、該検索したコメントを前記表示装置に表示する対処履歴表示手段とを備えたことを特徴とする障害監視システム。 The failure monitoring system according to any one of claims 1 to 4,
A knowledge information storage unit in which comments are registered in association with combinations of state groups and messages;
A comment registered in association with a combination of a state group in which the message is classified by the classification unit and a message classified in the state group is searched from the knowledge information storage unit, and the searched comment is displayed in the display. A fault monitoring system comprising a handling history display means for displaying on a device.
管理者によって入力されたコメントを、前記管理者によって指定された状態グループとメッセージとの組み合わせに対応付けて前記ナレッジ情報蓄積部に登録するナレッジ情報登録手段を備えたことを特徴とする障害監視システム。 The fault monitoring system according to claim 5, wherein
A failure monitoring system comprising knowledge information registration means for registering a comment input by an administrator in the knowledge information storage unit in association with a combination of a state group and a message specified by the administrator .
前記状態表示変更手段は、状態グループの状態を変更する際、その表示属性を変更することを特徴とする障害監視システム。 The failure monitoring system according to any one of claims 1 to 6,
The state display changing means changes the display attribute when changing the state of the state group.
メッセージをそれが関連する前記状態グループに分類するための分類定義が登録された分類定義蓄積部と、
エージェント装置から受信した、前記エージェント装置の状態を示すメッセージを前記分類定義に従って1以上の前記状態グループに分類する分類手段と、
前記表示装置に表示された状態グループの状態の内、前記分類手段によって前記メッセージが分類された状態グループの状態を変更する状態表示変更手段とを備えたことを特徴とするマネージャ装置。 A display device that displays the status of the status group defined for each type of countermeasure to recover from the failure;
A classification definition storage unit in which a classification definition for classifying a message into the state group to which the message is related is registered;
Classification means for classifying a message indicating the state of the agent device received from an agent device into one or more state groups according to the classification definition;
A manager device comprising: a state display changing unit that changes a state of the state group in which the message is classified by the classification unit among the states of the state group displayed on the display device.
前記状態表示変更手段は、前記メッセージが障害の発生を示す障害メッセージである場合は、前記分類手段によって前記メッセージが分類された状態グループの状態を、その状態グループに割り当てられている種別の対処法を実施することが必要な障害が発生したことを示すものに変更することを特徴とするマネージャ装置。 The manager device according to claim 8, wherein
If the message is a failure message indicating the occurrence of a failure, the state display change unit may change the state of the state group into which the message is classified by the classification unit to the type assigned to the state group. The manager device is characterized in that it is changed to one indicating that a failure requiring execution has occurred.
前記状態表示変更手段は、前記メッセージが障害回復のための処置がとられたことを示す回復メッセージである場合は、前記分類手段によって前記メッセージが分類された状態グループの状態を、障害が回復したことを示すものに変更することを特徴とするマネージャ装置。 The manager device according to claim 8 or 9,
When the message is a recovery message indicating that a measure for recovery from a failure has been taken, the status display change unit has recovered the status of the status group into which the message has been classified by the classification unit. A manager device characterized in that the manager device is changed to one indicating the above.
前記状態表示変更手段は、前記分類手段によって分類された前記メッセージを示す情報と、前記メッセージの分類先となった状態グループを示す情報とを前記表示装置に表示することを特徴とするマネージャ装置。 The manager device according to any one of claims 8 to 10,
The manager device characterized in that the status display change means displays information indicating the message classified by the classification means and information indicating a status group to which the message is classified on the display device.
状態グループとメッセージとの組み合わせに対応付けてコメントが登録されたナレッジ情報蓄積部と、
前記分類手段によって前記メッセージが分類された状態グループとその状態グループに分類されたメッセージとの組み合わせに対応付けて登録されているコメントを前記ナレッジ情報蓄積部から検索し、該検索したコメントを前記表示装置に表示する対処履歴表示手段とを備えたことを特徴とするマネージャ装置。 The manager device according to any one of claims 8 to 11,
A knowledge information storage unit in which comments are registered in association with combinations of state groups and messages;
A comment registered in association with a combination of a state group in which the message is classified by the classification unit and a message classified in the state group is searched from the knowledge information storage unit, and the searched comment is displayed in the display. A manager device comprising a handling history display means for displaying on the device.
管理者によって入力されたコメントを、前記管理者によって指定された状態グループとメッセージとの組み合わせに対応付けて前記ナレッジ情報蓄積部に登録するナレッジ情報登録手段を備えたことを特徴とするマネージャ装置。 The manager device according to claim 12, wherein
A manager device comprising knowledge information registration means for registering a comment input by an administrator in the knowledge information storage unit in association with a combination of a state group and a message specified by the administrator.
前記状態表示変更手段は、状態グループの状態を変更する際、その表示属性を変更することを特徴とするマネージャ装置。 The manager device according to any one of claims 8 to 13,
The manager device characterized in that the state display changing means changes the display attribute when changing the state of the state group.
前記コンピュータが、前記表示装置に表示された状態グループの状態の内、前記分類ステップによって前記メッセージが分類された状態グループの状態を変更する状態表示変更ステップとを含むことを特徴とする障害監視方法。 A display device that displays the state of a state group defined for each type of coping method for recovering a failure, and a category definition storage unit in which a category definition for classifying a message into the state group to which the message relates is registered A step of classifying a message indicating the state of the agent device received from the agent device into one or more state groups according to the classification definition;
A fault monitoring method comprising: a state display changing step in which the computer changes a state of a state group in which the message is classified by the classification step among states of the state group displayed on the display device. .
前記状態表示変更ステップでは、前記メッセージが障害の発生を示す障害メッセージである場合は、前記分類ステップによって前記メッセージが分類された状態グループの状態を、その状態グループに割り当てられている種別の対処法を実施することが必要な障害が発生したことを示すものに変更することを特徴とする障害監視方法。 The fault monitoring method according to claim 15, wherein
In the state display change step, if the message is a failure message indicating the occurrence of a failure, the state of the state group into which the message has been classified by the classification step is treated as the type assigned to the state group. The fault monitoring method is characterized in that a change is made to indicate that a fault that needs to be carried out has occurred.
前記状態表示変更ステップでは、前記メッセージが障害回復のための処置がとられたことを示す回復メッセージである場合は、前記分類ステップによって前記メッセージが分類された状態グループの状態を、障害が回復したことを示すものに変更することを特徴とする障害監視方法。 The fault monitoring method according to claim 15 or 16,
In the status display change step, when the message is a recovery message indicating that a measure for recovery from a failure has been taken, the status has recovered from the status of the status group into which the message has been classified by the classification step. A fault monitoring method, characterized in that the fault monitoring method is changed to one indicating the above.
前記状態表示変更ステップでは、前記分類ステップによって分類された前記メッセージを示す情報と、前記メッセージの分類先となった状態グループを示す情報とを前記表示装置に表示することを特徴とする障害監視方法。 The fault monitoring method according to any one of claims 15 to 17,
In the status display changing step, a failure monitoring method characterized in that information indicating the message classified by the classification step and information indicating a status group to which the message is classified are displayed on the display device. .
前記コンピュータが、状態グループとメッセージとの組み合わせに対応付けてコメントが登録されたナレッジ情報蓄積部を備え、且つ、
前記コンピュータが、前記分類ステップによって前記メッセージが分類された状態グループとその状態グループに分類された前記メッセージとの組み合わせに対応付けて登録されているコメントを前記ナレッジ情報蓄積部から検索し、該検索したコメントを前記表示装置に表示する対処履歴表示ステップとを含むことを特徴とする障害監視方法。 The failure monitoring method according to any one of claims 15 to 18,
The computer includes a knowledge information storage unit in which a comment is registered in association with a combination of a state group and a message; and
The computer searches the knowledge information storage unit for a comment registered in association with a combination of a state group in which the message is classified in the classification step and the message classified in the state group, and the search A failure monitoring method comprising: a handling history display step for displaying a comment made on the display device.
前記コンピュータが、管理者によって入力されたコメントを、前記管理者によって指定された状態グループとメッセージとの組み合わせに対応付けて前記ナレッジ情報蓄積部に登録するナレッジ情報登録ステップを含むことを特徴とする障害監視方法。 The fault monitoring method according to claim 19, wherein
The computer includes a knowledge information registration step of registering a comment input by an administrator in the knowledge information storage unit in association with a combination of a state group and a message designated by the administrator. Fault monitoring method.
前記状態表示変更ステップでは、状態グループの状態を変更する際、その表示属性を変更することを特徴とする障害監視方法。 The failure monitoring method according to any one of claims 15 to 20,
In the state display change step, when changing the state of the state group, the display attribute is changed.
エージェント装置から受信した、前記エージェント装置の状態を示すメッセージを前記分類定義に従って1以上の前記状態グループに分類する分類手段、
前記表示装置に表示された状態グループの状態の内、前記分類手段によって前記メッセージが分類された状態グループの状態を変更する状態表示変更手段として機能させるためのプログラム。 A display device that displays the state of a state group defined for each type of coping method for recovering a failure, and a category definition storage unit in which a category definition for classifying a message into the state group to which the message relates is registered A computer with
Classification means for classifying a message indicating the state of the agent device received from an agent device into one or more state groups according to the classification definition;
A program for functioning as a state display changing unit for changing a state of a state group in which the message is classified by the classification unit among the states of the state group displayed on the display device.
前記状態表示変更手段は、前記メッセージが障害の発生を示す障害メッセージである場合は、前記分類手段によって前記メッセージが分類された状態グループの状態を、その状態グループに割り当てられている種別の対処法を実施することが必要な障害が発生したことを示すものに変更することを特徴とするプログラム。 The program according to claim 22, wherein
If the message is a failure message indicating the occurrence of a failure, the state display change unit may change the state of the state group into which the message is classified by the classification unit to the type assigned to the state group. A program characterized in that it is changed to indicate that a failure has occurred that is necessary to be executed.
前記状態表示変更手段は、前記メッセージが障害回復のための処置がとられたことを示す回復メッセージである場合は、前記分類手段によって前記メッセージが分類された状態グループの状態を、障害が回復したことを示すものに変更することを特徴とするプログラム。 24. The program according to claim 22 or 23, wherein:
When the message is a recovery message indicating that a measure for recovery from a failure has been taken, the status display change unit has recovered the status of the status group into which the message has been classified by the classification unit. A program characterized by changing to something that indicates
前記状態表示変更手段は、前記分類手段によって分類された前記メッセージを示す情報と、前記メッセージの分類先となった状態グループを示す情報とを前記表示装置に表示することを特徴とするプログラム。 The program according to any one of claims 22 to 24,
The status display change means displays information indicating the message classified by the classification means and information indicating a status group to which the message is classified on the display device.
前記コンピュータが、状態グループとメッセージとの組み合わせに対応付けてコメントが登録されたナレッジ情報蓄積部を備え、且つ、
前記コンピュータを、前記分類手段によってメッセージが分類された状態グループとその状態グループに分類されたメッセージとの組み合わせに対応付けて登録されているコメントを前記ナレッジ情報蓄積部から検索し、該検索したコメントを前記表示装置に表示する対処履歴表示手段として機能させるためのプログラム。 The program according to any one of claims 22 to 25,
The computer includes a knowledge information storage unit in which a comment is registered in association with a combination of a state group and a message; and
The computer searches the knowledge information storage unit for a comment registered in association with a combination of the state group into which the message is classified by the classification unit and the message classified into the state group, and the searched comment For functioning as coping history display means for displaying a message on the display device.
前記コンピュータを、管理者によって入力されたコメントを、前記管理者によって指定された状態グループとメッセージとの組み合わせに対応付けて前記ナレッジ情報蓄積部に登録するナレッジ情報登録手段として機能させるためのプログラム。 The program according to claim 26,
A program for causing the computer to function as knowledge information registration means for registering a comment input by an administrator in the knowledge information storage unit in association with a combination of a state group and a message specified by the administrator.
前記状態表示変更手段は、状態グループの状態を変更する際、その表示属性を変更することを特徴とするプログラム。 The program according to any one of claims 22 to 27,
The state display changing means changes the display attribute when changing the state of the state group.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007188222A JP2009026052A (en) | 2007-07-19 | 2007-07-19 | Fault monitoring system, manager device, fault monitoring method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007188222A JP2009026052A (en) | 2007-07-19 | 2007-07-19 | Fault monitoring system, manager device, fault monitoring method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009026052A true JP2009026052A (en) | 2009-02-05 |
Family
ID=40397808
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007188222A Pending JP2009026052A (en) | 2007-07-19 | 2007-07-19 | Fault monitoring system, manager device, fault monitoring method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009026052A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017069912A (en) * | 2015-10-02 | 2017-04-06 | 日本電信電話株式会社 | Network monitoring device and network monitoring method |
WO2023157076A1 (en) * | 2022-02-15 | 2023-08-24 | 日本電信電話株式会社 | Control apparatus, control method, and control program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0595355A (en) * | 1991-10-01 | 1993-04-16 | Nec Corp | Network monitor system |
JP2000040021A (en) * | 1998-07-23 | 2000-02-08 | Ntt Data Corp | Monitoring display system and record medium |
JP2006023910A (en) * | 2004-07-07 | 2006-01-26 | Hitachi Ltd | Server fault recovery method and server fault recovery system |
-
2007
- 2007-07-19 JP JP2007188222A patent/JP2009026052A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0595355A (en) * | 1991-10-01 | 1993-04-16 | Nec Corp | Network monitor system |
JP2000040021A (en) * | 1998-07-23 | 2000-02-08 | Ntt Data Corp | Monitoring display system and record medium |
JP2006023910A (en) * | 2004-07-07 | 2006-01-26 | Hitachi Ltd | Server fault recovery method and server fault recovery system |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017069912A (en) * | 2015-10-02 | 2017-04-06 | 日本電信電話株式会社 | Network monitoring device and network monitoring method |
WO2023157076A1 (en) * | 2022-02-15 | 2023-08-24 | 日本電信電話株式会社 | Control apparatus, control method, and control program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5325981B2 (en) | Management server and management system | |
US20080065928A1 (en) | Technique for supporting finding of location of cause of failure occurrence | |
JP2017509262A (en) | Identify network failure troubleshooting options | |
JP7423942B2 (en) | information processing system | |
JP2019057139A (en) | Operation management system, monitoring server, method and program | |
JP3916232B2 (en) | Knowledge-type operation management system, method and program | |
JP5983102B2 (en) | Monitoring program, method and apparatus | |
WO2018135254A1 (en) | Area of influence specifying program, area of influence specifying method, and area of influence specifying device | |
US10558513B2 (en) | System management apparatus and system management method | |
JP2007079896A (en) | Monitoring device and monitoring method | |
JP2009211611A (en) | Operation management system, method, and program | |
WO2013124947A1 (en) | Information system management device and information system management method and program | |
US6966014B2 (en) | Method for system obstacle correspondence support | |
JP2009026052A (en) | Fault monitoring system, manager device, fault monitoring method, and program | |
JP2016134721A (en) | Information processing system, control method of information processing system and control program of management device | |
US8667340B2 (en) | Method and system for distributed processing of alerts | |
US8473788B2 (en) | Monitoring program, monitoring apparatus, and monitoring method | |
JP5313465B2 (en) | Network management program and network management method | |
JP5623950B2 (en) | IT failure sign detection device and program | |
JP6547649B2 (en) | INFORMATION PROCESSING APPARATUS AND INFORMATION PROCESSING PROGRAM | |
JP2007072545A (en) | Monitoring device and monitoring method | |
JP5088738B2 (en) | Fault monitoring apparatus, fault monitoring method, and program therefor | |
JP2007072546A (en) | Flow editing device and flow editing method | |
CN104823406A (en) | Identifying reports to address network issues | |
US20070214396A1 (en) | Round-trip resolution of customer error reports |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090721 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20090721 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100721 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100817 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101228 |