JP2006318036A - 障害監視システム - Google Patents

障害監視システム Download PDF

Info

Publication number
JP2006318036A
JP2006318036A JP2005137483A JP2005137483A JP2006318036A JP 2006318036 A JP2006318036 A JP 2006318036A JP 2005137483 A JP2005137483 A JP 2005137483A JP 2005137483 A JP2005137483 A JP 2005137483A JP 2006318036 A JP2006318036 A JP 2006318036A
Authority
JP
Japan
Prior art keywords
information
monitoring
filtering
target device
management information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005137483A
Other languages
English (en)
Inventor
Yuji Fujii
裕士 藤井
Masahiro Ise
正浩 伊勢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information Systems Ltd
Original Assignee
Hitachi Information Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information Systems Ltd filed Critical Hitachi Information Systems Ltd
Priority to JP2005137483A priority Critical patent/JP2006318036A/ja
Publication of JP2006318036A publication Critical patent/JP2006318036A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】 監視対象機器1の監視状態の切替の必要を生じたとき、スケジュール情報で管理情報のフィルタリング特性を自動変更させ、手動切替操作時の操作ミスをなくし、監視業務を継続実施させる障害監視システムを提供する。
【解決手段】 動作時に定期的に管理情報を出力する複数の監視対象機器1、複数の監視対象機器1から出力された各管理情報を所定条件でフィルタリングして異常を示す管理情報を障害情報として選択し、選択した障害情報を出力する監視機器2、監視機器2から出力された障害情報を受信する保守センター3を備えるもので、監視機器2で行う各管理情報に対する所定条件のフィルタリングは、監視対象機器1毎に設定した正常異常の判別に従って行われる第1のフィルタリングと、複数の監視対象機器1毎にそれらの稼動状態を示すステータス情報に基づいて第1のフィルタリングによる異常の判別の無効を判別する第2のフィルタリングとからなる。
【選択図】 図1

Description

本発明は、障害監視システムに係り、特に、複数の監視対象機器の動作を監視対象機器から出力される管理情報により監視し、障害発生の有無を管理情報のフィルタリングによって判別する際に、フィルタリングの判別を複数の監視対象機器毎の稼動状況を示すスケジュール情報に対応して切替可能にした障害監視システムに関する。
近年、企業や官庁または学校等の組織体(以下、これを企業等グループという)においては、企業等グループ内にネットワークシステムを構築し、企業等グループ内の各部署において行われている各種の業務をこのネットワークシステムを通してオンライン処理することが増えている。そして、この場合、ネットワークシステムに組み込まれる各種操作機器や業務サーバ等は、常時、企業等グループ内のいずれかの部署からもネットワークシステムの利用が可能になるように、無休稼動、すなわち24時間かつ365日稼動が前提になりつつある。このように、各種操作機器や業務サーバ等が無休稼動されるようになると、稼動期間中、それらの動作状態を常時監視するための障害監視システムが必要になってくる。
一般に、ネットワークシステムに組み込まれる各種操作機器や業務サーバ等の動作を監視する障害監視システムとしては、SNMP(Simple Network Management Protocol)と呼ばれる監視エージェントと、その監視エージェントから通知される管理情報(Trap)を収集するマネージャとを用いて障害監視するシステムが知られており、この他にも、既にいくつかの障害監視システムが提案されている。
その中の1つは、特開平07−183932号公報に開示された階層型ネットワーク管理システムである。この階層型ネットワーク管理システムは、管理対象となる通信ネットワーク構成要素(管理オブジェクト)の管理や制御を行う複数のエージェントから通知される管理情報を一旦複数のサブマネージャに収集し、そのサブマネージャにおいて収集した管理情報の中から統合マネージャに通知すべき管理情報を抽出するためのフィルタリング処理を行い、それにより統合マネージャにはネットワーク全体を管理するために必要な情報だけを通知するようにしているものである。すなわち、各サブマネージャは、統合マネージャに通知すべき管理情報を選定するための選定条件を管理情報ベース(MIB)内に記憶しておき、その選定条件に基づいて管理情報をフィルタリング処理することにより、その選定条件に合致するものだけを統合マネージャに通知しているものである。
この場合、各サブマネ−ジャが持つ管理情報ベースに格納される条件は、統合マネージャ側から変更できるようにし、ネットワーク構成の変更等に柔軟に対応できるような手法が採用されている。これにより、統合マネージャは、その負荷が軽減されるとともに、ネットワーク構成の変更に柔軟に対応することが可能になるものである。
また、この他にも、特開2004−320267号公報に開示された障害通報システムである。この障害通報システムは、複数の被監視装置と、それぞれの被監視装置から出力された障害通知情報を選択抽出して障害情報を発生する障害通報装置と、障害情報が送信される保守センタとを備え、複数の被監視装置より通知される障害通知情報を登録・分析し、通報定義に設定された条件に基づいて保守センタへ通知する必要がある障害を抽出し、保守センタに障害情報を通報するための手法が定義付けられている。すなわち、複数の被監視装置から通知される障害通知情報を登録し、通報定義テーブルに記憶された保守センタへ通知すべき障害情報を決定する条件情報を用いて障害通知情報のフィルタリングを行い、条件に合致する障害通知情報のみを障害情報として保守センタへ通報するものである。これにより、複数の被監視装置より通知される障害通知情報の中で、定義中に決められている無視してもよい軽微な障害に関しては障害情報として保守センタへ通報されることがなく、保守センタ員の負担を軽減することができるものである。
このような既知の手段や既知のシステムを用いれば、分散配置される複数の監視対象機器(ネットワーク機器およびサーバ等)から通知される管理情報の中からより必要と思われる管理情報のみを統合監視装置(統合マネージャ)に収集し、収集した管理情報の中から即時対応が必要な障害の発生を知らせる管理情報の有無を判別し、判別した管理情報を保守センターに通報することによって、統合監視装置の負荷及び保守センター員の負担を軽減することが可能になる。
特開平07−183932号公報 特開2004−320267号公報
前記既知の手段や既知のシステムを用いた場合は、広範囲に分散配置される複数の監視対象機器からそれぞれ出力される管理情報の中から統合マネージャで管理する必要のある管理情報を抽出した後、それらの管理情報を一元管理し、さらに、一元管理した管理情報の中から保守対応を行う必要のある障害を含んだ管理情報だけを抽出し、抽出した管理情報を障害情報として保守センターに通報することが可能になるので、情報の監視や機器の保守に対する効率化を高めることが可能になる。
しかし、複数の監視対象機器を同時に運用させる場合には、通常、障害発生と判定される状況にあっても実際に障害が発生していない場合や、障害発生と判定する条件を適宜変更しなければならない事態を生じる場合がある。その一つの例は、監視対象機器に定期的な機器・アプリケーションのメンテナンス業務の実施時期が到来したときであり、他の一つの例は、システムの構築・変更作業に伴うシステムダウンが発生したとき等である。このようなメンテナンス業務や構築・変更作業が実施されるときには、その監視対象機器の動作を停止させたり、監視対象機器のアプリケーションの稼動を停止させたりすることが生じる。ところで、監視対象機器の動作の停止やアプリケーションの稼動の停止は、通常、障害発生と判断される事象であるが、メンテナンス業務や構築・変更作業の実施時には、意図的に監視対象機器の動作やアプリケーションの稼動を停止させるものであるため、このような事象が発生した時でも、必ずしも障害の発生であると断定することはできない。
このような状況になったとき、当該監視対象機器に対して通常通りの監視業務を行っていたとすれば、メンテナンス業務や構築・変更作業の実施により当該監視対象機器の動作を意図的に停止させると、当該監視対象機器から出力される管理情報に障害の発生を示す内容が付加され、障害が発生していないのに障害が発生したとの誤報を発生してしまうことになる。このため、現状では、監視対象機器に対してメンテナンス業務や構築・変更作業を実施する際には、その監視対象機器の監視業務を一時停止させ、メンテナンス業務や構築・変更作業が終了した後で、その監視対象機器の監視業務を再開するという手段を採用して誤報の発生を抑止している。しかし、監視対象機器の監視業務の停止・再開の処理操作は、通常、人手によるものであるため、監視業務運用者にとって負担になることがあり、また、メンテナンス業務や構築・変更作業が終了した後、監視再開の処理操作をするのを忘れてしまう危険性がある。
さらに、監視対象機器に対してメンテナンス業務や構築・変更作業を実施するとき等には、通常運用時における障害検出の条件を用いるのでなく、当該メンテナンス業務や構築・変更作業の実施期間内には、通常運用時における障害検出の条件と異なる限定された障害検出の条件を設定しなければならない場合もある。現状では、このような事態に対応できるように、通常運用時における障害検出の条件の他に、通常運用時と異なる障害検出の条件を別途用意しておき、当該メンテナンス業務や構築・変更作業の実施期間内になると、通常運用時と異なる障害検出の条件が有効になり、通常運用時における障害検出の条件が無効になるように切替えるようにしている。
しかし、このような障害検出の条件を切替える処理操作は、監視業務運用者が手動によって行うものであるため、監視業務運用者にとってその操作が負担になることがあり、また、メンテナンス業務や構築・変更作業が終了した後、障害検出の条件を切替える操作を忘れたり、障害検出の条件の戻し操作を忘れたりする等の操作ミスの発生を招く危険性がある。
本発明は、このような技術的背景に鑑みてなされたもので、その目的は、監視対象機器の監視状態を切替える必要を生じたとき、スケジュール情報により管理情報のフィルタリング特性を自動変更させ、手動切替操作による操作ミスをなくし、かつ、監視業務を継続実施するようにした障害監視システムを提供することにある。
前記目的を達成するために、本発明による障害監視システムは、ネットワークシステムに組み込まれ、動作時に定期的に管理情報を出力する複数の監視対象機器と、複数の監視対象機器から出力された各管理情報を所定条件でフィルタリングして異常を示す管理情報を障害情報として選択し、選択した障害情報を出力する監視機器と、監視機器から出力された障害情報を受信する保守センタとを備えるものであって、監視機器で行う各管理情報に対する所定条件のフィルタリングは、監視対象機器毎に設定した正常異常の判別に従って行われる第1のフィルタリングと、複数の監視対象機器毎にそれらの稼動状態を示すステータス情報に基づいて第1のフィルタリングによる異常の判別の無効を判別する第2のフィルタリングとからなる手段を具備する。
前記手段において、第1のフィルタリングは、監視対象機器毎に設定した正常異常を判別するフィルタリングの条件を格納したフィルタテーブルによってそのフィルタリング特性が設定され、第2のフィルタリングは、監視対象機器毎の稼動スケジュールにより変更されるステータス情報を格納した監視対象機器テーブルによってそのフィルタリング特性が設定される具体的手段を具備する。
前記具体的手段における監視対象機器テーブルに格納されるステータス情報は、監視対象機器毎の稼動スケジュールの変更状態を格納したスケジュールテーブルによって定期的に変更されるものである。
以上のように、本発明の障害監視システムによれば、監視対象機器のメンテナンス等の実施時期が到来し、それにより当該監視対象機器における通常運用時の事象と異なる事象になった場合であっても、その異なる事象をステータス情報として表わすことにより、自動的にその異なる事象への対応が可能になるとともに、当該監視対象機器における障害監視の停止・再開の切替時に行われる手動切替操作を不要にしたので、その分、運用者の作業負担を軽減することができるという効果がある。
また、本発明の障害監視システムによれば、フィルタリング特性の設定変更を自動的に切替えるようにして、手動切替操作によるフィルタリング特性の設定変更の際の操作ミスの発生を軽減することができ、しかも、監視対象機器からの管理情報のフィルタリングを、フィルタリング実行条件であるフィルタリング定義とステータス情報に基づくステータス定義との組み合わせたフィルタリング特性を使用することにより、監視対象機器毎に当該フィルタリング特性を迅速かつ適確に変更することが可能になり、障害監視時の質の向上を図ることができるという効果がある。
以下、本発明の障害監視システムの実施の形態を図面を参照して説明する。
図1は、本発明の一つの実施の形態であって、監視対象機器から定期的に収集した管理情報を当該監視対象機器のステータス情報に対応したフィルタリング特性によってフィルタリングが行われる監視システムの一例を示すブロック構成図である。
図1に示すように、本発明による障害監視システムは、複数の監視対象機器1と、監視装置2と、保守センター3とからなっている。この場合、監視装置2は、制御部4と、管理情報入力部5と、障害抽出フィルタ部6と、障害情報通知部7と、フィルタ定義編集部8と、監視対象機器情報編集部9と、スケジュール管理部10と、フィルタテーブル11と、監視対象機器テーブル12と、スケジュールテーブル13とを備えており、保守センター3は、障害通報装置14を備えている。
そして、監視装置2において、管理情報入力部5は、入力端が複数の監視対象機器1にそれぞれ選択結合され、出力が障害抽出フィルタ部6の入力端に接続される。障害抽出フィルタ部6は、出力端が障害情報通知部7の入力端に接続され、制御入力端がフィルタテーブル11と監視対象機器テーブル12にそれぞれ接続される。障害情報通知部7は、出力端が保守センタ3の障害通報装置14に選択結合される。フィルタ定義編集部8は、出力端がフィルタテーブル11に接続される。監視対象機器情報編集部9は、監視対象機器テーブル12とスケジュールテーブル13に接続される。スケジュール管理部10は、入力端がスケジュールテーブル13に接続され、出力端が監視対象機器テーブル12に接続される。また、図1にはその接続状態が図示されていないが、制御部4は、監視装置2を構成するそれぞれの構成要素5乃至13に対して、それら構成要素5乃至13の動作を統括制御するように結合されている。
ここで、図2乃至図4は、図1に図示された監視装置2に用いられるフィルタテーブル、監視対象機器テーブル、スケジュールテーブルに格納される項目の一例を示すもので、図2はフィルタテーブル11の格納項目の一例を示す説明図であり、図3は監視対象機器テーブル12の格納項目の一例を示す説明図であり、図4はスケジュールテーブル13の格納項目の一例を示す説明図である。
図2に示されるように、フィルタテーブル11は、格納項目としてフィルタ条件11(1)、対象機器識別情報11(2)、フィルタタイプ11(3)を表した情報格納箇所を有している。この場合、フィルタ条件11(1)は、監視対象機器1から受信した管理情報にどのような情報内容(文字やID等)が含まれておれば、障害の発生を示す情報であるかの定義項目である。対象機器識別情報11(2)は、監視対象となる監視対象機器1に付与された識別情報(IPアドレス等)の登録項目であって、この項目に監視対象機器が登録されていない場合、当該フィルタ条件が全ての監視対象機器1に適用されることを意味する。フィルタタイプ11(3)は、項目フィルタ条件11(1)を実行する際の動作パターンの設定項目であって、この場合のフィルタ条件11(1)を実行する際の動作パターンとは、例えば、「監視対象機器が通常稼動状態であれば実行する」「監視対象機器が通常稼動状態であれば実行しない」、「監視対象機器がメンテナンス中であれば実行する」「監視対象機器がメンテナンス中であれば実行しない」等である。
また、図3に示されるように、監視対象機器テーブル12は、格納項目として対象機器識別情報12(1)、ステータス12(2)を表した情報格納箇所を有している。この場合、対象機器識別情報12(1)は、監視対象となる監視対象機器1に付与された識別情報(IPアドレス等)の登録項目である。ステータス12(2)は、後述するスケジュール管理部1の制御の基に対象機器識別情報12(1)に識別情報が格納されている監視対象機器1の稼動状態の設定項目であって、この場合に設定されている稼動状態とは、例えば、「通常稼動中」、「メンテナンス中」等である。
さらに、図4に示されるように、スケジュールテーブル13は、格納項目として対象機器識別情報13(1)、ステータス変更運用開始日時13(2)、ステータス変更運用終了日時13(3)ステータス13(4)を表した情報格納箇所を有している。この場合、対象機器識別情報12(1)は、監視対象となる監視対象機器1を付与された識別情報(IPアドレス等)の登録項目であり、ステータス変更運用開始日時13(2)は、監視対象機器1毎にメンテナンスの実行予定等によりステータス変更の運用を開始させる日時の設定項目であり、ステータス変更運用終了日時13(3)は、監視対象機器1毎にメンテナンスの実行終了等によりステータス変更の運用を終了させる日時の設定項目であり、ステータス13(4)は、対象機器識別情報13(1)に識別情報が格納されている監視対象機器1のステータス状態の設定項目であって、後述するように、これらの項目の設定内容によりスケジュール管理部1の制御状態が変更されるものである。
以下、図1に図示されたこの実施の形態よる監視装置2の動作について説明する。この場合、監視装置2における各構成要素5乃至13は、制御部4の制御の基に動作するものである。
複数の監視対象機器1から当該監視対象機器1の動作状態を表す管理情報が定期的に出力されると、それらの管理情報は、管理情報入力部5に供給される。このとき、管理情報入力部5は、入力された管理情報を受信し、受信管理情報を内部メモリ(図示なし)に一時記憶した後、内部メモリから読み出されて障害抽出フィルタ部6に供給する。
障害抽出フィルタ部6は、管理情報が供給されると、フィルタテーブル11に格納されている当該管理情報についての判別基準に基づいて正常な管理情報であるか障害情報であるかを判別する(以下、これを第1の判別という)とともに、監視対象機器テーブル12及びスケジュールテーブル13に格納されている当該管理情報に対応したスケジュール情報に基づいて第1の判別が正確であるか不正確であるかを判別する(以下、これを第2の判別という)。これら第1及び第2の判別は、監視対象となる1つの管理情報について、第1の判別によって障害情報であると判別したときでも、第2の判別によってその障害情報が不正確であると判別したときは、その管理情報が障害情報であるという第1の判別を無効にし、その管理情報が正常管理情報であるとの判別をする。このように、障害抽出フィルタ部6は、供給された管理情報毎に正常管理情報であるか障害情報であるかを判別し、管理情報の中で障害情報と判別したものだけを選択抽出し、選択抽出した管理情報を障害情報として障害情報通知部7に供給する。
障害情報通知部7は、障害抽出フィルタ部6から管理情報が供給されると、その管理情報を障害情報の形式に修正し、形成した障害情報を保守センター3の障害通報装置14に通報する。保守センター3は、障害通報装置14が障害情報の通報を受けると、通報された障害情報に基づいて、保守センター3の保守員が直ちに障害発生箇所や障害内容等を知ることができ、その障害発生に対して迅速な処理を行うことが可能になる。
この場合、障害抽出フィルタ部6で実行される管理情報のフィルタリングは、前述のように、フィルタテーブル11及び監視対象機器テーブル12に格納されている各種項目に示されている条件に従って実施される。この場合、フィルタテーブル11に格納されている各種項目の条件の登録・編集・削除は、監視装置2の運用者がフィルタ定義編集部8を用いた操作作業により随時実行することが可能である。同じように、監視対象機器テーブル12に格納されている各種項目の条件の登録・編集・削除も、監視装置2の運用者が監視対象機器情報編集部9を用いた操作作業により随時実行することが可能なものである。
また、いずれかの監視対象機器1に対する定期検査やメンテナンス作業等の実施時期が設定され、その設定期間内だけ障害抽出フィルタ部6のフィルタリング特性を切替える必要が発生した場合に、監視装置2の運用者が監視対象機器情報編集部9を用いた操作作業を行うと、当該監視対象機器1に対するステータス変更スケジュールの事前登録を行うことが可能になる。
すなわち、監視装置2の運用者が監視対象機器情報編集部9を用いた操作作業を行い、当該監視対象機器1に対して通常運用時のステータスと異なるステータスに変更すべき日時を設定すると、その設定内容を表すスケジュール情報がスケジュールテーブル8に格納される。このとき、スケジュール管理部10は、定期的にスケジュールテーブル13の格納内容を検索し、その検索時に格納内容が通常の内容と異なっていたことを確認すると、その格納内容に従って監視対象機器テーブル12のステータスの更新を実施する。これにより、監視対象機器テーブル12は、当該監視対象機器1の定期検査やメンテナンス作業等が実施される期間だけ、当該監視対象機器1における障害抽出フィルタ部6のフィルタリング特性の切替えを行うことが可能になり、本来、当該監視対象機器1の動作に障害が発生していないのに、障害が発生していると判定されることがなくなり、しかも、定期検査やメンテナンス作業等が実施される期間を経過すれば、自動的に当該監視対象機器1における障害抽出フィルタ部6のフィルタリング特性を自動的に元のフィルタリング特性に復帰させることができる。
次に、図5は、監視機器2の障害抽出フィルタ部6で実行される管理情報に対するフィルタリング処理手順を示すフローチャートである。
このフローチャートを用い、障害抽出フィルタ部6で実行される管理情報に対するフィルタリング処理について説明する。
この障害情報に対するフィルタリング処理は、第1の処理及び第2の処理の2つの処理からなり立っている。
その第1の処理は、フィルタリング処理の対象となる管理情報を送信した監視対象機器(以下、これを通知元監視対象機器という)1が監視対象機器テーブル12に識別情報(IPアドレス等)が登録されていることを確認する監視対象機器フィルタリング処理手段であり、その第2の処理は、通知元監視対象機器1を送信した管理情報に障害通知内容(障害と定義される事象)が含まれているか否かを確認する管理情報フィルタリング処理手段である。
始めに、ステップS1において、制御部4は、1つの監視対象機器1から管理情報入力部5に管理情報が供給されると、その管理情報を管理情報入力部5で受信する。
次に、ステップS2において、制御部4は、管理情報入力部5が受信した管理情報からその管理情報を送信した通知元監視対象機器1を表す対象機器識別情報(A)を取得する。
次いで、ステップS3において、制御部4は、監視対象機器テーブル12に登録されている対象機器識別情報(B)を取得する。この場合、対象機器識別情報(B)を取得は、監視対象機器テーブル12における対象機器識別情報の登録数分だけ順番に繰り返し実行される。
続いて、ステップS4において、制御部4は、監視対象機器テーブル12に登録されている最初の対象機器識別情報(B)を取得する。
続く、ステップS5において、制御部4は、通知元監視対象機器1を表す対象機器識別情報(A)と監視対象機器テーブル12に登録されている最初に取得した対象機器識別情報(B)とが一致するか否かを判断する。そして、これらの対象機器識別情報(A)と対象機器識別情報(B)とが一致すると判断した(Y)ときは次のステップS6に移行し、一方、これらの対象機器識別情報(A)と対象機器識別情報(B)とが一致しないと判断した(N)ときは前のステップS3に移行する。
次に、ステップS6において、制御部4は、監視対象機器テーブル12のステータス項目12(2)に格納されているステータス(C)を取得する。このステータス(C)の取得が終了すると、それに続いて図6に図示された通知情報フィルタ処理手段に移行する。
次いで、前のステップS3において、制御部4は、監視対象機器テーブル12に登録されている対象機器識別情報(A)の取得を、監視対象機器テーブル12の対象機器識別情報の登録数分だけ次々に繰り返し実行する。
続いて、ステップS4において、制御部4は、監視対象機器テーブル12に登録されている2番目(次)の対象機器識別情報(B)を取得する。
続く、ステップS5において、制御部4は、通知元監視対象機器1を表す対象機器識別情報(A)と監視対象機器テーブル12に登録されている2番目(次)に取得した対象機器識別情報(B)とが一致するか否かを判断する。そして、これらの対象機器識別情報(A)と対象機器識別情報(B)とが一致すると判断した(Y)ときは次のステップS6に移行し、一方、これらの対象機器識別情報(A)と対象機器識別情報(B)とが一致しないと判断した(N)ときは再び前のステップS3に移行する。この場合、かかるステップS3乃至ステップS5の再実行は、対象機器識別情報(A)と対象機器識別情報(B)とが一致するまで、監視対象機器テーブル12の対象機器識別情報の登録数分だけ順番に繰り返し実行される。
次に、ステップS7において、制御部4は、対象機器識別情報(A)と一致する対象機器識別情報(B)が得られないので、当該対象機器識別情報(A)を含んだ管理情報は正規の情報でないと判断し、この管理情報を廃棄する。この処理が終了すると、この一連の処理を終了させる。
また、図6は、監視機器2において実行されるフィルタリング処理時の通知情報の処理手順を示すフローチャートである。
このフローチャートを用い、障害抽出フィルタ部6で実行されるフィルタリング処理時の通知情報の処理手順について説明する。
まず、ステップS8において、制御部4は、管理情報入力部5で受信した管理情報に含まれる通知内容(D)を取得する。
次に、ステップS9において、制御部4は、フィルタテーブル11の対象機器識別情報の項目11(2)に登録されている対象機器識別情報(E)を取得する。この場合、対象機器識別情報(E)を取得は、フィルタテーブル11における対象機器識別情報の登録数分だけ順番に繰り返し実行される。
次いで、ステップS10において、制御部4は、フィルタテーブル11に登録されている最初の対象機器識別情報(E)を取得する。
続いて、ステップS11において、制御部4は、フィルタテーブル11から取得した対象機器識別情報(E)が指定なし(監視対象機器1の指定がなく、全ての監視対象機器1にフィルタ条件の項目11(1)が適用される)であるかまたは通知元監視対象機器1を表す対象機器識別情報(A)と監視対象機器テーブル12に登録されている最初に取得した対象機器識別情報(E)とが一致しているか否かを判断する。そして、対象機器識別情報(E)が指定なしであるまたは対象機器識別情報(A)と対象機器識別情報(E)とが一致していると判断した(Y)ときは前のステップS9に移行し、一方、対象機器識別情報(E)が指定ありであるかまたは対象機器識別情報(A)と対象機器識別情報(E)とが一致していないと判断した(N)ときは次のステップS12に移行する。
続く、ステップS12において、制御部4は、フィルタテーブル11のフィルタタイプの項目11(3)の設定条件(F)を取得する。
次に、ステップS13において、制御部4は、受信した管理情報に含まれる通知内容(D)とフィルタタイプの項目11(3)の設定条件(F)とが合致していないか否かを判断する。そして、通知内容(D)と設定条件(F)とが合致していないと判断した(Y)ときは前のステップS9に移行し、一方、通知内容(D)と設定条件(F)とが合致していると判断した(N)ときは次のステップS14に移行する。
次いで、ステップS14において、制御部4は、フィルタテーブル11のフィルタ条件の項目11(1)の設定条件(G)を取得する。
続いて、ステップS15において、制御部4は、受信した管理情報に含まれる通知内容(D)とフィルタタイプの項目11(1)の設定条件(G)とが一致しているまたは設定条件(G)に通知内容(D)が含まれているか否かを判断する。そして、通知内容(D)と設定条件(G)とが一致しているまたは設定条件(G)に通知内容(D)が含まれていると判断した(Y)ときは図7に図示された監視対象機器テーブルの更新処理手順に移行し、一方、通知内容(D)と設定条件(G)とが一致していないまたは設定条件(G)に通知内容(D)が含まれていないと判断した(N)ときは前のステップS9に移行する。
続く、ステップS9において、制御部4は、フィルタテーブル11の対象機器識別情報の項目11(2)に登録されている対象機器識別情報(E)の取得を、フィルタテーブル11のの対象機器識別情報の登録数分だけ次々に繰り返し実行する。
ステップS9の後、それに続くステップS10乃至ステップS15の再実行は、通知内容(D)と設定条件(G)とが一致しているまたは設定条件(G)に通知内容(D)を含んでいると判断されるまで、フィルタテーブル11の対象機器識別情報の登録数分だけ順番に繰り返し実行される。
次に、ステップS16において、制御部4は、通知内容(D)と設定条件(G)とが一致しているものまたは設定条件(G)に通知内容(D)が含まれているものが得られないので、当該管理情報は障害の通知内容を表すものでないと判断し、この管理情報を廃棄する。この処理が終了すると、一連の処理を終了させる。
さらに、図7は、監視機器2において実行される監視対象機器1のステータス変更スケジュールの登録に基づいて監視対象機器テーブル12の格納内容の更新処理手順を示すフローチャートである。
このフローチャートを用い、監視対象機器テーブル12の格納内容を更新処理する手順について説明する。
なお、このフローチャートを実行するに先立って、監視装置2の運用者は、事前に判明している監視対象機器1のステータス変更スケジュールを監視対象機器情報編集部19の操作によって編集することができるもので、当該監視対象機器1に対するスケジュ−ル情報が監視対象機器情報編集部19の操作によってスケジュールテーブル13に登録される。スケジュールテーブル13に登録されたスケジュ−ル情報は、制御部4の制御によりスケジュール管理部10が定期的にその格納内容を検出し、その検出によって格納内容が更新されている場合、その更新内容に合うように監視対象機器テーブル12の対応する格納内容が自動更新される。
始めに、ステップS17において、制御部4は、スケジュールテーブル13の格納内容を検出したとき、その検出を行った日時、すなわち現在の日時を取得する。
次に、ステップS18において、制御部4は、取得した現在の日時とステータス変更適用開始日時の項目12(2)及びステータス変更適用終了日時の項目12(3)に格納されている各日時とを比較し、ステータス変更の必要があるスケジュール情報(H)の抽出を監視対象機器テーブル12の対象機器識別情報の項目12(1)の登録数分だけ繰り返し実行する。
次いで、ステップS19において、制御部4は、最初のステータス変更の必要があるスケジュール情報(H)を抽出する。
続く、ステップS20において、制御部4は、監視対象機器テーブル12の対象機器識別情報(I)を監視対象機器情報の項目12(1)の登録数分だけ繰り返し取得する。
続いて、ステップS21において、制御部4は、監視対象機器テーブル12の最初の対象機器識別情報(I)を取得する。
次に、ステップS22において、制御部4は、ステータス変更の必要があるスケジュール情報(H)から抽出した最初の対象機器識別情報と監視対象機器テーブル12の最初の監視対象機器識別情報(I)とを比較する。この比較において、スケジュール情報(H)から抽出した対象機器識別情報と監視対象機器テーブル12の最初の監視対象機器識別情報(I)とが一致していると判断した(Y)ときは次のステップS23に移行し、一方、スケジュール情報(H)から抽出した対象機器識別情報と監視対象機器テーブル13の最初の監視対象機器識別情報(I)とが一致していないと判断した(N)ときは前のステップS20に移行する。
次いで、ステップS23において、制御部4は、当該スケジュール情報(H)に対応する監視対象機器1の対象機器識別情報(I)が監視対象機器テーブル12に登録されているので、この監視対象機器テーブル12のステータスの項目12(2)の格納内容をスケジュ−ルテーブル13のステータスの項目13(4)の格納内容に一致するように変更設定する。この場合、現在の日時がステータス変更適用終了日時の項目13(3)の日時より経過していた場合は、ステータスの項目12(2)の格納内容を以前に設定してあった格納内容に戻し、その変更設定を行わない。この処理が終了すると、前のステップS18に移行する。
続く、ステップS20において、制御部4は、監視対象機器テーブル12の対象機器識別情報(I)を監視対象機器情報の項目12(1)の登録数分だけ繰り返し取得する。
その後、ステップS18において、ステータス変更の必要があるスケジュール情報(H)の抽出を監視対象機器テーブル12の対象機器識別情報の項目12(1)の登録数分だけ繰り返し実行する。
ステップS18に続くステップS19乃至ステップS23の再実行、及び、ステップS20に続くステップS21乃至ステップS23の再実行は、ステップS22の比較条件が満たされるまで、それぞれスケジュールテーブル13における対象機器識別情報の項目13(1)の登録数分及び監視対象機器テーブル12の対象機器識別情報の項目12(1)の登録数分だけ繰り返し実行され、その後、この一連の処理が終了する。
本発明の一つの実施の形態であって、障害監視システムの構成の一例を示すブロック図である。 図1に図示の障害監視システムに用いられるフィルタテーブルの格納項目の一例を示す説明図である。 図1に図示の障害監視システムに用いられる監視対象機器テーブルの格納項目の一例を示す説明図である。 図1に図示の障害監視システムに用いられるスケジュールテーブルの格納項目の一例を示す説明図である。 監視機器における障害抽出フィルタ部で実行される管理情報に対するフィルタリング処理手順を示すフローチャートである。 監視機器における障害抽出フィルタ部で実行されるフィルタリング処理時の通知情報の処理手順を示すフローチャートである。 監視機器における監視対象機器のステータス変更スケジュールの登録に基づいて監視対象機器テーブルの更新処理手順を示すフローチャートである。
符号の説明
1 監視対象機器
2 監視機器
3 保守センター
4 制御部
5 管理情報入力部
6 障害抽出フィルタ部
7 障害情報通知部
8 フィルタテーブル編集部
9 監視対象機器情報編集部
10 スケジュ−ル管理部
11 フィルタテーブル
11(1) フィルタ条件
11(2)、12(1)、13(1) 対象機器識別情報
11(3) フィルタタイプ
12 監視対象機器テーブル
12(2)、13(4) ステータス
13 スケジュールテーブル
13(2) ステータス変更適用開始日時
13(3) ステータス変更適用終了日時
14 障害通報装置

Claims (3)

  1. ネットワークシステムに組み込まれ、動作時に定期的に管理情報を出力する複数の監視対象機器と、前記複数の監視対象機器から出力された各管理情報を所定条件でフィルタリングして異常を示す管理情報を障害情報として選択し、選択した障害情報を出力する監視機器と、前記監視機器から出力された障害情報を受信する保守センタとを備える障害監視システムにおいて、前記監視機器で行う各管理情報に対する所定条件のフィルタリングは、前記監視対象機器毎に設定した正常異常の判別に従って行われる第1のフィルタリングと、前記複数の監視対象機器毎にそれらの稼動状態を示すステータス情報に基づいて前記第1のフィルタリングによる異常の判別の無効を判別する第2のフィルタリングとからなるものであることを特徴とする障害監視システム。
  2. 前記第1のフィルタリングは、前記監視対象機器毎に設定した正常異常を判別するフィルタリングの条件を格納したフィルタテーブルによってそのフィルタリング特性が設定され、前記第2のフィルタリングは、前記監視対象機器毎の稼動スケジュールにより変更されるステータス情報を格納した監視対象機器テーブルによってそのフィルタリング特性が設定されることを特徴とする請求項1に記載の障害監視システム。
  3. 前記監視対象機器テーブルに格納されるステータス情報は、前記監視対象機器毎の稼動スケジュールの変更状態を格納したスケジュールテーブルによって定期的に変更されることを特徴とする請求項2に記載の障害監視システム。
JP2005137483A 2005-05-10 2005-05-10 障害監視システム Pending JP2006318036A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005137483A JP2006318036A (ja) 2005-05-10 2005-05-10 障害監視システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005137483A JP2006318036A (ja) 2005-05-10 2005-05-10 障害監視システム

Publications (1)

Publication Number Publication Date
JP2006318036A true JP2006318036A (ja) 2006-11-24

Family

ID=37538696

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005137483A Pending JP2006318036A (ja) 2005-05-10 2005-05-10 障害監視システム

Country Status (1)

Country Link
JP (1) JP2006318036A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012205276A (ja) * 2011-03-28 2012-10-22 Ntt Comware Corp 保守装置、保守方法及びプログラム
US9361153B2 (en) 2012-12-28 2016-06-07 Hitachi, Ltd. Management system and control program for management system
JP2017040962A (ja) * 2015-08-17 2017-02-23 富士通株式会社 管理プログラム、管理装置及び管理方法
JP2017518012A (ja) * 2014-03-26 2017-06-29 クアルコム,インコーポレイテッド ワイヤレス充電管理に関係するシステム、方法、および装置
JP2019159474A (ja) * 2018-03-08 2019-09-19 富士通フロンテック株式会社 メッセージ監視サーバ、方法、プログラム
JPWO2021028963A1 (ja) * 2019-08-09 2021-02-18

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012205276A (ja) * 2011-03-28 2012-10-22 Ntt Comware Corp 保守装置、保守方法及びプログラム
US9361153B2 (en) 2012-12-28 2016-06-07 Hitachi, Ltd. Management system and control program for management system
JP2017518012A (ja) * 2014-03-26 2017-06-29 クアルコム,インコーポレイテッド ワイヤレス充電管理に関係するシステム、方法、および装置
JP2017040962A (ja) * 2015-08-17 2017-02-23 富士通株式会社 管理プログラム、管理装置及び管理方法
JP2019159474A (ja) * 2018-03-08 2019-09-19 富士通フロンテック株式会社 メッセージ監視サーバ、方法、プログラム
JPWO2021028963A1 (ja) * 2019-08-09 2021-02-18
WO2021028963A1 (ja) * 2019-08-09 2021-02-18 日本電気株式会社 異常検出装置、制御方法、及びプログラム
JP7298694B2 (ja) 2019-08-09 2023-06-27 日本電気株式会社 異常検出装置、制御方法、及びプログラム
US11983064B2 (en) 2019-08-09 2024-05-14 Nec Corporation Abnormality detection apparatus, control method, and program

Similar Documents

Publication Publication Date Title
CN108710544B (zh) 一种数据库系统的进程监控方法及轨道交通综合监控系统
JP2006318036A (ja) 障害監視システム
EP1800436A1 (en) Method and apparatus for determining impact of faults on network service
JP2010226181A (ja) ネットワーク監視制御装置
US20080086295A1 (en) Monitoring simulating device, method, and program
JP2007034353A (ja) 業務管理装置、業務管理方法および業務管理プログラム
JP2007080035A (ja) 障害通報の通知方法およびシステム
CN110618864A (zh) 一种中断任务恢复方法及装置
CN108959037A (zh) 一种数据中心自动巡检方法及装置
JP2008306634A (ja) 通信ネットワークのアラームマスク管理システムとその管理方法
EP1662395A2 (en) Information processing system
JP2007199956A (ja) ロギング情報管理方法およびロギング情報管理システム
JP2003233512A (ja) 保守機能付きクライアント監視システム及び監視サーバ及びプログラム並びにクライアント監視・保守方法
JP2008059413A (ja) 障害管理支援システム及びその情報管理方法
JP6421516B2 (ja) サーバ装置、冗長構成サーバシステム、情報引継プログラム及び情報引継方法
JP6294145B2 (ja) 監視方法、監視装置および監視制御プログラム
JP2008244902A (ja) 障害復旧装置、障害復旧方法、及び障害復旧システム
CN113778763B (zh) 一种三方接口服务故障智能切换方法及系统
JP2007141007A (ja) システム運用監視での障害時のサポートシステム化
JPH10326208A (ja) 障害復旧システム及び記録媒体
CN111464357A (zh) 资源配置方法及装置
CN112000442A (zh) 一种基于kubernetes平台的集群状态自动获取方法及装置
JP2002318736A (ja) ログデータ保存方式、ログデータ保存方法およびログデータ保存用プログラム
JP2009182934A (ja) 障害監視装置及び障害監視方法並びにそのためのプログラム
JP2007052756A (ja) ワイヤレスデバイスの不具合診断に適用する学習型診断データベース

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080507

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081007