JP2001337873A

JP2001337873A - 障害監視システム

Info

Publication number: JP2001337873A
Application number: JP2000156633A
Authority: JP
Inventors: Keigo Nakamura; 圭吾中村
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2000-05-26
Filing date: 2000-05-26
Publication date: 2001-12-07

Abstract

(57)【要約】【課題】マネージャの処理の負荷を削減し、リアルタ
イムにエージェントの正しい障害状態を認識できるよう
にする。【解決手段】マネージャ１０が複数のエージェント３
１〜３４の障害状態の変化を、通信プロトコルとしてＳ
ＮＭＰを用いて監視する際に、サブマネージャ２１、２
２を設ける。サブマネージャ２１、２２は、エージェン
ト３１、３２およびエージェント３３、３４の障害状態
の変化の監視をそれぞれ行い、各エージェントの監視項
目のいずれかに障害が発生した場合、当該エージェント
に障害が発生したことをマネージャ１０に通知する。マ
ネージャ１０の処理をサブマネージャ２１、２２が分散
して行うので、マネージャ１０の処理の負荷が削減さ
れ、マネージャ１０はリアルタイムにエージェント３１
〜３４の正しい障害状態を認識できる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、マネージャ（監視
装置）と複数のエージェント（被監視装置）により構成
されていて、マネージャにより各エージェントの障害状
態の変化を監視する障害監視システムに関し、特に通信
プロトコルとしてＳＮＭＰ（ＳｉｍｐｌｅＮｅｔｗｏｒ
ｋＭａｎａｇｅｍｅｎｔＰｒｏｔｏｃｏｌ）を用い
ている障害監視システムに関する。

【０００２】

【従来の技術】マネージャとエージェントから構成さ
れ、通信プロトコルとしてＳＮＭＰを用いている障害監
視システムでは、エージェントにおいて状態変化が発生
したとき、エージェントがマネージャに状態変化を通知
する方法として“ＴＲＡＰ”というメッセージが使用さ
れている。

【０００３】しかし、ＳＮＭＰはＴＣＰ／ＩＰのような
送信データが相手先に確実に届いたことを確認できるよ
うなコネクション型のプロトコルではなく、一方的に相
手先にデータを送信するコネクションレスのプロトコル
であるＵＤＰ（ＵｓｅｒＤａｔａｇｒａｍＰｒｏｔ
ｏｃｏｌ）を用いているので、エージェントから送信さ
れた“ＴＲＡＰ”は必ずしもマネージャに届くとは限ら
ず、エージェントから送信された“ＴＲＡＰ”がマネー
ジャに到達しない“ＴＲＡＰ”抜けが発生する場合があ
る。このような“ＴＲＡＰ”抜けが発生すると、マネー
ジャは各エージェントの正しい状態を認識することがで
きなくなる。

【０００４】そのため、“ＴＲＡＰ”がマネージャに届
かない可能性があることを考慮して、マネージャは各エ
ージェントに対して“ＧｅｔＲｅｑｕｅｓｔ”という
メッセージを用いて定期的に各エージェントの全監視項
目の状態を獲得するといった処理（ポーリング）を行う
必要がある。

【０００５】しかし、各エージェントの全監視項目の状
態の獲得を行う場合、ポーリングを行う間隔を長くする
と“ＴＲＡＰ”抜けが発生した場合、正しい状態を認識
できない時間が長くなってしまう。逆に、逆にポーリン
グを行う間隔を短くすると“ＴＲＡＰ”抜けが発生した
場合でも正しい状態を認識できない時間は短くなるが、
ポーリングを頻繁に行うことによるネットワーク上のト
ラフィック負荷が高くなってしまい、“ＴＲＡＰ”抜け
が発生する可能性が増大してしまうという問題があっ
た。

【０００６】上記で説明したような従来の障害監視シス
テムを図４に示す。この従来の障害監視システムは、マ
ネージャ１０と、エージェント３１〜３４とを備えてい
る。

【０００７】各エージェント３１〜３４では、それぞれ
監視項目Ａ₁₁〜Ａ₁₃、監視項目Ａ₂₁〜Ａ₂₃、監視項目Ａ
₃₁〜Ａ₃₃、監視項目Ａ₄₁〜Ａ₄₃の障害状態（正常または
障害）を監視している。そして、マネージャ１０はエー
ジェント３１〜３４の全ての監視項目Ａ₁₁〜Ａ₁₃、監視
項目Ａ₂₁〜Ａ₂₃、監視項目Ａ₃₁〜Ａ₃₃、監視項目Ａ₄₁〜
Ａ₄₃の監視を行っている。

【０００８】そして、マネージャ１０はそれぞれのエー
ジェント３１〜３４と通信プロトコルとしてＳＮＭＰを
用いていて、“ＧｅｔＲｅｑｕｅｓｔ”または“ＴＲ
ＡＰ”を利用してエージェント３１〜３４の全項目の監
視を直接行っている。また、この従来の障害監視システ
ムでは、ネットワーク５１〜５３はＬＡＮ（Ｌｏｃａｌ
ＡｒｅａＮｅｔｗｏｒｋ）またはＷＡＮ（Ｗｉｄｅ
ＡｒｅａＮｅｔｗｏｒｋ：広域通信網）４０を介し
てネットワーク接続されている。

【０００９】監視端末であるマネージャ１０はネットワ
ーク５１に接続され、ネットワーク５２に接続されてい
るエージェント３１、３２およびネットワーク５３に接
続されているエージェント３３、３４の監視をリアルタ
イムで行っている。

【００１０】このような従来の障害監視システムでは、
マネージャ１０は、エージェント３１〜３４の全ての監
視項目を直接監視する必要があるため、マネージャ１０
の処理の負荷およびマネージャ１０が接続されているネ
ットワーク５１のトラフィックの負荷が大きくなる。そ
のため、マネージャ１０からの定期的な“ＧｅｔＲｅ
ｑｕｅｓｔ”の頻度をあまり多くすることはできず、ポ
ーリング間隔が長くなってしまいマネージャ１０がリア
ルタイムにエージェント３１〜３４の障害状態を認識す
ることが困難であった。

【００１１】

【発明が解決しようとする課題】上述した従来の障害監
視システムでは、マネージャはエージェントの全ての監
視項目を直接監視する必要がるため、マネージャの処理
の負荷およびマネージャが接続されているネットワーク
のトラフィックの負荷が大きくなり、マネージャがリア
ルタイムにエージェントの正しい障害状態を認識するこ
とが困難であるという問題点があった。

【００１２】本発明の目的は、マネージャの処理の負荷
およびマネージャが接続されているネットワークのトラ
フィックの負荷を削減し、マネージャがリアルタイムに
エージェントの正しい障害状態を認識することができる
障害監視システムを提供することである。

【００１３】

【課題を解決するための手段】上記目的を達成するため
に、本発明は、マネージャと複数のエージェントから構
成され、前記マネージャにより前記各エージェントの障
害状態の変化を監視する障害監視システムにおいて、前
記複数のエージェントのうちの一部のエージェントの障
害状態の変化の監視を行い、監視を行っているエージェ
ントの監視項目のいずれかに障害が発生した場合、当該
エージェントに障害が発生したことを前記マネージャに
通知する複数のサブマネージャが設けられていることを
特徴とする。

【００１４】本発明は、マネージャとエージェント間に
サブマネージャを設け、マネージャの処理をサブマネー
ジャが分散して行うようにすることにより、マネージャ
はエージェントの障害状態のトータル情報だけを監視す
るだけでよいので、マネージャの処理の負荷が削減さ
れ、マネージャがリアルタイムにエージェントの正しい
障害状態を認識することができる。

【００１５】また、本発明の他の障害監視システムで
は、前記サブマネージャは、既に発生している障害より
も優先度の高い障害が発生した場合、および優先度の高
い障害が復旧した場合には前記マネージャに通知を行
う。本発明によれば、障害状態に対して優先度を設ける
ことにより、マネージャは優先度の低い障害が既に発生
している場合でも、優先度の高い障害状態の変化をリア
ルタイムで認識することができる。

【００１６】また、本発明の他の障害監視システムによ
れば、前記サブマネージャは、監視を行うエージェント
と同一のネットワークに接続されている。本発明によれ
ば、マネージャが接続されているネットワークのトラフ
ィックの負荷を削減することができる。

【００１７】また、本発明の他の障害監視システムによ
れば、前記マネージャと前記各サブマネージャとの間お
よび、前記サブマネージャと前記各エージェントとの間
で行われる通信の通信プロトコルとしてＳＮＭＰが用い
られている。

【００１８】

【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。

【００１９】（第１の実施形態）図１は本発明の第１の
実施形態の障害監視システムの構成を示すブロック図で
ある。図１において、図４中の構成要素と同一の構成要
素には同一の符号を付す。

【００２０】本実施形態の障害監視システムでは、図１
に示されるように、図４に示した従来の障害監視システ
ムに対して、マネージャ１０とエージェント３１〜３４
間にサブマネージャ２１、２２が設けられている。

【００２１】サブマネージャ２１はネットワーク５２上
に接続され、同一ネットワーク上にあるエージェント３
１、３２のすべての監視項目Ａ₁₁〜Ａ₁₃、Ａ₂₁〜Ａ₂₃の
監視をリアルタイムで行っている。そして、サブマネー
ジャ２１は、エージェント３１、３２の監視項目Ａ₁₁〜
Ａ₁₃、Ａ₂₁〜Ａ₂₃のいずれかに障害が発生しているかい
ないかを、トータル情報Ｂ₁、Ｂ₂を用いて管理してい
る。例えば、サブマネージャ２１は、エージェント３１
の監視項目Ａ₁₁〜Ａ₁₃のうちのいずれか１つでも障害状
態になっている場合には、エージェント３１のトータル
情報Ｂ₁を障害状態とする。

【００２２】サブマネージャ２２はネットワーク５３上
に接続され、同一ネットワーク上にあるエージェント３
３、３４のすべての監視項目Ａ₃₁〜Ａ₃₃、Ａ₄₁〜Ａ₄₃の
監視をリアルタイムで行っている。そして、サブマネー
ジャ２２は、サブマネージャ２１と同様に、エージェン
ト３３、３４の監視項目Ａ₃₁〜Ａ₃₃、Ａ₄₁〜Ａ₄₃のいず
れかに障害が発生しているかいないかを、トータル情報
Ｂ₃、Ｂ₄を用いて管理している。

【００２３】本実施形態におけるマネージャ１０はサブ
マネージャ２１、２２により解析された各エージェント
３１〜３４の全体での障害状態を示すトータル情報Ｂ₁
〜Ｂ₄だけをリアルタイムで監視している。

【００２４】サブマネージャ２１、２２はそれぞれエー
ジェント３１、３２またはエージェント３３、３４から
通知された状態変化をすべてマネージャ１０に通知する
のではなく、各エージェント３１〜３４のトータル状態
だけをマネージャ１０に通知する。

【００２５】本実施形態の障害監視システムでは、エー
ジェント３１〜３４の監視項目のいずれかの状態変化が
発生した場合、エージェント３１、３２ならばサブマネ
ージャ２１に対して、エージェント３３、３４ならばサ
ブマネージャ２２に対して状態変化が発生したことを示
す“ＴＲＡＰ”を送信する。

【００２６】サブマネージャ２１および２２はそれぞれ
エージェント３１、３２およびエージェント３３、３４
の監視項目およびトータル情報を保持し、各エージェン
トのトータル状態が変化した場合のみ、マネージャ１０
にエージェントのトータル情報の変化が発生したことを
“ＴＲＡＰ”を用いて通知する。

【００２７】“ＴＲＡＰ”ぬけが発生したことを考慮し
て、マネージャ１０からサブマネージャ２１、２２に対
して、定期的に“ＧｅｔＲｅｑｕｅｓｔ”を使用し
て、各エージェント３１〜３４のトータル状態を示すト
ータル情報Ｂ₁〜Ｂ₄の状態を獲得する。

【００２８】また、サブマネージャ２１はエージェント
３１、３２に対して、エージェント３１、３２の監視項
目（Ａ₁₁〜Ａ₁₃、Ａ₂₁〜Ａ₂₃）の状態を“ＧｅｔＲｅ
ｑｕｅｓｔ”を用いて定期的に獲得し、サブマネージャ
２２はエージェント３３、３４に対して、エージェント
３３、３４の監視項目（Ａ₃₁〜Ａ₃₃、Ａ₄₁〜Ａ₄₃）の状
態を“ＧｅｔＲｅｑｕｅｓｔ”を用いてて定期的に獲
得する。

【００２９】図４に示した従来の障害監視システムでは
マネージャ１０が全てのエージェント３１〜３４に対し
て全ての監視項目（Ａ₁₁〜Ａ₁₃、Ａ₂₁〜Ａ₂₃、Ａ₃₁〜Ａ
₃₃、Ａ₄₁〜Ａ₄₃）の状態を“ＧｅｔＲｅｑｕｅｓｔ”
を用いて直接獲得する必要があった。これに対して、本
実施形態の障害監視システムでは、マネージャ１０は、
サブマネージャ２１、２２に対して、各エージェント３
１〜３４のトータル情報Ｂ₁〜Ｂ₄の状態の獲得だけを行
えばよいため、送信を行う“ＧｅｔＲｅｑｕｅｓｔ”
数が少なくなり、“ＧｅｔＲｅｑｕｅｓｔ”のパケッ
トサイズも小さくなるため、マネージャ１０の処理負荷
およびびネットワーク５１のトラフィック負荷を少なく
することができる。

【００３０】本実施形態の障害監視システムによれば、
既に障害状態が発生しているエージェントにおいて、他
の監視項目の障害が発生したり、障害状態が復旧した場
合に、まだそのエージェントにて他の監視項目の障害が
発生してる場合、エージェントからマネージャ１０に
“ＴＲＡＰ”を送信する必要がなくなり、送信される
“ＴＲＡＰ”の量が少なくなることによって、マネージ
ャ１０の処理負荷が少なくなる。つまり、マネージャ１
０は通信する相手先が少なくなり、かつ獲得する情報量
が少なくなるため、定期的に“ＧｅｔＲｅｑｕｅｓ
ｔ”を行う頻度を多くすることが可能となる。

【００３１】本実施形態は、このような構成とすること
によって、マネージャ１０の処理負荷およびマネージャ
１０が接続されているネットワーク５１のトラフィック
負荷を少なくすることによって、ＳＮＭＰの“ＴＲＡ
Ｐ”を抜けをできるかぎり少なくし、マネージャ１０か
らの定期的な“ＧｅｔＲｅｑｕｅｓｔ”の頻度を多く
することが可能になるため、エージェント３１〜３４の
障害状態をできるだけリアルタイムに正しく認識するこ
とが可能になる。

【００３２】次に図２を参照して、本実施例のエージェ
ントにおける状態変化発生時の動作について詳細を説明
する。この図２では、エージェント３１の監視項目Ａ₁₁
〜Ａ ₁₃の状態変化を監視する場合について説明するが。

【００３３】エージェント３１の監視項目Ａ₁₁〜Ａ₁₃が
全て正常状態の場合、サブマネージャ２１が保持してい
るエージェント３１の監視項目Ａ₁₁〜Ａ₁₃およびトータ
ル情報Ｂ₁の状態は全て正常状態となっていて、マネー
ジャ１０が保持しているエージェント３１のトータル情
報Ｂ₁も正常状態となっている。

【００３４】この状態から、監視項目Ａ₁₁の状態が正常
状態から障害状態に変化した場合（ステップ１１１）、
エージェント３１は、監視項目Ａ₁₁の状態変化が発生し
たことを“ＴＲＡＰ”を用いてサブマネージャ２１に通
知する（ステップ１１２）。

【００３５】サブマネージャ２１はエージェント３１か
ら送信されてきた“ＴＲＡＰ”を解析して、監視項目Ａ
₁₁が正常状態から障害状態に変化したことを認識し、ト
ータル情報Ｂ₁を正常状態から障害状態に変化させる。
（ステップ１１３）そして、サブマネージャ２１は、エ
ージェント３１のトータル情報Ｂ₁の状態が変化したこ
とを“ＴＲＡＰ”を用いてマネージャ１０に通知する
（ステップ１１４）。

【００３６】マネージャ１０はサブマネージャ２１から
送信されてきた“ＴＲＡＰ”を解析して、トータル情報
Ｂ₁の状態が正常状態から障害状態に変化したことを認
識する（ステップ１１５）。

【００３７】次に、監視項目Ａ₁₁の障害が発生している
状態において、さらに監視項目Ａ₁₂の状態が正常状態か
ら障害状態に変化した場合（ステップ１２１）、エージ
ェント３１は、監視項目Ａ₁₂の状態変化が発生したこと
を“ＴＲＡＰ”を用いてサブマネージャ２１に通知す
る。（ステップ１２２）サブマネージャ２１はエージェント３１から送信されて
きた“ＴＲＡＰ”を解析して、監視項目Ａ₁₂が正常状態
から障害状態に変化したことを認識する（ステップ１２
３）。

【００３８】ただし、エージェント３１のトータル情報
Ｂ₁の状態はすでに障害状態になっているため、トータ
ル情報Ｂ₁の状態変化は発生しない。従ってサブマネー
ジャ２１はマネージャ１０に状態変化を通知するための
“ＴＲＡＰ”を送信しない。

【００３９】次に、監視項目Ａ₁₁、Ａ₁₂の障害が発生し
ている状態で、監視項目Ａ₁₁の状態が障害状態から正常
状態に変化した場合（ステップ１３１）、エージェント
３１は、監視項目Ａ₁₁の状態変化が発生したことを“Ｔ
ＲＡＰ”を用いてサブマネージャ２１に通知する。（ス
テップ１３２）サブマネージャ２１はエージェント３１から送信されて
きた“ＴＲＡＰ”を解析して、監視項目Ａ₁₁が障害状態
から正常状態に変化したことを認識する（ステップ１３
３）。

【００４０】ただし、エージェント３１の監視項目Ａ₁₁
の状態が正常状態になっても、監視項目Ａ₁₂の状態は依
然として障害状態のため、トータル情報Ｂ₁の状態は障
害状態のままであり、トータル情報Ｂ₁の状態変化は発
生しない。従ってサブマネージャ２１はマネージャ１０
には状態変化を通知するための“ＴＲＡＰ”を送信しな
い。

【００４１】次に、監視項目Ａ₁₂の障害が発生している
状態において、監視項目Ａ₁₂の状態が障害状態から正常
状態に変化した場合（ステップ１４１）、エージェント
３１は、監視項目Ａ₁₂の状態変化が発生したことを“Ｔ
ＲＡＰ”を用いてサブマネージャ２１に通知する。（ス
テップ１４２）サブマネージャ２１はエージェント３１から送信されて
きた“ＴＲＡＰ”を解析して、監視項目Ａ₁₂が障害状態
から正常状態に変化したことを認識し、トータル情報Ｂ
₁を障害状態から正常状態に変化させる。（ステップ１
４３）そして、サブマネージャ２１は、エージェント３１のト
ータル情報Ｂ₁の状態が変化したことを“ＴＲＡＰ”を
用いてマネージャ１０に通知する（ステップ１４４）。

【００４２】マネージャ１０はサブマネージャ２１から
送信されてきた“ＴＲＡＰ”を解析して、トータル情報
Ｂ₁の状態が障害状態から正常状態に変化したことを認
識する（ステップ１４５）。

【００４３】図４に示した従来の障害監視システムで
は、エージェント３１〜３４の監視項目のいずれかが変
化した場合、常にマネージャ１０に状態変化を通知する
ための“ＴＲＡＰ”の送信が行われていたが、本実施形
態の障害監視システムによれば、いずれかの監視項目に
て既に障害が発生している際に他の監視項目の障害が発
生した場合、または障害が復旧しても他の項目がまだ障
害状態の場合、サブマネージャ２１、２２からマネージ
ャ１０に対して“ＴＲＡＰ”が送信されない。そのた
め、マネージャ１０の処理負荷およびネットワーク５１
のトラフィック負荷を少なくすることができる。

【００４４】上記の説明では、マネージャ１０によりエ
ージェント３１の障害状態の監視を行う場合を用いて説
明したが、エージェント３２〜３４の障害状態の監視を
行う場合でも同様にして行われる。（第２の実施形態）次に、本発明の第２の実施形態の障
害監視システムについて説明する。

【００４５】上記で説明した本発明の第１の実施形態で
は、サブマネージャ２１、２２がマネージャ１０の代わ
りにエージェント３１〜３４の監視項目（Ａ₁₁〜Ａ₁₃、
Ａ₂₁〜Ａ₂₃、Ａ₃₁〜Ａ₃₃、Ａ₄₁〜Ａ₄₃）を管理して、マ
ネージャ１０ではサブマネージャ２１、２２が作成した
各エージェントのトータル情報（Ｂ₁〜Ｂ₄）だけを監視
するようにしている。

【００４６】しかし、上記第１の実施形態の障害監視シ
ステムでは、ある監視項目に障害が発生している状態
で、後から他の項目の障害が発生した場合、後から発生
した障害の発生はリアルタイムでマネージャ１０に通知
されない。つまり、後から発生した障害が重大な障害で
ありその障害の発生をリアルタイムでマネージャ１０に
通知する必要がある場合でも、サブマネージャがエージ
ェントのトータル情報だけをマネージャに通知する方法
だとマネージャは後から発生した重大な障害を認識する
ことができないという問題が発生する。

【００４７】本発明の第２の実施形態の障害監視システ
ムは、このような問題を解決するために障害状態に優先
度を持たせるようにしたものである。本実施形態の障害
監視システムでは、障害状態の優先度として軽度／重度
の２つの障害状態を設けており、重度の障害状態の方が
軽度の障害状態より優先度が高いものとして、優先度の
高い障害が発生している場合、優先度の低い障害の状態
変化が発生してもエージェントの障害状態は変化しない
ものとする。

【００４８】次に、本実施形態の障害監視システムの動
作を図３のシーケンス図を参照して説明する。図３はエ
ージェント３１の監視項目Ａ₁₁の障害状態を軽度の障害
状態、監視項目Ａ₁₂の障害状態を重度の障害状態と設定
した場合のシーケンス図である。

【００４９】エージェント３１の監視項目Ａ₁₁〜Ａ₁₃が
全て正常状態の場合、サブマネージャ２１が保持してい
るエージェント３１の監視項目Ａ₁₁〜Ａ₁₃およびトータ
ル情報Ｂ₁の状態は全て正常状態となっていて、マネー
ジャ１０が保持しているエージェント３１のトータル情
報Ｂ₁は正常状態となっている。

【００５０】この状態から、監視項目Ａ₁₁の状態が正常
状態から障害状態に変化した場合（ステップ２１１）、
エージェント３１は、エージェント３１の監視項目Ａ₁₁
の状態変化が発生したことを“ＴＲＡＰ”を用いてサブ
マネージャ２１に通知する（ステップ２１２）。

【００５１】サブマネージャ２１はエージェント３１か
ら送信されてきた“ＴＲＡＰ”を解析して、監視項目Ａ
₁₁が正常状態から障害状態に変化したことを認識する。
そして、サブマネージャ２１は、監視項目Ａ₁₁は優先度
が低い障害状態であるため、トータル情報Ｂ₁を正常状
態から軽度の障害状態に変化させる（ステップ２１
３）。

【００５２】そして、サブマネージャ２１は、エージェ
ント３１のトータル情報Ｂ₁の状態が変化したことを
“ＴＲＡＰ”を用いてマネージャ１０に通知する。（ス
テップ２１４）マネージャ１０はサブマネージャ２１か
ら送信されてきた“ＴＲＡＰ”を解析して、トータル情
報Ｂ₁の状態が正常状態から軽度の障害状態に変化した
ことを認識する（ステップ２１５）。

【００５３】次に、監視項目Ａ₁₁の障害が発生している
状態で、監視項目Ａ₁₂の状態が正常状態から障害状態に
変化した場合（ステップ２２１）、エージェント３１
は、監視項目Ａ₁₂の状態変化が発生したことを“ＴＲＡ
Ｐ”を用いてサブマネージャ２１に通知する（ステップ
２２２）。

【００５４】サブマネージャ２１はエージェント３１か
ら送信されてきた“ＴＲＡＰ”を解析して、監視項目Ａ
₁₂が正常状態から障害状態に変化したことを認識し、監
視項目Ａ₁₂は優先度が高いため、トータル情報Ｂ₁を軽
度の障害状態から重度の障害状態に変化させる（ステッ
プ２２３）。

【００５５】エージェント３１のトータル情報Ｂ₁の状
態の状態が軽度の障害状態から重度の障害状態に変化し
たため、サブマネージャ２１はエージェント３１のトー
タル情報Ｂ₁の状態が変化したことを“ＴＲＡＰ”を用
いてマネージャ１０に通知する（ステップ２２４）。

【００５６】マネージャ１０はサブマネージャ２１から
送信されてきた“ＴＲＡＰ”を解析して、トータル情報
Ｂ₁の状態が軽度の障害状態から重度の障害状態に変化
したことを認識する（ステップ２２５）。

【００５７】次に、監視項目Ａ₁₁、監視項目Ａ₁₂の障害
が発生している状態で、監視項目Ａ ₁₁の状態が障害状態
から正常状態に変化した場合（ステップ２３１）、エー
ジェント３１は、エージェント３１の監視項目Ａ₁₁の状
態変化が発生したことを“ＴＲＡＰ”を用いてサブマネ
ージャ２１に通知する（ステップ２３２）。

【００５８】サブマネージャ２１はエージェント３１か
ら送信されてきた“ＴＲＡＰ”を解析して、監視項目Ａ
₁₁が障害状態から正常状態に変化したことを認識する
（ステップ２３３）。

【００５９】ただし、エージェント３１の監視項目Ａ₁₁
の状態が正常状態になっても、監視項目Ａ₁₂の状態が障
害状態のため、トータル情報Ｂ₁の状態は重度の障害状
態のままとし、状態変化は発生しない。従ってサブマネ
ージャ２１はマネージャ１０には状態変化を通知するた
めの“ＴＲＡＰ”を送信しない。

【００６０】次に、監視項目Ａ₁₂の障害が発生している
状態で、監視項目Ａ₁₂の状態が障害状態から正常状態に
変化した場合（ステップ２４１）、エージェント３１は
エージェント３１の監視項目Ａ₁₂の状態変化が発生した
ことを“ＴＲＡＰ”を用いてサブマネージャ２１に通知
する（ステップ２４２）。

【００６１】サブマネージャ２１はエージェント３１か
ら送信されてきた“ＴＲＡＰ”を解析して、監視項目Ａ
₁₂が障害状態から正常状態に変化したことを認識し、ト
ータル情報Ｂ₁が重度の障害状態から正常状態に変化し
たことを認識する（ステップ２４３）。

【００６２】エージェント３１のトータル情報Ｂ₁の状
態の状態が重度の障害状態から正常状態に変化したた
め、サブマネージャ２１はエージェント３１のトータル
情報Ｂ ₁の状態が変化したことを“ＴＲＡＰ”を用いて
マネージャ１０に通知する（ステップ２４４）。

【００６３】マネージャ１０はサブマネージャ２１から
送信されてきた“ＴＲＡＰ”を解析して、トータル情報
Ｂ₁の状態が重度の障害状態から正常状態に変化したこ
とを認識する（ステップ２４５）。

【００６４】上記で説明したように、本実施形態の障害
監視システムによれば、既に障害が発生していてもその
障害の優先度より高い優先度の障害が発生した場合に
は、サブマネージャ２１、２２はマネージャ１０にその
障害状態の変化を“ＴＲＡＰ”を使用して通知するが、
優先度の高い障害が既に発生している場合、その障害よ
りも優先度の低い障害が発生／復旧してもサブマネージ
ャからマネージャ１０には“ＴＲＡＰ”を送信しない。
また、優先度の高い障害と低い障害が既に発生している
場合、優先度の低い障害が復旧した場合には、サブマネ
ージャ２１、２２はマネージャ１０に障害状態の変化を
通知しないが、優先度の高い障害が復旧した場合には、
マネージャ１０に障害状態の変化を通知する。

【００６５】したがって、本実施形態によれば、上記第
１の実施形態による効果に加えて、障害状態に対して優
先度を設けることにより、マネージャ１０は優先度の低
い障害が既に発生している場合でも、優先度の高い障害
状態の発生／復旧の変化をリアルタイムで認識すること
ができる。

【００６６】上記第１および第２の実施形態では、マネ
ージャ１０とサブマネージャ２１、２２との間およびサ
ブマネージャ２１、２２と各エージェント３１〜３４と
の間の通信は、通信プロトコルとしてＳＮＭＰが用いら
れている場合について説明したが、本発明はこのような
場合に限定されるものではなく、コネクションレスの他
の通信プロトコルが用いられる場合でも同様に適用する
ことができるものである。

【００６７】

【発明の効果】以上説明したように、本発明によれば、
下記のような効果を得ることができる。（１）マネージャの処理を複数のサブマネージャに分散
させることでマネージャの処理負荷を削減することがで
き、またサブマネージャをエージェントと同一のネット
ワーク上に置くことによって、マネージャが接続されて
いるネットワークのトラフィックの負荷を削減すること
ができる。そのため、“ＧｅｔＲｅｑｕｅｓｔ”を使
用する頻度を多くすることが可能になり、よりリアルタ
イムにエージェントの正しい障害状態を認識することが
できる。（２）さらに、障害状態に優先度を設けることにより、
ある監視項目で障害が既に発生している際に、その監視
項目の優先度よりも高い優先度の監視項目で障害が発生
した場合には、マネージャはその障害の発生をリアルタ
イムに認識することができる。

【図面の簡単な説明】

【図１】本発明の第１の実施形態の障害監視システムの
構成を示すブロック図である。

【図２】図１の障害監視システムの動作を示すシーケン
ス図である。

【図３】本発明の第２の実施形態の障害監視システムの
動作を示すシーケンス図である。

【図４】従来の障害監視システムの構成を示すブロック
図である。

【符号の説明】

１０マネージャ２１、２２サブマネージャ３１〜３４エージェント４０ＷＡＮ／ＬＡＮ５１〜５３ネットワーク１１１〜１４５ステップ２１１〜２４５ステップＡ₁₁〜Ａ₁₃、Ａ₂₁〜Ａ₂₃、Ａ₃₁〜Ａ₃₃、Ａ₄₁〜Ａ₄₃
監視項目Ｂ₁〜Ｂ₄ トータル情報

Claims

【特許請求の範囲】

【請求項１】マネージャと複数のエージェントから構
成され、前記マネージャにより前記各エージェントの障
害状態の変化を監視する障害監視システムにおいて、前記複数のエージェントのうちの一部のエージェントの
障害状態の変化の監視を行い、監視を行っているエージ
ェントの監視項目のいずれかに障害が発生した場合、当
該エージェントに障害が発生したことを前記マネージャ
に通知する複数のサブマネージャが設けられていること
を特徴とする障害監視システム。
【請求項２】前記サブマネージャは、既に発生してい
る障害よりも優先度の高い障害が発生した場合、および
優先度の高い障害が復旧した場合には前記マネージャに
通知を行う請求項１記載の障害監視システム。
【請求項３】前記サブマネージャは、監視を行うエー
ジェントと同一のネットワークに接続されている請求項
１または２記載の障害監視システム。
【請求項４】前記マネージャと前記各サブマネージャ
との間および、前記サブマネージャと前記各エージェン
トとの間で行われる通信の通信プロトコルとしてＳＮＭ
Ｐが用いられている請求項１から３のいずれか１項記載
の障害監視システム。