JP2006222808A - 通信ネットワークにおける障害の原因を特定する障害管理装置および方法 - Google Patents

通信ネットワークにおける障害の原因を特定する障害管理装置および方法 Download PDF

Info

Publication number
JP2006222808A
JP2006222808A JP2005035170A JP2005035170A JP2006222808A JP 2006222808 A JP2006222808 A JP 2006222808A JP 2005035170 A JP2005035170 A JP 2005035170A JP 2005035170 A JP2005035170 A JP 2005035170A JP 2006222808 A JP2006222808 A JP 2006222808A
Authority
JP
Japan
Prior art keywords
communication
layer
information
failure
topology
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005035170A
Other languages
English (en)
Other versions
JP4523444B2 (ja
Inventor
Keiichi Oguro
啓一 小黒
Koyo Watanabe
幸洋 渡辺
Kuniaki Shimada
邦昭 嶋田
Ken Yokoyama
乾 横山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005035170A priority Critical patent/JP4523444B2/ja
Priority to US11/270,833 priority patent/US8270306B2/en
Publication of JP2006222808A publication Critical patent/JP2006222808A/ja
Application granted granted Critical
Publication of JP4523444B2 publication Critical patent/JP4523444B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Abstract

【課題】 通信ネットワークのどのレイヤで障害が発生していても、管理者のスキルに依存することなく発生箇所を特定する。
【解決手段】 前記監視対象の送信元と宛先の間の通信状態が通信可から通信不可へ変化する前と後の通信可否情報を比較して、通信可から通信不可へ変化した経路の宛先をグループ化することで、通信ネットワークを障害の影響を受ける複数の影響範囲に分割する処理を、探索開始レイヤから下位レイヤに向かってレイヤ毎に繰り返して、障害の原因となる機器とレイヤを特定する。
【選択図】図27

Description

本発明は、複数の機器から構成される通信ネットワークの運用管理に係り、通信に異常が発生した場合に障害の原因を特定する障害管理装置および方法に関する。
インターネットの普及に伴い、インターネットデータセンタ(IDC)、様々なサービスプロバイダ(xSP)、企業内ネットワーク等の大規模化・複雑化・高機能化によるネットワーク障害が問題となっている。このような障害発生時には、ネットワーク管理者が障害の原因特定と復旧に対応できるよう、迅速に障害の影響範囲と発生箇所(どの機器のどのレイヤか)を特定することが重要である。
従来の障害監視システムとしては、ping(Packet INternet Groper)やSNMP(Simple Network Management Protocol)等を用いて2点間の通信の可否および状態をチェックするシステムが知られている。また、ネットワーク上で発生した障害の影響範囲を容易に判別可能なように表示する装置も提案されている(例えば、下記の特許文献1参照)。
特開2004−222105号公報
しかしながら、上述した従来の障害監視システムでは、2点間の通信に異常があることが分かっても、どの機器のどのレイヤが原因になっているのかが分からない。このため、ネットワーク管理者は、最終的に経験とノウハウにより障害が発生した機器や回線を特定する必要があり、障害の影響範囲や発生箇所を正確に特定できなかったり、特定するまでに時間がかかっていた。
本発明の課題は、通信ネットワークのどのレイヤで障害が発生していても、管理者のスキルに依存することなく発生箇所を特定することができる障害管理装置および方法を提供することである。
図1は、本発明の障害管理装置の原理図である。図1の障害管理装置は、入力手段101、生成手段102、格納手段103、特定手段104、および出力手段105を備え、複数のレイヤによる階層構成の通信機能を有する通信ネットワーク上における障害の原因を特定する。
入力手段101は、監視対象の送信元と宛先を指定する監視情報を入力する。生成手段102は、監視対象の送信元と宛先の間の通信状態が通信可から通信不可へ変化する前と変化した後において、各レイヤにおける複数の送信元と複数の宛先の間の通信可否を示す通信可否情報を生成する。格納手段103は、生成された通信可否情報を格納する。
特定手段104は、監視対象の通信状態が変化する前と後の通信可否情報を比較して、通信可から通信不可へ変化した経路の宛先をグループ化することで、通信ネットワークを障害の影響を受ける複数の影響範囲に分割し、影響範囲の境界上にある機器のインタフェースを障害発生箇所と推定する処理を、探索開始レイヤから下位レイヤに向かってレイヤ毎に繰り返して、障害の原因となる機器とレイヤを特定する。出力手段105は、上記複数の影響範囲と障害発生箇所の情報を出力する。
このような障害管理装置によれば、複数のレイヤの中の探索開始レイヤから下位レイヤに向かって、レイヤ毎に機器間の通信可否がチェックされ、障害発生箇所が絞り込まれていくため、障害の原因となる機器とレイヤが自動的に特定される。
入力手段101は、例えば、後述する図49の入力装置4703に対応し、生成手段102および特定手段104は、例えば、図49のCPU(中央処理装置)4701に対応し、格納手段103は、例えば、図49のメモリ4702または外部記憶装置4705に対応し、出力手段105は、例えば、図49の出力装置4704に対応する。また、通信可否情報は、例えば、後述する図6、11、16、21、および26の通信可否マトリクスに対応する。
本発明によれば、通信ネットワークの任意のレイヤで発生した障害の発生箇所を、管理者のスキルに依存することなく自動的に特定することができる。
以下、図面を参照しながら、本発明を実施するための最良の形態を詳細に説明する。
本実施形態の障害管理装置は、機器から取得できるトポロジ情報から、ネットワーク構成および正常時と異常時の通信経路と通信可否を認識し、それらの情報に基いて障害が発生した機器およびその機器内のサービスを特定して、画面上に表示する。トポロジとは、ネットワークを構成する機器同士の物理的・論理的な接続構成を意味する。
図2は、管理対象となる通信ネットワークの例を示している。このネットワークは、クライアントコンピュータA、ファイアウォールB、DNS(Domain Name System)サーバC、負荷分散装置(Load Balancer )D、ウェブサーバE、F、アプリケーションサーバG、データベースサーバH、ルータI、J、およびスイッチK、L、Mの各機器で構成され、複数のレイヤによる階層構成の通信機能を有する。ここでは、上位から下位に向かって以下のような5つのレイヤが存在するものとする。
(1)アプリケーションレイヤ
サービス同士の論理接続等を担当する。
(2)トランスミッション制御プロトコル/ユーザデータグラムプロトコル(Transmission Control Protocol/User Datagram Protocol,TCP/UDP)レイヤ
フィルタリング・アドレス変換・負荷分散装置等による論理接続を担当する。
(3)インターネットプロトコル(Internet Protocol,IP)レイヤ
サブネット同士の論理接続を担当する。
(4)メディアアクセス制御(Media Access Control,MAC)レイヤ
仮想ローカルエリアネットワーク(Virtual Local Area Network,VLAN)による論理接続等を担当する。
(5)物理レイヤ
ケーブルによる物理接続を担当する。
ファイアウォールBは、TCP/UDPレイヤでパケットフィルタリングを行い、ルータIおよびJは、IPレイヤでパケット転送を行い、スイッチK、L、Mは、MACレイヤでパケット転送を行う。負荷分散装置Dは、ウェブサーバEおよびFの負荷分散の制御を行う。
DNSサーバCは、アプリケーションレイヤで名前解決サービスを提供し、ウェブサーバEおよびFは、アプリケーションレイヤでウェブサービスを提供し、アプリケーションサーバGは、アプリケーションレイヤでミドルウェアサービスを提供し、データベースサーバHは、アプリケーションレイヤでデータベースサービスを提供する。クライアントコンピュータAは、ネットワークを介してこれらのサーバが提供するサービスを利用する。
各レイヤにおいて、機器間の物理/論理接続は「リンク」で表され、リンクに使用される機器の物理/論理インタフェースは「コネクタ」で表され、通信の終端を行ったり、機器内の複数コネクタ間でデータの転送を行う機能は「サービス」で表される。各機器は「ノード」で表され、各レイヤにおけるトポロジは、リンク、コネクタ、およびサービスという3つの簡潔な要素で表現される。以下では、各機器の名称の代わりにノードA〜Mという表記を用いることにする。
図3は、図2のネットワークのコネクタ表現を示している。各ノード内の丸印“○”はコネクタを表す。ノードA、B、C、D、E、F、G、およびHはすべてのレイヤのコネクタを持ち、ノードIおよびJはIPレイヤ、MACレイヤ、および物理レイヤのコネクタを持ち、ノードK、M、およびLはMACレイヤおよび物理レイヤのコネクタを持つ。
ノードAのサービス301、ノードCのサービス305、ノードEのサービス308、ノードFのサービス309、ノードGのサービス312、およびノードHのサービス313は、アプリケーションレイヤにおいて通信の終端を行うサービスである。
また、ノードBのサービス302およびノードDのサービス306は、ノード内部のアプリケーションレイヤのコネクタ間でデータ転送を行うサービスであり、ノードIのサービス303およびノードJのサービス310は、ノード内部のIPレイヤのコネクタ間でデータ転送を行うサービスであり、ノードKのサービス304、ノードLのサービス311、およびノードMのサービス307は、ノード内部のMACレイヤのコネクタ間でデータ転送を行うサービスである。
このようなレイヤ毎のトポロジを重ねて表現することで、各レイヤにおけるリンクを下位レイヤの複数のリンクで表現することができる。これは、下位レイヤで障害が発生してリンクが切れた場合、その影響を受けて上位レイヤのリンクも切れるということを意味している。このため、各レイヤにおいて障害の影響範囲と発生箇所を求めて、上位レイヤから下位レイヤへドリルダウンしていけば、特定のサービスにおける障害の影響範囲と発生箇所を推定することができる。
そこで、障害管理装置は、各レイヤにおいて、障害発生前後の通信可否マトリクスを生成し、そのマトリクスから導出した障害の影響範囲と発生箇所を画面上に表示する。通信可否マトリクスは、入力情報から2つのノード間における障害発生前後の通信可否を調べて、その結果をマトリクスで表現したものである。
以下の説明では、障害の具体例として、ノードMのMACレイヤのコネクタ321におけるVLAN設定に誤りがあり、正しいコネクタ322とは異なる相手をVLANとして設定した場合を想定している。しかしながら、障害発生箇所は1箇所に限られるわけではなく、複数箇所で障害が発生した場合でも、障害の影響範囲と発生箇所を導出することができる。
まず、図4から図9までを参照しながら、アプリケーションレイヤにおける障害発生箇所の推定方法について説明する。
図4は、図2のネットワークのアプリケーションレイヤのトポロジ(リンク、コネクタ、およびサービス)を示している。このレイヤのコネクタ間の接続関係は、図5のような樹形図で表すことができる。
図6は、アプリケーションレイヤにおける通信可否マトリクスを示している。マトリクスの各行および各列のノードは、それぞれ、通信における送信元および宛先を表し、正常時および障害発生時は、それぞれ、障害発生前および後のマトリクスを表す。丸印“○”およびバツ印“×”は、それぞれ、通信可および通信不可を表し、ハイフン“−”は、通信の対象外であることを表す。
ここでは、ウェブサービスの通信を対象としているため、ノードA〜Dは宛先として選択されていない。また、正常時において、クライアントAはウェブサーバEおよびFと通信することができるが、アプリケーションサーバGおよびデータベースサーバHとは通信することができない。
障害発生時のマトリクスの灰色にハッチングされた箇所は、正常時のマトリクスに比べて変化があった経路を示している。ここでは、ノードA〜DおよびG〜HとノードE間の経路と、ノードA〜DおよびG〜HとノードF間の経路と、ノードE〜FとノードG間の経路と、ノードE〜FとノードH間の経路の状態が通信可から通信不可に変化したことを示している。これらの経路においては、MACレイヤで発生した障害の影響を受けて通信ができなくなっている。
障害管理装置は、この通信可否マトリクスにおいて、同一経路における障害前後の通信可否を比較する。その結果、通信可否に変化があった経路を含む列をグルーピングして影響範囲の切り分けを行い、障害発生箇所を絞り込む。
このとき、各ノードのコネクタを、宛先E、F、G、およびHの各コネクタに対して接続可能(通信可能)なコネクタと接続不可能なコネクタとにグルーピングし、図5に示した樹形図を接続可能範囲と接続不可範囲に切り分けると、図7のようになる。例えば、ノードEのコネクタに対しては、ノードFのコネクタとノードDのコネクタ701のみが接続可能であり、ノードDのコネクタ702と他のノードのコネクタは接続不可能であることが分かる。さらに、宛先EおよびFの樹形図をマージし、宛先GおよびHの樹形図をマージすると、図8のようになる。
障害管理装置は、図8の2つの樹形図は相反している(接続可能範囲と接続不可範囲が互いに入れ替わった関係にある)ため、障害の影響範囲は2つの範囲に切り分けられると判断し、図9に示すように、アプリケーションレイヤにおける影響範囲1および2を生成する。
この場合、各影響範囲内ではノード間の通信が可能であるが、影響範囲の境界を跨ぐノード間では通信は不可能である。また、影響範囲の境界とネットワーク接続が交差する点が障害境界点となり、その点を挟む2つのコネクタ701および702が障害発生箇所と推定される。
ここで、障害発生箇所と推定されたコネクタ701には複数のノードEおよびFが接続されているため、障害管理装置は、障害の原因が下位レイヤにあると判定し、下位レイヤの探索を続行する。したがって、1つ下のTCP/UDPレイヤで同様の処理が行われる。
次に、図10から図14までを参照しながら、TCP/UDPレイヤにおける障害発生箇所の推定方法について説明する。
図10は、図2のネットワークのTCP/UDPレイヤのトポロジを示しており、図11は、このレイヤにおける通信可否マトリクスを示している。このマトリクスでは、障害発生時に、ノードDとノードE間の経路およびノードDとノードF間の経路の状態が通信不可に変化している。
このとき、変化があった宛先D、E、およびFのみを対象として、接続可能範囲と接続不可範囲を示す樹形図を生成すると、図12のようになる。さらに、宛先EおよびFの樹形図をマージすると、最終的に図13のような樹形図が生成される。
障害管理装置は、図13の2つの樹形図から、図14に示すような影響範囲1および2を生成し、影響範囲の境界上の障害境界点を挟むコネクタ1401および1402を障害発生箇所と推定する。ここで、コネクタ1401には複数のノードEおよびFが接続されているため、下位レイヤの探索を続行し、1つ下のIPレイヤで同様の処理を行う。
次に、図15から図18までを参照しながら、IPレイヤにおける障害発生箇所の推定方法について説明する。
図15は、図2のネットワークのIPレイヤのトポロジを示しており、図16は、このレイヤにおける通信可否マトリクスを示している。このマトリクスでは、障害発生時に、ノードDとノードE間の経路およびノードDとノードF間の経路の状態が通信不可に変化している。
このとき、変化があった宛先D、E、およびFのみを対象として、接続可能範囲と接続不可範囲を示す樹形図を生成すると、図17のようになる。さらに、宛先EおよびFの樹形図をマージすると、最終的に図18のような樹形図が生成される。
障害管理装置は、図18の2つの樹形図から、図19に示すような影響範囲1および2を生成し、影響範囲の境界上の障害境界点を挟むコネクタ1801および1802を障害発生箇所と推定する。ここで、コネクタ1801には複数のノードEおよびFが接続されているため、下位レイヤの探索を続行し、1つ下のMACレイヤで同様の処理を行う。
次に、図20から図24までを参照しながら、MACレイヤにおける障害発生箇所の推定方法について説明する。
図20は、図2のネットワークのMACレイヤのトポロジを示しており、図21は、このレイヤにおける通信可否マトリクスを示している。このマトリクスでは、障害発生時に、ノードDとノードE間の経路およびノードDとノードF間の経路の状態が通信不可に変化している。
このとき、変化があった宛先D、E、およびFのみを対象として、接続可能範囲と接続不可範囲を示す樹形図を生成すると、図22のようになる。さらに、宛先EおよびFの樹形図をマージすると、最終的に図23のような樹形図が生成される。
障害管理装置は、これらの樹形図から、図24に示すような影響範囲1および2を生成し、影響範囲の境界上の障害境界点を挟むコネクタ321および322を障害発生箇所と推定する。ここで、コネクタ321および322にはそれぞれ1つのノードのみが接続されているため、このレイヤで障害が発生しているものと判断する。そして、下位レイヤの探索を続行し、1つ下の物理レイヤで同様の処理を行う。
次に、図25および26を参照しながら、物理レイヤにおける障害発生箇所の推定方法について説明する。
図25は、図2のネットワークの物理レイヤのトポロジを示しており、図26は、このレイヤにおける通信可否マトリクスを示している。この場合、正常時と障害発生時のマトリクスが全く同じであり、このレイヤでは障害が認識されないことが分かる。
障害管理装置は、図27に示すように、各レイヤにおける障害の影響範囲と発生箇所をまとめて画面上に表示する。実際には、MACレイヤの障害境界点を挟む2つのコネクタのうちいずれが障害発生箇所となるかは、通信可否の情報とサービス識別子から特定される。ここでは、影響範囲1と影響範囲2の境界上にあるノードM(スイッチ)が障害発生機器として特定され、以下の情報が障害発生箇所として提示される。
・ノード:M
・レイヤ:MACレイヤ
・コネクタ:1(コネクタ321)
・サービス:学習MAC1,ポートVLAN
ユーザは、表示された影響範囲と発生箇所に応じて、ノードMのVLAN設定を修正する等の復旧作業を行う。
このように、障害の影響範囲と発生箇所を通信機能の階層構成と対応させて画面上に表示することで、障害管理装置のユーザは迅速かつ適切な復旧作業を行うことができ、熟練管理者不足の問題に対応することが可能になる。また、障害管理装置は、復旧作業の自律制御にも適用可能である。さらに、ネットワーク上のクライアントコンピュータやサーバ等の機器のユーザに対して、障害状況や利用可能サービス等の情報を通知することも可能になる。
次に、図28から図30までを参照しながら、障害管理装置の配置例について説明する。
図28は、図2のネットワークを管理するために、擬似クライアントと障害管理装置を設けた構成を示している。この構成では、擬似クライアントコンピュータOがスイッチNを介してファイアウォールBに接続されている。この場合、擬似クライアントコンピュータOのセキュリティ確保のため、ファイアウォールBにおいて、クライアントコンピュータAからルータIへの通信と、擬似クライアントコンピュータOからルータIへの通信に同じポリシールールが適用され、コンピュータAとコンピュータO間で接続関係を持たないように制御される。
障害管理装置2701は、スイッチ2702を介して運用管理系のネットワークに接続されており、このネットワークを介して各機器から情報を取得することができる。障害管理装置2701は、ユーザが選択したアプリケーション(サービス)による擬似クライアントコンピュータOと任意の宛先の間で通信を試行し、その結果を監視することで、障害の発生を検出する。
図29は、図28の擬似クライアントコンピュータOの機能を障害管理装置に組み込んだ構成を示している。この構成では、障害管理装置2801は、スイッチ2702を介して運用管理系のネットワークに接続されるとともに、スイッチNを介してファイアウォールBに接続されており、擬似クライアントコンピュータOとしての役割も果たす。
図30は、擬似クライアントを持たない構成を示している。この構成では、障害管理装置2901は、スイッチ2702を介して運用管理系のネットワークに接続されており、定期的にトポロジ探索を実行する。そして、ユーザが選択したサービスによるクライアントコンピュータAと任意の宛先の間でのデータの到達可否を判定することで、障害の発生を検出する。
次に、図31から図36までを参照しながら、障害管理装置が用いるデータの構成について説明する。
図31は、障害監視のために用いるノード情報のデータ構造を示している。ノード情報は、管理対象のネットワークを構成する機器の設定情報であり、必要に応じて各機器から取得される。
このノード情報は、各ノードの属性情報およびレイヤ情報からなり、属性情報はノード識別子と管理用IPアドレスを含む。また、レイヤ情報は、物理レイヤ、MACレイヤ、IPレイヤ、TCP/UDPレイヤ、およびアプリケーションレイヤの情報からなり、各レイヤの情報は、コネクタおよびサービスの情報を含む。
図32は、図31のアプリケーションレイヤのデータ構造を示している。このレイヤのコネクタの情報は、コネクタ識別子(プロセスID、プロセス名、TCP/UDPレイヤ接続ポート番号)を含み、サービスの情報は、アプリケーション識別子およびルール識別子を含む。
図33は、図31のTCP/UDPレイヤのデータ構造を示している。このレイヤのコネクタの情報は、コネクタ識別子(プロトコル、コネクション識別子)を含み、サービスの情報は、フィルタ/アドレス変換ルール識別子を含む。
図34は、図31のIPレイヤのデータ構造を示している。このレイヤのコネクタの情報は、コネクタ識別子(IPアドレス、ネットマスク)を含み、サービスの情報は、ルータ動作識別子およびルーティング・テーブル・エントリ識別子(宛先IPアドレス、インタフェース識別子、ネクストホップのIPアドレス、ルーティングメトリック、ネクストホップのネットマスク)を含む。
図35は、図31のMACレイヤのデータ構造を示している。このレイヤのコネクタの情報は、コネクタ識別子(インタフェースのMACアドレス)を含み、サービスの情報は、学習MACエントリ識別子、ポートVLAN識別子、タグVLAN識別子、リンクアグリゲーション識別子、およびSTP(Spanning Tree Protocol)識別子を含む。
図36は、図31の物理レイヤのデータ構造を示している。このレイヤのコネクタの情報は、コネクタ識別子を含む。
次に、図37から図43までを参照しながら、このようなノード情報を用いた障害監視処理について説明する。
障害管理装置は、正常時において、あらかじめ管理対象のネットワークのサービスを運用している各機器からトポロジ情報を取得し、正常時の通信可否マトリクスを生成しておく。そして、障害発生後も同様にしてトポロジ情報を取得し、同一ネットワークに対して異常時の通信可否マトリクスを生成する。そして、正常時と異常時の通信可否マトリクスを比較して、障害の発生を検出する。
図37は、図28または29の構成において擬似クライアントコンピュータOの機能を用いた場合の障害監視処理のフローチャートである。ユーザが障害管理装置に監視情報を入力すると(ステップ3601)、障害管理装置は、ネットワークのトポロジ探索を実行する(ステップ3602)。これにより、上述したノード情報を含むトポロジ情報が生成され、障害管理装置内に保存される。
次に、障害管理装置は、得られたトポロジ情報を用いて、擬似クライアントコンピュータOと監視情報により指定された宛先の間の経路探索を実行し(ステップ3603)、この2点間のデータの到達可否を判定する(ステップ3604)。この判定ではデータ到達性のシミュレーションが行われ、実際の通信は行われない。データ到達不可の場合は、処理を終了する。
データ到達可の場合は、通信可否マトリクスを生成し(ステップ3609)、それが正常時のデータか否かをチェックする(ステップ3610)。通信可否マトリクスが正常時のデータであれば、擬似クライアントコンピュータOと指定された宛先の間で実際に通信を試行し(ステップ3605)、擬似クライアントコンピュータOから正常終了の応答が返されたか否かをチェックする(ステップ3606)。
正常終了の応答を受け取った場合は、定期監視のため一定時間の経過を待ち合わせ(ステップ3607)、ステップ3605以降の処理を繰り返す。正常終了の応答を受け取らなかった場合は、トポロジ探索を実行し(ステップ3608)、ステップ3609以降の処理を行う。
ステップ3610において通信可否マトリクスが正常時のデータと異なれば、障害が発生したものと判断し、障害発生箇所導出処理を行う(ステップ3611)。
ステップ3602および3608のトポロジ探索処理およびステップ3603の経路探索処理の詳細については、後述することにする。
図38は、図30の構成における障害監視処理のフローチャートである。ユーザが障害管理装置に監視情報を入力すると(ステップ3701)、障害管理装置は、トポロジ探索を実行する(ステップ3702)。
次に、障害管理装置は、得られたトポロジ情報を用いて、クライアントコンピュータAと監視情報により指定された宛先の間の経路探索を実行し(ステップ3703)、この2点間のデータの到達可否を判定する(ステップ3704)。データ到達不可の場合は、処理を終了する。
データ到達可の場合は、通信可否マトリクスを生成し(ステップ3710)、それが正常時のデータか否かをチェックする(ステップ3711)。通信可否マトリクスが正常時のデータであれば、障害監視を開始して(ステップ3705)、トポロジ探索を実行する(ステップ3706)。そして、ステップ3702と同様の経路探索を実行し(ステップ3707)、データの到達可否を判定する(ステップ3708)。
データ到達可の場合は、一定時間の経過を待ち合わせ(ステップ3709)、ステップ3705以降の処理を繰り返す。データ到達不可の場合は、ステップ3710以降の処理を行う。
ステップ3711において通信可否マトリクスが正常時のデータと異なれば、障害が発生したものと判断し、障害発生箇所導出処理を行う(ステップ3712)。
図39は、図37のステップ3601および図38のステップ3701における監視情報入力処理のフローチャートである。ユーザは、まず、通信に用いるサービスを選択し(ステップ3801)、擬似クライアントコンピュータOのブラウザを起動する(ステップ3802)。そして、監視対象となる宛先IPアドレスまたはホスト名を入力し(ステップ3803)、パスを入力する(ステップ3804)。
障害管理装置は、リクエスト情報を生成し(ステップ3805)、その情報を監視情報として、起動されたブラウザへ入力する(ステップ3806)。ただし、図38のステップ3701では、ステップ3806の処理はスキップされる。
また、生成されたリクエスト情報は、図37のステップ3603および図38のステップ3703、3707における経路探索でも用いられる。
例えば、ウェブサービス(WWW:http)が選択され、宛先IPアドレスとして“172.25.230.1”が入力され、パスとして“jp/index.html”が入力された場合、“http://172.25.230.1/jp/index.html”のようなリクエスト情報が生成される。
図40は、図37のステップ3609および図38のステップ3710における通信可否マトリクス生成処理のフローチャートである。障害管理装置は、まず、図31に示した構成を持つノード情報3900からレイヤ毎のサービス可能ノードを抽出し(ステップ3901)、各レイヤの送信元候補ノードを抽出し(ステップ3902)、各レイヤの宛先候補ノードを抽出する(ステップ3903)。
さらに、各レイヤの送信元インタフェース情報を抽出し(ステップ3904)、各レイヤの宛先インタフェース情報を抽出する(ステップ3905)。ステップ3902〜3904では、以下のようなノードおよびインタフェース情報が抽出される。
a.サービス可能ノード(ステップ3901)
(1)アプリケーションレイヤ
ノード情報3900のアプリケーションレイヤにデータが存在するノード
(2)TCP/UDPレイヤ
ノード情報3900のTCP/UDPレイヤにデータが存在するノード
(3)IPレイヤ
ノード情報3900のIPレイヤにデータが存在するノード
(4)MACレイヤ
ノード情報3900のMACレイヤにデータが存在するノード
(5)物理レイヤ
ノード情報3900の物理レイヤにデータが存在するノード
b.送信元候補ノード(ステップ3902)
(1)アプリケーションレイヤ
全てのノード、あるいは選択されたアプリケーションのクライアントプロセスが起動しているノード
(2)TCP/UDPレイヤ
すべてのノード
(3)IPレイヤ
IPアドレスを持つノード
(4)MACレイヤ
MACアドレスを持つノード
(5)物理レイヤ
ポート番号を持つノード
c.宛先候補ノード(ステップ3903)
(1)アプリケーションレイヤ
選択されたアプリケーションのサーバプロセスが起動しているノード
(2)TCP/UDPレイヤ
選択されたアプリケーションのポートが起動しているノード
(3)IPレイヤ
IPアドレスを持つノード
(4)MACレイヤ
MACアドレスを持つノード
(5)物理レイヤ
ポート番号を持つノード
d.送信元インタフェース情報(ステップ3904)
(1)アプリケーションレイヤ
アプリケーションレイヤの送信元候補ノードの全IPアドレス
(2)TCP/UDPレイヤ
TCP/UDPレイヤの送信元候補ノードの全IPアドレス
(3)IPレイヤ
IPレイヤの送信元候補ノードの全IPアドレス
(4)MACレイヤ
MACレイヤの送信元候補ノードの全MACアドレス
(5)物理レイヤ
物理レイヤの送信元候補ノードの全コネクタ識別子
e.宛先インタフェース情報(ステップ3905)
(1)アプリケーションレイヤ
アプリケーションレイヤの宛先候補ノードのIPアドレス
(2)TCP/UDPレイヤ
TCP/UDPレイヤの宛先候補ノードのIPアドレス
(3)IPレイヤ
IPレイヤの宛先候補ノードの全IPアドレス
(4)MACレイヤ
MACレイヤの宛先候補ノードの全MACアドレス
(5)物理レイヤ
物理レイヤの宛先候補ノードの全コネクタ識別子
障害管理装置は、抽出された送信元と宛先の組み合わせの数だけ経路探索を実行するために、それらの組み合わせを指定する経路探索入力情報を生成し(ステップ3906)、経路探索を実行する(ステップ3907)。このとき、監視情報により指定されたアプリケーションレイヤのサービス(例えば、http)およびパスと、TCP/UDPレイヤのプロトコル(例えば、tcp)および宛先のポート番号等も、経路探索入力情報として用いられる。そして、各組み合わせについて、図41に示すような経路探索の結果を保存する(ステップ3908)。
この経路探索結果は、アプリケーションレイヤから物理レイヤに至る各レイヤの経路情報からなり、各レイヤの経路情報は、m個の経路情報1〜mからなる。各経路情報は、n個のコネクタ情報1〜nと経路通信可否情報からなり、各コネクタ情報は、ノード識別子、レイヤ識別子、コネクタ識別子、およびサービス識別子からなる。経路通信可否情報は、指定された送信元と宛先の間におけるデータの到達可否を表している。
障害管理装置は、この経路通信可否情報に基いて通信可否マトリクスを生成する(ステップ3909)。
図42は、図37のステップ3611および図38のステップ3712における障害発生箇所導出処理のフローチャートである。障害管理装置は、まず、障害探索開始レイヤを決定する(ステップ4001)。この障害探索開始レイヤは、通常はユーザにより選択されるが、アプリケーションレイヤを自動的に選択するようにしてもよい。
次に、選択されたレイヤの通信可否マトリクスを読み込み(ステップ4002)、障害発生前後の通信可否を比較して(ステップ4003)、障害発生前後で通信可否マトリクスに変化があるか否かをチェックする(ステップ4004)。
通信可否マトリクスに変化があれば、障害影響範囲/発生箇所計算処理を行い(ステップ4005)、障害の影響範囲を画面上に表示する(ステップ4006)。通信可否マトリクスに変化がなければ、現在のレイヤでは障害が発生していないと判定する(ステップ4010)。
次に、2つのレイヤで連続して障害なしと判定されたか否かをチェックし(ステップ4007)、そのように判定されていなければ、次に、現在のレイヤが物理レイヤか否かをチェックする(ステップ4008)。現在のレイヤが物理レイヤでなければ、1つ下のレイヤを選択して(ステップ4009)、ステップ4002以降の処理を繰り返す。これにより、階層間に渡るドリルダウンが行われる。
そして、ステップ4007において2つのレイヤで連続して障害なしと判定されていれば、2つ上のレイヤにおける障害発生箇所を画面上に表示し(ステップ4011)、ステップ4008において現在のレイヤが物理レイヤであれば、1つ上のレイヤにおける障害発生箇所を画面上に表示する(ステップ4012)。
図43は、図42のステップ4005における障害影響範囲/発生箇所計算処理のフローチャートである。障害管理装置は、まず、通信可否マトリクスから上述した樹形図に相当する通信可否変化情報を抽出し、完全重複する通信可否変化情報同士をグルーピングする(ステップ4101)。このとき、重複しない通信可否変化情報については、単独でグルーピングされる(グループ内要素数=1)。
ここでは、障害発生時の通信可否マトリクスの要素のうち、障害発生前に通信可で障害発生後に通信不可となったものを含む列の全要素が、通信可否変化情報として抽出される。例えば、図6の通信可否マトリクスの場合は、宛先E〜Hに対応するすべての列が通信可否変化情報として抽出される。また、Eの列とFの列は変化した要素が完全重複するため1つのグループにグルーピングされ、同様に、Gの列とHの列も1つのグループにグルーピングされる。
次に、グループ数カウントnに生成されたグループの数を設定し(ステップ4102)、1つのグループの通信可否変化情報を読み込んで(ステップ4103)、グループ内要素数(通信可否変化情報の数)が1か否かをチェックする(ステップ4104)。グループ内要素数が1でなければ、それらの通信可否変化情報をマージして保存し(ステップ4105)、グループ内要素数が1であれば、その通信可否変化情報をそのまま保存する(ステップ4108)。
次に、n個のグループについて処理が終了したか否かをチェックし(ステップ4106)、未処理のグループがあれば次のグループを選択して(ステップ4107)、ステップ4103以降の処理を繰り返す。そして、n個のグループについて処理が終了すれば、ステップ4105および4108で保存された全グループの要素を比較し(ステップ4109)、グループ間で通信可否変化情報が相反しているか否かをチェックする(ステップ4110)。
グループ間で通信可否変化情報が相反していれば、次に、グループ間で通信可否変化情報が包含関係にあるか否かをチェックする(ステップ4111)。そして、通信可否変化情報が包含関係にあれば、これらのグループを相反包含関係の影響範囲として出力する(ステップ4112)。
ステップ4110において通信可否変化情報が相反していなければ、各グループを現状のまま影響範囲として出力し(ステップ4114)、ステップ4111において通信可否変化情報が包含関係になければ、それらのグループを相反関係の影響範囲として出力する(ステップ4113)。
例えば、図6の通信可否マトリクスの場合は、図7の通信可否変化情報がマージされて図8の2つのグループが生成される。これらのグループ間では、接続可能範囲と接続不可範囲が互いに入れ替わった関係にあるため、2つのグループは相反関係にあると判定される。
また、図11の通信可否マトリクスの場合は、図12の通信可否変化情報がマージされて図13の2つのグループが生成される。これらのグループ間では、接続可能範囲と接続不可範囲が互いに入れ替わった関係にあり、かつ、宛先Dのグループの接続可能範囲が宛先EおよびFのグループの接続不可範囲を包含しているため、2つのグループは相反包含関係にあると判定される。
ステップ4112〜4114では、例えば、障害の影響範囲と発生箇所の計算結果が図41の経路探索結果と同様の形式で生成される。この場合、影響範囲の計算結果は、図41の「経路情報」を「影響範囲情報」に置き換えて、「経路通信可否情報」を削除したデータ構造で出力される。また、障害発生箇所の計算結果は、図41の「経路情報」を「障害発生箇所情報」に置き換えて、「経路通信可否情報」を削除したデータ構造で出力される。
ところで、図37、38、および40に示したトポロジ探索処理および経路探索処理は、例えば、先願の特願2004−164778号に記載された「トポロジ探索技術」および「経路探索技術」を利用して行われる。そこで、この「トポロジ探索技術」および「経路探索技術」の概要について、図44から図48までを参照しながら説明する。
(1)トポロジ探索技術
本技術は、物理レイヤからアプリケーションレイヤまでのすべてのレイヤを統合したトポロジを表現するモデルに基き、SNMP−MIB(Management Information Base )等を用いて各ネットワーク機器から各レイヤに関する情報を自動的に収集・分析することにより、各レイヤにまたがるネットワークトポロジをシステムが把握し、これをマップとして描画・表示するものである。これにより、従来は困難であったすべてのレイヤについてのトポロジ把握を容易に行うことができる。
図44は、トポロジ探索技術を実装したトポロジ探索部を示している。図44のトポロジ探索部4202は、ノード検知部4211、トポロジ情報取得部4212、およびトポロジ構築部4213を備え、以下の手順で、管理対象のネットワークを構成する機器同士の物理的・論理的接続を求める。
1.ノード検知部4211は、管理対象のネットワーク4201のIPアドレスの範囲(探索範囲)と各機器のアカウント情報からなる入力情報4221を受け取る。そして、探索範囲に対してpingによる探索を試みて、ネットワーク4201を構成する機器(ノード)を検出し、検出されたノードのリスト4214を生成する。
2.トポロジ情報取得部4212は、SNMP、telnet、またはssh(Secure Shell)を用いて、検出されたネットワーク機器の設定やサービスの情報を取得する。情報取得に必要な各機器のアカウント情報は、ノード検知部4211から受け取る。
3.トポロジ構築部4213は、取得された情報から機器同士の物理的・論理的接続関係を求め、様々な目的に利用できる形式のトポロジ情報4222として出力する。トポロジ情報4222には、ノード情報およびリンク情報が含まれる。ノード情報は、ネットワーク4201を構成する機器の設定情報であり、リンク情報は、機器間の物理/論理接続の情報である。
図45は、トポロジ情報取得部4212により取得された機器設定情報の例を示している。この設定情報は、パーソナルコンピュータの機器設定情報を表しており、ノード名(ノード識別子)、機種、インタフェース、および経路表を含む。ノード名は機器の識別情報であり、機種は機器の種類を示す情報であり、インタフェースは、機器に設けられた通信インタフェースの情報であり、経路表は各インタフェースが通信に用いる経路の情報である。
このパーソナルコンピュータにはインタフェースが1つ設けられており、インタフェースの情報には、その番号、名前、MACアドレス、およびIPアドレスが含まれる。また、経路表には、宛先IPアドレス、送出インタフェースの名前、次経路IPアドレス、および優先度がエントリ毎に登録されている。
他の機器の設定情報も同様であるが、スイッチの機器設定情報にはさらにブリッジング情報、VLAN情報、およびリンクアグリゲーション情報が含まれ、ルータの機器設定情報にはさらにルーティング情報が含まれ、ファイアウォールの機器設定情報にはさらにパケットフィルタリング情報が含まれる。また、サーバの機器設定情報にはさらにアプリケーション情報が含まれる。
トポロジ構築部4213は、各機器におけるMAC学習テーブルを取得し、機器毎のMAC学習テーブルの内容を照合することで、機器間の物理的な接続関係を生成する。MAC学習テーブルには、送信先MACアドレスと送信元ポートの対応関係が記録されている。
図46は、管理対象のネットワークにおける物理接続の例を示している。このネットワークは、スイッチ4401〜4403およびパーソナルコンピュータ(PC)4404〜4415からなる。
スイッチ4401(スイッチα)はポート1〜5を有し、ポート1、2、3、および4には、パーソナルコンピュータ4404、4405、4406、および4407がそれぞれ接続されており、ポート5にはスイッチ4402が接続されている。
スイッチ4402(スイッチβ)はポート1〜6を有し、ポート1、2、3、および4には、パーソナルコンピュータ4408、4409、4410、および4411がそれぞれ接続されており、ポート5および6には、スイッチ4401および4403がそれぞれ接続されている。
スイッチ4403(スイッチγ)はポート1〜5を有し、ポート1、2、3、および4には、パーソナルコンピュータ4412、4413、4414、および4415がそれぞれ接続されており、ポート5にはスイッチ4402が接続されている。
パーソナルコンピュータ4404、4405、4406、4407、4408、4409、4410、4411、4412、4413、4414、および4415のMACアドレスは、それぞれA、B、C、D、E、F、G、H、I、J、K、およびLである。
スイッチ4401、4402、および4403は、スイッチングサービスを行うために、図47に示すようなMAC学習テーブル4501、4502、および4503をそれぞれ持っている。これらのMAC学習テーブルには、ポート毎に、学習されたパーソナルコンピュータ4404〜4415のMACアドレスが登録されている。
例えば、スイッチαのポート5については、スイッチβ配下の4台のPCのMACアドレスE、F、G、およびHが学習されており、スイッチβのポート5については、スイッチα配下の4台のPCのMACアドレスが学習されている。この情報から、スイッチαのポート5とスイッチβのポート5とが接続されていると推測できる。このように、スイッチのMAC学習テーブルから、スイッチ同士の接続や、スイッチ−PC間の接続を求めることが可能である。
スイッチ4401〜4403およびパーソナルコンピュータ4404〜4415の機器設定情報が入力されたとき、トポロジ構築部4213は、以下の手順で物理接続のリンク情報を求める。
トポロジ構築部4213は、まず、スイッチの機器設定情報からMAC学習テーブル4501、4502、および4503を抽出し、それらのMAC学習テーブルを参照してスイッチ間の物理接続を探索する。
隣接する2台のスイッチ間においては、互いを繋ぐポートについて学習されるMACアドレスは、隣接するスイッチの、互いを繋ぐポート以外のポートについて学習されたMACアドレスの総和である。
トポロジ構築部4213は、ネットワーク内の全スイッチのMACアドレス学習テーブルを調査し、スイッチの各ポートについて学習されているMACアドレスの、ポートを単位とする論理和を用いた比較が成立するか否かを判定して、スイッチ同士の物理接続を求める。
次に、トポロジ構築部4213は、パーソナルコンピュータ4404〜4415のMACアドレスと、スイッチ間の物理接続の探索結果から、スイッチと各パーソナルコンピュータの物理接続を探索する。このとき、各スイッチのMAC学習テーブル内の、スイッチ同士の接続に使用されていないポートのうち、ネットワーク内のスイッチ以外の機器(パーソナルコンピュータ)のMACアドレスを学習しているポートを探索し、該当するポートとパーソナルコンピュータの間の物理接続を求める。
こうして物理接続のリンク情報が得られると、トポロジ構築部4213は、そのリンク情報とノード情報を用いてレイヤ別のトポロジ探索処理を行い、複数レイヤにわたるトポロジを求める。
このとき、ノード情報を用いて複数のレイヤの中の下位レイヤのトポロジに含まれる物理接続または論理接続をグループ化して、上位レイヤにおける情報到達範囲を生成し、その情報到達範囲から上位レイヤのトポロジを生成する。このような処理を物理レイヤ、MACレイヤ、IPレイヤ、TCP/UDPレイヤ、およびアプリケーションレイヤの順に繰り返すことで、複数レイヤにわたるトポロジが生成される。
(2)経路探索技術
本技術は、探索対象となる経路の始点および終点の機器(ノード)と、トポロジ探索技術の出力結果であるトポロジ情報をもとに、始点ノードと終点ノードの間におけるデータの到達可否を判定し、到達可能な場合のデータの通過経路を算出するものである。具体的には、以下の手順で経路探索を行う。
1.IPレイヤのネクストホップ取得
始点ノードから終点ノードに向かうための、IPレイヤにおけるネクストホップのIPアドレスを、始点ノードのルーティング情報から取得する。
2.MACレイヤのネクストホップ取得
始点ノードのMAC学習テーブルをもとに、ネクストホップのIPアドレスに向かうための、MACレイヤにおけるネクストホップのMACアドレスを取得する。トポロジ探索技術により得られているリンク情報を参照し、MACレイヤでのネクストホップとなる機器を決定する。
3.始点ノードの代わりにネクストホップとなる機器に対して、2のMACレイヤのネクストホップ取得を繰り返し、MACレイヤでの経路情報の取得を続ける。これを繰り返してIPレイヤでのネクストホップの機器に辿り着いたら、上記1のIPレイヤのネクストホップ取得を繰り返して、IPレイヤにおいてその次のホップとなる機器を決定する。以上の処理を、終点ノードのIPアドレスに辿り着くまで繰り返す。終点ノードのIPアドレスに辿り着くことができればデータ到達可と判定され、辿り着くことができなければデータ到達不可と判定される。
図48は、このような経路探索技術を実装したトポロジ探索装置を示している。図48のトポロジ探索装置4601は、図44のトポロジ探索部4202と経路探索部4611を備える。経路探索部4611は、次経路判定部4621および動的情報算出部4622を備え、探索対象情報4623および次探索対象情報4624を保持する。
経路探索部4611は、各機器の設定情報4651、複数レイヤにわたるトポロジ4652、および探索条件4653を入力として経路探索処理を行い、経路探索結果4654を出力する。設定情報4651は、図44のトポロジ情報取得部4212により取得された機器設定情報に対応し、トポロジ4652は、図44のトポロジ情報4222に対応する。
トポロジ4652は、物理レイヤのトポロジ4661、MACレイヤのトポロジ4662、IPレイヤのトポロジ4663、TCP/UDPレイヤのトポロジ4664、およびアプリケーションレイヤのトポロジ4665からなり、探索条件4653は、始点および終点となるネットワーク内の2点4671およびサービスの種類4672の情報を含む。ネットワーク内の2点4671は、ノード名やIPアドレス等により指定される。
探索対象情報4623は、現在のコネクタ4631および直前のコネクタ4632の情報を含み、次探索対象情報4624は、上位レイヤのコネクタ4641および下位レイヤのコネクタ4642の情報を含む。また、経路探索結果4654は、図41に示したような情報を含む。現在のコネクタ4631、直前のコネクタ4632、上位レイヤのコネクタ4641、および下位レイヤのコネクタ4642のデータ構造についても、図41のコネクタ情報と同様である。
次経路判定部4621は、現在の探索対象の情報を探索対象情報4623に保持し、次の探索対象の情報を次探索対象候補4624に保持しながら、設定情報4651、トポロジ4652、および探索条件4653を用いてネクストホップの取得を繰り返す。そして、データ到達性の判定結果と、到達可能な場合の始点ノードから終点ノードに至るコネクタの情報を、経路探索結果4654として出力する。動的情報算出部4622は、次経路判定部4621により宛先が得られない場合、または名前解決等の方法により宛先を取得する必要がある場合に、動的に宛先を求める。
上述したような先願の「トポロジ探索技術」および「経路探索技術」を利用するため、障害管理装置は、図48のトポロジ探索部4202および経路探索部4611を備える。
また、図28〜30の構成では、障害管理装置が運用管理系のネットワークを介して管理対象のネットワークに接続されているが、障害管理装置を管理対象のネットワークのノードに直接接続するようにしてもよい。
また、以上説明した実施形態では、通信機能の階層構成として物理レイヤ、MACレイヤ、IPレイヤ、TCP/UDPレイヤ、およびアプリケーションレイヤの5つのレイヤを想定しているが、本発明はこの階層構成に限らず、他の階層構成にも同様に適用可能である。
なお、図28の障害管理装置2701、図29の障害管理装置2801、図30の障害管理装置2901、図48のトポロジ探索装置4601は、例えば、図49に示すような情報処理装置(コンピュータ)を用いて構成される。図49の情報処理装置は、CPU4701、メモリ4702、入力装置4703、出力装置4704、外部記憶装置4705、媒体駆動装置4706、ネットワーク接続装置4707を備え、それらはバス4708により互いに接続されている。
メモリ4702は、例えば、ROM(read only memory)、RAM(random access memory)等を含み、処理に用いられるプログラムおよびデータを格納する。CPU4701は、メモリ4702を利用してプログラムを実行することにより、必要な処理を行う。
図44のトポロジ探索部4202、ノード検知部4211、トポロジ情報取得部4212、トポロジ構築部4213、および図48の経路探索部4611、次経路判定部4621、動的情報算出部4622は、メモリ4702に格納されたプログラムに対応する。
入力装置4703は、例えば、キーボード、ポインティングデバイス等であり、ユーザからの指示や情報の入力に用いられる。出力装置4704は、例えば、ディスプレイ、プリンタ、スピーカ等であり、ユーザへの問い合わせや処理結果等の出力に用いられる。
外部記憶装置4705は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置、テープ装置等である。情報処理装置は、この外部記憶装置4705に、プログラムおよびデータを格納しておき、必要に応じて、それらをメモリ4702にロードして使用する。
媒体駆動装置4706は、可搬記録媒体4709を駆動し、その記録内容にアクセスする。可搬記録媒体4709は、メモリカード、フレキシブルディスク、光ディスク、光磁気ディスク等の任意のコンピュータ読み取り可能な記録媒体である。ユーザは、この可搬記録媒体4709にプログラムおよびデータを格納しておき、必要に応じて、それらをメモリ4702にロードして使用する。
ネットワーク接続装置4707は、LAN(local area network)やインターネット等の任意の通信ネットワークに接続され、通信に伴うデータ変換を行う。情報処理装置は、必要に応じて、プログラムおよびデータを外部の装置からネットワーク接続装置4707を介して受け取り、それらをメモリ4702にロードして使用する。
図50は、図49の情報処理装置にプログラムおよびデータを提供する方法を示している。可搬記録媒体4709やサーバ4801のデータベース4811に格納されたプログラムおよびデータは、情報処理装置4802のメモリ4702にロードされる。サーバ4801は、そのプログラムおよびデータを搬送する搬送信号を生成し、ネットワーク上の任意の伝送媒体を介して情報処理装置4802に送信する。CPU4701は、そのデータを用いてそのプログラムを実行し、必要な処理を行う。
(付記1) 複数のレイヤによる階層構成の通信機能を有する通信ネットワーク上における障害の原因を特定する障害管理装置であって、
監視対象の送信元と宛先を指定する監視情報を入力する入力手段と、
前記監視対象の送信元と宛先の間の通信状態が通信可から通信不可へ変化する前と変化した後において、各レイヤにおける複数の送信元と複数の宛先の間の通信可否を示す通信可否情報を生成する生成手段と、
生成された通信可否情報を格納する格納手段と、
前記監視対象の通信状態が変化する前と後の通信可否情報を比較して、通信可から通信不可へ変化した経路の宛先をグループ化することで、前記通信ネットワークを障害の影響を受ける複数の影響範囲に分割し、該影響範囲の境界上にある機器のインタフェースを障害発生箇所と推定する処理を、探索開始レイヤから下位レイヤに向かってレイヤ毎に繰り返して、障害の原因となる機器とレイヤを特定する特定手段と、
前記複数の影響範囲と障害発生箇所の情報を出力する出力手段と
を備えることを特徴とする障害管理装置。
(付記2) 複数のレイヤによる階層構成の通信機能を有する通信ネットワーク上における障害の原因を特定するコンピュータのためのプログラムであって、
監視対象の送信元と宛先を指定する監視情報を入力し、
正常時に各レイヤにおける複数の送信元と複数の宛先の間の通信可否を示す通信可否情報を生成して、格納手段に格納し、
前記監視対象の送信元と宛先の間の通信状態が通信可から通信不可へ変化した後に、各レイヤにおける前記複数の送信元と複数の宛先の間の通信可否を示す通信可否情報を生成して、前記格納手段に格納し、
前記監視対象の通信状態が変化する前と後の通信可否情報を比較して、通信可から通信不可へ変化した経路の宛先をグループ化することで、前記通信ネットワークを障害の影響を受ける複数の影響範囲に分割し、該影響範囲の境界上にある機器のインタフェースを障害発生箇所と推定する処理を、探索開始レイヤから下位レイヤに向かってレイヤ毎に繰り返して、障害の原因となる機器とレイヤを特定し、
前記複数の影響範囲と障害発生箇所の情報を出力する
処理を前記コンピュータに実行させることを特徴とするプログラム。
(付記3) 前記監視対象の送信元と宛先の間で通信を試行した結果を監視することで、前記監視対象の通信状態が変化したことを検出する処理を、前記コンピュータにさらに実行させることを特徴とする付記2記載のプログラム。
(付記4) 前記監視対象の送信元と宛先の間におけるデータの到達可否を判定することで、前記監視対象の通信状態が変化したことを検出する処理を、前記コンピュータにさらに実行させることを特徴とする付記2記載のプログラム。
(付記5) 前記監視対象の通信状態が変化する前と後において、前記通信ネットワークを構成する複数の機器から各レイヤのインタフェース情報を取得し、該インタフェース情報に基いて各レイヤのトポロジを生成し、生成されたトポロジを用いて各レイヤにおける前記通信可否情報を生成する処理を、前記コンピュータに実行させることを特徴とする付記2記載のプログラム。
(付記6) 前記インタフェース情報を用いて前記複数のレイヤの中の下位レイヤのトポロジに含まれる接続をグループ化して、上位レイヤにおける情報到達範囲を生成し、該情報到達範囲から上位レイヤのトポロジを生成する処理を繰り返して、各レイヤのトポロジを生成する処理を、前記コンピュータに実行させることを特徴とする付記5記載のプログラム。
(付記7) 前記生成されたトポロジを用いて前記複数の送信元と複数の宛先の間におけるデータの到達可否を判定することで、各レイヤにおける前記通信可否情報を生成する処理を、前記コンピュータに実行させることを特徴とする付記5または6記載のプログラム。
(付記8) 前記複数のレイヤがアプリケーションレイヤを含むとき、指定されたアプリケーションサービスのクライアントプロセスが起動している機器を該アプリケーションレイヤにおける送信元として選択し、該アプリケーションサービスのサーバプロセスが起動している機器を該アプリケーションレイヤにおける宛先として選択して、該アプリケーションレイヤにおける通信可否情報を生成する処理を、前記コンピュータに実行させることを特徴とする付記2乃至7記載のプログラム。
(付記9) 前記複数のレイヤがトランスミッション制御プロトコル/ユーザデータグラムプロトコルレイヤを含むとき、指定されたアプリケーションサービスのポートが起動している機器を該トランスミッション制御プロトコル/ユーザデータグラムプロトコルレイヤにおける宛先として選択して、該トランスミッション制御プロトコル/ユーザデータグラムプロトコルレイヤにおける通信可否情報を生成する処理を、前記コンピュータに実行させることを特徴とする付記2乃至7記載のプログラム。
(付記10) 前記複数のレイヤがインターネットプロトコルレイヤを含むとき、インターネットプロトコルアドレスを持つ機器を該インターネットプロトコルレイヤにおける送信元および宛先として選択して、該インターネットプロトコルレイヤにおける通信可否情報を生成する処理を、前記コンピュータに実行させることを特徴とする付記2乃至7記載のプログラム。
(付記11) 前記複数のレイヤがメディアアクセス制御レイヤを含むとき、メディアアクセス制御アドレスを持つ機器を該メディアアクセス制御レイヤにおける送信元および宛先として選択して、該メディアアクセス制御レイヤにおける通信可否情報を生成する処理を、前記コンピュータに実行させることを特徴とする付記2乃至7記載のプログラム。
(付記12) 前記複数の影響範囲と障害発生箇所の情報を前記複数のレイヤと対応させて画面上に表示する処理を、前記コンピュータに実行させることを特徴とする付記2記載のプログラム。
(付記13) 複数のレイヤによる階層構成の通信機能を有する通信ネットワーク上における障害の原因を特定する障害管理方法であって、
入力手段が、監視対象の送信元と宛先を指定する監視情報を入力し、
生成手段が、正常時に各レイヤにおける複数の送信元と複数の宛先の間の通信可否を示す通信可否情報を生成して、格納手段に格納し、
前記生成手段が、前記監視対象の送信元と宛先の間の通信状態が通信可から通信不可へ変化した後に、各レイヤにおける前記複数の送信元と複数の宛先の間の通信可否を示す通信可否情報を生成して、前記格納手段に格納し、
特定手段が、前記監視対象の通信状態が変化する前と後の通信可否情報を比較して、通信可から通信不可へ変化した経路の宛先をグループ化することで、前記通信ネットワークを障害の影響を受ける複数の影響範囲に分割し、該影響範囲の境界上にある機器のインタフェースを障害発生箇所と推定する処理を、探索開始レイヤから下位レイヤに向かってレイヤ毎に繰り返して、障害の原因となる機器とレイヤを特定し、
出力手段が、前記複数の影響範囲と障害発生箇所の情報を出力する
ことを特徴とする障害管理方法。
本発明の障害管理装置の原理図である。 管理対象となる通信ネットワークを示す図である。 通信ネットワークのコネクタ表現を示す図である。 アプリケーションレイヤのトポロジを示す図である。 アプリケーションレイヤの樹形図である。 アプリケーションレイヤの通信可否マトリクスを示す図である。 アプリケーションレイヤの通信可否マトリクスの第1の樹形図である。 アプリケーションレイヤの通信可否マトリクスの第2の樹形図である。 アプリケーションレイヤの障害の影響範囲を示す図である。 TCP/UDPレイヤのトポロジを示す図である。 TCP/UDPレイヤの通信可否マトリクスを示す図である。 TCP/UDPレイヤの通信可否マトリクスの第1の樹形図である。 TCP/UDPレイヤの通信可否マトリクスの第2の樹形図である。 TCP/UDPレイヤの障害の影響範囲を示す図である。 IPレイヤのトポロジを示す図である。 IPレイヤの通信可否マトリクスを示す図である。 IPレイヤの通信可否マトリクスの第1の樹形図である。 IPレイヤの通信可否マトリクスの第2の樹形図である。 IPレイヤの障害の影響範囲を示す図である。 MACレイヤのトポロジを示す図である。 MACレイヤの通信可否マトリクスを示す図である。 MACレイヤの通信可否マトリクスの第1の樹形図である。 MACレイヤの通信可否マトリクスの第2の樹形図である。 MACレイヤの障害の影響範囲を示す図である。 物理レイヤのトポロジを示す図である。 物理レイヤの通信可否マトリクスを示す図である。 物理レイヤの障害の影響範囲を示す図である。 第1の障害管理装置を示す図である。 第2の障害管理装置を示す図である。 第3の障害管理装置を示す図である。 ノード情報のデータ構造を示す図である。 アプリケーションレイヤのデータ構造を示す図である。 TCP/UDPレイヤのデータ構造を示す図である。 IPレイヤのデータ構造を示す図である。 MACレイヤのデータ構造を示す図である。 物理レイヤのデータ構造を示す図である。 第1の障害監視処理のフローチャートである。 第2の障害監視処理のフローチャートである。 監視情報入力処理のフローチャートである。 通信可否マトリクス生成処理のフローチャートである。 経路探索結果を示す図である。 障害発生箇所導出処理のフローチャートである。 障害影響範囲/発生箇所計算処理のフローチャートである。 トポロジ探索部の構成図である。 機器設定情報を示す図である。 物理接続を示す図である。 MAC学習テーブルを示す図である。 トポロジ探索装置の構成図である。 情報処理装置の構成図である。 プログラムおよびデータの提供方法を示す図である。
符号の説明
101 入力手段
102 生成手段
103 格納手段
104 特定手段
105 出力手段
301、302、303、304、305、306、307、308、309、310、311、312、313 サービス
321、322、323、701、702、1401、1402、1801、1802 コネクタ
2701、2801、2901 障害管理装置
2702 スイッチ
3900 ノード情報
4201 ネットワーク
4202 トポロジ探索部
4211 ノード検知部
4212 トポロジ情報取得部
4213 トポロジ構築部
4214 ノードのリスト
4221 入力情報
4222 トポロジ情報
4401、4402、4403 スイッチ
4404、4405、4406、4407、4408、4409、4410、4411、4412、4413、4414、および4415 パーソナルコンピュータ
4501、4502、4503 MAC学習テーブル
4601 トポロジ探索装置
4602 トポロジ探索部
4611 経路探索部
4621 次経路判定部
4622 動的情報算出部
4623 探索対象情報
4624 次探索対象情報
4631 現在のコネクタ
4632 直前のコネクタ
4641 上位レイヤのコネクタ
4642 下位レイヤのコネクタ
4651 各機器の設定情報
4652 複数レイヤにわたるトポロジ
4653 探索条件
4654 経路探索結果
4661 物理レイヤのトポロジ
4662 MACレイヤのトポロジ
4663 IPレイヤのトポロジ
4664 TCP/UDPレイヤのトポロジ
4665 アプリケーションレイヤのトポロジ
4671 ネットワーク内の2点
4672 サービスの種類
4701 CPU
4702 メモリ
4703 入力装置
4704 出力装置
4705 外部記憶装置
4706 媒体駆動装置
4707 ネットワーク接続装置
4708 バス
4709 可搬記録媒体
4801 サーバ
4802 情報処理装置
4811 データベース

Claims (9)

  1. 複数のレイヤによる階層構成の通信機能を有する通信ネットワーク上における障害の原因を特定する障害管理装置であって、
    監視対象の送信元と宛先を指定する監視情報を入力する入力手段と、
    前記監視対象の送信元と宛先の間の通信状態が通信可から通信不可へ変化する前と変化した後において、各レイヤにおける複数の送信元と複数の宛先の間の通信可否を示す通信可否情報を生成する生成手段と、
    生成された通信可否情報を格納する格納手段と、
    前記監視対象の通信状態が変化する前と後の通信可否情報を比較して、通信可から通信不可へ変化した経路の宛先をグループ化することで、前記通信ネットワークを障害の影響を受ける複数の影響範囲に分割し、該影響範囲の境界上にある機器のインタフェースを障害発生箇所と推定する処理を、探索開始レイヤから下位レイヤに向かってレイヤ毎に繰り返して、障害の原因となる機器とレイヤを特定する特定手段と、
    前記複数の影響範囲と障害発生箇所の情報を出力する出力手段と
    を備えることを特徴とする障害管理装置。
  2. 複数のレイヤによる階層構成の通信機能を有する通信ネットワーク上における障害の原因を特定するコンピュータのためのプログラムであって、
    監視対象の送信元と宛先を指定する監視情報を入力し、
    正常時に各レイヤにおける複数の送信元と複数の宛先の間の通信可否を示す通信可否情報を生成して、格納手段に格納し、
    前記監視対象の送信元と宛先の間の通信状態が通信可から通信不可へ変化した後に、各レイヤにおける前記複数の送信元と複数の宛先の間の通信可否を示す通信可否情報を生成して、前記格納手段に格納し、
    前記監視対象の通信状態が変化する前と後の通信可否情報を比較して、通信可から通信不可へ変化した経路の宛先をグループ化することで、前記通信ネットワークを障害の影響を受ける複数の影響範囲に分割し、該影響範囲の境界上にある機器のインタフェースを障害発生箇所と推定する処理を、探索開始レイヤから下位レイヤに向かってレイヤ毎に繰り返して、障害の原因となる機器とレイヤを特定し、
    前記複数の影響範囲と障害発生箇所の情報を出力する
    処理を前記コンピュータに実行させることを特徴とするプログラム。
  3. 前記監視対象の送信元と宛先の間で通信を試行した結果を監視することで、前記監視対象の通信状態が変化したことを検出する処理を、前記コンピュータにさらに実行させることを特徴とする請求項2記載のプログラム。
  4. 前記監視対象の送信元と宛先の間におけるデータの到達可否を判定することで、前記監視対象の通信状態が変化したことを検出する処理を、前記コンピュータにさらに実行させることを特徴とする請求項2記載のプログラム。
  5. 前記監視対象の通信状態が変化する前と後において、前記通信ネットワークを構成する複数の機器から各レイヤのインタフェース情報を取得し、該インタフェース情報に基いて各レイヤのトポロジを生成し、生成されたトポロジを用いて各レイヤにおける前記通信可否情報を生成する処理を、前記コンピュータに実行させることを特徴とする請求項2記載のプログラム。
  6. 前記インタフェース情報を用いて前記複数のレイヤの中の下位レイヤのトポロジに含まれる接続をグループ化して、上位レイヤにおける情報到達範囲を生成し、該情報到達範囲から上位レイヤのトポロジを生成する処理を繰り返して、各レイヤのトポロジを生成する処理を、前記コンピュータに実行させることを特徴とする請求項5記載のプログラム。
  7. 前記生成されたトポロジを用いて前記複数の送信元と複数の宛先の間におけるデータの到達可否を判定することで、各レイヤにおける前記通信可否情報を生成する処理を、前記コンピュータに実行させることを特徴とする請求項5または6記載のプログラム。
  8. 前記複数の影響範囲と障害発生箇所の情報を前記複数のレイヤと対応させて画面上に表示する処理を、前記コンピュータに実行させることを特徴とする請求項2記載のプログラム。
  9. 複数のレイヤによる階層構成の通信機能を有する通信ネットワーク上における障害の原因を特定する障害管理方法であって、
    入力手段が、監視対象の送信元と宛先を指定する監視情報を入力し、
    生成手段が、正常時に各レイヤにおける複数の送信元と複数の宛先の間の通信可否を示す通信可否情報を生成して、格納手段に格納し、
    前記生成手段が、前記監視対象の送信元と宛先の間の通信状態が通信可から通信不可へ変化した後に、各レイヤにおける前記複数の送信元と複数の宛先の間の通信可否を示す通信可否情報を生成して、前記格納手段に格納し、
    特定手段が、前記監視対象の通信状態が変化する前と後の通信可否情報を比較して、通信可から通信不可へ変化した経路の宛先をグループ化することで、前記通信ネットワークを障害の影響を受ける複数の影響範囲に分割し、該影響範囲の境界上にある機器のインタフェースを障害発生箇所と推定する処理を、探索開始レイヤから下位レイヤに向かってレイヤ毎に繰り返して、障害の原因となる機器とレイヤを特定し、
    出力手段が、前記複数の影響範囲と障害発生箇所の情報を出力する
    ことを特徴とする障害管理方法。
JP2005035170A 2005-02-10 2005-02-10 通信ネットワークにおける障害の原因を特定する障害管理装置および方法 Expired - Fee Related JP4523444B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005035170A JP4523444B2 (ja) 2005-02-10 2005-02-10 通信ネットワークにおける障害の原因を特定する障害管理装置および方法
US11/270,833 US8270306B2 (en) 2005-02-10 2005-11-10 Fault management apparatus and method for identifying cause of fault in communication network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005035170A JP4523444B2 (ja) 2005-02-10 2005-02-10 通信ネットワークにおける障害の原因を特定する障害管理装置および方法

Publications (2)

Publication Number Publication Date
JP2006222808A true JP2006222808A (ja) 2006-08-24
JP4523444B2 JP4523444B2 (ja) 2010-08-11

Family

ID=36984804

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005035170A Expired - Fee Related JP4523444B2 (ja) 2005-02-10 2005-02-10 通信ネットワークにおける障害の原因を特定する障害管理装置および方法

Country Status (2)

Country Link
US (1) US8270306B2 (ja)
JP (1) JP4523444B2 (ja)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008060958A (ja) * 2006-08-31 2008-03-13 Nec Corp Vlan通信範囲特定システム、データ作成方法、及びプログラム
WO2009060532A1 (ja) * 2007-11-09 2009-05-14 Fujitsu Limited 網情報収集装置、網情報収集サーバ装置、および、網情報収集システム
JP2010124152A (ja) * 2008-11-18 2010-06-03 Toshiba Corp 障害診断プログラム、方法、および通信装置
WO2010109673A1 (ja) * 2009-03-24 2010-09-30 株式会社日立製作所 管理システム及び情報処理システム
JP2011166313A (ja) * 2010-02-05 2011-08-25 Mitsubishi Electric Corp ネットワーク管理装置および障害箇所推定方法
JP2011176554A (ja) * 2010-02-24 2011-09-08 Kddi R & D Laboratories Inc 監視装置、監視方法及びプログラム
JP2012169951A (ja) * 2011-02-16 2012-09-06 Mitsubishi Electric Corp ネットワーク接続装置
JP2012199928A (ja) * 2012-04-18 2012-10-18 Hitachi Ltd 管理システム及び情報処理システム
JP2013192021A (ja) * 2012-03-14 2013-09-26 Nec Corp 通信機器およびその障害の検出方法
JP2013219478A (ja) * 2012-04-06 2013-10-24 Mitsubishi Electric Corp 情報処理装置および情報処理方法およびプログラム
JP2015513722A (ja) * 2012-04-17 2015-05-14 テンセント テクノロジー (シェンツェン) カンパニー リミテッド コンピュータ・ネットワーク用のトランザクション実行監視方法及びシステム並びにコンピュータ記憶媒体
JP2015228629A (ja) * 2014-06-02 2015-12-17 ヤマハ株式会社 中継装置およびプログラム
CN106130774A (zh) * 2016-07-11 2016-11-16 天脉聚源(北京)传媒科技有限公司 一种网络故障诊断方法及装置
JP2019017123A (ja) * 2018-11-06 2019-01-31 ヤマハ株式会社 中継装置およびプログラム
US10733038B2 (en) 2013-01-07 2020-08-04 Fujitsu Limited Abnormal module detection using aggregated time interval analysis
CN112114993A (zh) * 2020-09-28 2020-12-22 中国建设银行股份有限公司 一种应用系统的配置信息处理方法及装置

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4523444B2 (ja) * 2005-02-10 2010-08-11 富士通株式会社 通信ネットワークにおける障害の原因を特定する障害管理装置および方法
JP4376270B2 (ja) * 2007-01-24 2009-12-02 富士通株式会社 ネットワーク構成検証プログラム、ネットワーク構成検証方法およびネットワーク構成検証装置
US8236476B2 (en) 2008-01-08 2012-08-07 International Business Machines Corporation Multiple exposure photolithography methods and photoresist compositions
JPWO2009090939A1 (ja) * 2008-01-15 2011-05-26 日本電気株式会社 ネットワーク異常検出装置及び方法
US8600558B2 (en) * 2008-10-27 2013-12-03 Lennox Industries Inc. System recovery in a heating, ventilation and air conditioning network
US8892797B2 (en) * 2008-10-27 2014-11-18 Lennox Industries Inc. Communication protocol system and method for a distributed-architecture heating, ventilation and air conditioning network
US8442693B2 (en) 2008-10-27 2013-05-14 Lennox Industries, Inc. System and method of use for a user interface dashboard of a heating, ventilation and air conditioning network
US9651925B2 (en) 2008-10-27 2017-05-16 Lennox Industries Inc. System and method for zoning a distributed-architecture heating, ventilation and air conditioning network
US8295981B2 (en) 2008-10-27 2012-10-23 Lennox Industries Inc. Device commissioning in a heating, ventilation and air conditioning network
US9152155B2 (en) * 2008-10-27 2015-10-06 Lennox Industries Inc. Device abstraction system and method for a distributed-architecture heating, ventilation and air conditioning system
US8977794B2 (en) * 2008-10-27 2015-03-10 Lennox Industries, Inc. Communication protocol system and method for a distributed-architecture heating, ventilation and air conditioning network
US8744629B2 (en) * 2008-10-27 2014-06-03 Lennox Industries Inc. System and method of use for a user interface dashboard of a heating, ventilation and air conditioning network
US8762666B2 (en) * 2008-10-27 2014-06-24 Lennox Industries, Inc. Backup and restoration of operation control data in a heating, ventilation and air conditioning network
US8725298B2 (en) * 2008-10-27 2014-05-13 Lennox Industries, Inc. Alarm and diagnostics system and method for a distributed architecture heating, ventilation and conditioning network
US8661165B2 (en) * 2008-10-27 2014-02-25 Lennox Industries, Inc. Device abstraction system and method for a distributed architecture heating, ventilation and air conditioning system
US9325517B2 (en) * 2008-10-27 2016-04-26 Lennox Industries Inc. Device abstraction system and method for a distributed-architecture heating, ventilation and air conditioning system
US20100106810A1 (en) * 2008-10-27 2010-04-29 Lennox Industries Inc. Communication protocol system and method for a distributed-architecture heating, ventilation and air conditioning network
US8352081B2 (en) 2008-10-27 2013-01-08 Lennox Industries Inc. Communication protocol system and method for a distributed-architecture heating, ventilation and air conditioning network
US8452906B2 (en) 2008-10-27 2013-05-28 Lennox Industries, Inc. Communication protocol system and method for a distributed-architecture heating, ventilation and air conditioning network
US8994539B2 (en) * 2008-10-27 2015-03-31 Lennox Industries, Inc. Alarm and diagnostics system and method for a distributed-architecture heating, ventilation and air conditioning network
US8855825B2 (en) 2008-10-27 2014-10-07 Lennox Industries Inc. Device abstraction system and method for a distributed-architecture heating, ventilation and air conditioning system
US8655491B2 (en) * 2008-10-27 2014-02-18 Lennox Industries Inc. Alarm and diagnostics system and method for a distributed architecture heating, ventilation and air conditioning network
US8452456B2 (en) * 2008-10-27 2013-05-28 Lennox Industries Inc. System and method of use for a user interface dashboard of a heating, ventilation and air conditioning network
US20100106326A1 (en) * 2008-10-27 2010-04-29 Lennox Industries Inc. Communication protocol system and method for a distributed-architecture heating, ventilation and air conditioning network
US20100106957A1 (en) * 2008-10-27 2010-04-29 Lennox Industries Inc. Programming and configuration in a heating, ventilation and air conditioning network
US8874815B2 (en) * 2008-10-27 2014-10-28 Lennox Industries, Inc. Communication protocol system and method for a distributed architecture heating, ventilation and air conditioning network
US9377768B2 (en) * 2008-10-27 2016-06-28 Lennox Industries Inc. Memory recovery scheme and data structure in a heating, ventilation and air conditioning network
US8433446B2 (en) * 2008-10-27 2013-04-30 Lennox Industries, Inc. Alarm and diagnostics system and method for a distributed-architecture heating, ventilation and air conditioning network
US8437877B2 (en) * 2008-10-27 2013-05-07 Lennox Industries Inc. System recovery in a heating, ventilation and air conditioning network
US8798796B2 (en) 2008-10-27 2014-08-05 Lennox Industries Inc. General control techniques in a heating, ventilation and air conditioning network
US8802981B2 (en) * 2008-10-27 2014-08-12 Lennox Industries Inc. Flush wall mount thermostat and in-set mounting plate for a heating, ventilation and air conditioning system
US8463443B2 (en) * 2008-10-27 2013-06-11 Lennox Industries, Inc. Memory recovery scheme and data structure in a heating, ventilation and air conditioning network
US8548630B2 (en) 2008-10-27 2013-10-01 Lennox Industries, Inc. Alarm and diagnostics system and method for a distributed-architecture heating, ventilation and air conditioning network
US8564400B2 (en) * 2008-10-27 2013-10-22 Lennox Industries, Inc. Communication protocol system and method for a distributed-architecture heating, ventilation and air conditioning network
US9632490B2 (en) 2008-10-27 2017-04-25 Lennox Industries Inc. System and method for zoning a distributed architecture heating, ventilation and air conditioning network
US8600559B2 (en) * 2008-10-27 2013-12-03 Lennox Industries Inc. Method of controlling equipment in a heating, ventilation and air conditioning network
US8352080B2 (en) * 2008-10-27 2013-01-08 Lennox Industries Inc. Communication protocol system and method for a distributed-architecture heating, ventilation and air conditioning network
US8463442B2 (en) * 2008-10-27 2013-06-11 Lennox Industries, Inc. Alarm and diagnostics system and method for a distributed architecture heating, ventilation and air conditioning network
US8255086B2 (en) * 2008-10-27 2012-08-28 Lennox Industries Inc. System recovery in a heating, ventilation and air conditioning network
US8543243B2 (en) * 2008-10-27 2013-09-24 Lennox Industries, Inc. System and method of use for a user interface dashboard of a heating, ventilation and air conditioning network
US8239066B2 (en) * 2008-10-27 2012-08-07 Lennox Industries Inc. System and method of use for a user interface dashboard of a heating, ventilation and air conditioning network
US8788100B2 (en) 2008-10-27 2014-07-22 Lennox Industries Inc. System and method for zoning a distributed-architecture heating, ventilation and air conditioning network
US9261888B2 (en) 2008-10-27 2016-02-16 Lennox Industries Inc. System and method of use for a user interface dashboard of a heating, ventilation and air conditioning network
US20100106312A1 (en) * 2008-10-27 2010-04-29 Lennox Industries Inc. Alarm and diagnostics system and method for a distributed-architecture heating, ventilation and air conditioning network
US9432208B2 (en) 2008-10-27 2016-08-30 Lennox Industries Inc. Device abstraction system and method for a distributed architecture heating, ventilation and air conditioning system
US8615326B2 (en) * 2008-10-27 2013-12-24 Lennox Industries Inc. System and method of use for a user interface dashboard of a heating, ventilation and air conditioning network
US8694164B2 (en) 2008-10-27 2014-04-08 Lennox Industries, Inc. Interactive user guidance interface for a heating, ventilation and air conditioning system
US20100107072A1 (en) * 2008-10-27 2010-04-29 Lennox Industries Inc. System and method of use for a user interface dashboard of a heating, ventilation and air conditioning network
US8560125B2 (en) * 2008-10-27 2013-10-15 Lennox Industries Communication protocol system and method for a distributed-architecture heating, ventilation and air conditioning network
US8437878B2 (en) * 2008-10-27 2013-05-07 Lennox Industries Inc. Alarm and diagnostics system and method for a distributed architecture heating, ventilation and air conditioning network
US8655490B2 (en) * 2008-10-27 2014-02-18 Lennox Industries, Inc. System and method of use for a user interface dashboard of a heating, ventilation and air conditioning network
US9268345B2 (en) * 2008-10-27 2016-02-23 Lennox Industries Inc. System and method of use for a user interface dashboard of a heating, ventilation and air conditioning network
US9678486B2 (en) * 2008-10-27 2017-06-13 Lennox Industries Inc. Device abstraction system and method for a distributed-architecture heating, ventilation and air conditioning system
US8774210B2 (en) 2008-10-27 2014-07-08 Lennox Industries, Inc. Communication protocol system and method for a distributed-architecture heating, ventilation and air conditioning network
CN101771900B (zh) * 2008-12-26 2012-12-19 中兴通讯股份有限公司 一种eNB的光交换装置及方法
USD648641S1 (en) 2009-10-21 2011-11-15 Lennox Industries Inc. Thin cover plate for an electronic system controller
USD648642S1 (en) 2009-10-21 2011-11-15 Lennox Industries Inc. Thin cover plate for an electronic system controller
US8260444B2 (en) 2010-02-17 2012-09-04 Lennox Industries Inc. Auxiliary controller of a HVAC system
US9094309B2 (en) 2012-03-13 2015-07-28 International Business Machines Corporation Detecting transparent network communication interception appliances
EP2901633A4 (en) * 2012-09-28 2016-06-01 Nec Corp COMMUNICATION SYSTEM, CONTROL APPARATUS, CONTROL METHOD, AND PROGRAM
JP6281175B2 (ja) * 2012-12-07 2018-02-21 株式会社ジェイテクト Plc通信システム
EP3001606B1 (en) * 2013-06-27 2018-12-19 Huawei Technologies Co., Ltd. Fault processing method, device and system
US20160072688A1 (en) * 2014-09-08 2016-03-10 Mayank DESAI Fault monitoring in multi-domain networks
KR102054394B1 (ko) * 2018-08-17 2019-12-10 주식회사 케이티 선로 장애 감지 방법, 그 시스템 및 망 관제 시스템
US11102072B2 (en) 2019-04-19 2021-08-24 Bmc Software, Inc. Synthetic objects in service models
CN113315650B (zh) * 2021-04-26 2022-05-27 新华三大数据技术有限公司 一种节点布局方法及装置
CN114244692B (zh) * 2021-04-30 2024-02-02 无锡江南计算技术研究所 一种适用于超大规模互连网络的故障快速定位方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09284281A (ja) * 1996-04-16 1997-10-31 Nippon Telegr & Teleph Corp <Ntt> 網監視システム
JP2002354038A (ja) * 2001-05-23 2002-12-06 Fujitsu Ltd レイヤ型ネットワークの管理システム
JP2003273928A (ja) * 2002-03-14 2003-09-26 Nec Engineering Ltd Atm伝送路モニタ装置
JP2004222105A (ja) * 2003-01-17 2004-08-05 Fujitsu Ltd 仮想ネットワーク運用状況表示装置
WO2006046309A1 (ja) * 2004-10-29 2006-05-04 Fujitsu Limited 通信ネットワークにおける障害発生箇所を特定する装置および方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05260132A (ja) 1992-03-16 1993-10-08 Kyushu Nippon Denki Software Kk Osiネットワーク管理方式
US7054265B1 (en) * 1999-06-09 2006-05-30 Hitachi, Ltd. Communication apparatus and communication system
US7392301B1 (en) * 2000-11-14 2008-06-24 Siemens Subscriber Networks, Inc. Method and apparatus for automated assistance in configuring customer premises equipment
US20040160895A1 (en) * 2003-02-14 2004-08-19 At&T Corp. Failure notification method and system in an ethernet domain
JP4096183B2 (ja) * 2003-02-27 2008-06-04 日本電気株式会社 警報転送方法及び広域イーサネット網
US7277936B2 (en) * 2003-03-03 2007-10-02 Hewlett-Packard Development Company, L.P. System using network topology to perform fault diagnosis to locate fault between monitoring and monitored devices based on reply from device at switching layer
US20050099955A1 (en) * 2003-11-10 2005-05-12 Nortel Networks Limited Ethernet OAM fault isolation
US7855968B2 (en) * 2004-05-10 2010-12-21 Alcatel Lucent Alarm indication and suppression (AIS) mechanism in an ethernet OAM network
CN1756187A (zh) * 2004-09-30 2006-04-05 华为技术有限公司 出口标签交换路由器与其相连数据设备间故障的处理方法
JP4523444B2 (ja) * 2005-02-10 2010-08-11 富士通株式会社 通信ネットワークにおける障害の原因を特定する障害管理装置および方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09284281A (ja) * 1996-04-16 1997-10-31 Nippon Telegr & Teleph Corp <Ntt> 網監視システム
JP2002354038A (ja) * 2001-05-23 2002-12-06 Fujitsu Ltd レイヤ型ネットワークの管理システム
JP2003273928A (ja) * 2002-03-14 2003-09-26 Nec Engineering Ltd Atm伝送路モニタ装置
JP2004222105A (ja) * 2003-01-17 2004-08-05 Fujitsu Ltd 仮想ネットワーク運用状況表示装置
WO2006046309A1 (ja) * 2004-10-29 2006-05-04 Fujitsu Limited 通信ネットワークにおける障害発生箇所を特定する装置および方法

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4600367B2 (ja) * 2006-08-31 2010-12-15 日本電気株式会社 Vlan通信範囲特定システム、データ作成方法、及びプログラム
JP2008060958A (ja) * 2006-08-31 2008-03-13 Nec Corp Vlan通信範囲特定システム、データ作成方法、及びプログラム
WO2009060532A1 (ja) * 2007-11-09 2009-05-14 Fujitsu Limited 網情報収集装置、網情報収集サーバ装置、および、網情報収集システム
JP2010124152A (ja) * 2008-11-18 2010-06-03 Toshiba Corp 障害診断プログラム、方法、および通信装置
US8694829B2 (en) 2008-11-18 2014-04-08 Kabushiki Kaisha Toshiba Computer program product, failure diagnosis method, and communication apparatus
US8369227B2 (en) 2009-03-24 2013-02-05 Hitachi, Ltd. Management system and information processing system
WO2010109673A1 (ja) * 2009-03-24 2010-09-30 株式会社日立製作所 管理システム及び情報処理システム
JP4981974B2 (ja) * 2009-03-24 2012-07-25 株式会社日立製作所 管理システム及び情報処理システム
JP2011166313A (ja) * 2010-02-05 2011-08-25 Mitsubishi Electric Corp ネットワーク管理装置および障害箇所推定方法
JP2011176554A (ja) * 2010-02-24 2011-09-08 Kddi R & D Laboratories Inc 監視装置、監視方法及びプログラム
JP2012169951A (ja) * 2011-02-16 2012-09-06 Mitsubishi Electric Corp ネットワーク接続装置
JP2013192021A (ja) * 2012-03-14 2013-09-26 Nec Corp 通信機器およびその障害の検出方法
JP2013219478A (ja) * 2012-04-06 2013-10-24 Mitsubishi Electric Corp 情報処理装置および情報処理方法およびプログラム
JP2015513722A (ja) * 2012-04-17 2015-05-14 テンセント テクノロジー (シェンツェン) カンパニー リミテッド コンピュータ・ネットワーク用のトランザクション実行監視方法及びシステム並びにコンピュータ記憶媒体
JP2012199928A (ja) * 2012-04-18 2012-10-18 Hitachi Ltd 管理システム及び情報処理システム
US10733038B2 (en) 2013-01-07 2020-08-04 Fujitsu Limited Abnormal module detection using aggregated time interval analysis
JP2015228629A (ja) * 2014-06-02 2015-12-17 ヤマハ株式会社 中継装置およびプログラム
US10491480B2 (en) 2014-06-02 2019-11-26 Yamaha Corporation Relay device, program, and display control method
US10985991B2 (en) 2014-06-02 2021-04-20 Yamaha Corporation Relay device, program, and display control method
CN106130774A (zh) * 2016-07-11 2016-11-16 天脉聚源(北京)传媒科技有限公司 一种网络故障诊断方法及装置
JP2019017123A (ja) * 2018-11-06 2019-01-31 ヤマハ株式会社 中継装置およびプログラム
CN112114993A (zh) * 2020-09-28 2020-12-22 中国建设银行股份有限公司 一种应用系统的配置信息处理方法及装置

Also Published As

Publication number Publication date
US20070014233A1 (en) 2007-01-18
JP4523444B2 (ja) 2010-08-11
US8270306B2 (en) 2012-09-18

Similar Documents

Publication Publication Date Title
JP4523444B2 (ja) 通信ネットワークにおける障害の原因を特定する障害管理装置および方法
JP7108674B2 (ja) 故障根本原因決定方法及び装置並びにコンピュータ記憶媒体
JP4008432B2 (ja) ネットワーク機器のトポロジを探索する装置および方法
US9225624B2 (en) Systems and methods for topology discovery and application in a border gateway protocol based data center
US9391886B2 (en) Identification of the paths taken through a network of interconnected devices
US7292541B1 (en) Methods and systems for unnumbered network link discovery
JP4345987B2 (ja) 通信ネットワークにおける障害発生箇所を特定する装置および方法
US8724494B2 (en) Network multi-path discovery
CN109644141A (zh) 用于可视化网络的方法和系统
JP2019536331A (ja) 対話型ネットワーク分析プラットフォームのためのシステムおよび方法
US9544217B2 (en) Identification of paths in a network of mixed routing/switching devices
JP6193473B2 (ja) コンピュータ実施方法、コンピュータプログラム製品及びコンピュータ
CN102158348A (zh) 网络拓扑发现方法、装置及网络设备
CN108206792B (zh) 交换机的拓扑结构发现方法及装置
US7512841B2 (en) Method and system for network fault analysis
US9531598B2 (en) Querying a traffic forwarding table
JP5035219B2 (ja) 通信経路検出方法、通信経路検出プログラム、および通信経路検出装置
CN110730093B (zh) 城域网网络拓扑测绘方法及装置
CN102075364B (zh) 一种直连链路的确定方法和设备
JP6510217B2 (ja) ネットワーク制御システム
US8463940B2 (en) Method of indicating a path in a computer network
Peng et al. Analysis and research of network topology discovery method
CN117176639B (zh) 一种基于多协议的网络拓扑自动发现方法和装置
CN117880109A (zh) 一种生成两点间网络通信拓扑图的方法、系统和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100112

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100525

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100527

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130604

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130604

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees