JP2004336658A - ネットワーク監視方法およびネットワーク監視装置 - Google Patents

ネットワーク監視方法およびネットワーク監視装置 Download PDF

Info

Publication number
JP2004336658A
JP2004336658A JP2003133485A JP2003133485A JP2004336658A JP 2004336658 A JP2004336658 A JP 2004336658A JP 2003133485 A JP2003133485 A JP 2003133485A JP 2003133485 A JP2003133485 A JP 2003133485A JP 2004336658 A JP2004336658 A JP 2004336658A
Authority
JP
Japan
Prior art keywords
port
node
state
status
change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003133485A
Other languages
English (en)
Other versions
JP4228772B2 (ja
Inventor
Manabu Takeda
学 竹田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003133485A priority Critical patent/JP4228772B2/ja
Publication of JP2004336658A publication Critical patent/JP2004336658A/ja
Application granted granted Critical
Publication of JP4228772B2 publication Critical patent/JP4228772B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

【課題】従来のネットワーク監視方法では、特定のノードに障害が発生した際は、該ノードから直接状態情報を得ることができないことから、隣接するノードから送信されてくる状態情報を基に、該状態情報を送信してきたノードに隣接するノードに対して優先的に状態問合せのポーリングを行って障害ノードを特定していた。このため、障害ノードおよびその近傍に接続されているノードに対して、重複して状態問合せがなされ、ネットワークに対する負荷増大の要因となっていた。
【解決手段】障害発生ノードの隣接ノードから送信されてくるポートの状態情報の変化を検出して、ネットワーク構成要素間の接続関係情報を基に障害発生ノードを特定し、かつ、前記接続関係情報を基に該障害ノードに接続されている影響ノードを順次特定することにより、障害ノードの影響で監視不能となったノードを最小限の状態問合せで効率的に特定し、ネットワークに対する監視のための負荷を抑制する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、ネットワーク監視方法およびネットワーク監視装置に関し、特に、ネットワーク内の障害が発生したノードに隣接するノードが検出した状態情報を基に、障害が発生したノードとその影響範囲を効率的に特定するネットワーク監視方法およびネットワーク監視装置に関する。
【0002】
多数のノードが回線により相互に接続されたネットワークでは、通常、ネットワークの状態を監視するためのネットワーク監視装置が設けられている。
近年、ネットワークの大規模化および複雑化に伴い、ネットワーク内の一部のノードの障害による影響が広範囲に及び、障害が発生したノードおよびその影響範囲を、ネットワークに余分な負荷を掛けずに効率的かつ迅速に特定できるネットワーク監視方法およびネットワーク監視装置の実現が望まれている。
【0003】
【従来の技術】
図13は、従来技術のネットワーク監視方法で、ネットワークを構成する各ノードの接続関係を実線で示し、障害ノードの特定のシーケンスを点線矢印で示している。
図13に示すネットワークは、ノードA、B、C、D、E、Fから成り、ノードAはポートA1、A2を有し、ノードBはポートB1、B2を有し、ノードCはポートC1、C2を有し、ノードDはポートD1、D2、D3を有し、ノードEはポートE1、E2を有し、ノードFはポートF1を有する。また、ノードAとノードBはリンクL1で接続され、ノードAとノードCはリンクL2で接続され、ノードCとノードDはリンクL3で接続され、ノードDとノードEはリンクL5で接続され、ノードEとノードFはリンクL6で接続されている。
【0004】
ノードDが電源断した場合を考えると、ノードDからは状態情報は送信されないため、ネットワーク監視装置はノードDの状態が変化したことを直接知ることができない。また、ノードEおよびノードFは、ノードDが停止することによりネットワーク監視装置10への通信経路が切断されるため、ネットワーク監視装置10からの監視となるが、これを直接検出することはできない。
【0005】
この問題の解決策としては、ネットワーク監視装置から定期的に各ノードの状態を問い合わせるポーリングを実行し、定期的に各ノードの状態を確認し、障害が起きた時には、障害のノードに隣接しているノードに対して優先的にポーリングを行うことで、最初の障害に関連の有る障害を早く求める方法がある(例えば、特許文献1参照。)。
【0006】
これらの方法を用いたネットワーク監視方法は、図13に点線矢印で示したように、例えば次のようなシーケンスで行われる。ここでは、ネットワーク監視装置のポーリングは、通常はノードA、B、C、D、E、Fの順に行われ、ノードFに対するポーリングが終わった時点で、ノードDの電源断が発生した場合について説明する。
【0007】
S01. ノードDで電源断が発生。
S02. ネットワーク監視装置10は、ノードAに対してポーリングを行い、ノードAが正常であることを確認する。
S03. ネットワーク監視装置10は、次のポーリング先となるノードBに対してポーリングを行い、ノードDにリンクL4を介して接続されているポートB2のリンク断を検出する。
【0008】
S04. ノードBのポートB2でリンク断を検出したネットワーク監視装置10は、通常のポーリング順となるノードCではなく、ノードBに接続されているノードであるノードAおよびノードDに対しポーリングを優先して行うため、例えばまずノードAに対してポーリングを行い、ノードAの正常を確認する。
S05. 引き続いて、ノードDに対してポーリングを行い、応答が返送されないことから、ノードDの異常を検出する。
【0009】
S06. 次に、通常のポーリング順に戻って、ノードCに対してポーリングを行い、ノードDにリンクL3を介して接続されているポートC2のリンク断を検出する。
S07. ノードCのポートC2でリンク断アラームを検出したネットワーク監視装置10は、ノードCに接続されているノードAおよびノードDに対しポーリングを優先して行う。ここでは、例えば、まずノードDに対してポーリングを行い、次にノードAに対してポーリングを行うものとする。
【0010】
ノードDに対するポーリングに対しては応答がなく、ノードDの異常を検出する。
S08. 次に、ノードAに対して、ポーリングを行い、ノードAは正常であることを確認する。
S09. 通常のポーリング順序に戻って、次は、ノードEに対してポーリングを行うが、ノードEとネットワーク監視装置10の通信経路となるノードDが停止しているため、応答が返送されず、ノードEは監視不能状態であることを確認する。
【0011】
S10. 次に、ノードFに対してポーリングを行うが、上記シーケンスS09と同様に、応答が返送されず、ノードFは監視不能状態であることを確認する。
上記のように、従来技術のネットワーク監視方法では、通常の定周期のポーリング以外に、ポートのリンク断を検出したノードに隣接するノードに対して、複数回のポーリングが行われることになり、ポーリングによるネットワークに対する負荷が大きくなることが予想される。
【0012】
【特許文献1】
特開平10−13409号公報(第4〜7頁、第3図)
【0013】
【発明が解決しようとする課題】
上記の従来技術によるネットワーク監視方法では、障害が発生して停止したノードに隣接するノードから、ポートのリンク断のアラームが検出されると、そのリンク断を検出したノードに隣接するノードに対して優先的にポーリングを行うため、同じノードDに対して複数のポーリングが実行されることになる。また、すべての隣接ノードに対してポーリングすることで、確認する必要の無いノードにもポーリングを行うこととなる。このため、ネットワークが大規模になるほど無駄なポーリングの回数も増え、ネットワークに不必要な負荷をかけるという問題がある。
【0014】
本発明は、ネットワーク監視方法およびネットワーク監視装置において、ネットワークの状態確認のためのポーリング回数を最小限にし、ネットワーク内の障害が発生したノードに隣接するノードが検出したポートのリンク断情報を基に、障害ノードおよびその影響範囲を効率的に特定するネットワーク監視方法およびネットワーク監視装置を提供することを目的とする。
【0015】
【課題を解決するための手段】
第一の発明は、ネットワークを構成するノード、および、ノード間のリンクの接続口となるポートの状態をネットワーク監視装置で監視するネットワーク監視方法において、前記ノードは前記ノードが備えるポートで検出した障害の有無を示すポート状態情報を前記ネットワーク監視装置へ送信し、前記ネットワーク監視装置は、状態変化したポートの識別情報を記憶する状態変化ポートテーブルと、ネットワークの構成要素の接続関係を記憶する接続関係情報テーブルとを備え、
各ノードから送信されてくるポートの状態情報を基にポートの状態変化を検出し、状態変化したポートである状変ポートに関する情報を記憶するエントリを前記状態変化ポートテーブルに登録し、前記状変ポートに対向して接続されているノードを、前記接続関係情報テーブルに記憶されている接続関係情報を基に選定して対向ノードとし、前記対向ノードに対して状態情報を収集するための状態問い合わせを行い、正常に応答が返送されないときに、前記対向ノードを障害が発生した障害ノードとして特定する、ように構成した。
【0016】
第一の発明によれば、あるノードで障害が発生した場合は、障害ノードに対向して接続されている隣接ノードから、障害ノードに対向して接続されているポートの状態情報がネットワーク監視装置に送信され、ネットワーク監視装置は、このポートに関する状態変化を検出することにより、該ポートに対向して接続されている障害ノードを特定することができ、障害ノードに近接するノードに対する状態問合せを行うことなく、障害ノードの特定が可能となる。
【0017】
第二の発明は、前記第一の発明において、前記対向ノードの選定は、最初の状態変化検出時点から予め定められた時間内に前記状態変化ポートテーブルに蓄積された前記状変ポートに関するエントリに対して一括して行い、選定された同一の対向ノードに対しては、一回の状態問い合わせのみで障害ノードの特定を行う、ように構成した。
【0018】
第二の発明によれば、あるノードで障害が発生したことに起因して、該ノードに近接する複数ノードのポートの状態情報がネットワーク監視装置にほぼ同時に送信された場合でも、障害ノードに対する状態情報収集のための問い合わせは一回のみで行われるだけであり、ネットワークに対する負荷を抑制した形で障害ノードの特定を行うことができる。
【0019】
第三の発明は、前記第一の発明または前記第二の発明において、前記状態変化ポートテーブルに登録される状変ポートのエントリに状態変化を検出した際の要因を示す状変要因情報の記憶領域を設け、前記状変要因情報には、状態変化を検出したノードから自律的に送信されてくる状態情報により状態変化を検出した場合と、前記ネットワーク監視装置からの状態問合せにより状態変化を検出した場合とを識別できる初期値が設定され、前記状態変化ポートテーブルに存在するエントリの状変ポートを第一の状変ポートとし、前記第一の状変ポートのエントリの状変要因情報が、前記初期値の場合は、前記接続関係情報テーブルに記憶されている接続関係情報を基に、前記第一の状変ポートに対向して接続する第一の対向ノードを選定し、前記第一の対向ノードに対して状態問合せを行った際に応答がないときは、前記第一の対向ノードを、状態を確認できないノードであることを示す不明ノードとして特定し、前記第一の対向ノードに属するポートは不明な状態へ状態変化したとみなして、前記状態変化ポートテーブルへ第二の状変ポートとしてエントリを登録し、その際、前記第二の状変ポートが前記第一の状変ポートと対向して接続される関係にある場合は、前記第二の状変ポートのエントリの前記状変要因情報として、前記初期値とは異なる前記第二の状変ポートと対向して接続される前記第一の状変ポートの識別情報を設定し、前記状態変化ポートテーブルから前記第一の状変ポートのエントリを削除し、以降、前記状態変化ポートテーブル内に残された前記第二の状変ポートのエントリに対して、前記第一の状変ポートのエントリに対して行ったと同じ手順を実施し、これを前記状態変化ポートテーブルに状変ポートのエントリが無くなるまで繰り返し行う、ように構成した。
【0020】
第三の発明によれば、第一の発明により特定された障害発生のノードを経由してネットワーク監視装置に接続されているノードについては、該障害の影響によりネットワーク監視ができない範囲として、速やかに特定することが可能となる。
【0021】
【発明の実施の形態】
図1は、本発明のネットワーク監視方法で、ネットワーク監視装置10は状態変化ポートテーブル15、ネットワーク状態テーブル16、および、接続関係情報テーブル17を備え、それらのテーブルを用いて障害ノードの特定を行う。点線矢印は、障害特定の手順を示しており、この詳細については後述する。
図2〜6は本発明の状態変化ポートテーブル(1)〜(5)で、ネットワーク内の各ノードが保持する通信のインターフェースとなるポートの状態変化に関する情報を一時的に記憶するテーブルである。ここでは、ノードDが電源断になったときの状態変化ポートテーブル15の内容の推移例を図2〜6で示しており、その推移についての詳細は後述する。
図2の本発明の状態変化ポートテーブル(1)に示すように、状態変化ポートテーブル15のエントリは、状態変化が発生した時刻、ポートのIPアドレス、ポート識別情報、本エントリを処理済みか否かを示す処理済フラグ、および、状態変化の要因を示す状変要因情報からなり、ネットワーク監視装置10は、各ノードから送信されてくる状態情報の内、ポートに関する状態情報の変化を検出し、変化があったときに該ポートに関するエントリを生成して登録する。
図7は、本発明のネットワーク状態テーブルの構成で、ネットワークの構成要素毎に、その状態を記憶しておくテーブルである。本テーブルのエントリは、ネットワーク構成要素のID、構成要素名、および、状態情報からなる。本実施例では、状態情報は「正常」、「障害」、および、監視ができない状態を示す「不明」の3つの状態があるものとし、ポートB2で障害を検出した場合を例示している。図8は、本発明の接続関係情報テーブルの構成で、ネットワークの構成要素間の接続関係を記憶するテーブルであり、本テーブルを検索することにより、あるポートの接続相手となるノードを特定することができる。本テーブルのエントリは、接続関係ID、構成要素1、および、構成要素2からなり、構成要素1に示す構成要素と、構成要素2に示す構成要素とが、互いに接続関係にあることを示している。従って、本テーブルを必要な回数検索することにより、ある構成要素と接続関係にある構成要素を特定できる。本実施例では、ノード、ポート、およびポート間を接続するリンクをネットワーク構成要素としており、図1の本発明のネットワーク監視方法に示すネットワーク構成の一部を例示している。例えば、ポートB2はノードBに属して、リンクL4を介してポートD2に接続され、ポートC2はノードCに属して、リンクL3を介してポートD1に接続され、ポートD2およびポートD1はノードDに属していることが分かる。
次に、障害ノードおよびその影響範囲の特定方法について、図1の本発明のネットワーク監視方法に示した点線矢印に付されたシーケンス番号に従って、図2〜図6に示す本発明の状態変化ポートテーブルの構成(1)〜(5)、図7に示す本発明のネットワーク状態テーブルの構成、および、図8に示す本発明の接続関係情報テーブルの構成を併用して説明する。
S01. ノードDにて電源断が発生。
S02. ノードDからネットワーク監視装置10に対して状態情報を送信することは出来ないが、ポートB2およびポートC2はノードDとのリンク断を検出し、その状態情報をネットワーク監視装置10へ送信する。
S03. ネットワーク監視装置10は、この2つの状態情報を受信して、ポートB2とポートC2の状態が障害状態に変化したことを検知し、ネットワーク状態テーブル16内のポートB2とポートC2の状態を「正常」から「障害」へ書き換え、状態変化ポートテーブル15にポートB2とポートC2の状態変化に関するエントリデータを書き込む。この時の状態変化ポートテーブル15の内容を図2に示す。ここで、図2のなかの状変要因情報のトラップは、ネットワーク内のノードからの自律的な状態情報送信が要因であることを示している。
ネットワーク監視装置10は、状態変化ポートテーブル15に登録されているポートB2およびポートC2に関する状変ポートのエントリを読み出した後、該状変ポートのエントリを処理済であることを示すために、該当する処理済フラグに”1”を設定しておく。次に、読み出したエントリ内のポート識別情報を基に接続関係情報テーブル17を検索し、ポートB2およびポートC2それぞれにリンク接続されている対向ノードを求めて、ポートB2およびポートC2の対向ノードとして同一のノードDを選定する。そして、選定したノードDに対する処理が既に行われていないことを確認するために、状態変化ポートテーブル15内の処理済フラグが”1”となっているエントリのポート識別情報および状変要因情報をチェックし、該ポート識別情報にノードDに属するポート識別情報がないか、また、状変要因情報に初期値とは異なるノードDに属するポート識別情報が設定されているエントリが無いかを確認する。図2に示す実施例ではノードDに関する情報は無いため、ノードDの状態を確認するために、ノードDに対して状態問合せのポーリングを実行する。
ノードDは電源断の状態にあるため、ポーリングに対しては応答が返送されないことから、ノードDが障害ノードであることが特定される。ノードDおよびそれに属するポートD1、D2、D3はすべて状態を監視できないことを示す「不明」の状態として、ネットワーク状態テーブル16を更新する。ポートD1、D2、D3は「正常」状態から「不明」状態へ状態変化したとみなし、状態変化ポートテーブル15にポートD1、D2、D3に関するエントリデータを書き込む。このとき、ポートD1およびポートD2のエントリの状変要因情報には、各ポートの接続先となっているポートC2およびポートB2の識別情報を設定しておき、ポートD1およびポートD2のエントリは、ポートC2およびポートB2の状態変化をノードCおよびノードBからの状態情報受信により検出した結果、対向ノードDに対するポーリングにより生成されたエントリであることを記憶しておく。これにより、ポートC2およびポートB2がそれぞれ属するノードCおよびノードBについては、既に状態確認が完了していることが分かり、後でノードDの影響範囲を探索するために行うノードDに隣接するノードに対する状態問合せ処理の対象から、ノードCおよびノードBを除外することができる。この時点の状態変化ポートテーブル15の内容を図3に示す。ここで、状変要因情報のポーリングは、該当エントリの状変ポートは、ネットワーク監視装置10からのポーリングが要因で、状態変化が検出されたことを示す。
この後、状態変化ポートテーブル15から、既に参照して処理済のポートB2およびポートC2に関するエントリを、処理済フラグが”1”であることにより判定し、削除する。
S04. 状態変化ポートテーブル15に未処理のエントリが残っているかどうかチェックする。ポートD1、ポートD2、ポートD3に関するエントリが残っているので、読み込んで、前記接続関係情報テーブル17に基づいて、それぞれのポートにリンク接続されている対向ノードとして、ノードB、ノードC、ノードEを選定する。ここで、ポートD1、ポートD2、ポートD3に関するエントリ内の処理済フラグは処理済みを示す”1”に設定しておく。そして、これらの選定された対向ノードに関する情報が状態変化ポートテーブル15に含まれていないかを確認する。
ポートD2のエントリ内の状変要因情報にノードBに属するポートB2の識別情報が設定され、ポートD1のエントリ内の状変要因情報にノードCに属するポートC2の識別情報が設定されており、ノードBおよびノードCについては、上記ステップS03で述べたように、以前の処理で確認済みであることが分かるため、ノードBとノードCに対するポーリングは行わない。
そして、ノードEについては状態変化ポートテーブル15に関連する情報が無いので未確認であり、状態確認が必要であることが分かり、ノードEに対してポーリングを実行する。
S05. ノードDに対してポーリングを行った時と同様に、ノードEに対する状態問合せのポーリングでは応答がなく、ネットワーク状態テーブル16のノードE、ポートE1およびポートE2の状態を「不明」に書き換えると同時に、状態変化ポートテーブル15にポートE1とポートE2が「正常」から「不明」へ状態変化した旨のエントリデータを書き込む。このとき、ポートE1についてのエントリデータの状変要因情報には、対向接続するポートD3の状態変化の検出処理が要因となって状態変化を検出した旨を示すためにポートD3の識別情報を設定し、ポートE2についてはポーリングにより状態変化を検出した旨の初期値「ポーリング」を設定しておく。この時点の状態変化ポートテーブル15の内容は、図4に示す通りとなる。この後、処理済フラグを参照して、既に処理済みのポートD1、ポートD2、ポートD3に関するエントリを状態変化ポートテーブル15から削除する。
【0022】
さらに、状態変化ポートテーブル15を検索すると、ポートE1とポートE2に関する状態変化のエントリデータが取得できるので、それぞれの処理済フラグを”1”に設定し、接続関係情報テーブル17を基に、それぞれのポートにリンク接続されている対向ノードを選定する。ここでは、ポートE1とポートE2にリンク接続されている対向ノードは、それぞれノードDおよびノードFであることが分かる。
状態変化ポートテーブル15から、ポートE1の状態変化の状変要因はノードDに属するポートD3であることが分かる。これは、ノードDに対する確認処理は済みであることを意味するため、ノードDに対するポーリングは行わない。
ノードFに関しては、状態変化ポートテーブル15に関連する情報が無いため、確認処理を行うためにノードFに対してポーリングを行う。
ノードFに対してのポーリングに対しては応答が返送されないため、ネットワーク状態テーブル16のノードFとポートF1の情報を「不明」に書き換え、状態変化ポートテーブル15にポートF1に関する状態変化のエントリデータを書き込む。この時点の状態変化ポートテーブル15の内容は図5の通り。その後、状態変化ポートテーブル15内の、既に処理済みのポートE1およびポートE2に関するエントリは削除する。
この時点で、状態変化ポートテーブル15の内容は図6に示すようになっており、ポートF1の状態変化についてのエントリを取得し、対応する処理済フラグに”1”を設定する。ここで、接続関係情報テーブル17に基づき、ポートF1にリンク接続されている対向ノードとしてノードEを選定する。そして、ノードEに関連する情報が状態変化ポートテーブル15に有るかどうか確認すると、ポートF1のエントリ内の状変要因情報は、ノードEに属するポートE2であることから、ノードEに対する確認の処理は既に行われていることが分かるため、ノードEに対するポーリングは行わない。そして、既に参照して処理済のポートF1に関するエントリを、状態変化ポートテーブル15から削除する。
【0023】
さらに、状態変化ポートテーブル15を検索して、エントリが無いことから、障害ノードDおよびその影響範囲のノードが全て探索されたことが分かり、処理を終了する。
以上のように、本発明においては、定期ポーリング無しで状態情報をネットワーク監視装置へ直接送信することができない障害を検出し、あるノードで障害が起きた時に、その障害の影響で監視不能となる範囲が正確に特定でき、また、あるノードで障害が起きた時に、それに関連するノード群から複数の状態情報が同時に送出されたとしても、同じノードに対して余分なポーリングが実行されないことが分かる。
図9は、本発明のネットワーク監視装置の構成である。
状態情報受信部11は、ネットワークを構成する各ノードから送信されてくる状態情報を受信し、障害解析部13へ引き渡す。
障害解析部13はその状態情報を解析し、ポートについての状態変化を検出して、該ポートに関する状態変化の情報を状態変化ポートテーブル15のエントリデータとして登録すると同時に、ネットワーク状態テーブル16に記憶されているネットワーク構成要素の状態情報を更新する。
障害解析部13は、対向ノード検索部14に依頼して、状態変化ポートテーブル15に登録されている第一のエントリのポートに接続されている対向ノードを、ネットワークの構成要素間の接続関係を保持している接続関係情報テーブル17に基づいて選定する。そして、ここで選定された対向ノードに対して、状態問合せ部12に依頼して状態確認のポーリングを行う。このポーリングによる応答が返送されないときに、該対向ノードを障害ノードとして特定する。これにより、障害ノードに近接するノードに対して状態問合せを行うことなく、障害ノードの特定が可能となり、ネットワークに対する負荷を抑制した形での、障害特定が可能となる。ここで、この状態確認結果を、再び前記状態変化ポートテーブル15に反映した後、前記第一のエントリを状態変化ポートテーブル15から削除する。
この更新された状態変化ポートテーブル15に対して、上記のような対向ノードの選定と、それに対するポーリングを行い、これを未確認の対向ノードがなくなるまで繰り返すことにより、ネットワーク監視装置10はひとつのノードの障害を元に、その障害の影響で監視不能となる全てのノードとそのノードに属するポートを、定期的なポーリングを行うこと無しに正確に特定することができる。
また、あるひとつの障害に関して、関連するノードから複数のアラーム情報が同時に上がった時に対応するため、障害解析部13は、最初の状態変化検出時点から、予め定められた時間待機し、この間に検出された複数のポートについての状態変化情報が状態変化ポートテーブル15に蓄積されるのを待ち合わせる。その後、障害解析部13が状態変化ポートテーブル15を検索することによって、同じ障害を原因として状態変化したポートをまとめて取得し、これらを一括して処理することにより、同一の対向ノードが複数回選定された場合は、該対向ノードに対しては一回の状態問合せのためのポーリングを行うだけで、該ノードの状態を確認することができ、ネットワークに対する負荷を抑制することができる。
【0024】
対向ノード検索部14は、障害解析部13の依頼で起動され、障害解析部13から引き渡されたポート識別情報を基に、接続関係情報テーブル17を検索し、このポートとリンク接続されているノードを選定する。
状態問合せ部12は、障害解析部13の依頼で起動され、対向ノード検索部14により選定されたノードに対して、状態問合せのためのポーリングを行う。ここでポーリングの内容としては、例えば、最初にIP(Internet Protocol)レベルの接続性を確認するコマンドであるPingを用いて疎通確認を行い、疎通確認が成功であれば継続してノードの情報を取得する処理を行い、疎通確認が失敗であればその時点でノードの状態は「不明」であると判断して、その後の情報取得は行わないようにすることができる。ポーリングの結果は障害解析部13に通知され、ネットワーク状態テーブル16および状態変化ポートテーブル15の内容が更新される。
状態変化ポートテーブル15は、状態変化したポートに関する情報を記憶するもので、各エントリは、状態変化が起きた時刻、状態変化が起きたポートのIPアドレス、ポート識別情報、障害解析部13にて処理済みかどうかを示す処理済フラグ、状態変化の発生要因を示す状変要因情報を含んでいる。各エントリは、ポートの状態変化が検出されたときに登録され、障害解析部13により処理されたエントリは、削除される。
ネットワーク状態テーブル16は、ネットワーク構成要素の状態を保持するテーブルであり、登録される各エントリは、構成要素ID、構成要素名、および、状態情報を含んでいる。ここで、状態情報としては、例えば、「正常」、「障害」、「不明」といったネットワーク構成要素の状態を識別する情報が設定される。
接続関係情報テーブル17は、ネットワーク構成要素間の接続関係を保持するテーブルであり、接続関係毎に登録されるエントリは、接続関係の識別番号となる接続関係ID、相互に接続される二つのネットワーク構成要素の識別情報を記憶する構成要素1および構成要素2を含んでいる。
【0025】
図10は、本発明の障害解析部の動作フローチャート(1)である。
S01. 状態情報受信部11から引き渡された状態情報を、ネットワーク状態テーブル16に保持されている現在の状態情報と比較し、状態が変化した場合は、ネットワーク状態テーブル16内の状態情報を更新する。例えば、現在の状態が「正常」のときに、障害の状態情報を受信したときは、ネットワーク状態テーブル16内の対応する構成要素のエントリ内の状態情報を「正常」から「障害」へ書き換える。ここで、状態変化した構成要素がポートの場合は、さらに状態変化ポートテーブル15に該ポートの状態変化に関するエントリデータを生成して登録する。このとき、エントリ内の状変要因情報には、状態変化を検出する要因となった情報として、各ノードからの自律的な状態情報の送信による場合、および、ネットワーク監視装置10からの状態問合せのポーリングに対する応答による場合を区別できる初期値を設定しておく。例えば、ノードからの自律的な状態情報の送信による場合は「トラップ」とし、ネットワーク監視装置10からの状態問合せのポーリングに対する応答による場合は「ポーリング」としておく。
S02. 予め定められた時間、状態情報受信部11からの状態情報の引渡しを待ち合わせて、状態情報の受信の都度上記ステップS01を行い、状態変化ポートテーブル15にポートの状態変化に関するエントリを蓄積する。
S03. 状態変化ポートテーブル15内に、ポートに関するエントリが登録されているか否か判定し、エントリがあれば(YES)、次のステップS04へ移行し、エントリがなければ(No)、処理を終了する。
S04. 図11に示すポート解析処理を実行し、終了したら、ステップS03へ戻って状態変化ポートテーブル15内のエントリを検索する。
図11は、本発明の障害解析部の動作フローチャート(2)で、状態変化ポートテーブル15に登録されているエントリに関する処理内容を示している。
S01. 状態変化ポートテーブル15内に存在するエントリを第一のエントリとみなして取り出し、該エントリに含まれるポート識別情報を基に、対向ノード検索部14に依頼して、該ポートにリンク接続されている対向ノードを求めると同時に、該エントリ内の処理済フラグに処理済みを意味する”1”を設定する。上記の処理を、状態変化ポートテーブル15内の全てのエントリについて行った後、求められた対向ノードの中の同一ノードを一つに集約して、最終的な対向ノードとして選定する。これにより、特定のノードの障害に起因して、予め定められた時間内に複数の関連箇所の状態変化が発生した場合でも、同一の対向ノードに対して複数回の状態問合せのためのポーリングを行うことを防止でき、ネットワークの負荷増大を抑制できる。
S02. 上記ステップS01で選定した対向ノード対して、既に確認処理が行われているか否かを確認するために、状態変化ポートテーブル15内の処理済フラグが”1”であるエントリを検索し、ポート識別情報または状変要因情報に該対向ノードに属するポートの識別情報が設定されているエントリがあるか否かを判定する。対応するエントリがある場合は(YES)、該対向ノードに対する状態確認をおこなわずにステップS06へ移行し、対応するエントリが無い場合は(NO)、該対向ノードの状態確認のために次のステップS03へ移行する。これにより、特定のノードの障害に関連して同時に発生した状態変化に伴い、同一ノードに対して、不要な複数回の状態問合せのためのポーリングを行うことを防止でき、ネットワークに対する負荷増大を抑制できる。
S03. 該対向ノードの状態を確認するため、状態問合せ部12に依頼して、該対向ノードに対して状態問合せのためのポーリングを実行する。ポーリングに対する応答が返送された場合は、その応答に含まれる状態情報を最新の状態と見なし、また、ポーリングに対する応答が返送されない場合は、該対向ノードおよび該対向ノードに属するポートはすべて状態が監視できないことを意味する「不明」の状態と見なす。
S04. 上記ステップS03の状態問合せの結果、該対向ノードとそれに属するポートが状態変化したか否かを、ネットワーク状態テーブル16に基づいて判定し、状態変化があれば(YES)、次のステップS05へ移行し、状態変化が無ければ(NO)、ステップS06へ移行する。
S05. 状態変化があった場合は、ネットワーク状態テーブル16を最新の状態に更新すると同時に、状態変化ポートテーブル15にポートの状態変化に関する情報を記憶した第二のエントリを登録する。ここで、状変要因情報には、ネットワーク監視装置10からの状態問合せのポーリングに対する応答が状態変化の要因となったことを示すための初期値として、例えば、「ポーリング」を設定しておく。そして、状態変化したポートが、上記ステップS01で状態変化ポートテーブル15から取り出した第一のエントリのポートと対向接続の関係にある場合は、登録する第二のエントリ内の状変要因情報には、前記第一のエントリに含まれるポート識別情報を設定する。
S06. 状態変化ポートテーブル15から、既に処理済みであることを示す処理済フラグが”1”のエントリを削除し、呼び出し元へ復帰する。
上記の図10および図11に示す本発明の障害解析部の動作フローチャートに示すように、最初のポートの状態変化の情報を基に、先ず障害ノードを特定し、さらに状態変化ポートテーブル15の更新を繰り返しながら、該障害ノードに接続されている未確認のノードを順次探索していくことにより、該障害ノードの影響でネットワーク監視ができなくなるノードを、最小限のポーリングにより確実に特定できるようになる。
図12は、本発明の対向ノード検索部の動作フローチャートである。
S01. 障害解析部13からパラメータとして引き渡されたポート識別情報を基に接続関係情報テーブル17を検索し、該ポート識別情報を構成要素1または構成要素2のいずれかに含み、かつ、他方の構成要素がリンク識別情報であるエントリを一つ抽出して、第一のエントリとする。
S02. 接続関係情報テーブル17を検索し、上記ステップS01で抽出した第一のエントリ内のリンク識別情報と同一内容のリンク識別情報を構成要素1または構成要素2のいずれかに含み、かつ、上記第一のエントリとは異なるエントリを一つ抽出して、第二のエントリとする。
S03. 接続関係情報テーブル17を検索し、上記ステップS02で抽出した第二のエントリ内のポート識別情報と同じ内容のポート識別情報を構成要素1または構成要素2のいずれかに含み、かつ、他方の構成要素がノード識別情報であるエントリを一つ抽出して、第三のエントリとする。
S04. 上記ステップS03で抽出した第三のエントリに含まれるノード識別情報が示すノードを、障害解析部13からパラメータとして引き渡されたポート識別情報が示すポートとリンク接続されている対向ノードと決定し、呼び出し元である障害解析部13へ通知して、処理を終了する。
以上、本発明の実施の形態においては、図1の本発明のネットワーク監視方法に示すノードA、B、C、D、E、Fから構成されるネットワークを実施例として説明したが、ネットワークの構成形態はこれに限定されず、様々な態様が可能である。
また、図9に示す本発明のネットワーク監視装置の構成は、処理のブロック分割方法や、状態変化ポートテーブル15、ネットワーク状態テーブル16、および、接続関係情報テーブル17のテーブル構成方法には、様々な変形が可能であるが、本発明は同様に適用できる。
【0026】
【発明の効果】
本発明は、あるノードで障害が発生した場合は、障害ノードに対向して接続されている隣接ノードから、該障害ノードに関連する1以上のポートの状態情報がネットワーク監視装置に送信されたときに、ネットワーク監視装置は、これらポートに関する状態変化情報を予め定められた時間待ち合わせて蓄積し、この蓄積された情報を基に、上記1以上のポートに対向して接続されている障害ノードを特定するように構成している。
【0027】
これにより、障害ノードを特定するために、障害ノードおよびそれに隣接するノードに対して状態情報収集を行うための問い合わせ回数を最小限にすることができ、障害特定のためのネットワークに対する負荷を抑制することができる。
また、本発明では、ネットワークの構成要素間の接続関係情報を保持し、上記の特定された障害ノードを経由する形態で接続されているノードを、その接続関係を順次探索することにより、最小限の状態問合せで特定できるように構成している。
【0028】
これにより、特定のノードの障害の影響で監視ができなくなったノードを、ネットワークに対する負荷を抑制した形で効率的かつ確実に特定できる。
【図面の簡単な説明】
【図1】本発明のネットワーク監視方法
【図2】本発明の状態変化ポートテーブルの構成(1)
【図3】本発明の状態変化ポートテーブルの構成(2)
【図4】本発明の状態変化ポートテーブルの構成(3)
【図5】本発明の状態変化ポートテーブルの構成(4)
【図6】本発明の状態変化ポートテーブルの構成(5)
【図7】本発明のネットワーク状態テーブルの構成
【図8】本発明の接続関係情報テーブルの構成
【図9】本発明のネットワーク監視装置の構成
【図10】本発明の障害解析部の動作フローチャート(1)
【図11】本発明の障害解析部の動作フローチャート(2)
【図12】本発明の対向ノード検索部の動作フローチャート
【図13】従来技術のネットワーク監視方法
【符号の説明】
10 ネットワーク監視装置
11 状態情報受信部
12 状態問合せ部
13 障害解析部
14 対向ノード検索部
15 状態変化ポートテーブル
16 ネットワーク状態テーブル
17接続関係情報テーブル
A,B,C,D.E.F ノード
A1,A2 ノードAのポート
B1,B2 ノードBのポート
C1,C2 ノードCのポート
D1,D2,D3 ノードDのポート
E1,E2 ノードEのポート
F1 ノードFのポート
L1,L2,L3,L4,L5,L6 リンク

Claims (5)

  1. ネットワークを構成するノード、および、ノード間のリンクの接続口となるポートの状態をネットワーク監視装置で監視するネットワーク監視方法において、
    前記ノードは前記ノードが備えるポートで検出した障害の有無を示すポート状態情報を前記ネットワーク監視装置へ送信し、
    前記ネットワーク監視装置は、状態変化したポートの識別情報を記憶する状態変化ポートテーブルと、ネットワークの構成要素の接続関係を記憶する接続関係情報テーブルとを備え、
    各ノードから送信されてくるポートの状態情報を基にポートの状態変化を検出し、状態変化したポートである状変ポートに関する情報を記憶するエントリを前記状態変化ポートテーブルに登録し、
    前記状変ポートに対向して接続されているノードを、前記接続関係情報テーブルに記憶されている接続関係情報を基に選定して対向ノードとし、
    前記対向ノードに対して状態情報を収集するための状態問い合わせを行い、正常に応答が返送されないときに、前記対向ノードを障害が発生した障害ノードとして特定する、
    ことを特徴とするネットワーク監視方法。
  2. 請求項1に記載のネットワーク監視方法において、
    前記対向ノードの選定は、最初の状態変化検出時点から予め定められた時間内に前記状態変化ポートテーブルに蓄積された前記状変ポートに関するエントリに対して一括して行い、選定された同一の対向ノードに対しては、一回の状態問い合わせのみで障害ノードの特定を行う、
    ことを特徴とするネットワーク監視方法。
  3. 請求項1または請求項2に記載のネットワーク監視方法において、
    前記状態変化ポートテーブルに登録される状変ポートのエントリに状態変化を検出した際の要因を示す状変要因情報の記憶領域を設け、
    前記状変要因情報には、状態変化を検出したノードから自律的に送信されてくる状態情報により状態変化を検出した場合と、前記ネットワーク監視装置からの状態問合せにより状態変化を検出した場合とを識別できる初期値が設定され、
    前記状態変化ポートテーブルに存在するエントリの状変ポートを第一の状変ポートとし、前記第一の状変ポートのエントリの状変要因情報が、前記初期値の場合は、前記接続関係情報テーブルに記憶されている接続関係情報を基に、前記第一の状変ポートに対向して接続する第一の対向ノードを選定し、
    前記第一の対向ノードに対して状態問合せを行った際に応答がないときは、前記第一の対向ノードを、状態を確認できないノードであることを示す不明ノードとして特定し、前記第一の対向ノードに属するポートは不明な状態へ状態変化したとみなして、前記状態変化ポートテーブルへ第二の状変ポートとしてエントリを登録し、その際、前記第二の状変ポートが前記第一の状変ポートと対向して接続される関係にある場合は、前記第二の状変ポートのエントリの前記状変要因情報として、前記初期値とは異なる前記第二の状変ポートと対向して接続される前記第一の状変ポートの識別情報を設定し、
    前記状態変化ポートテーブルから前記第一の状変ポートのエントリを削除し、
    以降、前記状態変化ポートテーブル内に残された前記第二の状変ポートのエントリに対して、前記第一の状変ポートのエントリに対して行ったと同じ手順を実施し、これを前記状態変化ポートテーブルに状変ポートのエントリが無くなるまで繰り返し行う、
    ことを特徴とするネットワーク監視方法。
  4. ネットワークを構成するノード、および、ノード間のリンクの接続口となるポートの状態を監視するネットワーク監視装置において、
    前記ノードは前記ノードが備えるポートで検出した障害の有無を示すポート状態情報を前記ネットワーク監視装置へ送信する手段と、
    前記ネットワーク監視装置は、状態変化したポートの識別情報を記憶する状態変化ポートテーブルと、ネットワークの構成要素の接続関係を記憶する接続関係情報テーブルと、
    各ノードから送信されてくるポートの状態情報を基にポートの状態変化を検出し、状態変化したポートである状変ポートに関する情報を記憶するエントリを前記状態変化ポートテーブルに登録する手段と、
    最初の状態変化検出時点から予め定められた時間内に前記状態変化ポートテーブルに蓄積された前記状変ポートに関するエントリに対して、前記状変ポートに対向して接続されているノードの選定を、前記接続関係情報テーブルに記憶されている接続関係情報を基に一括して実施して対向ノードとする手段と、
    選定された同一の対向ノードに対しては、状態情報を収集するための状態問い合わせを一回のみ行い、正常に応答が返送されないときに、前記対向ノードを障害が発生した障害ノードとして特定する手段を備える、
    ことを特徴とするネットワーク監視装置。
  5. 請求項4に記載のネットワーク監視装置において、
    前記状態変化ポートテーブルに登録される状変ポートのエントリは状態変化を検出した際の要因を記憶する状変要因情報を備え、
    前記状変要因情報に、状態変化を検出したノードから自律的に送信されてくる前記状態情報により状態変化を検出した場合と、前記ネットワーク監視装置からの状態問合せにより状態変化を検出した場合とを識別できる初期値を設定する手段と、
    前記状態変化ポートテーブルに存在するエントリの状変ポートを第一の状変ポートとし、前記第一の状変ポートのエントリの状変要因情報が、前記初期値の場合は、前記接続関係情報テーブルに記憶されている接続関係情報を基に、前記第一の状変ポートに対向接続する第一の対向ノードを選定する手段と、
    前記第一の対向ノードに対して状態問合せを行った際に応答がないときは、前記第一の対向ノードを、状態を確認できないノードであることを示す不明ノードとして特定し、前記第一の対向ノードに属するポートは不明な状態へ状態変化したとみなして、前記状態変化ポートテーブルへ第二の状変ポートとしてエントリを登録し、その際、前記第二の状変ポートが前記第一の状変ポートと対向して接続される関係にある場合は、前記第二の状変ポートのエントリの前記状変要因情報として、前記初期値とは異なる前記第二の状変ポートと対向して接続される前記第一の状変ポートの識別情報を設定する手段と、
    前記状態変化ポートテーブルから前記第一の状変ポートのエントリを削除する手段と、
    以降、前記状態変化ポートテーブル内に残された前記第二の状変ポートのエントリに対して、前記第一の状変ポートのエントリに対して行ったと同じ手順を実施し、これを前記状態変化ポートテーブルに状変ポートのエントリが無くなるまで繰り返し行う手段を備える、
    ことを特徴とするネットワーク監視装置。
JP2003133485A 2003-05-12 2003-05-12 ネットワーク監視方法およびネットワーク監視装置 Expired - Fee Related JP4228772B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003133485A JP4228772B2 (ja) 2003-05-12 2003-05-12 ネットワーク監視方法およびネットワーク監視装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003133485A JP4228772B2 (ja) 2003-05-12 2003-05-12 ネットワーク監視方法およびネットワーク監視装置

Publications (2)

Publication Number Publication Date
JP2004336658A true JP2004336658A (ja) 2004-11-25
JP4228772B2 JP4228772B2 (ja) 2009-02-25

Family

ID=33508013

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003133485A Expired - Fee Related JP4228772B2 (ja) 2003-05-12 2003-05-12 ネットワーク監視方法およびネットワーク監視装置

Country Status (1)

Country Link
JP (1) JP4228772B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010258614A (ja) * 2009-04-22 2010-11-11 Fujitsu Ltd 大規模ネットワーク監視方法
JP2012100056A (ja) * 2010-11-01 2012-05-24 Fujitsu Ltd 対処提示方法及び対処提示装置
JP2013162373A (ja) * 2012-02-07 2013-08-19 Mitsubishi Electric Corp 通信評価システム
JP2017092566A (ja) * 2015-11-04 2017-05-25 トヨタ自動車株式会社 車載ネットワークシステム
JP2017103519A (ja) * 2015-11-30 2017-06-08 日本電気株式会社 制御装置、通信システム、制御方法及びプログラム
JP2018007179A (ja) * 2016-07-07 2018-01-11 エヌ・ティ・ティ・コミュニケーションズ株式会社 監視装置、監視方法および監視プログラム
US9927790B2 (en) 2013-11-29 2018-03-27 Fujitsu Limited Transmission device, transmission system, and monitoring control method

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5838574B2 (ja) * 2011-03-24 2016-01-06 日本電気株式会社 監視システム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010258614A (ja) * 2009-04-22 2010-11-11 Fujitsu Ltd 大規模ネットワーク監視方法
JP2012100056A (ja) * 2010-11-01 2012-05-24 Fujitsu Ltd 対処提示方法及び対処提示装置
JP2013162373A (ja) * 2012-02-07 2013-08-19 Mitsubishi Electric Corp 通信評価システム
US9927790B2 (en) 2013-11-29 2018-03-27 Fujitsu Limited Transmission device, transmission system, and monitoring control method
JP2017092566A (ja) * 2015-11-04 2017-05-25 トヨタ自動車株式会社 車載ネットワークシステム
JP2017103519A (ja) * 2015-11-30 2017-06-08 日本電気株式会社 制御装置、通信システム、制御方法及びプログラム
JP2018007179A (ja) * 2016-07-07 2018-01-11 エヌ・ティ・ティ・コミュニケーションズ株式会社 監視装置、監視方法および監視プログラム

Also Published As

Publication number Publication date
JP4228772B2 (ja) 2009-02-25

Similar Documents

Publication Publication Date Title
US10674486B2 (en) System, security and network management using self-organizing communication orbits in distributed networks
JP5033856B2 (ja) ネットワーク構成の想定のための装置、システム
CN103795553B (zh) 基于监控的主、备服务器切换
EP3167571B1 (en) Network topology estimation based on event correlation
US6173324B1 (en) Method and apparatus for fault detection and isolation in data
CN109344014B (zh) 一种主备切换方法、装置及通信设备
US9167031B2 (en) Distributed processing system and distributed processing method
US7430688B2 (en) Network monitoring method and apparatus
CN111030873A (zh) 一种故障诊断方法及装置
JP4612525B2 (ja) ネットワーク障害部位特定装置および方法
JP5617304B2 (ja) スイッチング装置、情報処理装置および障害通知制御プログラム
EP1800436A1 (en) Method and apparatus for determining impact of faults on network service
JP2005285040A (ja) ネットワーク監視システム及びその方法、プログラム
JP2004336658A (ja) ネットワーク監視方法およびネットワーク監視装置
JP2005237018A (ja) ネットワークマネージメントシステムへのデータ送信
US10277484B2 (en) Self organizing network event reporting
CN114697196A (zh) 数据中心中网络路径切换方法、数据中心网络系统及设备
CN111064609A (zh) 消息系统的主从切换方法、装置、电子设备及存储介质
CN107846292B (zh) 防止故障处理延迟的方法和装置
JPH08147231A (ja) ネットワークノードの検索方法
JP2018005457A (ja) 情報処理装置、情報処理方法、プログラム
JP2003092571A (ja) ネットワークサービス監視装置およびその方法、ならびにネットワーク監視プログラムおよび記録媒体
CN116319547A (zh) 网络地址的管理方法、装置、系统、电子设备及存储介质
JP2611662B2 (ja) 網管理装置の運用管理システム
CN113805788A (zh) 一种分布式存储系统及其异常处理方法和相关装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081111

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081124

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees