JP2008061139A - Network monitoring device, network monitoring method, and computer program - Google Patents
Network monitoring device, network monitoring method, and computer program Download PDFInfo
- Publication number
- JP2008061139A JP2008061139A JP2006238203A JP2006238203A JP2008061139A JP 2008061139 A JP2008061139 A JP 2008061139A JP 2006238203 A JP2006238203 A JP 2006238203A JP 2006238203 A JP2006238203 A JP 2006238203A JP 2008061139 A JP2008061139 A JP 2008061139A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- network
- link
- determination
- lsa
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
本発明は、ネットワーク監視装置およびネットワーク監視方法、コンピュータプログラムに関する。 The present invention relates to a network monitoring device, a network monitoring method, and a computer program.
従来、IP(Internet Protocol)を用いた通信ネットワーク(以下、「IPネットワーク」と称する)では、経路制御プロトコルにより、パケットがどの経路を通って伝送されるかを制御(経路制御)している。そして、その経路制御状態を監視することで、IPネットワーク内の経路障害発生やその復旧をできる限り即時に把握するように努め、IPネットワークの安定的な運用を図っている。 2. Description of the Related Art Conventionally, in a communication network using IP (Internet Protocol) (hereinafter referred to as “IP network”), a route control protocol controls (route control) which route a packet is transmitted through. By monitoring the path control status, we try to grasp the occurrence of a path failure in the IP network and its recovery as quickly as possible to ensure stable operation of the IP network.
IPネットワークで利用される経路制御プロトコルの代表的なものとしては、OSPF(Open Shortest Path First)が知られている。OSPFでは、IPネットワークを構成する各ルータが、自身が持つリンク状態(通信リンクの接続状態や通信リンクのコストなど)を、リンク状態広告メッセージ(Link-state Advertisement:LSA)を用いてIPネットワーク全体に広報する。ルータは他のルータから発信されたLSAを受信し、その受信したLSAからリンク状態データベース(Link-state Database:LSDB)を作成する。そして、LSDBに基づき、IPネットワークにおいて宛先までのコストが最小となるパスツリー(以下、「最短パスツリー」と称する)を作成し、それをもとにルータの経路テーブルを作成する。 As a typical routing protocol used in an IP network, OSPF (Open Shortest Path First) is known. In OSPF, each router that configures an IP network uses its link state (communication link connection state, communication link cost, etc.) to indicate the entire IP network using a link-state advertisement (LSA). To publicize. The router receives LSAs transmitted from other routers and creates a link-state database (LSDB) from the received LSAs. Based on the LSDB, a path tree that minimizes the cost to the destination in the IP network (hereinafter referred to as “shortest path tree”) is created, and a route table of the router is created based on the path tree.
また、OSPFでは、ルータは、自身が持つリンク状態を定期的にLSAを用いて送信すること(Refresh LSA)に加えて、自身が持つリンク状態に変更があった場合にも、例えばルータに接続した通信リンクが切れたことを検知した場合などに、LSAを送信する。ルータは、以前に受信したLSAとは異なるメッセージ内容のLSAを受信すると、LSDBを書き換え、トポロジーや経路テーブルを再生成する。従って、OSPFが動作するIPネットワークにおいてLSAを収集し監視すれば、IPネットワークの経路制御状態の変更を検知することができる。 In OSPF, in addition to periodically sending the link status of the router using LSA (Refresh LSA), when the link status of the router changes, for example, the router connects to the router. LSA is transmitted when it is detected that the communication link is broken. When the router receives an LSA with a message content different from the previously received LSA, the router rewrites the LSDB and regenerates the topology and route table. Therefore, if an LSA is collected and monitored in an IP network on which OSPF operates, a change in the route control state of the IP network can be detected.
例えば特許文献1記載の従来のネットワーク監視技術では、IPネットワークに接続する監視端末装置がLSAを収集し、LSDBと、IPネットワーク内の全てのルータを含む最短パスツリーとを作成する。そして、LSAの変化分を受信すると、LSDB及び最短パスツリーを再生成し、変更前のLSDBと変更後のLSDB、もしくは、変更前の最短パスツリーと変更後の最短パスツリーを比較し、変更箇所をディスプレイ等に明示的に表示している。
しかし、上述した従来のネットワーク監視技術では、以下に示すような問題がある。
IPネットワークで障害が発生した場合、その障害を検知したルータは、自身のリンク状態を変更したLSAをIPネットワーク全体に広報する。このとき、一つの障害を複数のルータが検知すると、その障害を検知した全てのルータが、自身のリンク状態を変更したLSAをネットワーク全体に広報するが、検知時間のずれやLSAの伝播遅延により、ある一つの障害に関連する複数のLSAが、監視端末装置に数十秒の時間差をもって到着する場合がある。すると、各LSAに応じてLSDBや最短パスツリーの変更が複数回発生するが、その複数回の変更点を表示しても、ネットワーク運用管理者には、それらの変更点が、一つの障害によるものなのか、あるいは複数の障害によるものなのかが分からない。
However, the above-described conventional network monitoring technology has the following problems.
When a failure occurs in the IP network, the router that detects the failure advertises the LSA whose link state has been changed to the entire IP network. At this time, if multiple routers detect one failure, all the routers that detected the failure will publicize the LSA whose link status has been changed to the entire network, but due to the detection time lag and LSA propagation delay, A plurality of LSAs related to a single failure may arrive at the monitoring terminal device with a time difference of several tens of seconds. Then, depending on each LSA, the LSDB and the shortest path tree change occur multiple times. Even if the changes are displayed multiple times, the network operation administrator can see these changes due to a single failure. I don't know if this is due to multiple failures.
また、障害によりIPネットワークの分断が発生した場合には、監視端末装置から見て分断発生箇所よりも遠い所にあるルータからのLSAは、該監視端末装置には届かないため、受信したLSAに基づき、LSDBやパスツリーの変更点を検出しても、正確な障害状況を把握することができない。 In addition, when the IP network is divided due to a failure, the LSA from the router that is farther from the location where the division occurs when viewed from the monitoring terminal device does not reach the monitoring terminal device. On the basis of this, even if the LSDB or path tree change point is detected, the exact failure status cannot be grasped.
本発明は、このような事情を考慮してなされたもので、その目的は、経路制御状態の監視に係る精度向上を図ることのできるネットワーク監視装置およびネットワーク監視方法を提供することにある。 The present invention has been made in view of such circumstances, and an object of the present invention is to provide a network monitoring apparatus and a network monitoring method capable of improving accuracy related to monitoring of a path control state.
また、本発明の他の目的は、本発明のネットワーク監視装置をコンピュータを利用して実現するためのコンピュータプログラムを提供することにある。 Another object of the present invention is to provide a computer program for realizing the network monitoring apparatus of the present invention using a computer.
上記の課題を解決するために、本発明に係るネットワーク監視装置は、IPネットワークから経路制御プロトコルのリンク状態広告メッセージを収集するメッセージ収集手段と、該収集されたリンク状態広告メッセージの差分情報を管理するための状態値を有するリンク状態データベースを作成するデータベース管理手段と、前記リンク状態データベースを参照し、想定される障害に対応するリンク状態広告メッセージの到着パターンに基づいた判定基準を用いて障害判定を行う判定手段と、を備え、前記判定手段は、リンク状態広告メッセージの到着遅延を考慮した時間差をもった2段階の障害判定を行うことを特徴とする。 In order to solve the above problem, a network monitoring apparatus according to the present invention manages message collection means for collecting a link status advertisement message of a routing protocol from an IP network, and differential information of the collected link status advertisement message. A database management means for creating a link state database having a state value for performing failure determination using a criterion based on an arrival pattern of a link state advertisement message corresponding to an assumed failure with reference to the link state database And determining means for performing a two-stage failure determination with a time difference in consideration of the arrival delay of the link state advertisement message.
本発明に係るネットワーク監視装置においては、先の障害判定時に収集したリンク状態広告メッセージの到着パターンから、遅れて到着すると予想されるリンク状態広告メッセージを待ち受けリンク状態広告メッセージとして記録する待ち受けメッセージ記録手段を備え、前記判定手段は、前記記録された待ち受けリンク状態広告メッセージが受信された場合に、後の障害判定を行うことを特徴とする。 In the network monitoring apparatus according to the present invention, the standby message recording means for recording the link state advertisement message expected to arrive late from the arrival pattern of the link state advertisement message collected at the time of the previous failure determination as the standby link state advertisement message. The determination means performs a subsequent failure determination when the recorded standby link state advertisement message is received.
本発明に係るネットワーク監視装置においては、前記判定手段は、起こりうる障害の種別毎に、所定の判定順序に従って、障害判定を行うことを特徴とする。 The network monitoring apparatus according to the present invention is characterized in that the determination unit performs failure determination according to a predetermined determination order for each type of failure that may occur.
本発明に係るネットワーク監視装置においては、前記判定手段は、先に行った障害判定結果と後に行った障害判定結果とが異なる場合には、後に行った障害判定結果を採用することを特徴とする。 In the network monitoring apparatus according to the present invention, the determination unit adopts a failure determination result performed later when a failure determination result performed earlier and a failure determination result performed later are different. .
本発明に係るネットワーク監視装置においては、前記障害判定時に、ネットワークの分断が発生しているかを判定するネットワーク分断判定手段を備えたことを特徴とする。 The network monitoring device according to the present invention is characterized in that it includes a network partition determination unit that determines whether or not a network partition has occurred at the time of the failure determination.
本発明に係るネットワーク監視装置においては、障害発生により削除されたリンク情報が、再度、リンク状態広告メッセージにより受信された時に、障害が復旧したと判断する障害復旧判定手段を備えたことを特徴とする。 The network monitoring device according to the present invention is characterized by comprising failure recovery determination means for determining that the failure has been recovered when the link information deleted due to the occurrence of the failure is received again by the link status advertisement message. To do.
本発明に係るネットワーク監視方法は、IPネットワークから経路制御プロトコルのリンク状態広告メッセージを収集する過程と、該収集されたリンク状態広告メッセージの差分情報を管理するための状態値を有するリンク状態データベースを作成する過程と、前記リンク状態データベースを参照し、想定される障害に対応するリンク状態広告メッセージの到着パターンに基づいた判定基準を用いて障害判定を行う過程と、リンク状態広告メッセージの到着遅延を考慮した時間差をもって2段階で前記障害判定を行う過程とを含むことを特徴とする。 The network monitoring method according to the present invention includes a process of collecting a link status advertisement message of a routing protocol from an IP network, and a link state database having a state value for managing difference information of the collected link state advertisement message. A process of making a failure determination using a determination criterion based on an arrival pattern of a link state advertisement message corresponding to an assumed failure with reference to the link state database, and an arrival delay of the link state advertisement message And a step of performing the failure determination in two stages with a time difference taken into consideration.
本発明に係るコンピュータプログラムは、IPネットワークから経路制御プロトコルのリンク状態広告メッセージを収集する機能と、該収集されたリンク状態広告メッセージの差分情報を管理するための状態値を有するリンク状態データベースを作成する機能と、前記リンク状態データベースを参照し、想定される障害に対応するリンク状態広告メッセージの到着パターンに基づいた判定基準を用いて障害判定を行う機能と、リンク状態広告メッセージの到着遅延を考慮した時間差をもって2段階で前記障害判定を行う機能とをコンピュータに実現させることを特徴とする。
これにより、前述のネットワーク監視装置がコンピュータを利用して実現できるようになる。
The computer program according to the present invention creates a link state database having a function for collecting a link state advertisement message of a routing protocol from an IP network and a state value for managing difference information of the collected link state advertisement message. A function that performs a failure determination using a determination criterion based on an arrival pattern of a link state advertisement message corresponding to an assumed failure, and a delay of arrival of the link state advertisement message. The computer is realized with the function of performing the failure determination in two steps with the time difference.
As a result, the network monitoring apparatus described above can be realized using a computer.
本発明によれば、障害箇所やその状況を正確に特定することが容易になり、経路制御状態の監視に係る精度向上を図ることができる。また、障害判定と同時にネットワーク分断判定を行うことにより、障害発生状況とともにネットワーク分断状況を把握することができる。これにより、ネットワークの分断が発生した場合には、ネットワーク分断に起因した障害判定結果の誤り発生の可能性を知ることができ、ネットワーク運用管理者等は、ネットワーク分断の影響を考慮して障害判定結果を利用することで、効率的な障害対応を行うことが可能になる。 ADVANTAGE OF THE INVENTION According to this invention, it becomes easy to pinpoint a fault location and its condition easily, and it can aim at the precision improvement regarding monitoring of a path control state. Further, by performing the network division determination at the same time as the failure determination, it is possible to grasp the network division status together with the failure occurrence status. As a result, when network partitioning occurs, it is possible to know the possibility of an error in the failure determination result due to network partitioning, and network operation managers can determine the failure considering the effects of network partitioning. By using the result, it becomes possible to perform an efficient failure response.
以下、図面を参照し、本発明の一実施形態について説明する。
図1は、本発明の一実施形態に係る監視対象のネットワーク構成例を示した図である。図1に示されるネットワークはIPネットワークである。また、図1に示されるネットワークは、経路制御プロトコルとしてOSPFを利用している。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a diagram illustrating a network configuration example of a monitoring target according to an embodiment of the present invention. The network shown in FIG. 1 is an IP network. The network shown in FIG. 1 uses OSPF as a route control protocol.
図1において、ネットワークN0は、企業内LAN等のローカルエリアネットワーク(LAN)である。ネットワークN5は、ネットワークN0に属さない外部のネットワークであり、例えばインターネットである。外部ネットワークN5は、ルータR4を介してネットワークN0に接続している。 In FIG. 1, a network N0 is a local area network (LAN) such as a corporate LAN. The network N5 is an external network that does not belong to the network N0, for example, the Internet. The external network N5 is connected to the network N0 via the router R4.
ネットワークN0は、10台のルータR1〜10と、スタブネットワークN1,N3,N4と、トランジットネットワークN2とから構成される。ルータR1〜10はOSPFに従って経路制御動作を行う。ネットワークN0内は、3つのエリア0,1,2に分割されている。エリア0はバックボーンエリアである。
The network N0 includes ten routers R1 to R10, stub networks N1, N3, and N4, and a transit network N2. The routers R1 to R10 perform path control operations according to OSPF. The network N0 is divided into three
ルータR1〜R4はエリア0に属する。ルータR7,R8はエリア1に属する。ルータR9,R10はエリア2に属する。ルータR5はエリア0とエリア1の両方に属する。ルータR6はエリア0とエリア2の両方に属する。
Routers R1 to R4 belong to area 0. Routers R7 and R8 belong to
スタブネットワークN1はルータR3に接続されている。トランジットネットワークN2はルータR2,R4,R6に接続されている。外部ネットワークN5はルータR4に接続されている。ルータR4は、外部ネットワークN5の経路情報を受信し、ネットワークN0内に再配布するAS(Autonomous System)境界ルータである。 The stub network N1 is connected to the router R3. The transit network N2 is connected to routers R2, R4, and R6. The external network N5 is connected to the router R4. The router R4 is an AS (Autonomous System) border router that receives route information of the external network N5 and redistributes it within the network N0.
OSPFでは、経路情報メッセージの転送量を低減させるために、ネットワークが大規模な場合には、図1に示すように、ネットワークをバックボーンエリアを含む複数のエリアに分割する。あるエリアに属するルータから送信されたLSA(リンク状態広告メッセージ)は、同一エリアに属する全てのルータが受信可能である。従って、ルータは、自身が属するエリアのリンク状態については全て取得することができる。しかし、各エリアの境界に位置するエリア境界ルータ(図1中のルータR5,R6)は、エリア間では要約したLSAのみ送信するため、あるエリアに属するルータは、他のエリアのリンク状態を全て取得することはできない。図1では、例えばルータR5は、エリア0のリンク状態を要約したLSAをエリア1の各ルータR7,R8に送信し、エリア1の状態を要約したLSAをエリア0の各ルータR1〜R4に送信する。
In OSPF, in order to reduce the transfer amount of the route information message, when the network is large, the network is divided into a plurality of areas including a backbone area as shown in FIG. An LSA (link status advertisement message) transmitted from a router belonging to a certain area can be received by all routers belonging to the same area. Therefore, the router can acquire all the link states of the area to which the router belongs. However, since the area border routers (routers R5 and R6 in FIG. 1) located at the border of each area transmit only the summarized LSA between the areas, the routers belonging to one area have all the link states of other areas. It cannot be acquired. In FIG. 1, for example, router R5 sends an LSA summarizing the link status of area 0 to each router R7, R8 in
このため、ネットワーク全体のLSAを収集し全てのリンク状態を取得するためには、ネットワーク監視装置をエリア毎に設置する。図1では、エリア0において、ルータR2にネットワーク監視装置10を接続している。また、エリア1において、ルータR8にネットワーク監視装置10を接続している。また、エリア2において、ルータR10にネットワーク監視装置10を接続している。ネットワーク監視装置10は、OSPFに従って、接続するルータからLSAを収集する。そして、収集したLSAからLSDBを生成し、障害判定や障害復旧判定を行う。
For this reason, in order to collect LSA of the entire network and acquire all link states, a network monitoring device is installed for each area. In FIG. 1, in the area 0, the
図2は、本発明の一実施形態に係るネットワーク監視装置10の構成を示すブロック図である。図2において、ネットワーク監視装置10は、LSA収集部11とLSA管理部12とLSDB管理部13と障害・復旧判定部14と障害管理テーブル15と判定結果格納部16とネットワーク分断判定部17を有する。
FIG. 2 is a block diagram showing the configuration of the
LSA収集部11は、自ネットワーク監視装置10が接続するルータから送信されるLSAを受信する。LSA管理部12は、LSA収集部11で受信されたLSAを記録する。LSDB管理部13は、LSA管理部12で記録されているLSAから、LSDB(リンク状態データベース)を作成し保持する。
The
図3は、図2に示すLSDB管理部13で保持されるLSDBの構成例である。この図3の例は、図1に示すエリア0に配置されたネットワーク監視装置10のものである。図3に示すように、LSDBは、ルータやネットワークの接続関係をマトリックス形式で管理する。そして、二点間(図3中のfromからtoへ)に接続関係がある場合は、LSタイプ、リンクタイプ、リンクコスト、LS age及び状態値を含むデータ30を保持する。図3の例では、ルータR3とルータR5間に接続関係があり、そのデータ30が例示されている。データ30において、「状態値」は、「Del」、「Alive」、「NG」及び「NC」の4種類の値を有し、LSAの差分情報を管理するための情報である。。「Del」は接続関係の削除を表す。「Alive」は接続関係の復旧を表す。「NG」は後述する障害判定処理において既に参照済みの要素を表す。「NC」は変更なしを表す。
FIG. 3 is a configuration example of the LSDB held by the
障害・復旧判定部14は、「Refresh LSA」ではないLSAの受信があると、判定処理を行う。その判定処理としては、LSDB管理部13で保持するLSDBを参照して障害判定を行い、障害箇所を特定する。また、LSDB管理部13で保持するLSDBを参照して障害復旧判定を行い、障害復旧箇所を特定する。障害・復旧判定部14は、その判定結果を障害管理テーブル15に登録する。また、障害・復旧判定部14は、その判定結果を判定結果格納部16に出力する。
The failure /
ネットワーク分断判定部17は、LSDB管理部13で保持しているLSDBを参照して、ネットワークの分断が発生しているか否かを判定する。ネットワーク分断判定部17は、その判定結果を判定結果格納部15に出力する。
The network
障害管理テーブル15は、障害・復旧判定部14で特定された障害箇所および障害復旧箇所を記憶する。判定結果格納部15は、障害・復旧判定部14で特定された障害箇所および障害復旧箇所を記憶する。また、判定結果格納部15は、ネットワーク分断判定部17によるネットワーク分断に係る判定結果を記憶する。
The failure management table 15 stores the failure location and the failure recovery location identified by the failure /
次に、図2に示すネットワーク監視装置10の動作を説明する。
Next, the operation of the
まず、ネットワーク監視装置10は、OSPF機能を動作させることで、接続するルータと隣接関係を確立し、隣接関係を確立したルータからLSAを受信する。受信したLSAについてはLSA管理部12で保持する。LSA管理部12は、新たに受信したLSAを既に保持しているLSAと比較し、リンク状態の変更の有無を調べる。その結果、リンク状態の変更がある場合には、リンク状態の変更点を示す差分リンク情報を作成し、一定期間保持する。例えば、既に保持しているLSAでは存在していたリンクAが、新たに受信したLSAでは削除された場合には、「リンクA削除」を示す差分リンク情報を作成し、一定期間保持する。LSA管理部12は、保持中のLSAに関し、一定期間において同じLSA(Refresh LSA)が受信されなかった場合には、当該LSAを削除する。
First, the
図4は、本実施形態の障害判定に係る全体処理の手順を示すフローチャートである。図4を参照し、障害判定に係る動作を説明する。
ステップS1では、LSA管理部12は、LSA収集部11で受信されたLSAが「Refresh LSA」であるか否かを監視する。ステップS2では、LSA管理部12は、その監視の結果、「Refresh LSA」ではない、変更されたLSAが受信されたならば、タイマー(タイムアウト時間「X秒」)を起動する。タイムアウト時間「X秒」は、監視対象ネットワークの規模などによって決まる値であるが、通常は数秒程度に設定すればよい。
FIG. 4 is a flowchart showing a procedure of overall processing according to the failure determination of the present embodiment. With reference to FIG. 4, an operation related to the failure determination will be described.
In step S <b> 1, the
ステップS3では、LSA管理部12は、タイムアウト前(X秒以内)に、別の変更されたLSAが受信されるかを確認する。ステップS4では、LSA管理部12は、その確認の結果、別の変更されたLSAが受信されたならば、タイマーをリセットしてステップS3に戻り、再びX秒以内に別の変更されたLSAが受信される否かを監視する。一方、タイムアウトした場合には、ステップS5に進む。
In step S3, the
ステップS5では、つまり、X秒以内に変更されたLSAが受信されなかった場合は、LSDB管理部13は、LSDBを初期化し、LSA管理部12で保持されているLSAからLSDBを再生成する。ステップS6では、障害・復旧判定部14は、その再生成されたLSDBに基づいて障害判定処理を行う。
In step S5, that is, if the LSA changed within X seconds is not received, the
図5は、図4に示す障害判定処理(ステップS6)の手順を示すフローチャートである。障害判定処理(ステップS6)では、図5に示される手順で、障害の種類別に障害判定を行う。以下、各ステップにおける障害種別毎の判定基準について説明する。この障害判定基準は、LSAのパターンに基づいている。 FIG. 5 is a flowchart showing the procedure of the failure determination process (step S6) shown in FIG. In the failure determination process (step S6), failure determination is performed for each type of failure according to the procedure shown in FIG. Hereinafter, criteria for each failure type in each step will be described. This failure criterion is based on the LSA pattern.
ステップS21;自律ルータ障害では、障害となるルータが、障害前に自身が持つリンク情報を全て削除とするLSAを送信する。ネットワーク監視装置10では、そのLSAを受信した場合に、該当ルータで自律ルータ障害が発生したと判定する。自律ルータ障害の例としては、ルータの再起動などが考えられる。
Step S21: In the case of an autonomous router failure, the router that becomes the failure transmits an LSA that deletes all link information that the router has before the failure. When the
ステップS22;ルータ障害では、障害となるルータ自身は何もLSAを送信しないが、障害となるルータと接続していたルータが障害を検知して、障害ルータへの接続リンク情報を削除するLSAを送信する。ネットワーク監視装置10では、全ての接続ルータから、障害ルータへの接続リンク情報が削除されたLSAを受信した場合に、そのルータでルータ障害が発生したと判定する。ルータ障害の例としては、ルータの不意の電源断などが考えられる。
Step S22: In the case of a router failure, the faulty router itself does not send any LSA, but the router connected to the faulty router detects the fault and deletes the link link information to the faulty router. Send. When the
ステップS23;トランジットネットワーク障害では、そのトランジットネットワークの代表ルータが、障害ネットワークを削除するLSAを送信する。また、障害となるトランジットネットワークに接続していたルータが、障害ネットワークへの接続リンク情報を削除するLSAを送信する。ネットワーク監視装置10では、そのLSAを受信した場合に、トランジットネットワーク障害が発生したと判定する。トランジットネットワーク障害の例として、ネットワークのレイヤ2スイッチ障害などが考えられる。
Step S23: In the transit network failure, the representative router of the transit network transmits an LSA for deleting the failed network. In addition, the router connected to the faulty transit network transmits an LSA for deleting connection link information to the faulty network. When the
ステップS24;PtoPリンク(ルータ間リンク)障害では、障害となるリンクの両端に接続したルータが、そのリンク情報を削除するLSAを送信する。ネットワーク監視装置10では、どちらか一方のLSAを受信した場合に、PtoPリンク障害が発生したと判定する。
Step S24: In a PtoP link (inter-router link) failure, the router connected to both ends of the failed link transmits an LSA for deleting the link information. The
ステップS25;トランジットネットワークリンク障害は、ルータがトランジットネットワークに接続するリンクの障害である。そのルータがトランジットネットワークの代表ルータである場合は、トランジットネットワークへの接続リンク情報を削除するLSAを送信するとともに、そのトランジットネットワークを削除するLSAを送信する。ネットワーク監視装置10では、それらのLSAを受信した場合に、トランジットネットワークリンク障害が発生したと判定する。一方、ルータがトランジットネットワークの代表ルータでない場合は、そのルータはトランジットネットワークへの接続リンク情報を削除するLSAを送信し、代表ルータは、そのルータがトランジットネットワークから削除されたLSAを送信する。ネットワーク監視装置10では、それらのLSAを受信した場合に、トランジットネットワークリンク障害が発生したと判定する。
Step S25: The transit network link failure is a failure of the link connecting the router to the transit network. When the router is a representative router of the transit network, an LSA that deletes connection link information to the transit network is transmitted, and an LSA that deletes the transit network is transmitted. The
ステップS26;スタブネットワーク障害は、ルータにおけるスタブネットワークへの接続リンクの障害であり、ルータはスタブネットワークへの接続リンク情報を削除するLSAを送信する。ネットワーク監視装置10では、そのLSAを受信した場合に、スタブネットワーク障害が発生したと判定する。
Step S26: The stub network failure is a failure of the connection link to the stub network in the router, and the router transmits an LSA for deleting the connection link information to the stub network. When the
ステップS27;エリア外ネットワーク障害は、エリア境界ルータが検知する障害であり、エリア境界ルータがエリア外のあるネットワークを削除するLSAを送信する。ネットワーク監視装置10では、そのLSAを受信した場合に、エリア外ネットワーク障害が発生したと判定する。
Step S27: The out-of-area network failure is a failure detected by the area border router, and the area border router transmits an LSA for deleting a network outside the area. When the
ステップS28;外部ネットワーク障害は、AS境界ルータが検知する障害であり、AS境界ルータが外部のあるネットワークを削除するLSAを送信する。ネットワーク監視装置10では、そのLSAを受信した場合に、外部ネットワーク障害が発生したと判定する。
Step S28: The external network failure is a failure detected by the AS boundary router, and the AS boundary router transmits an LSA for deleting a certain external network. When the
説明を図4に戻す。ステップS6の障害判定処理では、それまで(ステップS1〜S3)で収集された「変更されたLSA」を調査し、その収集されたLSAからどの種類の障害に相当するかを判定し、障害判定結果を障害管理テーブル15に記録するとともに、判定結果格納部16にログとして記録する。
Returning to FIG. In the failure determination process in step S6, the “changed LSA” collected so far (steps S1 to S3) is investigated, and the type of failure corresponding to the collected LSA is determined to determine the failure. The result is recorded in the failure management table 15 and recorded as a log in the determination
ここで、ある障害に関連して送信される全てのLSAが、ネットワーク監視装置10にほぼ同時に到着するとは限らない。各LSAは、それぞれ別の複数のルータを中継してネットワーク監視装置10に到着するが、例えば途中に負荷の高いルータが存在してそのルータでの中継処理が遅れた場合、ある障害に関連するLSAがネットワーク監視装置10にはある時間差をもって到着すると考えられる。また障害の検知が遅れたルータが存在する場合は、そのルータは他のルータより遅れてLSAを送信するため、この場合も、ある障害に関連するLSAが、ネットワーク監視装置10にはある時間差をもって到着すると考えられる。そこで、ステップS7では、障害・復旧判定部14は、障害判定時に、ネットワーク監視装置10で収集したLSAの到着パターンから、遅れて到着すると予想されるLSAを待ち受けLSAとして判定し、その待ち受けLSAを障害管理テーブル15に記録する。なお、待ち受けLSAが存在しないと判断した場合は、図4の処理を終了する。
Here, all the LSAs transmitted in relation to a certain failure do not always arrive at the
ステップS8では、つまり、待ち受けLSAが存在する場合、LSA管理部12は、さらにY秒間、変更されたLSAを収集する。LSDB管理部13は、この収集結果をLSDBに反映させてLSDBを更新する。ステップS9では、そのY秒間で待ち受けLSAを受信したか判定する。その判定の結果、待ち受けLSAを受信した場合はステップS10に進み、待ち受けLSAを受信しなかった場合は図4の処理を終了する。
In step S8, that is, when there is a standby LSA, the
ステップS10では、再度、ステップS6と同様の障害判定処理を行う(障害後判定)。ステップS10において、遅れて到着した待ち受けLSAを含めて障害判定を行った結果、先(ステップS6)と異なる判定結果が出た場合は、先の障害を解除するログを判定結果格納部16に記録するとともに、後判定での障害判定結果を判定結果格納部16にログとして記録する。待ち受けLSAの待ち時間「Y秒」は、障害検知の遅れ時間やLSAの伝播遅延、処理遅延を考慮して設定する必要があるが、通常は数十秒程度に設定すればよい。
In step S10, the same failure determination process as in step S6 is performed again (determination after failure). In step S10, if a failure determination is made including the standby LSA that arrived late, and a determination result different from the previous (step S6) is obtained, a log for canceling the previous failure is recorded in the determination
ここで、具体例を挙げて、本実施形態に係る障害判定処理を説明する。 Here, the failure determination processing according to the present embodiment will be described with a specific example.
[具体例1;自律ルータ障害発生]
図6に示されるネットワークにおいて、ルータ間は全てPtoPリンクで接続している。また、ネットワーク監視装置10はルータR5に接続されている。この図6のネットワークにおいて、ルータR2で自律ルータ障害が発生したとする。
[Specific example 1: Autonomous router failure]
In the network shown in FIG. 6, the routers are all connected by PtoP links. The
まず、ルータR2は自律ルータ障害が発生したため、自身が持つ全てのリンク情報を削除するLSAを送信する。またそれに付随して、ルータR2と接続していたルータR1,R3,R5は、ルータR2との接続が切れることを検知し、ルータR2へのリンク情報を削除するLSAを送信する。なお、ここでは障害に関連するLSAが全てほぼ同時にネットワーク監視装置10で収集された場合を考える。
First, since an autonomous router failure has occurred, the router R2 transmits an LSA that deletes all link information that the router R2 has. Along with this, the routers R1, R3, and R5 connected to the router R2 detect that the connection with the router R2 is disconnected, and transmit an LSA for deleting link information to the router R2. Here, a case is considered where all the LSAs related to the failure are collected by the
その結果、ネットワーク監視装置10のLSDBには、R2(from)からR1、R3、R5(to)へのリンク状態が削除(Del)されたことと、R1、R3、R5(from)からR2(to)へのリンク状態が削除(Del)されたことが登録される。これにより、ネットワーク監視装置10のLSDBは、図7に示される障害判定前のLSDBとなる。なお、図7には、LSDB中の「状態値」の情報のみが示されている。
As a result, the link status from R2 (from) to R1, R3, R5 (to) has been deleted (Del) in the LSDB of the
次いで、障害判定処理では、まず自律ルータ障害が発生しているかをLSDBを参照して調査する(図5、ステップS21)。ここでは、図7に示されるようにR2からのリンク状態が全て「Del」となっているため、R2で自律ルータ障害が発生したと判定する。次いで、そのR2に関するリンク状態で「Del」となっているものを「NG」に書き換える。「NG」は障害判定処理において既に参照済みの要素を表す。これにより、ネットワーク監視装置10のLSDBは、図8に示される障害判定後のLSDBとなる。なお、図8には、LSDB中の「状態値」の情報のみが示されている。
Next, in the failure determination process, first, whether an autonomous router failure has occurred is investigated with reference to the LSDB (FIG. 5, step S21). Here, as shown in FIG. 7, since the link states from R2 are all “Del”, it is determined that an autonomous router failure has occurred in R2. Next, the link state related to R2 that is “Del” is rewritten to “NG”. “NG” represents an element already referenced in the failure determination process. Thereby, the LSDB of the
次いで、他の障害が発生しているかを調査する。ここでLSDBに「Del」が残っていれば他の障害が発生していると考えるが、図8のLSDBの例では「Del」は残っておらず、かつ待ち受けLSAもないので、障害判定処理を終了する。 Next, it is investigated whether another failure has occurred. Here, if “Del” remains in the LSDB, it is considered that another failure has occurred. However, in the example of the LSDB in FIG. 8, “Del” does not remain and there is no standby LSA. Exit.
[具体例2;ルータ障害およびPtoPリンク障害の同時発生]
図9に示されるネットワークにおいて、ルータ間は全てPtoPリンクで接続している。また、ネットワーク監視装置10はルータR6に接続されている。この図9のネットワークにおいて、ルータR2でルータ障害が発生し、かつ、ルータR3とルータR4間のリンクでPtoPリンク障害が発生したとする。
[Specific example 2: Simultaneous occurrence of router failure and PtoP link failure]
In the network shown in FIG. 9, the routers are all connected by PtoP links. The
まず、ネットワーク監視装置10はLSAを収集し、その結果、ネットワーク監視装置10のLSDBは、図10に示される障害判定前のLSDBとなる。なお、図10には、LSDB中の「状態値」の情報のみが示されている。図10において、R2はLSAを送信しないため、R2からのリンク状態は「NC」で変更されていない。「NC」は変更なしを表す。
First, the
また、R2に接続していたルータは、R2への接続が切れたことを検知した後、R2へのリンク情報を削除するLSAを送信する。しかしながら、この時点ではR3とR6からのLSAはネットワーク監視装置10に到着しているが、R1からのLSAはまだ到着していないとする。このため、図10では、R3、R6(from)からR2(to)へのリンク状態が削除(Del)されたことが登録されているが、R1(from)からR2(to)へのリンク状態は「NC」で変更されていない。
Also, after detecting that the connection to R2 has been lost, the router connected to R2 transmits an LSA that deletes link information to R2. However, at this time, the LSAs from R3 and R6 have arrived at the
また、R3からはR4へのリンク情報を削除するLSAがネットワーク監視装置10に到着し、R4からはR3へのリンク情報を削除するLSAがネットワーク監視装置10に到着している。これにより、図10では、R3(from)からR4(to)へのリンク状態が削除(Del)されたことと、R4(from)からR3(to)へのリンク状態が削除(Del)されたことが登録される。
In addition, an LSA that deletes link information to R4 from R3 arrives at the
次いで、障害判定処理では、LSDBを参照して、図5に示される順番で、障害発生を調査する。まず自律ルータ障害が発生しているかを調査する(図5、ステップS21)。ここでは、あるルータからのリンク状態が全て「Del」となっているルータはないので、自律ルータ障害は発生していないと判定する。 Next, in the failure determination process, the occurrence of the failure is investigated in the order shown in FIG. 5 with reference to the LSDB. First, it is investigated whether an autonomous router failure has occurred (FIG. 5, step S21). Here, since there is no router in which all link states from a certain router are “Del”, it is determined that no autonomous router failure has occurred.
次いで、ルータ障害が発生しているかを調査する(図5、ステップS22)。LSDBの各行を参照し、もしリンク状態が全て「Del」であるルータがあれば、そのルータでルータ障害が発生していると判定する。しかしながら、図10のLSDBでは、そのようなルータはないので、この時点ではルータ障害は発生していないと判定する。 Next, it is investigated whether a router failure has occurred (FIG. 5, step S22). Referring to each row of the LSDB, if there is a router whose link state is all “Del”, it is determined that a router failure has occurred in that router. However, since there is no such router in the LSDB of FIG. 10, it is determined that no router failure has occurred at this point.
次いで、図9のネットワークにはトランジットネットワークは存在しないので、PtoPリンク障害が発生しているかを調査する(図5、ステップS24)。まず、R3からR4へのリンク状態とR4からR3へのリンク状態が「Del」となっているので、R3とR4の間のPtoPリンク障害が発生したと判定し、それらリンク状態を「NG」に書き換える。次に、R3からR2へのリンク状態と、R6からR2へのリンク状態が「Del」となっているので、R3とR2の間のPtoPリンク障害と、R6とR2の間のPtoPリンク障害が発生したと判定し、それらリンク状態を「NG」に書き換える。 Next, since there is no transit network in the network of FIG. 9, it is investigated whether a PtoP link failure has occurred (FIG. 5, step S24). First, since the link status from R3 to R4 and the link status from R4 to R3 are "Del", it is determined that a PtoP link failure between R3 and R4 has occurred, and the link status is set to "NG" Rewrite to Next, since the link status from R3 to R2 and the link status from R6 to R2 are “Del”, there is a PtoP link failure between R3 and R2 and a PtoP link failure between R6 and R2. It is determined that it has occurred, and the link state is rewritten to “NG”.
ここでLSAの到着遅れを考慮すると、R2からのLSAが遅れている場合と、R2に障害が発生しており、R2に接続したR1からのLSAが遅れている場合とがLSA遅れの可能性として考えられる。そこで、ここでは待ち受けLSAとして、(1)R2からR1へのリンク状態削除のLSA、(2)R2からR3へのリンク状態削除のLSA、(3)R2からR6へのリンク状態削除のLSA、(4)R1からR2へのリンク状態削除のLSA、の4つを障害管理テーブル15に登録する。 Considering the LSA arrival delay here, there is a possibility of LSA delay when LSA from R2 is delayed and when R2 is faulty and LSA from R1 connected to R2 is delayed. Is considered. Therefore, here, as standby LSA, (1) LSA for deleting link state from R2 to R1, (2) LSA for deleting link state from R2 to R3, (3) LSA for deleting link state from R2 to R6, (4) The four LSAs for deleting the link state from R1 to R2 are registered in the failure management table 15.
ここまでの先の障害判定処理の結果、ネットワーク監視装置10のLSDBは、図11に示される障害判定後のLSDBとなる。なお、図11には、LSDB中の「状態値」の情報のみが示されている。図11に示されるように、LSDBには「Del」は残っていないので、一旦、障害判定処理を終了するが、待ち受けLSAが存在するので、再び変更されたLSAを収集する(図4、ステップS8)。ここでR1からR2へのリンク状態削除のLSAが、遅れてネットワーク監視装置10に到着したとする。このLSAは待ち受けLSAであるので、障害後判定処理を実施する(図4、ステップS10)。このときのLSDBは図12の状態になっており、R1(from)からR2(to)へのリンク状態が削除(Del)されたことが登録されている。
As a result of the previous failure determination process, the LSDB of the
次いで、障害後判定処理では、ルータ障害が発生しているかを調査する。LSDBの各行を参照すると、R2へのリンク状態が全て「Del」か「NG」となっており、R2へのリンク状態が全て削除されたと考えられる。このことからR2でルータ障害が発生したと判定する。ここで先に判定したR3とR2の間のPtoPリンク障害と、R6とR2の間のPtoPリンク障害は、R2のルータ障害によるものと判断して問題ないと考えられる。このことから、先の判定結果である二つのPtoPリンク障害を一つのルータ障害へと判定結果を変更する。そして、R1からR2へのリンク状態を「NG」に書き換える。これにより、ネットワーク監視装置10のLSDBは、図13に示される障害後判定後のLSDBとなる。
Next, in the post-failure determination process, it is investigated whether a router failure has occurred. Referring to each row of LSDB, all link states to R2 are “Del” or “NG”, and it is considered that all link states to R2 have been deleted. From this, it is determined that a router failure has occurred in R2. Here, it is considered that the PtoP link failure between R3 and R2 and the PtoP link failure between R6 and R2 determined earlier are determined to be due to the router failure of R2, and there is no problem. Therefore, the determination result is changed from the two PtoP link failures, which are the previous determination results, to one router failure. Then, the link state from R1 to R2 is rewritten to “NG”. As a result, the LSDB of the
ここまでの障害後判定処理結果から、R3とR2の間のPtoPリンク障害およびR6とR2の間のPtoPリンク障害を解除するログと、R2でルータ障害が発生したというログとを、判定結果格納部16に記録する。
Based on the results of the post-failure judgment processing so far, the judgment results are stored as a log that clears the PtoP link fault between R3 and R2 and the PtoP link fault between R6 and R2, and a log that a router fault has occurred in R2.
以上が障害判定に係る動作の説明である。
なお、障害・復旧判定部14が行う復旧判定処理では、障害発生により削除されたリンク情報が、再度、LSAによりリンク情報として送信され、そのLSAをネットワーク監視装置10で受信した時に、障害が復旧したと判断する。
The above is the description of the operation related to the failure determination.
In the recovery determination process performed by the failure /
次に、図14を参照して、ネットワーク分断判定部17によるネットワーク分断判定に係る動作を説明する。図14は、本実施形態に係るネットワーク分断判定処理の手順を示すフローチャートである。
ネットワーク分断判定部17は、障害判定時に、LSDBを参照して、ネットワークの分断が発生しているか否かを判断する。LSDBを参照すれば、エリア内の任意のルータから、同じエリア内の他の全てのルータまでの経路が存在するか否かを確認することができる。
Next, with reference to FIG. 14, the operation | movement which concerns on the network parting determination by the network
The network
図14において、ステップS41では、障害判定処理が行われたかを監視し、障害判定処理が行われた場合にステップS42に進む。ステップS42では、LSDBを参照して、自ネットワーク監視装置10が接続しているルータを起点としたときの、エリア内の全てのルータを接続するパスツリーを算出する。ステップS43では、その算出したパスツリーに、エリア内の全てのルータが含まれるか否かを判定する。
In FIG. 14, in step S41, it is monitored whether the failure determination process has been performed. If the failure determination process has been performed, the process proceeds to step S42. In step S42, with reference to the LSDB, a path tree connecting all the routers in the area when the router to which the own
その判定の結果、エリア内の全てのルータが含まれる場合はステップS44に進み、ネットワークの分断は発生していないと判定する。一方、エリア内の全てのルータが含まれていない場合はステップS45に進む。 As a result of the determination, if all the routers in the area are included, the process proceeds to step S44, and it is determined that the network is not divided. On the other hand, if all the routers in the area are not included, the process proceeds to step S45.
ステップS45では、ネットワークの分断が発生していると判定し、ステップS46で、障害判定結果とあわせて判定結果格納部16に記録する。
In step S45, it is determined that the network has been divided, and in step S46, it is recorded in the determination
上述した実施形態によれば、想定される障害に対応するLSAの到着パターンに基づいた判定基準を用いて障害判定を行う。さらに、LSAの到着遅延を考慮した時間差をもった2段階の障害判定を行う。これにより、障害箇所やその状況を正確に特定することが容易になり、経路制御状態の監視に係る精度向上を図ることができる。この結果、障害箇所や原因を特定するために要する時間を短縮することができ、ネットワーク運用管理者等は効率的に障害対応を行うことが可能になる。 According to the above-described embodiment, the failure determination is performed using the determination criterion based on the LSA arrival pattern corresponding to the assumed failure. Further, a two-stage failure determination with a time difference taking into account the LSA arrival delay is performed. As a result, it becomes easy to accurately identify the location of failure and its situation, and the accuracy of monitoring the path control state can be improved. As a result, it is possible to reduce the time required to identify the location and cause of the failure, and the network operation manager or the like can efficiently handle the failure.
また、障害判定と同時にネットワーク分断判定を行うことにより、障害発生状況とともにネットワーク分断状況を把握することができる。これにより、ネットワークの分断が発生した場合には、ネットワーク分断に起因した障害判定結果の誤り発生の可能性を知ることができる。この結果、ネットワーク運用管理者等は、ネットワーク分断の影響を考慮して障害判定結果を利用することで、効率的な障害対応を行うことができ、障害対応時間の短縮を図ることが可能になる。 Further, by performing the network division determination at the same time as the failure determination, it is possible to grasp the network division status together with the failure occurrence status. Thereby, when the network is divided, it is possible to know the possibility of an error in the failure determination result due to the network division. As a result, network operation managers can use the failure determination result in consideration of the effects of network partitioning, so that the failure can be efficiently dealt with and the failure handling time can be shortened. .
なお、本実施形態に係るネットワーク監視装置10は、専用のハードウェアにより実現されるものであってもよく、あるいはパーソナルコンピュータ等のコンピュータシステムにより構成され、図2に示されるネットワーク監視装置10の各機能を実現するためのプログラムを実行することによりその機能を実現させるものであってもよい。
Note that the
また、図4、図5、図14に示す各ステップを実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、ネットワーク監視処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
Also, a program for realizing each step shown in FIGS. 4, 5, and 14 is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system and executed. Thus, network monitoring processing may be performed. Here, the “computer system” may include an OS and hardware such as peripheral devices.
The “computer-readable recording medium” means a flexible disk, a magneto-optical disk, a ROM, a writable nonvolatile memory such as a flash memory, a portable medium such as a CD-ROM, a hard disk built in a computer system, etc. This is a storage device.
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
Further, the “computer-readable recording medium” means a volatile memory (for example, DRAM (Dynamic DRAM) in a computer system that becomes a server or a client when a program is transmitted through a network such as the Internet or a communication line such as a telephone line. Random Access Memory)), etc., which hold programs for a certain period of time.
The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line.
The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.
以上、本発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
例えば、上述の実施形態では、ネットワーク監視装置10を単独の装置として構成したが、ネットワーク監視装置10とルータとを一つの装置に統合してもよい。例えば、パーソナルコンピュータにネットワーク監視装置10の機能とルータの機能とを実装するようにしてもよい。
The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes design changes and the like within a scope not departing from the gist of the present invention.
For example, in the above-described embodiment, the
10…ネットワーク監視装置、11…LSA収集部、12…LSA管理部、13…LSDB管理部、14…障害・復旧判定部、15…障害管理テーブル、16…判定結果格納部、17…ネットワーク分断判定部
DESCRIPTION OF
Claims (8)
該収集されたリンク状態広告メッセージの差分情報を管理するための状態値を有するリンク状態データベースを作成するデータベース管理手段と、
前記リンク状態データベースを参照し、想定される障害に対応するリンク状態広告メッセージの到着パターンに基づいた判定基準を用いて障害判定を行う判定手段と、を備え、
前記判定手段は、リンク状態広告メッセージの到着遅延を考慮した時間差をもった2段階の障害判定を行う、
ことを特徴とするネットワーク監視装置。 A message collection means for collecting a routing protocol link status advertisement message from the IP network;
Database management means for creating a link state database having state values for managing the difference information of the collected link state advertisement messages;
A determination unit that refers to the link state database and performs a failure determination using a determination criterion based on an arrival pattern of a link state advertisement message corresponding to an assumed failure; and
The determination means performs a two-stage failure determination with a time difference considering the arrival delay of the link state advertisement message.
A network monitoring device.
前記判定手段は、前記記録された待ち受けリンク状態広告メッセージが受信された場合に、後の障害判定を行う、
ことを特徴とする請求項1に記載のネットワーク監視装置。 A standby message recording means for recording a link status advertisement message that is expected to arrive late from the arrival pattern of the link status advertisement message collected at the time of the previous failure determination, as a standby link status advertisement message,
The determination means performs a later failure determination when the recorded standby link state advertisement message is received.
The network monitoring apparatus according to claim 1.
該収集されたリンク状態広告メッセージの差分情報を管理するための状態値を有するリンク状態データベースを作成する過程と、
前記リンク状態データベースを参照し、想定される障害に対応するリンク状態広告メッセージの到着パターンに基づいた判定基準を用いて障害判定を行う過程と、
リンク状態広告メッセージの到着遅延を考慮した時間差をもって2段階で前記障害判定を行う過程と、
を含むことを特徴とするネットワーク監視方法。 Collecting routing protocol link status advertisement messages from the IP network;
Creating a link state database having state values for managing the difference information of the collected link state advertisement messages;
Referring to the link state database and performing a failure determination using a determination criterion based on an arrival pattern of a link state advertisement message corresponding to an assumed failure;
A process of performing the failure determination in two steps with a time difference considering the arrival delay of the link state advertisement message;
A network monitoring method comprising:
該収集されたリンク状態広告メッセージの差分情報を管理するための状態値を有するリンク状態データベースを作成する機能と、
前記リンク状態データベースを参照し、想定される障害に対応するリンク状態広告メッセージの到着パターンに基づいた判定基準を用いて障害判定を行う機能と、
リンク状態広告メッセージの到着遅延を考慮した時間差をもって2段階で前記障害判定を行う機能と、
をコンピュータに実現させることを特徴とするコンピュータプログラム。
The ability to collect routing protocol link status advertisement messages from the IP network;
A function of creating a link state database having a state value for managing difference information of the collected link state advertisement message;
A function of referring to the link state database and performing a failure determination using a determination criterion based on an arrival pattern of a link state advertisement message corresponding to an assumed failure;
A function of performing the failure determination in two stages with a time difference considering the arrival delay of the link state advertisement message;
A computer program for causing a computer to realize the above.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006238203A JP4620019B2 (en) | 2006-09-01 | 2006-09-01 | Network monitoring apparatus, network monitoring method, and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006238203A JP4620019B2 (en) | 2006-09-01 | 2006-09-01 | Network monitoring apparatus, network monitoring method, and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008061139A true JP2008061139A (en) | 2008-03-13 |
JP4620019B2 JP4620019B2 (en) | 2011-01-26 |
Family
ID=39243344
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006238203A Expired - Fee Related JP4620019B2 (en) | 2006-09-01 | 2006-09-01 | Network monitoring apparatus, network monitoring method, and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4620019B2 (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010239299A (en) * | 2009-03-30 | 2010-10-21 | Kddi R & D Laboratories Inc | Network management system and management method |
JP2011130201A (en) * | 2009-12-17 | 2011-06-30 | Fujitsu Ltd | Monitoring program, monitoring apparatus, and monitoring method |
US8483054B2 (en) | 2010-03-29 | 2013-07-09 | Fujitsu Limited | Communication path estimation method, non-transitory computer-readable recording medium, and monitoring apparatus |
WO2015136812A1 (en) * | 2014-03-12 | 2015-09-17 | 株式会社日立製作所 | Middle server, network system, and method for narrowing down location and cause of deterioration in communication quality therein |
JP2016225909A (en) * | 2015-06-02 | 2016-12-28 | ソフトバンク株式会社 | Determination device and program |
US9691081B2 (en) | 2011-09-23 | 2017-06-27 | International Business Machines Corporation | Error-specific advertisement display in electronic device |
KR20220009818A (en) * | 2020-07-16 | 2022-01-25 | 주식회사 케이티 | System and method for monitoring netwrok |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005333383A (en) * | 2004-05-19 | 2005-12-02 | Kddi Corp | Trouble relief processing method and program |
WO2006025296A1 (en) * | 2004-08-31 | 2006-03-09 | Nec Corporation | Failure recovery method, network device, and program |
-
2006
- 2006-09-01 JP JP2006238203A patent/JP4620019B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005333383A (en) * | 2004-05-19 | 2005-12-02 | Kddi Corp | Trouble relief processing method and program |
WO2006025296A1 (en) * | 2004-08-31 | 2006-03-09 | Nec Corporation | Failure recovery method, network device, and program |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010239299A (en) * | 2009-03-30 | 2010-10-21 | Kddi R & D Laboratories Inc | Network management system and management method |
JP2011130201A (en) * | 2009-12-17 | 2011-06-30 | Fujitsu Ltd | Monitoring program, monitoring apparatus, and monitoring method |
US8483054B2 (en) | 2010-03-29 | 2013-07-09 | Fujitsu Limited | Communication path estimation method, non-transitory computer-readable recording medium, and monitoring apparatus |
US9691081B2 (en) | 2011-09-23 | 2017-06-27 | International Business Machines Corporation | Error-specific advertisement display in electronic device |
US9910725B2 (en) | 2011-09-23 | 2018-03-06 | International Business Machines Corporation | Error-specific advertisement display in electronic device |
WO2015136812A1 (en) * | 2014-03-12 | 2015-09-17 | 株式会社日立製作所 | Middle server, network system, and method for narrowing down location and cause of deterioration in communication quality therein |
JP2016225909A (en) * | 2015-06-02 | 2016-12-28 | ソフトバンク株式会社 | Determination device and program |
KR20220009818A (en) * | 2020-07-16 | 2022-01-25 | 주식회사 케이티 | System and method for monitoring netwrok |
KR102509057B1 (en) * | 2020-07-16 | 2023-03-10 | 주식회사 케이티 | System and method for monitoring netwrok |
Also Published As
Publication number | Publication date |
---|---|
JP4620019B2 (en) | 2011-01-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4620019B2 (en) | Network monitoring apparatus, network monitoring method, and computer program | |
JP5095823B2 (en) | Transport control server, network system, and transport control method | |
CN102598599B (en) | RSVP-TE graceful restart under fast re-route conditions | |
US8009556B2 (en) | System and method for providing redundant routing capabilities for a network node | |
US7961601B2 (en) | Lesser disruptive open shortest path first handling of bidirectional forwarding detection state changes | |
EP2119114B1 (en) | Analyzing virtual private network failures | |
US20070177523A1 (en) | System and method for network monitoring | |
CN101984600B (en) | Graceful restart method, equipment and system of routing protocol | |
CN104012051A (en) | An ip fast reroute scheme offering full protection | |
CN108768796B (en) | Link fault detection method and device | |
JP6792701B2 (en) | Primary backup pseudo line PW switching | |
CA2572980A1 (en) | Dynamic forwarding adjacency | |
CN110891018B (en) | Network traffic recovery method and device, SDN controller and storage medium | |
JP6508051B2 (en) | Communication control apparatus, communication control system, communication control method and communication control program | |
CN106789638A (en) | A kind of method and the network equipment for processing route | |
CN108924044A (en) | Link maintains method, PE equipment and readable storage medium storing program for executing | |
CN103200100A (en) | Method and device for packet transmitting | |
CN101860477A (en) | Method and device for processing exception in elegant restart | |
JP4686490B2 (en) | Path switching method, path switching system, and branch node | |
WO2017036165A1 (en) | Link fault detection method and apparatus | |
US7869350B1 (en) | Method and apparatus for determining a data communication network repair strategy | |
JP5035219B2 (en) | Communication path detection method, communication path detection program, and communication path detection apparatus | |
JP2017011480A (en) | Device, system and method for route control | |
CN102055662A (en) | Method and device for determining preset routing | |
JP5726062B2 (en) | Network relay device and route control method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20090122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100727 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100924 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100927 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101019 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101027 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131105 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4620019 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |