JP2014011727A - 経路制御プロトコルに基づいて障害ノード装置又は障害リンクをリアルタイムに検出する方法、ノード装置及びプログラム - Google Patents

経路制御プロトコルに基づいて障害ノード装置又は障害リンクをリアルタイムに検出する方法、ノード装置及びプログラム Download PDF

Info

Publication number
JP2014011727A
JP2014011727A JP2012148555A JP2012148555A JP2014011727A JP 2014011727 A JP2014011727 A JP 2014011727A JP 2012148555 A JP2012148555 A JP 2012148555A JP 2012148555 A JP2012148555 A JP 2012148555A JP 2014011727 A JP2014011727 A JP 2014011727A
Authority
JP
Japan
Prior art keywords
node device
link
update message
path
prefix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012148555A
Other languages
English (en)
Other versions
JP5829183B2 (ja
Inventor
Masafumi Watari
雅史 渡里
Tokuo Tachibana
篤男 立花
Shigehiro Ano
茂浩 阿野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2012148555A priority Critical patent/JP5829183B2/ja
Publication of JP2014011727A publication Critical patent/JP2014011727A/ja
Application granted granted Critical
Publication of JP5829183B2 publication Critical patent/JP5829183B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】BGPに基づくUPDATEメッセージを通常シーケンスで観測し、実際に発生した障害リンクをリアルタイムに特定することができる方法等を提供する。
【解決手段】観測ノード装置が、受信したUPDATEメッセージが経由したパスを記録し、プレフィックス数が零となった障害候補ノード装置又は障害候補リンクを検出する第1のステップと、障害候補リンクの上流側ノード装置と一致する障害候補ノード装置について、当該障害候補リンク以外の迂回リンクの有無を判定する第2のステップと、迂回リンクが有る場合、当該障害候補ノード装置が広報元となるプレフィックスのUPDATEメッセージが到達しているならば、障害候補リンクに障害が発生していると判定し、逆に、当該プレフィックスのUPDATEメッセージが到達していないならば、障害候補ノード装置に障害が発生していると判定する第3のステップとを有する。
【選択図】図2

Description

本発明は、経路制御プロトコルに基づいてネットワークの障害箇所をリアルタイムに検出する方法、ノード装置及びプログラムに関する。
インターネットでは、経路制御プロトコルを用いて、ノード装置(例えばルータ)がパケットを適切に中継転送する。代表的な経路制御プロトコルとして、インターネット上で組織ネットワーク間の経路情報を交換する「BGP(Border Gateway Protocol)」がある。ノード装置は、単体の装置であってもよいし、複数の装置によって構成されたシステムであってもよい。BGP対応のノード装置には、インターネットにおける唯一の「AS(Autonomous System)番号」(固有識別番号)が付与される。AS番号は、共通ポリシ及び同一管理運用下にあるノード装置の集合毎に付与される。AS番号は、原則として2バイト(現在は4バイト化)であって、IANA(Internet Assigned Numbers Authority)によって管理されている。
図1は、BGPにおけるネットワーク構成図である。
図1によれば、AS番号を有するノード装置1がネットワークを介して相互に接続されている。各ノード装置は、BGPに基づく送信元プレフィックス(送信元ネットワークアドレス)及びAS番号を含む経路更新メッセージ(UPDATE)を、定期的にブロードキャストで送信する。UPDATEメッセージには、以下のパラメータが含まれる。
(1)メッセージ種別
(2)プレフィックス
(3)AS_PATH属性
「メッセージ種別」は、経路更新メッセージのタイプ(通知Announce/削除Withdraw)を表す。
「プレフィックス」は、IPアドレス及びサブネットマスクの組(xxx.xxx.xxx.xxx/xx)であって、送信元ネットワークアドレス(送信元アドレスの範囲)を表す。
「AS_PATH属性」は、プレフィックスからの到達経路のパス(AS番号の列)を表す。
UPDATEメッセージを受信した各ノード装置は、そのUPDATEメッセージのパスに当該ノード装置のAS番号を含めて、そのUPDATEメッセージを中継転送する。
観測ノード装置は、各ノード装置から広報された経路更新メッセージを受信する。また、観測ノード装置は、RIB(Routing Information Base)と称されるパス(経路)テーブルを有する。ここで、「パス」とは、管理元ノード装置(送信元)と観測ノード装置との間の経路であって、中継ノード装置を介した接続を意味する。また、「リンク」とは、直接的に接続される隣接ノード装置間の接続を意味する。
パステーブルは、送信元ノード装置の「プレフィックス」と、そのプレフィックスに対応する「AS番号のパス」とを含む。パステーブルは、UPDATEメッセージを定期的に受信することによって更新される。
従来、このような経路制御プロトコルに基づくネットワークについて、障害リンクを検出するために、大量の経路更新メッセージをデータベースに収集した上で、観測時刻が近い経路更新メッセージをクラスタリング(例えばデンドログラム)する技術がある(例えば非特許文献1参照)。この技術によれば、障害発生前及び発生後の複数の経路更新メッセージについて、プレフィックス毎のASパスの変化状態から、障害箇所を推定することができる。
また、経路更新メッセージに含まれるプレフィックス毎のASパスから、各ノード装置間のリンクを抽出し、リンク毎に使用プレフィックス数を時系列に計算する技術もある(例えば非特許文献2又は3参照)。この技術によれば、リンク毎に、評価時間Tに受信したプレフィックスの数(UPDATEメッセージの数)を記録する。プレフィックス数が減少又は0になったリンクは、障害箇所として推定される。
尚、リンクの障害を検出する技術ではないが、所望のパスを導出することができる技術もある(例えば非特許文献4参照)。
更に、本願と同一の発明者によれば、観測ノード装置が、受信する経路更新メッセージを記録し、プレフィックス数の変動量から障害リンクを推定する技術も開示されている(例えば特許文献1、2及び非特許文献5参照)。これは、BGPの経路表とBGPのUPDATEメッセージを用いて、各AS間のリンクを使用するプレフィックス数を算出する。
この技術によれば、障害リンクを検出するためのアルゴリズムとして、監視対象リンクを使用するプレフィックス数が、閾値以下(例えば0)となった場合に、そのリンクを障害箇所候補として検出し、プレフィックス数が0となった時刻を障害検出時刻とする。具体的には、最適経路(正常状態パス)毎に検出されるリンク群を1つの集合とし、それら集合の候補を検出時刻の順にソートする。そして、最初の検出からd秒以内の候補群を同一のクラスタとして分割し、クラスタ毎に観測点に最も近いリンクを障害リンクとして推定する。
特開2011−166248号公報 特開2011−082943号公報
A FeldMann, O. Maennel, Z.Mao, A. Berger and B. Maggs,"Locating Internet routing instabililties," SIGCOMM 2004. M. Lad, R. Oliveira, D. Massey, L. Zhang, "Inferring the Originof Routing Changes using Link Weights," IEEE ICNP 2007. A. Campisano, L. Cittadini, G. Di Battista, T. Refice, C. Sasso,"Tracking back the root cause of a path change in interdomainrouting," IEEE Network Operations and Management Symposium, 2008. R. Oliveira, B. Zhang, D. Pei, L. Zhang, "Quantifying PathExploration in the Internet", IEEE/ACM Transaction on Networking, 2008. M. Watari, A. Tachibana, S. Ano, Inferring the Origin of RoutingChanges based on Preferred Path Changes, PAM 2011.
非特許文献1に記載された技術によれば、障害発生前及び発生後について、ネットワークの状態を表すテーブルを用いて障害箇所を推定している。しかしながら、実際のインターネットでは、秒毎に経路変動が発生しているため、障害前の状態を定義することが困難となる。また、この技術によれば、複雑なアルゴリズムを必要とするため、ネットワークの規模に応じて膨大な計算量を必要とし、リアルタイムに障害リンクを検出することはできない。更に、複数のリンクにほぼ同時に障害が発生した場合、クラスタリングによって特定の障害リンクを検出できないという問題もあり、短い時間帯毎に、クラスタリングを実行しなければならない。
また、非特許文献2及び3に記載された技術によれば、障害前の状態を定義することなく、定期的にプレフィックス数を確認することによって、障害箇所を推定する。経路更新メッセージを受信し、その経路更新メッセージのプレフィックスに対応するASパスから、そのリンク毎にプレフィックス数を増分する。プレフィックス数が0又は減分されたリンクについて、障害が発生したと判断することができる。
これら非特許文献1、2及び3に記載された技術によれば、実際の障害発生後から障害を検出するまで、経路更新メッセージの経路変動を検出するために一定時間を要する。一定時間とは、実際には、BGPネットワークにおける経路変動が収束する時間である。この時間は、インターネットを対象とした場合、2〜3分程度を要する。特に、経路変動の完全な収束を待って障害箇所を推定するために、リアルタイムに検出できない。また、障害推定の精度は、経路変動の収束のための待ち時間によって大きく異なる。
更に、特許文献1、2及び非特許文献1に記載された技術によれば、リンク単位でしか障害を検出することができない。そのために、ASレベル(ノード装置)で障害が発生した場合、当該ノード装置が接続する全てのリンクで障害が発生したと検出してしまう。ASレベルの障害とは、例えば1つのASが、複数のノード装置(BGPルータ)によって構成されたシステムである場合、それら複数のノード装置が全て同時にダウンすることを意味する。
そこで、本発明は、経路制御プロトコルに基づく経路更新メッセージを通常シーケンスで観測し、ノード装置間のリンクの障害か、又は、当該ノード装置自体の障害かを切り分けて検出することができる方法、ノード装置及びプログラムを提供することを目的とする。
本発明によれば、固有識別番号を有する複数のド装置が相互に接続され、経路制御プロトコルの経路更新メッセージを送受信するネットワークであり、
各ノード装置が、広報元としての1つ以上のプレフィックス及び固有識別番号を含む経路更新メッセージを定期的にブロードキャストで送信し、
各ノード装置が、受信した経路更新メッセージに含まれる、中継ノード装置の固有識別番号の連続からなるパスに、更に当該ノード装置の固有識別番号を含めて、当該経路更新メッセージを中継転送し、
観測ノード装置が、ノード装置間のリンクの障害か、又は、当該ノード装置自体の障害かを切り分けて検出する障害検出方法において、
観測ノード装置が、
受信した経路更新メッセージが経由したパスを記録し、ノード装置毎のプレフィックス数が零となった障害候補ノード装置と、リンク毎のプレフィックス数が零となった障害候補リンクとを検出する第1のステップと、
障害候補リンクの上流側ノード装置と一致する障害候補ノード装置について、当該障害候補リンク以外の迂回リンクの有無を判定する第2のステップと、
迂回リンクが有る場合、当該障害候補ノード装置が広報元となるプレフィックスの経路更新メッセージが到達しているならば、障害候補リンクに障害が発生していると判定し、逆に、当該プレフィックスの経路更新メッセージが到達していないならば、障害候補ノード装置に障害が発生していると判定する第3のステップと
を有することを特徴とする。
本発明の障害検出方法における他の実施形態によれば、
観測ノード装置における第1のステップについて、
経路更新メッセージが経由したパスを用いて、各ノード装置が広報元となるプレフィックス毎に、正常状態時における1つの正常状態パスを決定する第11のステップと、
プレフィックス毎に、当該プレフィックスを広報するノード装置を「監視対象ノード装置」とし、当該監視対象ノード装置と結ぶリンクを「監視対象リンク」として決定する第12のステップと、
受信した経路更新メッセージが経由したパスを記録し、単位時間における、監視対象ノード装置のプレフィックス数と、監視対象リンクをパスに含むプレフィックス数とを計測する第13のステップと、
ノード装置毎のプレフィックス数が零となった障害候補ノード装置と、リンク毎のプレフィックス数が零となった障害候補リンクとを検出する第14のステップと
を有することも好ましい。
本発明の障害検出方法における他の実施形態によれば、
観測ノード装置における第14のステップについて、
正常状態パスにおけるプレフィックスがAnnounce(通知)状態である場合に、タイプWithdraw(削除)の経路更新メッセージを受信した際に、当該プレフィックスにおける監視対象ノード装置及び監視対象リンクのプレフィックス数を1減分し、
正常状態パスにおけるプレフィックスがAnnounce状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、監視対象ノード装置が広報元ノード装置でない場合、監視対象ノード装置のプレフィックス数を1減分し、
正常状態パスにおけるプレフィックスがAnnounce状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、当該プレフィックスのパスに監視対象リンクが含まれない、又は、監視対象ノード装置が広報元ノード装置でない場合、監視対象ノード装置のプレフィックス数を1減分し、
正常状態パスにおけるプレフィックスがWithdraw状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、監視対象ノード装置が広報元ノード装置である場合、監視対象ノード装置のプレフィックス数を1増分し、
正常状態パスにおけるプレフィックスがWithdraw状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、当該プレフィックスのパスに監視対象リンクが含まれており、且つ、監視対象ノード装置が広報元ノード装置である場合、監視対象リンクのプレフィックス数を1増分する
ことも好ましい。
本発明の障害検出方法における他の実施形態によれば、
観測ノード装置における第11のステップについて、各ノード装置のプレフィックス毎に、受信した経路更新メッセージに含まれるパス毎の累積利用時間を収集し、所定時間範囲で、当該累積利用時間が最も長いパスを正常状態パスとして決定することも好ましい。
本発明の障害検出方法における他の実施形態によれば、
経路制御プロトコルは、BGP(Border Gateway Protocol)であり、
固有識別番号は、AS(Autonomous System)番号であり、
経路更新メッセージは、BGPのUPDATE(Announce/Withdraw)であり、
プレフィックスとは、IPアドレスとサブネットマスクのビット数との組からなる送信元アドレス又はその範囲であり、
経路更新メッセージのパスは、AS_PATH属性に含まれる
ことも好ましい。
本発明によれば、経路制御プロトコルの経路更新メッセージを送受信するネットワークに接続された、固有識別番号を有するノード装置であって、
広報元としての1つ以上のプレフィックス及び固有識別番号を含む経路更新メッセージを定期的にブロードキャストで送信する経路更新メッセージ送信手段と、
受信した経路更新メッセージに含まれる、中継ノード装置の固有識別番号の連続からなるパスに、更に当該ノード装置の固有識別番号を含めて、当該経路更新メッセージを中継転送する中継転送手段と
を有するノード装置において、
受信した経路更新メッセージが経由したパスを記録し、ノード装置毎のプレフィックス数が零となった障害候補ノード装置と、リンク毎のプレフィックス数が零となった障害候補リンクとを検出する障害候補検出手段と、
障害候補リンクの上流側ノード装置と一致する障害候補ノード装置について、当該障害候補リンク以外の迂回リンクの有無を判定する迂回リンク判定手段と、
迂回リンクが有る場合、当該障害候補ノード装置が広報元となるプレフィックスの経路更新メッセージが到達しているならば、障害候補リンクに障害が発生していると判定し、逆に、当該プレフィックスの経路更新メッセージが到達していないならば、障害候補ノード装置に障害が発生していると判定する障害検出手段と
を有することを特徴とする。
本発明のノード装置における他の実施形態によれば、
障害候補検出手段は、
経路更新メッセージが経由したパスを用いて、各ノード装置が広報元となるプレフィックス毎に、正常状態時における1つの正常状態パスを決定する正常状態パス決定手段と、
プレフィックス毎に、当該プレフィックスを広報するノード装置を「監視対象ノード装置」とし、監視対象ノード装置と結ぶリンクを「監視対象リンク」として決定する監視対象決定手段と、
受信した経路更新メッセージが経由したパスを記録し、単位時間における、監視対象ノード装置のプレフィックス数と、監視対象リンクをパスに含むプレフィックス数とを計測するプレフィックス数計測手段と、
ノード装置毎のプレフィックス数が零となった障害候補ノード装置と、リンク毎のプレフィックス数が零となった障害候補リンクとを決定する障害候補決定手段と
を有することも好ましい、
本発明のノード装置における他の実施形態によれば、
障害候補決定手段は、
正常状態パスにおけるプレフィックスがAnnounce(通知)状態である場合に、タイプWithdraw(削除)の経路更新メッセージを受信した際に、当該プレフィックスにおける監視対象ノード装置及び監視対象リンクのプレフィックス数を1減分し、
正常状態パスにおけるプレフィックスがAnnounce状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、監視対象ノード装置が広報元ノード装置でない場合、監視対象ノード装置のプレフィックス数を1減分し、
正常状態パスにおけるプレフィックスがAnnounce状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、当該プレフィックスのパスに監視対象リンクが含まれない、又は、監視対象ノード装置が広報元ノード装置でない場合、監視対象ノード装置のプレフィックス数を1減分し、
正常状態パスにおけるプレフィックスがWithdraw状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、監視対象ノード装置が広報元ノード装置である場合、監視対象ノード装置のプレフィックス数を1増分し、
正常状態パスにおけるプレフィックスがWithdraw状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、当該プレフィックスのパスに監視対象リンクが含まれており、且つ、監視対象ノード装置が広報元ノード装置である場合、監視対象リンクのプレフィックス数を1増分する
ことも好ましい。
本発明のノード装置における他の実施形態によれば、正常状態パス決定手段は、各ノード装置のプレフィックス毎に、受信した経路更新メッセージに含まれるパス毎の累積利用時間を収集し、所定時間範囲で、当該累積利用時間が最も長いパスを正常状態パスとして決定することも好ましい。
本発明のノード装置における他の実施形態によれば、
経路制御プロトコルは、BGP(Border Gateway Protocol)であり、
固有識別番号は、AS(Autonomous System)番号であり、
経路更新メッセージは、BGPのUPDATE(Announce/Withdraw)であり、
プレフィックスとは、IPアドレスとサブネットマスクのビット数との組からなる送信元アドレス又はその範囲であり、
経路更新メッセージのパスは、AS_PATH属性に含まれる
ことも好ましい。
本発明によれば、経路制御プロトコルの経路更新メッセージを送受信するネットワークに接続された、固有識別番号を有するノード装置に搭載されたコンピュータを
広報元としての1つ以上のプレフィックス及び固有識別番号を含む経路更新メッセージを定期的にブロードキャストで送信する経路更新メッセージ送信手段と、
受信した経路更新メッセージに含まれる、中継ノード装置の固有識別番号の連続からなるパスに、更に当該ノード装置の固有識別番号を含めて、当該経路更新メッセージを中継転送する中継転送手段と
して機能させるノード装置用のプログラムにおいて、
受信した経路更新メッセージが経由したパスを記録し、ノード装置毎のプレフィックス数が零となった障害候補ノード装置と、リンク毎のプレフィックス数が零となった障害候補リンクとを検出する障害候補検出手段と、
障害候補リンクの上流側ノード装置と一致する障害候補ノード装置について、当該障害候補リンク以外の迂回リンクの有無を判定する迂回リンク判定手段と、
迂回リンクが有る場合、当該障害候補ノード装置が広報元となるプレフィックスの経路更新メッセージが到達しているならば、障害候補リンクに障害が発生していると判定し、逆に、当該プレフィックスの経路更新メッセージが到達していないならば、障害候補ノード装置に障害が発生していると判定する障害検出手段と
してコンピュータを機能させることを特徴とする。
本発明の障害検出方法、ノード装置及びプログラムによれば、経路制御プロトコルに基づく経路更新メッセージを通常シーケンスで観測し、ノード装置間のリンクの障害か、又は、当該ノード装置自体の障害かを切り分けて検出することができる。
BGPにおけるネットワーク構成図である。 本発明における観測ノード装置のフローチャートである。 正常状態パスの検出(S11)を表す説明図である。 ルール1に対応する経路更新メッセージの受信を表す説明図である。 ルール2に対応する経路更新メッセージの受信を表す説明図である。 ルール3に対応する経路更新メッセージの受信を表す説明図である。 ルール5及び6に対応する経路更新メッセージの受信を表す説明図である。 正常状態に観測ノード装置によって観測された「パステーブル」「ノード装置のプレフィックス数」「リンクのプレフィックス数」を表す説明図である。 ノード装置に障害が発生した際に、観測ノード装置によって観測された「パステーブル」「ノード装置のプレフィックス数」「リンクのプレフィックス数」を表す説明図である。 リンクに障害が発生した際に、観測ノード装置によって観測された「パステーブル」「ノード装置のプレフィックス数」「リンクのプレフィックス数」を表す説明図である。 リンクに障害が発生した際であって、1つのプレフィックスしか転送されていない場合における、観測ノード装置によって観測された「パステーブル」「ノード装置のプレフィックス数」「リンクのプレフィックス数」を表す説明図である。 本発明におけるノード装置の機能構成図である。
以下では、本発明を実施するための形態について、図面を用いて詳細に説明する。
図2は、本発明における観測ノード装置のフローチャートである。
図2によれば、図1と同一のネットワーク構成が表されており、BGPを用いて、AS番号を有する7台のノード装置1(AS10〜AS70)が相互に接続されている。各ノード装置AS20〜AS70から送信されたUPDATEメッセージは、観測ノード装置AS10へ到達する。
ここで、ノード装置AS60から送信されたプレフィックスp60,p61,p62が、観測ノード装置AS10へ到達するまでの流れについて詳述する。
ノード装置AS60は、以下のように、自ら管理するプレフィックス及びAS番号を含むUPDATE(Announce)メッセージを定期的に送信する。
UPDATE(Announce)メッセージ[A|p60|60] :ノード装置AS40へ
UPDATE(Announce)メッセージ[A|p61|60] :ノード装置AS50へ
UPDATE(Announce)メッセージ[A|p62|60] :ノード装置AS40へ
ノード装置AS40は、以下のように、AS60から受信したそのUPDATEメッセージのASパスに、自らのAS番号[40]を追加して、ノード装置AS30及びAS20へ送信する。
UPDATE(Announce)メッセージ[A|p60|40 60] :ノード装置AS20へ
UPDATE(Announce)メッセージ[A|p62|40 60] :ノード装置AS30へ
ノード装置AS50は、以下のように、AS60から受信したそのUPDATEメッセージのASパスに、自らのAS番号[50]を追加して、ノード装置AS20へ送信する。
UPDATE(Announce)メッセージ[A|p61|50 60] :ノード装置AS20へ
ノード装置AS30は、以下のように、AS40から受信したそのUPDATEメッセージのASパスに、自らのAS番号[30]を追加して、ノード装置AS20へ送信する。
UPDATE(Announce)メッセージ[A|p62|30 40 60]:ノード装置AS20へ
ノード装置AS20は、以下のように、AS30,AS40又はAS50から受信したそのUPDATEメッセージのASパスに、自らのAS番号[20]を追加して、ノード装置AS10へ送信する。
UPDATE(Announce)メッセージ[A|p60|20 40 60]:ノード装置AS10へ
UPDATE(Announce)メッセージ[A|p61|20 50 60]:ノード装置AS10へ
UPDATE(Announce)メッセージ[A|p62|20 30 40 60]:ノード装置AS10へ
ノード装置AS10は、AS60から受信したそのUPDATEメッセージのASパスに、自らのAS番号[10]を追加し、それをパステーブルに記録する。
前述したシーケンスと同様に、ノード装置AS60以外のノード装置AS50,AS40,AS30,AS20も、定期的にブロードキャストでUPDATEメッセージを送信し、そのUPDATEメッセージは、他のノード装置を中継して、観測ノード装置AS10によって受信される。
図2によれば、本発明における観測ノード装置AS10は、経路更新(UPDATE)メッセージを受信する毎に、以下の3つのステップを実行する。
[S1]受信した経路更新メッセージが経由したパスを記録し、ノード装置毎のプレフィックス数が零となった障害候補ノード装置と、リンク毎のプレフィックス数が零となった障害候補リンクとを検出する。ここで、複数のノード装置や複数のリンクについてプレフィックス数の零が検出された場合、観測点に最も近いノード装置及びリンクを、障害候補として考えることができる。
[S2]次に、障害候補リンクの上流側ノード装置と一致する障害候補ノード装置について、当該障害候補リンク以外の迂回リンクの有無を判定する。ここで、 BGPによって、障害リンクが発生した場合、所定時間を要して、迂回経路を探索しながら、経路更新メッセージ転送するように動作する。従って、観測点は、所定時間経過後も、障害候補ノード装置を広報元とする経路更新メッセージを受信できない場合にのみ、障害候補ノード装置は迂回リンクを要しないものと判定することができる。
[S3]そして、迂回リンクが有る場合、以下のように判定する。
(1)当該障害候補ノード装置が広報元となるプレフィックスの経路更新メッセージが到達しているならば、障害候補リンクに障害が発生していると判定する。
(2)逆に、当該プレフィックスの経路更新メッセージが到達していないならば、障害候補ノード装置に障害が発生していると判定する。
勿論、プレフィックス数が零となったものが障害候補ノード装置のみである場合、最も観測点に近い障害候補ノード装置を障害箇所と推定する。また、プレフィックス数が零となったものが障害候補リンクのみである場合、最も観測点に近い障害候補リンクを障害箇所と推定する。
ここで、第1のステップ[S1]について詳細に説明する。
(S11)経路更新メッセージが経由したパスを用いて、各ノード装置が広報元となるプレフィックス毎に、正常状態時における1つの正常状態パス(最適経路)を決定する。
図3は、正常状態パスの検出(S11)を表す説明図である。
観測ノード装置AS10は、各プレフィックスのUPDATE(Announce)メッセージを受信した際に、そのUPDATEメッセージから、プレフィックス及びASパスを取得する。観測ノード装置AS10は、送信元ノード装置のプレフィックス毎に、受信したUPDATEメッセージに含まれるASパス毎の累積利用時間を収集する。図4によれば、例えば管理元ノード装置をAS60として、そのノード装置AS60が広報するプレフィックスp60,p61,p62の累積利用時間が記録されている。
その後、観測ノード装置AS10は、UPDATEメッセージに含まれるパス(AS_PATH属性)を用いて、各ノード装置のプレフィックス毎に、正常状態時における1つの正常状態パスを決定する。ここでは、当該累積利用時間が最も長いパスを正常状態パスとして決定する。図2によれば、管理元ノード装置AS60について、以下のように正常状態パスが決定されている。
p60について、累積利用時間「240時間」のASパス[10 20 40 60]
p61について、累積利用時間「200時間」のASパス[10 20 50 60]
p62について、累積利用時間「180時間」のASパス[10 20 30 40 60]
(S12)次に、プレフィックス毎に、当該プレフィックスを広報するノード装置を「監視対象ノード装置」とし、当該監視対象ノード装置と結ぶリンクを「監視対象リンク」として決定する。
図3によれば、正常状態パスに基づいて、以下のように決定される。
プレフィックスp70については、ノード装置AS70とリンク[60-70]とが、監視対象として決定される。
プレフィックスp60については、ノード装置AS60とリンク[40-60]とが、監視対象として決定される。
プレフィックスp61については、ノード装置AS60とリンク[50-60]とが、監視対象として決定される。
プレフィックスp62については、ノード装置AS60とリンク[40-60]とが、監視対象として決定される。
プレフィックスp50については、ノード装置AS50とリンク[30-50]とが、監視対象として決定される。
プレフィックスp40については、ノード装置AS40とリンク[30-40]とが、監視対象として決定される。
プレフィックスp30については、ノード装置AS30とリンク[20-30]とが、監視対象として決定される。
プレフィックスp20については、ノード装置AS20とリンク[10-20]とが、監視対象として決定される。
(S13)受信した経路更新メッセージが経由したパスを記録し、単位時間における、監視対象ノード装置のプレフィックス数と、監視対象リンクをパスに含むプレフィックス数とを計測する。
(S14)そして、ノード装置毎のプレフィックス数が零となった障害候補ノード装置と、リンク毎のプレフィックス数が零となった障害候補リンクとを検出する。
ここで、正常状態パス(最適経路)毎に、障害候補ノード装置及び障害候補リンクの集合を検出していく。集合内の障害候補ノード装置及び障害候補リンクについて、その検出時刻の順にソートし、最初の検出から所定時間d
秒以内の候補群を同一のクラスタとして分割する。そして、クラスタ毎に、障害候補ノード装置及び障害候補リンクについて、障害箇所を推定する。
次に、監視対象ノード装置及び監視対象リンクについて、プレフィックスの計数方法(S13)について、詳細に説明する。観測ノード装置は、BGPメッセージを時系列に解析し、監視対象ノード装置及び監視対象リンクのプレフィックス数の変動量を集計する。以下に、ルールを詳述する。
[ルール1]正常状態パスにおけるプレフィックスがAnnounce(通知)状態である場合に、タイプWithdraw(削除)の経路更新メッセージを受信した際に、当該プレフィックスにおける監視対象ノード装置及び監視対象リンクのプレフィックス数を1減分する。
図4は、ルール1に対応する経路更新メッセージの受信を表す説明図である。図4によれば、例えば、観測ノード装置AS10が、p62のWithdrawの経路更新メッセージを受信した場合、ノード装置AS60のプレフィックス数は「3->2」へ1減分し、リンク40-60のプレフィックス数は「2->1」へ1減分する。
[ルール2]正常状態パスにおけるプレフィックスがAnnounce状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、監視対象ノード装置が広報元ノード装置でない場合、監視対象ノード装置のプレフィックス数を1減分する。広報元ノード装置が変更される理由としては、例えばネットワーク構成が変更された場合が想定される。逆に、監視対象ノード装置が広報元ノード装置である場合、何ら処理をしない。
図5は、ルール2に対応する経路更新メッセージの受信を表す説明図である。図5によれば、例えば、観測ノード装置AS10が、p60のAnnounceのパス「10 20 40 60 90」の経路更新メッセージを受信した場合、広報元ノード装置がAS90であるために、ノード装置AS60のプレフィックス数は「3->2」へ減分する。正しく、p60のAnnounceのパス「10 20 40 60」の経路更新メッセージを受信した場合、何ら処理をしない。
[ルール3]正常状態パスにおけるプレフィックスがAnnounce状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、当該プレフィックスのパスに監視対象リンクが含まれてない場合、監視対象ノード装置のプレフィックス数を1減分する。正しく、当該プレフィックスのパスに監視対象リンクが含まれており、且つ、監視対象ノード装置が広報元ノード装置である場合、何ら処理をしない。
図6は、ルール3に対応する経路更新メッセージの受信を表す説明図である。図6によれば、例えば、観測ノード装置AS10が、p60のAnnounceのパス「10 20 50 60」を受信した場合、監視対象リンク[40-60]が含まれておらず、リンク[40-60]のプレフィックス数は「2->1」へ減分する。正しく、p60のAnnounceのパス「10 20 40 60」を受信した場合、何ら処理をしない。
[ルール4]正常状態パスにおけるプレフィックスがWithdraw状態である場合に、タイプWithdrawの経路更新メッセージを受信した際に、何ら処理しない。
[ルール5]正常状態パスにおけるプレフィックスがWithdraw状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、監視対象ノード装置が広報元ノード装置である場合、監視対象ノード装置のプレフィックス数を1増分する。
[ルール6]正常状態パスにおけるプレフィックスがWithdraw状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、当該プレフィックスのパスに監視対象リンクが含まれており、且つ、監視対象ノード装置が広報元ノード装置である場合、監視対象リンクのプレフィックス数を1増分する。
図7は、ルール5及び6に対応する経路更新メッセージの受信を表す説明図である。図7によれば、例えば、観測ノード装置AS10が、p62についてWithdraw状態である場合に、Announceのパス「10 20 50 60」のUPDATEメッセージを受信している。ここで、その広報元ノード装置は監視対象ノード装置AS60であり、パスには監視対象リンク[50-60]を含んでいる。この場合、監視対象ノード装置AS60のプレフィックス数を「2->3」へ1増分すると共に、監視対象リンク[50-60]も「0->1」へ1増分する。
[ルール7]最適経路が定まっていないプレフィックスについては、経路更新メッセージ(Announce/Withdraw)を受信しても、何もしない。
図8は、正常状態に観測ノード装置によって観測された「パステーブル」「ノード装置のプレフィックス数」「リンクのプレフィックス数」を表す説明図である。
[パステーブル]
プレフィックス毎に、「ASパス」「状態」「監視対象AS」「監視対象リンク」が記録されたものである。「ASパス」とは、受信したUPDATEメッセージに含まれるパスであって、後述するように正常状態パスに基づくものである。「状態」とは、受信したUPDATEメッセージに含まれるタイプ(Announce(通知)又はWithdraw(削除))である。「監視対象AS」とは、当該プレフィックスの広報元となるASである。「監視対象リンク」とは、監視対象ASから下流に接続されたリンクであって、当該プレフィックスが流れるリンクである。
[ノード装置のプレフィックス数]
ノード装置(AS番号)毎に、当該ノード装置が広報元として送信し、且つ、当該観測ノード装置で観測されたプレフィックス数が記録されている。図8によれば、ノード装置AS60が広報元として送信し、且つ、当該観測ノード装置で観測されてプレフィックス数は、p60,p61,p62の「3」となる。
[リンクのプレフィックス数]
ノード装置(AS番号)間のリンク毎に、当該リンクを経由して受信されたプレフィックス数が記録されている。図8によれば、リンク40-60を経由して受信されたプレフィックス数は、p60,p62の「2」であり、リンク50-60を経由して受信されたプレフィックス数は、p61の「1」である。
図9は、ノード装置に障害が発生した際に、観測ノード装置によって観測された「パステーブル」「ノード装置のプレフィックス数」「リンクのプレフィックス数」を表す説明図である。
ノード装置AS60に障害が発生した場合、観測ノード装置AS10は、前述したルール1に従って、結果的に、障害候補ノード装置AS60及びAS70のプレフィックス数と、障害候補リンク[40-60][50-60][60-70]のプレフィックス数とが零になる。ここで、観測点に最も近い上流側の障害候補ノード装置はAS60であり、観測点に最も近い障害候補リンクは[40-60][50-60]である。
次に、障害候補ノード装置AS60について、当該障害候補リンク[40-60][50-60]以外の迂回リンクの有無を判定する。BGPによって、障害リンクが発生した場合、所定時間を要して、迂回経路を探索しながら、経路更新メッセージ転送するように動作する。従って、観測ノード装置AS10は、所定時間経過後も、障害候補ノード装置AS60を広報元とする経路更新メッセージを受信できない場合、障害候補ノード装置AS60は迂回リンクを要しないものと判定することができる。
そして、迂回リンクが有る場合、観測ノード装置AS10は、以下のように判断する。
(1)当該障害候補ノード装置AS60が広報元となるプレフィックスの経路更新メッセージが到達しているならば、障害候補リンクに障害が発生していると判定する。
(2)逆に、当該プレフィックスの経路更新メッセージが到達していないならば、障害候補ノード装置AS60に障害が発生していると判定する。
尚、ノード装置AS40は、ノード装置AS60から経路更新メッセージを受信できない場合、ノード装置AS60又はリンク[AS40-AS60]に障害が発生したと判断する。このとき、障害を検出したノード装置AS40は、UPDATE(Withdraw)メッセージをノード装置AS20及びAS30へ送信する。
UPDATE(Withdraw):[W| p60,p62,p70]
Withdrawは、経路が削除されたことを意味する。UPDATE(Withdraw)メッセージには、ノード装置AS40が過去に中継した経路更新(UPDATE)メッセージについて、リンク[AS40-AS60]を介したプレフィックスが含まれる。
図10は、リンクに障害が発生した際に、観測ノード装置によって観測された「パステーブル」「ノード装置のプレフィックス数」「リンクのプレフィックス数」を表す説明図である。
リンク[40-60]に障害が発生した場合、観測ノード装置AS10は、前述したルール1に従って、結果的に、障害候補ノード装置AS70のプレフィックス数と、障害候補リンク[40-60][60-70]のプレフィックス数とが零になる。一方で、障害候補ノード装置AS60が広報元となるp61については、リンク[50-60]を経由するために、リンク[50-60]は障害候補リンクとならず、ノード装置AS60のプレフィックスは零にならず、ノード装置AS60は障害候補ノード装置とならない。
次に、障害候補ノード装置AS70について、当該障害候補リンク[40-60][60-70]以外の迂回リンクの有無を判定する。観測ノード装置AS10は、所定時間経過後も、障害候補ノード装置AS70を広報元とする経路更新メッセージを受信できない場合、障害候補ノード装置AS70は迂回リンクを要しないものと判定することができる。
プレフィックスp70については、時間経過に応じて迂回リンク[20-50][50-60][60-70]が観測される。そこで、観測ノード装置AS10は、当該障害候補ノード装置AS70が広報元となるプレフィックスの経路更新メッセージが到達しているならば、障害候補リンクに障害が発生していると判定する。ここでは、障害候補リンク[40-60][60-70]が検出されているので、その下流側となるリンク[40-60]に障害が発生したと判断される。
図11は、リンクに障害が発生した際であって、1つのプレフィックスしか転送されていない場合における、観測ノード装置によって観測された「パステーブル」「ノード装置のプレフィックス数」「リンクのプレフィックス数」を表す説明図である。
リンク[40-60]に障害が発生した場合、観測ノード装置AS10は、前述したルール1に従って、結果的に、障害候補ノード装置AS60及びAS70のプレフィックス数と、障害候補リンク[40-60][60-70]のプレフィックス数とが零になる。ここで、障害候補ノード装置AS70については、所定時間経過後、リンク[20-50][50-60][60-70]を経由した経路更新メッセージを観測ノード装置AS10が受信する。
次に、障害候補ノード装置AS60について、当該障害候補リンク[40-60]以外の迂回リンクの有無を判定する。観測ノード装置AS10は、所定時間経過後も、障害候補ノード装置AS60を広報元とする経路更新メッセージを受信できない場合、障害候補ノード装置AS60は迂回リンクを要しないものと判定することができる。
図11によれば、プレフィックスp60について、時間経過に応じて迂回リンク[20-50][50-60]が観測される。そのために、観測ノード装置AS10は、当該障害候補ノード装置AS60が広報元となるプレフィックスの経路更新メッセージが到達しているならば、障害候補リンクに障害が発生していると判定する。ここでは、障害候補リンク[40-60][60-70]が検出されているので、その下流側となるリンク[40-60]に障害が発生したと判断される。但し、これらリンク毎の障害検出時間(プレフィックス数が零となる)の差が、所定時間d秒以内であった場合に、観測点に最も近い40-60が障害箇所として推定される。障害候補リンク[40-60]及び[60-70]の障害検出時間が、所定時間d秒以上であれば、異なる障害として扱われる。
図12は、本発明におけるノード装置の機能構成図である。
図12によれば、ノード装置1は、中継転送部10と、障害候補検出部11と、迂回リンク判定部12と、障害検出部13と、経路更新メッセージ受信監視部14と、経路更新メッセージ送信部15とを有する。これら機能構成部は、ノード装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。尚、中継転送部10を除くこれらの機能は、経路更新メッセージの転送経過情報を予め蓄積した障害箇所検出装置2に搭載することもできる。
中継転送部10は、UPDATE(Announce)メッセージを受信した際に、そのUPDATE(Announce)メッセージに含まれる、中継ノード装置のAS番号の連続からなるパスに、更に当該ノード装置のAS番号を含めて、当該UPDATEメッセージを中継転送する。
経路更新メッセージ送信部15は、BGPに基づいて、プレフィックス及びAS番号を含むUPDATEメッセージを、定期的にブロードキャストで送信する。
経路更新メッセージ受信監視部14は、中継転送部10から抽出したBGPのUPDATEメッセージを、障害候補検出部部11へ出力する。
[障害候補検出部11]
障害候補検出部11は、受信した経路更新メッセージが経由したパスを記録し、ノード装置毎のプレフィックス数が零となった障害候補ノード装置と、リンク毎のプレフィックス数が零となった障害候補リンクとを検出する。
障害候補検出部11は、正常状態パス決定部111と、監視対象決定部112と、プレフィックス数計数部113と、障害候補決定部114とを有する。
正常状態パス決定部111は、経路更新メッセージが経由したパスを用いて、各ノード装置が広報元となるプレフィックス毎に、正常状態時における1つの正常状態パス(最適経路)を決定する。正常状態パス決定部111は、UPDATE(Announce)メッセージに含まれるパスを用いて、各ノード装置のプレフィックス毎に、正常状態時における1つの正常状態パスを決定する。具体的には、各ノード装置のプレフィックス毎に、受信したUPDATE(Announce)メッセージに含まれるパス毎の累積利用時間を収集し、所定時間範囲で、当該累積利用時間が最も長いパスを正常状態パスとして決定する。決定された正常状態パスは、監視対象決定部112へ出力される。
監視対象決定部112は、プレフィックス毎に、当該プレフィックスを広報するノード装置を「監視対象ノード装置」とし、当該監視対象ノード装置と結ぶリンクを「監視対象リンク」として決定する。
プレフィックス数計数部113は、受信した経路更新メッセージが経由したパスを記録し、単位時間における、監視対象ノード装置のプレフィックス数と、監視対象リンクをパスに含むプレフィックス数とを計測する。
障害候補決定部114は、ノード装置毎のプレフィックス数が零となった障害候補ノード装置と、リンク毎のプレフィックス数が零となった障害候補リンクとを検出する。
[迂回リンク判定部12]
迂回リンク判定部12は、障害候補リンクの上流側ノード装置と一致する障害候補ノード装置について、当該障害候補リンク以外の迂回リンクの有無を判定する。
[障害検出部13]
障害検出部13は、迂回リンクが有る場合、当該障害候補ノード装置が広報元となるプレフィックスの経路更新メッセージが到達しているならば、障害候補リンクに障害が発生していると判定し、逆に、当該プレフィックスの経路更新メッセージが到達していないならば、障害候補ノード装置に障害が発生していると判定する。
以上、詳細に説明したように、本発明の障害検出方法、ノード装置及びプログラムによれば、経路制御プロトコルに基づく経路更新メッセージを通常シーケンスで観測し、ノード装置間のリンクの障害か、又は、当該ノード装置自体の障害かを切り分けて検出することができる。
前述した本発明の種々の実施形態によれば、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 ノード装置
10 中継転送部
11 障害候補検出部
111 正常状態パス決定部
112 監視対象決定部
113 プレフィックス数計数部
114 障害候補決定部
12 迂回リンク判定部
13 障害検出部
14 経路更新メッセージ受信監視部
15 経路更新メッセージ送信部
2 障害箇所検出装置

Claims (11)

  1. 固有識別番号を有する複数のノード装置が相互に接続され、経路制御プロトコルの経路更新メッセージを送受信するネットワークであり、
    各ノード装置が、広報元としての1つ以上のプレフィックス及び固有識別番号を含む経路更新メッセージを定期的にブロードキャストで送信し、
    各ノード装置が、受信した前記経路更新メッセージに含まれる、中継ノード装置の固有識別番号の連続からなるパスに、更に当該ノード装置の固有識別番号を含めて、当該経路更新メッセージを中継転送し、
    観測ノード装置が、ノード装置間のリンクの障害か、又は、当該ノード装置自体の障害かを切り分けて検出する障害検出方法において、
    前記観測ノード装置が、
    受信した経路更新メッセージが経由した前記パスを記録し、ノード装置毎のプレフィックス数が零となった障害候補ノード装置と、リンク毎のプレフィックス数が零となった障害候補リンクとを検出する第1のステップと、
    前記障害候補リンクの上流側ノード装置と一致する前記障害候補ノード装置について、当該障害候補リンク以外の迂回リンクの有無を判定する第2のステップと、
    前記迂回リンクが有る場合、当該障害候補ノード装置が広報元となるプレフィックスの経路更新メッセージが到達しているならば、前記障害候補リンクに障害が発生していると判定し、逆に、当該プレフィックスの経路更新メッセージが到達していないならば、前記障害候補ノード装置に障害が発生していると判定する第3のステップと
    を有することを特徴とする障害検出方法。
  2. 前記観測ノード装置における第1のステップについて、
    前記経路更新メッセージが経由した前記パスを用いて、各ノード装置が広報元となるプレフィックス毎に、正常状態時における1つの正常状態パスを決定する第11のステップと、
    プレフィックス毎に、当該プレフィックスを広報するノード装置を「監視対象ノード装置」とし、当該監視対象ノード装置と結ぶリンクを「監視対象リンク」として決定する第12のステップと、
    受信した経路更新メッセージが経由したパスを記録し、単位時間における、監視対象ノード装置のプレフィックス数と、監視対象リンクをパスに含むプレフィックス数とを計測する第13のステップと、
    ノード装置毎のプレフィックス数が零となった障害候補ノード装置と、リンク毎のプレフィックス数が零となった障害候補リンクとを検出する第14のステップと
    を有することを特徴とする請求項1に記載の障害検出方法。
  3. 前記観測ノード装置における第14のステップについて、
    前記正常状態パスにおけるプレフィックスがAnnounce(通知)状態である場合に、タイプWithdraw(削除)の経路更新メッセージを受信した際に、当該プレフィックスにおける監視対象ノード装置及び監視対象リンクのプレフィックス数を1減分し、
    前記正常状態パスにおけるプレフィックスがAnnounce状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、監視対象ノード装置が広報元ノード装置でない場合、監視対象ノード装置のプレフィックス数を1減分し、
    前記正常状態パスにおけるプレフィックスがAnnounce状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、当該プレフィックスのパスに監視対象リンクが含まれない、又は、監視対象ノード装置が広報元ノード装置でない場合、監視対象ノード装置のプレフィックス数を1減分し、
    前記正常状態パスにおけるプレフィックスがWithdraw状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、監視対象ノード装置が広報元ノード装置である場合、監視対象ノード装置のプレフィックス数を1増分し、
    前記正常状態パスにおけるプレフィックスがWithdraw状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、当該プレフィックスのパスに監視対象リンクが含まれており、且つ、監視対象ノード装置が広報元ノード装置である場合、監視対象リンクのプレフィックス数を1増分する
    ことを特徴とする請求項2に記載の障害検出方法。
  4. 前記観測ノード装置における第11のステップについて、各ノード装置のプレフィックス毎に、受信した前記経路更新メッセージに含まれるパス毎の累積利用時間を収集し、所定時間範囲で、当該累積利用時間が最も長いパスを前記正常状態パスとして決定することを特徴とする請求項2又は3に記載の障害検出方法。
  5. 前記経路制御プロトコルは、BGP(Border Gateway Protocol)であり、
    前記固有識別番号は、AS(Autonomous System)番号であり、
    前記経路更新メッセージは、BGPのUPDATE(Announce/Withdraw)であり、
    前記プレフィックスとは、IPアドレスとサブネットマスクのビット数との組からなる送信元アドレス又はその範囲であり、
    前記経路更新メッセージの前記パスは、AS_PATH属性に含まれる
    ことを特徴とする請求項1から4のいずれか1項に記載のノード装置の障害検出方法。
  6. 経路制御プロトコルの経路更新メッセージを送受信するネットワークに接続された、固有識別番号を有するノード装置であって、
    広報元としての1つ以上のプレフィックス及び固有識別番号を含む経路更新メッセージを定期的にブロードキャストで送信する経路更新メッセージ送信手段と、
    受信した前記経路更新メッセージに含まれる、中継ノード装置の固有識別番号の連続からなるパスに、更に当該ノード装置の固有識別番号を含めて、当該経路更新メッセージを中継転送する中継転送手段と
    を有するノード装置において、
    受信した経路更新メッセージが経由した前記パスを記録し、ノード装置毎のプレフィックス数が零となった障害候補ノード装置と、リンク毎のプレフィックス数が零となった障害候補リンクとを検出する障害候補検出手段と、
    前記障害候補リンクの上流側ノード装置と一致する前記障害候補ノード装置について、当該障害候補リンク以外の迂回リンクの有無を判定する迂回リンク判定手段と、
    前記迂回リンクが有る場合、当該障害候補ノード装置が広報元となるプレフィックスの経路更新メッセージが到達しているならば、前記障害候補リンクに障害が発生していると判定し、逆に、当該プレフィックスの経路更新メッセージが到達していないならば、前記障害候補ノード装置に障害が発生していると判定する障害検出手段と
    を有することを特徴とするノード装置。
  7. 前記障害候補検出手段は、
    前記経路更新メッセージが経由した前記パスを用いて、各ノード装置が広報元となるプレフィックス毎に、正常状態時における1つの正常状態パスを決定する正常状態パス決定手段と、
    プレフィックス毎に、当該プレフィックスを広報するノード装置を「監視対象ノード装置」とし、前記監視対象ノード装置と結ぶリンクを「監視対象リンク」として決定する監視対象決定手段と、
    受信した経路更新メッセージが経由したパスを記録し、単位時間における、監視対象ノード装置のプレフィックス数と、監視対象リンクをパスに含むプレフィックス数とを計測するプレフィックス数計測手段と、
    ノード装置毎のプレフィックス数が零となった障害候補ノード装置と、リンク毎のプレフィックス数が零となった障害候補リンクとを決定する障害候補決定手段と
    を有することを特徴とする請求項6に記載のノード装置。
  8. 前記障害候補決定手段は、
    前記正常状態パスにおけるプレフィックスがAnnounce(通知)状態である場合に、タイプWithdraw(削除)の経路更新メッセージを受信した際に、当該プレフィックスにおける監視対象ノード装置及び監視対象リンクのプレフィックス数を1減分し、
    前記正常状態パスにおけるプレフィックスがAnnounce状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、監視対象ノード装置が広報元ノード装置でない場合、監視対象ノード装置のプレフィックス数を1減分し、
    前記正常状態パスにおけるプレフィックスがAnnounce状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、当該プレフィックスのパスに監視対象リンクが含まれない、又は、監視対象ノード装置が広報元ノード装置でない場合、監視対象ノード装置のプレフィックス数を1減分し、
    前記正常状態パスにおけるプレフィックスがWithdraw状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、監視対象ノード装置が広報元ノード装置である場合、監視対象ノード装置のプレフィックス数を1増分し、
    前記正常状態パスにおけるプレフィックスがWithdraw状態である場合に、タイプAnnounceの経路更新メッセージを受信した際に、当該プレフィックスのパスに監視対象リンクが含まれており、且つ、監視対象ノード装置が広報元ノード装置である場合、監視対象リンクのプレフィックス数を1増分する
    ことを特徴とする請求項7に記載のノード装置。
  9. 前記正常状態パス決定手段は、各ノード装置のプレフィックス毎に、受信した前記経路更新メッセージに含まれるパス毎の累積利用時間を収集し、所定時間範囲で、当該累積利用時間が最も長いパスを前記正常状態パスとして決定することを特徴とする請求項7又は8に記載のノード装置。
  10. 前記経路制御プロトコルは、BGP(Border Gateway Protocol)であり、
    前記固有識別番号は、AS(Autonomous System)番号であり、
    前記経路更新メッセージは、BGPのUPDATE(Announce/Withdraw)であり、
    前記プレフィックスとは、IPアドレスとサブネットマスクのビット数との組からなる送信元アドレス又はその範囲であり、
    前記経路更新メッセージの前記パスは、AS_PATH属性に含まれる
    ことを特徴とする請求項6から9のいずれか1項に記載のノード装置。
  11. 経路制御プロトコルの経路更新メッセージを送受信するネットワークに接続された、固有識別番号を有するノード装置に搭載されたコンピュータを
    広報元としての1つ以上のプレフィックス及び固有識別番号を含む経路更新メッセージを定期的にブロードキャストで送信する経路更新メッセージ送信手段と、
    受信した前記経路更新メッセージに含まれる、中継ノード装置の固有識別番号の連続からなるパスに、更に当該ノード装置の固有識別番号を含めて、当該経路更新メッセージを中継転送する中継転送手段と
    して機能させるノード装置用のプログラムにおいて、
    受信した経路更新メッセージが経由した前記パスを記録し、ノード装置毎のプレフィックス数が零となった障害候補ノード装置と、リンク毎のプレフィックス数が零となった障害候補リンクとを検出する障害候補検出手段と、
    前記障害候補リンクの上流側ノード装置と一致する前記障害候補ノード装置について、当該障害候補リンク以外の迂回リンクの有無を判定する迂回リンク判定手段と、
    前記迂回リンクが有る場合、当該障害候補ノード装置が広報元となるプレフィックスの経路更新メッセージが到達しているならば、前記障害候補リンクに障害が発生していると判定し、逆に、当該プレフィックスの経路更新メッセージが到達していないならば、前記障害候補ノード装置に障害が発生していると判定する障害検出手段と
    してコンピュータを機能させることを特徴とするノード装置用のプログラム。
JP2012148555A 2012-07-02 2012-07-02 経路制御プロトコルに基づいて障害ノード装置又は障害リンクをリアルタイムに検出する方法、ノード装置及びプログラム Expired - Fee Related JP5829183B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012148555A JP5829183B2 (ja) 2012-07-02 2012-07-02 経路制御プロトコルに基づいて障害ノード装置又は障害リンクをリアルタイムに検出する方法、ノード装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012148555A JP5829183B2 (ja) 2012-07-02 2012-07-02 経路制御プロトコルに基づいて障害ノード装置又は障害リンクをリアルタイムに検出する方法、ノード装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2014011727A true JP2014011727A (ja) 2014-01-20
JP5829183B2 JP5829183B2 (ja) 2015-12-09

Family

ID=50108021

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012148555A Expired - Fee Related JP5829183B2 (ja) 2012-07-02 2012-07-02 経路制御プロトコルに基づいて障害ノード装置又は障害リンクをリアルタイムに検出する方法、ノード装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5829183B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112583622A (zh) * 2019-09-30 2021-03-30 中兴通讯股份有限公司 故障事件信息的上报方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112583622A (zh) * 2019-09-30 2021-03-30 中兴通讯股份有限公司 故障事件信息的上报方法及系统
CN112583622B (zh) * 2019-09-30 2023-09-26 中兴通讯股份有限公司 故障事件信息的上报方法及系统

Also Published As

Publication number Publication date
JP5829183B2 (ja) 2015-12-09

Similar Documents

Publication Publication Date Title
JP5283192B2 (ja) 経路制御プロトコルに基づいて障害リンクをリアルタイムに検出する方法、ノード装置及びプログラム
JP5120784B2 (ja) 通信ネットワークシステムにおけるネットワーク上の品質劣化箇所を推定する方法
JP4244940B2 (ja) ネットワークの品質劣化箇所推定装置、品質劣化箇所推定方法及び品質劣化箇所推定プログラム
US9385917B1 (en) Monitoring and detecting causes of failures of network paths
US20070177506A1 (en) Method and system for network traffic matrix analysis
CN112311580B (zh) 报文传输路径确定方法、装置及系统、计算机存储介质
CN108616367B (zh) 故障定位方法和网络设备
US20090282291A1 (en) Internal maintenance association end point (mep) for sharing state information
CN111404822A (zh) 数据传输方法、装置、设备以及计算机可读存储介质
CN110838950B (zh) 一种网络性能抖动值的确定方法及装置
JP5829183B2 (ja) 経路制御プロトコルに基づいて障害ノード装置又は障害リンクをリアルタイムに検出する方法、ノード装置及びプログラム
JP5170778B2 (ja) Bgp障害箇所推定方法および装置
EP3602967B1 (en) Network availability measurement aggregation and correlation
JP2010161524A (ja) 経路制御プロトコルに基づく障害リンク検出方法、ノード装置及びプログラム
JP5221594B2 (ja) ネットワーク監視装置、ネットワーク監視方法及びネットワーク監視プログラム
JP4455285B2 (ja) 経路解析装置
CN102752169A (zh) 传输监控方法及装置
JP5274494B2 (ja) 経路制御プロトコルに基づいて障害リンクを検出する方法、ノード装置及びプログラム
Lad et al. Inferring the origin of routing changes using link weights
JP5587232B2 (ja) 経路制御プロトコルに基づいて障害リンクを検出する方法、ノード装置及びプログラム
JP5046401B2 (ja) 経路制御プロトコルに基づいて障害リンクを検出する方法、ノード装置及びプログラム
JP5117534B2 (ja) ネットワーク監視装置、ネットワーク監視方法及びネットワーク監視プログラム
CN117857437A (zh) 确定备份路径的方法及装置、非易失性存储介质
Liu et al. Failure Microscope: Precisely Diagnosing Routing Instability
Tachibana et al. IP performance management infrastructure for ISP

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150109

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150911

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150925

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151021

R150 Certificate of patent or registration of utility model

Ref document number: 5829183

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees