JP2016208092A - 通信経路監視装置、通信システム、障害判定方法、及びプログラム - Google Patents

通信経路監視装置、通信システム、障害判定方法、及びプログラム Download PDF

Info

Publication number
JP2016208092A
JP2016208092A JP2015083594A JP2015083594A JP2016208092A JP 2016208092 A JP2016208092 A JP 2016208092A JP 2015083594 A JP2015083594 A JP 2015083594A JP 2015083594 A JP2015083594 A JP 2015083594A JP 2016208092 A JP2016208092 A JP 2016208092A
Authority
JP
Japan
Prior art keywords
route
observation point
information
path
communication path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015083594A
Other languages
English (en)
Other versions
JP6460893B2 (ja
Inventor
坪井 俊樹
Toshiki Tsuboi
俊樹 坪井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Communications Corp
Original Assignee
NTT Communications Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Communications Corp filed Critical NTT Communications Corp
Priority to JP2015083594A priority Critical patent/JP6460893B2/ja
Publication of JP2016208092A publication Critical patent/JP2016208092A/ja
Application granted granted Critical
Publication of JP6460893B2 publication Critical patent/JP6460893B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

【課題】拠点間を接続する通信経路の監視を効率的に行う。【解決手段】第1の拠点と第2の拠点とを接続する通信経路の監視を行う通信経路監視装置において、前記通信経路が構築されるネットワーク上の所定のルータが観測点として設定されており、前記通信経路の確立の際に、前記第1の拠点から送信され、前記観測点が受信する経路広告メッセージに含まれる経路情報を前記観測点から取得するモニタリング手段と、前記モニタリング手段により取得した前記経路情報に基づいて、最適経路選択処理を行って、前記観測点における1つの経路情報を決定する最適経路選択手段と、前記観測点から、当該観測点において最適経路選択処理が実行された後の経路情報を取得する取得手段と、前記最適経路選択手段により決定された経路情報と、前記取得手段により取得された経路情報とを比較することにより、障害判定を実行する障害判定手段とを備える。【選択図】図19

Description

本発明は、通信ネットワークにおいて構築される通信経路の監視を行う技術に関連するものである。
従来から、通信事業者が提供する閉域ネットワークサービスを活用することによる企業ネットワークの構築が一般的に行われている。また、MPLS−VPN等のマルチテナント技術の活用により、単一ネットワークへ複数企業ユーザを収容する形態が一般的である。
通信事業者は、自ドメインのネットワーク運用(開通工事、故障監視)を可能とする監視装置を配備しているため、自ドメイン内では効率的なNW制御が可能である。
特開2011−114743号公報
最近、ハイブリッドクラウド技術の活用による企業ネットワークのマルチドメイン化の採用が進んでいる。また、開通工事等もSDN技術活用によるオンデマンドなフルオートメーション化が一般化しつつある。
複数通信事業者を相互接続したマルチドメインの企業ネットワーク構成において、各通信事業者は自ドメイン側のNW制御については、既存の監視装置を活用して迅速/効率的に行うことが可能である。しかし、通信事業者は、他の通信事業者が運用する他ドメイン側での詳細なネットワーク構成を把握できないため、マルチドメインで構築された企業ネットワークのE2E(end−to−end)のトータル監視が困難であるという課題がある。
図1に、管理ドメインAと管理ドメインBの2つのドメインをまたがって(2つの通信事業者のネットワーク上に)構築されている企業ネットワークの例を示す。図1に示すように、各通信事業者(オペレータ)は自ドメインで開通工事・故障監視等を行い、オフラインでの情報共有により、企業ユーザにおけるE2Eの通信経路の監視等を行っている。
本発明は上記の点に鑑みてなされたものであり、拠点間を接続する通信経路の監視を効率的に行うことを可能とする技術を提供することを目的とする。
本発明の実施の形態によれば、第1の拠点と第2の拠点との間を接続する通信経路の監視を行う通信経路監視装置であって、
前記通信経路が構築されるネットワーク上の所定のルータが観測点として設定されており、前記通信経路の確立の際に、前記第1の拠点から送信され、前記観測点が受信する経路広告メッセージに含まれる経路情報を前記観測点から取得するモニタリング手段と、
前記モニタリング手段により取得した前記経路情報に基づいて、最適経路選択処理を行って、前記観測点における1つの経路情報を決定する最適経路選択手段と、
前記観測点から、当該観測点において最適経路選択処理が実行された後の経路情報を取得する取得手段と、
前記最適経路選択手段により決定された経路情報と、前記取得手段により取得された経路情報とを比較することにより、障害判定を実行する障害判定手段と
を備える通信経路監視装置が提供される。
また、本発明の実施の形態によれば、第1の拠点と第2の拠点との間を接続する通信経路の監視を行う通信経路監視装置が実行する障害判定方法であって、
前記通信経路が構築されるネットワーク上の所定のルータが観測点として設定されており、前記通信経路の確立の際に、前記第1の拠点から送信され、前記観測点が受信する経路広告メッセージに含まれる経路情報を前記観測点から取得するモニタリングステップと、
前記モニタリングステップにより取得した前記経路情報に基づいて、最適経路選択処理を行って、前記観測点における1つの経路情報を決定する最適経路選択ステップと、
前記観測点から、当該観測点において最適経路選択処理が実行された後の経路情報を取得する取得ステップと、
前記最適経路選択ステップにより決定された経路情報と、前記取得ステップにより取得された経路情報とを比較することにより、障害判定を実行する障害判定ステップと
を備える障害判定方法が提供される。
本発明の実施の形態によれば、拠点間を接続する通信経路の監視を効率的に行うことを可能とする技術が提供される。
従来技術を示す図である。 E2E通信経路の確立の手順例1を説明するための図である。 E2E通信経路の確立の手順例2を説明するための図である。 Cプレーン障害の例を説明するための図である。 Dプレーン障害の例を説明するための図である。 本発明の実施の形態の概要を説明するための図である。 Cプレーン障害の検出方法を説明するための図である。 Dプレーン障害の検出方法を説明するための図である。 本実施の形態におけるBGPモニタリング機能の例を説明するための図である。 E2E正常性が確認される場合の処理シーケンスの例を示す図である。 Cプレーン障害が検知される場合の処理シーケンスの例を示す図である。 Dプレーン障害が検知される場合の処理シーケンスの例を示す図である。 BGPベストパス計算を説明するための図である。 BGPシミュレーション経路計算を説明するための図である。 最新ルーティング情報収集を説明するための図である。 ルーティング情報の突合を説明するための図である。 宛先プレフィックス経路診断を説明するための図である。 ネクストホップ経路診断を説明するための図である。 本実施の形態におけるE2E開通監視装置の機能ブロック図である。
以下、図面を参照して本発明の実施の形態を説明する。なお、以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。例えば、本実施の形態では、複数のドメインにまたがる通信経路の監視を対象としているが、本発明は複数のドメインにまたがらない通信経路の監視にも適用できる。
なお、本実施の形態における管理ドメイン等の「ドメイン」とは、1オペレータ(通信事業者)が運用するネットワーク(ルータにより構成されるネットワーク)であることを想定している。1つの「ドメイン」を1つのASであるとしてもよいが、これに限定されず、1つの「ドメイン」が複数のASを含むこととしてもよい。
本発明の実施の形態では、企業ネットワーク等においてユーザ拠点が追加されたとき等に行われるE2E通信経路の開通(確立)時における正常性確認等の監視を効率的に行うE2E開通監視装置について説明するが、その説明の前に、本実施の形態に係る技術の理解を促進するために、まず、E2E通信経路の各種の確立方法について説明する。
(E2E通信経路の確立の手順例1)
まず、E2E通信経路の確立の手順例1を図2を参照して説明する。図2に示すように、オペレータ(通信事業者)Aが管理する管理ドメインAとオペレータBが管理する管理ドメインBがあり、それぞれの管理ドメインはルータ間を接続したネットワークとして構築されている。また、管理ドメインAと管理ドメインBはドメインの境界となるルータにより接続されている。
図2の例は、「192.168.100.0/32」のプレフィックスを持つユーザ拠点(ユーザXのユーザ拠点)が管理ドメインAに新たに接続される場合の例である。つまり、ユーザ拠点への経路が追加される場合の例である。図2の例では、当該ユーザ拠点と管理ドメインA間がスタティックルーティングを使用して接続される。
本例では、まず、ユーザXからオペレータAに対して開通申込がなされ(ステップS1)、ユーザ拠点への経路が追加になったタイミングで、オペレータAによりユーザ拠点を接続するルータへの開通工事がなされる(ステップS2)。
また、オペレータの各拠点に配備されたルータ間でのBGPシグナリング処理により広告経路(192.168.100.0/32)の伝搬が行われ(ステップS3〜S5)、最終的に対向管理ドメインBにおけるルータのルーティングテーブルに広告経路が反映されることにより、エンドToエンド通信経路が確立される。
また、オペレータAからオペレータBに対して工事連絡がなされ(ステップS6)、オペレータBが開通確認を行って(ステップS7)、完了通知(OK)がオペレータAに返される(ステップS8)。
図2の例は、例えば、SOHO/小規模な企業ユーザの顧客セグメントでのエンタープライズNW形態として活用されているネットワークモデルである。
(E2E通信経路の確立の手順例2)
図3を参照してE2E通信経路の確立の手順例2を示す。この例は、追加されるユーザ拠点と管理ドメインA間がBGPによるダイナミックルーティングを行うことが可能な場合の例である。
ステップS11において、ユーザXによりユーザ拠点(192.168.100.0/32)の開通工事がなされ、オペレータが介在することなく、ルータ間でのBGPシグナリング処理により広告経路の伝搬が行われ(ステップS12〜S15)、エンドToエンド通信経路が確立される。
図3に示す例は、大規模な企業ユーザの顧客セグメントでのエンタープライズNW形態として活用されているネットワークモデルである。このようなモデルにおいて、ハイブリッドクラウド活用により、ユーザ主導による完全自動化された開通工事が一般化されつつある。
(Cプレーン障害の例)
ユーザ自ら開通工事を行うことによるマルチドメインでのE2E通信経路確立時において、不測な事態により、E2E通信経路が正常に開通できなかった場合、例えば図4に示すような手順で対処が行われる。すなわち、ユーザXが、開通工事(ステップS21)を行った際に正常に開通できない場合に、ユーザ側と各管理ドメインのオペレータは、各管理区分ごとに障害状況を把握(原因究明)した上で、対処を実施する(ステップS22〜S26)。
図4に示す原因調査(ステップS24)において、各管理ドメインのオペレータは、各ルータでのBGPテーブルを確認の上、BGPメッセージ紛失箇所を特定する必要があるため、正確に障害原因を特定するには、相当な時間を要する。
(Dプレーン障害の例)
大規模トポロジにおいては、一般的には、CプレーンとDプレーンを異経路としている。よって、Cプレーンは正しく動作しているが、Dプレーンが動作しないケースも想定する必要がある。この場合も、図5に示すようにユーザ側と各管理ドメインのオペレータは、各管理区分ごとに障害状況を把握(原因究明)した上で、対処を実施する(ステップS31〜S36)。
切り分け手順として、まず、Cプレーン動作を確認する。各管理ドメインのオペレータは、各ルータでのルーティングテーブル等を確認の上、Dプレーン故障箇所を特定するため、正確に原因特定するには、相当な時間を要する。
(本発明の実施の形態の概要)
本発明の実施の形態では、マルチドメインのE2E通信経路の確立時において、上述した技術のような手間や時間をかけることなく、E2E通信経路や正常性の確認や障害箇所の特定等を可能とする技術が提供される。
図6を参照して、本実施の形態における通信システムの概要を説明する。図6に示すように、E2E開通監視装置100が備えられる。E2E開通監視装置100を「通信経路監視装置」と称してもよい。E2E開通監視装置100は、各管理ドメインにおいて観測点として決定された複数のルータからBGPメッセージの情報を取得することで、Cプレーン障害の発生区間を特定することが可能である。また、E2E開通監視装置100は更に、観測点からBGPの経路情報等を収集することで、Dプレーン障害の発生区間を特定することも可能である。
「観測点」とは、観測点として決定されたルータである。また、観測点の決定方法は特定の方法に限定されないが、例えば、管理ドメインにおいてエッジとなり、eBGPの動作を行うルータ(例:PEルータ)の中で、開通に係るBGPメッセージ(経路広告メッセージ)が通過することが想定されるルータを観測点とすることができる。なお、E2E開通監視装置100の運用者は、各管理ドメインのネットワークにおける観測点を決定するためのルータ等の情報は把握しているものとする。
<Cプレーン障害検知方法概要>
図7を参照して、E2E開通監視装置100によるCプレーン障害検知方法の概要を説明する。
本実施の形態では、E2E開通監視装置100が観測点のルータからBGPメッセージの情報を取得するために、BMP(BGP Monitoring Protocol)を使用することを想定している。そのため、まず、観測点において当該プロトコルに係るBGPメッセージのモニタリング機能を有効にする。
E2E開通監視装置100は、通信経路の開通時において各ルータに転送される経路広告のBGPメッセージを取得(モニタリング)する(ステップS101、S102)。そして、当該BGPメッセージを取得できなかった観測点が存在する場合、BGPメッセージを取得できた最後の観測点と、取得できなかった最初の観測点との間の区間をCプレーン障害区間であると判断できる。図7の例では、観測点2と観測点3の間にCプレーン障害が発生したと判断している。
<Dプレーン障害検知方法概要>
前述したように、Cプレーンに障害が検知されない場合でもDプレーンに障害がある場合がある。本実施の形態では、このようなDプレーンの障害検知を自動的に行うことが可能である。
E2E開通監視装置100は、Cプレーンの正常性確認のためにBGPメッセージの情報を取得した後、図8のステップS111〜114として示されるように、BGPモニタリングの各観測点からBGPのルーティング情報(経路情報と称してもよい)を取得する。E2E開通監視装置100は、各観測点から取得したBGPモニタリング情報に基づき、各観測点での最適な経路情報(ベストパス)を計算(選択)する。そして、当該経路情報を、ステップS111〜S114で取得した実際の経路情報とを比較することにより、障害被疑箇所を特定し、当該被疑箇所に対して経路診断を行うことで障害箇所を特定することとしている。図8の例では、観測点2と観測点3の間にDプレーン障害が発生したと判断している。
<BGPモニタリング機能について>
前述したように、本実施の形態では、BGPメッセージの情報の取得のために、BMPを使用することを想定しているが、図9に示すように、E2E開通監視装置100が、BGPルートサーバ/ルッキンググラスの機能を備え、観測点毎にBGPピアを張ることにより、BGPメッセージの取得を行うこととしてもよい。
以外では、本実施の形態に係るE2E開通監視装置100の処理内容をより詳細に説明する。
(処理シーケンス例)
詳細な説明として、まず、処理シーケンス例を説明する。正常性が確認できた場合の処理シーケンスを図10に示し、Cプレーン障害検知に関わる処理シーケンスを図11に示し、Dプレーン障害検知に関わる処理シーケンスを図12に示す。
各処理シーケンスに示す例において、管理ドメインAは、観測点間がMPLSトンネルで接続されるIPネットワークであり、管理ドメインBは、MPLS−VPNネットワークである。また、各処理シーケンスにおける事前処理として、E2E開通監視装置100において、観測点とするルータを、観測点1、観測点2、観測点3、観測点4として登録する。具体的には、例えば、観測点とするルータのIPアドレスを登録する。
各処理シーケンスにおいて、観測点における処理毎にステップ番号を付与しているが、当該ステップ番号は、当該観測点での処理の順番を示し、観測点間での処理の順番とは必ずしも関連しない。例えば、全観測点でのBGPモニタリングが終了した後に、各観測点のRIB情報収集等が行われる。
まず、図10を参照して、E2E通信経路確立時に、正常性が確認される場合の処理シーケンスについて説明する。
ユーザXにおけるユーザ拠点開通工事により、ユーザ拠点のルータからBGPメッセージ(具体的には、プレフィックスとネクストホップ等を含むBGP UPDATE)が観測点1に送信される。図10のケースは正常なケースであり、BGPメッセージは、観測点1、2、3を経由し、ユーザXの他ユーザ拠点を収容するルータである観測点4に届く。なお、MPLS−VPNでは、MP−BGP(Multiprotocol−BGP)が使用される。
一方、E2E開通監視装置100は、各観測点に対してBGPモニタリングを実施する(ステップS121、S131、S141、S151)。当該BGPモニタリングにおいて、E2E開通監視装置100は、観測点毎に、当該観測点がBGPピアルータから受信したBGPメッセージの内容(BGP情報と呼ぶ)を取得する。つまり、BGPテーブル(RIB情報と呼んでもよい)における「Adj−RIBs−In」の情報を取得する。この情報は、ベストパス選択処理(最適経路選択処理)が実行される前の情報である。
E2E開通監視装置100は、各観測点について、取得したBGP情報の中に、今回の開通に係るユーザ拠点のプレフィックス(ネットワークアドレス)と、ネクストホップとして、自観測点の前の観測点の識別情報(IPアドレス等)とを含む経路情報がある場合に、正常であると判定する。つまり、E2E開通監視装置100は、各観測点について、今回の開通に係るプレフィックスの広告メッセージを受信したかどうかを判定し、全観測点が受信したならばCプレーンは正常であると判断する。
図10の例では、全ての観測点においてBGPモニタリングによる確認は正常であり、これにより、E2E開通監視装置100は、Cプレーンは正常であると判断する。
Cプレーンが正常であると判定された後、E2E開通監視装置100は、Dプレーンの正常性確認を行うが、Dプレーンの正常性確認の詳細については後述する。概要として、Dプレーンの正常性確認においては、各観測点からのRIB情報収集(ステップS122、S132、S142、S152)、突合処理、経路診断(ステップS123、S133、S143、S153)が行われる。
図10の例では、これらの確認の結果、Aで示す区間、Bで示す区間、Cで示す区間、Dで示す区間のいずれも正常であると判定されている。
次に、図11を参照して、E2E通信経路確立時に、Cプレーン障害が検知される場合の処理シーケンスについて説明する。
図11の例でも、図10に示した例と同様に、E2E開通監視装置100は、各観測点のBGPモニタリングを順次実行する。本例では、観測点1〜3では、正しいBGP情報を取得でき、また、Dプレーンの正常性も確認されている。しかし、観測点4では、正しいBGP情報を取得できなかった。よって、E2E開通監視装置100は、開通対象のユーザ拠点と観測点3との間までは正常であるが、観測点3と観測点4の間にCプレーン障害があることを検知する。
次に、図12を参照して、E2E通信経路確立時に、Dプレーン障害が検知される場合の処理シーケンスについて説明する。
図12の例でも、図10に示した例と同様に、E2E開通監視装置100は、各観測点のBGPモニタリングを順次実行し、Cプレーンは正常であることを確認する。しかし、本例では、観測点4から収集(S152)したRIB情報に基づく突合処理により、異常が検知されたため、経路診断(S153、S154)の結果、観測点3と観測点4との間でDプレーンの障害が検知されている。
(Dプレーン正常性確認について)
次に、E2E開通監視装置100が、Dプレーン正常性確認のために実施する処理内容をより詳細に説明する。
<BGPルータでのベストパス計算について>
まず、基本的な事項として、BGP/MP−BGPが動作するネットワークにおいて、Dプレーン障害が発生した場合のベストパス計算について図13を参照して説明する。
図13に示す例は、これまでに説明したネットワークと同じネットワークであり、管理ドメインAと管理ドメインBを有する。管理ドメインAはIPネットワークであり、BGPが動作する。管理ドメインBはMPLS−VPNのネットワークであり、MP−BGPが動作する。なお、BGPとMP−BGPを特に区別しない場合、これらを総称して「BGP」と呼ぶ。
管理ドメインAと管理ドメインB等のAS内部でBGPピア接続された各ルータはiBGPで動作するが、iBGPでは、BGPメッセージの伝搬を行うために、フルメッシュでルータ間のBGPピア接続を行う。ただし、ルータの数が多い場合等には、フルメッシュ接続は現実的ではないため、実際には、図13(a)に示すように、ルートリフレクタ(RR)を設け、RR経由でBGPピアを開設し、BGPメッセージを全てのBGPルータに伝搬させている。このようにすることで、BGPルータ間を接続するMPLSトンネルに障害があってもBGPメッセージは全てのBGPルータに伝搬される。なお、ルートリフレクタ(RR)を用いる手法は一例である。
ユーザ拠点の開通により経路が追加されたときに、例えば観測点4は、観測点3と観測点8からそれぞれBGPメッセージ(BGPアップデート)を受信する。各BGPメッセージには、プレフィックス、通過ASの情報、ネクストホップの情報等が含まれる。また、MP−BGPの場合は、MPLSラベル等も含まれる。これらの情報からなる情報を経路情報と呼ぶことにする。また、これらの情報をNLRI情報と呼んでもよい。観測点4のルータは、受信した複数の経路情報について、BGPのプロトコルに従って、ベストパス計算を行い、1つの経路情報を選択する。ベストパス計算において、ネクストホップのBGPルータへの到達性がない経路情報は選択されない。
図13の例において、観測点4は、観測点3から、プレフィックスと観測点3をネクストホップとして含むBGPメッセージ(経路情報1とする)を受信し、観測点8から、プレフィックスと観測点8をネクストホップとして含むBGPメッセージ(経路情報2)を受信する。ここで、図13(b)に示すように、観測点3と観測点4との間に障害が発生し、観測点4から観測点3への到達性が無い状況を想定する。これ以外の障害は無いとする。
この場合、観測点4でのベストパス計算では、経路情報1は選択されず、経路情報2が選択される。よって、追加されたプレフィックスへの観測点4におけるネクストホップは観測点8となる。
なお、図13(b)において、各ルータ上に示された矢印は、ベストパス計算で得られたネクストホップへの方向を示している。例えば、観測点4では観測点8に向いた矢印が示されている。当該矢印の意味は他の図においても同様である。
以下、順次、図面を参照しながらDプレーン正常性確認のためにE2E開通監視装置100が実行する手順を詳細に説明する。
<シミュレーション経路計算>
既にBGPモニタリングとして説明したが、図14(a)に示すように、E2E開通監視装置100は、ユーザXの経路開通に関するBGPメッセージ(BGPアップデート)の情報(Adj−RIBs−Inの情報)をBGP情報として各観測点から収集する。
続いて、E2E開通監視装置100は、観測点毎に取得したBGP情報を用いて、ルータ内で行われるベストパス計算と同様に、観測点毎のベストパス計算を行う。ただし、E2E開通監視装置100内で実行するベストパス計算(シミュレーション経路計算)において、ネクストホップへの到達性の有無は不明であるため、到達性が有ると仮定して計算を行う。
図14(b)は、E2E開通監視装置100にて実行されたベストパス計算の結果を示している。図14(b)に示すように、観測点4において、対象プレフィックスへのネクストホップが観測点3である経路が選択されている。
<最新ルーティング情報の収集>
次に、図15(a)に示すように、E2E開通監視装置100は、各観測点から最新のルーティング情報(経路情報と称してもよい)を取得する。この手順は、図10〜図12に示した「RIB情報収集」のステップに相当する。E2E開通監視装置100が各観測点から収集する最新の経路情報は、例えば、各観測点において、対象のプレフィクスに関して、ベストパス計算により選択された経路情報である。つまり、各観測点のルータにおける「Local−RIB」のテーブルに蓄積されている経路情報を収集する。なお、対象のプレフィクスに関するRIB情報を全て取得し、取得したRIB情報から「Local−RIB」の経路情報を選択して比較に用いてもよい。
本例において、各観測点から収集された経路情報に基づく各観測点におけるネクストホップを図15(b)に示す。図15(b)に示すように、実際のネットワークにおいて、観測点4から観測点3への到達性が無いため、観測点4において、観測点8をネクストホップとする経路情報が選択されている。
<経路情報の突合処理>
次に、E2E開通監視装置100は、シミュレーションによるベストパス計算で得られた経路情報と、各観測点から得られた実施の経路情報(すなわち、ベストパス計算後の経路情報)とを比較(突合)する処理を観測点毎に実行する。
ここでは、例として、観測点4に着目する。図16(a)に示されるように、観測点4におけるシミュレーションでのベストパス計算により、「プレフィックス:開通するユーザ拠点、ネクストホップ:観測点3」に相当する経路情報が得られている。一方、図16(b)に示すように、観測点4からは、「プレフィックス:開通するユーザ拠点、ネクストホップ:観測点8」という経路情報が得られている。
これらを突合すると、開通するユーザ拠点への経路についてのネクストホップに差異が検出される。なお、観測点4以外の観測点について差異は検出されていない。
従って、E2E開通監視装置100は、観測点4から観測点3への経路にDプレーンの障害があることを推定できる。言いかえると、障害被疑を検出できる。
突合処理に関し、基本的には、開通設定対象のプレフィックスについて、シミュレーションで計算した経路情報と、観測点から取得した経路情報との間で、ネクストホップが一致しているかを比較により判断する。
開通設定対象のプレフィックスに対して、観測点から取得した情報に複数の経路情報が存在する場合には、その中で、観測点におけるBGPベストパス計算で抽出された経路情報と、シミュレーションで計算した経路情報とを比較し、ネクストホップが一致しているかを判断する。
なお、観測点がMPLS−VPNネットワークに属している場合には、開通設定対象は、VPNv4プレフィックスとして区別する。この場合、ネクストホップに加えて、RD(Route Distinguisher)値とMPLSラベル値も一致しているかを判断する。
<宛先プレフィックス経路診断>
次に、図17に示すとおり、E2E開通監視装置100は、障害被疑事象が検出された観測点4から宛先プレフィックス経路診断を行う。宛先プレフィックス経路診断とは、観測点4から宛先プレフィックスまでの到達性を確認するための診断であり、コマンドとしてはpingが用いられる。なお、宛先とするアドレスは予め登録しておく。
本例では、観測点4が属する管理ドメインBは、MPLS−VPNネットワークであるため、観測点となっているBGPルータでは、1台のルータ上で複数のルーティングテーブル(それぞれVPNユーザに対応)を持つことを可能とするVRFが用いられていることから、VRF名を指定するVRF−Pingを実行する。また、宛先プレフィックスは、VPNv4プレフィックスとなる。これは、IPのプレフィックスに、ユーザ(ルート)を識別するRD(Route Distinguisher)を付加したものである。更に、VPNv4プレフィックスに対応するMPLSラベル値を適切に挿入した上でテストパケットの送信を行う。
通常、Pingのテストパケットは、ルータにおける実際のルーティング情報に基づいた経路で送信されるが、本例では、図17に示すように、E2E開通監視装置100がシミュレーションのベストパス計算で得た経路情報(ルーティング情報)に基づいてテストパケットの送信を行う。すなわち、E2E開通監視装置100が備える経路情報に従った動作を観測点4のルータに実行させる。このような動作は、例えばOpenFlow技術を用いることで実現可能である。
もしも、観測点4のルータにおける実際の経路情報に基づいてPingを実行した場合、障害の無い経路でテストパケットが転送されることで、経路診断に成功してしまい、障害を検知できない可能性がある。よって、シミュレーションのベストパス計算で得た経路情報(ルーティング情報)に基づいてテストパケットの送信を行う。
テストパケットに関し、通常の用途であれば、テストパケットとしては、pingで活用されている[ICMP ECHOパケット]で構わないが、ユーザ拠点でのセキュリティポリシーに応じて、テスト方法を切り替える方式としてもよい。例えば、ユーザ拠点のFirewallでICMP通信禁止、TCP通信許可としている場合には、テストパケットとして、ICMP ECHOを使用しても、到達性を確認することができないため、この場合は、TCP通信許可となるテストパケットを使用する。
本例では、図17に示すとおり、観測点4から観測点3への経路に障害があるため、宛先プレフィックス経路診断は失敗する(応答が返ってこない)。
<ネクストホップ経路診断>
上記の宛先プレフィックス診断により、E2E開通監視装置100は、観測点4からユーザ拠点へのルートのどこかに障害があることがわかるが、観測点4から観測点3へのルートに障害があることはまだ特定できない。
そこで、図18に示すように、次に、E2E開通監視装置100は、観測点4からネクストホップ経路診断を実施する。本例において、観測点4と観測点3は、MPLSトンネルで接続されているため、ここでは、観測点3宛てにLSP−Pingを実行する。ネクストホップの情報(観測点3)は、シミュレーションにより得られた経路情報から取得できる。
本例では、図18に示すとおり、ネクストホップ経路診断は失敗する(応答が返ってこない)。これにより、E2E開通監視装置100は、観測点4から観測点3への経路にDプレーン障害があると判定できる。
(E2E開通監視装置100の構成)
次に、これまでに説明した処理を実行するE2E開通監視装置100の構成例を図19を参照して説明する。
図19に示すとおり、E2E開通監視装置100は、BGPモニタリング部110、ルーティング情報チェック部120、経路診断部130、データ格納部140を含む。
BGPモニタリング部110は、BGPモニタ受信部111、BGPアップデート情報抽出部112、及びCプレーン障害判定部113を含む。ルーティング情報チェック部120は、RIB情報抽出部121、Dプレーン障害判定部122、BGPベストパス計算部123を含む。経路診断部130は、テストパケット転送部131、テストパケット受信部132、Dプレーン障害判定部133を含む。
BGPモニタリング部110は、図14等を参照して説明したように、例えばBMPを使用して、観測点のルータからBGP情報(例:Adj−RIBs−Inの情報)を取得する機能部である。より詳細には、BGPモニタ受信部111が観測点のルータからのBGP情報を取得する。BGPアップデート情報抽出部112は、取得したBGP情報から、監視対象のユーザのプレフィクスを広告するBGPアップデートメッセージの情報を抽出し、データ格納部140に保存する。図19に示すように、この処理により、データ格納部140には、観測点毎に、対象ユーザのプレフィックス、ネクストホップが格納される。なお、これらの情報は例であり、ベストパス計算のために必要な更なる情報が含まれる。
Cプレーン障害判定部113は、観測点毎に、対象のプレフィックスを広告するBGPアップデートメッセージが受信できているかどうかをチェックし、全観測点で受信できていることを確認した場合に、Cプレーン障害はないと判定する。BGPアップデートメッセージが受信できていない観測点を検知した場合、Cプレーンに障害があると判定する。
ルーティング情報チェック部120は、図14〜図16等を参照して説明したようにして、Dプレーンの障害被疑の観測点を特定する機能部である。より詳細には、RIB情報抽出部121は、各観測点のルータからRIB情報を取得し、これをデータ格納部140に格納する。また、BGPベストパス計算部123は、データ格納部140に格納されているBGP情報を用いて、観測点毎に、シミュレーションとしてベストパス計算を行い、経路情報(シミュレーションによるRIB)を算出する。
Dプレーン障害判定部122は、観測点毎に、実際に取得した経路情報と、シミュレーションにて計算した経路情報とを突合することにより、観測点毎に障害被疑の有無を判定する。Dプレーン障害判定部122は、突合により不一致を検出した観測点における情報を経路診断対象として抽出し、データ格納部140に格納する。
経路診断部130は、図17〜図18を参照して説明したように、障害被疑のある観測点を介して経路診断を実行する機能部である。より具体的には、テストパケット転送部131は、診断対象の情報に基づき、テストパケットを作成し、診断対象観測点のルータにテストパケットを転送し、シミュレーションで算出した経路情報に基づく経路でテストパケットを当該ルータに送信させる。テストパケット受信部132は、応答に係るテストパケットを受信したルータからテストパケットを受信する。Dプレ―ン障害判定部133は、テストパケット受信部132によるテストパケット受信の有無により、経路診断の結果を判定し、経路診断がNGである場合に、Dプレーンに障害があると判断する。
データ格納部140は、管理者等から監視対象のエントリ(観測を行うルータである観測点の識別情報等)の入力を受けてそれを格納するとともに、上記のようにして取得・作成した各種データを格納する。
本実施の形態に係るE2E開通監視装置100は、例えば、1つ又は複数のコンピュータに、本実施の形態で説明する処理内容を記述したプログラムを実行させることにより実現可能である。すなわち、E2E開通監視装置100が有する機能は、当該コンピュータに内蔵されるCPUやメモリ、ハードディスクなどのハードウェア資源を用いて、当該装置で実施される処理に対応するプログラムを実行することによって実現することが可能である。上記プログラムは、コンピュータが読み取り可能な記録媒体(可搬メモリ等)に記録して、保存したり、配布したりすることが可能である。また、上記プログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。
E2E開通監視装置100は1つの装置(サーバ等のコンピュータ)により構成される必要はなく、複数のサーバがネットワーク接続された構成であってもよい。このように複数のサーバにより構成される場合でも当該複数のサーバ全体をE2E開通監視装置100と称してよい。
(実施の形態のまとめ)
本実施の形態により、第1の拠点と第2の拠点との間を接続する通信経路の監視を行う通信経路監視装置であって、前記通信経路が構築されるネットワーク上の所定のルータが観測点として設定されており、前記通信経路の確立の際に、前記第1の拠点から送信され、前記観測点が受信する経路広告メッセージに含まれる経路情報を前記観測点から取得するモニタリング手段と、前記モニタリング手段により取得した前記経路情報に基づいて、最適経路選択処理を行って、前記観測点における1つの経路情報を決定する最適経路選択手段と、前記観測点から、当該観測点において最適経路選択処理が実行された後の経路情報を取得する取得手段と、前記最適経路選択手段により決定された経路情報と、前記取得手段により取得された経路情報とを比較することにより、障害判定を実行する障害判定手段とを備える通信経路監視装置が提供される。
前記ネットワーク上に複数の観測点が設定されており、前記モニタリング手段は、例えば、複数の観測点の中に前記経路情報を取得できない観測点が有る場合に、Cプレーン障害が発生していると判定する。
前記障害判定手段は、前記比較の対象の2つの経路情報が一致しない場合に、当該経路情報に係る観測点においてDプレーンの障害被疑があると判定することとしてもよい。
前記障害判定手段により、前記観測点においてDプレーンの障害被疑があると判定された場合に、当該観測点からテストパケットを送信することにより経路診断を実行する経路診断手段を備えてもよい。
前記経路診断手段は、前記テストパケットの送信経路を、前記最適経路選択手段により決定された経路情報に基づいて決定することとしてもよい。
前記経路診断手段は、前記経路広告メッセージにより広告されるプレフィックス宛ての経路診断を行い、当該プレフィックス宛ての経路診断が不成功である場合に、前記観測点から前記プレフィックス宛ての経路におけるネクストホップの経路診断を実行することとしてもよい。
前記経路広告メッセージは、例えば、BGPのアップデートメッセージである。前記最適経路選択処理は、例えば、BGPのベストパス選択処理である
(実施の形態の効果等)
本実施の形態に係る技術では、例えば、複数通信事業者をまたがるマルチドメイン構成において、各ドメイン間での責任分界点に関わる観測点を定義して、その観測点における構成把握に必要な「障害検知−>解析情報収集−>解析分析−>原因特定」を行うことにより、迅速に、エンドエンド区間の障害を特定できる。
また、本実施の形態のE2E開通監視装置は、mpBGP/MPLS−VPNネットワーク構成を念頭においた構成情報収集・経路診断を行うことが可能である。すなわち、BGP情報のやりとりをオフライン的にモニタ監視/BGPベストパス計算して、実際の各観測点でのルーティング情報(RIB)と突合比較する。もしも、突合結果で差異が発見された場合には、経路診断機能と連携として包括的な障害箇所特定を行うことができる。
本実施の形態により、マルチドメインな閉域ネットワーク環境等において、ユーザ自ら開通設定を行った際に、万一、エンドエンド区間で障害が発生していて、開通設定が失敗してしまった場合にも、迅速に障害箇所を特定できるため、各NWオペレータ稼動が削減できる。NWオペレータは階層ネットワークで活用されている多種多様なプロトコル技術を習得していなくとも、簡易に原因特定が可能である。さらに、原因特定に関わる手作業による切り分け作業が不要なためオペミス防止も期待できるので原因特定精度も向上する。また、ユーザへの障害特定情報を迅速に開示できるため、競合他社のハイブリッドクラウドサービスとの差別化が期待できる。
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
100 E2E開通監視装置
110 BGPモニタリング部
111 BGPモニタ受信部
112 BGPアップデート情報抽出部
113 Cプレーン障害判定部
120 ルーティング情報チェック部
121 RIB情報抽出部
122 Dプレーン障害判定部
123 BGPベストパス計算部
130 経路診断部
131 テストパケット転送部
132 テストパケット受信部
133 Dプレーン障害判定部
140 データ格納部

Claims (11)

  1. 第1の拠点と第2の拠点との間を接続する通信経路の監視を行う通信経路監視装置であって、
    前記通信経路が構築されるネットワーク上の所定のルータが観測点として設定されており、前記通信経路の確立の際に、前記第1の拠点から送信され、前記観測点が受信する経路広告メッセージに含まれる経路情報を前記観測点から取得するモニタリング手段と、
    前記モニタリング手段により取得した前記経路情報に基づいて、最適経路選択処理を行って、前記観測点における1つの経路情報を決定する最適経路選択手段と、
    前記観測点から、当該観測点において最適経路選択処理が実行された後の経路情報を取得する取得手段と、
    前記最適経路選択手段により決定された経路情報と、前記取得手段により取得された経路情報とを比較することにより、障害判定を実行する障害判定手段と
    を備える通信経路監視装置。
  2. 前記ネットワーク上に複数の観測点が設定されており、前記モニタリング手段は、複数の観測点の中に前記経路情報を取得できない観測点が有る場合に、Cプレーン障害が発生していると判定する
    請求項1に記載の通信経路監視装置。
  3. 前記障害判定手段は、前記比較の対象の2つの経路情報が一致しない場合に、当該経路情報に係る観測点においてDプレーンの障害被疑があると判定する
    請求項1又は2に記載の通信経路監視装置。
  4. 前記障害判定手段により、前記観測点においてDプレーンの障害被疑があると判定された場合に、当該観測点からテストパケットを送信することにより経路診断を実行する経路診断手段
    を備える請求項3に記載の通信経路監視装置。
  5. 前記経路診断手段は、前記テストパケットの送信経路を、前記最適経路選択手段により決定された経路情報に基づいて決定する
    請求項4に記載の通信経路監視装置。
  6. 前記経路診断手段は、前記経路広告メッセージにより広告されるプレフィックス宛ての経路診断を行い、当該プレフィックス宛ての経路診断が不成功である場合に、前記観測点から前記プレフィックス宛ての経路におけるネクストホップの経路診断を実行する
    請求項4又は5に記載の通信経路監視装置。
  7. 前記経路広告メッセージは、BGPのアップデートメッセージである
    請求項1ないし6のうちいずれか1項に記載の通信経路監視装置。
  8. 前記最適経路選択処理は、BGPのベストパス選択処理である
    請求項1ないし7のうちいずれか1項に記載の通信経路監視装置。
  9. 請求項1ないし8のうちいずれか1項に記載の通信経路監視装置と、前記ネットワークとを含む通信システム。
  10. コンピュータを、請求項1ないし8のうちいずれか1項に記載の通信経路監視装置における各手段として機能させるためのプログラム。
  11. 第1の拠点と第2の拠点との間を接続する通信経路の監視を行う通信経路監視装置が実行する障害判定方法であって、
    前記通信経路が構築されるネットワーク上の所定のルータが観測点として設定されており、前記通信経路の確立の際に、前記第1の拠点から送信され、前記観測点が受信する経路広告メッセージに含まれる経路情報を前記観測点から取得するモニタリングステップと、
    前記モニタリングステップにより取得した前記経路情報に基づいて、最適経路選択処理を行って、前記観測点における1つの経路情報を決定する最適経路選択ステップと、
    前記観測点から、当該観測点において最適経路選択処理が実行された後の経路情報を取得する取得ステップと、
    前記最適経路選択ステップにより決定された経路情報と、前記取得ステップにより取得された経路情報とを比較することにより、障害判定を実行する障害判定ステップと
    を備える障害判定方法。
JP2015083594A 2015-04-15 2015-04-15 通信経路監視装置、通信システム、障害判定方法、及びプログラム Active JP6460893B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015083594A JP6460893B2 (ja) 2015-04-15 2015-04-15 通信経路監視装置、通信システム、障害判定方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015083594A JP6460893B2 (ja) 2015-04-15 2015-04-15 通信経路監視装置、通信システム、障害判定方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2016208092A true JP2016208092A (ja) 2016-12-08
JP6460893B2 JP6460893B2 (ja) 2019-01-30

Family

ID=57490384

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015083594A Active JP6460893B2 (ja) 2015-04-15 2015-04-15 通信経路監視装置、通信システム、障害判定方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6460893B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022525205A (ja) * 2019-03-20 2022-05-11 新華三技術有限公司 異常ホストのモニタニング

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010057158A (ja) * 2008-07-31 2010-03-11 Kddi Corp 経路障害箇所推定装置及びコンピュータプログラム
JP2010161524A (ja) * 2009-01-07 2010-07-22 Kddi Corp 経路制御プロトコルに基づく障害リンク検出方法、ノード装置及びプログラム
JP2013012881A (ja) * 2011-06-29 2013-01-17 Nippon Telegr & Teleph Corp <Ntt> 経路監視装置、経路監視方法及び経路監視プログラム
JP2013528337A (ja) * 2010-06-11 2013-07-08 アルカテル−ルーセント ルーティング情報ベースの改良された更新のための方法およびルータ
US20140181292A1 (en) * 2012-12-20 2014-06-26 Dell Products L.P. Systems and methods for topology discovery and application in a border gateway protocol based data center

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010057158A (ja) * 2008-07-31 2010-03-11 Kddi Corp 経路障害箇所推定装置及びコンピュータプログラム
JP2010161524A (ja) * 2009-01-07 2010-07-22 Kddi Corp 経路制御プロトコルに基づく障害リンク検出方法、ノード装置及びプログラム
JP2013528337A (ja) * 2010-06-11 2013-07-08 アルカテル−ルーセント ルーティング情報ベースの改良された更新のための方法およびルータ
JP2013012881A (ja) * 2011-06-29 2013-01-17 Nippon Telegr & Teleph Corp <Ntt> 経路監視装置、経路監視方法及び経路監視プログラム
US20140181292A1 (en) * 2012-12-20 2014-06-26 Dell Products L.P. Systems and methods for topology discovery and application in a border gateway protocol based data center

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022525205A (ja) * 2019-03-20 2022-05-11 新華三技術有限公司 異常ホストのモニタニング
JP7228712B2 (ja) 2019-03-20 2023-02-24 新華三技術有限公司 異常ホストのモニタニング

Also Published As

Publication number Publication date
JP6460893B2 (ja) 2019-01-30

Similar Documents

Publication Publication Date Title
AU2021200243B2 (en) Systems and methods for an interactive network analysis platform
EP3175579B1 (en) Systems and methods for network management
US9729414B1 (en) Monitoring service availability using distributed BGP routing feeds
CN102820984B (zh) 自动网络拓扑结构检测和建模
EP2081321A2 (en) Sampling apparatus distinguishing a failure in a network even by using a single sampling and a method therefor
CN106130761B (zh) 数据中心的故障网络设备的识别方法和装置
US8089897B2 (en) VPN intelligent route service control point trouble diagnostics
US11595483B2 (en) Devices, systems and methods for internet and failover connectivity and monitoring
JP7416919B2 (ja) データ処理方法及び装置並びにコンピュータ記憶媒体
US11509552B2 (en) Application aware device monitoring correlation and visualization
WO2006046309A1 (ja) 通信ネットワークにおける障害発生箇所を特定する装置および方法
US11032124B1 (en) Application aware device monitoring
CN108512699B (zh) 区块链业务服务器数据异常检测方法、设备及区块链系统
US9210046B2 (en) Zone-based network traffic analysis
JP6460893B2 (ja) 通信経路監視装置、通信システム、障害判定方法、及びプログラム
JP2010114657A (ja) 通信経路検出方法、通信経路検出プログラム、および通信経路検出装置
US11765059B2 (en) Leveraging operation, administration and maintenance protocols (OAM) to add ethernet level intelligence to software-defined wide area network (SD-WAN) functionality
JP3725146B2 (ja) 通信ネットワーク管理装置及び通信ネットワークの疎通確認試験方法
Di Bartolomeo et al. Discovering high-impact routing events using traceroutes
CN108092843B (zh) 一种路由器通用测试方法
Almehmadi The State of the Art in Internet Topology Discovery
CN116264558A (zh) 云专线质量监测方法、装置、设备以及计算机存储介质
Wennerhult Evaluating high availability in the enterprise network: Case study at Stora Enso Pulp Mill AB
KR20100043554A (ko) 네트워크 연결 관계 제공 시스템 및 방법
Stewart CCNP Tshoot 642-832 Quick Reference

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181225

R150 Certificate of patent or registration of utility model

Ref document number: 6460893

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250