JP5105327B2 - オーバレイノード、該オーバレイノードを備えたオーバレイネットワークおよびオーバレイルーティング方法とそのためのプログラム - Google Patents

オーバレイノード、該オーバレイノードを備えたオーバレイネットワークおよびオーバレイルーティング方法とそのためのプログラム Download PDF

Info

Publication number
JP5105327B2
JP5105327B2 JP2007155014A JP2007155014A JP5105327B2 JP 5105327 B2 JP5105327 B2 JP 5105327B2 JP 2007155014 A JP2007155014 A JP 2007155014A JP 2007155014 A JP2007155014 A JP 2007155014A JP 5105327 B2 JP5105327 B2 JP 5105327B2
Authority
JP
Japan
Prior art keywords
overlay
node
nodes
routing table
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007155014A
Other languages
English (en)
Other versions
JP2008311715A (ja
Inventor
聡 亀井
剛 長谷川
村田  正幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Osaka University NUC
Original Assignee
Nippon Telegraph and Telephone Corp
Osaka University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Osaka University NUC filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007155014A priority Critical patent/JP5105327B2/ja
Publication of JP2008311715A publication Critical patent/JP2008311715A/ja
Application granted granted Critical
Publication of JP5105327B2 publication Critical patent/JP5105327B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、非常時の通信を確保するためのオーバレイネットワーク技術に係り、特に、低コストで、従来の膨大なコストをかけたネットワークと同様の耐性を持たせることを可能にするオーバレイノード(オーバレイルーティング装置)、該オーバレイノード(オーバレイルーティング装置)を備えたオーバレイネットワークおよびオーバレイルーティング方法とそのためのプログラムに関する。
従来は、情報ネットワークにリンク・ノード障害が発生し、単一機器や複数の機器を含むエリアが通信不可能になる場合に対応するために、機器やリンク、およびそれらを制御するソフトウェアを冗長化し、障害発生時に冗長系へ切り替えるようにした手法を採用していた。この手法において重要となるのは制御コストと性能のトレードオフであり、既存研究の多くはこの点に着目していた。
そのため、大規模災害やテロ、大規模停電などによって引き起こされる大規模なネットワーク障害に対しては、発生確率が小さいにもかかわらずコストが大幅に増大するため、対応が極めて困難となる(非特許文献1,2参照)。
また、従来のネットワークの高信頼化を目指した研究のほとんどは障害発生モデルとして単一障害を想定している。一方、大規模災害、テロ、ルータソフトウェア(OS)の不具合などによって発生すると考えられる、複数の構成要素が同時に故障するような大規模かつ面的なネットワーク障害に関する研究はほとんど行われていなかった。
また、IP(Internet Protocol)ネットワークに対する同種の研究も少ない。その理由として、IPそのものが軽度の障害発生に対しては代替経路の発見が比較的短時間に行われることが挙げられる。しかし、インターネットのAS(Autonomous System)間経路制御を行っているBorder Gateway Protocol(BGP)は、障害が大規模である場合や、ある特定のトポロジ環境においては、障害発生時のネットワーク接続性が低下し、代替経路発見および経路の収束に非常に長い時間(数分〜数時間)を必要とすることが指摘されている(非特許文献3,4参照)。
そもそもBGPには、経路収束にかかる時間の理論的上限は存在しない。そのため、BGPの経路収束時間を改善するための様々な手法が提案されている(例えば、非特許文献5,6参照)が、そのほとんどはBGPやTCP/IPそのものの改変を必要とするため、導入には標準化作業が必要となり、現在のインターネットへの適用は困難であると考えられる。
また、AS(Autonomous System)間リンクには、トランジットリンクやピアリングリンクなどのコスト構造が異なるリンクが存在し、各ISPはそれらの経済的コストや政治的思惑を考慮してトラヒックの経路制御を行っている(非特許文献7,8参照)。そのため、結果として得られる経路はエンド間遅延時間などの性能指標の面では必ずしも最適ではない(非特許文献9,10参照)。また、このことは、大規模ネットワーク障害の発生などの非常時におけるネットワーク接続性にも影響を与える。
IPネットワーク上に論理ネットワークを構築するオーバレイネットワーク技術は現在様々なアプリケーション(ファイル交換、音声通話、IP−VPN、コンテンツ配信など)で用いられ、サービスオーバレイネットワークと呼ばれている(非特許文献11参照)。
ここでオーバレイルーティングについて説明する。
オーバレイネットワークとは、下位層ネットワークであるIPネットワークの上に独自の論理ネットワークを構築するものであり、例えばP2Pネットワーク、Gridネットワーク、IP−VPNサービスなどが挙げられる。これらのアプリケーションは、ある特定のサービスを前提として論理ネットワークを構築する。
また、それぞれのアプリケーションのポリシーにしたがってアプリケーショントラヒックの制御を行う。例えば、P2Pのファイル交換ネットワークは、コンテンツの所在場所に応じてダウンロードホストや中継ホストを選択する。
さらに、特定のアプリケーションを前提とせず、トラヒックのルーティングそのものを目的(アプリケーション)とするオーバレイルーティングと呼ばれる技術も登場しつつある。例えばResilient Overlay Network(以下、単にRONという)では、参加ノード間の伝送遅延時間やパケット廃棄率などを計測し、あるノード間のデータ転送を直接行うのか、他のオーバレイノードを経由して行うのかを判断している(非特許文献12参照)。これにより、IPネットワークでのルーティングと比較して効率の良いデータ転送を実現し、またIPネットワークの障害をすばやく検知し、迂回経路を選択することが可能である。
この技術を非常時通信に適用し、RONのノードを各ISP(AS)に配置しオーバレイルーティングを行うことで、下位層のIPネットワークを変更することなく、ネットワーク障害発生時にすばやく経路切り替えを実現する手法を実現することができると考えられる。
しかし、RONは参加しているノード間でフルメッシュに計測および情報交換を行うため、計測オーバヘッドが大きく、数十ノード程度しか参加できないとされている(非特許文献13参照)。したがって、このまま非常時通信に適用すると、参加できるISP(AS)数が限定されてしまう。また、迂回経路として2ホップ経路、すなわち、送信ノードと受信ノードの間に1つだけ中継ノードを挟む経路のみを考慮している。これは、エンド間遅延時間や空き帯域の観点では、3ホップ以上の経路を選択することによるメリットは大きくないためである。しかし、非常時通信において最も重要となるのは接続性そのものであるため、接続性を確保するために3ホップ以上の経路を用いることは重要である。
村田正幸 "サービスオーバレイによるネットワークの高信頼化"電子情報通信学会総合大会(BT-1-5), Mar. 2005 亀井聡、"Interop Tokyo 2006 W02 インターネット計測技術の進展とその応用「6.オーバーレイネットワークへの計測技術の応用」"[online]、[平成19年5月30日検索]、インターネット<URL:http://infonet.cse.kyutech.ac.jp/net_design_rc/interop06/W02_6_kamei.pdf> C. Labovitz, A. Ahuja, A. Abose, and F. Jahanian, "Delayed Internet routing convergence," in Proceedings of ACMSIGCOMM 2000, Aug. 2000. B. Zhang, D. Massey, and L. Zhang, "Destination reachability and BGPconvergence time," in Proceedings of GLOBECOM 2004, Apr. 2004. C. Labovitz, A. Ahuja, R. Wattenhofer, and S. Venkatachary, "The impact of Internet policy and topology on delayed routing convergence," in Proceedings of INFOCOM 2001, Dec. 2001. Dan Pei and Matt Azuma and Nam Nguyen and Jiwei Chen and Dan Massey and Lixia Zhang, "BGP-RCN: Improving BGPconvergence through root cause notification," Tech. Rep. TR-030047, UCLA CSD, Oct. 2003. William Norton, "Internet service providers and peering." [online]、[平成19年5月30日検索]、インターネット<http://www.equinix.com/pdf/whitepapers/PeeringWP.2.pdf.> William Norton, "A buisness case for peering." [online]、[平成19年5月30日検索]、インターネット<http://www.equinix.com/pdf/whitepapers/Business_case.pdf.> Y.Zhu, C. Dovrolis, and M. Ammar, "Dynamic overlay routing based on available bandwidth estimation: A simulation study," Computer Networks Journal, vol. 50, pp. 739876, Apr. 2006. D. G. Andersen, A. C. Snoeren, and H. Balakrishnan, "Bestpath vs. multi-path overlay routing," in Proceedings of ACM SIGCOMM conference on Internet measurement, pp. 91100, Oct. 2003. Z. Duan, Z.-L. Zhang, and T. Hou, "Service overlay networks : SLAs, QoS and bandwidth provisioning," in Proceedings of IEEE ICNP 2002, Nov. 2002. D. G. Andersen, H. Balakrishnan, M. F. Kaashoek, and R. Morris, "Resilient overlay networks," in Proceedings of 18th ACM Symposium on Operating Systems Principles, Oct. 2001. A. Nakao, L. Peterson, and A. Bavier, "Scalable routing overlay networks," ACM SIGOPS Operating Systems Review, vol. 40, pp. 4961, Jan. 2006.
非常時通信における問題点
大規模災害、テロなどの発生によって、情報ネットワークにおいても障害が広範囲に渡って発生する。また、ルータを制御しているソフトウェア(OS)の不具合によって、同時に多数のルータ動作が不良となることも考えられる。このような非常時における通信において求められるのは、ネットワーク接続性のすばやい回復および重要通信の優先的処理である。
本発明において着目している前者に関しては、多くの研究が行われているが、それらのほとんどにおいては単一障害、すなわち、ネットワークの構成要素の障害は同時には1つしか発生しないことが前提とされている。つまり、発生し得る障害をあらかじめ想定し、想定した障害に対して効率の良い手法が検討されている。したがって、一般的にそれらの手法は大規模かつ面的に発生するネットワーク障害に対しては有効ではない。
また、障害発生時の対応を含むネットワーク制御においては、コストと性能のトレードオフが重要となる[1]。このとき、非常時通信は大規模ネットワーク障害という発生確率の小さい事象に対するために必要となるため、コストが非常に大きくなる。MPLSネットワークにおいて装置故障が発生した際に早期にデータ転送を復旧するネットワークアーキテクチャも提案されているが、ネットワークを現用面と予備面の2つ用意する必要があり、その導入コストは非常に大きいと考えられる。そのため、低コストで運用可能なアーキテクチャが求められる。
一方、現在のインターネットにおいてAS間の経路制御を司っているBGPが、大規模な障害発生時やフルメッシュ構造などの特殊なトポロジ環境において不安定であることが近年指摘されている。この問題に対する改善案も多数提案されているが、それらはBGPそのものやルータの改変を必要とするため、その導入には標準化作業が必要となり、非常に長い時間かかる。
さらに、ISP(Internet Service Provider)間の接続性を提供するリンクには、上位ISPからインターネット全体への接続性の提供を受けるためのトランジットリンクや、同程度の規模のISP間でトラヒックのやりとりを行うためのピアリングリンクなど、経済的コスト構造が異なるリンクが存在する。各ISPはそれらのコスト構造に加えて政治的思惑なども考慮し、BGPを用いることによって経路制御を行っている。
図6は、このことが、非常時におけるネットワーク接続性に影響を与える例を示す図である。
同図に示すように、ISP2−ISP4はISP1との間にトランジットリンクを持ち、インターネット全体への接続性を確保している。さらにISP2とISP3間およびISP3とISP4間にはピアリングリンクが存在する。ピアリングリンクには、通常、接続されている2つのISPを始点および終点とするトラヒックのみが流れる。
すなわち、ISP2からISP4への通信はトランジットリンクおよびISP1を経由して行われ、ISP2からISP3への通信はピアリングリンクを用いて行われる。
この時、ISP1に障害が発生し、トランジットリンクの全てが利用できなくなる状況を考える。この時、ネットワークトポロジとしてはISP1とISP3間にピアリングリンクを2段経由する経路が存在するが、実際に用いることはできない。
これは、ISP1とISP2間のピアリングリンクは始点や終点がISP3であるトラヒックは通過できず、さらにISP2とISP3間のピアリングリンクは始点や終点がISP1であるトラヒックは通過できないためである。
この問題を解決し、非常時通信において接続性を向上させるためには、非常時にはルーティング設定を変更して複数のピアリングリンクを経由するような経路も利用可能にする必要がある。しかし、そのためにはBGP設定を注意深く行う必要があり、非常時の設定変更には通常ISPのオペレータ同士の折衝が必要となるため、実現は困難であると考えられる。
以上説明したように、大規模な災害・テロなどの非常時における情報通信網の耐性を高める方法としては、従来、ネットワーク機器や回線の冗長化を中心とした技術開発が進められているが、この方法は設置・維持コストが膨大になるという欠点を有している。
また、IP(Internet Protocol)ネットワークはネットワーク障害や構成変更に対して柔軟に対応する能力を有しているが、復旧に数分〜数十分以上必要となる場合が存在し、迅速な復旧が見込めない場合があるという欠点を有している。
さらに、オーバレイネットワークを利用して障害発生時に代替経路を発見する手法は従来も存在していたが、経路制御のために必要となる情報交換量が非常に多いため、20−30程度のノードしか参加できないのが現状である。
このように、従来技術においては、設置・維持コストが膨大になる、復旧に数分〜数十分以上必要となる場合が存在し、迅速な復旧が見込めない場合がある、膨大なノードに適用できない、などの問題がある。
そこで、本発明は、上記問題を解消し、非常に少ないコストで従来と同程度の耐性を可能にするオーバレイルーティング装置、該オーバレイルーティング装置を備えたオーバレイネットワークおよびオーバレイルーティング方法とそのためのプログラムを提供することである。
本発明は、上記目的を達成するために、次のような構成を採用している。以下、請求項毎の構成を記す。
a)請求項1記載のオーバレイノード(オーバレイルーティング装置)は、インターネットサービスプロバイダ(ISP)の隣接するインターネットサービスプロバイダとの間に設けられる対外接続リンク毎に設置され、ネットワークに部分的障害が発生した場合に、障害以外の部分により対外接続を維持するようにルーティングすることを特徴としている。
b)さらに、前記オーバレイノードが、パケット転送手段(実施例におけるパケット転送部に相当)と、オーバレイルーティングテーブル管理手段(実施例におけるオーバレイルーティングテーブル管理部に相当)と、NW障害判定手段(実施例におけるNW障害判定部に相当)と、オーバレイNW管理手段(実施例におけるオーバレイNW管理部に相当)とを備え、前記パケット転送手段は、通過するパケットの宛先に応じて、前記オーバレイルーティングテーブル管理手段が管理するオーバレイルーティングテーブルに基づいて、転送先のノードを決定し、該決定したノードにパケットを転送する手段であり、前記オーバレイルーティングテーブル管理手段は、前記NW障害判定手段からネットワーク障害に関する情報を受け取り、オーバレイルーティングテーブルを作成/更新する手段であり、前記NW障害判定手段は、オーバレイネットワークに参加している他ノードの間で定期的に生死確認用のパケットを交換することによって、他ノードへの到達性(Connectivity)を把握し、ネットワークの一部に障害が発生し、他ノードへの到達性が失われた場合には、その旨の情報をオーバレイルーティングテーブル管理手段へ通知する手段であり、前記オーバレイNW管理手段は、オーバレイネットワークに新たなノードの参加や離脱があった場合に、そのノードから情報を受け取り、参加しているノード全ての情報(IPアドレス、設置ISP)を管理するとともに、ノードの増減情報をオーバレイルーティングテーブル管理手段へ通知する手段であることを特徴としている。
c)請求項2記載の発明は、前記設置されたノードのNW障害判定手段が生死を確認する他ノードは、通常のIPルーティング時にパケットが装置を通過する宛先を持つノードに限定することを特徴とし、請求項3記載の発明は、前記オーバレイルーティングテーブルが、送信側ノード番号と受信側ノード番号間における到達性情報(Connectivity)とタイムスタンプ(Timestamp)を保持するテーブルであることを特徴としている。
d)請求項4記載のオーバレイネットワークは、請求項1からのいずれかに記載のオーバレイノードを具備することを特徴としている。
e)請求項5記載の発明は、インターネットサービスプロバイダ(ISP)の隣接するインターネットサービスプロバイダとの間に設けられる対外接続リンク毎に設置され、ネットワークに部分的障害が発生した場合に、障害以外の部分により対外接続を維持するための、パケット転送手段,オーバレイルーティングテーブル管理手段,NW障害判定手段およびオーバレイNW管理手段からなるオーバレイノードを用いたオーバレイルーティング方法であって、前記NW障害判定手段が、他ノードとの間で定期的に生死確認用のパケットを交換することにより他ノードへの到達性を把握し、障害などにより他ノードへの到達性が失われた場合には、その旨の情報をオーバレイルーティングテーブル管理手段に通知するステップと、前記オーバレイルーティングテーブル管理手段が、前記NW障害判定手段からの情報によりオーバレイルーティングテーブルを作成/更新し、パケット通過時には適切な宛先ノードアドレスをパケット転送手段へ通知するステップと、前記パケット転送手段が、前記オーバレイルーティングテーブル管理手段から通知された宛先ノードアドレスを有するノードへパケットを転送するステップとからなることを特徴としている。
f)請求項6記載の発明は、前記パケット転送手段へ通知される適切な宛先ノードアドレスとは、ルート上のノードに障害がなく直接到達可能の場合はそのままのノードアドレスであり、直接到達可能でなければ他のノードを経由することによって到達可能となるルートをオーバレイルーティングテーブルで探索し、該探索された該他のノードのノードアドレスであることを特徴としている。
g)請求項7記載のプログラムは、コンピュータを、請求項1から3のいずれかに記載のオーバレイノードにおけるパケット転送手段,オーバレイルーティングテーブル管理手段,NW障害判定手段およびオーバレイNW管理手段として機能させるためのプログラムである。

本発明によれば、対外接続リンク毎にオーバレイノードを設置することによって、ISPネットワークを分割して管理することになるため、部分的にISPネットワークに障害が発生した場合においても、残りのネットワークおよびノードを用いて通信を継続することが可能となる。
また、対外接続リンク毎にノードを設置し、生死確認を行なう他ノードを分担することによって、情報交換量を削減することが可能となり、これにより、ルーティングテーブルの更新に必要な、他ノードの生死確認のために送受信するパケット量を1/10〜1/100程度に削減することができる。
従来、膨大なコストをかけて冗長化を行い、ネットワーク障害への対応を行っている情報通信ネットワークに対して、本発明によれば、非常に少ないコストで同程度の耐性を持たせることが可能である。
また、本発明によれば、オーバレイノードは少ない台数から導入することが可能であり、台数が増えるたびにネットワーク障害に対する耐性が増加するため、いわゆるスモールスタートが可能である。
また、本発明によれば、インターネットへの適用で従来ネックとなっている標準化作業が必要なく、適切なレベルの非常時通信を実現することができる。
本発明によれば、インターネットを構成する複数のAS(Autonomous System;自律システム:本発明のISP)が本技術を用いたオーバレイノード(オーバレイルーティング装置)をそれぞれのネットワーク内に設置すると、参加したAS(ISP)間のトラヒックが、大規模なネットワーク障害の発生時にも通信可能となる可能性を格段に高めることが可能となる。
以下、本発明に係るオーバレイノード(オーバレイルーティング装置;単にノードともいう)の実施例を、図面を用いて詳細に説明する。
本発明における非常時オーバレイには、ASやISPなどの単位に相当する、ある程度の大きさを持ったネットワーク単位で参加することを前提としている。以下の説明ではISP単位で参加することを仮定する。また、本発明の核となるオーバレイノードは、ISPが他ISPとの間に持つ対外接続リンクが接続されているルータ上に設置される。
これは、図1−Aに示すように、各ISPに1つずつオーバレイノードを設置すると、ISPがネットワーク障害によって部分的に通信不可能になりオーバレイノードがそれに含まれた場合に、残った部分も通信不可能(×印で示す)となってしまうためである。一方、図1−Bのように対外リンク毎にオーバレイノードを設置することによって、部分的障害が発生した場合においても、残った部分がオーバレイルーティングによって対外接続を維持することができる(○印で示す)。
図1−Cは、本発明に係るオーバレイノード(オーバレイルーティング装置)の設置場所を説明するために1つのリンクの部分を示した図である。同図において、10は本発明に係るオーバレイノード(オーバレイルーティング装置)、20は対外接続ルータを示している。
本発明に係るオーバレイノードは、図1−Cに示すように、各インターネットサービスプロバイダ(ISP;Internet Service Provider)の隣接プロバイダへの対外接続リンク部分に設置される。
図2は、9つのISPから構成されるIPネットワークおよびオーバレイノード設置例を示す図である。本例では、各ISPの対外接続リンク部分に26個のオーバレイノードが存在し、これらがフルメッシュにオーバレイリンクを設定し、オーバレイネットワークを構築している。
同図において、ISP1〜ISP9はインターネットサービスプロバイダであり、1−1〜9−3は本発明に係るオーバレイノード(オーバレイルーティング装置)である。一例を示すと、オーバレイノード1−1〜1−4はISP1とISP2、ISP3、ISP4、ISP5への対外接続リンクとの間に設けられたオーバレイルーティング装置である。なお、同図において、異なるISPのオーバレイノード間の太い線はトランジットリンクを示し、細い線はピアリングリンクを示している。
設置された各オーバレイノードは、他ISPに設置されたオーバレイノードとの間で到達性を確認すると共にオーバレイルーティングテーブル(以下、単にORT(Overlay Reachability Table)と表記することもある)の交換を行い、参加しているオーバレイノード間のフルメッシュ到達性情報を取得する。ネットワーク障害が発生した場合には、自身が保持しているORTに基づいてトラヒックを運ぶ経路を決定する。
図3は、本発明に係るオーバレイノード(オーバレイルーティング装置)の構成図である。
本発明に係るオーバレイノード(オーバレイルーティング装置)10は、図3に示すように、パケット転送部11、オーバレイルーティングテーブル管理部12、NW(Network)障害判定部13、オーバレイNW(Network)管理部14を具備しており、オーバレイルーティングテーブル管理部12には、各ノード間における到達性を管理するためのオーバレイルーティングテーブル(ORT)121を備えている。
次に、パケット転送部11、オーバレイルーティングテーブル管理部12、NW障害判定部13、オーバレイNW管理部14のそれぞれの機能を説明する。
(1)パケット転送部11の機能
パケット転送部11は、通過するパケットの宛先に応じて、オーバレイルーティングテーブル管理部12が管理するオーバレイルーティングテーブル121に基づいて、転送先のノードを決定し、該決定したノードにパケットを転送する。
(2)オーバレイルーティングテーブル管理部12の機能
オーバレイルーティングテーブル管理部12は、NW障害判定部13からネットワーク障害に関する情報を受け取り、オーバレイルーティングテーブル121を作成/更新する。
図4は、オーバレイルーティングテーブル(ORT)121の一実施例を示す図である。同図に示すように、オーバレイルーティングテーブル121は、送信側ノード番号と受信側ノード番号間における到達性情報(Connectivity)とタイムスタンプ(Timestamp)をNW障害判定部13からの到達性情報に基づいて作成/更新されるテーブルである。
テーブルのエントリ(i,j)には、オーバレイノードiのNW障害判定部13が計測したオーバレイノードjへの到達性情報と、計測した時刻あるいは送信側ノードが到達性を確認した時刻を表すタイムスタンプが含まれる。到達性情報は、一般的にはオーバレイノード間の計測によって得ることのできるパケット廃棄率、空き帯域、伝播遅延時間などが含まれるが、最も単純な場合は1ビットで表わされ、0=到達可能、1=到達不可能とすることができる。
したがって、エントリ(i,j)とエントリ(j,i)は共にオーバレイノードi,j間の到達性情報を示すが、計測を行った主体が異なる。
本テーブルは、各オーバレイノードは非常時オーバレイに参加している全てのノード間の到達性情報を把握し、ネットワーク障害発生時に代替経路を発見するために用いる。そのためには、自ノード以外の全てのノードとの到達性情報を計測によって獲得するとともに、それを他ノードと交換することが必要となる。
オーバレイルーティングテーブル管理部12は、パケット通過時には適切な宛先ノードのアドレスをパケット転送部11へ通知する。すなわち、通過するパケットの宛先アドレスに対応する宛先ノードに到達可能である場合には、パケットをそのまま転送する。直接到達可能でない場合には、オーバレイルーティングテーブル121を探索し、他のノードを経由することによって到達可能となるノードを求め(一般的にオーバレイルーティングテーブルを用いて迂回可能なルートを求める方法は従来周知であるので説明は省略する)、該求めたノードへパケットを転送する。
(3)NW障害判定部13の機能
オーバレイネットワークに参加している他ノードの間で定期的に生死確認用のパケットを交換することによって、他ノードへの到達性(Connectivity)を把握する。ネットワークの一部に障害が発生し、他ノードへの到達性が失われた場合には、その旨の情報をオーバレイルーティングテーブル管理部12へ通知する。
設置されたノードが生死を確認する他ノードは、通常のIPルーティング時にパケットが装置を通過する宛先を持つノードに限定する。ISPは自身が持つ対外接続リンク全てにノードを設置することで、全ての他ノードの生死確認を行ない、自ISPに設置したノード間で定期的に情報を交換することで、自ISP内の全てのノードが他ノードの生死情報を把握することが可能となる。
(4)オーバレイNW管理部14の機能
オーバレイネットワークに新たなノードの参加や離脱があった場合に、そのノードから情報を受け取り、参加しているノード全ての情報(IPアドレス、設置ISP)を管理する。またノードの増減情報はオーバレイルーティングテーブル管理部12へ通知することによって、オーバレイルーティングテーブル121の更新を促す。
図5は、本実施例におけるオーバレイノードの処理の流れを示す図である。以下、図5を用いて、本実施例の処理、特にNW障害判定部13、オーバレイルーティングテーブル管理部12、パケット転送部11の処理を説明する。
まず、NW障害判定部13は、他ノードとの間で定期的に生死確認用のパケットを交換することにより他ノードへの到達性を把握しており、障害などにより他ノードへの到達性が失われた場合には、その旨の情報をオーバレイルーティングテーブル管理部12へ通知する(ステップS101)。
オーバレイルーティングテーブル管理部12は、NW障害判定部13からの情報によりオーバレイルーティングテーブル121(図4参照)を作成/更新し、パケット通過時には適切な宛先ノードアドレスをパケット転送部11へ通知する(ステップS102)。
すなわち、ルート上のノードに障害がなく直接到達可能であればそのままのノードアドレスを宛先ノードアドレスとしてパケット転送部へ通知し、直接到達可能でなければ他のノードを経由することによって到達可能となるルートをオーバレイルーティングテーブル121で探索し、検索された該他のノードのノードアドレスを宛先ノードアドレスとしてパケット転送部11へ通知する。
パケット転送部11は、オーバレイルーティングテーブル管理部12から通知された宛先ノードアドレスを有するノードへパケットを転送する(ステップS103)。
次に、到達性の計測とテーブル交換方法、経路探索手法、およびISPの参加および離脱方法について詳しく説明する。
まず、オーバレイノード間の到達性計測とテーブル交換について説明する。
前述のように、各ISPの対外接続リンクごとにオーバレイノードを設置すると、非常時オーバレイに参加するISPに比べてオーバレイノード数が増加するため、参加するISP数に対するスケーラビリティが低下する。
特に、RONと同様のフルメッシュ計測およびテーブル交換を行う場合、RONが良好に動作する規模が50ノード程度であることを考慮すると、非常時オーバレイに参加することのできるISP数は10程度に抑えられる。
そこで本実施例においては、計測およびテーブル交換を行う他ISPのオーバレイノード群を、ISP内に設置された各オーバレイノードで分割することによって、オーバヘッドを削減し、より多くのISPが参加できるようにする。
具体的には、他ISPに設置されたオーバレイノードそれぞれに対して、自ISPからそのノードへのIPルーティング情報を参照し、自ISPが持つ対外接続リンクのうち、どのリンクから送出されるのかを調べ、そのリンクに設置されたオーバレイノードが担当するものとする。これは、自ISP内に設置された複数のオーバレイノードを仮想的に1つのオーバレイノードとみなし、他ノードとの間の到達性の計測とテーブル交換を行うことに相当する。
ノード間の到達性確認は、ノード間にTCPコネクションを確立することで行う。その際、確立したTCPコネクションを用いてお互いが持つORTを送ることによって、テーブル交換を行う。
さらに、他ノードから獲得したORTと自身が持つORTの各エントリのタイムスタンプを比較し、新しいものがあれば自身のORTのエントリを更新する。
その後、自ISP内のオーバレイノード同士でフルメッシュにORTの交換を行い、到達性情報の共有を行う。これにより、自ISP内の全てのオーバレイノードが、他の全てのオーバレイノードへの到達性情報を持つことができる。
図2のISP2を例にとると、ISP2内のオーバレイノード2−1〜2−5は、それぞれ下記に示すノードとの間で到達性計測とテーブル交換を行う。
(a)オーバレイノード2−1⇔オーバレイノード1−1〜1−4,3−1〜3−4,4−1,4−2,5−1,5−2
(b)オーバレイノード2−2⇔オーバレイノード8−1
(c)オーバレイノード2−3⇔オーバレイノード7−1,7−2
(d)オーバレイノード2−4⇔オーバレイノード6−1,6−2,6−3
(e)オーバレイノード2−5⇔オーバレイノード9−1,9−2,9−3
この場合、ISP2内のオーバレイノードが行う通信回数は31回となる。一方、この分割を行わず全てのオーバレイノードがフルメッシュに到達性確認およびテーブル交換を行う場合は125回となる。
次に、経路探索について説明する。
各オーバレイノードは、上述した到達性確認およびテーブル交換によって得られた最新のORTに基づいて、周知のダイクストラ法に基づいて各ノードへの経路探索を行う。一般にダイクストラ法はノード数の2乗の計算時間がかかるが、障害が発生していない部分はフルメッシュにオーバレイリンクが存在するため、実際の計算量は小さいと考えられる。
この手法により、RONと同様に、2ホップパス(送信ノードと受信ノードの間に1つの中継ノードを経由させる経路)は固定時間で見つけることができる。3ホップ以上のパスに関しては前述したテーブル交換の順序に依存するが、最悪の場合でも(ホップ数−1)と固定時間の積で発見可能である。BGPによるルーティング情報の伝播もホップ数に比例した時間が必要となるが、BGPは隣接ルータに更新情報を伝えるのに対して、提案手法はフルメッシュに張られたオーバレイパスを用いてテーブルを伝播させるため、BGPに比べて短時間でルーティング情報の伝播が可能となる。
さらに、本方式を用いることで、ネットワーク障害発生時に通常は取得できない情報を取得することができる。図2においてISP2に部分的なネットワーク障害が発生し、ノード2−3、2−4および2−5が設置されている3本の対外リンクが不通になった場合を想定する。
この場合、ノード5−1からノード6−3およびノード7−1へは通常のIPルーティングでは到達不可能となるため、ノード6−3とノード7−1間の接続性に関する情報を直接獲得することができない。しかし、(1)ノード6−1とノード9−3の間のテーブル交換、(2)ISP9内でのテーブル共有、(3)ノード9−1とノード3−3の間のテーブル交換、(4)ノード5−1とノード3−3の間のテーブル交換、というステップによって、ノード5−1はISP7が持つ接続情報を獲得することができる。
また、上記(1)−(4)伝播経路は、そのままノード5−1とノード7−1が通信するための4ホップオーバレイパスとなる。この経路は3本のピアリングリンクを経由しており、通常のBGPルーティングでは用いられることはない。このように、本発明の手法によって障害発生時のネットワーク接続性が向上することが期待される。
次に、ISPの参加および離脱について説明する。
新たなISPが非常時オーバレイに参加する場合の手続きは以下のようになる。
(a)新規ISPの作業
a1)既参加ISPから、参加ノード情報およびORTを取得し、自ISP内に設置するオーバレイノード全てにコピーする。
a2)自ISP内に設置するオーバレイノード間のフルメッシュ計測を設定する。
a3)他ノードに対する到達性計測およびテーブル交換の担当を、IPルーティング情報に基づいて決定する。
a4)全ての既参加ISPへ自ISPの参加および設置したオーバレイノードに関する情報を通知する。
(b)既存ASの作業
b1)新規ISP内に設置されるオーバレイノードへのIPルーティング情報を基に、到達性計測およびテーブル交換を担当するノードを決定する。
一方、ISPが非常時オーバレイから離脱する場合は下記のようになる。
(c)離脱ISPの作業
c1)全ての他ノードに対して離脱を通知する。
(d)既存ISPの作業
d1)離脱通知を受けたノードのエントリをORTから削除する。
d2)離脱ASに対する到達性計測およびテーブル交換を担当していたノードはそのASを対象から外す。
本発明によれば、到達性確認およびテーブル交換のために必要となる通信量を従来手法に比べて大幅に削減でき、また、大規模なネットワーク障害が発生した際に、代替経路をBGPに比べて短時間で発見できるとともに、ネットワーク接続性を高く維持できることがわかった。
また、本発明によると、既存のTCP/IPネットワークの上にルーティングを行うオーバレイネットワークを構築することで、大規模ネットワーク障害が発生した場合に短時間で代替経路を発見可能な非常時オーバレイネットワークを実現できる。本発明の手法は既存のオーバレイルーティング手法を基盤としているが、ノード間の到達性確認およびルーティング情報の交換をISP内で分担して行うことで、オーバヘッドを1/10−1/1000程度に削減し、参加ISP数に対するスケーラビリティを向上している。また、オーバレイルーティング技術を用いることで、従来のBGPルーティングでは用いることができなかった経路が利用可能となり、BGPルーティングに比べてネットワーク接続性を最大で約9倍改善することができることが明らかとなった。
なお、図3に示すオーバレイノードはコンピュータ構成を有しており、パケット転送部11、オーバレイルーティングテーブル管理部12、NW(Network)障害判定部13、オーバレイNW(Network)管理部14の機能(処理)は、これら各部に対応するプログラムと該プログラムを実効するCPUなどのハードウェアによって実現されることはいうまでもない。これらのプログラムはCD−ROM、DVD,FD、インターネットなどの媒体を介して市場に流通させることができる。
各ISPに1つずつオーバレイノードを設置した場合の構成例を示す図である。 対外リンク毎にオーバレイノード(オーバレイルーティング装置)を設置した場合の構成例を示す図である。 本発明に係るオーバレイノード(オーバレイルーティング装置)の設置場所を説明するために1つのリンクの部分を示す図である。 9つのISPから構成されるIPネットワークおよびオーバレイノード設置例を示す図である。 本発明に係るオーバレイノード(オーバレイルーティング装置)の構成図である。 オーバレイルーティングテーブル(ORT)の一実施例を示す図である。 本発明におけるオーバレイノードの処理の流れを示す図である。 非常時におけるネットワーク接続性に影響を与える例を示す図である。
符号の説明
10:オーバレイルーティング装置(ノード)
11:パケット転送部
12:オーバレイルーティングテーブル管理部
121:オーバレイルーティングテーブル
13:NW(ネットワーク)障害判定部
14:オーバレイネットワーク(NW)管理部
20:対外接続ルータ
ISP1〜ISP9:インターネットサービスプロバイダ(ISP)
1−1〜9−3:オーバレイルーティング装置(ノード)

Claims (7)

  1. インターネットサービスプロバイダ(ISP)の隣接するインターネットサービスプロバイダとの間に設けられる対外接続リンク毎に設置され、ネットワークに部分的障害が発生した場合に、障害以外の部分により対外接続を維持するようにルーティングすることを特徴とするオーバレイノードであって、
    前記オーバレイノードは、パケット転送手段と、オーバレイルーティングテーブル管理手段と、NW障害判定手段と、オーバレイNW管理手段とを備え、
    前記パケット転送手段は、通過するパケットの宛先に応じて、前記オーバレイルーティングテーブル管理手段が管理するオーバレイルーティングテーブルに基づいて、転送先のノードを決定し、該決定したノードにパケットを転送する手段であり、
    前記オーバレイルーティングテーブル管理手段は、前記NW障害判定手段からネットワーク障害に関する情報を受け取り、オーバレイルーティングテーブルを作成/更新する手段であり、
    前記NW障害判定手段は、オーバレイネットワークに参加している他ノードの間で定期的に生死確認用のパケットを交換することによって、他ノードへの到達性(Connectivity)を把握し、ネットワークの一部に障害が発生し、他ノードへの到達性が失われた場合には、その旨の情報をオーバレイルーティングテーブル管理手段へ通知する手段であり、
    前記オーバレイNW管理手段は、オーバレイネットワークに新たなノードの参加や離脱があった場合に、そのノードから情報を受け取り、参加しているノード全ての情報(IPアドレス、設置ISP)を管理するとともに、ノードの増減情報をオーバレイルーティングテーブル管理手段へ通知する手段であることを特徴とするオーバレイノード。
  2. 設置されたノードの前記NW障害判定手段が生死を確認する他ノードは、通常のIPルーティング時にパケットが装置を通過する宛先を持つノードに限定することを特徴とする請求項1記載のオーバレイノード。
  3. 前記オーバレイルーティングテーブルは、送信側ノード番号と受信側ノード番号間における到達性情報(Connectivity)とタイムスタンプ(Timestamp)を保持するテーブルであることを特徴とする請求項1または2記載のオーバレイノード。
  4. 請求項1からのいずれかに記載のオーバレイノードを具備することを特徴とするオーバレイネットワーク。
  5. インターネットサービスプロバイダ(ISP)の隣接するインターネットサービスプロバイダとの間に設けられる対外接続リンク毎に設置され、ネットワークに部分的障害が発生した場合に、障害以外の部分により対外接続を維持するための、パケット転送手段,オーバレイルーティングテーブル管理手段,NW障害判定手段およびオーバレイNW管理手段からなるオーバレイノードを用いたオーバレイルーティング方法であって、
    前記NW障害判定手段が、他ノードとの間で定期的に生死確認用のパケットを交換することにより他ノードへの到達性を把握し、障害などにより他ノードへの到達性が失われた場合には、その旨の情報をオーバレイルーティングテーブル管理手段に通知するステップと、
    前記オーバレイルーティングテーブル管理手段が、前記NW障害判定手段からの情報によりオーバレイルーティングテーブルを作成/更新し、パケット通過時には適切な宛先ノードアドレスをパケット転送手段へ通知するステップと、
    前記パケット転送手段が、前記オーバレイルーティングテーブル管理手段から通知された宛先ノードアドレスを有するノードへパケットを転送するステップとからなることを特徴とするオーバレイルーティング方法。
  6. 前記パケット転送手段へ通知される適切な宛先ノードアドレスとは、ルート上のノードに障害がなく直接到達可能の場合はそのままのノードアドレスであり、直接到達可能でなければ他のノードを経由することによって到達可能となるルートをオーバレイルーティングテーブルで探索し、該探索された該他のノードのノードアドレスであることを特徴とする請求項5記載のオーバレイルーティング方法。
  7. コンピュータを、請求項1から3のいずれかに記載のオーバレイノードにおけるパケット転送手段,オーバレイルーティングテーブル管理手段,NW障害判定手段およびオーバレイNW管理手段として機能させるためのプログラム。
JP2007155014A 2007-06-12 2007-06-12 オーバレイノード、該オーバレイノードを備えたオーバレイネットワークおよびオーバレイルーティング方法とそのためのプログラム Expired - Fee Related JP5105327B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007155014A JP5105327B2 (ja) 2007-06-12 2007-06-12 オーバレイノード、該オーバレイノードを備えたオーバレイネットワークおよびオーバレイルーティング方法とそのためのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007155014A JP5105327B2 (ja) 2007-06-12 2007-06-12 オーバレイノード、該オーバレイノードを備えたオーバレイネットワークおよびオーバレイルーティング方法とそのためのプログラム

Publications (2)

Publication Number Publication Date
JP2008311715A JP2008311715A (ja) 2008-12-25
JP5105327B2 true JP5105327B2 (ja) 2012-12-26

Family

ID=40238964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007155014A Expired - Fee Related JP5105327B2 (ja) 2007-06-12 2007-06-12 オーバレイノード、該オーバレイノードを備えたオーバレイネットワークおよびオーバレイルーティング方法とそのためのプログラム

Country Status (1)

Country Link
JP (1) JP5105327B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5201046B2 (ja) * 2009-03-25 2013-06-05 日本電気株式会社 ネットワークノード、ネットワーク及びそれらに用いるトンネルスイッチング方法
EP2613264B1 (en) 2010-09-01 2019-06-19 Fujitsu Limited Management device, management program and management method for managing overlay networks
US8411832B2 (en) * 2010-10-29 2013-04-02 Intelepeer, Inc. Wireless call routing in a communication peering grid
JP5841905B2 (ja) * 2012-07-03 2016-01-13 株式会社日立製作所 通信システム、通信網管理装置、及び通信網の管理方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001060956A (ja) * 1999-08-23 2001-03-06 Nippon Telegr & Teleph Corp <Ntt> トランスポート層マルチリンク通信方法
JP3837696B2 (ja) * 2001-03-30 2006-10-25 富士通株式会社 伝送装置及びデータ伝送方法
JP2008301517A (ja) * 2003-02-19 2008-12-11 Intec Netcore Inc ルータ装置及びパケット転送制御方法
JP3736554B2 (ja) * 2003-02-19 2006-01-18 株式会社 インテック・ネットコア ルータ装置及びパケット転送制御方法
JP4277189B2 (ja) * 2003-02-19 2009-06-10 株式会社 インテック・ネットコア ルータ装置及びパケット転送制御方法
JP4579746B2 (ja) * 2005-03-31 2010-11-10 古河電気工業株式会社 接続管理装置、接続管理装置の制御方法および制御プログラム
JP4839428B2 (ja) * 2006-02-03 2011-12-21 株式会社インテック マルチホーム接続方法と装置

Also Published As

Publication number Publication date
JP2008311715A (ja) 2008-12-25

Similar Documents

Publication Publication Date Title
JP3850391B2 (ja) VRRP(VirtualRouterRedundancyProtocol)によるルータ・インターフェース・バックアップ実行方法
JP4449903B2 (ja) ルータ装置およびネットワーク接続方式
US7609619B2 (en) Active-active data center using RHI, BGP, and IGP anycast for disaster recovery and load distribution
JP7091923B2 (ja) 転送装置、転送方法及びプログラム
JP5546461B2 (ja) チェーン及びリングネットワークにおける透過的なオートリカバリのための方法及びシステム
JP5867211B2 (ja) 中継装置、中継装置の制御方法及び中継システム
JP5913635B2 (ja) 冗長ネットワーク接続
US20060193247A1 (en) Disaster recovery for active-standby data center using route health and BGP
US7940694B2 (en) Intelligent filtering of redundant data streams within computer networks
US20110055622A1 (en) Network system and network relay apparatus
CN112422307B (zh) Evpn和vpls共存双活的方法、设备及系统
Muthumanikandan et al. Link failure recovery using shortest path fast rerouting technique in SDN
JP2017506462A (ja) 分離した制御デバイスおよび転送デバイスを備えるネットワークでの制御デバイス検出
US8295181B2 (en) Transfer of network traffic for multi-homed devices
KR102050910B1 (ko) 연결 실패 시에 홈 네트워크에 대한 재라우팅을 인에이블시키는 방법 및 시스템
WO2011079695A1 (zh) 一种网络流量切换控制方法、装置及系统
CN101562576B (zh) 一种路由发布方法和设备
WO2022253087A1 (zh) 一种数据传输方法、节点、网络管理器及系统
JP5105327B2 (ja) オーバレイノード、該オーバレイノードを備えたオーバレイネットワークおよびオーバレイルーティング方法とそのためのプログラム
JP5438624B2 (ja) 通信システム、制御サーバ、フロー制御方法およびそのプログラム
JP2013046090A (ja) 通信装置および通信システム
CN117061357A (zh) 一种基于虚拟专用网络的网络拓扑管理方法和系统
Ramjee et al. Separating control software from routers
JP2015164293A (ja) ネットワーク接続装置及びネットワーク接続方法
WO2007066442A1 (ja) 故障救済方法およびパケット通信装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100601

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100602

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110620

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110620

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20110623

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110620

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111115

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120911

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120924

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151012

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees