JP6141407B2 - 802.1aqのためのスプリットタイブレーカ - Google Patents

802.1aqのためのスプリットタイブレーカ Download PDF

Info

Publication number
JP6141407B2
JP6141407B2 JP2015506333A JP2015506333A JP6141407B2 JP 6141407 B2 JP6141407 B2 JP 6141407B2 JP 2015506333 A JP2015506333 A JP 2015506333A JP 2015506333 A JP2015506333 A JP 2015506333A JP 6141407 B2 JP6141407 B2 JP 6141407B2
Authority
JP
Japan
Prior art keywords
traffic
network
ids
path
equal cost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015506333A
Other languages
English (en)
Other versions
JP2015519795A (ja
Inventor
イアン アラン、デイビッド
イアン アラン、デイビッド
Original Assignee
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エルエム エリクソン(パブル), テレフオンアクチーボラゲット エルエム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Publication of JP2015519795A publication Critical patent/JP2015519795A/ja
Application granted granted Critical
Publication of JP6141407B2 publication Critical patent/JP6141407B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/16Multipoint routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/38Flow based routing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02BCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
    • Y02B90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
    • Y02B90/20Smart grids as enabling technology in buildings sector

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明の実施形態は、コンピュータネットワーキングの分野に関し、より具体的には、802.1aqネットワークにおけるスプリットタイブレーカの使用に関する。
イーサネットは、IEEE(Institute of Electrical and Electronics Engineers)により定義されたネットワーキングプロトコルであり、物理レイヤを仕様化する標準802.3と、ネットワークレイヤを仕様化する802.1とを包含する。イーサネットは、LAN(Local Area Network)を可能とするために考案され、わずかな構成しか要しない“プラグアンドプレイ”のネットワークキングを可能とした。時を経て、イーサネットは、追加的な機能性を提供し及び代替的ネットワークトポロジーをサポートするように拡張された。ここで使用されるところでは、“イーサネットネットワーク”との用語は、例えば802.1、802.1Q、802.1ad、802.1ah、802.1Qay、802.1Qbp又は802.1aqを含む802.1プロトコルファミリーのうちの1つ以上を実装するネットワークをいう。
高度な仮想化をサポートし、マルチパスルーティングを可能とし、並びに、キャリア、企業及びクラウドネットワークの生成と管理とを簡素化するために、IEEE802.1aqが開発されてきた。IEEE802.1aqネットワークでは、ブリッジが、ネットワークのトポロジー及び論理的なネットワークメンバシップの双方を広告することで、ネットワークによるイーサネットフレームの転送を制御するために、リンクステートプロトコルを利用する。リンクステートルーティングプロトコルの2つの例は、OSPF(Open Shortest Path First)及びIS−IS(Intermediate System to Intermediate System)を含み、802.1aqネットワークでは後者が使用される。
リンクステートルーティングネットワークでは、ネットワークを形成するブリッジは、ネットワークトポロジーの同期したビューを各ノードが有することを可能とするために、リンクステート広告(LSA)を交換する。ネットワーク内の各ブリッジがネットワークのトポロジーの同期したビューと必要とされるユニキャスト及びマルチキャストの接続性の完全な認識とを有するため、各ブリッジは、ネットワーク内のブリッジの任意のペアの間の1つ以上の最短パスを計算することができる。この情報で、各ブリッジは、それに応じて個別に転送情報ベース(FIB)を構築する。
IEEE802.1aqは、エッジベースの拡散に基づいて、ネットワークの単一のフルメッシュを伴う等コストツリー(ECT)へと負荷を分散し、それらはECTセットと見なされる。各ECTセットは、バックボーンVLAN識別子(B−VID)に1対1で関連付けられることにより、データプレーン内で識別される。
数多くのネットワーキングアプリケーションがマルチパスネットワークの設計への依存を深めており、ネットワーク内で任意の2つの地点の間に複数の等コストパスが存在することになる。ほとんどのコンピュータネットワークにおいて、ネットワークにおける1回以上の障害に順応することの必要性は、ネットワークの継続的な可用性を保証するために重要である。“旧来の”802.1aqネットワークでは、リンク又はブリッジの障害は、1つ以上の周囲のブリッジにより観測され、ネットワークにわたって広告されることになる。ネットワーク内の各ブリッジは障害により影響を受けるトラフィックについて新たなパスを再計算し、新たなパスを用いて転送が自動的に継続されるであろう。しかしながら、障害が存在する場合、トラフィックはまとまってフェイルオーバパスへとシフトされる。接続性の疎らなネットワークでは、代替的なパスの数が大きく制約されることに起因して、これらの結果は容易に理解される。一方、密に接続されたマルチパスネットワークでは、障害のインパクトを受けた所与の2つの地点の間の負荷は、生き残ったパスのセットにわたって分散される代わりに、いくつもの候補パスのうちの1つのみへとシフトされる。これは、フェイルオーバパスが今やトラフィックの大幅な増加を処理することから、ネットワークの安定性を減少させるかもしれず、それにより、既にパス上にあったトラフィック、当該パスへとシフトされたトラフィック、及び影響を受けたパス内のリンク又はブリッジを利用する任意の他のトラフィックの性能が劣化し得る。さらに、フェイルオーバパスへのこのまとまったトラフィックのシフトは、フェイルオーバパス内のリンク及びブリッジを、それらエレメントを実質的に障害に陥らせるほど圧倒するかもしれない。このような形で、まとまったトラフィックのシフトの繰り返しとその結果としてのフェイルオーバ障害とに起因して、ネットワーク障害が連鎖的に起きる可能性がある。よって、障害のシナリオにおいて、影響を受けない既存のパスをリルートすることなくネットワーク負荷を分散させ、移動した負荷を障害の是正の後にもとのルーティングへと復帰させる仕組みを有することが望ましいであろう。
本発明の一実施形態によれば、方法は、スプリットタイブレーカを用いてネットワーク内の等コスト最短パスの間で選択を行うために、通信ネットワーク内の複数のノードのうちのノードにより実行される。ノードについての第1の及び第2のシステム識別子(ID)がネットワーク内で広告される。第1及び第2のシステムIDは、それぞれ第1の及び第2のトラフィックIDのセットに関連付けられる。これらは、802.1aq用語におけるECTセットに対応している。トラフィックIDは、ネットワーク内で異なる仮想ネットワークを区別するために使用され、タイブレーキング変換に関連付けられる。方法は、ネットワーク内の他の複数のノードの各々についての第3の及び第4のシステムIDを受信するステップをさらに含む。第3の及び第4のシステムIDは、それぞれ第1の及び第2のトラフィックIDのセットに関連付けられる。方法は、ネットワークの第1のノードと第2のノードとの間の複数の異なる等コスト最短パスを構築するステップと、各トラフィックIDについて、構築された等コスト最短パスのうちの1つを選択するステップと、を含む。選択は、当該トラフィックIDに関連付けられるタイブレーキング変換と、当該トラフィックIDに関連付けられるシステムIDを含むシステムIDのセットと、を用いて、等コスト最短パスの各々についてのパスIDを構築することにより、部分的に実行される。システムIDのセットの各々は、その等コスト最短パスの異なるノードに関連付けられる。選択は、また、等コスト最短パスのうちの1つを選択するためにパスIDに選択アルゴリズムを適用することにより、部分的に実行される。方法は、ネットワーク内のシステムID及びトラフィックIDの構成を理由として、選択された1つ以上の等コスト最短パス上の、複数のトラフィックIDについてのトラフィックに影響する障害に応じて、他の複数の等コスト最短パスにわたって当該トラフィックIDに関連付けられるトラフィックを分散させるステップをさらに含む。
本発明の別の実施形態によれば、通信ネットワーク内の他のネットワークエレメントのセットに連結されるネットワークエレメントは、スプリットタイブレーカを用いてネットワーク内の等コスト最短パスの間で選択を行うように構成される。ネットワークエレメントは、ネットワークのトポロジーを表現し、複数のネットワークエレメントと当該複数のネットワークエレメントの各々についての複数のシステム識別子(ID)とを含むリンクステートデータベース、を管理するように構成されるリンクステートプロトコルモジュールを含む。リンクステートプロトコルモジュールは、また、ネットワークエレメントについての、それぞれ第1の及び第2のトラフィックIDのセットに関連付けられる第1の及び第2のシステムIDであって、ネットワーク内で異なる仮想ネットワークを区別するために各トラフィックIDが使用され、各トラフィックIDがタイブレーキング変換に関連付けられる、第1の及び第2のシステムIDを広告するために、ネットワークを用いてリンクステートメッセージを送信するように構成される。リンクステートプロトコルモジュールは、また、ネットワーク内の他の複数のネットワークエレメントの各々に割り当てられる、それぞれ第1の及び第2のトラフィックIDのセットに関連付けられる第3の及び第4のシステムID、を示すリンクステートメッセージを受信するように構成される。リンクステートプロトコルモジュールは、また、リンクステートデータベース内の情報を用いて、ネットワークの第1のネットワークエレメントと第2のネットワークエレメントとの間の複数の異なる等コスト最短パスを構築するように構成される。リンクステートプロトコルモジュールは、また、各トラフィックIDについて、複数の異なる等コスト最短パスの各々についてのパスIDを、当該トラフィックIDに関連付けられる前記タイブレーキング変換と、当該トラフィックIDに関連付けられるシステムIDを含む、各々が当該等コスト最短パスの異なるネットワークエレメントに関連付けられるシステムIDのセットと、を用いて構築するように構成される。リンクステートプロトコルモジュールは、また、トラフィックIDの各々について、構築した各パスIDに選択アルゴリズムを適用することにより、対応する構築した等コスト最短パスのうちの1つを選択するように構成される。リンクステートプロトコルモジュールは、また、選択した等コスト最短パスを反映するように、1つ以上の転送エントリを構成させるように構成される。ネットワークエレメントは、また、ポートから複数のパケットを受信するように構成される転送モジュールを含む。転送モジュールは、また、1つ以上の等コスト最短パス上の複数のトラフィックIDについてのトラフィックに影響するネットワーク内の障害の前に、転送エントリに従って1つ以上の等コスト最短パス上で複数のトラフィックIDについてのトラフィックを送信するように構成される。転送モジュールは、また、障害の後に、ネットワーク内のシステムID及びトラフィックIDの構成を理由として、複数の異なる等コスト最短パス上で複数のトラフィックIDについてのトラフィックを送信するように構成される。
本発明は、明細書及び本発明の実施形態を説明するために用いられる以下の添付図面を参照することにより、最もよく理解され得る。
本発明の一実施形態に係る、例示的なネットワーク及び例示的なネットワークにおけるスプリットタイブレーカを使用するための手続のうちのいくつかを示す。 本発明の一実施形態に係る、802.1aqのためのスプリットタイブレーカを実装するネットワークエレメントの例示的な機能ブロック図である。 本発明の一実施形態に係る、ネットワークトラフィックをカプセル化するために使用されるパケットヘッダを示す。 本発明の一実施形態に係る、802.1aqネットワークにおけるスプリットタイブレーカを使用するためのフロー図を示す。 本発明の一実施形態に係る最短パス及びトラフィック識別子を示す、例示的なネットワークトポロジーを示す。 本発明の一実施形態に係るスプリットタイブレーカを利用する最短パスの論理計算を示す。 本発明の一実施形態に係る、障害後の図5に示される例示的なネットワークトポロジーを示す。 本発明の一実施形態に係る、スプリットタイブレーカを利用する最短パスの論理計算を示す。 本発明の一実施形態に係る、例示的なネットワーク上のマルチキャストトラフィックのための最短パスを示す。 本発明の一実施形態に係る、障害後の図9の例示的なネットワーク上のマルチキャストトラフィックのための別の最短パスを示す。
以下の説明において、多くの具体的な詳細が説明される。しかしながら、本発明の実施形態は、それらの具体的な詳細がなくとも実践され得ることが理解されるべきである。他の例では、本説明の理解を曖昧にすることのないように、周知の回路、構造、及び技法については詳細を示していない。ここに含まれる説明によって、当業者は、過度の実験をすることなく、適切な機能性を実装することができるであろう。
明細書中の“一実施形態(one embodiment)”、“実施形態(an embodiment)”、“例としての実施形態(an example embodiment)”等への言及は、説明される実施形態が、特定の特徴、構造又は特性を含み得ることを示すが、全ての実施形態が、当該特定の特徴、構造又は特性を必ずしも含まなくともよい。さらに、そのような表現は、必ずしも同一の実施形態に言及するものではない。さらに、特定の特徴、構造又は特性が、実施形態に関連して記載される場合に、明示的に記載されているか否かに関わらず、他の実施形態に関連してそのような特徴、構造、又は特性を達成することは、当業者の知識の範囲内であると考えられる。
以下の説明及び特許請求の範囲において、それらの派生物と共に“結合された(coupled)”及び“接続された(connected)”という用語が使用され得る。これらの用語は、互いに同義語として意図されるものでないことを理解すべきである。“結合された(coupled)”は、互いに直接物理的又は電気的に接触していてもよく、していなくてもよい2以上のエレメントが、互いに協働又は相互作用することを示すために用いられる。“接続された(connected)”は、互いに結合された2以上のエレメント間の通信の確立を示すために用いられる。
本発明の様々な実施形態は、ソフトウェア、ファームウェア、及び/又はハードウェアの様々な組み合わせを使用して実装され得る。したがって、図に示される技術は、1以上の電子装置(例えば、エンドステーション、ネットワークエレメント)上に格納され実行されるコード及びデータを使用して実装されることができる。そのような電子装置は、非一時的コンピュータ可読記憶媒体(磁気ディスク、光ディスク、RAM、ROM、フラッシュメモリ装置、相変化メモリ)及び一時的コンピュータ可読送信媒体(例えば、搬送波、赤外線信号、デジタル信号といった、電気的、光学的、音響又は他の形式の伝搬される信号)といったコンピュータ可読媒体を使用して、コード及びデータを(内部的に、及び/又はネットワーク上の他の電子装置と共に)格納及び通信する。さらに、そのような電子装置は、典型的に、1以上の記憶装置(非一時的機械可読記憶媒体)、ユーザ入力/出力装置(例えば、キーボード、タッチスクリーン、及び/又はディスプレイ)、及びネットワーク接続といった、1以上の他のコンポーネントに結合される1以上のプロセッサ一式を含む。プロセッサ一式と他のコンポーネントとの結合は、典型的に、1以上のバス及びブリッジ(バスコントローラとも呼ばれる)を介して行われる。したがって、所与の電子装置の記憶装置は、典型的に、その電子装置の1以上のプロセッサ一式上で実行するためのコード及び/又はデータを格納する。
ここで用いられるものとして、ネットワークエレメント(例えば、ルータ、スイッチ、ブリッジ、又は総称的にはノード)は、ネットワーク上の他の機器(例えば、他のネットワークエレメント、エンドステーション)を通信可能に相互接続するハードウェア及びソフトウェアを含むネットワーキング機器の一部である。いくつかのネットワークエレメントは、複数のネットワーキング機能(例えば、ルーティング、ブリッジング、スイッチング、レイヤ2アグリゲーション、セッションボーダコントロール、QoS(Quality of Service)、及び/又は加入者管理)についてのサポートを提供し、及び/又は複数のアプリケーションサービス(例えば、データ、音声、及びビデオ)についてのサポートを提供する、“複数のサービスネットワークエレメント”である。加入者エンドステーション(例えば、サーバ、ワークステーション、ラップトップ、ネットブック、パームトップ、携帯電話、スマートフォン、マルチメディアフォン、VOIP(Voice Over Internet Protocol)フォン、ユーザ機器、ターミナル、携帯メディアプレイヤ、GPSユニット、ゲームシステム、セットトップボックス)は、インターネット上で提供されるコンテンツ/サービス、及び/又はインターネット上に重ねられた(例えば、インターネットを通じてトンネルされた)VPN(virtual private networks)上で提供されるコンテンツ/サービスにアクセスする。コンテンツ及び/又はサービスは、典型的には、サービス若しくはコンテンツプロバイダ又はピアツーピアサービスに参加しているエンドステーションに属している1以上のエンドステーション(例えば、サーバエンドステーション)により提供される。コンテンツ及び/又はサービスは、例えば、公共のウェブページ(例えば、無料コンテンツ、ストアフロント、検索サービス)、私的なウェブページ(例えば、ユーザ名/パスワードでアクセスされる電子メールサービスを提供するウェブページ)、及び/又はVPN上の企業ネットワークを含み得る。典型的には、加入者エンドステーションは、(例えば、(有線又は無線の)アクセスネットワークに結合される顧客構内機器を通じて)エッジネットワークエレメントに結合される。エッジネットワークエレメントは、他のエンドステーション(例えば、サーバエンドステーション)に結合される他のエッジネットワークに(例えば、1以上のコアネットワークエレメントを介して)結合される。
いくつかのネットワークエレメントは、VPN(Virtual Private Networks)(例えば、レイヤ2VPN及び/又はレイヤ3VPN)の実装についてのサポートを提供する。例えば、プロバイダのネットワーク及び顧客のネットワークが結合されている地点におけるネットワークエレメントは、各々PE(Provider Edge)及びCE(Customer Edge)と呼ばれる。レイヤ2VPNでは、転送は典型的にVPNのいずれかの端におけるCE上で実行され、トラフィックは、ネットワークをわたって(例えば、他のネットワークエレメントにより結合される1以上のPEを介して)送信される。レイヤ2回線は、CE及びPE間(例えば、イーサネットポート、802.1Q恒久仮想回線(PVC:permanent virtual circuit)、オンデマンド802.1Q PVC、フレームリレーPVC、非同期転送モード(ATM:Asynchronous Transfer Mode)PVC)で構成される。レイヤ3VPNでは、ルーティングは、典型的にPEにより実行される。一例として、複数のコンテキストをサポートするエッジネットワークエレメントは、PEとして展開されることができ、コンテキストは、VPNプロトコルで構成されることができ、したがって、そのコンテキストは、VPNコンテキストと呼ばれる。
ネットワークエレメントは、一般に、制御プレーンとデータプレーン(転送プレーン又はメディアプレーンと呼ばれることもある)とに分けられる。ネットワークエレメントがルータである(又はルーティング機能を実装している)場合、制御プレーンは、典型的に、データ(例えば、パケット)がどのようにルーティングされるべきか(例えば、データについてのネクストホップ、及びそのデータについての発信ポート)を決定し、データプレーンは、そのデータの転送を担当する。例えば、制御プレーンは、典型的に、ルートを交換し、1以上のルーティングメトリックに基づいてそれらのルートを選択するために他のネットワークエレメントと通信する、1以上のルーティングプロトコル(例えば、BGP(Border Gateway Protocol)、IGP(Interior Gateway Protocol(例えば、OSPF(Open Shortest Path First)、RIP(Routing Information Protocol)、IS−IS(Intermediate System to Intermediate System))、LDP(Label Distribution Protocol)、RSVP(Resource Reservation Protocol))を含む。
ルート及び隣接性(adjacencies)は、制御プレーン上の1以上のルーティング構造体(例えば、RIB(Routing Information Base)、LIB(Label Information Base)、1以上の隣接性構造体)に格納される。制御プレーンは、ルーティング構造体に基づく情報(例えば、隣接性及びルート情報)で、データプレーンをプログラムする。例えば、制御プレーンは、データプレーン上の1以上の転送構造体(例えば、FIB(Forwarding Information Base)、LFIB(Label Forwarding Information Base)、及び1以上の隣接性構造体)の中に隣接性及びルート情報をプログラムする。データプレーンは、トラフィックの転送時にこれらの転送構造体及び隣接性構造体を使用する。
レイヤ2フォワーディングのために、ネットワークエレメントは、データ内に存在するレイヤ2情報に基づいてデータを転送するために使用される1以上のブリッジングテーブルを格納することができる。
典型的には、ネットワークエレメントは、1以上のラインカードのセット、1以上のコントロールカードのセット、及び必要に応じて1以上のサービスカード(リソースカードと呼ばれることもある)のセットを含む。これらのカードは、1以上のメカニズム(例えば、ラインカードを結合する第1のフルメッシュ及び全てのカードを結合する第2のフルメッシュ)を介して互いに結合される。コントロールカードのセットがコントロールプレーンを提供し、ラインカードを介して外部のネットワークエレメントとパケットを交換する一方、ラインカードのセットは、データプレーンを作り上げる。サービスカードのセットは、専門化した処理(例えば、レイヤ4からレイヤ7のサービス(例えば、ファイアウォール、IPSec、IDS、P2P)、VoIPセッションボーダコントローラ、モバイルワイヤレスゲートウェイ(GGSN、EPS(Evolved Packet System)ゲートウェイ))を提供する。例として、サービスカードは、IPsecトンネルを終端させ、付随する認証及び暗号化アルゴリズムを実行するために使用され得る。
IEEE802.1aqは、2つの動作可能なモードを有する。VLANベースのネットワークのための第1のモードは、最短パスブリッジングVID(SPBV)と呼ばれる。MACベースのネットワークのための第2のモードは、最短パスブリッジングMAC(SPBM)と呼ばれる。各ECTセットは、一般に、SPBVについての最短パスVLAN識別子(SPVID)セット及びSPBMについてのバックボーンVLAN識別子(B−VID)に関連付けられる。イーサネットネットワークは、データプレーンにおいて1つより多くのECTセットを同時にサポートすることができる。
IEEE802.1aqは、ネットワーク内の2つの地点の間の全てのノードが独立して、所与のECTセットについてネットワーク内の任意の2つの地点の間の同一の対称パスを選択することを必要とする。したがって、IEEE802.1aqネットワークにおけるパス選択が、計算の方向、計算の順序、又はパスの任意のサブセットの検査に関わらず、任意の2つのノード間のパスが単一の対称パスに解決されるようなタイブレーキング処理を利用するように、アルゴリズムは仕様化されている。この性質は、あるいは、“最短パスのどの部分も最短パスである”とされている。複数の“同等の”選択肢があるといったように、最短パスのどの部分に沿っても同点(tie)が発生する場合、それらのノードは、結果が最小コストの最短パスツリーである同一の選択肢で、パスのサブセットについて同点を解消するであろう。これは、“共通アルゴリズムタイブレーキング”処理とここで呼ばれる。マルチパスネットワークのより効果的な使用を可能にさせる、複数のECTセットが生成されるように、共通アルゴリズムタイブレーキング処理への入力を操作することが可能である。
パス選択処理において、共通アルゴリズムタイブレーキング処理を利用するリンクステート(トポロジー)データベースの最初のパスは、第1のツリーのセットの生成をもたらす。最初のステップは、ネットワーク内の各ノードのペア間の最短パスを判定する。任意の2つのノード間で1以上の最短パスが見つかる場合、共通アルゴリズムタイブレーキング処理は、ネットワーク内の各ノードペア間で一意のパス選択を行うため、及び、IEEE802.1aqにおいて“ECTセット”と呼ばれる1以上の等コスト転送ツリーのセットを生成するために、タイブレーキングに利用される。
旧来の802.1aqSPBMネットワークでは、パスは、各B−VIDについて以下の方式で選択される。第1に、各ノードは、ノード間で送信されるIS−ISリンクステートルーティングプロトコルメッセージを用いて、ネットワークのトポロジを学習する。全てのノードがネットワークのトポロジを学習すると、ユニキャスト及びマルチキャストトラフィックについての最短パスが、いくつかの最短パス計算アルゴリズムを使用する各ノードによって計算される。そのようなアルゴリズムは、当該技術分野において周知であり、全点対間最短パスアルゴリズム(フロイドワーシャルアルゴリズム、ジョンソンのアルゴリズム等)、及び単一始点最短パスアルゴリズム(ダイクストラのアルゴリズム、ベルマン・フォードアルゴリズム等)を含む。ノードが、共通のサービスに関与しているノードのペア間の最短パス上にあると判定する場合、ノードは、それに応じてそのようなトラフィックを転送し得るように転送状態をインストールする
しかしながら、共通のサービスに関与しているノードのペア間に複数の最短パスが存在する場合、ネットワーク内の各ノードは、そのECTセットのトラフィックについて最短パスのうちの共通の1つを選択するために、タイブレーキング手続きを実行する。このタイブレーキング手続きは、そのトラフィックについてパスの合同性(congruency)を保つために、1つの正しいパスに関してネットワーク全体の一貫した決定がなされ、それによって、任意の2つのブリッジ間のパスが両方向で共通のルートを共有するであろうということを提供することを保証する。対称なタイブレーキングアルゴリズムであるこの手続きは、パス内の各ノードからシステム識別子(システムID)を使用する最短パスの各々についてパス識別子(パスID)を構築すること、及び、その後特定のタイブレーキングアルゴリズムに従ってこれらのパスIDのうち1つを選択することにより動作する。802.1aqの仕様に従って、パス内のノード各々についてのシステムIDは、そのECTセットについてのB−VIDと関連付けられるマスクを使用して変換される。パスについての変換された各システムIDは、その後接合され、その後パスIDを形成するために辞書順にソートされる。潜在的なパスのセットを表現するこれらのパスIDは、ランク付けされ、最も低いパスIDがそのECTセットにおけるトラフィックについてのパスとして選択される。この方式では、同一ロジックを実装する全てのノードが、同一の選択肢から同一のパスを選択するであろう。所与のECTセットについてのトラフィックの正確なパスは、したがって、そのパスには直接的にインパクトを与えなかったネットワークトポロジーにおける変化がある場合でさえ、予測可能である。この手続きは、また、トラフィックのサービスが選択的にB−VIDに割り当てられ得るため、先験的(apriori)なトラフィックエンジニアリングを可能にし、それにより、ネットワーク内の複数の等コストパスにわたって、システムロードを分散させることが可能である。
リンク又はノード障害が起きた場合には、ネットワーク内の各ノードは、IS−ISリンクステートメッセージを介して障害を知り、障害により影響を受けるトラフィック(即ち、障害のあるリンク上を通過され、又は障害のあるノードを介して通過されるトラフィック)についての最短パスを再計算する。例えば、特定のB−VIDを有するトラフィックが、障害により影響を受ける特定のルートを通過した場合、ネットワーク内の各ノードは、そのB−VIDを利用する全てのトラフィックが、異なるパスを使用して転送されるべきであると判定するであろう。これは、トラフィックが異なるリンク上及びノードにシフトされるという結果をもたらす。このアプローチは、ネットワーク内で中断されるトラフィックが、障害のあるリンク又はノードを通過したトラフィックのみに限定されるということにおいて利益を有する。
しかしながら、このアプローチは、重大な制限をも有する。ネットワーク内の障害の後に、所与の最短パス上の影響を受けたB−VIDのトラフィックは、ブロックとして新たなパスにシフトされ、生き残ったリソースにわたって均等に分散されない。これは、影響を受けたトラフィックについての“新たな”パス内のリンク及びノード上に著しい負荷を生む可能性がある。例えば、ノードA104とノードB102との間に4つの物理的等コスト最短パスを有する、図1のネットワークを仮定すると、パスのうちの1つ(例えば、A−Y−B)の上での障害は、そのパスを利用するトラフィックが別のパス(例えば、A−Z−B)に一括してシフトされるという結果をもたらすであろう。したがって、障害の前には全てのトラフィックが4つの等コスト最短パス間で均等に分散されていたとすると、障害後、パスA−Z−Bではトラフィックが倍増するであろう。この結果は、そのパス上のリンクを利用するトラフィックについてサービスが大幅に低下する結果となり、更なるネットワーク障害及び更なるサービスの低下に至る可能性があるため、厄介である。
図1は、本発明の一実施形態に係る、例示的なネットワーク及び例としてのネットワークにおけるスプリットタイブレーカを使用するための手続きの論理的表現を示す。この例としてのイーサネットネットワークは、スプリットタイブレーカの一使用を示すためのリンクにより相互接続される6個のノード(例えば、ブリッジ、ネットワークエレメント等)を含む。しかしながら、他の実施形態では、ネットワークはより多くのノード、少ないノード、又はファットツリー若しくはClosネットワークアーキテクチャといった別のネットワークトポロジーを含むものであってもよい。
このネットワークでは、ノードA104は、ネットワークの入口ノードであり、したがって、別のネットワーク(図示せず)からのトラフィックを受信し、ネットワークの他のノードに送信されるべきトラフィックを生成する。ここで、ノードA104は、出口ノードB102にトラフィックを送信するように構成され、出口ノードB102は、別のネットワーク(図示せず)にトラフィックを転送し得る。ノードA104及びB102は、ネットワークの入口ノードとして、バックボーンエッジブリッジ(BEB:Backbone Edge Bridge)又はプロバイダエッジ(Provider Edge)ネットワークエレメントが考えられ得る。
ノードA104及びノードB102間には4つのノードがある。これら4つのノード、ノードW110、ノードX112、ノードY114、及びノードZ116は、リンクのセットでノードA104及びノードB102の両方に各々接続されている。これら4つの中間ノード110〜116は、バックボーンコアブリッジ(BCB:Backbone Core Bridge)又はプロバイダネットワークエレメントと考えられ得る。
この構成では、ノードA104からノードB102への4つの異なる物理パス:A−W−B、A−X−B、A−Y−B、及びA−Z−Bが存在する。説明のため、これら4つのパスの各々は、等コストであるものとして定義される。しかしながら、実際には、これらのパスの各々は、ただ1つのノード(即ち、ノードW110〜Z116のうちの1つ)を介してノードA104からノードB102に進んではいるものの、これらのパスの各々は、様々な方法の構成又は判定により異なるコストであると考えられ得る。例えば、最短パスは最も少ない数のノードを通過するパスであると判定するようにネットワークが構成されてもよく、又は、最短パスは、パス内のリンクの帯域幅に基づいて、若しくは各リンク若しくはノードに割り当てられた“重み”を設定されることにより判定される。
このように、このネットワークは、ノードA104及びノードB102の間に4つの物理的等コスト最短パスを含む。802.1aq SPBMによれば、これらの最短パスのうち1つが、関連するECTセットを識別するパケットに関連付けられるB−VIDに従って、ノードA104からノードB102に向かうパケットについて選択される。例えば、SPBMネットワークに入ると、パケットは、B−VIDヘッダフィールドを含む802.1ahヘッダ340(図3参照、本明細書中で後述する)内にカプセル化される。このB−VIDは、トラフィック識別子(トラフィックID又はTID)としてもここで総称的に言及され、1以上の等コスト最短パスが存在する場合に、発信元から宛て先へのそのB−VIDのトラフィックについての1つの最短パスを判定するために、ネットワークの各ノードにより使用される。
本発明の実施形態によれば、ネットワークトラフィックは、スプリットタイブレーカの使用を通じて、障害が起きた場合に複数の生き残った等コスト最短パスにわたって迅速かつ簡単に分散されることができる。他の利益の中でも、スプリットタイブレーカは障害後において大幅な利益を提供し、影響を受けるトラフィックの一部が複数の生き残ったパスにシフトされ、それによって生き残ったリンク及びノード各々におけるインパクトを減少させる。障害前のパス及び障害後のパスの両方が、サービス及びB−VIDのトラフィックへの選択的割り当てを通じて決定可能かつ構成可能であるため、スプリットタイブレーカの使用は、旧来の802.1aqネットワークのパス決定能力(determinability)の利益をも保持する。これらの利益についての基本的メカニズムは、タイブレーキング期間中の2次的パス、即ち“好適なパス以外のパス”の選択が、他のシステムIDのセットのものとは様々異なるように、各セット内のシステムIDの分散を構成することである。障害が発生すると、複数のECTセットが影響を受け、システムIDは、共通の“次に最善な”選択を持たないようなやり方で選択されているため、障害により影響を受けるトラフィックは、1以上の生き残ったパスにわたって分散される。技術に対する必要条件は、いかなる単一の障害においても、特定のパスが選択されるようにするタイブレーカのセットに関連付けられるインパクトのあったECTセットが生き残ったリソースのセットにわたって均等に分散されるように、システムIDのセットを生成することである。3ステージCLOSアーキテクチャのような単純なネットワークについて、これは些細な作業であると証明することができる。任意のトポロジーについては、より複雑なアルゴリズムによって各セット内の値の分配を決定する必要があるかもしれない。
本発明の実施形態に係るスプリットタイブレーキングの使用は、図1の例としての簡単なネットワークにおいて図示されている。上述のように、このネットワークは、6つのノード、及びノードA104とノードB102との間の4つの物理的等コスト最短パスを含む。この例では、8個の異なるトラフィックID(即ちB−VID)により表されるトラフィックが、4つの物理的等コスト最短パスへと解決される8つの仮想的な等コスト最短パスを使用し、ノードA104からノードB102に転送される。この例は、最短パスのうちの1つに影響する障害118の前後にスプリットタイブレーカを有するネットワークの動作を示している。当然のことながら、スプリットタイブレーカは、より多くの若しくは少ないノード、より多くの若しくは少ないトラフィックIDを有するネットワークにおいて、及び、ノードのペア間により多くの若しくは少ないパスを有するシナリオについて、動作するように構成されることができる。
旧来の802.1aqネットワークは、パス識別子の構築時に各ノードに割り当てられるシステムIDを使用する一方、スプリットタイブレーカの実装は、ネットワーク内のノードに1以上のシステムIDを割り当てる。ノードについての各システムIDは、1以上のトラフィックIDの特定のセットについてパス識別子を構築する際に使用される。したがって、ノードの各々について、第1のトラフィックIDが第1のシステムIDについてのパス識別子を生成する際に使用される。一方で、そのパス内のノードの各々から、第2のトラフィックIDについてのパス識別子を生成する際には第2のシステムIDが使用されるであろう。本発明の実施形態によれば、各ノードについての複数のシステムIDは、ネットワーク管理者により手動で割り当てられてもよく、又はネットワーク上のソフトウェアツール若しくはハードウェアエレメントにより割り当てられてもよい。同様に、トラフィックIDのセットと、最短パス判定の際に使用されるべきノードについてのシステムIDのセットのうち所定の1つとの間のマッピングは、ネットワーク管理者により手動で割り当てられてもよく、又はネットワーク上のソフトウェアツール若しくはハードウェアエレメントにより割り当てられてもよい。
図1において、8個の仮想的な等コスト最短パスは、ネットワーク内の各ノードにより、ノードA104及びノードB102間で構築される。図1において構築された8個の仮想的な等コスト最短パスは、トラフィックID1から8に対応する4つの物理的パス120A−W−B、A−X−B、A−Y−B、及びA−Z−Bの各々に割り当てられる2つのインスタンスを含む。1というトラフィックIDを有するトラフィックについて最短パスのうち1つを選択するために、各パスについてのパス識別子が、パス各々におけるノード各々に関連付けられる第1のシステムIDを使用して構築122される。このネットワークでは、各ノードの第1のシステムIDがトラフィックID1〜4に関連付けられ、各ノードの第2のシステムIDがトラフィックID5〜8に関連付けられる。代替的な実施形態では、各ノードに割り当てられる2つより多くのシステムIDが存在してもよく、システムIDの各々に関連付けられるトラフィックIDは、異なるものであってもよく、数がより多くても少なくてもよい。これらのオプション間の選択及びその構成は、異なるネットワークトポロジー及びシナリオについて異なっていてもよく、ネットワークに依存して異なる利益を生み出すものであってもよい。
第1のパスA−W−Bについて、各ノードに割り当てられる第1のシステムIDが選択122される。ノードA104について、これは1001bであり、ノードW110についてこれは0000bであり、ノードB102についてこれは1000bである。これらのシステムIDは、その後変換される。例えば、図1は、トラフィックID1に関連付けられる変換を使用して各システムIDを変換すること123を示す。この例では、変換は、“排他的OR”(XOR)演算子を介したシステムIDへのマスクの適用であり、トラフィックID1に関連付けられるマスクは、0000bというマスクである。変換された各システムID123は、その後辞書順にソートされ、接合130されて、0000/1000/1001bというパスIDを構築する。この手続きは、他の3つの等コスト最短パスの各々について繰り返される。例えば、パスA−Z−Bについて、ノードA104についての第1のシステムID1001bが識別され、ノードZ116についての第1のシステムID0011bが識別され、ノードB102についての第1のシステムID1000bが識別される。これらの識別されたシステムIDは変換され、辞書順にソートされ、接合されて、パスID0011/1000/1001bを形成する。
4つのパスIDの各々がこの処理に従って構築された後、それらはランク付けされ、最低値を有するパスIDが選択され、そのパスIDに関連付けられる等コスト最短パスが、そのトラフィックIDのトラフィックについてのパスであるように決定される。この例では、パスIDは、バイナリ符号なし整数として各ビットパターンを扱うことにより比較されるが、本発明の他の実施形態では、パスIDの比較の他の方法が可能であり、当技術分野において周知である。ここでは、パスA−W−BについてのパスIDは、他の3つのパスIDよりも小さく、したがってトラフィックID1についてのトラフィックは、パスA−W−Bを使用してこのネットワーク内でルーティングされるであろう。この処理は、トラフィックID2〜4の各々について繰り返される。
他方、トラフィックID5〜8についてのタイブレーキングアルゴリズムは、各等コスト最短パスにおけるブリッジを表すためにシステムIDの異なるセットに依存する。トラフィックID5〜8について4つの物理的等コスト最短パスのうち1つを選択するために、各ノードに割り当てられる第2のシステムIDが選択124される。例えば、パスA−W−BについてのパスIDは、ここで、ノードA104についての第2のシステムID1000b、ノードW110についての第2のシステムID0001b、及び、ノードB102についての第2のシステムID1001bを用いて構築されている。
ネットワーク118における障害の前は、構築された4つのパスのうち1つが、トラフィックID5〜8の各々について、タイブレーキングアルゴリズム及びその特定のトラフィックIDに関連付けられる変換を用いて選択される。図1では、この処理がトラフィックID6について示されており、トラフィックID6は0001bのマスクに関連付けられる。したがって、そのパスにおける第2のシステムIDの各々は、マスク0001bに対してシステムIDをXORすることにより変換125される。これは、パスA−W−B1000/0001/1001bについての元のシステムIDが1001/0000/1000bに変換される結果となる。1000b XOR 0001b=1001bであるから、当該結果の最初の4ビットが発生し、0001b XOR 0001b=0000bであるから、当該結果の真ん中の4ビットが発生し、1001b XOR 0001b=1000bであるから、当該結果の最後の4ビットが発生する。変換されたシステムIDの各セットは、その後、辞書順にソートされ、特定されたトラフィックIDについてのタイブレーキングにおいて使用されるべきパスIDを形成するように接合132される。
トラフィックID6について、この手続きは、他の3つの等コスト最短パスの各々に対して発生する。パスIDが、これらの4つの等コスト最短パスの各々について構築された後、最低値を有するパスIDを選択することにより、タイブレーキングが発生126し、そのパスIDに関連付けられる等コスト最短パスが、トラフィックID6についてのパスとなるように判定される。この例では、最も低いパスIDは、ノードA−W−Bを通過するパスについての0000/1000/1001bである。この処理は、トラフィックID6〜8の各々について、その特定のトラフィックIDに関連付けられる変換と共に各パス内の各ノードの第2のシステムIDを使用する度に、繰り返される。
障害前126のトラフィックID1〜4及び5〜8の両方についての最短パスの選択の終わりに、トラフィックID1及び6についてのトラフィックは、A−W−Bパスを通過し、トラフィックID2及び8についてのトラフィックは、A−X−Bパスを通過し、トラフィックID3及び5についてのトラフィックは、A−Y−Bパスを通過し、トラフィックID4及び7についてのトラフィックは、A−Z−Bパスを通過する。ネットワーク内の各ノードは、これらのパスを独立して計算し、これらの転送手続きを実装するために使用される正確な転送状態をインストール済みである。
ある時点において、ノードA104及びW110間のリンクに影響する障害がネットワーク内に発生118する。ノードA104及びノードW110のうち少なくとも1つは、このリンクの喪失を示す広告をネットワークを通じてフラッディングする。この情報で、システム内の各ノードは、そのリンクステートデータベースから当該リンク(又は当該リンクの有効性)を削除する。結果的に、トラフィックID1及び6についてのトラフィックはもはや、ネットワークを通じて有効なパスを有さず、各トラフィックIDについての新たなパスが各ノードにより判定される。
トラフィックID1及び6の各々についての新たなパスを判定するために、各ノードは再び等コスト最短パスを構築し、そのトラフィックIDについての変換を用いて、構築された各等コスト最短パスについてのパスIDを構築し、パスを選択するために共通のタイブレーキングアルゴリズムを適用する。例えば、障害を除いて他にネットワークが全く変化していないと仮定すると、等コスト最短パスは120におけるように構築されるであろうが、1つ目のパスA−W−Bはもはや存在しないであろう。トラフィックID1について、システムIDは、これらのパス122における各ノードの第1のシステムIDを用いて選択されるであろう(重ねて、パスA−W−BについてのパスIDは構築されないであろう)。システムIDの各々は、マスク0000bである、トラフィックID1に関連付けられる変換を使用して変換123されるであろう。この障害後の状態においては、変換されたシステムIDは、辞書順に並び替えられ、パスIDを生成するために接合134され、最も低いパスIDが選択128される。トラフィックID1についてのトラフィックは、これからパスA−X−Bを通過するであろう。
同様に、トラフィックID6について、A−W−Bについてのパスは存在しないであろうが、パス内の各ノードの第2のシステムIDを使用して、124におけるのと同様にシステムIDが選択されるであろう。第2のシステムIDの各々は、トラフィックID6に関連付けられる0001bのマスクを使用して変換125される。この障害後の状態において、変換されたシステムIDは、辞書順に並び替えられ、パスID136を形成するために接合136され、その後、最も低い結果のパスIDが選択128される。トラフィックID6についてのトラフィックは、これからパスA−Y−Bを通過するであろう。
この結果は、スプリットタイブレーカの使用から生じる利益の1つを示している。旧来の802.1aqの動作によれば、A−W−Bパスを通過する全てのトラフィックは、障害118の後、他の生き残った1つのパスA−X−Bにシフトされるであろう。結果的に、障害の影響を受ける全てのトラフィックを他の1つのパス上にこのようにシフトすることは、そのパス上の負荷を著しく増加させるであろう。よくても、これはそのパス内の全てのリンク及びノードの性能を低下させ、最悪の場合、トラフィックが破棄され、又はノード若しくはリンクの障害が発生する恐れがあるほど、これらのノード及びリンクが混雑に陥ることが起こりうる。
その代わりに、システムのノードについてのシステムIDの意図的な選択、並びにネットワークのトラフィックについてのトラフィックID及び変換の慎重な選択を通じて、スプリットタイブレーカを実装するネットワークは、生き残った複数の等コスト最短パスにわたって、影響を受けるトラフィックを分散することにより、障害に適切にかつ自動的に適応することが可能である。例えば、図1においてトラフィックID1及び6に関連付けられるトラフィックは、障害118の後に同一のパスにシフトされず、その代わりに、このトラフィックは、2つのパス(A−X−B及びA−Y−B)間で分散される。さらに、リンク障害の後で、トラフィックの著しい拡散がネットワーク内の生き残ったリソースの間に発生することを保証するように、マルチパス及びスプリットタイブレーカ構成の組み合わせを設計するためにネットワークのトポロジとトラフィック割り当てを分析することが可能である。
さらに、障害116が是正された場合、他のパスのトラフィックが動かないままである一方、トラフィックID1及びトラフィックID6に関連付けられるトラフィックは、元のパス(A−W−B)に戻るであろう。これは、トポロジーの変化により誘発されるネットワーク内のパケットフローの並び替えの可能性を最小化する。
結果的に、ホップ・バイ・ホップの等コストマルチパスルーティング(ECMP:equal cost multi-path routing)の多くの利益はそのままで、但し、障害シナリオにおけるフロー順序の保全、ネットワークの予測可能性、並びにOAM(Operations, Administration, and Maintenance)の実用性及びテスト容易性、における大いなる改善がもたらされる。さらに、スプリットタイブレーカを採用するシステムが、旧来の802.1aqネットワークで典型的に使用されるよりも多くのトラフィックIDを使用することにより利益を受ける一方、各ノードの転送データベース内のマルチキャスト状態の量は、トラフィックIDのこの増加により影響を受けない。さらに、いかなる順序においても全ての障害の正確な影響は確実に予測され得るため、ネットワークの計画は単純化される。
図2は、本発明の一実施形態に係る802.1aqのためのスプリットタイブレーカを実装する例示的なネットワークエレメント210の機能ブロック図を示す。図2に示されるように、ネットワークエレメント210は、制御プレーン212とデータプレーン214とを含む。データプレーン214の役割は、インバウンドパケット252を受信すること、及び、転送情報ベース236内の情報に従って、アウトバウンドパケットとしてこれらのパケットを転送することである。ネットワークエレメント210がBEBとして機能し、したがってバックボーンネットワークの端に位置し、別個のネットワーク(例えば、顧客のネットワーク)とインタフェース接続している本発明の実施形態においては、インバウンドのパケット252は、別個のネットワークから到着する。インバウンドパケット252が別個のネットワークから受信される802.1adパケットである、本発明の実施形態では、転送モジュール234が、それらをアウトバウンドパケット254としてバックボーンネットワークに転送する前に、802.1ahヘッダと共にインバウンドパケット252をカプセル化し得る。(802.1adパケット及び802.1ahパケットに関する更なる詳細は、図3に関して本明細書中の後で提示される)
あるいは、本発明の実施形態において、ネットワークエレメント210は、バックボーンネットワーク及び別個のネットワークの端において、BEBとして機能することができ、802.1adヘッダと共に既にカプセル化されている、バックボーンネットワークからのインバウンドパケット252を受信することができる。このシナリオでは、転送モジュール234が、パケットをアウトバウンドパケット254として別個のネットワークに送信する前に、パケットから802.1adヘッダを逆カプセル化(即ち削除)するであろう。ネットワークエレメント210がBCBとして機能し、よってバックボーンネットワークのコア内にある、本発明の実施形態では、インバウンドパケット252及びアウトバウンドパケット254の両方が802.1adパケットであり、転送モジュール234によってさらにカプセル化又は逆カプセル化されないであろう。
制御プレーン212は、ネットワークエレメント210の動作を制御するように構成される。制御プレーン212は、リンクステートプロトコルモジュール216を含み、リンクステートプロトコルモジュール216は、本明細書で後述される他の機能性の中で、バックボーンネットワークのネットワークエレメントの間でリンクステートメッセージ250を交換(即ち、送信及び受信)することにより、ネットワークの他のネットワークエレメントと通信する。リンクステートメッセージ250は、ネットワーク内のノード間でトポロジー情報を通信する、IS−IS又はOSPFといったリンクステート型ルーティングプロトコルを採用するネットワークにおいて使用されており、そのようなリンクステート型ルーティングプロトコルは、当業者によりよく理解されている。リンクステートメッセージ250の交換は、ネットワーク内の各ネットワークエレメントが、ネットワークトポロジーの理解を同期させることを可能にする。本発明の実施形態では、リンクステートメッセージは、2001年3月8日の“IS-IS Extensions Supporting IEEE 802.1aq Shortest Path Bridging”と題するIETF(Internet Engineering Task Force)インターネットドラフト バージョン5(draft-ietf-isis-ieee-aq-05.txt)に記載された、IS−ISプロトコルのバージョンに従って送信される。本発明の実施形態によれば、基盤となるIS−ISプロトコルは、各ネットワークエレメントが、単にシステムIDを1つだけ送信する替わりに、特定のネットワークエレメントに割り当てられている複数のシステムIDを送信及び受信することを可能にするためにさらに修正される。この修正は、スプリットタイブレーキングを目的として、ネットワークエレメント毎に複数のシステムIDを分散することを可能にするための1つの方法である。しかしながら、各ネットワークエレメントにおいてこの情報を手動で構成するといった、他の方法が利用されてもよい。
ネットワークの他のネットワークエレメントからリンクステートメッセージ250のセットを受信すると、リンクステートプロトコルモジュール216は、ネットワークのトポロジーを判定するために、これらのリンクステートメッセージ250からの情報を利用する。リンクステートプロトコルモジュール216は、リンクステートデータベースモジュール224にアクセス260することによって、ネットワークについてのトポロジー情報を格納及び取得する。リンクステートデータベースモジュール224は、ネットワークのネットワークエレメントを表すエントリ、及びこれらのネットワークエレメント間の接続を含むリンクステートデータベース226を含む。本発明の実施形態では、これらのネットワークエレメントは、イーサネットブリッジであり、イーサネットブリッジ間の接続は、イーサネットリンクである。さらに、リンクステートデータベース226は、等コスト最短パス間のスプリットタイブレーキングのために用いられる、各ネットワークエレメント228についての複数のシステムIDをも格納する。
リンクステートデータベースモジュール224内に格納されたネットワークトポロジー情報にアクセス260することにより、リンクステートプロトコルモジュール216は、パス構築モジュール220を使用してネットワークエレメント間の最短パスを構築することができる。本発明の実施形態では、パス構築モジュール220は、ネットワーク内のBEBペア間の1以上の等コスト最短パスを構築するために、ダイクストラのアルゴリズムの実装を使用し、続いて、FIB構築の一部として、その特定のB−VIDに割り当てられる所与のBEBのペア間のI−SIDの共通集合(intersection)を決定する。
パス構築モジュール220によりBEBのペア間に1以上の等コスト最短パスが存在すると判定される場合、リンクステートプロトコルモジュール216は、判定された等コスト最短パスのうち1つを選択するために、タイブレーキングモジュール222を利用する。本発明の実施形態では、タイブレーキングモジュール222は、B−VID/トラフィックIDに関連付けられる変換、及びB−VID/トラフィックIDに関連付けられる各ネットワークエレメント228についての複数のシステムIDのうち特定の1つを使用して、特定のトラフィックIDについての特定のノードのペア間のパスについてタイブレーキングを実行する。
ネットワークのネットワークエレメント間の最短パスを判定後、リンクステートプロトコルモジュール216は、転送モジュール234を更新266して、最短パスに従ってパケットを転送するようにデータプレーン214を構成する。本発明の実施形態では、最短パス情報は、転送情報ベース(FIB)236に格納されており、転送情報ベース236は、1以上の出力インタフェースに対し、1以上の入力インタフェース、宛て先アドレス、及びB−VIDをマッピングするエントリを含む。ネットワークトポロジーにおける変更を示す、追加のリンクステートメッセージ250を受信すると、リンクステートプロトコルモジュール216がリンクステートデータベースモジュール224を更新し、最短パスを構築し、再度転送モジュール234を更新266するように、この処理が繰り返される。
図3は、本発明の一実施形態に係るネットワークトラフィックをカプセル化するために使用されるパケットヘッダを示す。上述したように、BEB装置として機能するネットワークエレメントは、外部のネットワークからトラフィックを受信し、外部のネットワークはクライアントネットワークであり得る。本発明の実施形態では、クライアントネットワーク上のイーサネットトラフィックは、ペイロード310と、クライアント宛て先MACアドレス(C−DA)318、クライアント発信元MACアドレス(C−SA)316、及び少なくとも1つの仮想LAN ID(VID)を含むクライアントヘッダ330とを含む。本発明の実施形態によれば、図3に示す通り、クライアントヘッダは、IEEE802.1adにより詳述されるようにS−VID314及びC−VID312の両方を含む。本発明の他の実施形態では、クライアントヘッダは、802.1Qでのように、C−VIDのみを含み得る。いうまでもなく、他のイーサネットフレームフォーマットが、クライアントネットワークにより使用されてもよい。クライアントトラフィックを受信すると、BEBネットワークエレメントは、IEEE802.1ahバックボーンヘッダ340と共にトラフィック350をカプセル化し、IEEE802.1ahバックボーンヘッダ340は、バックボーンネットワークのネットワークエレメントが、クライアントMACアドレス空間に基づいて転送する替わりに、バックボーンベースのMACアドレス空間に基づいてトラフィックを転送することを可能にする。802.1ahヘッダ330は、バックボーン(B)宛て先MACアドレス(B−DA)326、バックボーン発信元MACアドレス(B−SA)324、プロバイダVLAN ID(B−VID)322、及びサービス識別子(I−SID)320を含む。
図4のフロー図の動作について、図1、2、5、7、9及び10の例示的な実施形態を参照して説明する。しかしながら、図4のフロー図の動作は、図1、2、5、7、9及び10を参照して論じられる以外の本発明の実施形態により実行されることができ、図1、2、5、7、9及び10を参照して論じられる実施形態は、図4のフロー図を参照して論じられるものとは異なる動作を実行することができることを理解すべきである。
図4は、本発明の一実施形態に係る802.1aqネットワークにおけるスプリットタイブレーカの使用についてのフロー図を示す。ブロック402において、802.1aqネットワーク内のノードは、当該ノードについての第1及び第2のシステム識別子を広告する。第1の及び第2のシステムIDは、それぞれ第1の及び第2のトラフィックIDのセットに関連付けられる。トラフィックIDは、ネットワーク内で異なる仮想ネットワークを区別するために使用され、各トラフィックIDはタイブレーキング変換に関連付けられる。本発明の実施形態では、2以上のシステムIDがノードについて広告され、システムIDの各々は、トラフィックIDの異なるセットに関連付けられる。ある実施形態では、タイブレーキング変換は、マスクと各システムIDとにXOR演算を実行することにより、パスID内のシステムIDを変換するために使用されるマスクである。ブロック404において、ノード402は、ネットワーク内の他の複数のノードの各々についての第3の及び第4のシステムIDを受信する。第3の及び第4のシステムIDは、それぞれ第1の及び第2のトラフィックIDのセットに関連付けられる。本発明の実施形態では、2以上のシステムIDが、ネットワーク内の他の複数のノードの各々について受信され、ノードについてのシステムIDの各々が、トラフィックIDの異なるセットに関連付けられる。ブロック406において、ノードは、ネットワークの第1のノードと第2のノードとの間の複数の異なる等コスト最短パスを構築する。ある実施形態では、最短パスは、それらが同じ数のリンクを包含する場合に等コストであるとみなされる。ある実施形態では、最短パスは、リンク使用統計(link usage statistics)を用いて判定される。ブロック408において、ノードは、1)等コスト最短パスの各々について、そのトラフィックIDに関連付けられるタイブレーキング変換と、そのトラフィックIDに関連付けられるシステムIDを含む、各々がその等コスト最短パスの異なるノードに関連付けられるシステムIDのセットと、を用いてパスIDを構築すること、及び2)等コスト最短パスのうちの1つを選択するためにパスIDに選択アルゴリズムを適用することにより、各トラフィックIDについて、構築された等コスト最短パスのうち1つを選択する。ブロック410において、ノードは、ネットワーク内のシステムID及びトラフィックIDの構成を理由として、選択された1以上の等コスト最短パス上の、複数のトラフィックIDについてのトラフィックに影響する障害に応じて、複数の他の等コスト最短パスにわたって、それらのトラフィックIDに関連付けられるトラフィックを分散させる。本発明の実施形態において、ネットワーク内の各ノードについての複数のシステムID、並びにトラフィックについてのトラフィックID及び変換の選択は、障害により影響を受けるトラフィックが、そのトラフィックについての他の全ての生き残った等コスト最短パスにわたって分散されることを可能にする。
図5は、本発明の一実施形態に係る最短パス及びトラフィック識別子を説明する例示的なネットワークトポロジーを示しており、本発明の一実施形態に係るスプリットタイブレーカを利用する最短パスの論理計算を示す図6と併せて提示されている。図5は、6個のノード−2個のBEBノードであるB502及びA500、並びに4個のBCBノードであるW510、X512、Y514及びZ516を含むバックボーンネットワークを示す。各ノードは、2つのシステムIDを含むが、説明を容易にするために、BCBノードについてのシステムIDのみ示されている。このネットワークは、4つの等コスト最短パス、A−W−B、A−X−B、A−Y−B、及びA−Z−Bを含む。図5中の円は、特定のパス上で転送されるものと判定されたトラフィックIDに関連付けられるトラフィックを示す。例えば、トラフィックID1及び6に関連付けられるトラフィックは、BEBノードA500及びBEBノードB502の間でBCBノードW510を介して転送されるものとされている。
図6は、トラフィックID1〜8に関連付けられるトラフィックが、4つの等コストパス上を進むためにどのように選択されるかの概念的な図を提示する。図1及び図2を参照して上で詳述したように、各ノードは、ネットワークのトポロジーを表すリンクステートデータベースをメンテナンスする。ネットワーク内のBEBノードのペア(ノードA500及びノードB502)について、各ノードは、BEBノード間を通過するトラフィックにおいて使用される各トラフィックIDについて、BEBノード間の等コスト最短パスを計算する。ノードが1以上の等コスト最短パスを算出した場合、ノードは、スプリットタイブレーカを使用してトラフィックIDを有するトラフィックについて1つのパスを選択する。
図6は、スプリットタイブレーキングの理解に有用な第1のテーブル602A及び第2のテーブル602Bを含む。各テーブルは、システムIDの見出し行(606、618)を含み、システムIDは4つの等コスト最短パスの各々における中間ノードに属する。各行は、トラフィックIDの各々に関連付けられる第1列のマスク604でインデックス付けされている。第1のテーブル602Aは、等コスト最短パス内の各中間ノードからの第1のシステムIDのセット606の使用を示す。この例では、第1のシステムIDのセットの各々が、1から4までの範囲内のトラフィックIDのセットに関連付けられる。他方、第2のテーブル602Bは、等コスト最短パス内の各中間ノードからの第2のシステムIDのセット618の使用を示す。この第2のシステムIDは、5から8までの範囲内のトラフィックIDのセットに関連付けられる。トラフィックID1〜4の各々についての等コスト最短パスを判定する場合、第1のテーブル602A及び第1のシステムIDのセット606が用いられる。同様に、トラフィックID5〜8の各々についての等コスト最短パスを判定する場合、第2のテーブル602B及び第2のシステムIDのセット618が用いられる。
図5のように、発信元と宛て先ノードとの間に複数の等コスト最短パスが存在する場合、各パスについてパスIDが構築される。特定のトラフィックIDについて、各パス内の各システムIDは、そのトラフィックIDに関連付けられる変換を使用して変換される。変換された各システムIDは、辞書順に並び替えられ、パスIDを生成するために接合され、最も低いパスIDがそのトラフィックIDについてのパスとして選択される。図6(及び後述する図8)は、この処理の関連する部分を示している。しかしながら、理解を容易にするために、完全なパスIDは、これらの図において示されていない。特に、送信側のBEBノード(図5におけるノードA500)及び受信側のBEBノード(図5におけるノードB502)についてのシステムID及び変換されたシステムIDは示されていない。これらの値は、構築された各パスID内に存在するであろうから、比較される際に互いに相殺される。例えば、A−W−BとA−X−Bの2つのパスを比較する際、各パスの差異のある面は、各パスの第2ホップのみであり、この場合は、ノードWとノードXである。理解を容易にするために、これらの余分な値(例えば、ノードA及びBについてのシステムID)は、明確化のために省略されるが、そのような値を含む完全な例については、図1を参照されたい。
第1のテーブル602Aは、本発明の実施形態に係る、トラフィックID1〜4についてのパスの選択を示す。第1の行610は、トラフィックID1についての中間ノードのシステムID606のうちの1つの変換及び選択を示す。トラフィックIDに関連付けられる変換はマスク0000bであり、ノードW510についての第1のシステムIDのセット、即ち0000bとXORされると、0000bの結果を得る。同様にマスク0000bは、ノードX512、Y514及びZ516の各々についての第1のシステムIDに対して再び適用される。行610における各々の結果は、変換されたシステムIDを表す。本発明の実施形態では、各パス内の各ノードについての第1のシステムID各々は、このようにして変換され、結果は、パスIDを生成するために辞書順に並べ替えられ、接合され、その最低値がパスとして選択される。第1の行610について、ノードW510についての変換されたシステムIDが行610において最も低いバイナリ変換されたシステムIDであるため、選択される(丸で表される)。本発明の他の実施形態では、選択されるパスIDは、最も高い変換されたパスIDを選択するといったような、別のルールやアルゴリズムに従って選択されてもよい。このように、ノードA500とノードB502との間の4つの等コスト最短パスを表す第1の行610内の変換されたシステムIDによれば、トラフィックID1についてのトラフィックは、A−W−Bを用いて転送されるであろう。この手続きは、ネットワーク内の各ノードによって実行されるが、この点において、ノードA500、W510及びB502は、この決定されたパスに従ってトラフィックを認識し転送するために、それらの個別の転送情報ベース236内の転送情報を構成する。
この処理は、2行612、3行614、4行616内のトラフィックID2〜4の各々について同様に実行されるであろう。この処理によれば、0000bのノードX512についての変換されたシステムIDが、第2行612の最低値であるから、トラフィックID2についてのトラフィックはパスA−X−Bを通過するであろう。同様に、トラフィックID3についてのトラフィックは、A−Y−Bのパスを通過し、トラフィックID4についてのトラフィックは、A−Z−Bのパスを通過するであろう。
しかしながら、第2のテーブル602Bが示すように、トラフィックID5〜8についてのパス選択は、パス内の各ノードに関連付けられるシステムIDのセットの第2のシステムIDの変換を含む。例えば、第1のテーブル602A内のノードW510は、その第1のシステムID0000bによって表されていたが、第2のテーブル602B内のノードW510は、その第2のシステムID0001bによって表される。第2のテーブル602Bの第1の行620において、トラフィックID5についてのパス選択が示されている。トラフィックID5についての変換は、マスク0000bであり、それは中間ノードについての第1のシステムIDの各々に適用される。例えば、ノードW510についての第2のシステムIDは0001bであり、これは、XOR演算とともにマスク0000bを適用することにより変換され、その結果0001bとなる。ノードX512について、第2のシステムID0011bは、マスク0000bとXORされた結果0011bとなる。ノードY514について、第2のシステムID0000bは、マスク0000bとXORされた結果0000bとなる。ノードZについて、第2のシステムID0010bは、マスク0000bとXORされた結果0010bとなる。第2のテーブル602Bの第1行620において、各システムIDが変換された後、最も低い変換されたシステムIDが選択される。この最低値は、0000bであり、それは、ノードY514を含むパスがトラフィックID5を使用するトラフィックについてのパスであることを示している。同様に、この処理をトラフィックID6〜8の各々について繰り返し、各中間ノードについて第2のシステムIDのセットを再び使用する。図5は、パス選択完了時におけるトラフィックIDによるトラフィックの流れを表す。トラフィックID1及び6についてのトラフィックは、A−W−Bパスを通過し、トラフィックID2及び8についてのトラフィックは、A−X−Bパスを通過し、トラフィックID3及び5についてのトラフィックは、A−Y−Bパスを通過し、トラフィックID4及び7についてのトラフィックは、A−Z−Bパスを通過する。
図7は、本発明の一実施形態に係る、障害後の図5に示された例示的なネットワークトポロジーを示しており、本発明の一実施形態に係るスプリットタイブレーカを利用する最短パスの論理計算を示す図8と併せて提示される。図5及び6と同様に、図7及び8は、ノードA700及びB702についてのシステムIDを図示せず、パスID全体を表現する代わりに、各パスにおける中間ノードについてのシステムID及び変換されたシステムIDのみを代わりに表示する。
図7は、図5で提示されたのと同一のノードを含む。しかしながら、図7は、トラフィックID1及び6についてのトラフィックに影響する障害718が発生した後のネットワークを示す。この障害は、多くの理由により発生し得る。ノードA700及びW710間のリンクの物理的障害、ノードA及びB710のうち1つ又は両方の障害、又はノードA700及びW710のうち1つ若しくは両方におけるポート若しくはネットワークインタフェースカードの問題を含むが限定されない。この例としてのネットワークでは、ノードA700及びW710のうち1つ又は両方が障害718を検知し、この障害718を示すリンクステートメッセージ250をネットワークの他のノードに送信するであろう。各ノードが障害718のことを知ると、ノードは、そのリンクステートデータベース226を更新260し、トラフィックID1及び6についての新たなパスを計算する。
図8は、図7の3つの生き残った等コスト最短パス上を進むために、トラフィックID1〜8に関連付けられるトラフィックがどのように選択されるかの概念的な図を提示する。障害718に起因して、各ノードは、ノードA500とノードB502との間のパスを計算する際に、ノードW510を通る最短パスを計算することはない。したがって、第1のテーブル802A及び第2のテーブル802BにおけるノードW510の列は、‘X’で印され、考慮されない。図6でのように、第1のテーブル802A及び第2のテーブル802Bの各々は、トラフィックID1〜8の各々に関連付けられる第1列のマスク804を含む。同様に、各テーブルは、システムIDの行を含み、第1のテーブル802Aは、各中間ノードについての第1のシステムIDのセットを含む行806を含み、第2のテーブル802Bは、第2のシステムIDのセットを含む行818を含む。
第1のテーブル802Aに示されるように、ノードA500とノードB502との間の3つの等コストパスが、ネットワーク内の各ノードにより計算される。パス候補が1つ少なく存在するが、トラフィックID1〜4の各々についてのパス選択処理は、図6において前述したように発生する。第1の行810において、トラフィックID1に関連付けられる変換はマスク0000bであり、各中間ノードについての第1のシステムIDのセット806の各々に対してXORされる。この変換の結果、変換されたシステムIDは、ノードX512について0001b、ノードY514について0010b及びノードZ516について0011bとなる。これらの3つの候補のうち、ノードX512についての0001bが最も低く、したがってトラフィックID1についての選択されたパスは、ここでA−X−Bである。このように、ノードA500、X512及びB502の各々は、トラフィックID1に関連付けられるトラフィックが、この決定されたパスに従って転送されることができるように、それらの個別の転送情報ベース236を構成するであろう。この処理は、第2行812、第3行814及び第4行816においてトラフィックID2〜4について継続する。
トラフィックID5〜8の各々についてのパス選択は、第2のテーブル802に表されており、それは、各中間ノードについての第2のシステムIDのセット818を使用する。例えば、トラフィックID6についての新たなパスは、0001bのマスクである、トラフィックID6に関連付けられる変換で、システムID818の各々に第1の変換を行うことにより、第2の行822において判定される。システムID818の各々にマスクを適用することにより、変換されたシステムIDは、ノードX512についての0010b、ノードY514についての0001b、及びノードZについての0011bである。0001bのノードY514についての変換されたシステムIDが、行822の最低値であるから、トラフィックID6についてのトラフィックは、ノードY514を用いて転送されるであろう。その結果、ノードA500、Y514及びB502の各々は、トラフィックID6に関連付けられるトラフィックが、この判定されたパスに従って転送されることができるように、それらの個別の転送情報ベース236を構成するであろう。同様にして、タイブレーキングは、820、824及び826においてトラフィックID5、7及び8の各々についても実行される。上述のように、中間ノードについての第2のシステムIDのセットを変換することに加えて、いくつかの実施形態では、ノードA500及びノードB502についての第1のシステムIDのセットも変換され、3つの変換されたシステムID全てが、辞書順に並べ替えられ、パスIDに接合される。それらの実施形態では、各パスIDは、タイブレーキングを実行し、トラフィックIDについてのパスを選択するために比較される。
複数の各ノードについてのシステムID、トラフィックに割り当てられるトラフィックID、及びトラフィックIDの各々に関連付けられる変換の適切な構成に起因して、タイブレーキングは、それによって、以前A−W−Bを通過していたネットワークトラフィックが、パスA−X−B及びA−Y−Bにインパクトを与える障害の後、2つの異なるパス上を通過することができるようにする。これは、ネットワークが、障害に起因して移動されるトラフィックについて、ネットワークを介して複数のフェイルオーバーパスを利用することにより、障害シナリオにより簡単かつ予測通りに対応できるようにする。影響を受けた全てのトラフィックをブロックとして他の1つのパスにシフトする代わりに、トラフィックが複数のパス間で分散され、障害のインパクトを軽減している。
図9は、本発明の一実施形態に係る例示的なネットワーク上のマルチキャストトラフィックについての最短パスを示す。この図は、明確化のため、2つのトラフィックID(1及び6)のみを利用するトラフィックを示し、典型的には、そのようなネットワークは2以上のトラフィックIDを利用するであろう。本実施形態では、ノードA900は、ノードB902、ノードC904、ノードD906及びノードE908にマルチキャストトラフィックを送信する。ノードA900と受信側ノード902〜908との間には、中間ノードW910、中間ノードX912、中間ノード914及び中間ノード916がある。ノード間のホップ数がパスのコストを示す、本発明の実施形態では、4つの物理等コスト最短パスが、ノードA900と4つの受信側ノード902〜908各々との間に存在すると判定される。図5及び図6と同じ方法で、各パス内の各ノードの第1のシステムIDは、トラフィックID1〜4と関連付けられ、各パス内の各ノードの第2のシステムIDは、トラフィックID5〜8と関連付けられる。重ねて、説明の明確化のために、ノードA900及び受信側ノード902〜908各々についてのシステムIDは図示しない。トラフィックID1についてのパスを選択する際に、中間ノード910〜916各々の第1のシステムIDが、トラフィックID1に関連付けられる変換(例えば、マスク0000b、図示せず)を使用して変換される。これにより、トラフィックID1についてのトラフィックはノードW910を通過することとなり、パスは、A−W−B、A−W−C、A−W−D、及びA−W−Eであると判定される。同様に、トラフィックID6についてのパスの選択は、トラフィックID6に関連付けられる変換(例えば、マスク0001b、図示せず)を使用して、中間ノード910〜916についての第2のシステムIDのセットの変換を含む。これにより、トラフィックID6についてのトラフィックも、ノードW910を通過することとなり、パスは、A−W−B、A−W−C、A−W−D、及びA−W−Eであると判定される。
図10は、本発明の一実施形態に係る、障害後の図9の例示的なネットワーク上のマルチキャストトラフィックのための別の最短パスを示す。この図では、トラフィックID1及び6に影響する障害1018が、中間ノードW910と受信側ノードB902との間で発生する。このシナリオでは、ノードB902に向かうトラフィックID1及び6についてのトラフィックのみが影響を受け、ノードC904、ノードD906及びノードE908に向かうトラフィックID1及び6についてのトラフィックは、引き続きノードW910を通って転送1020されるであろう。トラフィックID1が変換としてマスク0000bを利用すると仮定すると、このマスクは、ノードX912、ノードY914及びノードZ916の各々についての第1のシステムIDに対してXORされるであろう。結果的に、最も低い変換されたシステムIDは、ノードX912についての0001bとなる。同様に、トラフィックID6がマスク0001bを利用すると仮定すると、このマスクは、ノードX912、ノードY914及びノードZ916の各第2のシステムIDに適用される。結果的に、最も低い変換されたシステムIDは、ノードY914についての0001bとなる。その結果、ノードA900からノードB902に向かうトラフィックID1についてのトラフィックは、A−X−Bパスを通過し、ノードA900からノードB902に向かうトラフィックID6についてのトラフィックは、A−X−Cパスを通過する。
図面のフロー図は、本発明の所定の実施形態により実行される動作の特定の順序を示しているが、そのような順序は例示的なものである(例えば、代替的な実施形態は、異なる順序で動作を実行し、所定の動作を結合し、所定の動作を重複させる等してもよい)ことを理解すべきである。
本発明は、数個の実施形態の観点から記載されたが、当業者は、本発明が記載された実施形態に限定されないことを認識し、添付の特許請求の範囲の精神及び範囲内において修正及び変更して実施することができる。したがって、説明は、限定ではなく例示であるものと見なされるべきである。

Claims (20)

  1. 通信ネットワーク内の複数のノードのうちのノードにより実行される、スプリットタイブレーカを用いて前記ネットワーク内の等コスト最短パスの間で選択を行うための方法であって、
    前記ノードについての第1の及び第2のシステム識別子(ID)を広告するステップと、前記第1の及び第2のシステムIDは、それぞれ第1の及び第2のトラフィックIDのセットに関連付けられることと、前記ネットワーク内で異なる仮想ネットワークを区別するためにトラフィックIDが使用されることと、各トラフィックIDは、タイブレーキング変換に関連付けられることと、
    前記ネットワーク内の他の複数のノードの各々についての第3の及び第4のシステムIDを受信するステップと、前記第3の及び第4のシステムIDは、それぞれ前記第1の及び第2のトラフィックIDのセットに関連付けられることと、
    前記ネットワークの第1のノードと第2のノードとの間の複数の異なる等コスト最短パスを構築するステップと、
    各トラフィックIDについて、構築された前記等コスト最短パスのうちの1つを、
    前記等コスト最短パスの各々について、当該トラフィックIDに関連付けられる前記タイブレーキング変換と、当該トラフィックIDに関連付けられるシステムIDを含む、各々が当該等コスト最短パスの異なるノードに関連付けられるシステムIDのセットと、を用いてパスIDを構築し、
    前記等コスト最短パスのうちの1つを選択するために前記パスIDに選択アルゴリズムを適用する、
    ことにより選択するステップと、
    前記ネットワーク内の前記システムID及び前記トラフィックIDの構成に基づいて、選択された1つ以上の等コスト最短パス上の、複数のトラフィックIDについてのトラフィックに影響する障害に応じて、他の複数の等コスト最短パスにわたって当該トラフィックIDに関連付けられるトラフィックを分散させるステップと、
    を含む方法。
  2. 前記複数の異なる等コスト最短パスを構築することは、前記ネットワーク内の前記複数のノードについて全てのペアの最短パスを計算すること、を含む、請求項1の方法。
  3. 前記等コスト最短パスの各々について前記パスIDを構築することは、
    前記トラフィックIDに関連付けられる前記タイブレーキング変換をシステムIDの前記セットの各々に適用することと、
    変換された各システムIDを辞書順に並び替えることと、
    変換され並び替えられた前記システムIDを接合することと、
    を含む、請求項1の方法。
  4. 前記選択アルゴリズムは、
    前記パスIDをランク付けすることと、
    ランク付けされた前記パスIDのうち最低のパスIDを選択することと、
    を含む、請求項1の方法。
  5. 前記通信ネットワークは、802.1aqネットワークであり、
    前記トラフィックIDは、バックボーンVLAN識別子(B−VID)である、請求項1の方法。
  6. 前記障害は、選択された1つの等コスト最短パス上のN個のトラフィックIDについてのトラフィックに影響し、Nは、1より大きい整数であり、
    前記N個のトラフィックIDについてのトラフィックは、N個の異なる等コスト最短パスにわたって分散される、請求項1の方法。
  7. 前記障害を発生させた障害コンポーネントの復旧時に、前記N個の異なるトラフィックIDについての前記トラフィックは、選択された前記1つの等コスト最短パス上で転送される、請求項6の方法。
  8. 通信ネットワーク内の他のネットワークエレメントのセットに連結されるべき、スプリットタイブレーカを用いて前記ネットワーク内の等コスト最短パスの間で選択を行うように構成されるネットワークエレメントであって、
    リンクステートプロトコルモジュールと、
    転送モジュールと、
    を備え、
    前記リンクステートプロトコルモジュールは、
    前記ネットワークのトポロジーを表現し、複数のネットワークエレメントと当該複数のネットワークエレメントの各々についての複数のシステム識別子(ID)とを含むリンクステートデータベース、を管理し、
    前記ネットワークエレメントについての、それぞれ第1の及び第2のトラフィックIDのセットに関連付けられる第1の及び第2のシステムIDであって、前記ネットワーク内で異なる仮想ネットワークを区別するために各トラフィックIDが使用され、各トラフィックIDがタイブレーキング変換に関連付けられる、前記第1の及び第2のシステムIDを広告するために、前記ネットワークを用いてリンクステートメッセージを送信し、
    前記ネットワーク内の他の複数のネットワークエレメントの各々に割り当てられる、それぞれ前記第1の及び第2のトラフィックIDのセットに関連付けられる第3の及び第4のシステムID、を示すリンクステートメッセージを受信し、
    前記リンクステートデータベース内の情報を用いて、前記ネットワークの第1のネットワークエレメントと第2のネットワークエレメントとの間の複数の異なる等コスト最短パスを構築し、
    各トラフィックIDについて、前記複数の異なる等コスト最短パスの各々についてのパスIDを、当該トラフィックIDに関連付けられる前記タイブレーキング変換と、当該トラフィックIDに関連付けられるシステムIDを含む、各々が当該等コスト最短パスの異なるネットワークエレメントに関連付けられるシステムIDのセットと、を用いて構築し、
    前記トラフィックIDの各々について、構築した各パスIDに選択アルゴリズムを適用することにより、対応する構築した前記等コスト最短パスのうちの1つを選択し、
    選択した前記等コスト最短パスを反映するように、1つ以上の転送エントリを構成させる、
    ように構成され、
    前記転送モジュールは、
    ポートから複数のパケットを受信し、
    1つ以上の等コスト最短パス上の複数のトラフィックIDについてのトラフィックに影響する前記ネットワーク内の障害の前に、前記転送エントリに従って前記1つ以上の等コスト最短パス上で前記複数のトラフィックIDについてのトラフィックを送信し、
    前記障害の後に、前記ネットワーク内の前記システムID及び前記トラフィックIDの構成に基づいて、複数の異なる等コスト最短パス上で前記複数のトラフィックIDについてのトラフィックを送信する、
    ように構成される、
    ネットワークエレメント。
  9. 前記リンクステートプロトコルモジュールは、前記ネットワーク内の前記複数のネットワークエレメントについて全てのペアの最短パスを計算することにより、前記複数の異なる等コスト最短パスを構築するように構成される、請求項8のネットワークエレメント。
  10. 前記リンクステートプロトコルモジュールは、
    前記トラフィックIDに関連付けられる前記タイブレーキング変換をシステムIDの前記セットの各々に適用することと、
    変換された各システムIDを辞書順に並び替えることと、
    変換され並び替えられた前記システムIDを接合することと、
    によって、前記複数の等コスト最短パスの各々について前記パスIDを構築するように構成される、請求項8のネットワークエレメント。
  11. 前記選択アルゴリズムは、
    構築された前記パスIDをランク付けすることと、
    ランク付けされた前記パスIDのうち最低のパスIDを選択することと、
    を含む、請求項8のネットワークエレメント。
  12. 前記通信ネットワークは、802.1aqネットワークであり、
    前記トラフィックIDは、バックボーンVLAN識別子(B−VID)である、請求項8のネットワークエレメント。
  13. 前記障害は、選択された1つの等コスト最短パス上のN個のトラフィックIDについてのトラフィックに影響し、Nは、1より大きい整数であり、
    前記障害の後、前記N個のトラフィックIDについてのトラフィックは、N個の異なる等コスト最短パスにわたって送信される、請求項8のネットワークエレメント。
  14. 前記障害を発生させた障害コンポーネントの復旧時に、前記N個のトラフィックIDについての前記トラフィックは、選択された前記1つの等コスト最短パス上で送信される、請求項13のネットワークエレメント。
  15. 複数のネットワークエレメントを含む通信ネットワークであって、
    各ネットワークエレメントは、少なくとも1つの他のネットワークエレメントと通信可能に連結され、
    各ネットワークエレメントは、
    プロセッサと、
    前記プロセッサに連結され、命令を有する非一時的な機械可読媒体と、
    を含み、
    前記命令は、前記プロセッサにより実行される際に、前記プロセッサに、以下の動作を実行させることにより、スプリットタイブレーカを用いて前記ネットワークの等コスト最短パスの間で選択を行わせ、
    前記動作は、
    前記ネットワークエレメントについての第1の及び第2のシステム識別子(ID)を広告することであって、前記第1の及び第2のシステムIDは、それぞれ第1の及び第2のトラフィックIDのセットに関連付けられ、前記ネットワーク内で異なる仮想ネットワークを区別するためにトラフィックIDが使用され、各トラフィックIDは、タイブレーキング変換に関連付けられることと、
    前記ネットワーク内の他の複数のネットワークエレメントの各々についての第3の及び第4のシステムIDを受信することであって、前記第3の及び第4のシステムIDは、それぞれ前記第1の及び第2のトラフィックIDのセットに関連付けられることと、
    前記ネットワークの第1のネットワークエレメントと第2のネットワークエレメントとの間の複数の異なる等コスト最短パスを構築することと、
    各トラフィックIDについて、構築された前記等コスト最短パスのうちの1つを、
    前記等コスト最短パスの各々について、当該トラフィックIDに関連付けられる前記タイブレーキング変換と、当該トラフィックIDに関連付けられるシステムIDを含む、各々が当該等コスト最短パスの異なるネットワークエレメントに関連付けられるシステムIDのセットと、を用いてパスIDを構築し、
    前記等コスト最短パスのうちの1つを選択するために前記パスIDに選択アルゴリズムを適用する、
    ことにより選択することと、
    前記ネットワーク内の前記システムID及び前記トラフィックIDの構成に基づいて、選択された1つ以上の等コスト最短パス上の、複数のトラフィックIDについてのトラフィックに影響する障害に応じて、他の複数の等コスト最短パスにわたって当該トラフィックIDに関連付けられるトラフィックを分散させることと、
    である、通信ネットワーク。
  16. 前記複数の異なる等コスト最短パスを構築することは、前記ネットワーク内の前記複数のネットワークエレメントについて全てのペアの最短パスを計算すること、を含む、請求項15の通信ネットワーク。
  17. 前記等コスト最短パスの各々について前記パスIDを構築することは、
    前記トラフィックIDに関連付けられる前記タイブレーキング変換をシステムIDの前記セットの各々に適用することと、
    変換された各システムIDを辞書順に並び替えることと、
    変換され並び替えられた前記システムIDを接合することと、
    を含む、請求項15の通信ネットワーク。
  18. 前記選択アルゴリズムは、
    前記パスIDをランク付けすることと、
    ランク付けされた前記パスIDのうち最低のパスIDを選択することと、
    を含む、請求項15の通信ネットワーク。
  19. 前記通信ネットワークは、802.1aqネットワークであり、
    前記トラフィックIDは、バックボーンVLAN識別子(B−VID)である、請求項15の通信ネットワーク。
  20. 前記障害を発生させた障害コンポーネントの復旧時に、影響を受ける前記複数のトラフィックIDに関連付けられる前記トラフィックは、選択された前記1つ以上の等コスト最短パス上で転送される、請求項15の通信ネットワーク。
JP2015506333A 2012-04-20 2013-04-10 802.1aqのためのスプリットタイブレーカ Expired - Fee Related JP6141407B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/452,780 2012-04-20
US13/452,780 US8982689B2 (en) 2012-04-20 2012-04-20 Split tiebreakers for 802.1AQ
PCT/IB2013/052859 WO2013156903A1 (en) 2012-04-20 2013-04-10 Selecting between equal cost shortest paths in a 802.1aq network using split tiebreakers

Publications (2)

Publication Number Publication Date
JP2015519795A JP2015519795A (ja) 2015-07-09
JP6141407B2 true JP6141407B2 (ja) 2017-06-07

Family

ID=48577163

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015506333A Expired - Fee Related JP6141407B2 (ja) 2012-04-20 2013-04-10 802.1aqのためのスプリットタイブレーカ

Country Status (7)

Country Link
US (1) US8982689B2 (ja)
EP (1) EP2839614B1 (ja)
JP (1) JP6141407B2 (ja)
KR (1) KR102123034B1 (ja)
CN (1) CN104396197B (ja)
IN (1) IN2014DN09369A (ja)
WO (1) WO2013156903A1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9083645B2 (en) * 2012-09-07 2015-07-14 Dell Products L.P. Systems and methods providing reverse path forwarding compliance for a multihoming virtual routing bridge
CN103731288B (zh) * 2012-10-16 2017-04-12 杭州华三通信技术有限公司 报文转发方法及设备
US9106556B2 (en) * 2013-02-11 2015-08-11 Avaya Inc. Method to achieve the use of an external metric as the primary tie-breaker in intermediate system to intermediate system (ISIS) route selections
EP2784998B1 (en) * 2013-03-29 2018-10-17 Mitsubishi Electric R&D Centre Europe B.V. Method and device for allocating resources in a mesh communications network for setting up a data stream transmission
CN104184667B (zh) * 2013-05-22 2017-09-15 新华三技术有限公司 一种M‑in‑M模式的SPB网络中的组播流量迁移方法和装置
CN104219145B (zh) * 2013-05-31 2017-10-17 英业达科技有限公司 网络系统及路由方法
US9860081B2 (en) * 2013-06-18 2018-01-02 Extreme Networks, Inc. General user network interface (UNI) multi-homing techniques for shortest path bridging (SPB) networks
EP2993842A1 (en) * 2014-09-05 2016-03-09 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO Search for disjoint paths through a network
CN106330748B (zh) 2015-06-30 2019-04-09 中兴通讯股份有限公司 一种流量控制方法及装置
JP2017118355A (ja) * 2015-12-24 2017-06-29 富士通株式会社 影響範囲特定プログラム及び影響範囲特定装置
CN106453084B (zh) * 2015-12-30 2017-07-07 中国人民解放军国防科学技术大学 一种基于拥塞系数的混合数据中心网络流调度方法
EP3253013B1 (en) * 2016-06-02 2020-01-15 Mitsubishi Electric R&D Centre Europe B.V. Ultra-low transmission latency for sporadic network traffic
WO2019003993A1 (ja) * 2017-06-26 2019-01-03 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
US11563670B2 (en) 2018-10-12 2023-01-24 At&T Intellectual Property I, L.P. Methods, devices and systems for determining a target path
US10812371B2 (en) 2018-10-12 2020-10-20 At&T Intellectual Property I, L.P. Methods, devices and systems for determining a target path in a network

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5684800A (en) 1995-11-15 1997-11-04 Cabletron Systems, Inc. Method for establishing restricted broadcast groups in a switched network
US6084858A (en) 1997-01-29 2000-07-04 Cabletron Systems, Inc. Distribution of communication load over multiple paths based upon link utilization
US20070002770A1 (en) 2005-06-30 2007-01-04 Lucent Technologies Inc. Mechanism to load balance traffic in an ethernet network
EP1943782B1 (en) * 2005-10-05 2012-03-28 Nortel Networks Limited Provider link state bridging
EP1935145B1 (en) 2005-10-11 2011-12-21 Telefonaktiebolaget LM Ericsson (publ) Method of generating spanning trees
US7756035B2 (en) 2006-01-31 2010-07-13 Nortel Networks Limited Planning routes and allocating identifiers to routes in a managed frame-forwarding network
US7911944B2 (en) 2007-12-26 2011-03-22 Nortel Networks Limited Tie-breaking in shortest path determination
WO2010104434A1 (en) 2009-03-12 2010-09-16 Telefonaktiebolaget L M Ericsson (Publ) Global provisioning of zero-bandwidth traffic engineering label switched paths
US8509618B2 (en) 2009-05-06 2013-08-13 Ciena Corporation Photonic routing systems and methods for loop avoidance
US8248925B2 (en) 2009-09-08 2012-08-21 Rockstar Bidco, LP Method and apparatus for selecting between multiple equal cost paths
CA2775951A1 (en) 2009-10-02 2011-04-07 Telefonaktiebolaget L M Ericsson (Publ) Technique for controlling data forwarding in computer networks
KR20130060170A (ko) 2010-03-26 2013-06-07 록스타 비드코, 엘피 라우팅형 이더넷 네트워크에서의 분산형 장애 복구
US9210071B2 (en) * 2010-08-16 2015-12-08 Telefonaktiebolaget L M Ericsson (Publ) Automated traffic engineering for fat tree networks
US8553584B2 (en) * 2010-09-08 2013-10-08 Telefonaktiebolaget L M Ericsson (Publ) Automated traffic engineering for 802.1AQ based upon the use of link utilization as feedback into the tie breaking mechanism
US9813257B2 (en) 2010-09-10 2017-11-07 Extreme Networks, Inc. Access network dual path connectivity
US8949385B2 (en) 2011-09-27 2015-02-03 Avaya, Inc. Method and apparatus for resolving conflicting unicast advertisements in a transport network

Also Published As

Publication number Publication date
KR102123034B1 (ko) 2020-06-15
EP2839614B1 (en) 2016-10-26
KR20150013536A (ko) 2015-02-05
WO2013156903A1 (en) 2013-10-24
EP2839614A1 (en) 2015-02-25
CN104396197A (zh) 2015-03-04
CN104396197B (zh) 2017-10-27
US20130279323A1 (en) 2013-10-24
JP2015519795A (ja) 2015-07-09
IN2014DN09369A (ja) 2015-07-17
US8982689B2 (en) 2015-03-17

Similar Documents

Publication Publication Date Title
JP6141407B2 (ja) 802.1aqのためのスプリットタイブレーカ
JP6117911B2 (ja) 802.1aqのための3段折り返しclosの最適化
US9954769B2 (en) Inter-domain fast reroute methods and network devices
JP6250825B2 (ja) データネットワークに最大冗長木(maximally redundant tree)をデプロイする方法およびシステム
US8565230B2 (en) Shared virtual tunnels supporting Mac learning in communication networks
US8694664B2 (en) Active-active multi-homing support for overlay transport protocol
EP3841711A1 (en) Loop conflict avoidance in a network computing environment
US8553584B2 (en) Automated traffic engineering for 802.1AQ based upon the use of link utilization as feedback into the tie breaking mechanism
US20140341029A1 (en) Encoding a payload hash in the da-mac to facilitate elastic chaining of packet processing elements
CN108574616A (zh) 一种处理路由的方法、设备及系统
JPWO2009051179A1 (ja) キャリアネットワーク接続装置およびキャリアネットワーク
US20140112188A1 (en) Architecture For Virtualization And Distribution Of Routing Information Used In A Transport Network
EP3920476A1 (en) Fault protection method, node, and storage medium
WO2020230146A1 (en) Method and apparatus for layer 2 route calculation in a route reflector network device
Gopalan et al. Fast recovery from link failures in ethernet networks
US20150036508A1 (en) Method and Apparatus For Gateway Selection In Multilevel SPB Network
WO2022053007A1 (zh) 网络可达性验证方法及装置、计算机存储介质
US12034632B2 (en) Fault protection method, node, and storage medium
WO2023088244A1 (zh) 一种路径确定方法及装置
Amaral et al. An L2 policy based multipath fabric

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170425

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170502

R150 Certificate of patent or registration of utility model

Ref document number: 6141407

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees