JP2015515809A - 仮想ファブリックリンク障害復旧のためのシステムおよび方法 - Google Patents

仮想ファブリックリンク障害復旧のためのシステムおよび方法 Download PDF

Info

Publication number
JP2015515809A
JP2015515809A JP2015503323A JP2015503323A JP2015515809A JP 2015515809 A JP2015515809 A JP 2015515809A JP 2015503323 A JP2015503323 A JP 2015503323A JP 2015503323 A JP2015503323 A JP 2015503323A JP 2015515809 A JP2015515809 A JP 2015515809A
Authority
JP
Japan
Prior art keywords
link
aggregation switch
aggregation
switch
port interfaces
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015503323A
Other languages
English (en)
Other versions
JP5873597B2 (ja
Inventor
ビナヤガム,アナンド
ジャコブ・ダ・シルバ,ロベルト・エイチ
Original Assignee
アルカテル−ルーセント
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/431,116 external-priority patent/US8913489B2/en
Application filed by アルカテル−ルーセント filed Critical アルカテル−ルーセント
Publication of JP2015515809A publication Critical patent/JP2015515809A/ja
Application granted granted Critical
Publication of JP5873597B2 publication Critical patent/JP5873597B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/58Association of routers
    • H04L45/586Association of routers of virtual routers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • H04L41/0661Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/18Loop-free operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • H04L45/245Link aggregation, e.g. trunking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/48Routing tree calculation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/58Association of routers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/66Layer 2 routing, e.g. in Ethernet based MAN's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/40Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using virtualisation of network functions or resources, e.g. SDN or NFV entities
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Abstract

アグリゲーションスイッチは、マルチシャーシリンクアグリゲーショングループによってエッジノードに接続され、仮想ファイバリンクは、アグリゲーションスイッチにわたってMACアドレステーブルを同期するように、MACアドレスに関してアグリゲーションスイッチ間で情報を交換するための接続をもたらす。仮想ファイバリンクの障害が検出されたときは、マルチシャーシリンクアグリゲーショングループは、各リンクアグリゲートがエッジノードをアグリゲーションスイッチの1つに接続する状態で、2つ以上のリンクアグリゲートに再構成される。ネットワーク内のループを防止するために、リンクアグリゲートにわたってスパニングツリープロトコルが起動される。MACアドレステーブルはフラッシュされ、2つ以上のリンクアグリゲートによって再学習される。

Description

本発明は一般にデータネットワークに関し、具体的には1つまたは複数のデータネットワークのノード間のトポロジー的な冗長性および回復力をもたらすためのシステムおよび方法に関する。
データネットワークは、多くの異なるコンピューティングデバイス、例えばパーソナルコンピュータ、IP電話デバイス、またはサーバが、互いに、および/またはネットワークに接続された様々な他のネットワーク要素またはリモートサーバと通信することを可能にする。例えばデータネットワークは、非限定的に例えばボイスオーバIP(VoIP)、データおよびビデオアプリケーションを含む複数のアプリケーションをサポートする、メトロイーサネット(登録商標)または企業イーサネットネットワークを含むことができる。このようなネットワークは通常、ネットワークを通してトラフィックをルーティングする、一般にスイッチまたはルータとして知られる多くの相互接続されたノードを含む。
様々なノードは多くの場合、ネットワークのサイズに応じて一般に2つまたは3つの「階層」または「レイヤ」を特徴付ける、ネットワークの特定のエリア内のそれらの場所に基づいて区別される。通常は3階層のネットワークは、エッジレイヤ、アグリゲーションレイヤ、およびコアレイヤからなる(一方、2階層ネットワークは、エッジレイヤおよびコアレイヤのみからなる)。データネットワークのエッジレイヤは、ローカルエリアネットワークなどの企業ネットワークまたはホームネットワークから、メトロまたはコアネットワークへの接続性をもたらすエッジ(アクセスとも呼ばれる)ネットワークを含む。エッジ/アクセスレイヤは、ネットワークのエントリポイントであり、すなわちそれに顧客ネットワークワークが名目的に接続され、エッジレイヤにあるスイッチはエッジノードとして知られる。種々のタイプのエッジネットワークは、デジタル加入者線、ハイブリッドファイバ同軸(HFC)、およびファイバトゥザホームを含む。エッジノードは、例えば接続されたデバイスに対するL2スイッチング機能を行うことができる。エッジノードは一般に、複数のエッジノードから来るアクセスリンクを終端するアグリゲーションレイヤに接続される。アグリゲーションレイヤにあるスイッチは、アグリゲーションスイッチとして知られる。アグリゲーションスイッチは、例えばアグリゲートリンクを通じてエッジノードから受信されるトラフィックの、L2スイッチングおよびL3ルーティングを行うことができる。アグリゲーションレイヤは、アグリゲーションスイッチから(3階層ネットワークにおいて)、またはエッジノードから(2階層ネットワークにおいて)受信されるトラフィックのレイヤ3/IPルーティングを行う、メトロまたはコアネットワークレイヤに接続される。理解されるように、ネットワークの各増分のレイヤにおけるノードは通常、より大きな容量およびより高速のスループットを有する。
データネットワークが直面する主な課題の1つは、満足なネットワーク性能をもたらすために決定的に重要であるネットワーク回復力、すなわち断続的な構成要素障害、リンク障害などにもかかわらず高い可用性を維持する能力の必要性である。ネットワーク回復力は、一部はトポロジー的な冗長性によって、すなわち単一の障害ポイントを防止するために冗長ノード(およびノード内の冗長な構成要素)、およびノード間の複数の物理パスをもたらすことによって達成することができ、ならびに一部は障害の発生後すぐに、ネットワークを通るトラフィックフローをルーティングするために代替パスに収束するように、冗長性を利用するためのL2/L3プロトコルによって達成することができる。理解されるように、代替パスへのシームレスな遷移を達成するために、検出および収束時間は迅速に(有利には1秒未満で)行われなければならない。
イーサネットプロトコルは、コンピュータとネットワークの間で通信するためのホームおよび企業ネットワークなどの、ローカルエリアネットワーク(LAN)において普遍的に用いられるトランスポート技術である。しかしアクセスおよびアグリゲーションネットワークならびにメトロネットワークにおける、イーサネットプロトコル技術の使用は、増大し続け、企業ネットワークにおけると同様にエッジネットワークに大変革を起こしている。アクセス技術としてイーサネットは他のアクセス技術よりも重要な利点、すなわち(i)データ、ビデオ、および音声アプリケーションのために将来にわたって使用され得るトランスポート、(ii)データサービスのためのコスト効率の良いインフラストラクチャ、および(iii)簡潔であり相互運用性を確実にするようになる世界的に受け入れられる標準、を提供する。
イーサネット技術を、エッジおよびアグリゲーションレイヤネットワークにおけるキャリア品位のサービス環境に適合させるために、障害に対する回復力を含む対処すべきいくつかの問題がある。1つの知られている解決策では通例、イーサネットネットワークにおいて障害が起きたときに障害を検出し、トラフィックを代替パスに迂回するために、スパニングツリープロトコル(STP)が用いられる。一般にSTPは、スイッチ間の複数の物理パスに依存するが、任意の時点では特定のパケットフローに対して1つのパスだけがアクティブあり、他方のパスは、ブロックモード(「アクティブ/パッシブ」パラダイムを規定する)に置かれる。障害が起きたときは、代替パスはブロックモードからアクティブ状態にされ、それによって接続を再確立する。
しかしSTPは一部のネットワークトポロジーにおいて結果として、非限定的にエッジノードとデータネットワークのアグリゲーションスイッチとの間の収束を含む、許容できない収束時間(例えば最大で数秒)を生じ得る。さらにSTPはアクティブ/パッシブ動作パラダイムをもたらすだけであり、それによってすべてのリンクが同時に能動的にトラフィックを転送することはない。
IEEE 802.1AX−2008、2008年11月3日 IEEE 802.1Q、Virtual Bridged Local Area Networks、2005年版 IEEE 802.1D、Standard for Local and metropolitan area networks:Media Access Control(MAC)Bridges、2004年版
したがって非限定的に、イーサネットネットワークのエッジノードとアグリゲーションスイッチの間などの、1つまたは複数のデータネットワークのノード間の回復力をもたらすためのシステムおよび方法の必要性がある。回復力があり、様々なタイプのネットワークノードに適合可能な通信制御プロトコルをもたらすための、システムおよび方法の必要性がある。このようなネットワークにおける1つまたは複数のリンクの障害による復旧をもたらすためのシステムおよび方法の必要性がある。
本発明によるネットワークアーキテクチャの一実施形態の概略ブロック図である。 本発明によるマルチシャーシシステムの一実施形態の概略ブロック図である。 本発明によるマルチシャーシシステムにおけるアグリゲーションスイッチの一実施形態の概略ブロック図である。 本発明によるマルチシャーシシステムにおけるアグリゲーションスイッチの、ネットワークインターフェースモジュールの一実施形態の概略ブロック図である。 本発明によるマルチシャーシシステムにおけるアグリゲーションスイッチを通るパケットフローの一実施形態の概略ブロック図である。 本発明によるマルチシャーシシステムにおける送信元アドレス学習の一実施形態の概略ブロック図である。 本発明によるマルチシャーシシステムにおけるパケットのプリペンドされたヘッダの一実施形態の概略ブロック図である。 本発明によるアグリゲーションスイッチの管理制御モジュールの一実施形態の概略ブロック図である。 本発明による、仮想ファイバリンクが作動可能なときの、マルチシャーシシステムにおけるリンクステータスの一実施形態の概略ブロック図である。 本発明による仮想ファイバリンクの接続障害の場合のマルチシャーシシステムにおけるリンクステータスの一実施形態の概略ブロック図である。 本発明による、仮想ファイバリンクを通して接続障害が生じたときの復旧のための一実施形態の概略ブロック図である。 本発明による、仮想ファイバリンクを通して接続障害が生じたときの復旧のための方法の一実施形態の論理フロー図である。 本発明による、アグリゲーションスイッチ上のマルチシャーシリンクアグリゲートの再構成の方法の一実施形態の論理フロー図である。 本発明による、アグリゲーションスイッチによるスパニングツリープロトコル(STP)イネーブル化のための方法の一実施形態の論理フロー図である。 本発明による、VFLが作動可能のときに、アグリゲーションスイッチによってマルチシャーシモードに戻るための方法の一実施形態の論理フロー図である。 本発明による、アグリゲーションスイッチによってスタンドアロンモードで動作する方法の一実施形態の論理フロー図である。 本発明による、アグリゲーションスイッチによってマルチシャーシモードで動作する方法の一実施形態の論理フロー図である。
図1は、ネットワークノードの能力をより十分に利用する、アクティブ/アクティブパラダイム(すなわちすべてのリンクが同時に能動的にトラフィックを転送する)をもたらすマルチシャーシリンクアグリゲーションを有する、回復力のあるネットワーク100の一実施形態を示す。本明細書では以下の略称が用いられる。
CMM シャーシ管理モジュール
LAG リンクアグリゲーション
L2 ネットワークに対するOSIモデルのレイヤ2(「データリンクレイヤ」)
L3 ネットワークに対するOSIモデルのレイヤ3(「ネットワークレイヤ」)
MAC 媒体アクセス制御プロトコル
MC−LAG マルチシャーシリンクアグリゲートグループ
MC−VFA マルチシャーシ仮想ファブリックアグリゲーション
NIM ネットワークインターフェースモジュール
STP スパニングツリープロトコル
VLAN 仮想ローカルエリアネットワーク
ASIC 特定用途向け集積回路
本出願では以下の標準が参照され、参照により本明細書に組み込まれる:1)以前にIEEE 802.3adタスクフォースによって2000年3月に追加されたIEEE802.3標準の43項であり、現在は2008年11月3日にIEEE802.1AX−2008に組み込まれている、リンクアグリゲーション制御プロトコル(LACP)、2)IEEE標準802.1Q、Virtual Bridged Local Area Networks、2005年版、ならびに3)IEEE 802.1D、Standard for Local and metropolitan area networks:Media Access Control(MAC)Bridges、2004年版。
リンクアグリゲーション制御プロトコル(LACP)は、2つのピアノード間の、リンクアグリゲーショングループ(LAG)と呼ばれるいくつかの物理リンクのバンドリングを制御して、それらの間に単一の論理チャネルを形成する方法をもたらす。ピアノードは、LACPパケットを交換することによって物理リンクのLAGへのバンドリングをネゴシエートし、あるいはLAGは手動で構成することができる。リンクアグリゲーションは、いずれの単一ポートまたはリンク単独で届けることできるものより多くのデータを転送するための、費用のかからない方法を提供する。一実施形態ではLAGのポートは、すべての銅線ポート(CAT−5E/CAT−6)、すべてのマルチモードファイバポート(SX)、またはすべてのシングルモードファイバポート(LX)などの、同じ物理タイプを含む。他の実施形態ではLAGのポートは、異なる物理タイプを有することができる。
向上された回復力をもたらし、単一の障害のポイントを取り除くために、図1からわかるようにLAGは2つのデバイスにわたって分割され、本明細書ではマルチシャーシリンクアグリゲーショングループ(MC−LAG)102と呼ばれる。例えば図1では、MC−LAG102aはエッジノード104から生じ、2つのサブセットに分割され、各サブセットにおいてMC−LAG102aの1つまたは複数の物理リンクで、2つのアグリゲーションスイッチ106aおよび106bに接続される。一実施形態ではエッジノード104は、MC−LAG102aのすべての利用可能なリンクにわたってトラフィックを分散するために負荷バランス技法を用いることができる。MC−LAG102aを通して送信される各パケットに対して、負荷バランスアルゴリズムに基づいて物理リンクの1つが選択される(通常は、送信元および宛先インターネットプロトコル(IP)、または媒体アクセス制御(MAC)アドレス情報に対して演算するハッシュ関数を用いる)。MC−LAG102の物理リンクにわたる負荷バランスは、結果として帯域幅のより効率的な使用をもたらす。
図1からわかるようにエッジノード104は、アクセスネットワーク122を通して、LAN内で動作するブリッジ、スイッチ、ルータなどの企業ネットワークデバイス110に接続され、および/またはDSLモデム、セットトップボックス、光回線終端装置などのホームネットワークデバイス112にも接続され得る。エッジノード104はスイッチまたはサーバであり、一実施形態では機能的にDSLアクセスマルチプレクサ(DSLAM)、ケーブルモデム終端システム(CMTS)、光回線終端装置(OLT)などを含むことができるが、他のタイプのデバイスも含むことができる。
一実施形態ではアグリゲーションスイッチ106は、仮想ファブリックリンク(VFL)124に結合される。VFL124は、トラフィック転送、MACアドレシング、マルチキャストフロー、アドレス解決プロトコル(ARP)テーブル、レイヤ2制御プロトコル(例えばスパニングツリー、イーサネットリング保護、論理リンク検出プロトコル)、ルーティングプロトコル(例えばRIP、OSPF、BGP)、およびそれに接続されたMC−LAG102のステータスに関する、アグリゲーションスイッチ106間の情報の交換のための接続をもたらす。アグリゲーションスイッチ106はエッジノード104に対して透過的に動作し、エッジノード104によって単一の論理デバイスとして扱われる。エッジノード104は、MC−LAG102a上で能動的にトラフィックを転送することができ、一方、アグリゲーションスイッチ106間の、MACアドレステーブルおよび他の転送情報の同期は、一実施形態では、低減された量の制御メッセージングと共に、VFL124を通してレイヤ2(L2)パケットフローによって駆動される。この機能は、アグリゲーションスイッチ106の対への、エッジノード104のデュアルホーミングを可能にし、レイヤ2マルチパスイントラストラクチャならびに基本レイヤ3アクセスインフラストラクチャをもたらす。
加えて一実施形態では、このマルチシャーシ仮想ファブリックアグリゲーション(MC−VFA)機能は、エッジノード104とアグリゲーションスイッチ106の間のレイヤ2冗長性プロトコル(例えばスパニングツリー)を必要とせずにこの機能をもたらし、一方で依然として、エッジアップリンク障害ならびにアグリゲーション/コアスイッチ障害に対するキャリア品位の検出および収束時間を容易にする。特にデータセンタに対する、多くの最近のネットワーク設計は、エッジノードとアグリゲーションスイッチの間のますます多くのレイヤ2隣接関係を必要としている。この傾向は、ループ検出機能および収束時間など、スパニングツリープロトコルの限界を押し広げつつある。スパニングツリー収束時間は、多くの現在のネットワークトポロジーでは最大で数秒になり得る。一実施形態でのマルチシャーシアーキテクチャは、好ましくはループ防止のためにスパニングツリープロトコル動作を稼働することを必要とせずに、エッジノード104とアグリゲーションスイッチ106の間のデュアルホーム、レイヤ2マルチパス接続をもたらし、一方で依然として一実施形態ではネットワークトポロジーのいくつかの部分において、マルチシャーシ機能性と共にスパニングツリープロトコル動作を可能にするように十分に柔軟性を有する(例えばアグリゲーションスイッチ間で、VFL124を通して、ならびにアグリゲーションスイッチをコアネットワークノード116または他のスイッチ/ルータに接続するリンクを通して)。
一実施形態でのMC−VFAアーキテクチャの利点は、エッジノード104のアクティブ/アクティブ転送モードであり、それによってアグリゲーションスイッチ106aおよびアグリゲーションスイッチ106bへのMC−LAGアップリンクの両方の組がトラフィックを処理して、MC−LAGリンクの帯域幅の使用の効率を向上させる。この機能はまた一実施形態では、アクセスアップリンク障害およびノード障害に対する高速なフェイルオーバ検出および収束時間を容易にする。加えて本明細書では、VFL124の障害の場合の復旧の機構のための一実施形態が述べられる。
図1からわかるように一実施形態では、アグリゲーションスイッチ106はまた、本明細書で述べられるようにMC−LAG機能(MC−VFAアーキテクチャの一部として)を用いて、ネットワークスイッチおよび/またはルータなどの1つまたは複数のネットワークノード116を含むメトロまたはコアネットワーク120に接続される。例えばアグリゲーションスイッチ106bは、MC−LAG102bを通してネットワークノード116bおよび116cに接続され、ネットワークノード116bおよび116cは同様にVFLを通して状態情報を交換する。MC−LAG102bアーキテクチャは、アグリゲーションスイッチ106bと、ネットワークノード116bおよび116cとの間の、デュアルホーム、レイヤ2マルチパス接続をもたらす。一実施形態ではネットワークノード116はまた、MC−LAG102cおよびVFL124からわかるように、MC−LAG機能性を用いて接続され得る。アグリゲーションスイッチ106はまた、LAG118などの標準のLAGまたは他のトランクまたはリンクを用いて、ネットワークノード116に接続され得る。
次に図2に関連して、MC−VFAアーキテクチャについてより詳しく述べる。エッジノード104aは、第1のMC−LAG1 102aによってアグリゲーションスイッチ106aおよび106bに接続され、一方、エッジノード104bは、第2のMC−LAG2 102bによってアグリゲーションスイッチ104aおよび104bに接続される。各MC−LAG102aおよび102bは、少なくとも2つのサブセットに分割された複数の物理リンクを含み、2つのサブセットのそれぞれは少なくとも1つの物理リンクを含む。図2からわかるように第1の組のMC−LAG102a物理リンクは第1のアグリゲーションスイッチ106aにおいて終端され、第2の組のMC−LAG102a物理リンクは第2のアグリゲーションスイッチ106bにおいて終端される。MC−LAG1は、論理的デュアルホーム、レイヤ2マルチパスを形成する。MC−LAGメンバポートは、MC−LAG102のメンバである、外部のユーザポートである。一実施形態ではVFL124は、回復力のために各アグリゲーションスイッチ106上に複数のネットワークインターフェースモジュールに広がり、シャーシ間トラフィックおよび制御/状態データ転送をもたらすリンクアグリゲート(LAG)である。マルチシャーシシステム140は、アグリゲーションスイッチ106、仮想ファブリックリンク124、MC−LAG102aおよび102bの少なくとも1つ、および対応するダウンストリームエッジノード104に接続されたそれらのそれぞれのMC−LAGメンバポートを含む。アグリゲーションスイッチ106aおよび106bは、それぞれがスタンドアロンスイッチとして動作可能であり、それぞれがそれ自体の個別の物理シャーシに入れられた、個別の物理スイッチである。アグリゲーションスイッチ106aおよび106bは、中央局またはデータセンタ内などの同じ地理的エリアにあってもよく、または地理的多様性をもたらすために異なる建物または都市などにおいて別々の地理的場所にあってもよい。
アグリゲーションスイッチ106に接続されたMC−LAGクライアントとして動作するエッジノード104は、好ましくはリンクの選択が所与のパケットフローに対して固定されたままである限り、種々の方法を用いてトラフィックをMC−LAGのそれらのリンクに割り当てることができる。これは、通信しているエンドステーションのいずれの対の間でトラフィックが順次届けられることを確実にする。一実施形態では好ましくは、エッジデバイスからMC−LAGアグリゲーションスイッチのそれぞれまで、同数のアップリンクポートが構成される。言い換えれば、エッジノードとアグリゲーションスイッチの1つとの間でMC−LAGのために2つのアップリンクが構成された場合は、エッジノードと他方のアグリゲーションスイッチとの間にもMC−LAGのために2つのアップリンクが構成されるべきである。必須ではないがこの構成は、アグリゲーションスイッチとエッジノードの間のフローに対してより一様なトラフィック分布をもたらす。
次に、アグリゲーションスイッチ106の間の仮想ファブリックリンク(VFL)124について、図3に関連してより詳しく述べる。一実施形態ではアグリゲーションスイッチ106はそれぞれ、少なくとも1つの制御管理モジュール(CMM)150a(プライマリ)、および好ましくは第2のCMMモジュール150b(バックアップ)、ならびにラインカードまたはポートモジュールなどの複数のネットワークインターフェースモジュール(NIM)152を含む。VFL124は、第1および第2のアグリゲーションスイッチ106において、1つまたは複数のNIM152に接続されたVFLメンバポートのアグリゲートである。例えばVFL124は、アグリゲーションスイッチ106aのNIM152aとアグリゲーションスイッチ106bのNIM152bとの間の物理リンクの第1のサブセットA、およびアグリゲーションスイッチ106aのNIM152nと106bとの間の物理リンクの第2のサブセットBを含む。一実施形態ではVFLリンクは、アグリゲーションスイッチ106のNIM152内にあるスイッチングASIC210の間に接続される。NIM152はまたそれぞれ、以下でさらに述べられるキューイングASIC212を含む。スイッチングファブリック集積回路(IC)214は、アグリゲーションスイッチ106内の様々なNIM152の間の相互接続をもたらす。
マルチシャーシシステム内の各アグリゲーションスイッチ106には、一意のシャーシ識別子が割り当てられる。各アグリゲーションスイッチ106に対するシャーシIDは、一意でグローバルであり、例えば各アグリゲーションスイッチはそのピアアグリゲーションスイッチのシャーシIDを知っている。各アグリゲーションスイッチ106内のIC、NIM、CMMなどの様々な構成要素に対する一意のハードウェアデバイス識別子(MID)も発生され、ローカルおよびリモートオブジェクトの管理を可能にする。一実施形態では、スイッチングASIC210に対するハードウェアデバイス識別子は、マルチシャーシシステム内でグローバルな意味を有し、一方、キューイングASIC212などの他の構成要素に対するMIDはローカルな意味のみを有することができる。例えば、スイッチングASIC210に割り当てられたハードウェアデバイス識別子は、両方のアグリゲーションスイッチ106によって知られており、一方、他のデバイスに対するハードウェアデバイス識別子は、ローカルアグリゲーションスイッチに限定され、リモートアグリゲーションスイッチに対しては意味をもたない。
一実施形態ではスイッチングASIC210には、下記など、それのアグリゲーションスイッチに割り当てられたレンジ内のグローバルな一意のハードウェアデバイス識別子(MID)が割り当てられる。
アグリゲーションスイッチ106a:シャーシID=1およびMID値0−31
アグリゲーションスイッチ106b:シャーシID=2およびMID値32−63
図3には、スイッチングASIC210に割り当てられた例示のMIDが示される。割り当てられたレンジを知っていることによってモジュールは、アグリゲーションスイッチ106a内またはアグリゲーションスイッチ106b内など、そのMIDからスイッチングASICの場所を判断することができる。
一実施形態ではスイッチングASIC210は、アグリゲーションスイッチ106の間でデータを交換しパケットを制御するために、プリペンデッドヘッダモードにおいて動作する。図4は、ネットワークインターフェースモジュール(NIM)152の一実施形態の概略ブロック図をより詳しく示す。スイッチングASIC210は、エッジノード104aおよび104bなどの外部ノードに接続された複数の外部ポートインターフェース240を含む。外部ポートインターフェース240の1つまたは複数は、MC−LAG、LAG、または他のトランクグループ、固定リンクなどに対するメンバポートを含むことができる。外部ポート240は、銅線ポート(CAT−5E/CAT−6)、マルチモードファイバポート(SX)、またはシングルモードファイバポート(LX)などの、同じ物理インターフェースタイプを有することができる。他の実施形態では外部ポート240は、1つまたは複数の異なる物理インターフェースタイプを有することができる。
外部ポート240には、外部ポートインターフェース識別子(ポートID)例えば、スイッチングASIC210に関連する、gportおよびdport値などのデバイスポート値が割り当てられる。一実施形態ではスイッチングASIC210のMIDと、スイッチングASIC210上の外部ポート240に対する外部ポートインターフェース識別子とは、マルチシャーシシステム140におけるローカルまたはリモートアグリゲーションスイッチ106のいずれかで上の、スイッチングASIC210の物理外部ポートインターフェース240を一意に識別するために用いられる。他の実施形態では、変換モジュールまたは他のエンティティを含むポートマネージャは、スイッチングASIC210のMIDと、外部ポート識別子とを単一の整数値に変換してグローバルポート値(GPV)例えばMID4を発生し、デバイスポート識別子(dport)5はGPV20に変換される。いずれの例においても、ローカルおよびリモートアグリゲーションスイッチの両方において、NIM152の外部ポートに対する一意の外部ポート識別子が発生される。一意のポート識別子はまた、スイッチングASIC210からNIM152上の処理モジュールへの内部ポートなどの、スイッチングASIC210の内部ポートにも割り当てられる。これらの内部ポートはまたは、ポート識別子およびスイッチングASICのMIDによって一意に識別される。
スイッチングASIC210はさらに、着信パケットの宛先アドレスを判断するパケット管理ユニット(PMU)242を含む。パケットは、スイッチングASIC210の別の外部ポートインターフェース240に、ローカルまたはリモートアグリゲーションスイッチ上の別のNIM152への送信のためにキューイングASIC212に、またはスイッチングASIC210の外部または内部のNIM152の処理モジュール266への送信のためにプロセッサインターフェース(PI)244に、切り換えることができる。
一実施形態では、パケットがローカルまたはリモートアグリゲーションスイッチ上の別のNIM152に送信されるときは、スイッチングASIC210は、ハードウェアデバイス情報(HDI)を含むようにパケットヘッダを追加するあるいは変更するプリペンデッドパケットヘッダインターフェース(PPHI)に、パケットを転送する。HDIは、パケットの送信元および/または宛先に関連するハードウェアデバイスの識別子を含む。一実施形態ではプリペンドされたヘッダは、パケット優先度および負荷バランス識別子などの他の情報を含むことができる。宛先HDI情報を取得するためにPPHIは、MAC/HDI転送テーブル250へのルックアッププロセスを行う。アドレステーブルメモリ248に記憶されたMAC/HDI転送テーブル250は、アグリゲーションスイッチ106に接続された外部デバイス、ノード、モジュール、ソフトウェアまたはハードウェアに対するMACアドレスなどの、MACアドレスエントリのリストを含む。MACアドレスエントリは、関連付けられたMACアドレスを有するデバイスに到達するようにパケットをブリッジするまたはルーティングするために用いられる、関連するハードウェアデバイス情報を含む。宛先ハードウェアデバイス情報は例えば、宛先MACアドレスに関連付けられたローカルまたはピアアグリゲーションスイッチのいずれかの、スイッチングASIC210のポート識別子およびMID(例えば、MID=24、ポートID=5、またはMID=54、デバイスポート=12)を含む。他の実施形態では宛先ハードウェアデバイス情報は、宛先MACアドレスに関連付けられた外部ポートインターフェースのグローバルポート値(GPV)を含むことができる。MAC/HDI転送テーブル250は、送信元トランクマップ、トランクビットマップテーブル、トランクグループテーブル、VLANマッピングテーブルなどの1つまたは複数のテーブルを含むことができる。一実施形態ではMAC/HDI転送テーブル250またはその一部は、NIM152のキューイングASIC内に配置することもできる。
一実施形態では、スイッチングASIC210が、リモートアグリゲーションスイッチへのリンクを有するアクティブVFLメンバポート252を含むときは、MAC/HDI転送テーブル250は、gport値をスイッチングASIC MID値およびデバイスポート値に関連付けるためのテーブル、および/または外部ポートインターフェースに対する論理アグリゲートグループ識別子マッピングを有するテーブルなどの、追加のHDI情報を含むことができる。
一実施形態ではプリペンドされたヘッダは、スイッチングASICのハードウェアデバイス識別子MID、および送信元ポートのデバイスポート識別子を含む、外部または内部ポートインターフェースなどの、送信元ポートに関連するハードウェアデバイス情報HDIを含む。
他の実施形態ではプリペンドされたヘッダは、VFLポート124に接続されたスイッチングASIC210に関連するHDIを含む(図3でのアグリゲーションスイッチ106aに対してMID=0、MID=31など)。次いでVFLポートに接続されたスイッチングASIC210は、VFLを通してパケットを送信する前に、プリペンドされたヘッダ内のHDIをトランスレートまたは変換することになる。
一実施形態ではPPHI246はまた、送信元ポート、例えばパケットを最初に受信した外部ポートインターフェース240、に関連する送信元ハードウェアデバイス情報を付加する。送信元ハードウェアデバイス情報は、スイッチングASIC210のMID、およびポート識別子(例えばデバイスポート)、および/または外部ポートインターフェース240のグローバルポート値(GPV)を含むことができる。一実施形態ではまた、宛先ハードウェアデバイス識別子またはMID、宛先デバイスポート、VLAN ID、パケットタイプ(マルチキャスト、ユニキャスト、ブロードキャスト)、パケット優先度および負荷バランス識別子などの、追加の情報もプリペンドされたヘッダに追加される。一実施形態では宛先HDIは、MAC/HDI転送テーブル250などのアドレステーブル248から取り出される。
次いでプリペンドされたヘッダを有するパケットは、ファブリックIC214を通してルーティングするために、キューイングASIC212に送信される。キューイングASIC212は、パケットバッファ260、トラフィックおよびバッファ管理をもたらすためのキュー管理262、およびグローバルHDIアドレステーブル264を含む。グローバルHDIアドレステーブル264は、宛先HDIを、他のNIM152の1つまたは複数内のキューイングASIC212における適切なキューにマップする。例えばマッピングは、プリペンドされたヘッダ内のハードウェアデバイス情報に基づいて、アグリゲーションスイッチ106内の他のキューイング/スイッチングASIC内の外部ポートインターフェースの1つまたは複数に対する適切な外向きキューに、パケットを切り換えるための情報をもたらす。他の例では、宛先HDIがリモートアグリゲーションスイッチ上の宛先を示す(すなわち宛先デバイス識別子が、リモート/ピアスイッチレンジに属する)ときは、キューイングASIC212は、VFL124を通したリモートアグリゲーションスイッチへの送信のために、ローカルアグリゲーションスイッチ106内のVFLポートインターフェースの1つまたは複数に対する適切な外向きキューにパケットを切り換え、例えばグローバルHDIアドレステーブル264は、関連するハードウェアデバイスがリモートアグリゲーションスイッチ上にあることを示す。一実施形態では、特定のVFLポートインターフェースに対応する外向きキューの決定は、プリペンドされたヘッダ内にある、前にスイッチングASIC210によって挿入された、負荷バランス識別子に基づいて行われる。
スイッチングASIC210およびキューイングASIC212は、別々の集積回路またはモジュールとして示されるが、ASICの1つまたは複数の機能または構成要素は、他方のASICに含める、または代替のASICに組み合わせる、あるいは1つまたは複数の集積回路に実装することができる。
図5は、アグリゲーションスイッチ106aを通ってVFL124に至るまでのパケットフローの一実施形態の概略ブロック図を示す。この例では、企業デバイス110またはホームネットワークデバイス112などの送信元MACアドレスを有するデバイス300は、パケットを、例えばエッジノード104を通して、リモートアグリゲーションスイッチ106bの外部ポートインターフェースを通してアクセスすることができるデバイスの宛先MACアドレスを有して、アグリゲーションスイッチ106aに送信する。NIM152n内の、例えば図5のMID=31を有する、スイッチングASIC210nは、例えばポートID=2を有する外部ポートインターフェース240上でパケットを受信する。スイッチングASIC210nは、宛先MACアドレスを抽出し、アドレステーブルルックアップを行って、MAC/HDI転送テーブル250から、宛先MACアドレスに関連付けられたハードウェアデバイス情報(HDI)を求める。宛先HDIは、例えばローカルアグリゲーションスイッチ106aまたはリモートアグリゲーションスイッチ106bのいずれかのNIM152、キューイングASIC212、スイッチングASIC210、外部ポート識別子240、VFL124のメンバポートなど、MACアドレスを有する宛先デバイスへのパスにおける1つまたは複数のハードウェア構成要素のデバイスモジュール識別子(MID)を含むことができる。一実施形態では宛先HDIは、スイッチングASIC210のMID、および宛先デバイスへのアクセスをもたらす外部ポートインターフェース240のポート識別子(例えばデバイスポート)を含むことができる。さらに一実施形態ではプリペンドされたヘッダは、元のパケットから取り出されたパラメータ(送信元MACアドレス、宛先MACアドレス、送信元IPアドレス、宛先IPアドレス)に基づく、パケット優先度および負荷バランス識別子を含む。他の例ではHDIは、外部ポートインターフェース240に対するグローバルポート値(GPV)、または宛先デバイスへのアクセスをもたらすNIM152のMIDを含む。他の実施形態では、宛先MACアドレスがリモートアグリゲーションスイッチに関連するときは、HDIは、NIM152a、またはVFL124に接続されたスイッチングASIC210(MID=0など)に対するハードウェアデバイス識別子MIDを含む。宛先HDIは、元のパケットヘッダ(レイヤ2、イーサネットパケットヘッダタイプなど)に情報を追加するプリペンドされたヘッダに追加される。スイッチングASIC210nはまた、送信側外部ポートインターフェース例えばポートID=2に関連する、1つまたは複数のデバイスについての送信元ハードウェアデバイス情報(HDI)を含む。送信元HDIは、送信側スイッチングASIC210のMID、送信元ポート識別子(例えばデバイスポート)、グローバルポート値、送信元NIM152に対するMID、シャーシIDなどの、1つまたは複数のハードウェアデバイス識別子を含む。
プリペンドされたヘッダを有するパケットは、キューイングASIC212nに送信され、次いでキューイングASIC212nは、宛先HDIに基づいて、パケットを送信するためにローカルアグリゲーションスイッチ上のNIM152を決定する。宛先HDIが、アグリゲーションスイッチ106a上のローカル外部ポートインターフェースを示すときは(例えばプリペンドされたヘッダに含まれた宛先MIDに基づいて)、キューイングASIC212nは、ローカル外部ポートインターフェースの対応するNIM152への送信のために、パケットを外向きキュー内に置く。図5に示される他の例ではキューイングASIC212nは、宛先HDIがリモートアグリゲーションスイッチ上の宛先ハードウェアデバイスを示す、例えばHDIがリモートアグリゲーションスイッチ上のMID=45を有するスイッチングASICを示すと判断する。リモートアグリゲーションスイッチに到達するようにパケットは、VFL124に接続されたNIM152に送信される。この例ではキューイングASIC212nは、プリペンドされたヘッダを有するパケットを、ファブリックIC214を通して、VFL124に接続されたNIM152aに送信する。VFLメンバポートの選択は、プリペンドされたヘッダ上で運ばれる負荷バランス識別子パラメータに基づいて行われる。NIM152a内のキューイングASIC212aは、プリペンドされたヘッダを有するパケットを受信し、VFL124を通した送信のためにパケットをキューに入れる。次いでスイッチングASIC210aは、送信元および/または宛先HDIを含むプリペンドされたヘッダを有するパケットを、VFL124を通してリモートアグリゲーションスイッチに送信する。
一実施形態ではスイッチングASIC210aは、VFL124を通して送信する前に、プリペンドされたヘッダを変更することができる。例えばスイッチングASCI210aは、ローカルな意味を有する宛先HDI(例えばgport値、またはローカルハードウェアデバイス識別子MID)を、グローバルな意味を有するHDIにトランスレートすることができる。次いでスイッチングASIC210aは、送信元および/または宛先HDIを含むプリペンドされたヘッダを有するパケットを、VFL124を通してリモートアグリゲーションスイッチに送信する。
一実施形態では、アグリゲーションスイッチ106の複数のスイッチングASIC210、例えば図3においてスイッチングASIC MID=0およびMID=31が、VFL124に接続されたときは、VFL124を通して送信されるトラフィックは分散することができる。例えばキューイングASIC212のグローバルHDIアドレステーブル264内の負荷バランス識別子マップテーブルは、以下の分布を示すことになる。
Figure 2015515809
キューイングASIC212は、負荷バランス識別子または他の負荷バランス技法を用いて、パケットを適切なVFLポートインターフェースにマップする。例えば、アグリゲーションスイッチ106内に8個のNIM152を有する一実施形態では、キューイングASIC212nは、8個のNIM(モジュールID、ポート)のために構成された、8個の1組のキューを有する。一実施形態では、VFL124に接続されたキューイングASIC212は、VFLメンバポートインターフェースに対して関係するキューの個別の組を有する。VFLのためのキューの組は、アグリゲーションスイッチ106を接続する内部VFLポートに関連するFIFOに割り当てられる。一実施形態では、複数の仮想ファブリックリンクメンバポートを有し、キューは、VFLメンバポートをホストするキューイングASIC212aおよび212nの間でリモートシャーシ上の宛先ポートが等しく分散されるように、割り当てられる。
一実施形態では、NIM152内のMAC/HDI転送テーブルは、システムを通って流れるレイヤ2パケットに応答して配置され、次いで更新される。プリペンドされたヘッダは送信元MACアドレスおよび送信元HDI情報を含むので、NIM152、例えば一実施形態では特にスイッチングASIC210は、この情報を用いてMAC/HDI転送テーブル250に配置することができる。VFL124を通して送信元MACアドレスおよび送信元HDIを有するレイヤ2パケットを交換するようにプリペンデッドヘッダモードにおいて動作することによって、スイッチングASIC210はアグリゲーションスイッチ106の間でMACアドレステーブルを同期することができる。MAC/HDI転送テーブルはスイッチングASIC210内にあるものとして述べられたが、MAC/HDI転送テーブルは別法としてまたは追加として、キューイングASIC212n内に、またはNIM152の別のモジュール内に含むことができる。他の実施形態ではCMM150(プライマリおよびセカンダリ)はまた、アグリゲーションスイッチ106の間の1つまたは複数のタイプのリンクのためのMAC/HDI転送テーブルを含むことができる。
図6は、マルチシャーシシステムにおけるパケットのプリペンドされたヘッダの一実施形態の概略ブロック図である。プリペンドされたヘッダ300は、送信元HDI302、宛先HDI304、VLAN ID306、パケットタイプ308、送信元MACアドレス310、宛先MACアドレス312のためのフィールドを含む。一実施形態ではプリペンドされたヘッダはまた、負荷バランス識別子314およびパケット優先度316を含むことができる。宛先HDI304は例えば、宛先MACアドレスに関連付けられたローカルまたはピアアグリゲーションスイッチのいずれかの、スイッチングASIC210のポート識別子およびMID(例えばMID=24、ポートID=5、またはMID=54、デバイスポート=12)を含む。他の実施形態では宛先ハードウェアデバイス情報は、宛先MACアドレスに関連する外部ポートインターフェースのグローバルポート値(GPV)を含むことができる。宛先ハードウェアデバイス情報はまた、VFLに接続されたスイッチングASIC210、NIM152、キューイングASICなどのMIDを含むことができる。送信元HDI302は、スイッチングASIC210のMID、および外部ポートインターフェース240のポート識別子(例えばデバイスポート)および/またはグローバルポート値(GPV)を含むことができる。負荷バランス識別子314は、ピアアグリゲーションスイッチに到達するために通過/ゲートウェイポートとしてどのVFLメンバポートを用いるべきかを、キューイングASIC212が決定するのを助けるために用いられる。パケット優先度316は、特定の優先キューを判断するためにキューイングASIC212によって用いられる。
図7は送信元MAC学習を示す、マルチシャーシシステムの一実施形態の概略ブロック図を示す。エッジノード104は、論理アグリゲートグループLAG1 282、マルチシャーシ論理アグリゲートグループMC−LAG1 102a、マルチシャーシ論理アグリゲートグループMC−LAG2 102b、および固定ポートリンク280を通して、アグリゲーションスイッチ106aおよび106bに接続される。一実施形態ではアグリゲーションスイッチ106は、LAG1および他のタイプのトランクグループなどの論理アグリゲートグループについての構成情報、およびそれらに関連するハードウェアデバイス情報を通信する。一実施形態ではハードウェアデバイス情報は、論理アグリゲートグループに関連する物理ポート、例えばスイッチングASICのハードウェアデバイスまたはモジュール識別子(MID)、および論理アグリゲートグループに関連するリンクに対する外部ポート識別子(デバイスポート値またはgport値)を含む。
例えば一実施形態では、アグリゲーションスイッチAはアグリゲーションスイッチBに、アグリゲートグループ識別子LAG1を有する論理アグリゲートグループは、ハードウェアデバイスモジュール識別子MID=31と、識別子デバイスポート=1、2を有する外部ポートインターフェースとを有するスイッチングASICに関連することを通知する。アグリゲーションスイッチBはアグリゲーションスイッチAに、アグリゲートグループ識別子MC−LAG1を有する論理アグリゲートグループは、ハードウェアデバイスモジュール識別子MID=45と、外部ポートインターフェース識別子デバイスポート=1、2とを有するスイッチングASICに関連することを通知する。別法としてまたはスイッチングASICのMIDおよびデバイスポート値の追加として、論理アグリゲートグループに関連するNIMの識別子、キューイングASICなどの、他のハードウェアデバイス情報が交換される。アグリゲーションスイッチ106はまた、通常のアグリゲートおよびマルチシャーシアグリゲートグループの両方に対する、論理アグリゲートグループの構成情報への更新の通知を交換する。アグリゲーションスイッチ106の論理アグリゲートグループおよびマルチシャーシアグリゲートに関連するハードウェアデバイス情報は、アグリゲーションスイッチ106のNIM152内のMAC/HDI転送テーブルの1つまたは複数に含まれる。例えば一実施形態では、両方のアグリゲーションスイッチ106内のMAC/HDI転送テーブルの1つまたは複数は、以下の情報を含む:
Figure 2015515809
論理アグリゲートグループ(例えばLAG1)に対する同じアグリゲートグループ識別子は、両方のアグリゲーションスイッチ106によって知られ、利用されるので、一実施形態ではマルチシャーシシステムは、論理グループの各タイプに、およびアグリゲーションスイッチ106のそれぞれに対して、アグリゲートグループ識別子のサブセットを割り当てる。例えば、最大で128個の可能なアグリゲートグループを有する一実施形態では、アグリゲートグループ識別子の割り当ては以下を含むことになる:
Figure 2015515809
アグリゲーションスイッチ106は、割り当てられたレンジおよびアグリゲートグループのタイプに基づいて、アグリゲートグループ識別子を割り当てる。したがってアグリゲーションスイッチ106におけるパケット転送は、MAC/HDI転送テーブルにアクセスし、論理アグリゲートグループとハードウェアデバイス情報との間のマッピングを用いることによって行われる。典型的にはアグリゲート識別子情報は、プリペンドされたヘッダ内では転送されない。
一実施形態では、LAGまたはMC−LAGにわたる負荷バランスを容易にするために、アグリゲーションスイッチ106が、(MID、ポートID)などの宛先HDI情報を有して、VFL124を通してパケットを受信したときは、アグリゲーションスイッチ106は、各LAGまたはMC−LAGアグリゲートグループのアクティブメンバであるすべてのポートのリストを含んだその内部トランクテーブルの1つまたは複数において、送信元HDI(宛先MID、宛先ポート識別子)において識別されたポートを求めて検索することによって、宛先HDIが論理アグリゲートグループに含まれるかどうかを判定する。宛先ポートが関連するLAGまたはMC−LAG内に見付かったときは、アグリゲーションスイッチ106は、関連するLAGの1つまたは複数の異なる外部ポートインターフェースにパケットを割り当てることによって、負荷バランス技法を実行する。例えば、リモートアグリゲーションスイッチ106bにおいてVFLに接続されたスイッチングASIC210が、MID=45、ポート2の宛先HDIを有するパケットを受信したときは、スイッチングASIC210は、以下に示される例で、そのMAC/HDIテーブルからMID=45、ポート2はMC−LAG1の一部であると判断する。次いでスイッチングASICは負荷バランスを行うことを決定し、1つまたは複数のハッシュアルゴリズムを通して、代わりにパケットをMC−LAG1のMID=45、ポート1を通して送信することを決定する。この特定の例では次いでスイッチングASICは、外部ポート(MID=45、ポート1)からパケットを送信する前に、プリペンドされたヘッダを削除することになる。
Figure 2015515809
他の実施形態ではノードまたはネットワーク管理アプリケーション内のMACアドレステーブルは、論理アグリゲーショングループについてのHDIを含まなくてもよい。ユーザにより表示されるMACアドレステーブルは、固定ポートについてのHDIのみを含むことができ、したがって両方のアグリゲーションスイッチ106に対して同様となる。
Figure 2015515809
Figure 2015515809
MAC/HDI転送テーブルは、トラフィックがVFL124を通って流れるのに従って、送信元MACアドレスに関連付けられたLAG識別子に対して自動的に同期される。したがって論理的にアグリゲーションスイッチ106は、MAC学習のための単一のブリッジとして動作する。さらにMAC学習は、トラフィックがVFL124を通って流れるのに従って自動的に生じるので、プロセス間通信メッセージをベースとするMACテーブル同期を必要とせずに、最小のレイヤ2/制御モジュール管理のソフトウェア介入が必要なだけである。
図8は、アグリゲーションスイッチ106のための管理制御モジュール(MCM)400の一実施形態の概略ブロック図を示す。一実施形態ではMCM400は、アグリゲーションスイッチ106の中央管理モジュール(CMM)150内に(MCM−CMM402として示される)、またはアグリゲーションスイッチ106の指定されたネットワークインターフェースモジュール(NIM)152における処理モジュール内に(MCM−NIM404として示される)、またはそれらの組み合わせにおいて実装される。
一実施形態ではMCM−CMM402は、MCM400と要素および/またはネットワークマネージャモジュール406との間のインターフェース、ならびにアグリゲーションスイッチ106上で動作可能なMCM400に登録された他のアプリケーション408へのインターフェースを含む。登録されたアプリケーション408は、例えばVLANマネージャアプリケーションモジュール410、スパニングツリープロトコル(STP)アプリケーションモジュール412、送信元学習アプリケーションモジュール414、リンクアグリゲーションアプリケーションモジュール416、およびポートマネージャアプリケーションモジュール418を含む。本明細書で述べられる機能もたらすために、追加のまたは異なるアプリケーションも、MCM400と協調および動作することができる。
MCM400は、登録されたアプリケーション408と協調して広範な通知をもたらす。例えばMCM400は、登録されたアプリケーション408に、マルチシャーシシステムのステータスについて、およびいつマルチシャーシモードで動作すべきか、およびいつスタンドアロンモードで動作すべきかを知らせる。ステータス情報は、ローカルおよびリモートアグリゲーションスイッチ上の管理構成によって、またはアグリゲーションスイッチによって個々に行われる、もしくは制御データ交換、ネゴシエーション、および合意後すぐにマルチシャーシシステム内の両方のアグリゲーションスイッチによって行われる実行時の決定によって、駆動される。
MCM400はまた、登録されたアプリケーション408からサービスを要求する。例えばMCM400はVLANマネージャ410に、マルチシャーシピアスイッチ間のプロセス間通信チャネルをセットアップするために、VFLメンバポートをマルチシャーシ制御VLANのメンバとして構成するように要求する。STPアプリケーションモジュール412は、IEEE 802.1D、Standard for Local and metropolitan area networks:Media Access Control(MAC)Bridges、2004年版において規定されるスパニングツリープロトコル、IEEE802.1Q、Virtual Bridged Local Area Networks、2005年版において規定される複数のスパニングツリープロトコル、またはネットワーク内の複数のアクティブパスによるパケットループを軽減するための他の同様なタイプのネットワークプロトコルなどの、スパニングツリープロトコル含む。送信元学習アプリケーションモジュール414は、アグリゲーションスイッチ内のMAC/HDI転送テーブルの更新および学習を協調させる。リンクアグリゲーションモジュール416は、メンバポートをリンクアグリゲート(LAG)およびマルチシャーシリンクアグリゲートグループ(MC−LAG)に構成、ネゴシエート、およびグループ化するために、LACPまたは他の同様なプロトコルを実行する。ポートマネージャアプリケーションモジュール418は、ポートインターフェース240のステータスを監視する。
一実施形態ではMCM−CMM402は、マルチシャーシプロトコルに関連する管理制御機能を行うために、指定されたNIM152を選択する。例えばマルチシャーシプロトコルは、アグリゲーションスイッチ106が、互いを発見し、マスタスイッチを選出し、システム情報を交換し、定期的なヘルスチェックを実行することを可能にする。指定されたNIM152の使用は、CMM150のみにおけるMCMアプリケーション400の機能の集中化を回避する。加えてMCM−CMM402は、プライマリに指定されたNIM152における障害に備えて、バックアップに指定されるNIM152を選択する。一実施形態では指定されたNIMは、最も低い作動可能なスロット番号に基づいて選択される。
一実施形態ではMCM400は、仮想ファブリックリンク(VFL)124の制御および管理のためのマルチシャーシ状態アプリケーションモジュール420を含む。マルチシャーシ状態アプリケーションモジュール420は、VFL124を管理および構成し、VFL124およびそのメンバポートの状態を監視および/または制御するために、ポートマネージャアプリケーションモジュール418とインターフェースする。MCM−CMM402およびMCM−NIM404は、VFL124のメンバポートおよびリンクについてのポート状態およびリンク状態イベントを受け取るように、ポートマネージャアプリケーションモジュール418に登録する。マルチシャーシ状態アプリケーションモジュール420は、物理レベルにおけるリンクの状態と共に、標準のLACPプロトコルまたは他の同様なプロトコルを用いて各VFLメンバポートの状態を追跡する。LACPプロトコルに加えてマルチシャーシステータスプロトコルは、両方のマルチシャーシスイッチ上の指定されたNIM上で稼働する構成要素のステータスおよび/または運用性をチェックするために定期的なキープアライブチェック(Helloプロトコル)を実行する。MCM400は、VFL124の作動可能状態を追跡し、VFLステータスについてのイベント、すなわちアグリゲート生成/削除/アップ/ダウンを処理する。
MCM−CMM402および/またはMCM−NIM404は、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ、マイクロコンピュータ、中央処理装置、フィールドプログラマブルゲートアレイ、プログラマブルロジックデバイス、状態機械、論理回路、アナログ回路、デジタル回路、および/または回路のハードコーディングおよび/または作動可能な命令に基づいて信号(アナログおよび/またはデジタル)を処理する任意のデバイス、などの1つまたは複数の処理デバイスを含む。MCM−CMM402および/またはMCM−NIM404は、内部メモリまたは外部メモリである、メモリを含む。MCM−CMM402および/またはMCM−NIM404のメモリは、単一のメモリデバイスまたは複数のメモリデバイスとすることができる。このようなメモリデバイスは、リードオンリメモリ、ランダムアクセスメモリ、揮発性メモリ、不揮発性メモリ、スタティックメモリ、ダイナミックメモリ、フラッシュメモリ、キャッシュメモリ、および/またはデジタル情報を記憶する任意のデバイスとすることができる。MCM−CMM402および/またはMCM−NIM404はその機能の1つまたは複数を、状態機械、アナログ回路、デジタル回路、および/または論理回路によって実現することができ、対応する作動可能な命令を記憶したメモリは、状態機械、アナログ回路、デジタル回路、および/または論理回路を備えた回路内に埋め込む、またはその外部とすることができる。MCM−CMM402および/またはMCM−NIM404は、ハードコードされた、および/またはソフトウェア、および/または本明細書で述べられるステップおよび/または機能を実行するために内部メモリおよび/または外部メモリによって記憶された作動可能な命令を実行することができる。MCM−CMM402および/またはMCM−NIM404は、単一の、または1つまたは複数の集積回路において実現することができる。
マルチシャーシシステム140においては、アグリゲーションスイッチ106の間の仮想ファブリックリンクの接続性の障害は、ネットワークの安定性に深刻な影響を生じる。問題は特定のトポロジーに依存するが、例えば接続性損失、不必要な溢れおよびMAC移動を含む。これらの問題は、高い帯域幅使用量、およびアグリゲーションスイッチ106上での高い処理利用、ならびにループされたパケットおよび重複パケットを引き起こし得る。加えて単一の接続を通じてマルチシャーシシステム140に接続されたエッジノード104は、VFL124障害によりトラフィックの影響を受け得る。単一に接続されたエッジノード104との間で交換されるトラフィックの一部は、宛先に到達するために元々(障害の前は)VFL124を通って流れることを必要し得るので、このトラフィックは今や失われることになる。
VFL124の障害後すぐに生じる別の問題は、アグリゲーションスイッチ106上の同期されないMACテーブルによる永久的な溢れである。データ転送は、機能できるが、アグリゲーションスイッチ106の1つはエッジノード104からの所与のアップストリームパケットフローが、マルチシャーシシステム140内のコアネットワークノード116からのダウンストリームトラフィックと比べて異なるアグリゲーションスイッチを通って送信されたときは、MACアドレスのいくつかを学習することができないので、最適とすることはできず、結果として本来なら溢れることのないトラフィックの溢れを生じる。VFL124障害後すぐの、これらおよび他の問題を回避することを試みるために、本明細書では図9−17に関連して、復旧のためのプロセスおよびシステムについて述べられる。
図9は、VFL124が作動可能なときの、アグリゲーションスイッチ106のリンクステータスの一実施形態を示す。マルチシャーシモードではVFL124が作動可能なときは、スパニングツリープロトコルは、MC−LAGメンバポート、例えば図9のアグリゲーションスイッチ106aのポートS1/1およびS1/2、およびアグリゲーションスイッチ106bのポートS2/1およびS2/2上では、自動的にディセーブルされる。エッジノード104から、アグリゲーションスイッチ106aおよび106bに結合されたMC−LAG102のリンクは、単一の論理ノードへの単一のリンクアグリゲートグループ(LAG)の一部である。スパニングツリープロトコルは、アグリゲーションスイッチ106と、ネットワークノード116などの、メトロ/コアネットワーク内のノードとの間のネットワークの一部分においてイネーブルされる。加えてスパニングツリープロトコルは、VFLメンバポートにおいてイネーブルされ、転送状態となるように構成される。
アグリゲーションスイッチ106とネットワークノード116の間のループを防止するために、スパニングツリープロトコルは、アグリゲーションスイッチ106からパケットを転送するための1つまたは複数のポート、およびアグリゲーションスイッチ106からのパケットフローの転送がブロックされる1つまたは複数のポートを決定する。パケットフローは、VLAN、ならびに各VLANに対して転送およびブロックするためのアグリゲーションスイッチ上のポートを選択するように実装された複数のスパニングツリープロトコルとの一部とすることができる。例えばSTPは、ポートインターフェースS1/3およびポートインターフェースS2/3上でイネーブルされる。VLANのためのパケットフローに対してなど、パケットフローに対するループを防止するために、ポートインターフェースS1/3は、パケットフローまたはVLANのためにパケットを送信または受信することがブロックされている。このようなパケットはポートインターフェースS1/3によって捨てられる。したがって、アグリゲーションスイッチ106aとネットワークノード116の間のリンク440は、パケットフローに対してブロック状態となる。
アグリゲーションスイッチ106は、VFLの接続障害を検出するように動作可能である。例えばMCM−CMM402およびMCM−NIM404は、VFL124のメンバポートについてのポート状態およびリンク状態イベントを受信するように、ポートマネージャアプリケーションモジュール418に登録する。または他の実施形態ではマルチシャーシ状態アプリケーションモジュール420は、物理レベルにおけるリンクの状態と共に、標準のLACPプロトコルまたは他の同様なプロトコルを用いて、各VFLメンバポートの状態を追跡する。LACPプロトコルに加えてマルチシャーシ状態アプリケーションモジュール420は、アグリゲーションスイッチ106上のVFL124のステータスをチェックするために定期的なキープアライブチェック(Helloプロトコル)を実行することができる。したがってMCM400は、VFL124の作動可能状態を追跡し、VFLステータスについてのイベント、すなわちアグリゲート生成/削除/アップ/ダウンを処理するように動作可能である。
図10は、例えばアグリゲーションスイッチ106aはもはやVFL124を通してアグリゲーションスイッチ106bと通信できない、VFL124の接続障害の場合のマルチシャーシシステム140のリンクステータスの一実施形態を示す。発生する問題は、アグリゲーションスイッチ106は、コアネットワークノード116からのダウンストリームパケットフローと比べて異なるアグリゲーションスイッチを通して送信される、エッジノード104からの所与のアップストリームパケットフローに対してMACアドレスを学習できないことである。アグリゲーションスイッチ106は依然として、エッジノード104に対するMACアドレステーブルの内容の観点から、論理的な単一のブリッジである。ならびに、仮想ファブリックリンク124は作動可能ではないので、アグリゲーションスイッチ106は、それらのMACテーブルエントリを同期することができない。
例えばステップ1で、H1の送信元MACアドレスを有するデータパケットが、未知の宛先を有して、ポートEN1/1においてエッジノード104に入る。エッジノード104は、そのMACテーブルを更新して、送信元アドレスH1はポートEN1/1を通して到達できることを学習する。次いでステップ2でエッジノード104は、ホストH10へのポートID EN1/4などの、その出力ポートにパケットを溢れさせる。加えて、MC−LAG102依然として構成されているので、エッジノードは2つのアグリゲーションスイッチ106を単一のMACエンティティと見なし、ステップ3でアグリゲーションスイッチ106aへのポートEN1/3など、MC−LAG102のメンバポートの1つを選択してパケットを溢れさせる。ステップ4でアグリゲーションスイッチ106aは、リンク440を通してネットワークノード116にパケットを送信し、これはステップ5でホストH2にパケットを届ける。しかしステップ6でネットワークノード116はまた、リンク442を通してアグリゲーションスイッチ106bにパケットを溢れさせる。ステップ7でアグリゲーションスイッチ106bから、パケットはエッジノード104に戻るように送信される。パケットは、例えば別のMC−LAGポートEN1/2に進入する。次いでエッジノード104は、そのMACアドレステーブルを更新して、送信元アドレスH1はMC−LAG102を通して到達できることを学習する。MACアドレスH1は、ポートEN1/1を通して到達可能であると正しく学習されたが、今やこれはMC−LAG102を通して到達可能と誤って再学習される。
加えてステップ8では、MC−LAG102から戻って受信されたパケットは、再びホストH10に溢れるようになる。次いでホストH10もまた、送信元MACアドレスH1は、エッジノードポートEN1/1ではなくMC−LAG102を通じて到達可能であることを再学習する。ホストH1とH10の間の接続性は失われ得る。この例からわかるようにVFL124がダウンしたときは、溢れたパケットはエッジノード104にループバックし、誤ったMAC移動を引き起こす。
図11は、VFL124を通して接続障害が起きたときの復旧の一実施形態を示す。実施形態は、本明細書で述べられる問題の1つまたは複数を軽減する助けとなる。一実施形態では、アグリゲーションスイッチ106が、VFL124を通してアグリゲーションスイッチ106が通信できなくなるような接続障害が起きたと判断したときは、アグリゲーションスイッチ106はMC−LAG102を、エッジノード104に接続された1つまたは複数のリンクアグリゲートに再構成する。一実施形態ではMC−LAG102は少なくとも2つのリンクアグリゲートに再構成され、そこで少なくとも1つのリンクアグリゲートLAG1 420はエッジノード104からアグリゲーションスイッチ106aに接続され、少なくとも1つの他のリンクアグリゲートLAG2 422はエッジノード104からアグリゲーションスイッチ106bに接続される。次にアグリゲーションスイッチ106は、エッジノード104に接続されたリンクアグリゲートLAG1 420およびLAG2 422上、ならびにアグリゲーションスイッチ106とコアネットワーク120の間で、スパニングツリープロトコルをイネーブルする。スパニングツリープロトコルは例えば、IEEE 802.1D、Standard for Local and metropolitan area networks:Media Access Control(MAC)Bridges、2004年版において規定されるスパニングツリープロトコル、IEEE802.1Q、Virtual Bridged Local Area Networks、2005年版において規定される複数のスパニングツリープロトコル、またはネットワーク内の複数のアクティブパスによるパケットループを軽減するための他の同様なタイプのネットワークプロトコルを含む。
アグリゲーションスイッチ106がMC−LAG102を、エッジノード104に接続された1つまたは複数のリンクアグリゲートに再構成するときは、MC−LAG102のメンバポート上で前に学習されたMACテーブルエントリは、アグリゲーションスイッチ106およびエッジノード104の両方においてフラッシュされる。新たに形成されたリンクアグリゲートLAG1 420およびLAG2 422に対して、新しいMACエントリが学習される。またアグリゲーションスイッチ106は、異なるMACアドレスが割り当てられ、エッジノード104によって2つの独立した論理エンティティと見なされる。ここでアグリゲーションスイッチ106はスタンドアロンモードで作動可能となり、もはやVFL124を通してMACテーブルエントリを同期する必要はない。
加えて、エッジノード104に結合されたリンクアグリゲート上、およびネットワークノード116に結合されたリンク440、442上でイネーブルされたスパニングツリープロトコルは、1つまたは複数のポートをブロック状態に置くことによってループを防止する助けとなる。特定のパケットフローまたはVLAN、またはすべてのトラフィックに対してスパニングツリープロトコルは、ネットワークを通るアクティブパスを決定し、ループを防止するために1つまたは複数の他のパスをブロックする。図11に示される例では、アグリゲーションスイッチ106a内のポートIDS1/3はブロック状態に置かれ、アグリゲーションスイッチ106b内のポートS2/3は転送状態に置かれる。他の例ではスパニングツリープロトコルは、パケットフローまたはVLANに対して、アグリゲーションスイッチ106bのポートID S2/3をブロック状態に、およびアグリゲーションスイッチ106a内のポートS1/3を転送状態に置くように決定することができる。スパニングツリープロトコルは、複数のスパニングツリープロトコルを用いることなどによりVLANをベースとして、またはすべてのトラフィックフローに対して、アクティブパスを決定することができる。
リンクアグリゲートLAG1 420およびLAG2 422上でスパニングツリープロトコルをイネーブルすることによってパケットループは抑止される。H1から生じるデータパケットはループバックしないので、エッジノード104におけるMAC移動は防止される。結果としてH1とH10(ならびに他のホスト)の間の接続性は安定となる。
図12は、VFL124を通して接続障害が起きたときの、復旧の方法の一実施形態の論理フロー図を示す。ステップ502では、アグリゲーションスイッチ106がVFL124を通してリモートアグリゲーションスイッチへ通信できないような接続障害が、アグリゲーションスイッチ106によって検出される。一実施形態では、アグリゲーションスイッチ106内のポートマネージャアプリケーションモジュール418は、VFL124のメンバポートについてのポート状態およびリンク状態イベントを受け取り、障害をアグリゲーションスイッチ106のMCM400に報告する。または他の実施形態では、アグリゲーションスイッチ106のマルチシャーシ状態アプリケーションモジュール420は、物理レベルにおけるリンクの状態と共に、標準のLACPプロトコルまたは他の同様なプロトコルを用いて各VFLメンバポートの状態を追跡する。他の実施形態ではマルチシャーシ状態アプリケーションモジュール420は、VFL124のステータスをチェックするために定期的なキープアライブチェック(Helloプロトコル)を実行することができる。アグリゲーションスイッチ106はまた、他の方法またはアプリケーションを用いて、VFL124の作動可能状態を追跡し、VFLステータスを判断することができる。
アグリゲーションスイッチ106が、VFLの接続障害が起きたと判断したときは、ステップ504でアグリゲーションスイッチ106は、そのMC−LAG102のメンバポートの組の1つまたは複数を、エッジノードに結合された少なくとも1つのリンクアグリゲートに再構成する。ステップ506ではリンクアグリゲート上で、ネットワーク内の複数のアクティブパスによるパケットループを軽減するために、スパニングツリープロトコルまたは他の同様なタイプのネットワークプロトコルがイネーブルされる。
図13は、アグリゲーションスイッチ106の1つでのMC−LAG102のメンバポートの再構成の方法の一実施形態の論理フロー図を、より詳しく示す。ステップ510では、アグリゲーションスイッチ106のリンクアグリゲーションアプリケーションモジュール416は、MC−LAG102の1組のメンバポートのリンクパラメータを、リンクアグリゲートに対応する値に再構成する。一実施形態ではリンクパラメータは、以前にIEEE 802.3adタスクフォースによって2000年3月に追加されたIEEE802.3標準の43項であり、現在は2008年11月3日にIEEE802.1AX−2008に組み込まれている、リンクアグリゲーション制御プロトコル(LACP)によって記述されているものなどの、パラメータを含む。他の同様なタイプのリンクアグリゲーションプロトコルを実装することもできる。再構成されるMC−LAG102のメンバポートの組は、MC−LAG102のメンバポートの1つまたは複数を含む。アグリゲーションスイッチ106の追加のポートも、MC−LAG102のメンバポートの組から、エッジノード104に結合された新たに形成されたリンクアグリゲートに再構成され得る。
一実施形態では、スタンドアロンモードおよびマルチシャーシモードのためのリンクパラメータは、システム管理者によって予め構成される。別法としてリンクパラメータは、アグリゲーションスイッチ106によって自動的に決定される。例えばリンクアグリゲーションアプリケーションモジュール416は、スタンドアロンモードおよび/またはマルチシャーシモードのための1組のリンクパラメータを選択するように構成することができる。スタンドアロンリンクパラメータは、VFL124が接続障害を有するときなど、アグリゲーションスイッチがスタンドアロンモードで動作するときに実施される。マルチシャーシリンクパラメータは、アグリゲーションスイッチがマルチシャーシモードで動作しており、VFL124が作動可能であるときに実施される。スタンドアロンモードおよびマルチシャーシモードにおけるリンクパラメータの例は、以下の表に示される。
Figure 2015515809
リンクアグリゲーションアプリケーションモジュール416は1組のMC−LAGメンバポートを、第2の異なるシステム識別子、およびリンクアグリゲートのためのアクタ管理キーを用いて再構成する。これらのメンバポートは、エッジノード104に結合された新しいリンクアグリゲートに再グループ化される。1つまたは複数の新しいリンクアグリゲートは、MC−LAGメンバポートの組から形成することができる。アグリゲーションスイッチ106は、LACPまたは他のタイプのリンクアグリゲートプロトコルを用いて、新たに構成されたリンクアグリゲートメンバポートを通して、および隣接デバイスへの新たに構成されたリンクアグリゲートのメンバリンクにわたって、システム識別子および管理キーを交換する。結果としてエッジノード106は、MC−LAG102からリンクアグリゲートへの変化を検出する。次いでエッジノード106は、リンクアグリゲートのそのメンバポートを、新しい1組のリンクパラメータを用いて再構成する。リンクパラメータの変化はメンバポートに、LACPまたは他のタイプのリンクアグリゲートプロトコルを用いて再ネゴシエートさせ、新たに構成されたリンクアグリゲート、例えば図11のLAG1 420またはLAG2 422を形成させる。
加えてステップ512で、MC−LAG102の、1つまたは複数のリンクアグリゲートへの再構成が検出されたときは、ステップ514でMC−LAGに対するMACテーブルエントリはフラッシュされる。ステップ516で、新たに構成されたリンクアグリゲート、例えばLAG1 420またはLAG2 422に対して、新しいMACテーブルエントリが学習される。
図14は、アグリゲーションスイッチ106の1つによるSTPイネーブル化の方法の一実施形態の論理フロー図をより詳しく示す。アグリゲーションスイッチ106のSTPアプリケーションモジュール412は、VFL124のステータスの通知のために登録する。STPアプリケーションモジュール412が、VFL124が「ダウン」しているとの通知、またはVFL124の接続障害を示す他のイベントを受け取ったときは、ステップ520でSTPアプリケーションモジュールは、新たに構成されたリンクアグリゲートメンバポート上でSTP動作をイネーブルする。STPアプリケーションモジュール412は、ステップ522でVLANごとをベースとするなどにより、1つまたは複数のパケットフローのためのネットワークを通る1つまたは複数のアクティブパスを決定し、ステップ524でパケットフローに対するループを防止するために1つまたは複数の他のパスをブロックする。
図15は、VFL124が再び作動可能になったときに、アグリゲーションスイッチ124の1つによってマルチシャーシモードに戻る方法の一実施形態の論理フロー図を示す。ステップ526でアグリゲーションスイッチ106は、VFL124が再び作動可能であり、リモートアグリゲーションスイッチと通信できることを検出する。リンクアグリゲーションアプリケーションモジュール416は、リンクアグリゲートメンバポートの1つまたは複数を、システム識別子およびMC−LAGに対するアクタ管理キーに再構成する。ステップ528でこれらのメンバポートは、リモートアグリゲーションスイッチの1つまたは複数のメンバポートを用いて、エッジノード104に結合されたMC−LAG102に再グループ化される。アグリゲーションスイッチ106は、LACPまたは他のタイプのリンクアグリゲーションプロトコルを用いて、メンバポートを通して、およびエッジノード106への新たに構成されたMC−LAGのメンバリンクにわたって、システム識別子および管理キーを交換する。結果としてエッジノード106は、リンクアグリゲートからMC−LAGへの変化を検出する。次いでエッジノード106は、そのメンバポートをMC−LAGに再構成する。リンクパラメータの変化は、メンバポートにLACPまたは他のタイプのリンクアグリゲーションプロトコルを用いて再ネゴシエートさせ、MC−LAG102を形成させる。加えて、MC−LAGメンバポートの再構成が検出されたときは、リンクアグリゲート、例えばLAG1 420およびLAG2 422に対するMACテーブルエントリはフラッシュされる。新たに形成されたMC−LAGに対して新しいMACテーブルエントリが学習される。ステップ530でSTPは、新たに形成されたMC−LAGのメンバポート上でディセーブルされる。次いでアグリゲーションスイッチ106は、本明細書で述べられるようにマルチシャーシモードで動作し、VFL124を通してMACテーブルエントリを同期する。
図16は、アグリゲーションスイッチ106によって、スタンドアロンモードで動作する方法の一実施形態の論理フロー図を示す。上述のようにアグリゲーションスイッチ106のマルチシャーシモードからスタンドアロンモードへの再構成は、VFL124の接続障害の検出後すぐに起動される。他の実施形態では、アグリゲーションスイッチ106のマルチシャーシモードからスタンドアロンモードへの再構成は、システム管理者からのスタンドアロンコマンドによって起動される。例えばシステム管理者は、例えばリモートアグリゲーションスイッチに対して保守を行うために、VFL124が作動可能なときでも、アグリゲーションスイッチ106の1つをスタンドアロンモードに再構成することが必要な場合がある。ステップ532でアグリゲーションスイッチ106は、要素マネージャモジュール406からスタンドアロンコマンドを受け取る。次いでステップ534でアグリゲーションスイッチ106は、MC−LAG102の1組のメンバポートを、エッジノード104に接続された1つまたは複数のリンクアグリゲートに再構成する。次にステップ536でアグリゲーションスイッチ106は、エッジノード104への1つまたは複数のリンクアグリゲート上でスパニングツリープロトコルをイネーブルする。スタンドアロンモードではMACテーブルの同期は必要ないので、アグリゲーションスイッチ106は、VFL124を通したパケットの転送をブロックする。次いでアグリゲーションスイッチ106は、再びマルチシャーシモード起動するためのコマンドを受け取るまで、スタンドアロンモードで動作し続ける。
アグリゲーションスイッチのスタンドアロンモードからマルチシャーシモードへの再構成は、システム管理者からのマルチシャーシコマンドによって起動される。図17は、アグリゲーションスイッチ106によってマルチシャーシモードで動作する方法の一実施形態の論理フロー図を示す。ステップ540でアグリゲーションスイッチ106は、マルチシャーシモードで動作するためのコマンドを受け取る。ステップ542でアグリゲーションスイッチ106の1つまたは複数のポートは、リモートアグリゲーションスイッチの1つまたは複数のポートを用いて、エッジノード104に結合されたMC−LAG102に再グループ化される。ステップ544で、MC−LAG102のメンバポート上でSTPはディセーブルされる。次いでアグリゲーションスイッチ106は、マルチシャーシモードで動作し、再びVFL124を通して、プリペンドされたヘッダを用いてパケットを転送して、アグリゲーションスイッチ106の間でMACテーブルエントリを同期する。
アグリゲーションスイッチ106のスタンドアロンモードへの再構成は、仮想ファブリックリンク124がマルチシャーシシステム内で作動可能でなくなったときに起きる問題に対処する。実施形態は、接続性の損失、不必要な溢れ、MAC移動、ループされたパケット、重複したパケットを軽減するのを助ける。実施形態は、マルチシャーシシステムにおける高い可用性および回復力をもたらすのを助ける。
本明細書で用いられ得る、「に結合され」および/または「結合」という(1つまたは複数の)用語は、アイテムの間の直接の結合、および/または介在するアイテムを通じたアイテムの間の間接の結合を含み(例えばアイテムは、非限定的に構成要素、要素、回路、および/またはモジュールを含む)、間接の結合の場合は介在するアイテムは信号の情報を変更しないが、その電流レベル、電圧レベル、および/または電力レベルを調整する場合がある。本明細書でさらに用いられ得る、推論される結合(すなわち、1つの要素が推論により別の要素に結合される)は、「に結合される」と同じやり方での2つのアイテムの間の直接および間接の結合を含む。
本明細書で用いられる「するように動作可能」という用語は、アイテムが、述べられるまたは必要な対応する機能の1つまたは複数を行うために、処理モジュール、データ、(1つまたは複数の)入力、(1つまたは複数の)出力などの、1つまたは複数を含むことを示し、さらに、述べられるまたは必要な対応する機能を行うために、1つまたは複数の他のアイテムへの推論される結合を含み得る。また本明細書で用いられ得る「に接続される」および/または「接続」または「相互接続」という(1つまたは複数の)用語は、ノード/デバイスの間の直接の接続またはリンク、および/または介在するアイテムを通じたノード/デバイスの間の間接の接続を含む(例えばアイテムは、非限定的に構成要素、要素、回路、モジュール、ノード、デバイスなどを含む)。さらに本明細書で用いられ得る、推論される接続(すなわち、1つの要素が推論により別の要素に接続される)は、「に接続される」と同じやり方での2つのアイテムの間の直接および間接の接続を含む。
また実施形態について上記で、特定の機能の動作およびそれらの関係を示す方法ステップを用いて述べられた。これらの機能ビルディングブロックおよび方法ステップの境界およびシーケンスは、本明細書では説明の都合上で任意に定義されたものである。特定の機能および関係が適切に行われる限り、代替の境界およびシーケンスを定義することができる。したがっていずれのこのような代替の境界またはシーケンスも、特許請求される本発明の範囲および趣旨内にある。同様にフロー図ブロックも本明細書において特定の重要な機能を示すために任意に定義されたものである。用いられる範囲で、フロー図ブロック境界およびシーケンスは他のやり方で定義することもでき、依然として特定の重要な機能を行うことができる。したがって、機能ビルディングブロックおよびフロー図ブロックの両方のこのような代替の定義は、特許請求される本発明の範囲および趣旨内にある。当業者にはまた、本明細書における機能ビルディングブロック、および他の例示的ブロック、モジュール、構成要素は図示されるように、または1つまたは複数の個別構成要素、ネットワーク、システム、データベース、または適切なソフトウェアを実行する処理モジュールなど、またはそれらの人の組み合わせによって実現できることが理解されよう。

Claims (10)

  1. マルチシャーシシステムにおけるアグリゲーションスイッチであって、
    マルチシャーシリンクアグリゲートを形成するように構成されたリモートアグリゲーションスイッチの1つまたは複数のメンバポートインターフェースを用いてグループ化された、アグリゲーションスイッチの第1の組のメンバポートインターフェースであって、マルチシャーシリンクアグリゲートは、アグリゲーションスイッチおよびリモートアグリゲーションスイッチをエッジノードに結合する、第1の組のメンバポートインターフェースと、
    アグリゲーションスイッチをリモートアグリゲーションスイッチに結合するための仮想ファイバリンクを形成するように構成された、第2の組のポートインターフェースと、
    処理モジュールであって、
    リモートアグリゲーションスイッチへの仮想ファイバリンクの接続障害を判断し、
    第1の組のポートインターフェースの1つまたは複数を、エッジノードに結合するためのリンクアグリゲートに再構成し、
    第1の組のポートインターフェースの1つまたは複数においてスパニングツリープロトコルを起動する
    ように動作可能な処理モジュールと
    を備える、アグリゲーションスイッチ。
  2. 処理モジュールが、
    第1の組のポートをマルチシャーシリンクアグリゲートとして指定するリンクパラメータを、第1の組のポートをリンクアグリゲートとして指定するリンクパラメータに再割り当てする
    ことによって、第1の組のポートインターフェースをリンクアグリゲートに再構成するように動作可能である、請求項1に記載のアグリゲーションスイッチ。
  3. 第1の組のポートがそれぞれ、
    リンクパラメータのリンクアグリゲートへの変化を検出し、
    MACテーブルエントリをフラッシュし、
    リンクアグリゲートの一部として、MACテーブルエントリを再配置する
    ように動作可能である、請求項2に記載のアグリゲーションスイッチ。
  4. 処理モジュールが、
    第1の組のポートインターフェース上でスパニングツリープロトコルをイネーブルし、
    仮想ローカルエリアネットワークに属するパケットのアグリゲーションスイッチを通るループを識別し、
    識別されたループを防止するように、アグリゲーションスイッチの1つまたは複数のポートインターフェース上で、仮想ローカルエリアネットワークに属するパケットの転送をブロックする
    ことによって、第1の組のポートインターフェースにおいてスパニングツリープロトコルを起動するように動作可能である、請求項1に記載のアグリゲーションスイッチ。
  5. 第1の組のポートインターフェースが、
    宛先アドレスを含む、着信パケットを受信し、
    着信パケットの宛先アドレスに基づいて、リモートアグリゲーションスイッチ上のハードウェアデバイスに対応する宛先ハードウェアデバイス情報を求め、
    着信パケットから、宛先ハードウェアデバイス情報を含むプリペンドされたヘッダを有するパケットを発生し、
    仮想ファブリックリンクを通したリモートアグリゲーションスイッチへの送信のために、プリペンドされたヘッダを有するパケットを第2の組のポートインターフェースに送信する
    ように動作可能である、請求項1に記載のアグリゲーションスイッチ。
  6. 第2の組のポートインターフェースが、
    仮想ファイバリンクの障害を判断し、
    仮想ファイバリンクを通したパケットの転送をブロックする
    ように動作可能である、請求項5に記載のアグリゲーションスイッチ。
  7. スイッチにおける方法であって、
    マルチシャーシモードで動作するステップであって、
    スイッチ内の第1の組のポートインターフェースを通してエンドノードと通信するステップであって、第1の組のポートはエンドノードへのリモートスイッチの1つまたは複数のポートインターフェースを用いてマルチシャーシリンクアグリゲートを形成するように構成される、通信するステップと、
    仮想ファイバリンクを形成するように構成されたスイッチ内の第2の組のポートインターフェースを通して、リモートスイッチと通信するステップと
    を含む、マルチシャーシモードで動作するステップと、
    スタンドアロンモードで動作するためのコマンドを受け取るステップと、
    コマンドに応答して、複数の第1の組のポートインターフェースをリンクアグリゲートに再構成し、複数の第1の組のポートインターフェースにおいてスパニングツリープロトコルを起動するステップと
    を含む、方法。
  8. 所定のテーブルからスタンドアロンモードでの動作のためのリンクパラメータを決定するステップをさらに含み、スタンドアロンモードでの動作のためのリンクパラメータは、リンクアグリゲートのためのリンクパラメータ、およびリモートアグリゲーションスイッチのシステム識別子とは異なるシステム識別子を含む、請求項7に記載の方法。
  9. リンクアグリゲートのためのリンクパラメータを用いて複数の第1の組のポートを再構成するステップと、
    複数の第1の組のポートインターフェースのリンクアグリゲートへの再構成を検出するステップと、
    マルチシャーシリンクアグリゲートに関連する第1の組のポートインターフェースによって、MACテーブルエントリをフラッシュするステップと、
    リンクアグリゲートに対するMACテーブルエントリを再配置するステップと
    をさらに含む、請求項7に記載の方法。
  10. 複数の第1の組のポートインターフェースにおいてスパニングツリープロトコルを起動するステップが、
    第1の組のポートインターフェース上でスパニングツリープロトコルをイネーブルするステップと、
    スイッチを通るパケットフローのためのアクティブパスを識別するステップと、
    1つまたは複数の他のパスのためのスイッチの1つまたは複数のポートインターフェース上のパケットフローにおけるパケットの転送をブロックするステップと
    を含む、請求項7に記載の方法。
JP2015503323A 2012-03-27 2013-03-15 仮想ファブリックリンク障害復旧のためのシステムおよび方法 Expired - Fee Related JP5873597B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/431,116 2012-03-27
US13/431,116 US8913489B2 (en) 2010-08-04 2012-03-27 System and method for virtual fabric link failure recovery
PCT/US2013/031878 WO2013148303A1 (en) 2012-03-27 2013-03-15 System and method for virtual fabric link failure recovery

Publications (2)

Publication Number Publication Date
JP2015515809A true JP2015515809A (ja) 2015-05-28
JP5873597B2 JP5873597B2 (ja) 2016-03-01

Family

ID=48045082

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015503323A Expired - Fee Related JP5873597B2 (ja) 2012-03-27 2013-03-15 仮想ファブリックリンク障害復旧のためのシステムおよび方法

Country Status (5)

Country Link
EP (1) EP2832059B1 (ja)
JP (1) JP5873597B2 (ja)
KR (1) KR101563102B1 (ja)
CN (1) CN104221336B (ja)
WO (1) WO2013148303A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017108266A (ja) * 2015-12-09 2017-06-15 富士通株式会社 中継装置、設定方法、設定プログラム及び情報処理システム
JP2017526309A (ja) * 2014-09-04 2017-09-07 華為技術有限公司Huawei Technologies Co.,Ltd. 転送テーブル同期方法、ネットワークデバイスおよびシステム
JP2018042178A (ja) * 2016-09-09 2018-03-15 日本電信電話株式会社 通信装置及び配信テーブル同期方法
JP2018207284A (ja) * 2017-06-02 2018-12-27 富士通株式会社 伝送システム、伝送装置及びループ防止方法
JP2021535698A (ja) * 2018-08-23 2021-12-16 アルカス インコーポレイテッド ネットワークコンピューティング環境における第1ホップゲートウェイ冗長性
JP2022512135A (ja) * 2018-12-18 2022-02-02 新華三技術有限公司 プロトコルパケットの処理

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5821815B2 (ja) * 2012-09-11 2015-11-24 日立金属株式会社 通信システムおよび通信システムの処理方法
CN104869010B (zh) * 2013-12-13 2021-06-18 马维尔以色列(M.I.S.L.)有限公司 保护切换
KR101715368B1 (ko) 2015-08-27 2017-03-14 성균관대학교산학협력단 무선센서 네트워크 내 임의 노드 오작동시 동적 스위칭을 수행하는 방법 및 노드
WO2017149364A1 (en) * 2016-02-29 2017-09-08 Telefonaktiebolaget Lm Ericsson (Publ) Coordinated traffic reroute in an inter-chassis redundancy system
CN107306193B (zh) * 2016-04-18 2020-11-27 中兴通讯股份有限公司 基于sdn网络的交换机端口信息感知方法、装置和终端设备
EP3534571B1 (en) * 2016-11-15 2021-03-03 Huawei Technologies Co., Ltd. Service packet transmission method, and node apparatus
CN109218188B (zh) * 2017-07-04 2021-11-19 华为技术有限公司 链路聚合系统、方法、装置、设备及介质
US11245644B2 (en) * 2018-01-19 2022-02-08 Super Micro Computer, Inc. Automatic multi-chassis link aggregation configuration
CN109462515A (zh) * 2018-09-11 2019-03-12 锐捷网络股份有限公司 环路处理方法、网络设备、mlag组网及存储介质
CN112398731B (zh) * 2019-08-15 2022-05-13 华为技术有限公司 一种处理报文的方法和第一网络设备
CN112737956A (zh) * 2019-10-28 2021-04-30 华为技术有限公司 报文的发送方法和第一网络设备
CN112865936B (zh) * 2019-11-28 2022-04-05 大唐移动通信设备有限公司 一种信令转发方法和系统
US11470038B1 (en) 2020-05-19 2022-10-11 Marvell Asia Pte Ltd. Line side multiplexers with protection switching
CN114697220B (zh) * 2020-12-29 2024-07-30 华为技术有限公司 一种报文处理方法及相关装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012018521A1 (en) * 2010-08-04 2012-02-09 Alcatel-Lucent Usa Inc. System and method for multi-chassis link aggregation

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1655522A (zh) * 2005-02-24 2005-08-17 港湾网络有限公司 机架式网络设备业务板预配置实现方法
US8457017B2 (en) * 2005-06-30 2013-06-04 Infinera Corporation Multi-chassis interconnect
US20080181196A1 (en) * 2007-01-31 2008-07-31 Alcatel Lucent Link aggregation across multiple chassis
US8817656B2 (en) 2008-04-08 2014-08-26 Cisco Technology, Inc. Discovery for fibre channel over ethernet devices
EP2242215B1 (en) * 2009-04-16 2017-01-11 Alcatel Lucent Method for client data transmission through a packet switched provider network

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012018521A1 (en) * 2010-08-04 2012-02-09 Alcatel-Lucent Usa Inc. System and method for multi-chassis link aggregation

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6015034895; 高橋健太郎: '10GイーサLAN構築入門 手頃な価格が実現し一気に普及フェーズへ' 日経NETWORK 第133号, 20110428, p.30〜41, 日経BP社 *
JPN6015034896; Roger Lapuh et al.: Split Multi-link Trunking (SMLT), draft-lapuh-network-smlt-08 , 20080707, IETF *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017526309A (ja) * 2014-09-04 2017-09-07 華為技術有限公司Huawei Technologies Co.,Ltd. 転送テーブル同期方法、ネットワークデバイスおよびシステム
US10079781B2 (en) 2014-09-04 2018-09-18 Huawei Technologies Co., Ltd. Forwarding table synchronization method, network device, and system
JP2017108266A (ja) * 2015-12-09 2017-06-15 富士通株式会社 中継装置、設定方法、設定プログラム及び情報処理システム
JP2018042178A (ja) * 2016-09-09 2018-03-15 日本電信電話株式会社 通信装置及び配信テーブル同期方法
JP2018207284A (ja) * 2017-06-02 2018-12-27 富士通株式会社 伝送システム、伝送装置及びループ防止方法
JP2021535698A (ja) * 2018-08-23 2021-12-16 アルカス インコーポレイテッド ネットワークコンピューティング環境における第1ホップゲートウェイ冗長性
JP7475349B2 (ja) 2018-08-23 2024-04-26 アルカス インコーポレイテッド ネットワークコンピューティング環境における第1ホップゲートウェイ冗長性
US11972306B2 (en) 2018-08-23 2024-04-30 Arrcus Inc. Routing optimizations in a network computing environment
JP2022512135A (ja) * 2018-12-18 2022-02-02 新華三技術有限公司 プロトコルパケットの処理
JP7230206B2 (ja) 2018-12-18 2023-02-28 新華三技術有限公司 プロトコルパケットの処理
US11936762B2 (en) 2018-12-18 2024-03-19 New H3C Technologies Co., Ltd. Processing protocol packet

Also Published As

Publication number Publication date
WO2013148303A1 (en) 2013-10-03
CN104221336A (zh) 2014-12-17
KR20140127904A (ko) 2014-11-04
JP5873597B2 (ja) 2016-03-01
CN104221336B (zh) 2017-04-12
EP2832059A1 (en) 2015-02-04
EP2832059B1 (en) 2018-12-26
KR101563102B1 (ko) 2015-10-23

Similar Documents

Publication Publication Date Title
JP5873597B2 (ja) 仮想ファブリックリンク障害復旧のためのシステムおよび方法
JP5661929B2 (ja) マルチシャーシリンクアグリゲーションのためのシステムおよび方法
US8913489B2 (en) System and method for virtual fabric link failure recovery
US8582423B2 (en) Multi-chassis inter-process communication
US8472447B2 (en) IP multicast snooping and routing with multi-chassis link aggregation
US20200067812A1 (en) First Hop Gateway Redundancy In A Network Computing Environment
US7751329B2 (en) Providing an abstraction layer in a cluster switch that includes plural switches
EP2769515B1 (en) Fhrp optimizations for n-way gateway load balancing in fabric path switching networks
US20190182202A1 (en) System and method for route optimization in a multichasiss link aggregation configuration
US20160255018A1 (en) Protection switching over a virtual link aggregation
US20150271104A1 (en) Redundent virtual link aggregation group
CN110061915B (zh) 跨多个架构交换机的虚拟链路聚合的方法和系统
US20110032825A1 (en) Multipath discovery in switched ethernet networks
KR101691759B1 (ko) 가상 섀시 시스템 제어 프로토콜
US8446818B2 (en) Routed split multi-link trunking resiliency for wireless local area network split-plane environments

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160115

R150 Certificate of patent or registration of utility model

Ref document number: 5873597

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees