JP6046241B2 - リンクアグリゲーショングループにおけるスプリットブレイン問題を検知し、それに対処するための方法及び装置 - Google Patents

リンクアグリゲーショングループにおけるスプリットブレイン問題を検知し、それに対処するための方法及び装置 Download PDF

Info

Publication number
JP6046241B2
JP6046241B2 JP2015512140A JP2015512140A JP6046241B2 JP 6046241 B2 JP6046241 B2 JP 6046241B2 JP 2015512140 A JP2015512140 A JP 2015512140A JP 2015512140 A JP2015512140 A JP 2015512140A JP 6046241 B2 JP6046241 B2 JP 6046241B2
Authority
JP
Japan
Prior art keywords
node
lag
setting information
virtual
friend
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015512140A
Other languages
English (en)
Other versions
JP2015520577A (ja
Inventor
ヤノシュ ファルカシュ,
ヤノシュ ファルカシュ,
バラージュ ペーテル ゲロ,
バラージュ ペーテル ゲロ,
パナギオティス サルスィディス,
パナギオティス サルスィディス,
Original Assignee
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エルエム エリクソン(パブル), テレフオンアクチーボラゲット エルエム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Publication of JP2015520577A publication Critical patent/JP2015520577A/ja
Application granted granted Critical
Publication of JP6046241B2 publication Critical patent/JP6046241B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0813Configuration setting characterised by the conditions triggering a change of settings
    • H04L41/0816Configuration setting characterised by the conditions triggering a change of settings the condition being an adaptation, e.g. in response to network events
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • H04L41/0661Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • H04L45/245Link aggregation, e.g. trunking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Debugging And Monitoring (AREA)

Description

本出願は、2012年5月15日に出願された米国仮特許出願第61/647,211号への優先権を主張する。
本発明は概してリンクアグリゲーションに関し、より具体的には、リンクアグリゲーショングループにおけるスプリットブレイン状態を検知し、それに対処するための方法及び装置に関する。
リンクアグリゲーションは、リンクアグリゲーショングループ(LAG)に加わっている各リンク上のユーザデータの送信を可能にすることを目的に、ノード対の間の複数のリンクを集約するために広く使用されている(例えばIEEE802.1AXを参照のこと)。この様態における複数のネットワーク接続の集約は、単一接続が維持できることを超えてスループットを増大させ、かつ/又は、リンクのうちの1つに障害がある場合に冗長性を提供するために使用されうる。「DistributedResilientNetworkInterconnect」(DRNI)(IEEE802.1AX−REV/D0.2の第8条を参照のこと)は、例えば図1に示されたA、B、C及びDの4つのノードの間のような、2つ以上のノード間であっても、ネットワークインターフェース上のリンクアグリゲーションを使用可能にするために、リンクアグリゲーションに対する拡張の仕様を定める。この出願の図1及び後続の多くの図では、「DRNI」という表示は、4つのノードA、B、C及びDを含むLAGを示すために使用される。
図1に示すように、LAGは、ネットワーク1とネットワーク2の間に形成される。より具体的には、LAGは、LAG仮想ノード30、32の間に形成される。第1LAG仮想ノード30は、第1ノード(A)及び第2ノード(B)を含む。第2LAG仮想ノード32は、第3ノード(C)及び第4ノード(D)を含む。LAGノードAとCはピアノードとして接続され、LAGノードBとDも、ピアノードとして接続される。仮想ノード30内で、ノードAとBは「仲間ノード」として接続され、同様に仮想ノード32内では、ノードCとDは「仲間ノード」として接続される。この出願で使用されているように、「LAG仮想ノード」とは、上述のIEEE参照文献におけるDRNIポータル(すなわち、それぞれのピアにとって単一ノードとして発現する2つのノード)を表す。加えて、仮想ノード30は2つのノードA、Bを「含む」という記述は、仮想ノード30が、ノードA、Bによってエミュレートされるという意味である。同様に、仮想ノード32は2つのノードC、Dを「含む」という記述は、仮想ノード32が、ノードC、Dによってエミュレートされるという意味である。
LAGに加わっている複数のノードは、LAG内のそれらのピアリングパートナーに、単一システムIDを備えた同一の仮想ノードと認識される。システムIDは、各ノード(ノードA、ノードB、ノードC、ノードDなど)を識別するために使用される。システムIDは、LAGの個々のノード間で送信される、リンクアグリゲーション制御プロトコルデータユニット(LACPDU)に含まれる。仲間ノードのうちの1つのシステムIDを、それらに対応するLAG仮想ノードのための共通システムIDとして使用することは実際的である。ゆえに、図1に示すように、ノードA及びノードBは、同一のネットワーク1に属し、かつそれらは、同一のDRNIポータル(すなわち同一のLAG仮想ノード30)の一部であり、エミュレートされたLAG仮想ノード30のために、「A」という共通システムIDを使用する。同様に、ネットワーク2のノードC及びDは、ノードAとBによって、システムID「C」を備えた単一LAG仮想ノード32として受け止められる。
図1はまた、特定のサービスのDRNIハンドオフを示す(図1の太線「サービス」を参照のこと)。インターフェース上のサービスハンドオフは仮想局所的エリアネットワーク(VLAN)であり、サービスのための識別子は、サービスVID(すなわち「S VID」)(通常、ネットワーク・ネットワークインターフェース(NNI)上のサービスを識別する)、又は、顧客VID(すなわち「C−VID」)(通常ユーザ対ネットワークのインターフェース(UNI)上のサービスを識別する)のような、VLAN識別子(VID)でありうる。図1の実施例では、ネットワーク1と2の両方が、「アクティブゲートウェイノード」として上位ノードを選択し、かつ、サービスハンドオフのために上部リンクを選択したことから、サービスは上部リンク上で(ノードA、Cの間で)ハンドオフされる。この出願全体にわたり、アクティブゲートウェイノードは、太線で囲まれて図示される。このゲートウェイ機能は、ループ防止のためにDRNIによって導入される。ゆえに、ノードBとDは、DRNIとそれら自身の各ネットワークの間でサービスがハンドオフされるのを妨げる。
DRNIによって対処される必要がある、様々な種類の障害が存在する。それらのうちの1つは、図2に示した「ポータルノード障害」である(「ポータルノード」及び「LAGノード」は、この文脈において同義に使用されている)。図2に示すように、ノードAに障害が発生し、ノードB及びノードCと通信できなくなっている。従来技術では、ノードBはLAGのために、図1の実施例でノードAのシステムIDであった、既に使用されていた共通IDの代わりに、それ自身のシステムIDの使用を開始することになる。ノードCはノードAの非到達性を知覚し、ノードDもそれを知覚しうる。ノードC及びノードDは、LAG接続性を提供するために、新たなパートナーシステムID(B)を受容する必要がある。より円滑な移行のために、また、アクティブアグリゲーションを漏れなく再確立するために、旧システムID(A)から新システムID(B)へのグレースフルな名称変更が適用されうる(例えば、N.Finn氏が2011年に寄稿した「GracefulNameChangeinLACP,http://www.ieee802.org/1/files/public/docs2011/axbq−nfinn−graceful−name−change−0511−v1.pdf」を参照のこと)。
ただし、図2に示した挙動は、ポータルを含む個々のノードのシステムIDに基づく、ポータルのシステムIDの変更に基づくものであることから、疑わしい。相応して、この従来技術の解決法は、個々のシステムに視認性を与える(すなわち、ノードCとDはノードAに障害が生じたと知覚する)が、このことは、単一LAG仮想ノードの外観をそのピアに提示するDRNIの内部システムの詳細を秘匿するというDRNIの主たる設計原則に反する。ゆえに、DRNI原則の下では、たとえノード障害が発生しても、システムIDの変更は避けることが望ましい。
図3は、同一ポータル上のノード間の接続性(すなわち「ポータルリンク」)が切断され、それによって仲間ノードAとBの間のリンク切れを起こしている時における、別の不具合事象を示している。従来技術では、ノードは、ポータルリンク障害とポータルノード障害を弁別することは不可能であり、ポータルリンク障害に対するノードB’の反応は、上述のポータルノード障害に対するものと同一(すなわち、ノードBは共通システムIDの代わりにそれ自身のシステムIDの使用を開始する)である。それにもかかわらず、図2に示すように、ノードAは作動中であり、かつ、LACPDU中のそれ自身のシステムIDを使用している。ノードCとDは次いで、単に共通システムIDを使用するLAG仮想ノード30に対するリンク(すなわち、この実施例ではノードAへのリンク)を維持する。他のノードへのリンクは、図4に図示されているように、LAGからのリンクを無効化することにより、ノードCとDによって無効化される(ノードBとノードDの間の点線を参照のこと−この表記は、この出願全体にわたり無効化されたリンクを示すために使用される)。
図3から図4のポータルリンク障害によって生じた状況は、単一LAG仮想ノード30をエミュレートするノードAとBの両方が作動中であるが、互いに接続されていないことから、「スプリットブレイン(SB)」と称される。スプリットブレインノードの両方がアクティブゲートウェイになっている場合には、ループが発現することになる。それにもかかわらず、ピアリングパートナーノードCとDは、スプリットブレインノードAとBに、それらが図4に示すようなスプリットブレイン状況にあると伝えることができる。それはつまり、ノードCとDの両方が、それらの各ピアノードに、LAG仮想ノード30でスプリットブレイン状況が発生したと伝えるために、LACPDUを使用するということである。ゆえに、どちらのノードも、他方からアクティブゲートウェイの役割を引き継がない(例えば、ノードBは図1のサービスのためのアクティブゲートウェイにならない)。ノードCとDの間の接続性が妥当に機能している場合、それらは単一LAG仮想ノード32をエミュレートし、かつ、それらの両方が、それらの各ピアノードA及びBから受信された異なるシステムIDを知覚することに留意されたい。
スプリットブレイン状況がLAGの両側で同時に発現している場合には、「ダブルスプリットブレイン(DSB)」状態(「デュアルスプリットブレイン」としても知られる)が発生していると言われる(図5を参照のこと)。LAGの両側にスプリットブレインが発生している場合には、いずれのポータル内にも接続が存在しないことから、LAG仮想ノード30、32のどちらも、他方のLAG仮想ノード30、32のスプリットブレイン状況を検知できない。ゆえに、同一のポータルのノードは、それらの各LACPDU内でそれらが異なるシステムIDを受信するという事実を互いに通知できず、このことは、従来技術のシングルスプリットブレイン対処法の原理である。従って、全てのノードはポータル内にあるそれらの仲間ノードがダウンしているとみなすことになり、全てのノードは、あらゆるサービスのためのアクティブゲートウェイになる。この結果として、図5に示すように、データフレームの転送ループが生じる。ダブルスプリットブレイン状況に対処するための、有効な方法はない。
第1仮想ノードと第2仮想ノードを含む、リンクアグリゲーショングループ(LAG)内の仮想ノードを動作させるためのいくつかの方法が開示される。第1の例示的な方法により、第1仮想ノードと第2仮想ノードを含むLAG内の仮想ノードを動作させる方法が開示されている。第1仮想ノードは、少なくとも、第1仲間ノード及び第2仲間ノードを含む。方法により、第1仲間ノードは、第1仲間ノードが第2仲間ノードと通信しているか否かを判断する。第1仲間ノードはまた、判断に基づいて、判断により第1仲間ノードは第2仲間ノードと通信していると示される時には、制御情報がシステムID及びLAGに関連付けられた第1設定情報を含むように、判断により第1仲間ノードは第2仲間ノードと通信していないと示される時には、制御情報がシステムID及びLAGに関連付けられた第2設定情報を含むように、第2仮想ノードに制御情報を送信し、第2設定情報は第1設定情報とは異なる。
一実施例では、第1設定情報及び第2設定情報は、設定キーとサービスダイジェストのうちの1つである。同一の、又は別の実施例では、第1設定情報及び第2設定情報は、リンクアグリゲーション制御プロトコルデータユニット(LACPDU)メッセージ内で搬送される。例示的な方法を実装するよう構成された対応するネットワークノードも開示される。
別の例示的な実施形態により、第1仮想ノードと第2仮想ノードを含むLAG内の仮想ノードを動作させる方法が開示されている。第1仮想ノードは、少なくとも、第1仲間ノード及び第2仲間ノードを含む。方法により、第1仲間ノードは、第2仮想ノードから、システムID及びLAGに関連付けられた第1設定情報を含む第1制御情報を受信する。第1設定情報は、LAGに関連付けられた参照設定情報と比較される。比較により、第1設定情報が参照設定情報に一致しないと示される場合、第1仲間ノードは第2仲間ノードと通信していないと検知すること、及び、第2仲間ノードは第2仮想ノードと通信しており、かつ、第1設定情報が、第2仮想ノードによって第2仲間ノードに提供された第2設定情報に一致しないこと、のうちの少なくとも1つに応答して、LAG内にスプリットブレイン状態が存在すると判断される。参照設定は、既に確立された、LAGに関連付けられた予想設定情報を表す。
一実施例では、スプリットブレイン状態が存在すると判断することは、第1仲間ノードは第2仲間ノードと通信していないと検知することに応答して、LAG内にデュアルスプリットブレイン状態が存在すると判断することを含む。この実施例では、第1と第2の仮想ノードを接続する非プライマリ接続リンク、又は非デフォルト接続リンクは、LAG内にデュアルスプリットブレイン状態が存在すると判断される場合、LAGから除外されることがある。
一実施例では、スプリットブレイン状態が存在すると判断することは、第2仲間ノードは第2仮想ノードと通信しており、第1設定情報が、第2仮想ノードによって第2仲間ノードに提供された第2設定情報に一致しないことに応答して、LAG内にシングルスプリットブレイン状態が存在すると判断することを含む。第1設定情報、第2設定情報及び参照設定情報は、設定キーと設定ダイジェストのうちの1つでありうる。また、設定情報は、リンクアグリゲーション制御プロトコルデータユニット(LACPDU)メッセージ内で搬送されることがある。この追加の例示的な方法を実装するよう構成された、対応するネットワークノードも開示される。
言うまでもなく、本発明は、上記の特性及び利点に限定されない。実際には、当業者は、下記の詳細な説明を読み添付の図面を参照することで、追加的な特性及び利点を認識するであろう。
サービスに対応可能なLAGを示すブロック図である。 LAG内のポータルノード障害のブロック図である。 スプリットブレイン状態を発生させる、LAG内のポータルリンク障害のブロック図である。 図3のスプリットブレイン状態に対処するための従来技術の解決法のブロック図である。 ダブルスプリットブレイン状態のブロック図である。 新規のシステムID命名措置を使用する、通常のLAG動作状態のブロック図である。 新規のシステムID命名措置を使用する、通常のLAG動作状態のブロック図である。 図6から図7のLAG内のノード障害のブロック図である。 共通キーを使用するLAGノードの通常の動作状態のブロック図である。 図9のLAG内の非プライマリLAGノード障害のブロック図である。 図9のLAG内のプライマリLAGノード障害のブロック図である。 図9のLAGにおける、シングルスプリットブレイン対処法のブロック図である。 図9のLAGにおける、シングルスプリットブレイン対処法のブロック図である。 サービス割当ダイジェストを使用するLAGノードの通常の動作状態のブロック図である。 図14のLAG内のLAGノード障害のブロック図である。 図14のLAGにおける、シングルスプリットブレイン対処法のブロック図である。 図14のLAGにおける、シングルスプリットブレイン対処法のブロック図である。 スプリットブレイン状態を検知するためにLAG内の仮想ノードを動作させる、例示的な方法を示している。 スプリットブレイン状態を検知するためにLAG内の仮想ノードを動作させる、別の例示的な方法を示している。 LAGにおける、ダブルスプリットブレイン対処法のブロック図である。 LAGにおける、ダブルスプリットブレイン対処法のブロック図である。 完全にメッシュ化されたDRNIにおける、ダブルスプリットブレイン対処法のブロック図である。 ダブルスプリットブレインの誤った対処により切断されたLAG接続性のブロック図である。 LAG内の仮想ノードを動作させる、例示的な方法を示している。 LAG内の仮想ノードを動作させる、別の例示的な方法を示している。 例示的なLAGノードを示している。
図6から図7は、LAG仮想ノード30、32の各々で同一のノード識別システムIDが使用される、システムID命名方法を示す。図6から図7に示すように、ノードAとBは、ネットワーク2に対してLAG仮想ノード30内の単一仮想ノードA’であると主張する。それはつまり、図6に示すようにノードCとノードDのパートナーのシステムIDがA’であるように、かつ、ノードCとノードDが、それらは単一ノードA’に接続されていると認知するようなLACPDUを、ノードCとノードDの両方が受信するということである。他方の側での動作も同じであり、ノードCとノードDは、ネットワーク1に対してC’というシステムIDを備えた単一LAG仮想ノード32であると主張する。一実施例では、各仮想ノードのシステムIDは、仮想ノードを実装しているポータルノードのうちの1つのIDのものと同一である。それはつまり、一実施例では、システムID A’=システムID Aであり、かつ、システムID C’=システムID Cであるということである。
DRNI動作の原則によれば、障害の場合であっても、LAG仮想ノードの内部動作をそのピアリングネットワークから秘匿することが望ましい。図8は、図6から図7のLAG内のノード障害のブロック図であり、その中でこの所望の挙動が追及されている。それはつまり、ノードAの機能停止にもかかわらず、ノードBは、ピアリングネットワークに対してシステムID A’を依然として使用し、それ自身のIDには変更しないということである。システムID A’=システムID Aである場合には、ノードBは、ノードAの機能停止にもかかわらず、ネットワーク2に対してシステムID Aを依然として使用する。従って、図6から図7のLAGノードA、B、C、DはLAGに対して告知しているシステムIDを変更しないことから、DRNI動作原則が常に適用され、維持されることを目指すものである場合、従来のスプリットブレイン対処方法は適用されえない。
スプリットブレイン状況が発現する可能性を最小化するための、実現可能性のある一ステップは、仲間ポータルノードの相互接続のために、ポータル内で保護されたリンクを適用する(A−B間及びC−D間に保護されたポータルリンクを有する)ことである。例えば、LAGによってグループ化された複数の物理リンクにより、仲間ポータルノードは互いに接続される可能性がある。この方法と組み合わせて、或いはこの方法の代替として使用されうる他の方法を、下記で説明する。
キー変更を使用するシングルスプリットブレイン回避
図9から図13は、シングルスプリットブレイン状態を検知し、それに対処するためにキー変更を使用する、例示的な一方法を示す。これらの図(及び図7から図8)では、ノードを囲む二重円は、ノードがその各LAG仮想ノード30又は32内にある「プライマリノード」であることを示している。
図9から図13の方法は、システムIDが障害発生時に変更されず、かつ、いかなる状態下においても変更されない場合に、シングルスプリットブレインに対処するために提案されている。提案されている方法は、仲間ポータルノードがダウンしていると認知される場合、アグリゲーションキーの変更に依拠する。アグリゲーションキー(又は「アグリゲータキー」或いは「アクターキー」若しくは単に「キー」)は、ノードAとCの間、及びノードBとDの間で送信されたLACPDU内で使用される。図9を参照するに、通常の動作状態では、ノードAとBの各々は、それらのピアノードへの送信においてキー「K」を使用する。
図10は、ノードBに障害が生じている、図9のLAGにおける非プライマリポータルノード障害を示す。仮想ノードのシステムIDが、仮想ノードをエミュレートしているポータルノードのうちの1つのシステムIDと同一の場合には、共通システムIDを有するノードがプライマリノードである(例えば、システムID A’=システムID Aの時はノードAがプライマリノードである)。図10に示すように、たとえ非プライマリノードに故障が生じても、プライマリノードはそのアグリゲーションキーを変更しない。
しかし、プライマリノードAに故障が生じている場合には、図11に示すように、非プライマリノードBはそのアグリゲーションキーを変更する。それはつまり、ノードAに故障が生じている場合には、ノードBは、そのLACPDU内のキーを、既に使用していた共通キー「K」に替えて「L」に変更するということである。キー変更による中断を回避するために、旧キー値と新キー値は、変更中、及びその少し後に、LACPDU内で搬送されうる。ゆえに、旧キー又は新キーのいずれかとの一致があれば、LAGは維持されうる。A’という同一のシステムIDが、ノードBはノードAに障害が生じたと認知しているにも関わらず、ノードBによって使用され続けることは、注目に値する。
例示的な一実施形態による、キー変更によるシングルスプリットブレイン状態の対処法が、図12から図13に示されている。図12を参照するに、仮想ノード30のポータル内で接続性が切断されている場合には、ポータルノードA、Bの両方は、仲間ポータルノードがダウンしていると認知する。ただし、ノードA又はノードBのいずれも、両方がそれらのピアノードC、Dに対してシステムID A’の使用を継続することから、そのシステムIDを変更しない。プライマリノード(すなわち実施例ではノードA)も、そのキーを変更せず、共通キー「K」を使用し続ける。対象的に、非プライマリノードであるノードBは、そのキー値をキー「L」へと変更する。
ピアノード(ノードC及びノードD)は、LACPDU内の別々のキー値を受信し、これを使用して、LAG仮想ノード30でシングルスプリットブレインが発生したと検知する。予想キーKが受信されるリンクは、LAG内に保たれる(すなわち、ノードAとCの間のリンク)。受信されたキーが予想キーと異なるそれらのリンクは、図13に示すようにLAGから除外される(すなわち、BとDの間のリンクは除外される−BとDの間の点線により示す)。
ノード障害の場合、たとえキーが変更されても、ピアによって単一キーが受信されることが、ノード障害とスプリットブレイン状態の間の相違であることに留意されたい。しかし、スプリットブレイン状況の場合、複数の異なるキーが受信される。従って、図13に示すように、ピアはスプリットブレイン状況を認識し、かつ、スプリットブレイン内のノードに、それらのノードがスプリットブレイン内にあるという事実について伝えることが可能である。
サービス割当変更に基づくシングルスプリットブレインの回避
図14から図17は、シングルスプリットブレイン状態を検知し、それに対処するためにサービス割当ダイジェストを使用する、例示的な方法を示す。下記に説明するダイジェストを組み込む実施形態においては、「プライマリ」及び「非プライマリ」ノードが存在せず、ゆえに、どのノードも二重円で囲まれていないことは、注目に値する。しかしこれらの実施形態は、同様の様態において、「デフォルトリンク」及び「非デフォルトリンク」という概念を利用する。
ある状況において(例えば、LAG適合が必要な場合)、LAG内に集約されている個々のリンクへの実際のサービス割当の情報は、ダイジェストの形態で、交換されたLACPDU内で搬送される可能性がある(例として、「MethodforEnsuringCongruencyinLinkAggregation」と題された、Ericsson社の仮出願特許番号61/605,818、識別番号4015−8027/P36113を参照のこと)。かかる構成においては、あるサービスが特定のLAGピアリンクに割り当てられ、ダイジェストは、LAGノードの間で送信され、これらのサービス割当を示す。LAGの2つのエンドで交換された割当の比較により、搬送されたサービスの適合の検証が可能になる。
下記の説明では、スプリットブレインの回避方法は、リンク割当に対するサービスの変更(すなわち、ダイジェストで受信されると予想されるサービス割当情報と比較した相違)の検知に依拠している。以下でずっと詳細に説明するように、LACPDU内のLAGサービス割当を表すためにサービス割当ダイジェストの形をとることにより、あるダイジェスト変更に基づいて、スプリットブレイン状態が検知されうる。
図14は、サービス割当ダイジェストを使用するLAGの通常の動作状態のブロック図である。図14では全てのリンクが動作可能であることから、LAG全体にわたって同一のサービス割当が使用され、LAG内のピアノード間で同一のサービスダイジェスト「G」が送信される。それはつまり、集約された各リンク上で、例としては物理リンクへのVLAN識別子(VID)割当についての情報を搬送する、追加的なサービスダイジェストが交換されるということである。VIDは合目的的な様態でハンドオフされることから、図14に示すように、全てのダイジェスト値は同一であり、かつ、LAG仮想ノード30、32の両方の間で同一のサービスダイジェスト「G」が交換される。VIDがLAGの両側で同一の物理リンクに割り当てられ、かつ、ダイジェストがあらゆるVIDの割当を対象とする場合、割当は一貫性を有する。ゆえに、送信されるダイジェストと同一のダイジェストが受信されることが予想される。
図15は、ノード障害の場合の動作を示している。この場合、ピアリンクB−Dによって搬送された全てのサービスが、ピアリンクA−Cによって搬送されるようになっている。これは、ネットワーク2に新たなダイジェストHが伝達され、サービスの移転を示すことになることを意味する。また、ネットワーク2のLAG仮想ノード32は、LAGのリンクを喪失することによって障害を知覚し、従って、仮想ノード32は、全てのサービスをリンクA−Cへと移動させてダイジェストを更新するために、適切な措置の変更も行う。ゆえに、ダイジェストの交換は図15に図示したようなものになる。
サービス割当の変更に基づくシングルスプリットブレイン状態に対処する例示的な一方法を、図16及び図17に示す。ポータル内で接続性が切断されている(例えば、ノードAとノードBの間のリンクが切れている)場合、ポータルノードAとBの両方は、それらの仲間ノードがダウンしていると認知する。集約された各リンクは、以前は他のリンク上で搬送されていた全てのサービスを引き継ぐ。その結果として、ノードAによって送信されたダイジェスト「H」は、全てのサービスがA−Cリンクを介して搬送されるように算出される。ノードBも、全てのサービスがB−Dリンクを介して搬送されるように算出される、ダイジェスト「J」を送信する。ゆえに、スプリットブレイン内のポータルノードは、図16に示すように、別々のダイジェストを送信する。その結果、ノードCとDの各々は、それらのピアノードA及びBから、A−C及びB−Dのリンクを介して別々のダイジェストを受信する。ノードC及びDは、この情報を使用して、それらのピアにスプリットブレイン状態が発生していると判断することができ、かつ、下部IDリンクを分離させる(すなわち、ノードBとノードDの間の「非デフォルトリンク」を無効化する)こと、及び、LAG内の「デフォルトリンク」(図16から図17の実施例ではノードAとノードCの間のA−Cリンク)を保つことによってLAGが分割されるように、適切な処置を取りうる。同時に、ノードCとDは、それらの各ピアノードA及びBに、LAG仮想ノード30におけるスプリットブレイン状態について伝える(図17の「SB」通知を参照のこと)。
この点を考慮して、図24は、第1仮想ノード(例えばLAG仮想ノード30)、及び第2仮想ノード(例えばLAG仮想ノード32)を含むLAG内の仮想ノードを動作させる例示的な方法300を示している。一例として、方法300は、少なくとも、第1仲間ノードと第2仲間ノード(例えばノードA及びB)を含むLAG仮想ノード30である、「第1仮想ノード」と共に説明される。第1仲間ノードは、第1仲間ノードが第2仲間ノードと通信しているか否かを判断し(ステップ302)、判断に基づいて制御情報を第2仮想ノードに送信する(ステップ304、306)。判断により第1仲間ノードは第2仲間ノードと通信していると示される時には、制御情報は、システムID、及びLAGに関連付けられた第1設定情報を含む(ステップ304)。判断により第1仲間ノードは第2仲間ノードと通信していないと示される時には、制御情報は、システムID、及びLAGに関連付けられた第2設定情報を含み、第2設定情報は第1設定情報とは異なる(ステップ306)。
上述のように、第1設定情報と第2設定情報は、設定キー及び/又はサービスダイジェストでありうる。また、第1設定情報と第2設定情報は、任意ではあるが有利には、LACPDUメッセージ内で搬送されうる。
シングルスプリットブレイン及びダブルスプリットブレインの対処法
図18から図19は、スプリットブレイン状態を検知するためにLAG内の仮想ノードを動作させる、例示的な方法の詳細を示している。各実施形態では、LAGノード(A、B、C、D)の各々は、そのLAGピアからある情報を得ることを予想するよう構成され、ダブルスプリットブレイン状態は、一旦検知されると、接続ピアリンクを除外することにより対処されうる。
図18は、ピアノードからのLACPDUの受信に基づいてシングルスプリットブレイン又はダブルスプリットブレインの対処を促進する、例示的な方法100を示している。方法100は、例示の目的で、LAG仮想ノード32のノードDの観点から説明される。
制御情報が他の仮想ノードから(例えばノード30から)受信されたか否かを判断するための確認が実行される(ステップ102)。情報は、例えばLACPDU内で、受信されることがある。制御情報は、システムID並びに第1設定情報を含む。第1設定情報が参照設定情報に一致するか否かを判断するための確認が実行される(ステップ104)。参照設定は、既に確立された、LAGに関連付けられた予想設定情報(例えば予想キー)を表す。第1設定情報が参照設定情報に一致しない場合、ノードDはその仲間ノードCと通信可能か否か(すなわち、ノードCは到達可能か否か)を判断するための確認が実行される(ステップ106)。ノードCとDが互いに通信可能である場合には、第2設定情報が仲間ノードCで受信されるか否かを判断するための確認が実行される(ステップ107)。規定の時間が経過した後に第2設定情報が受信されない場合には、ピアノードAに障害が生じたと判断されうる(ステップ108)。或いは、第2設定情報が受信され、かつ、第1設定情報に一致しない(例えば、仲間ノードCとDが、それらのピアノードAとCから異なる設定情報を受信している)場合には、LAG仮想ノード30でシングルスプリットブレイン状態が発生したと判断される(ステップ109)。これに基づいて、当該リンクが依然としてLAGのメンバであるか否かを判断するための確認が実行される(ステップ112)。これは、ノードDの例では、ノードBとDを接続するピアリンクであるはずである。リンクが依然としてLAGのメンバである場合には、それはLAGから除外され(ステップ114)、シングルSB通知を有するLACPDUが、ノードBであるはずのLAGピアに送信される(ステップ116)。
ステップ106を再度参照するに、ノードCとDが互いに通信できない場合には、ダブルスプリットブレイン状態が検知され(ステップ110)、ステップ112からステップ116が、シングルSB通知に替えてDSB通知がステップ116で提供されることになることを除き同様の様態で実行される。ゆえに、当該リンクが依然としてLAGのメンバであるか否かを判断するための確認が実行され(ステップ112)るが、LAGのメンバとは、ノードDの例では、ノードBとDを接続するピアリンクであるはずである。リンクが依然としてLAGのメンバである場合には、それはLAGから除外され(ステップ114)、DSB通知を有するLACPDUが、ノードBであるはずのLAGピアに送信される(ステップ116)。本書で提案されている方法は、他の不具合事象の対処法を改変する、又は損なうものではないことに留意されたい。
ステップ104を再度参照するに、LACPDUに予想情報が含まれる場合、仲間ノードが到達可能であるか否かを判断するための確認が実行される(ステップ118)。ゆえに、ノードDがノードCと通信可能か否かを判断するための確認が実行される。ノードC、Dが通信可能である場合には、以前のダブルスプリットブレイン状態はもはや存在しない。従って、ノードBとノードDの間のピアリンクが現時点でLAGの一部であるか否かを判断するための確認が実行され(ステップ120)、それがLAGの一部ではない場合、再びLAGに付加される(ステップ122)。
加えて、従来技術のシングルスプリットブレイン方法(障害発生の際にノードBがそのシステムIDを変更するはずの方法)と方法400(キー変更によってシングルスプリットブレイン状態を検知する方法)はどちらも、方法100で提案されたダブルスプリットブレイン対処法と共に、良好に機能する。
方法100は、(ノードAとCの間のプライマリピアリンクが保持されることになるように)ノードBとDの間の非プライマリ接続ピアリンクを無効化するために、(ノードDとノードCはどちらも、それらの各仲間ノードから同一の参照設定情報を得ることを予想している状況で)ノードDによって実装されている設定情報と説明されたが、これは一例に過ぎないことを理解すべきである。方法100はノードCによっても実行され、例えばノードCは、ステップ102からステップ104において、やはりその予想情報を受信することになる。これは、ノードAとCは、同一の情報(例えば、同一のシステムID及び/又はキー)の使用を継続し、ノードCとDのみが別の情報を使用することになるからである。従って、ノードAとノードCの間のピアリンクは、たとえダブルスプリットブレインの際でも無効化されないはずである。一実施形態では、ノードA、B、C及びDの4つ全てが、方法100を実行して、LAG仮想ノード30、32の両方で、シングルスプリットブレイン及びダブルスプリットブレインを検知を行う。
上述のように、参照設定情報は、例えば情報検証に使用される、アグリゲーションキーを含む可能性がある。参照設定情報は、例えば初期設定アクションによって決定される、或いは、通常の動作下で(例えば初期LACPDU交換中に)LACPDUによって搬送された価に基づく可能性がある。図9の実施例では、ノードCとDは両方、それらのピアの予想キーKを保存するよう構成される。図18で説明されている方法の情報の不一致は、LACPDU内で受信されたキーがと局所的予想キーと異なる場合に発生することになる。
図19は、設定情報が、物理LAGリンクへのサービスの割当を示すサービス割当ダイジェストである、スプリットブレイン状態を検知するよう、LAG内の仮想ノードを動作させる例示的な方法を示している。ダイジェストはLACPDU内で受信され、サービスダイジェストは、予想サービスダイジェストと異なることがある。図18のダブルスプリットブレイン対処機構は、リンクに対するサービスの、受信された割当と、予想割当の不一致の検知に依拠する。
方法200は、例示の目的で、ノードDの観点から説明される。図19のステップ202からステップ212、及びステップ214からステップ222は、(キー又はシステムIDとは対照的に)予想情報がサービス割当ダイジェストに対応することを除き、図18のステップ102からステップ112、及びステップ214からステップ222と同様の様態で実行される。方法100、200の間の顕著な一相違点は、方法200には、当該LAGピアリンク(例えばノードBとノードDを接続するリンクB−D)はデフォルトLAGリンクであるか否かを判断するための、追加的なステップ213が含まれていることである。このステップにより、非デフォルトリンク(すなわちノードB、Dの間のリンク)のみが無効化され、プライマリリンク(すなわちノードA、Cの間のリンク)は無効化されないことが確実になる。ゆえに、スプリットブレイン状況が予測され、かつ、受信されたダイジェストと予想ダイジェストの不一致が存在する場合には、リンクは、デフォルトLAGリンクではない限り、LAGから除外される必要がある。一実施例では、デフォルトLAGリンクは、別のリンクがデフォルトLAGリンクとして構成されていない限り、数値的に最も低いリンクID値を有するリンクである。
図18から図19がより詳細に図示しているのに対して、図25は、第1仮想ノードと第2仮想ノードを含むLAG内の仮想ノードを動作させる、一般化された方法400を示している。方法400の実施例では、LAG仮想ノード32は例示的な「第1仮想ノード」であり、LAG仮想ノード30は例示的な「第2仮想ノード」となるが、異なる状況においては、これらが逆になる可能性もある。第1仲間ノード(例えばノードC)は、第2仮想ノード30から、システムID及びLAGに関連付けられた第1設定情報を含む第1制御情報を受信する(ステップ402)。第1設定情報は、LAGに関連付けられた参照設定情報と比較される(ステップ404)。第1設定情報が参照設定情報と異なる(一致しない)場合(ステップ404に対する答えが「いいえ」)、ノード(ノードC)はその仲間ノード(例えばノードD)と通信しているか否かという判断がなされる(ステップ406)。通信していない場合には、LAG内にダブルスプリットブレイン状態が存在すると判断される(ステップ410)。仲間ノードC、Dが通信している場合には、第2仲間ノードが第2仮想ノードと通信していること(ステップ407)、及び、第1設定情報が、第2仮想ノードによって第2仲間ノードに提供された第2設定情報に一致しないこと(ステップ409)に応答して、シングルスプリットブレイン状態が存在すると判断される。ステップ408は、ノード障害(例えばノードA)の検知を表す。参照設定は、既に確立された、LAGに関連付けられた予想設定情報を表しうる。
スプリットブレイン状態が存在すると判断することは、第1仲間ノードは第2仲間ノードと通信していないと検知すること(ステップ406)に応答して、LAG内にデュアルスプリットブレイン状態が存在すると判断することを含みうる。この実施例では、第1と第2の仮想ノードを接続する非プライマリ接続リンク、又は非デフォルト接続リンクは、LAG内にデュアルスプリットブレイン状態が存在すると判断される場合、LAGから除外されることがある。
スプリットブレイン状態が存在すると判断することは、第2仲間ノードが第2仮想ノードと通信しており、第1設定情報が、第2仮想ノードによって第2仲間ノードに提供された第2設定情報に一致しないこと(ステップ407、409)に応答して、LAG内にシングルスプリットブレイン状態が存在すると判断することを含みうる。
方法300、400の両方において、設定情報は、設定キー又は設定ダイジェストのいずれかであることがあり、かつ、所望であれば、リンクアグリゲーション制御プロトコルデータユニット(LACPDU)メッセージ内で搬送されうる。
図20から図21は、システムIDに基づき、方法100を使用する、LAGにおけるダブルスプリットブレイン対処法のブロック図である。図20を参照するに、ノードAとノードBを接続するリンクは消失しており、ノードBは新たなシステムIDの使用を開始する。同様に、ノードCとDの間の接続も消失しており、ノードDは新たなシステムIDの使用を開始する。従って、ノードBとDは、それらの予想情報を受信しない(ステップ102、104)。また、ノードBとDの各々は、それぞれ、それらの仲間ノードA及びCに到達することができない(ステップ106)。従って、ダブルスプリットブレイン状態が検知され(ステップ110)、ダブルスプリットブレイン表示を有するLACPDUが、ノードBからノードDへと送信され、かつ、同様のLACPDUがノードDからノードBへと送信される(ステップ116)(図21の「DSB」通知を参照のこと)。
ノードAとCの観点から、これらのノードの各々は、それらのLAGピアから(すなわち互いから)、局所的に予想される基本システムIDである同一のシステムIDを受信する。従って、ノードAとCの間のピアリンクはLAGグループ内で保たれ、かつ、ピアリンクA−Cは、ネットワーク1とネットワーク2の間の接続性を継続的に提供する。しかし、ノードBとDによってLACPDU内で受信されるシステムIDは、局所的に予想される基本システムIDと一致せず、ノードBとCはそれらの仲間ポータルノードへの接続性を喪失している。従って、ノードBとDは、ダブルスプリットブレイン状況を明示し、かつ、それらの間のピアリンクB−DをLAGグループから除去する(上述のステップ112からステップ114を参照のこと)。更にノードBとDは、任意的に、互いにDSB通知を送信しうる(ステップ116)。LAGグループからのリンクB−Dの除去は局所的決定であり、どの他のノードとのいかなる合意も必要ないことに留意されたい。
図22は、LAGに加わっているノード間でフルメッシュトポロジーが使用される、別の実施例における、提案された方法100、200によるダブルスプリットブレイン対処法を示している。この実施例では、本書で提案されている方法によってLAGグループ内で保たれるのは、ノードAとCの間のリンクのみである。他の全てのリンクは、LAGグループからそれらを除去することによって無効化され、ゆえに、ループフリーな接続性が確実になる(ノードA、B、C、D間の点線を参照のこと)。
トポロジーがフルメッシュでない場合には、慎重な設定なくして提案された方法が適用されると、LAGによって既に提供されていた接続性が、ダブルスプリットブレインにより切断されうることに留意されたい。図23に示すダブルスプリットブレイン状況の例では、LACPDU内で受信されたシステムIDは、いずれのLAG仮想ノードにおいても局所的に予想される基本システムIDと一致せず、また、どちらのノードもその仲間ポータルノードに到達しえない。従って、両方のリンクがLAGグループから除去され、ネットワーク1とネットワーク2の間に接続性は提供されない。かかる接続性切断、及び従来技術のDSB状態に伴うループ(図5を参照のこと)を回避するために、ノードA、B並びにノードC、Dは、上述のように、障害発生の際にも変わらない共通システムIDを使用するよう構成されうる。
図26は、上述の方法を実装するよう動作する、例示的なLAGノード800を示している。LAGノード800は、上述の方法のうち一又は複数を実装するよう動作可能なプロセッサ802を含む。プロセッサ802は、持続性メモリ804、及び、(同一のLAG仮想ノード30又は32内で)その仲間LAGノードと、並びに、(他の遠隔LAG仮想ノード内の)そのピアLAGノードと通信するための少なくとも1つの入出力デバイス806に、動作可能に接続される。メモリ804は、例えば、上述の設定情報を保存するために使用されうる。プロセッサ802は、一又は複数の処理回路(例えば、マイクロプロセッサ、ハードウェア、ファームウェア、又はそれらの組み合わせ)によって実装されうる。メモリ804は、LAGノード上で稼働する時に、LAGノードを、上述の方法のうちの一又は複数を実行するよう構成する、スプリットブレイン対処法のためのプログラム命令を含むことがある。
例示的な利点
上記で提案された例示的なシングルスプリットブレイン対処方法のいくつかは、障害がある場合に、システムIDの変更を回避することができ、従って、ポータルの内部的な詳細をLAGピアから秘匿することによって、DRNI要件を満たしうる。
上記で提案された例示的なダブルスプリットブレイン対処方法のいくつかは、それらの方法でなければ少なくとも4つのノードが加わっているLAG内のDSB状態によって引き起こされることになる、フレームループを防ぐ。更に、提案された方法は、他の不具合状況の対処に影響を与えない。
前述の説明及び添付の図面は、本書で教示されている方法及び装置の非限定的な実施例を表している。そのため、本発明は前述の説明及び添付の図面によって限定されない。その代わりに、本発明は、以下の特許請求の範囲及び法的均等物によってのみ限定される。

Claims (11)

  1. 第1仮想ノードと第2仮想ノードを含むリンクアグリゲーショングループ(LAG)内の仮想ノードを動作させる方法であって、前記第1仮想ノードは、少なくとも、第1仲間ノードと第2仲間ノードを含み、前記方法は、
    前記第1仲間ノードが、
    前記第1仲間ノードは前記第2仲間ノードと通信しているか否かを判断すること、及び、
    前記判断に基づいて、
    前記判断により前記第1仲間ノードは前記第2仲間ノードと通信していると示される時には、制御情報がシステムID及び前記LAGに関連付けられた第1設定情報を含むように、
    前記第1仲間ノードがプライマリノードであり、かつ、前記判断により前記第1仲間ノードは前記第2仲間ノードと通信していないと示される時には、前記制御情報がシステムID及び前記LAGに関連付けられた前記第1設定情報を含むように、
    前記第1仲間ノードが非プライマリノードであり、かつ、前記判断により前記第1仲間ノードは前記第2仲間ノードと通信していないと示される時には、前記制御情報が前記システムID及び前記LAGに関連付けられた、前記第1設定情報とは異なる第2設定情報を含むように、
    前記第2仮想ノードに前記制御情報を送信することを含み
    前記第1設定情報及び前記第2設定情報は、設定キーとサービスダイジェストのうちの1つである、方法。
  2. 第1仮想ノードと第2仮想ノードを含むリンクアグリゲーショングループ(LAG)内の第1仲間ノードとしての使用のために構成されたネットワークノードであって、前記第1仮想ノードは、少なくとも、前記第1仲間ノードと第2仲間ノードを含み、前記第1仲間ノードは、
    前記第1仲間ノードが前記第2仲間ノードと通信しているか否かを判断し、かつ、
    前記判断に基づいて、
    前記判断により前記第1仲間ノードは前記第2仲間ノードと通信していると示される時には、制御情報がシステムID及び前記LAGに関連付けられた第1設定情報を含むように、
    前記第1仲間ノードがプライマリノードであり、かつ、前記判断により前記第1仲間ノードは前記第2仲間ノードと通信していないと示される時には、前記制御情報が前記システムID及び前記LAGに関連付けられた第1設定情報を含むように、
    前記第1仲間ノードが非プライマリノードであり、かつ、前記判断により前記第1仲間ノードは前記第2仲間ノードと通信していないと示される時には、前記制御情報が前記システムID及び前記LAGに関連付けられた、前記第1設定情報とは異なる第2設定情報を含むように、
    前記第2仮想ノードに前記制御情報を送信するよう構成され
    前記第1設定情報及び前記第2設定情報は、設定キーとサービスダイジェストのうちの1つである、ネットワークノード。
  3. 前記第1設定情報及び前記第2設定情報は、リンクアグリゲーション制御プロトコルデータユニット(LACPDU)メッセージ内で搬送される、請求項2に記載のネットワークノード。
  4. 第1仮想ノードと第2仮想ノードを含むリンクアグリゲーショングループ(LAG)内の仮想ノードを動作させる方法であって、前記第1仮想ノードは、少なくとも、第1仲間ノードと第2仲間ノードを含み、前記方法は、
    前記第1仲間ノードが、前記第2仮想ノードから、システムID及び前記LAGに関連付けられた第1設定情報を含む第1制御情報を受信すること、及び、
    前記第1設定情報を前記LAGに関連付けられた参照設定情報と比較することを含み、
    比較により、前記第1設定情報が前記参照設定情報に一致しないと示される場合、
    前記第1仲間ノードが前記第2仲間ノードと通信していないと検知することと、
    前記第2仲間ノードが前記第2仮想ノードと通信しており、かつ、前記第1設定情報が、前記第2仮想ノードによって前記第2仲間ノードに提供された第2設定情報に一致しないこと、
    のうちの少なくとも1つに応答して、前記LAG内にスプリットブレイン状態が存在すると判断することを含み、
    前記参照設定情報は、既に確立された、前記LAGに関連付けられた予想設定情報を表し、
    前記第1設定情報と前記参照設定情報の各々は、設定キーと設定ダイジェストのうちの1つである、方法。
  5. 前記スプリットブレイン状態が存在すると判断することは、前記第1仲間ノードは前記第2仲間ノードと通信していないと検知することに応答して、前記LAG内にデュアルスプリットブレイン状態が存在すると判断することを含む、請求項4に記載の方法。
  6. 更に、前記LAG内にデュアルスプリットブレイン状態が存在すると判断される場合に、前記第1と第2の仮想ノードを接続する非プライマリ接続リンク、又は非デフォルト接続リンクを前記LAGから除外することを含む、請求項5に記載の方法。
  7. 前記スプリットブレイン状態が存在すると判断することは、前記第2仲間ノードが前記第2仮想ノードと通信しており、かつ、前記第1設定情報が、前記第2仮想ノードによって前記第2仲間ノードに提供された第2設定情報に一致しないことに応答して、前記LAG内にシングルスプリットブレイン状態が存在すると判断することを含む、請求項4に記載の方法。
  8. 前記第1設定情報は、リンクアグリゲーション制御プロトコルデータユニット(LACPDU)メッセージ内で搬送される、請求項4から7のいずれか一項に記載の方法。
  9. 第1仮想ノードと第2仮想ノードを含むリンクアグリゲーショングループ(LAG)内の第1仲間ノードとしての使用のために構成されたネットワークノードであって、前記第1仮想ノードは、少なくとも、前記第1仲間ノードと第2仲間ノードを含み、前記第1仲間ノードは、
    前記第2仮想ノードから、システムID及び前記LAGに関連付けられた第1設定情報を含む第1制御情報を受信し、かつ、
    前記第1設定情報を前記LAGに関連付けられた参照設定情報と比較し、
    前記第1設定情報が前記参照設定情報に一致しない場合、
    前記第1仲間ノードが前記第2仲間ノードと通信していないという検知と、
    前記第2仲間ノードが前記第2仮想ノードと通信しており、かつ、前記第1設定情報が、前記第2仮想ノードによって前記第2仲間ノードに提供された第2設定情報に一致しないこと、
    のうちの少なくとも1つに応答して、前記LAG内にスプリットブレイン状態が存在すると判断するよう構成され、
    前記参照設定情報は、既に確立された、前記LAGに関連付けられた予想設定情報を表し、
    前記第1設定情報と前記参照設定情報の各々は、設定キーと設定ダイジェストのうちの1つである、ネットワークノード。
  10. 前記スプリットブレイン状態が存在するという判断は、前記第1仲間ノードが前記第2仲間ノードと通信していないという検知に応答して、前記LAG内にデュアルスプリットブレイン状態が存在すると判断することを含む、請求項9に記載のネットワークノード。
  11. 前記スプリットブレイン状態が存在するという判断は、前記第2仲間ノードが前記第2仮想ノードと通信しており、かつ、前記第1設定情報が、前記第2仮想ノードによって前記第2仲間ノードに提供された第2設定情報に一致しないことに応答して、前記LAG内にシングルスプリットブレイン状態が存在すると判断することを含む、請求項9に記載のネットワークノード。
JP2015512140A 2012-05-15 2012-08-29 リンクアグリゲーショングループにおけるスプリットブレイン問題を検知し、それに対処するための方法及び装置 Expired - Fee Related JP6046241B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261647211P 2012-05-15 2012-05-15
US61/647,211 2012-05-15
PCT/IB2012/054444 WO2013171552A1 (en) 2012-05-15 2012-08-29 Methods and apparatus for detecting and handling split brain issues in a link aggregation group

Publications (2)

Publication Number Publication Date
JP2015520577A JP2015520577A (ja) 2015-07-16
JP6046241B2 true JP6046241B2 (ja) 2016-12-14

Family

ID=47137985

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015512140A Expired - Fee Related JP6046241B2 (ja) 2012-05-15 2012-08-29 リンクアグリゲーショングループにおけるスプリットブレイン問題を検知し、それに対処するための方法及び装置

Country Status (6)

Country Link
US (3) US9602348B2 (ja)
EP (1) EP2850787B1 (ja)
JP (1) JP6046241B2 (ja)
KR (1) KR102043071B1 (ja)
IN (1) IN2014DN08942A (ja)
WO (1) WO2013171552A1 (ja)

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103780407B (zh) * 2012-10-18 2018-07-06 中兴通讯股份有限公司 分布式弹性网络互连(drni)中网关动态切换方法和装置
CN103780419B (zh) * 2012-10-24 2018-12-21 中兴通讯股份有限公司 一种分布式链路聚合组业务切换方法和装置
US10616049B2 (en) * 2013-01-25 2020-04-07 Dell Products, L.P. System and method for determining the configuration of switches in virtual link trunking environments
US9553798B2 (en) 2013-04-23 2017-01-24 Telefonaktiebolaget L M Ericsson (Publ) Method and system of updating conversation allocation in link aggregation
US9497132B2 (en) 2013-04-23 2016-11-15 Telefonaktiebolaget Lm Ericsson (Publ) Method and system of implementing conversation-sensitive collection for a link aggregation group
US9654337B2 (en) * 2013-04-23 2017-05-16 Telefonaktiebolaget L M Ericsson (Publ) Method and system for supporting distributed relay control protocol (DRCP) operations upon communication failure
CN104125088B (zh) * 2013-04-28 2019-05-10 中兴通讯股份有限公司 Drni中同一端内系统之间交互信息的方法和系统
US10749711B2 (en) 2013-07-10 2020-08-18 Nicira, Inc. Network-link method useful for a last-mile connectivity in an edge-gateway multipath system
US10454714B2 (en) 2013-07-10 2019-10-22 Nicira, Inc. Method and system of overlay flow control
US9654418B2 (en) 2013-11-05 2017-05-16 Telefonaktiebolaget L M Ericsson (Publ) Method and system of supporting operator commands in link aggregation group
US9813290B2 (en) 2014-08-29 2017-11-07 Telefonaktiebolaget Lm Ericsson (Publ) Method and system for supporting distributed relay control protocol (DRCP) operations upon misconfiguration
US10135789B2 (en) 2015-04-13 2018-11-20 Nicira, Inc. Method and system of establishing a virtual private network in a cloud service for branch networking
US10425382B2 (en) 2015-04-13 2019-09-24 Nicira, Inc. Method and system of a cloud-based multipath routing protocol
US10498652B2 (en) 2015-04-13 2019-12-03 Nicira, Inc. Method and system of application-aware routing with crowdsourcing
US10257019B2 (en) * 2015-12-04 2019-04-09 Arista Networks, Inc. Link aggregation split-brain detection and recovery
US9942133B2 (en) * 2016-03-25 2018-04-10 Netscout Systems Texas, Llc Fully connected network
US11121962B2 (en) 2017-01-31 2021-09-14 Vmware, Inc. High performance software-defined core network
US10992568B2 (en) 2017-01-31 2021-04-27 Vmware, Inc. High performance software-defined core network
US20180219765A1 (en) 2017-01-31 2018-08-02 Waltz Networks Method and Apparatus for Network Traffic Control Optimization
US11706127B2 (en) 2017-01-31 2023-07-18 Vmware, Inc. High performance software-defined core network
US11252079B2 (en) 2017-01-31 2022-02-15 Vmware, Inc. High performance software-defined core network
US10992558B1 (en) 2017-11-06 2021-04-27 Vmware, Inc. Method and apparatus for distributed data network traffic optimization
US20200036624A1 (en) 2017-01-31 2020-01-30 The Mode Group High performance software-defined core network
US10778528B2 (en) 2017-02-11 2020-09-15 Nicira, Inc. Method and system of connecting to a multipath hub in a cluster
CN108259348B (zh) * 2017-05-24 2020-05-12 新华三技术有限公司 一种报文传输方法和装置
US10523539B2 (en) 2017-06-22 2019-12-31 Nicira, Inc. Method and system of resiliency in cloud-delivered SD-WAN
US11005684B2 (en) 2017-10-02 2021-05-11 Vmware, Inc. Creating virtual networks spanning multiple public clouds
US11089111B2 (en) 2017-10-02 2021-08-10 Vmware, Inc. Layer four optimization for a virtual network defined over public cloud
US10959098B2 (en) 2017-10-02 2021-03-23 Vmware, Inc. Dynamically specifying multiple public cloud edge nodes to connect to an external multi-computer node
US11115480B2 (en) 2017-10-02 2021-09-07 Vmware, Inc. Layer four optimization for a virtual network defined over public cloud
US10999165B2 (en) 2017-10-02 2021-05-04 Vmware, Inc. Three tiers of SaaS providers for deploying compute and network infrastructure in the public cloud
US10999100B2 (en) 2017-10-02 2021-05-04 Vmware, Inc. Identifying multiple nodes in a virtual network defined over a set of public clouds to connect to an external SAAS provider
US11223514B2 (en) * 2017-11-09 2022-01-11 Nicira, Inc. Method and system of a dynamic high-availability mode based on current wide area network connectivity
US10701000B1 (en) 2017-11-30 2020-06-30 Open Invention Network Llc VNFM assisted fault handling in virtual network function components
CN111771190B (zh) * 2018-04-12 2024-04-09 华为云计算技术有限公司 探测虚拟机状态的方法和设备
CN109039888A (zh) * 2018-08-10 2018-12-18 新华三技术有限公司合肥分公司 报文环路消除方法及分布式弹性dr设备
US10938732B2 (en) * 2019-04-12 2021-03-02 Dell Products L.P. Systems and methods for traffic redirection on disruptive configurations in link aggregation groups
US11310170B2 (en) 2019-08-27 2022-04-19 Vmware, Inc. Configuring edge nodes outside of public clouds to use routes defined through the public clouds
US11044190B2 (en) 2019-10-28 2021-06-22 Vmware, Inc. Managing forwarding elements at edge nodes connected to a virtual network
US11489783B2 (en) 2019-12-12 2022-11-01 Vmware, Inc. Performing deep packet inspection in a software defined wide area network
US11394640B2 (en) 2019-12-12 2022-07-19 Vmware, Inc. Collecting and analyzing data regarding flows associated with DPI parameters
US11606712B2 (en) 2020-01-24 2023-03-14 Vmware, Inc. Dynamically assigning service classes for a QOS aware network link
US11544228B2 (en) * 2020-05-07 2023-01-03 Hewlett Packard Enterprise Development Lp Assignment of quora values to nodes based on importance of the nodes
US11245641B2 (en) 2020-07-02 2022-02-08 Vmware, Inc. Methods and apparatus for application aware hub clustering techniques for a hyper scale SD-WAN
US11323392B1 (en) * 2020-07-17 2022-05-03 Juniper Networks, Inc. Managing split-brain scenario in multi-homed environment
US11709710B2 (en) 2020-07-30 2023-07-25 Vmware, Inc. Memory allocator for I/O operations
US11575591B2 (en) 2020-11-17 2023-02-07 Vmware, Inc. Autonomous distributed forwarding plane traceability based anomaly detection in application traffic for hyper-scale SD-WAN
US11575600B2 (en) 2020-11-24 2023-02-07 Vmware, Inc. Tunnel-less SD-WAN
US11929903B2 (en) 2020-12-29 2024-03-12 VMware LLC Emulating packet flows to assess network links for SD-WAN
US11792127B2 (en) 2021-01-18 2023-10-17 Vmware, Inc. Network-aware load balancing
US11979325B2 (en) 2021-01-28 2024-05-07 VMware LLC Dynamic SD-WAN hub cluster scaling with machine learning
US11509571B1 (en) 2021-05-03 2022-11-22 Vmware, Inc. Cost-based routing mesh for facilitating routing through an SD-WAN
US12009987B2 (en) 2021-05-03 2024-06-11 VMware LLC Methods to support dynamic transit paths through hub clustering across branches in SD-WAN
US11729065B2 (en) 2021-05-06 2023-08-15 Vmware, Inc. Methods for application defined virtual network service among multiple transport in SD-WAN
US12015536B2 (en) 2021-06-18 2024-06-18 VMware LLC Method and apparatus for deploying tenant deployable elements across public clouds based on harvested performance metrics of types of resource elements in the public clouds
US11489720B1 (en) 2021-06-18 2022-11-01 Vmware, Inc. Method and apparatus to evaluate resource elements and public clouds for deploying tenant deployable elements based on harvested performance metrics
US11375005B1 (en) 2021-07-24 2022-06-28 Vmware, Inc. High availability solutions for a secure access service edge application
US11943146B2 (en) 2021-10-01 2024-03-26 VMware LLC Traffic prioritization in SD-WAN
US11909815B2 (en) 2022-06-06 2024-02-20 VMware LLC Routing based on geolocation costs

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2371706B (en) * 2001-01-30 2003-04-23 3Com Corp Link aggregation control for network devices
US20020137498A1 (en) 2001-03-23 2002-09-26 Goss Stephen C. Method for automatic call forwarding when a mobile unit goes out of service
KR100889753B1 (ko) * 2006-12-01 2009-03-24 한국전자통신연구원 링크 애그리게이션 그룹에서의 보호 절체 방법 및 그 장치
CN100512194C (zh) 2006-12-25 2009-07-08 华为技术有限公司 链路聚合方法、装置、mac帧收发方法和系统
US7881230B2 (en) 2007-10-29 2011-02-01 Alcatel Lucent Facilitating self configuring link aggregation using link aggregation control protocol
JP5014190B2 (ja) 2008-02-12 2012-08-29 株式会社エヌ・ティ・ティ・ドコモ 通知システム、通知方法、メッセージサーバ、及び通信端末
WO2010069382A1 (en) 2008-12-18 2010-06-24 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for transferring data packets between a first network and a second network
US8369332B2 (en) * 2009-08-21 2013-02-05 Alcatel Lucent Server-side load balancing using parent-child link aggregation groups
US8817594B2 (en) * 2010-07-13 2014-08-26 Telefonaktiebolaget L M Ericsson (Publ) Technique establishing a forwarding path in a network system
US8913489B2 (en) * 2010-08-04 2014-12-16 Alcatel Lucent System and method for virtual fabric link failure recovery
US8650285B1 (en) * 2011-03-22 2014-02-11 Cisco Technology, Inc. Prevention of looping and duplicate frame delivery in a network environment
CN102752187B (zh) 2011-04-21 2018-02-13 中兴通讯股份有限公司 弹性网络接口的实现方法和系统
EP2820805B1 (en) 2012-03-02 2015-12-09 Telefonaktiebolaget LM Ericsson (Publ) Technique for ensuring congruency in link aggregation
WO2013127414A1 (en) * 2012-03-02 2013-09-06 Telefonaktiebolaget L M Ericsson (Publ) Technique for bundling in link aggregation

Also Published As

Publication number Publication date
US10567224B2 (en) 2020-02-18
IN2014DN08942A (ja) 2015-05-22
KR20150016327A (ko) 2015-02-11
US9602348B2 (en) 2017-03-21
JP2015520577A (ja) 2015-07-16
US9906411B2 (en) 2018-02-27
EP2850787B1 (en) 2019-02-13
KR102043071B1 (ko) 2019-11-11
US20150172121A1 (en) 2015-06-18
US20180159734A1 (en) 2018-06-07
WO2013171552A1 (en) 2013-11-21
EP2850787A1 (en) 2015-03-25
US20170195177A1 (en) 2017-07-06

Similar Documents

Publication Publication Date Title
JP6046241B2 (ja) リンクアグリゲーショングループにおけるスプリットブレイン問題を検知し、それに対処するための方法及び装置
EP1982447B1 (en) System and method for detecting and recovering from virtual switch link failures
JP5508289B2 (ja) 多重リンク障害からのネットワーク回復システム及び方法
WO2015032027A1 (zh) 一种业务路径的保护方法、控制器、设备及系统
JP6287518B2 (ja) オープンフロースイッチおよびオープンフローネットワークの障害復旧方法
US20140369230A1 (en) Virtual Chassis Topology Management
WO2012058895A1 (zh) 聚合链路切换方法及装置
CN112491700A (zh) 网络路径调整方法、系统、装置、电子设备及存储介质
US20070162612A1 (en) Method and system for the automatic reroute of data over a local area network
WO2016091094A1 (zh) 一种光传送网的保护倒换方法及装置
US20150098317A1 (en) Linear protection switching method and apparatus for protecting network segmented into multi-domain
WO2015067048A1 (zh) Vpls跨域冗余保护方法及系统
WO2015042840A1 (zh) 一种故障恢复的方法、节点和路径计算单元
JP2011223172A (ja) リング型ネットワークシステム、通信装置および障害検出方法
JP6790667B2 (ja) クラスタシステム、サーバ、動作方法、及びプログラム
JP6042549B2 (ja) コンピュータネットワークを稼働する方法
KR20140009488A (ko) 이더넷 노드의 검출 프레임 타임아웃 지속시간을 설정하는 방법 및 시스템
US10122588B2 (en) Ring network uplink designation
CN115250226B (zh) Mlag双主故障恢复方法、装置、系统、介质及设备
Ogawa et al. High Availability within a Forwarding and Control Element Separation (ForCES) Network Element
JP2011004435A (ja) 伝送路システム、フレーム伝送装置、伝送路システムにおける伝送路切り替え方法およびプログラム
CN117499205A (zh) 一种存储系统端口绑定容灾的方法、装置、设备及介质
JP2005318020A (ja) 接続状態検知システムおよび接続状態検知装置
JP2001148714A (ja) 通信ネットワーク装置および簡易ルーティング方法
JP2012044614A (ja) 中継装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150728

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160427

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161018

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161116

R150 Certificate of patent or registration of utility model

Ref document number: 6046241

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees