JP4860677B2 - 複数のmacを複数のプロセッサへ割り当てるための方法及びシステム - Google Patents

複数のmacを複数のプロセッサへ割り当てるための方法及びシステム Download PDF

Info

Publication number
JP4860677B2
JP4860677B2 JP2008232556A JP2008232556A JP4860677B2 JP 4860677 B2 JP4860677 B2 JP 4860677B2 JP 2008232556 A JP2008232556 A JP 2008232556A JP 2008232556 A JP2008232556 A JP 2008232556A JP 4860677 B2 JP4860677 B2 JP 4860677B2
Authority
JP
Japan
Prior art keywords
mac
processor
replacement
controller
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008232556A
Other languages
English (en)
Other versions
JP2009071820A (ja
Inventor
ロゼンバーグ コビー
ハラヴィー アヴィシャイ
Original Assignee
ポリコム・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ポリコム・インコーポレイテッド filed Critical ポリコム・インコーポレイテッド
Publication of JP2009071820A publication Critical patent/JP2009071820A/ja
Application granted granted Critical
Publication of JP4860677B2 publication Critical patent/JP4860677B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2005Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication controllers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/35Switches specially adapted for specific applications
    • H04L49/355Application aware switches, e.g. for HTTP
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2025Failover techniques using centralised failover control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/30Peripheral units, e.g. input or output ports
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/35Switches specially adapted for specific applications
    • H04L49/351Switches specially adapted for specific applications for local area network [LAN], e.g. Ethernet switches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Hardware Redundancy (AREA)

Description

本発明は、通信システムの分野に関し、より具体的には、複数のLANからの複数のクライアントと、ひと揃いの処理ノード(ユニット)を有するネットワーク装置との間の接続性の不具合検出及び回復方法の品質改善に関する。
1又はそれ以上のイーサネット(登録商標)ローカルエリアネットワーク(LAN)へ接続された複数の処理ユニットに基づくネットワーク装置のシステムでは、安全性のニーズを達成すべく異なるLANの間で良好な分離を保ちながら、99.999%よりも多くの時間、RAS(Reliability「信頼性」、Availability「可用性」、Serviceability「保守性」)接続を提供することが課題となっている。ネットワーク装置は、複数のユーザと通信し且つサービスを提供するネットワーク内のノードでありうる。ネットワーク装置の例として、マルチポイント制御ユニット(MCU)、ファイアウォール、コンテンツサーバ、メディアサーバなどがある。
一般的なネットワーク装置では、1又はそれ以上のメディアアクセスコントロール(MAC;Media Access Controls)アドレスは、システムが起動して動作している限りは、1つの処理ユニットに関連付けられている。MACアドレスは、イーサネット(登録商標)ハードウェアアドレス(EHA)又はハードウェアアドレスとも呼ばれうる。MACアドレスは、ほとんどのネットワークアダプタ(すなわち、ネットワークインターフェースカード(NIC)。)へアダプタ名として付与される識別子である。このような一般的なアーキテクチャでは、処理ノードが動作しなくなったり又は交換されたりする必要がある場合に、他のMACへ切り替えることなく待機中の処理ユニットへプロセッサの機能性を支援する方法はない。余分のMAC/プロセッサ対を用いることで、費用対利用比は高くなる。さらに、一対の待機中のMAC/プロセッサは、LANごとに必要とされうる。MAC又は物理的経路(PHY若しくはケーブル)のどこかで起こる不具合は、たとえプロセッサが永久的な不具合状態にあるわけではなく、別な方法で他のLANからユーザにサービスを提供することができるとしても、プロセッサを切り離す。
このように、マルチプロセッサ装置の現在の技術は、外部のイーサネット(登録商標)LANとの信頼性のある接続性を著しく困難なものとすることは明らかである。
上記の課題は、オープンシステムの相互接続モジュール/スタックのデータリンク層によって指示されるタスクに関与する複数のMACが複数の処理ノード(ユニット)とは区別されるところの接続形態(topology)を用いて達成される。処理ノードは、OSIのレイヤ3及びそれより上の信頼性(responsibility)に関連するタスクを扱うことに関与する。前記の一群のMACコントローラは、複数の処理ノードに対して接続性リソースプールとして機能する。一方、複数の処理ノードは、処理リソースプールとして機能し、且つ、MACコントローラとは区別される。このような接続形態では、2つのリソースプールは、必要とされるRASを実現するよう、オンザフライで相互に接続され得る。
開示される方法及びシステムは、ユーザ・イーサネット(登録商標)・ローカルエリアネットワークへ接続される必要がある複数の処理ノード(プロセッサ)に基づくネットワーク装置の信頼性、可用性及び保守性を改善する。
図中、同じ参照番号は同じ要素を表す。便宜上、同じグループの幾つかの要素にしか参照番号が付されないことがある。図面の目的は、例となる実施形態を記載することであり、製造のためではない。従って、図示される特徴は、便宜上、提示を明確にするために選択される。
図1は、複数の処理ノード/ユニット100a〜100eと、相互接続スイッチアレイ101へ接続されたひと揃いのMACコントローラ102a〜102eとに基づく例となるネットワーク装置システムの要素を図式的に表す。処理ノードの数及びMACコントローラの数は、図1に示されているものに限定されない。例えば、システムは、2つのプロセッサノード及び5つのMACコントローラを有することができる。様々な他の組み合わせも配置され得る。各MACコントローラ102a〜102eは、OSIモジュール/スタックのデータリンク層によって特定されるタスクに関与する。例えば、各MACコントローラ(102)は、例えば、これらに限定されないが、802.3CSMA/CD、802.1P及び802.1Qのようなデータリンク層によって用いられる通信プロトコルに従うことができる。
図1を参照すると、MACコントローラ102a〜102eは、1又はそれ以上のバンク(bank)に分けられる。各バンクは、例えば、複数のユーザのローカルエリアネットワーク(LAN)のようなブロードキャスティング・ドメインと関連付けられ得る。各ブロードキャスティング・ドメインは、ひと揃いのN個のMACアドレス及びひと揃いのN+1個のMACコントローラと関連付けられ得る。MACコントローラは、物理的にブロードキャスティング・ドメインへ接続され得る。このドメインからのMACアドレスの夫々は、同じドメインに属する対応するMACコントローラへ割り当てられ得る。Nは、同じブロードキャスティング・ドメインへ接続された作動中のMACコントローラの数であり、‘+1’のMACコントローラは、作動していない余分のMACコントローラ(すなわち、待機中のMACコントローラ。)である。MACコントローラのMACアドレスは、必要が生じれば、待機中の余分のMACコントローラへ再利用又は再割り当てをされ得る。ブロードキャスティング・ドメインは、コンピュータネットワークのセグメントであり、その全てのノードは、データリンク層でブロードキャストによって互いに到達することができる。ルータ及び他のより上位層の装置は、ブロードキャスティング・ドメイン間の境界を形成する。ブロードキャスティング・ドメインで使用され得る例となるブロードキャスティング・メッセージは、第1のコンピュータが第2のコンピュータのネットワークアドレス(例えば、IPアドレス。)しか有さない場合である。第1のコンピュータは、アドレス絞り込みプロトコル(ARP;Address Resolution Protocol)を使用することができ、第2のコンピュータのIPアドレスとともにARPリクエストを送信する。第2のコンピュータは、同じブロードキャスティング・ドメインへ接続されている場合は、そのMACアドレスに応答することができる。
通常、MACアドレスは、IEEE機関によって、ネットワーク装置及びネットワークインターフェースカード(NIC)のベンダーへ割り当てられている。その場合に、各ベンダーは、NICごとにMACアドレスを割り当てることができる。MACアドレスを割り当てるプロセスについて更に知りたいならば、IEEEのサイトhttp://standards.ieee.org/regauth/index.htmlを参照されたし。
開示されている実施例では、N個のMACアドレスのグループは、ネットワーク装置、例えばMCUへ割り当てられる。このグループは、ハウスキーピング・コンピュータ103又は104によって管理され得る。このグループからのMACアドレスは、作動中である(ブロードキャスティング・ドメインへ接続されている)イーサネット(登録商標)MACコントローラ102のいずれか1つへ割り当てられ得る。待機中のイーサネット(登録商標)MACコントローラ102は、MACアドレスを割り当てられない。通常、MACコントローラ102の数は、余分を含むために、Nよりも大きく、例えばN+1である。
ブロードキャスティング・ドメインへの新たな接続が確立される場合に、プロセッサ100及びイーサネット(登録商標)MACコントローラ102は、選択されて、相互接続スイッチアレイ101を介して相互に関連付けられる。MACアドレスのグループからのMACアドレスは、作動中のハウスキーピング・プロセッサ103によって、選択されたプロセッサ100へ、そのMACアドレスを関連するイーサネット(登録商標)MACコントローラ102にロードする命令とともに伝送される。続いて、ブロードキャスティング・ドメインへの接続が確立される。
MACコントローラは、通常は、OSIモジュール/スタックに従って物理媒体を介して非構造ビットストリームの伝送に関与する物理エンティティ(例えば、10/100/1000ベース−T PHY(図示せず。)。)へ接続されている。OSI物理層タスクは、例えば、10ベース−T、100ベース−T、1000ベース−T、1000ベース−LX、又は1000ベース−SXに従っても良い。
各処理ノード100a〜100eは、OSIのレイヤ3以上に関連するタスクを扱うことに関与する。例えば、各処理ノード100a〜100eは、IP(Internet Protocol)、DHCP(Dynamic Host Configuration Protocol)、IPSEC(IP Security)及びICMP(Internet Control Message Protocol)を扱うことができる。OSIトランスポート層タスクは、例えば、TCP(Transport Control Protocol)、UDP(User Datagram Protocol)及びRTP(Real-time Transport Protocol)を含みうる。OSIモジュールの上位層に関連する他のタスクは、例えばG.711のような音声信号、例えばH.261のような映像信号、例えばSSH(Secure Shell)のようなセキュリティ関連タスク、例えばSNMP(Simple Network Management Protocol)のようなインターネット管理、例えばNTP(Network Time Protocol)のようなネットワークタイミング、及び例えばHTTP(Hyper Text Transport Protocol)又はFTP(File Transfer Protocol)のような他のアプリケーションを扱うことを含みうる。
相互接続スイッチアレイ101は、例えば、それらに限られないが、PCIエクスプレス、ラピッドIO、又はフィールド・プログラマブル・ゲート・アレイによって実施されるクロスバー配列のような様々な規格に従うことができる。例となるスイッチは、アメリカ合衆国カリフォルニア州にあるVitsse Semiconductor Corporationによって製造されたVSC3312であっても良い。スイッチアレイについて更に知りたいならば、Vitsseのサイトwww.vitsse.comを参照されたし。処理ノード100a〜100eは、作動中のハウスキーピング・プロセッサ(処理ノード)103と内部ネットワーク105を介して通信することができる。ネットワーク105は、回路交換ネットワーク、パケット交換ネットワーク、キャリア検知媒体アクセスメモリ、又は、1若しくはそれ以上の処理ノードが相互に通信することを可能にする何らかの技術でありうる。ある実施例では、プロセッサ104及びネットワーク106を備える更なるハウスキーピング・セットが余分及び信頼性のために加えられ得る。ネットワーク105及び106は、イーサネット(登録商標)MACコントローラ102の他方の側へ接続された外部のLAN(図示せず。)とは別である。ある実施例では、ハウスキーピング・タスクは、処理ノード100の1つによって、それの他のタスクに加えて実行され得る。
初期化の間、ハウスキーピング処理ユニット103は、あるLANと関連付けられたひと揃いのアドレスからのMACアドレスを、同じLANと関連付けられたひと揃いのコントローラに属するMACコントローラ(102a〜102e)へ割り当てることができる。初期化後、相互接続スイッチアレイ(101)によるプロセッサ(100a〜100e)に対するMACコントローラ(102a〜102e)の結合及び再結合は、例えば、図2に表されるような処理として実行される。この処理の中で、余分のMACコントローラ又は処理ノードへの円滑且つ迅速なフェイルオーバー(failover)が可能である。MACコントローラ(102a〜102e)をプロセッサ(100a〜100e)と結合した後、MACアドレスがプロセッサへ割り当てられる。プロセッサ(100a〜100e)は、割り当てられたMACアドレスを、その新たに結合されたMACコントローラへ、相互接続スイッチアレイ(101)を介してそのプロセッサによって確立された接続を介して伝送する。
図2は、不具合検出の前、間及び後の処理ノードのMACコントローラへの割り当て処理を表す。この処理は、例えば、ネットワーク105を介して、作動中のハウスキーピング処理ユニット103によって実施され得る。
不具合検出は、システム内の異常動作が検出されるところの処理である。フローチャートは、クライアント及び処理ノードとブロードキャスティング・ドメインとの間の接続の確立中に始まる。ステップ200で、MACコントローラ102a〜102eの1つが利用可能であるかどうかが判断される。利用可能なMACコントローラは、ブロードキャスティング・ドメインへその物理層を介して物理的に接続されるものである。利用可能なMACコントローラがない場合は、処理は終了する。利用可能なMACコントローラがある場合は、処理ノードは、相互接続スイッチアレイ101(図1)を介して利用可能なMACコントローラへ動的に割り当てられ、結合される(ステップ201)。MAC/プロセッサ対の動的割り当てが完了すると、MACアドレスのグループからの空いているMACアドレスが、そのMAC/プロセッサ対へ割り当てられる。本発明の例では、MACアドレスは、割り当てられたプロセッサへ作動中のハウスキーピング・プロセッサによって配分される。すなわち、プロセッサは、MACアドレスを、その関連するMACコントローラ102へロードする。
次いで、不具合検出段階の処理が始まる。図2に提示される例となる不具合検出処理は、ICMPパケット(エコーパケット)を使用して、定期的にユーザネットワークを監視する。エコーパケットのあて先は、MACコントローラが接続されたLANのデフォルトのゲートウェイIPアドレスであっても良い。ハウスキーピング・プロセッサ103は、エコーパケットを送信して、エコー応答が受信された場合は応答を返すよう処理ユニット100に要求することができる。ハウスキーピング・プロセッサは、このような要求及び応答の処理を通して、ユーザLANへの処理ユニットの接続の有効性を監視して、何かが接続成形路に沿って起こった場合に不具合を検出する。
不具合検出処理は、デフォルトのゲートウェイIPアドレスへのエコー送信(ステップ202)及びゲートウェイとの接続が動作していることを示すエコー応答を受信したかどうかの判断(ステップ203)から始まる。デフォルトのゲートウェイは、割り当てられたMACコントローラが接続されたブロードキャスティング・ドメインのデフォルトのゲートウェイである。T1秒後(ステップ204)、不具合検出処理は、新しいエコーパケットを発信することによって再開する(ステップ202)。(ステップ203で)エコー応答が受信されなかった場合は、不具合が検出されたことを示しており、回復段階が開始される(ステップ205乃至209)。T1は、設定可能なパラメータでありうる。それは数ミリ秒から数秒の範囲にあって、ブロードキャスティング・ドメイン及びMACコントローラ102(図1)とブロードキャスティング・ドメインとの間の接続に依存する。
回復段階の第1の段階は、相互接続スイッチアレイ101(図1)を介して、余分の処理ノードを割り当てることである(ステップ205)。第2の段階は、新しいエコーパケットを発信することである(ステップ206)。第3の段階は、エコーパケットが受信されたかどうかを判断することである(ステップ207)。エコー応答が受信された場合は、不具合検出処理は、新しいエコーパケットを発信することによって再開する(ステップ202)。ステップ207でのエコーパケットの受信は、不具合がその時点では検出されていないことを示す。エコー応答が受信されなかった場合は、それは、不具合が検出されたことを示す。続いて、不具合の疑いがあるMACコントローラと同じブロードキャスティング・ドメインへ接続された待機中の余分のMACコントローラがあるかどうかが判断される(ステップ208)。望ましくは、余分のMACコントローラは、余分の経路への円滑な移行を可能とするよう、最初に、不具合の疑いがあるMACコントローラのMACアドレスへ割り当てられる。本発明の代替の実施例では、結合−再結合の順序は、MACコントローラ、次いでプロセッサを交換することから始まっても良い。
処理は、現在のMACコントローラを無効にし、次いで、余分のMACコントローラのみを有効にすることによって開始されても良く(図示せず。)、余分のMACコントローラが実際に同じブロードキャスティング・ドメインへ接続されている場合にMACアドレスの重複を回避することができる。同じMACアドレスを使用することは、新しい接続性形路が提供される場合に生ずる好ましくない影響を最小限とすることができる。余分のMACコントローラが、(同時にではなく)不具合があるMACコントローラと同じMACアドレスを使用する場合に、ユーザのネットワークが交換を認識することはない。接続に含まれるレイヤ2は、IEEE802.1Dトランスペアレント・ブリッジ法に基づき、余分のMACへ接続され得、自動的に、来るエコーパケットを受信することによって新しい経路を知る。余分のMACコントローラが利用可能である場合は、MACコントローラはプロセッサへ割り当てられ(ステップ209)、不具合検出の処理は続く(ステップ202)。
開示される方法及びシステムは、ユーザ・イーサネット(登録商標)・ローカルエリアネットワークへ接続される必要がある複数の処理ノード(プロセッサ)に基づくネットワーク装置の信頼性、可用性及び保守性を改善する。開示される方法及びシステムは、プロセッサシステムが直面しうる不具合のいずれか1つの点のフェイルオーバーを支援する接続形態を提供することによって、プロセッサシステムの予定外の不稼働時間を減らす。また、開示される方法及びシステムは、例えば、性能向上を可能にするよう、プロセッサシステムの予定外の不稼働時間を減らす。さらに、本開示は、MAC/プロセッサ対の間の分離を可能にすることによって、ネットワーク分離、すなわち、ファイアウォール・ゲートウェイのための方法及び装置を提供する。
余分のプロセッサによってプロセッサを置換する処理205は、不具合があるプロセッサによって実行された動作を処理するために必要とされる情報及びソフトウェアを余分のプロセッサにロードすることを含んでも良い。この処理は、必要とされる情報を記録することができる作動中のハウスキーピング・プロセッサ103によって実行される。
本願の明細書及び特許請求の範囲で、動詞“有する(comprise、include、have)”及びその活用形の夫々は、動詞の目的が、必ずしも、動詞の主語の部材、部品、要素又は部分の全てを挙げることではないことを示すために使用される。
本願で、語“ユニット(unit)”及び“モジュール(module)”は同義的に使用される。ユニット又はモジュールとして示されるどんなものでも、スタンドアローン型のユニット又は特定用途のモジュールであっても良い。ユニット又はモジュールは、モジュラーであっても、あるいは、容易に削除又は他の同様のユニット若しくはモジュールと交換されることを可能にするモジュラー様式を有しても良い。夫々のユニット又はモジュールは、ソフトウェア、ハードウェア及び/又はファームウェアのいずれか1つ、あるいは、それらのいずれかの組み合わせであっても良い。論理モジュールのソフトウェアは、例えば、読み出し/書き込み用ハードディスク、CD−ROM、フラッシュメモリ、ROM等のような、コンピュータ読出可能な媒体において具現され得る。あるタスクを実行するために、ソフトウェアプログラムは、必要に応じて適切なプロセッサへロードされ得る。
本発明は、その実施例の詳細な記載を用いて記載されてきた。実施例は、一例として提供され、本発明の適用範囲を限定するよう意図されない。記載される実施例は、異なる特徴を有する。これらの特徴の全てが、本発明の全ての実施例で必要とされるわけではない。本発明のある実施例は、特徴の幾つか又は特徴の可能な組み合わせしか利用しない。記載される本発明の実施例及び記載される実施例に挙げられている特徴の様々な組み合わせを有する本発明の実施例の変形は、いわゆる当業者によって行われ得る。
本願は、2007年9月11に出願した米国仮出願整理番号60/971,415に基づく優先権を主張するものであり、同米国出願の全内容を本願に参照により援用する。
複数の処理ユニット(ノード)と、相互接続スイッチアレイによって接続されるひと揃いのMACコントローラとに基づく例となるネットワーク装置システムを表すブロック図である。 不具合検出前、不具合検出中、及び不具合検出後の3つの相における処理ノードのMACコントローラへの割り当て処理を表すフローチャートである。
符号の説明
100a〜100e プロセッサ
101 相互接続アレイ
102a〜102e MACコントローラ
103 作動中のハウスキーピング・プロセッサ
104 待機中のハウスキーピング・プロセッサ
105、106 ネットワーク
202〜204 不具合検出処理
205〜209 回復段階

Claims (19)

  1. 不具合から回復可能である耐障害性システムであって、
    複数の処理ユニットと、
    複数のMACコントローラと、
    1又はそれ以上の対を生成するよう前記複数の処理ユニットの夫々を前記複数のMACコントローラの対応する1つと関連付けるよう構成され、各対が当該対に専用である1つの処理ユニット及び1つのMACコントローラを有するようにする相互接続スイッチと、
    前記複数の処理ユニットの夫々へ伝達可能に結合されるハウスキーピング・プロセッサとを有し、
    前記ハウスキーピング・プロセッサは、前記1又はそれ以上の対の夫々へMACアドレスを動的に割り当てるようプログラムされる、システム。
  2. 前記複数のMACコントローラはブロードキャスティング・ドメインに属する、請求項1記載のシステム。
  3. 前記ハウスキーピング・プロセッサは、ローカルエリアネットワークを介して前記複数の処理ユニットへ伝達可能に結合される、請求項1記載のシステム。
  4. 前記ハウスキーピング・プロセッサは、前記1又はそれ以上の対のいずれか1つの対へ、当該対のMACコントローラの不具合発生時に、前記複数のMACコントローラのうちの他の1つのMACコントローラを割り当てるようプログラムされる、請求項1記載のシステム。
  5. 前記ハウスキーピング・プロセッサは、前記複数のMACコントローラの前記他の1つのMACコントローラへ、前記不具合を起こしたMACコントローラのMACアドレスを割り当て直すようプログラムされる、請求項4記載のシステム。
  6. ブロードキャスティング・ドメインに対する処理ユニット/MACコントローラ対の接続性における不具合から回復する方法であって、
    前記ブロードキャスティング・ドメインに対する、第1のMACアドレスを有する処理ユニット/MACコントローラ対であって、当該対に専用である1つの処理ユニット及び1つのMACコントローラを有する前記処理ユニット/MACコントローラ対の接続における不具合を検出した場合に、前記処理ユニット/MACコントローラ対へ交換用処理ユニット又は交換用MACコントローラのいずれか1つを割り当て直す段階と、
    前記ブロードキャスティング・ドメインへの接続のために前記処理ユニット/MACコントローラ対の利用可能性を確認する段階と、
    前記処理ユニット/MACコントローラ対が利用可能でない場合は、前記処理ユニット/MACコントローラ対へ前記交換用処理ユニット又は交換用MACコントローラの他の1つを割り当てる段階と、
    前記交換用MACコントローラが前記処理ユニット/MACコントローラ対へ割り当て直される場合に、前記第1のMACアドレスを当該交換用MACコントローラへ割り当て直す段階とを有し、
    前記利用可能性を確認する段階は前記第1のMACアドレスを用いて実行される、方法。
  7. 不具合の検出は、前記ブロードキャスティング・ドメインのデフォルトのゲートウェイへ誤り検出パケットを送ることによって実行される、請求項6記載の方法。
  8. 前記利用可能性を確認する段階は、前記ブロードキャスティング・ドメインのデフォルトのゲートウェイへ誤り検出パケットを送る段階を有する、請求項6記載の方法。
  9. 前記誤り検出パケットはICMPエコーパケットである、請求項7記載の方法。
  10. 前記誤り検出パケットはICMPエコーパケットである、請求項8記載の方法。
  11. 交換用MACコントローラが利用可能であるかどうかを決定し、該交換用MACコントローラが利用可能でない場合は当該方法を終了する段階を更に有する、請求項6記載の方法。
  12. 不具合の検出の送信、前記交換用処理ユニットの再割り当て、前記利用可能性の確認、他の不具合の検出、前記交換用MACコントローラの再割り当て、及び前記交換用MACコントローラへの前記第1のMACアドレスの再割り当ては、作動中のハウスキーピング・プロセッサによって実行される、請求項6記載の方法。
  13. 前記作動中のハウスキーピング・プロセッサへ及び前記複数の処理ユニットへ伝達可能に結合される待機中のハウスキーピング・プロセッサは、
    前記作動中のハウスキーピング・プロセッサの動作を監視し、
    前記作動中のハウスキーピング・プロセッサで不具合を検出すると、前記不具合の検出の送信、前記交換用処理ユニットの再割り当て、前記利用可能性の確認、前記他の不具合の検出、前記交換用MACコントローラの再割り当て、及び前記交換用MACコントローラへの前記第1のMACアドレスの再割り当てを実行する、請求項12記載の方法。
  14. ネットワークで通信を維持する方法であって、
    複数の処理ユニットを設ける段階と、
    複数のMACコントローラを設ける段階と、
    前記複数のMACコントローラへ割り当てられる複数のMACアドレスを提供する段階であって、前記複数のMACコントローラは前記複数の処理ユニットのうちの少なくとも1つへ割り当てられる段階と、
    前記複数のMACコントローラへ前記複数の処理ユニットを伝達可能に結合する相互接続スイッチを設ける段階と、
    前記複数の処理ユニットへ伝達可能に結合されるハウスキーピング・プロセッサを設ける段階とを有し、
    前記ハウスキーピング・プロセッサから、
    前記ネットワークのデフォルトのゲートウェイへ第1の誤り検出パケットを送る段階と、
    不具合を検出した場合に、前記ネットワークへの接続のために、前記複数の処理ユニットから選択される交換用処理ユニットを割り当て直す段階と、
    前記ネットワークの前記デフォルトのゲートウェイへ第2の誤り検出パケットを送る段階と、
    不具合を検出した場合に、前記ネットワークへの接続のために、前記複数のMACコントローラから選択される交換用MACコントローラの利用可能性を決定する段階と、
    前記ネットワークへの接続のために前記交換用処理ユニットへ前記交換用MACコントローラを割り当て直す段階とを有する方法。
  15. 前記誤り検出パケットはICMPエコーパケットである、請求項14記載の方法。
  16. 前記交換用MACコントローラが利用可能でない場合に終了する、請求項14記載の方法。
  17. 前記複数の処理ユニットへ伝達可能に結合される作動中のハウスキーピング・プロセッサにおいて実行される、請求項14記載の方法。
  18. 前記複数の処理ユニットへ及び前記作動中のハウスキーピング・プロセッサへ伝達可能に結合される待機中のハウスキーピング・プロセッサは、前記作動中のハウスキーピング・プロセッサの動作を監視し、該作動中のハウスキーピング・プロセッサで不具合を検出すると、当該方法の実行を受け継ぐ、請求項17記載の方法。
  19. ネットワーク装置とブロードキャスティング・ドメインとの間の接続を設定する方法であって、前記ネットワーク装置は複数のMACコントローラ及び複数のプロセッサを有し、一群のMACアドレスは前記ネットワーク装置へ割り当てられている方法において、
    前記複数のプロセッサから利用可能なプロセッサを選択する段階と、
    前記複数のMACコントローラから、前記選択されたプロセッサに関連付けられる利用可能なMACコントローラを選択する段階と、
    1又はそれ以上の対を生成するよう前記選択されたMACコントローラ前記選択されたプロセッサを一対のプロセッサ及びMACコントローラにまとめ、各対が当該対に専用である1つのプロセッサ及び1つのMACコントローラを有するようにする段階と、
    前記複数のMACアドレスから利用可能なMACアドレスを選択する段階と、
    前記一対のプロセッサ及びMACコントローラへ前記選択されたMACアドレスを割り当てる段階とを有する方法。
JP2008232556A 2007-09-11 2008-09-10 複数のmacを複数のプロセッサへ割り当てるための方法及びシステム Expired - Fee Related JP4860677B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US97141507P 2007-09-11 2007-09-11
US60/971,415 2007-09-11

Publications (2)

Publication Number Publication Date
JP2009071820A JP2009071820A (ja) 2009-04-02
JP4860677B2 true JP4860677B2 (ja) 2012-01-25

Family

ID=39870462

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008232556A Expired - Fee Related JP4860677B2 (ja) 2007-09-11 2008-09-10 複数のmacを複数のプロセッサへ割り当てるための方法及びシステム

Country Status (7)

Country Link
US (1) US7898941B2 (ja)
EP (1) EP2037364B1 (ja)
JP (1) JP4860677B2 (ja)
CN (2) CN101515885B (ja)
DE (1) DE602008003874D1 (ja)
HK (1) HK1122630A1 (ja)
TW (1) TWI383616B (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9418040B2 (en) * 2005-07-07 2016-08-16 Sciencelogic, Inc. Dynamically deployable self configuring distributed network management system
US8908500B1 (en) * 2008-07-30 2014-12-09 Adtran, Inc. Systems and methods for protecting bonding engines in network communications
JP4811489B2 (ja) * 2009-03-27 2011-11-09 日本電気株式会社 サーバシステム、集合型サーバ装置及びmacアドレス管理方法
US20110103391A1 (en) * 2009-10-30 2011-05-05 Smooth-Stone, Inc. C/O Barry Evans System and method for high-performance, low-power data center interconnect fabric
CN102149116B (zh) * 2011-04-02 2015-05-20 迈普通信技术股份有限公司 一种无线个域网协调器的备份方法及装置
BR112015014639A2 (pt) * 2012-12-20 2017-07-11 Ericsson Telefon Ab L M métodos para comunicação com um terminal conectado em uma rede de comunicação por protocolo da internet e operável para ser associado com um segundo hospedeiro, arranjo de hospedeiro, hospedeiro virtual, primeiro hospedeiro, programa de computador, e, produto de programa de computador
US9146890B1 (en) * 2013-01-25 2015-09-29 Pmc—Sierra Us, Inc. Method and apparatus for mapped I/O routing in an interconnect switch
US9092353B1 (en) 2013-01-29 2015-07-28 Pmc-Sierra Us, Inc. Apparatus and method based on LDPC codes for adjusting a correctable raw bit error rate limit in a memory system
US9813080B1 (en) 2013-03-05 2017-11-07 Microsemi Solutions (U.S.), Inc. Layer specific LDPC decoder
US10230396B1 (en) 2013-03-05 2019-03-12 Microsemi Solutions (Us), Inc. Method and apparatus for layer-specific LDPC decoding
US9397701B1 (en) 2013-03-11 2016-07-19 Microsemi Storage Solutions (Us), Inc. System and method for lifetime specific LDPC decoding
US9454414B2 (en) 2013-03-15 2016-09-27 Microsemi Storage Solutions (Us), Inc. System and method for accumulating soft information in LDPC decoding
US9590656B2 (en) 2013-03-15 2017-03-07 Microsemi Storage Solutions (Us), Inc. System and method for higher quality log likelihood ratios in LDPC decoding
US9450610B1 (en) 2013-03-15 2016-09-20 Microsemi Storage Solutions (Us), Inc. High quality log likelihood ratios determined using two-index look-up table
US9417804B2 (en) 2014-07-07 2016-08-16 Microsemi Storage Solutions (Us), Inc. System and method for memory block pool wear leveling
US9450916B2 (en) * 2014-08-22 2016-09-20 Honeywell International Inc. Hardware assist for redundant ethernet network
US10332613B1 (en) 2015-05-18 2019-06-25 Microsemi Solutions (Us), Inc. Nonvolatile memory system with retention monitor
US9799405B1 (en) 2015-07-29 2017-10-24 Ip Gem Group, Llc Nonvolatile memory system with read circuit for performing reads using threshold voltage shift read instruction
US9886214B2 (en) 2015-12-11 2018-02-06 Ip Gem Group, Llc Nonvolatile memory system with erase suspend circuit and method for erase suspend management
US9892794B2 (en) 2016-01-04 2018-02-13 Ip Gem Group, Llc Method and apparatus with program suspend using test mode
US9899092B2 (en) 2016-01-27 2018-02-20 Ip Gem Group, Llc Nonvolatile memory system with program step manager and method for program step management
CN106200454B (zh) * 2016-06-21 2019-03-29 沈阳东软医疗系统有限公司 一种多mcu的通信系统及方法
US10283215B2 (en) 2016-07-28 2019-05-07 Ip Gem Group, Llc Nonvolatile memory system with background reference positioning and local reference positioning
US10291263B2 (en) 2016-07-28 2019-05-14 Ip Gem Group, Llc Auto-learning log likelihood ratio
US10236915B2 (en) 2016-07-29 2019-03-19 Microsemi Solutions (U.S.), Inc. Variable T BCH encoding
CN109508491B (zh) * 2018-11-09 2023-05-30 辽宁石油化工大学 一种基于控制器失效的反应釜系统保成本控制器设计方法
US11425771B2 (en) * 2019-11-27 2022-08-23 At&T Intellectual Property I, L.P. Medium access control interface to coordinate multi-site operation for 5G or other next generation wireless network

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3662378B2 (ja) * 1996-12-17 2005-06-22 川崎マイクロエレクトロニクス株式会社 ネットワーク中継器
US6253334B1 (en) * 1997-05-13 2001-06-26 Micron Electronics, Inc. Three bus server architecture with a legacy PCI bus and mirrored I/O PCI buses
US6314525B1 (en) * 1997-05-13 2001-11-06 3Com Corporation Means for allowing two or more network interface controller cards to appear as one card to an operating system
US6208616B1 (en) * 1997-05-13 2001-03-27 3Com Corporation System for detecting errors in a network
US6590861B1 (en) 1999-03-18 2003-07-08 3Com Corporation Combining virtual local area networks and load balancing with fault tolerance in a high performance protocol
JP2001268092A (ja) * 2000-03-21 2001-09-28 Yokogawa Electric Corp 冗長化通信カード
US6760859B1 (en) 2000-05-23 2004-07-06 International Business Machines Corporation Fault tolerant local area network connectivity
US6971044B2 (en) 2001-04-20 2005-11-29 Egenera, Inc. Service clusters and method in a processing system with failover capability
US7085224B1 (en) 2001-06-14 2006-08-01 Cisco Technology, Inc. Method and apparatus for fast failure detection in switched LAN networks
US7391719B2 (en) * 2002-07-15 2008-06-24 Sixnet, Llc Redundant network interface for ethernet devices
JP2004172888A (ja) * 2002-11-19 2004-06-17 Mitsubishi Electric Corp ブロードキャストパケット送信システム
US20050010837A1 (en) 2003-07-10 2005-01-13 International Business Machines Corporation Method and apparatus for managing adapters in a data processing system
US7284147B2 (en) * 2003-08-27 2007-10-16 International Business Machines Corporation Reliable fault resolution in a cluster
JP4340731B2 (ja) 2004-02-26 2009-10-07 日本電気株式会社 ネットワークの障害監視処理システム及び方法
JP2005260321A (ja) * 2004-03-09 2005-09-22 Nec Corp ラベルパスネットワークの迂回制御方式
US20060029097A1 (en) * 2004-06-07 2006-02-09 Mcgee Michael S Dynamic allocation and configuration of a computer system's network resources
JP4462418B2 (ja) * 2004-12-07 2010-05-12 日本電気株式会社 レイヤ2スイッチ切替回路、基地局装置、およびレイヤ2スイッチ切替方法
ATE387799T1 (de) * 2005-10-18 2008-03-15 Alcatel Lucent Verbesserter media-gateway
US7586842B2 (en) * 2006-05-19 2009-09-08 Hewlett-Packard Development Company, L.P. Failover of multicast traffic flows using NIC teaming
US7706255B1 (en) * 2007-01-29 2010-04-27 Solace Systems, Inc. Communications apparatus with redundant switching or backpressure mechanism
JP4964666B2 (ja) * 2007-05-14 2012-07-04 株式会社日立製作所 冗長化された通信経路を切り替える計算機、プログラム及び方法

Also Published As

Publication number Publication date
TWI383616B (zh) 2013-01-21
JP2009071820A (ja) 2009-04-02
EP2037364B1 (en) 2010-12-08
CN101515885B (zh) 2012-12-05
US20090067320A1 (en) 2009-03-12
DE602008003874D1 (de) 2011-01-20
HK1122630A1 (en) 2009-05-22
US7898941B2 (en) 2011-03-01
CN103002072A (zh) 2013-03-27
TW200929928A (en) 2009-07-01
EP2037364A1 (en) 2009-03-18
CN101515885A (zh) 2009-08-26

Similar Documents

Publication Publication Date Title
JP4860677B2 (ja) 複数のmacを複数のプロセッサへ割り当てるための方法及びシステム
US9300528B2 (en) Trill network with multipath redundancy
US9965368B2 (en) High-availability cluster architecture and protocol
US20190140890A1 (en) Method and system of a dynamic high-availability mode based on current wide area network connectivity
US8842518B2 (en) System and method for supporting management network interface card port failover in a middleware machine environment
US6535990B1 (en) Method and apparatus for providing fault-tolerant addresses for nodes in a clustered system
US7010716B2 (en) Method and apparatus for defining failover events in a network device
US8121051B2 (en) Network resource teaming on a per virtual network basis
CA2753747C (en) Method for operating a node cluster system in a network and node cluster system
US7197664B2 (en) Stateless redundancy in a network device
JP6341914B2 (ja) ミドルウェアマシン環境で高可用性(ha)ネットワーク通信をサポートするためのシステムおよび方法
US20040010583A1 (en) Method and apparatus for defining failover events in a network device
US7769862B2 (en) Method and system for efficiently failing over interfaces in a network
US20220263909A1 (en) Failover prevention in a high availability system during traffic congestion
US20210083944A1 (en) Apparatus, system, and method for topology discovery across geographically redundant gateway devices
JP2002344450A (ja) 高可用性処理方法及びその実施システム並びにその処理プログラム
JP4133738B2 (ja) 高速ネットワークアドレス引継ぎ方法、ネットワーク装置及びプログラム
US8903991B1 (en) Clustered computer system using ARP protocol to identify connectivity issues
JP5653947B2 (ja) ネットワーク管理システム、ネットワーク管理装置、ネットワーク管理方法及びネットワーク管理プログラム
JP5170000B2 (ja) 冗長化ペア検出方法、通信装置、冗長化ペア検出プログラム、記録媒体
JP2011250012A (ja) 通信機器、障害検知方法、障害検知プログラム、通信システムおよび通信方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101026

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110419

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110808

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110815

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111011

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111102

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141111

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees