JP4038176B2 - フェイルオーバー・アドレスまたはマルチキャスト・アドレスを使用したネットワーク・ノードのフェイルオーバー - Google Patents

フェイルオーバー・アドレスまたはマルチキャスト・アドレスを使用したネットワーク・ノードのフェイルオーバー Download PDF

Info

Publication number
JP4038176B2
JP4038176B2 JP2003518112A JP2003518112A JP4038176B2 JP 4038176 B2 JP4038176 B2 JP 4038176B2 JP 2003518112 A JP2003518112 A JP 2003518112A JP 2003518112 A JP2003518112 A JP 2003518112A JP 4038176 B2 JP4038176 B2 JP 4038176B2
Authority
JP
Japan
Prior art keywords
node
multicast
port
address
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003518112A
Other languages
English (en)
Other versions
JP2004537918A (ja
Inventor
カシュヤップ、ヴィヴェック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2004537918A publication Critical patent/JP2004537918A/ja
Application granted granted Critical
Publication of JP4038176B2 publication Critical patent/JP4038176B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/185Arrangements for providing special services to substations for broadcast or conference, e.g. multicast with management of multicast group membership
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1863Arrangements for providing special services to substations for broadcast or conference, e.g. multicast comprising mechanisms for improved reliability, e.g. status reports
    • H04L12/1877Measures taken prior to transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)
  • Hardware Redundancy (AREA)
  • Computer And Data Communications (AREA)

Description

本発明は一般に、インフィニバンド・ネットワークなどのネットワークに関するものであり、特にこれらネットワーク内のノードのフェイルオーバー(障害時切り替え)に関するものである。
システム・バスなどの入出力(I/O)ネットワークは、コンピュータのプロセッサがネットワーク・アダプタなどの周辺装置と通信するために用いることができる。 しかしながら、PCI(Peripheral Component Interface)バスなどの共用I/Oネットワークのアーキテクチャにおける制約は、コンピュータの全体的なパフォーマンスを制限する。 それゆえ、新しいタイプのI/Oネットワークが提案されてきた。
新しいタイプのI/Oネットワークの一つはインフィニバンド・ネットワークとして知られ、またその名で呼ばれている。 インフィニバンド・ネットワークは、コンピュータ内で現在見受けられるPCIやその他のバスを、1つまたは複数のルーターを備えたパケット切り替えネットワークで置き換えるものである。 1つのホスト・チャネル・アダプタ(HCA)がプロセッサを1つのサブネットとつなぎ、一方、複数のターゲット・チャネル・アダプタ(TCA)が周辺装置を当該サブネットとつなぐ。 当該サブネットには、少なくとも1つのスイッチと、当該HCAおよび当該複数のTCAを当該スイッチに接続する複数のリンクとがある。 例えば、簡易なインフィニバンド・ネットワークは1つのスイッチを持つことができ、HCAと複数のTCAとが複数のリンクを介して(そのスイッチに)接続される。 より複雑なトポロジー(位相的構成)もまた可能であり、検討もされている。
インフィニバンド・ネットワークの各終端ノードは1つまたは複数のチャネル・アダプタ(CA)を備えており、各CAは1つまたは複数のポートを備えている。 各ポートは、1つの局所サブネット・マネージャ(SM)によって割り当てられた1つの局所識別子(LID)を備えている。 当該サブネット内ではLIDは固有の(1種類につき1つしか存在しない)ものである。 各スイッチは、当該サブネット内でのパケットの経路決めをするためにこれらLIDを使用する。 各々のデータ・パケットは、このパケットを当該サブネットへ投入した(ソースの)ポートを識別するソースLID(SLID)と、当該インフィニバンド・ファブリック(構造)もしくはネットワークがこのパケットを配信しなければならない(宛先の)ポートを識別する宛先LID(DLID)とを含んでいる。
このインフィニバンド・ネットワーク手法では、LIDマスク・カウント(LMC)を規定することによって、1つの物理ポート内に複数の仮想ポートを提供する。 このLMCは、あるパケットのDLIDがそれ(パケット)に割り当てられるLIDと一致することを確認する際に、物理ポートがマスクする、即ち無視する、当該LIDの最下位側のビット数を指定するものである。 しかし、各スイッチはこれらのビットを無視しない。 それ故、SMは当該最下位側ビットに基づいて、当該インフィニバンド・ファブリックを通過する異なった複数の経路をプログラムすることができる。 従って当該ポートは、当該ファブリックを横切って経路指定する上で、2つのLMCポートのように見える。
障害なしに24時間使用可能であることが必要とされる重要なアプリケーションにおいては、個々のアプリケーションの、また従って、通信の終端点、即ち終端ノード、のフェイルオーバー(障害時切り替え)が通常求められる。 インフィニバンド・ネットワークの状況下における通信終端点は、各CAポートと関係している。 これらのアプリケーションは、当該インフィニバンド・ネットワークをまたがって、例えば他のアプリケーション等と通信するためにこれらの終端点を使用する。 終端点のトランスペアレントな(ユーザーから気付かれない)フェイルオーバーとは、ネットワーク自体における通信を中断させないような方法で、別の終端点が、障害を起こした終端点の責務を取って代わることであると意味することができる。
しかしながら、インフィニバンド・ネットワークにおける終端点およびその他のノードのトランスペアレントなフェイルオーバーは、これら終端点をアドレス指定するという方法のため、実現するのが困難である。 フェイルオーバーには、当該障害ポートに取って代わっている新しいポートに対してLIDが再割り当てされることが必要である。 しかし、当該新しいポートは、それに割り当てられた1つのLIDを通常既に保持している。 従って、追加のLIDを割り当てることができる唯一の方法は、当該ポート上でLMCの範囲を拡張し、当該新しいLIDがその範囲内に入ることを保証することである。
しかし実際上は、各ポート上でLMCの範囲を拡張することは困難であり、取って代わるポートが、障害を起こしたポートに割り当てられていたLIDを持てるよう保証するためには、時には著しい労力を要する。 LIDフェイルオーバーはそれ故、トランスペアレントなフェイルオーバーが必要なインフィニバンド・ネットワークを成功裏に広く行き渡らせることに対しての問題および障壁と見られている。 その他の理由を加えたこれらの理由によって、本発明の必要性が存在する。
本発明は、1つのフェイルオーバー・アドレスまたは1つのマルチキャスト(同報送信)・アドレスを用いた、ネットワーク内でのノードのフェイルオーバーに関するものである。 本発明の方法において、あるネットワークに属する第1のノードが、1つのマルチキャスト・アドレスを持った1つのマルチキャスト・グループに参加する。 この参加は、3つの対応の内の1つをとることにより実行される。 1つ目の対応では、1つのフェイルオーバー・アドレスを当該第1のノードに関連付けることができ、その結果、当該第1のノードは、当該フェイルオーバー・アドレスをマルチキャスト・アドレスとして持つマルチキャスト・グループに有効に参加する。 当該フェイルオーバー・アドレスに対する通信は、当該ネットワークを通って当該第1のノードに向けられる。 2つ目の対応では、当該マルチキャスト・アドレスを当該第1のノードに関連付けることができ、その結果、そこ(マルチキャスト・アドレス)に対する通信は、当該ネットワークを通って当該第1のノードに向けられる。 3つ目の対応では、当該ネットワークに属する1つのスイッチ上の1つのマルチキャスト・ポートを、当該第1のノード上の1つのポートにマップする(位置付ける)ことができる。 当該マルチキャスト・アドレスに対する通信は、当該スイッチ上の当該マルチキャスト・ポートから当該第1のノード上のこのポートへと向けられる。
当該第1のノードの障害に際しては、当該第1のノードを当該ネットワークに参加させた方法に対応して、3つの対応の内の1つが行われる。 もしこの参加が、当該フェイルオーバー・アドレスを当該第1のノードに関連付けるものであるならば、当該フェイルオーバー・アドレスは第2のノードに関連付けられ、その結果、当該第2のノードは当該マルチキャスト・グループに有効に参加し、そこ(フェイルオーバー・アドレス)に対する通信は当該第2のノードによって取り扱われる。 もしこの参加が、当該マルチキャスト・アドレスを当該第1のノードに関連付けるものであるならば、当該第2のノードが当該マルチキャスト・グループに参加し、その結果、当該マルチキャスト・アドレスは当該第2のノードに関連付けられ、当該マルチキャスト・アドレスに対する通信は当該第2のノードによって取り扱われる。 もしこの参加が、当該スイッチ上の当該マルチキャスト・ポートを当該第1のノード上の先のポートにマップするものであるならば、当該スイッチ上の当該マルチキャスト・ポートは当該第2のノード上の1つのポートに再マップされる。 従って当該マルチキャスト・アドレスに対する通信は、当該第2のノード上のこのポートへと向けられる。
本発明はまたフェイルオーバー・ノードと装置をも含んでいる。 これらフェイルオーバー・ノードとは本発明の方法を実行するためのものであり、一方これら装置とは、コンピュータ可読の媒体と、この媒体内にある本発明の方法を実行するための手段とを有するものである。 本発明のその他の特徴および利点は、本発明の現在の好ましい実施形態についての以下の詳細な記述を、添付の図面と併せて見ることにより、明らかなものとなるであろう。
[概要]
図1は、本発明の好ましい一実施形態による方法100を示すものである。 ネットワークに属する第1のノードが、1つのマルチキャスト・グループに最初に有効に参加する(102)。 当該マルチキャスト・グループは1つのマルチキャスト・アドレスまたは1つのフェイルオーバー・アドレスを持つ。 3つの対応の内の少なくとも1つが実行される(104)。 第1のモードでは、当該マルチキャスト・アドレスが当該第1のノードに割り当てられる。 当該マルチキャスト・アドレス対する通信は、これまではこのような通信を達成するためのネットワークは予め手動でまたは自動でセットアップされてきたかもしれないが、今度は自動的に当該第1のノードに方向付けることができる。 第2のモードでは、当該ネットワークに属するスイッチ上の1つのマルチキャスト・ポートが、当該第1のノード上の1つのポートにマップ(位置付け)、即ち関連付けられる。 当該マルチキャスト・アドレスに対する通信は、当該スイッチがマルチキャスティングをサポートしない場合には、今度は当該スイッチ上の当該マルチキャスト・ポートから当該第1のノード上の当該ノードへと方向付けることができる。 第3のモードでは、当該フェイルオーバー・アドレスが当該ノードに割り当てられる。 当該フェイルオーバー・アドレスに対する通信は、これまではこのような通信を達成するためのネットワークは予めまたは自動でセットアップされてきたかもしれないが、今度は自動的に当該第1のノードに方向付けることができる。 当該ネットワークはインフィニバンド・ネットワークであることが望ましい。 当該第1のおよび第2のノードは、このようなネットワーク上の、複数のチャネル・アダプタ(CA)および複数のポートを備えたホストである場合もある。
その後、当該第1のノードが障害を起こす(108)と、当該ネットワークの第2のノードによる当該第1のノードのトランスペアレントな(ユーザーから気付かれない)フェイルオーバーが起こることが望ましい。 これは、3つの対応の内の1つの実行に伴って生じさせることができる。 1つ目では、当該第2のノードが当該マルチキャスト・グループに参加することができ、その結果、当該マルチキャスト・アドレスが当該第2のノードにも割り当てられる(110)。 従って、当該マルチキャスト・アドレスに対する通信は、当該第1の、障害を起こしたノードへと同様に、当該第2のノードへも方向付けられ、その結果、当該第2のノードが当該第1のノードからこのような通信の取り扱いを引き継ぐ。 2つ目では、当該スイッチ上の当該マルチキャスト・ポートを当該第2のノード上の1つのポートに再マップすることができる(112)。 従って、当該マルチキャスト・アドレスに対する通信は当該第2のノード上の当該ポートに方向付けられ、その結果、当該第2のノードがこのような通信の取り扱いを引き継ぐ。 3つ目では、当該第2のノードが当該フェイルオーバー・アドレスと関連付けられ、その結果、当該第2のノードは当該マルチキャスト・グループに有効に参加する(114)。 従って、当該フェイルオーバー・アドレスに対する通信は、当該第1の、障害を起こしたノードへと同様に、当該第2のノードへも方向付けられ、それにより当該第2のノードが当該第1のノードからこのような通信の取り扱いを引き継ぐ。
インフィニバンド・サブネットのサブネット・マネージャ(SM)といった管理コンポーネントが、当初当該第1のノードに割り当てられていた当該マルチキャスト・グループの当該マルチキャスト・アドレスを当該第2のノードに割り当てるのを遂行することができる。 当該管理コンポーネントはまた、当該第1のノード上の当該ポートに当初はマップされていた当該スイッチ上の当該マルチキャスト・ポートを当該第2のノード上の当該ポートに再マップするのを遂行することもできる。 ある装置のコンピュータ可読の媒体の中の手段がこの機能を遂行することもできる。 当該手段は、追記可能なデータ記憶媒体や、変調された搬送波信号や、または他のタイプの媒体や信号である場合がある。
それ故、当該第1のモードでは、ユニキャスト(単一送信)の通信用にマルチキャスト・アドレスが用いられる。 これらマルチキャスト・アドレスは、マルチキャストLIDのみが複数のポートによって共有できるので、局所識別子(LID)のフェイルオーバーが起こるのを可能にする。 当該第2のモードでは、問題のノードは1つのスイッチ上の1次マルチキャスト・ポートに接続される。 フェイルオーバーに際して、パケットが当該フェイルオーバー・ノードに移動できるように当該1次ポートを再割り当てすることにより、スイッチ構成が修正される。 当該第3のモードでは、フェイルオーバーLIDはあらゆるマルチキャスト・グループに関連付けることが可能である。 更に、フェイルオーバーLIDは、それらが当該マルチキャスト・グループ・アドレスを含まないようにすることが可能である。
[技術的背景]
図2は、本発明の実施形態を関連させて実施することができる、インフィニバンド・ネットワーク・アーキテクチャ200の一例を示している。 インフィニバンド・ネットワークはネットワークの1つのタイプである。 本発明は、他の諸タイプのネットワークでも実施することができる。 プロセッサ202はホスト相互接続204と連結され、そこへメモリ・コントローラ206もまた連結されている。 当該メモリ・コントローラ206はシステム・メモリ208を管理する。 当該メモリ・コントローラはまた、ホスト・チャネル・アダプタ(HCA)210にも接続されている。 当該HCA210は、当該プロセッサ202と、当該ホスト相互接続204と、当該メモリ・コントローラ206と、当該システム・メモリ208と、を包含するプロセッサおよびメモリ・サブシステムが、当該インフィニバンド・ネットワークを介して通信することを可能とする。
図2のインフィニバンド・ネットワークは、特にサブネット236と称せられるものであり、当該サブネット236はインフィニバンド・リンク212、216、224、および230と、1つのインフィニバンド・スイッチ214とを包含している。 複数のインフィニバンド・スイッチがある場合があるが、スイッチ214のみが図2に示されている。 リンク212、216、224、および230は、HCAおよびターゲット・チャネル・アダプタ(TCA)218および226がお互いに通信するのを可能にし、当該インフィニバンド・ネットワークがルータ232を介して他のインフィニバンド・ネットワークと通信することもまた可能にする。 具体的には、リンク212はHCA210をスイッチ214に接続する。 リンク216および224はTCA218および226をそれぞれスイッチ224に接続する。 リンク230はルータ232をスイッチ214に接続する。
TCA218はある特定の周辺機器用のターゲット・チャネル・アダプタ であり、この場合イーサネット・ネットワーク・アダプタ220である。 1つのTCAは複数のネットワーク・アダプタ、SCSIアダプタ、その他といった複数の周辺機器を備えることができる。 TCA218は、ネットワーク・アダプタ220が当該インフィニバンド・ネットワークを介してデータを送受信することを可能にする。 アダプタ220自体は、ライン222で表示されるように、通信ネットワーク、特にイーサネット・ネットワークを介しての通信を可能にする。 他の通信ネットワークもまた本発明に従う。 TCA226はその他の周辺機器であるターゲット周辺機器228用のターゲット・チャネル・アダプタであるが、図2には特に規定されていない。 ルータ232は図2の当該インフィニバンド・ネットワークを他のインフィニバンド・ネットワークに接続するのを可能にし、ライン234がこの接続を表している。
インフィニバンド・ネットワークはパケットをスイッチする入出力(I/O)ネットワークである。 従って、プロセッサ202は、相互接続204およびメモリ・コントローラ206を介して、HCA210を通るデータ・パケットを送受信する。 同様に、ターゲット周辺機器228およびネットワーク・アダプタ220は、それぞれTCA226および218を介してデータ・パケットを送受信する。 データ・パケットはまた、ルータ232を介しても送受信されることができ、これによりスイッチ214を他のインフィニバンド・ネットワークに接続する。 リンク212、216、224、および230は、スイッチ214に接続される特定のHCA、TCA、等に必要とされるバンド幅に依存して、変化する容量を持つことができる。
インフィニバンド・ネットワークはTCAとHCAの間の通信を種々の異なる方法にて提供するものであり、それらは本明細においては要約目的のためだけに簡単に記述されている。 他のタイプのネットワークと同様に、インフィニバンド・ネットワークは、物理層、リンク層、ネットワーク層、トランスポート層、および上位レベルのプロトコルを持つ。 他のタイプのパケット・スイッチを行うネットワークにあるように、インフィニバンド・ネットワークにおいては特定の数トランザクションが数メッセージに分割され、それら(メッセージ)自身は、インフィニバンド・ネットワークを介しての配信のために数パケットに分割される。 意図した受信者によって受信されたとき、これらパケットは所定のトランザクションを構成するメッセージへと再度順序付けられる。 インフィニバンド・ネットワークは、これらパケットが送受信されるためのキュー(待ち行列)およびチャネルを提供する。
更に、インフィニバンド・ネットワークは、信頼性のある接続、信頼性の無い接続、信頼性のあるデータグラム、信頼性の無いデータグラム、および未加工(Raw)パケット・サポート、を含む多くの異なった転送サービスを可能にする。 信頼性のある接続および信頼性のあるデータグラムにおいては、バケット順序を保証するための、応答とパケット系列番号とが生成される。 重複したパケットは拒絶され、紛失パケットは検出される。 信頼性の無い接続および信頼性の無いデータグラムにおいては、応答は生成されず、パケット順序は保証されない。 重複パケットは拒絶されないことがあり、紛失パケットは検出されないことがある。
インフィニバンド・ネットワークはまた、複数の独立したプロセッサ・プラットフォーム即ちホスト・プロセッサ・ノード、I/Oプラットフォーム、およびI/Oデバイスの間を接続するためのシステム・エリア・ネットワーク(SAN)を規定するのに用いることができる。 図3は、本発明の実施形態をそれに伴って実施することができる、SAN300の一例を示している。 SAN300は、1つまたは複数のコンピュータ・システムのための、I/O通信とプロセッサ間通信(IPC)の両方をサポートする、通信および管理基盤である。 インフィニバンド・システムは、小規模なサーバから超並列スーパー・コンピュータ設備にまでまたがり得る。 更に、インターネット・プロトコル(IP)になじみ易いというインフィニバンド・ネットワークの性質は、インターネット、イントラネット、またはリモート(遠隔)・コンピュータ・システムへの接続、に対する橋渡しを可能とする。
SAN300は、保護され遠隔管理された環境下において、多くのデバイスが高いバンド幅と低いレイテンシー(待ち時間)で同時に通信するのを可能にする、スイッチ型通信ファブリック(構造)301、即ちサブネットを持つ。 1つの終端ノードは、複数のインフィニバンド・ポートをまたがって通信することができ、またファブリック301を介する複数の経路を利用することができる。 ネットワーク300を介しての、ポートと経路のこの多重性は、耐障害性と増大するデータ転送バンド幅との両者のために利用される。 インフィニバンド・ハードウェアは、プロセッサおよびI/O通信の動作の負担の多くを軽減する。 これにより、通信する際のプロトコルに伴う従来のオーバーヘッド無しに複数の同時通信が可能になる。
具体的にはファブリック301は、多くのスイッチ、302、304、306、310、および312と、矢印303で示すようにファブリック301が他のインフィニバンド・サブネット、ワイド・エリア・ネットワーク(WAN)、ローカル・エリア・ネットワーク(LAN)およびホストとリンクされることを可能にする1つのルータと、を含んでいる。 ファブリック301は、多くのホスト318、320、および322が、異なったサブシステム、管理コンソール、ドライブ、およびI/O筐体との通信に加え、お互いの間での通信を行うことを可能にする。 これら異なったサブシステム、管理コンソール、ドライブ、およびI/O筐体は、RAID(Redundant Array of Information Disks)サブシステム324、管理コンソール326、I/O筐体328および330、ドライブ332、およびストレージ・サブシステム334として図3に示されている。
図4は、インフィニバンド・ネットワークの終端ノード400の一例となる、通信インターフェースを示している。 当該終端ノードは、例えば図3のホスト318、320、および322の1つであるかもしれない。 終端ノード400は、プロセス402および404の上で動作している。 各プロセスは1つまたは複数のキュー対(QP)と関係付けられ、各QPは、矢印420で示されるように、当該インフィニバンド・ファブリックにリンクするためにノード400のチャネル・アダプタ(CA)418と通信する。 例えば、プロセス402は具体的にQP406と408を持ち、一方プロセス404はQP410を持つ。
各QPは1つのHCAと1つのTCAとの間で規定される。 リンクの各終端は、他方へ配信されるべきキュー・メッセージを持つ。 1つのQPは、お互いに対になった1つの送信作業キューおよび1つの受信作業キューを含んでいる。 一般に、当該送信作業キューは、クライアントのメモリと他のプロセスのメモリとの間でのデータの転送をもたらす命令を保持しており、また当該受信作業キューは、他のプロセスから受信されたデータをどこに配置するかについての命令を保持する。
QPは1つのインフィニバンド・クライアント・プロセスとの仮想通信インターフェースを表しており、当該クライアントのための仮想通信ポートを提供する。 1つのCAは224個までのQPを供給することができ、各QP上での動作は他からは独立している。 当該クライアントは、1つのQPを割り当てることで仮想通信ポートを作成する。 当該クライアントは、当該QPを他のQPと結びつけるのに必要なあらゆる通信構築を開始し、また当該QPコンテキスト(構成文脈)を、宛先アドレス、サービス・レベル、取り決められた動作制限、等といった特定の情報で構成する。
図5および図6は、インフィニバンド・ネットワーク内でいかにしてアドレス指定が行われるかを示している。 図5には、1つの終端ノード502と1つのスイッチ504とを含んだ簡易なインフィニバンド・ネットワーク500が示されている。 終端ノード502は、関連するQP506、508、および510を持つプロセス504上で動作している。 終端ノード502はまた、CA512などの1つまたは複数のCAを含んでいる。 CA512は、ポート514および516といった1つまたは複数の通信ポートを含んでいる。 QP506、508、および510の各々は、CA512によって割り当てられた、CA512内でQPを一意に識別する1つのキュー対番号(QPN)を持っている。 未加工のデータグラム以外のデータ・パケットは、宛先作業キューのQPNを含んでいる。 CA512がパケットを受信したとき、当該パケットを適切に処理するために当該宛先QPNのコンテキストが使用される。
局所サブネット・マネージャ(SM)は各ポートに1つの局所識別子(LID)を割り当てる。 SMとは、スイッチ、ルータ、およびCAを構成し管理する責任を持った、サブネットに接続された管理コンポーネントである。 あるSMはCAやスイッチといった他のデバイスに組み込むことができる。 例えば、当該SMは終端ノード502のCA512内に組み込むことができる。 他の例としては、当該SMはスイッチ504内に組み込むことができる。
インフィニバンド・サブネット内ではLIDは固有のものである。 スイッチ504などのスイッチ類は、当該LIDを使用して当該サブネット内でパケットを経路付ける。 各パケットは、当該パケットを当該サブネットへ投入したポートを識別するソースLID(SLID)と、当該ファブリックが当該パケットを配信しなければならない(宛先の)ポートを識別する宛先LID(DLID)とを含んでいる。 スイッチ504などのスイッチ類はまた、各々がポートの番号を有している。 スイッチ504上の各ポートは、終端ノード502上の1つのポートと関連付けることができる。 例えば、スイッチ504のポート518は、矢印520で示されるように、終端ノード502のポート516に関連付けられる。 従って、スイッチ504によって受信された、ノード502のポート516を対象としたデータ・パケットは、ポート518からポート516へと送られる。 より詳しくは、スイッチ504がDLIDを持った1つのパケットを受信する場合、当該スイッチは当該DLIDがゼロでないことを確認するだけである。 そうでない(ゼロでない)場合は、当該スイッチは、当該SMによってプログラムされた複数のテーブルに従って当該パケットの経路決めを行う。
各々が1つのインフィニバンド・サブネット内の特定のポートを識別するものであるDLIDに加え、マルチキャストDLIDまたはマルチキャスト・アドレスをもまた規定することができる。 一般に、1組の終端ノードが1つのマルチキャスト・グループに参加することができ、その結果、当該SMは、当該マルチキャスト・グループに属する1つのマルチキャストDLIDを伴った各ノードに属する1つのポートを割り当てる。 当該マルチキャストDLIDに送られた1つのデータ・パケットは、当該マルチキャスト・グループに参加している各ノードに送られる。 スイッチ504などの各々のスイッチは、1つの初期設定の1次マルチキャスト・ポートと、1つの初期設定の非1次マルチキャスト・ポートとを持つ。 当該1次/非1次マルチキャスト・ポートはすべてのマルチキャスト・パケットのためのものであり、いかなる特定のDLIDとも関連付けられるものではない。 当該マルチキャスト・グループに参加した各ノードに属する1つのポートは、当該スイッチに属する当該1次マルチキャスト・ポートまたは当該非1次マルチキャスト・ポートの何れかに関連付けられる。
マルチキャストDLIDを持った1つのデータ・パケットが受信されたとき、当該マルチキャストDLIDは調べられ、当該データ・パケットは当該SMによってプログラムされたテーブルに基づいて転送される。 当該マルチキャストDLIDがテーブルに無い場合、または当該スイッチがテーブルを保持していない場合、当該パケットは当該1次および非1次の初期設定のマルチキャスト・ポートのうちのどちらかに転送される。 1次ポートにて受信された場合は、当該パケットは当該非1次マルチキャスト・ポートに送出され、逆に当該スイッチに属する他のあらゆるポートにて受信された場合は、当該1次マルチキャスト・ポートに送出される。 当該マルチキャストDLIDを指定するスイッチ504によって受信されたデータ・パケットは、こうしてこれらマルチキャスト・ポートの内の1つから、当該マルチキャスト・グループ・ノードに属する関連するポートへと送られる。 スイッチ504は、当該パケットが移動するべき先となる各ポートの指定をする、マルチキャスト・トラフィックのための経路指定情報によって構成することができる。
更に、あらゆるインフィニバンド・ノードがあらゆるマルチキャスト・グループに伝わることができるが、もしも、スイッチ504などのスイッチがパケットを正しく転送しなかったなら、データ・パケットが当該グループ・メンバによって正しく受信されるという保証は無い。 従って、これらスイッチは、マルチキャスト・データ・パケットが当該グループ・メンバによって受信されるように設定されるべきである。 これは、マルチキャスト・パケットがそれらの適切な宛先に到達することを保証するように予めプログラムされた、即ち独占的にプログラムされた、特定の1つまたは複数のスイッチを介して、マルチキャスト・データ・パケットを常に送り込むことを確実に行うことによって、達成することができる。 もう1つの方法として、もしもすべてのスイッチがマルチキャストについて完全にサポートされるのであれば、終端ノードがマルチキャスト・グループに参加することで、これらパケットが当該マルチキャスト・グループに属するすべてのメンバによって正しく受信されるように当該SMにこれらスイッチをプログラムさせることになる。 その他のアプローチをもまた実行することができる。
図6には、2つのサブネット602および604を備えた、より複雑なインフィニバンド・ネットワーク600が示されている。 サブネット602は終端ノード604、606、および608を備え、これらはそれぞれにスイッチ610および612に接続されている。 同様に、サブネット604は終端ノード614、616、618、および620を備え、これらはそれぞれにスイッチ622および624に接続されている。 サブネット602に属するスイッチ610および612は、ルータ626および628を介して、サブネット604に属するスイッチ622および624にそれぞれに接続されており、これによりサブネット間通信が可能となる。 この文脈上の、それぞれに接続されているとは、ある構成要素に属する1つまたは複数のポートが別の構成要素に属する1つまたは複数のポートに関連付けられていることを意味する。 例えば、ノード604は2つのポートを持つことができ、一方はスイッチ610と関連付けられ、他方はスイッチ612と関連付けられている。
[第1ノード・フェイルオーバーについてのフェイルオーバー(マルチキャスト)・アドレスの第2ノードとの関連]
本発明の実施例によって、1つのマルチキャスト・グループに属する1つのフェイルオーバー・アドレスを他のノードと関連付けることによるネットワーク・ノードのフェイルオーバーを実現することができる。 図7は、本発明のかかる1実施例に従った方法700を示している。 この実施例では、局所識別子(LID)についてのインフィニバンド仕様が次のように再定義されることが望ましい。
Figure 0004038176

ThLIDとは、アドミニストレータ指定の閾値であり、このThLIDを超えるLIDのみがフェイルオーバーLIDとなること、およびそれらはまた有効にマルチキャストLIDでもあることが望ましい。
更には、当該インフィニバンド仕様は、フェイルオーバーLIDがマルチキャストのグループ識別子(GID)と関連付けられることが可能となるように拡張されることが望ましい。 このようなフェイルオーバーLIDはGID付き、またはGID無しで、使用することが可能となる。ThLIDが0XC000に等しい場合には、マルチキャストが範囲を占める値は現行インフィニバンド仕様の中で開始し、従って本実施例は現行仕様に適合している。
本発明の他の実施例では、許容性LID以外のあらゆる有効なLIDは、1つのマルチキャスト・グループと関連付けることができ、それ故にフェイルオーバーLIDとして有効に機能することができる。 従って1つのサブネット・マネージャ(SM)を拡張して、許容性LID以外のあらゆるこのような有効なLIDが1つのマルチキャスト・グループと関連付けられるのが可能となるようにする。 即ち、インフィニバンド仕様が修正され、その結果、ノードのフェイルオーバーを可能とするために、許容性LID以外のあらゆる有効なLIDが1つのマルチキャスト・グループと関連付けられるのを、当該SMが認めることが可能となる。 最後に、本発明の別の実施例では、当該インフィニバンド仕様に対していかなる変更もなされず、その結果、図7の方法700に関する以下の議論は、同じく有効に1つのマルチキャスト・グループLIDであるフェイルオーバーLIDにではなく、マルチキャスト・グループLIDのみに関連したものとなる。
次に、図7の方法700を参照すると、あるインフィニバンド・ネットワークに属する第1のノードが、有効にマルチキャスト・グループLIDである1つのフェイルオーバーLID(または1つのマルチキャストLID)に関連付けられることで、当該第1のノードは有効に当該マルチキャスト・グループに参加する(702)。 当該第1のノードをその一部に含むサブネットに属するSMは、当該第1のノードによる当該マルチキャスト・グループへの参加要求に応答するといったように、当該フェイルオーバーLIDを当該マルチキャスト・グループに関連付ける。 当該第1のノードは、当該インフィニバンド・ネットワークの中の当該サブネット上の1つのホストに属する1つのチャネル・アダプタ(CA)であることがある。 次に、当該第1のノードが障害を起こし(704)、これは普通、当該サブネットに属する別のノードによって検出される。 当該第1のノードは、任意選択で当該マルチキャスト・グループから立去ることができ(706)、これは例えば、当該サブネットに属する第2のノードが当該第1のノードに代わって当該SMに対して立去り要求を送ることによって行われる。
次に、当該第2のノードが当該マルチキャスト・グループに参加し、よって当該フェイルオーバーLID(または当該マルチキャストLID)に対して送られたパケットを受信することになる(708)。 より詳しくは、当該SMは、当該第2のノードからの当該参加要求に応答してこれらスイッチをプログラムし、その結果、当該マルチキャストに送られたパケットは当該第2のノードによって受信される。 当該第2のノードもまた、当該インフィニバンド・ネットワークの中の当該サブネット上の1つのホストに属する1つのCAであることがある。 当該第2のノードの当該ホストは、当該第1のノードのそれと同じホストであることがある。 当該フェイルオーバーLIDを対象とした通信は、当該第1のノードに代わって当該第2のノードによって取り扱われ、その結果、当該第1のノードは途切れなく当該第2のノードにフェイルオーバーされる。
ある時点で、当該第1のノードは障害から回復することがある(710)、即ちオンラインに戻る。 そして当該フェイルオーバーLID(またはマルチキャストLID)は再び当該第1のノードと関連付けられ(712)、その結果、当該第1のノードは再び当該フェイルオーバーLIDを対象とした通信を取り扱うことができるようになる。 当該サブネットに属する当該第2のノードは、当該第1のノードが当該マルチキャスト・グループに再参加する前に、最初に当該マルチキャスト・グループから立去ることができる。 当該第2のノードはこのように、当該第1のノードが当該SMに対して参加要求を送って当該SMが当該フェイルオーバーLIDを当該第1のノードと関連付けるようにするより前に、当該SMに対して立去り要求を送ることができる。 障害からの回復はまた、当該第1のノードが当該第2のノードから状況のダンプを取ることも含んでおり、そのとき当該第2のノードは当該障害からの回復が完了するまですべての接続を凍結する。 当該第2のノードは更に、当該第2のノードに対する既存の接続が終了するまでは当該マルチキャスト・グループから立去らない場合もある。
このように、もともとは当該第1のノードと通信をしている第3のノードは、当該第2のノードに対してのフェイルオーバーが行われたことには気付かないでいることになる。 即ち、それ(第3のノード)は、当該フェイルオーバー・アドレスが当該第1のノードと当該第2のノードのどちらと関連付けられているのかを知る必要なしに、当該フェイルオーバー・アドレスに対する通信を続けることになる。 一般に、当該第3のノードと当該第1または第2のノードのどちらかとの間の通信は、たとえ1つのマルチキャスト・フェイルオーバー・アドレスがフェイルオーバーを実行するのに用いられたとしても、本質的にはユニキャストである。 当該第3のノードは、当該フェイルオーバー・アドレスが実際にはマルチキャスト・アドレスであるということを知らず、このように自分自身と当該フェイルオーバー・アドレスとの間の通信が本質的にはユニキャストであると信じさせられる。 即ち、当該第3のノードには、実際には1つのマルチキャスト・アドレスを使って通信が行われているときに、当該通信が正常に進行しているように見えるようにさせられる。
図8は、当該第1のノードから当該第2のノードへのフェイルオーバーを図式的に示したものである。 当該マルチキャスト・グループは、第1のノード804の障害前の状態を表すのに、マルチキャスト・グループ802Aとして示されている。 当該マルチキャスト・グループは、第1のノード804の障害後の状態を表すのに、マルチキャスト・グループ802Bとして示されており、矢印808で示されるように第1のノード804の障害後にグループ802Aはグループ802Bになる。 グループ802Aの第1のノード804は、グループ802Bの第1のノード804’になり、障害を表す。 第2のノード810はマルチキャスト・グループ802Bに参加したものとして表される。 第1のノード804’はマルチキャスト・グループ802Bにあるものとして表されるが、グループ802Bから既に立去っていることもある。 パケット806は従って、今度は第1のノード804’に加えて第2のノード810にも送られる。
[第1ノードのフェイルオーバーについてのスイッチ・マルチキャスト・ポートの第2ノード上のポートへの再マップ]
本発明の実施例ではまた、1つのスイッチ・マルチキャスト・ポートを他のノード上の1つのポートに再マップ(位置付け)することにより、ネットワーク・ノードのフェイルオーバーを達成することもまた可能である。 図9は、本発明のかかる1実施例に従った方法900を示している。 あるインフィニバンド・ネットワークに属する第1のノードが1つのマルチキャスト・グループに参加し、そこで1つのスイッチ上の1次マルチキャスト・ポートが当該第1のノード上の1つのポートにマップされる(902)。 当該第1のノードと当該スイッチとをその一部に含むサブネットのサブネット・マネージャ(SM)は、当該第1のノードによる参加要求に応答してこのマップを実行する。 当該第1のノードは、当該ネットワークの中の当該サブネット上の1つのホストに属する1つのチャネル・アダプタ(CA)である場合がある。
当該第1のノードはその後障害を起こし(904)、それは通常当該サブネットに属する他のノードによって検出される。 当該第1のノードは任意選択で当該マルチキャスト・グループから立去ることができ(906)、これは例えば、当該サブネットに属する第2のノードが当該第1のノードに代わって当該SMに対して立去り要求を送ることによって行われる。 そして当該スイッチ上の1次マルチキャスト・ポートは、当該第2のノード上の1つのポートに再マップされる(708)。 より具体的には、当該SMは当該スイッチ上の1次マルチキャスト・ポートを、それに対応する、任意選択で独占的な、当該第2のノードによる要求に応答して、当該第2のノード上の当該ポートに再マップする。 当該第2のノードもまた、当該インフィニバンド・ネットワークの中の当該サブネット上の1つのホストに属する1つのCAである場合がある。 当該第2のノードに属する当該ホストは、当該第1のノードのものと同じホストである場合がある。 当該マルチキャスト・アドレスに対する通信は、当該第1のノード上のポートに代わって、当該第2のノード上の当該ポートに方向付けられ、その結果、当該第1のノードは途切れなく当該第2のノードにフェイルオーバーする。
ある時点で、当該第1のノードは障害から回復することがある(910)、即ちオンラインに戻る。 その後当該スイッチ上の当該1次マルチキャスト・ポートは、当該第1のノード上の当該ポートにまた再マップされ(912)、その結果、当該第1のノードは再び当該マルチキャスト・アドレス、即ち1つのマルチキャストの宛先位置識別子(DLID)であることができるもの、を対象とした通信を取り扱うことが可能となる。 当該サブネットに属する当該第2のノードは、最初に当該マルチキャスト・グループから立去らなければならない場合があり、従って当該1次マルチキャスト・ポートが当該第1のノード上の当該ポートにまた再マップされるより前に、当該SMに対する立去り要求を送る場合がある。 障害からの回復はまた、当該第1のノードが当該第2のノードから状況のダンプを取ることも含んでおり、そのとき当該第2のノードは当該障害からの回復が完了するまですべての接続を凍結する。 当該第2のノードは更に、当該第2のノードに対する既存の接続が終了するまでは当該マルチキャスト・グループから立去らない場合もある。
図10は、当該第1のノードから当該第2のノードへのフェイルオーバーを図式的に示したものである。 当該サブネットの一部分が、第1のノード1004の障害前の状態を表すのに、一部分1002Aとして示されている。 第1のノード1004はポート1006を備えている。 スイッチ1008は1次マルチキャスト・ポート1010を備えている。 スイッチ1010に属する1次マルチキャスト・ポート1010は、線分1012で表されるように、第1のノード1004に属するポート1006にマップされる。 スイッチ1008に方向付けられたマルチキャスト通信は、こうしてポート1006に送られる。 当該サブネットの当該一部分は、第1のノード1004の障害後の状態を表すのに、一部分1002Bとして示されており、その結果、矢印1014で示されるように、第1のノード1004の障害後に一部分1002Aが一部分1002Bとなる。 第2のノード1016はポート1018を備えている。 スイッチ1008に属するマルチキャスト・ポート1030が今度は1次マルチキャスト・ポートとされ、線分1020で表されるように、第2のノード1016に属するポート1018にマップされる。 スイッチ1008に方向付けられたマルチキャスト通信は、今度はこうしてポート1018に代わりに送られる。
[スイッチ、およびデータグラムと接続サービスのタイプ]
インフィニバンド・ネットワークが採用するスイッチとは、通常、宛先位置識別子(DLID)が非ゼロであることのみをチェックし、そしてサブネット・マネージャ(SM)によってプログラムされたテーブルに基づいてデータ・パケットの経路を決めるものである。 各スイッチは、1つのマルチキャスト・データ・パケットが移動する必要があるすべてのポート、を規定するマルチキャスト・トラフィック、のための経路付け情報でもって構成されることが望ましい。 このことで、マルチキャスト・パケットがそれらの正しい宛先に経路付けされることが確実になる。
更に、インフィニバンド・ネットワークは、異なったタイプのデータグラムおよび接続サービスを採用することができる。 データグラムが使用されるのは、パケットが受信される順序が、それらが送信されるときの順序と比較して問題とならないような場合である。 データグラム・パケットは、それらが送信されたときの順序と比較して無秩序な順序で受信されることがある。 データグラムは未加工(Raw)である場合があるが、これは一般にそれらデータグラムが、イーサータイプ(Ethertype)、インターネット・プロトコル(IP)バージョン6、その他といった非インフィニバンド仕様に従ったものであるということを意味している。 逆に、接続サービスが使用されるのは、パケットが受信される順序が、それらが送信されるときの順序と比較して問題となるような場合である。 接続サービス・パケットは、それらが送信されたときと同じ順序で受信される。
データグラムも接続サービスも、信頼性があるかもしれないし、無いかもしれない。 信頼性が一般に関係するのは、パケットのために連続番号が維持されているかどうか、受信されたパケットのために肯定応答メッセージが送信されたかどうか、および/または、送信されたパケットが意図する受信者に確かに受信されたか確認する手段が実行されたかどうか、に対してである。 信頼性の無いデータグラムや信頼性の無い接続サービスは、これら確認手段を実行することは無く、一方、信頼性のあるデータグラムや接続サービスは、これら確認手段を必ず実行する。
信頼性の無い、そして未加工の(Raw)データグラムに関しては、第1のノードがマルチキャストの位置識別子(LID)をそのソースLID(SLID)として使用する。 第2のノードがフェイルオーバー・ノードである場合、第3のノードがそれらパケットを受信することができるが、それは、それら(パケット)がその(ノードの)ユニキャストのDLIDに送られるからであり、また当該パケットの当該SLIDがチェックされないからである。 当該第3のノードは、当該第1のノードのマルチキャストのLIDに対して応答することが期待される。 これが発生するために、当該クライアントにはマルチキャストLIDとの関連性が送られることがあり、それは当該クライアントによって記録される。 当該第3のノードには、信頼性の無いデータグラムのSIDRプロトコルの場合におけるマルチキャストのLIDが送られる場合があり、および/または、当該第2のノードが、受信したパケットから当該マルチキャストのLIDを拾う場合もある。 インフィニバンド仕様には、信頼性の無いデータグラム・モードのために規定された有効性チェックは存在しない。
もしも当該第3のノードが、当該SMによって保持されている経路記録の中から当該LIDを決定する場合は、当該第3のノードとの通信を開始するに先立って、当該LIDのための適切な値が当該経路記録の中に配置される場合がある。 当該第1のノード、または当該フェイルオーバーの第2のノードが、当該クライアントから応答パケットを受信するとき、当該パケットは1つのマルチキャストのDLIDを除いた1つの非マルチキャストのキュー対(QP)を持つ。 信頼性のあるデータグラムおよび接続モード転送の場合には、当該接続マネージャは通信用に用いるためにこれらLIDを交換する。 この段階では当該マルチキャストまたはフェイルオーバーのLIDを交換することができる。 このLIDは、いかなる有効性のチェックも無しに当該第2のノードによって記録されることになり、またあらゆる通信において1つのユニキャストLIDとして使用されることになる。
リンク・レベルおよびトランスポート・レベルの両チェックにおいてもまた確認が行われる。 当該リンク・レベルのチェックでは、当該クライアントのマルチキャストまたはユニキャストのいずれかのLIDの確認を行うだけである。 当該トランスポート・レベルのチェックにおいては、受信するQPが最初に有効かどうか確認されるが、これは送信者が当該QPをセットしたためである。最後に、当該QPが16進数で0xFFFFFFFでないことが確認され、それゆえ当該データ・パケットがマルチキャスト・パケットではないと考えられ、その結果、マルチキャストのグローバル・ルート・ヘッダ(GRH)の存在はチェックされない。
しかしながら、本発明の一実施例においては、当該インフィニバンド仕様が再定義され、その結果、これらトランスポート・レベルのチェックをさほど厳密に行わなずにノードのフェイルオーバーが提供される。 この実施例においては、ソースLID(SLID)は、いかなる転送方法についてもチェックされず、またマルチキャストの各宛先LID(DLID)は、いかなる転送方法においても受け入れられる。 このように当該インフィニバンド仕様は修正され、その結果SLIDおよびDLIDのチェックは以前ほど厳密には行われない。
本発明の他の実施例においては、当該QPに0xFFFFFFEといった特別な値をセットしてマルチキャスト・トラフィックであることを示すことによって、ノード・フェイルオーバーがもう一つの方法として提供される。 本発明のこの実施例は、信頼性の無い接続サービスについてのみ実施可能である。 当該特別なQPの値は、当該SMにより構成可能な場合があり、また当該SMにより維持することができる。
信頼性のあるデータグラム、および、信頼性のある接続サービスと信頼性の無い接続サービスに関しては、マルチキャストは、それが定義されていないという理由で許容されない。 しかしながら、当該2つの終端ノードが別のユニキャスト的様式で機能するのであれば、この制限は克服することができる。 サーバは各クライアントに対して1つのマルチキャストLIDを使ってパケットを送信する。 リモート・クライアントは、当該SLIDがマルチキャストLIDかどうかをチェックすることができる。 もしそうであれば、そのときは当該クライアントのホスト・チャネル・アダプタ(HCA)は、マルチキャストSLIDを受信するように修正される場合があり、あるいはまた当該SMを、1つのユニキャストLIDを当該マルチキャスト・グループに関連付けるように修正することが可能である。
即ち、この修正されなかったレシーバは、当該SLIDを、それが16進数で0xC000よりも上であるときに限り、マルチキャストであるとの判断を下す。 従って、当該SMは16進数で0xC000より下の値を当該マルチキャスト・グループに割り当てるように修正され、その結果当該レシーバは当該SLIDがマルチキャストであるとの判断は下さない。 当該クライアントは当該サーバに対して応答し、当該サーバは1つのDLIDを指定している1つのパケットを受信する。 当該サーバは、当該DLIDがマルチキャストLIDかどうかチェックすることができる。 もしマルチキャストLIDであるならその場合は、当該サーバのHCAは、マルチキャストDLIDを受信するように修正される場合があり、あるいはまた当該SMを、1つのユニキャストLIDを当該マルチキャスト・グループに関連付けるように修正することが可能である。
[従来技術に対する利点]
本発明の諸実施例は、従来技術に対する利点を可能にさせる。 インフィニバンド・ネットワークのこのマルチキャスト・アドレスとマルチキャスト・ポートの利点を生かして、ノード・フェイルオーバーが達成される。 たとえある所定のインフィニバンド・ファブリックがマルチキャストを認めない場合であっても、他のノードが当該グループに参加するより前に当該障害を起こしたノードが当該マルチキャスト・グループから立去り、その結果当該グループには同時に1つのノードしか存在しないようにする場合には、本発明の諸実施例を依然用いることが可能である。 障害を起こしたノードのフェイルオーバーには、当該障害を起こしたノードがそれまで通信していた相手である当該リモート・ノードを関与させることは必要ない。
このように、この取って代わったノードは、ユーザに気付かれずに、また通常当該リモート・ノードについての知識を伴わずに、当該障害を起こしたノードの持っていた責務を引き受ける。 いかなるホストであっても障害を起こしたホストの持っていた責務を受け継ぐことができることが望ましい。 本発明の諸実施例はまたすべてのインフィニバンド・トランスポート・タイプに適応可能でもある。 当該インフィニバンド仕様に対し権利を持たない拡張をすることは、本発明の諸実施例を実現するためには一般には不要であり、従って当該諸実施例は当該仕様による援助の範囲内で機能する。
更には、本発明のその他のいくつかの実施例においては、この発明によって指定されたインフィニバンド・ネットワークのフェイルオーバー・アドレスを利用することでノード・フェイルオーバーが達成される。 障害を起こしたノードのフェイルオーバーには、当該障害を起こしたノードがそれまで通信していた相手である当該リモート・ノードを関与させることは必要ない。 それどころか、この取って代わったノードは、ユーザに気付かれずに、また通常当該リモート・ノードについての知識を伴わずに、当該障害を起こしたノードの持っていた責務を引き受ける。 いかなるホストであっても障害を起こしたホストの持っていた責務を受け継ぐことができることが望ましい。 本発明の諸実施例はまたすべてのインフィニバンド・トランスポート・タイプに適応可能でもある。
[代替の実施例]
ここでは本発明の具体的な諸実施例が図解の目的のために述べられてきたのではあるが、本発明の趣旨および範囲から逸脱すること無しに各種の変更を行うことができるということが理解されよう。 例えば、本発明は大部分がインフィニバンド・ネットワークに関連して述べられているが、本発明は他のタイプのネットワークにも同様に適応可能である。 従って、本発明による保護の範囲は、特許請求の範囲およびその同等のものだけに限られる。
図1は、本発明の実施の形態に従った方法のフロー・チャートであり、発行される特許の最初のページに印刷されるよう勧められるものである。 図2は、それに関連して本発明の実施形態を実現することができる、インフィニバンド・ネットワークの図である。 図3は、それに関連して本発明の実施形態を実現することができる、インフィニバンドのシステム・エリア・ネットワーク(SAN)の一例の図である。 図4は、インフィニバンド・ネットワークの終端点の一例の通信インターフェースの図である。 図5は、いかにしてインフィニバンドのアドレッシングが起こるかを示すインフィニバンド・ネットワークの図である。 図6は、いかにしてインフィニバンドのアドレッシングが起こるかを示すインフィニバンド・ネットワークの図である。 図7は、本発明の実施形態でいかにして、マルチキャスト・グループのフェイルオーバー・アドレスおよび/またはマルチキャスト・グループのマルチキャスト・アドレスを伴って、他のノードに対するネットワーク・ノードのフェイルオーバーを達成することができるかを示した方法のフロー・チャートである。 図8は、図7の実施形態の遂行を図式的に示した図である。 図9は、本発明の実施形態でいかにして、スイッチ・マルチキャスト・ポートを他のノードの1つのポートに再マップすることによって、ネットワーク・ノードのフェイルオーバーを達成することができるかを示した方法のフロー・チャートである。 図10は、図9の実施形態の遂行を図式的に示した図である。
符号の説明
100 ・・・ 本発明の実施の一形態による方法
102 ・・・ ステップ(処理)
104 ・・・ ステップ(処理)
108 ・・・ ステップ(処理)
110 ・・・ ステップ(処理)
112 ・・・ ステップ(処理)
114 ・・・ ステップ(処理)
200 ・・・ インフィニバンド・ネットワーク・アーキテクチャ
202 ・・・ プロセッサ
204 ・・・ プロセッサ相互接続
206 ・・・ メモリ・コントローラ
208 ・・・ システム・メモリ
210 ・・・ ホスト・チャネル・アダプタ(HCA)
212 ・・・ インフィニバンド・リンク
214 ・・・ インフィニバンド・スイッチ
216 ・・・ インフィニバンド・リンク
218 ・・・ ターゲット・チャネル・アダプタ(TCA)
220 ・・・ ネットワーク・アダプタ
222 ・・・ ライン
224 ・・・ インフィニバンド・リンク
226 ・・・ ターゲット・チャネル・アダプタ(TCA)
228 ・・・ ターゲット周辺機器
230 ・・・ インフィニバンド・リンク
232 ・・・ ルータ
234 ・・・ ライン
300 ・・・ システム・エリア・ネットワーク(SAN)
302 ・・・ スイッチ
304 ・・・ スイッチ
306 ・・・ スイッチ
308 ・・・ ルータ
310 ・・・ スイッチ
312 ・・・ スイッチ
314 ・・・ スイッチ
316 ・・・ スイッチ
318 ・・・ ホスト・プラットフォーム
320 ・・・ ホスト・プラットフォーム
322 ・・・ ホスト・プラットフォーム
324 ・・・ RAIDサブシステム
326 ・・・ 管理コンソール
328 ・・・ I/O筐体
330 ・・・ I/O筐体
332 ・・・ ドライブ
334 ・・・ ストレージ・サブシステム
400 ・・・ 終端ノード
402 ・・・ プロセス
404 ・・・ プロセス
406 ・・・ キュー対(QP)
408 ・・・ キュー対(QP)
410 ・・・ キュー対(QP)
418 ・・・ チャネル・アダプタ(CA)
420 ・・・ 矢印
500 ・・・ インフィニバンド・ネットワーク
502 ・・・ 終端ノード
504(上) ・・・ プロセス
504(下) ・・・ スイッチ
506 ・・・ キュー対(QP)
508 ・・・ キュー対(QP)
510 ・・・ キュー対(QP)
512 ・・・ チャネル・アダプタ(CA)
514 ・・・ ポート
516 ・・・ ポート
518 ・・・ ポート
520 ・・・ 矢印
600 ・・・ インフィニバンド・ネットワーク
602 ・・・ サブネット
604(上) ・・・ 終端ノード
604(下) ・・・ サブネット
606 ・・・ 終端ノード
608 ・・・ 終端ノード
610 ・・・ スイッチ
612 ・・・ スイッチ
614 ・・・ 終端ノード
616 ・・・ 終端ノード
618 ・・・ 終端ノード
620 ・・・ 終端ノード
622 ・・・ スイッチ
624 ・・・ スイッチ
626 ・・・ ルータ
628 ・・・ ルータ
702 ・・・ 方法
704 ・・・ ステップ
706 ・・・ ステップ
708 ・・・ ステップ
710 ・・・ ステップ
712 ・・・ ステップ
802A ・・・ マルチキャスト・グループ
802B ・・・ マルチキャスト・グループ
804 ・・・ 第1のノード
804’ ・・・ 第1のノード
806 ・・・ パケット
808 ・・・ 矢印
810 ・・・ 第2のノード
900 ・・・ 方法
902 ・・・ ステップ
904 ・・・ ステップ
906 ・・・ ステップ
908 ・・・ ステップ
910 ・・・ ステップ
912 ・・・ ステップ
1002A ・・・ (サブネットの)一部分
1002B ・・・ (サブネットの)一部分
1004 ・・・ 第1のノード
1006 ・・・ ポート
1008 ・・・ スイッチ
1010 ・・・ スイッチ
1012 ・・・ 線分
1014 ・・・ 矢印
1016 ・・・ 第2のノード
1018 ・・・ ポート
1020 ・・・ 線分
1030 ・・・ マルチキャスト・ポート


Claims (10)

  1. 複数のノードの間を接続するネットワークに属する、ノードとして機能する装置において、フェイル・オーバーを制御する方法であって、
    ネットワークに属する第1のノード、マルチキャスト・アドレスを持ったマルチキャスト・グループに参加させるステップ(102)であって、前記参加が、本質的に、
    (1) フェイル・オーバー・アドレスを前記第1のノードと関連付けて、その結果、前記フェイル・オーバー・アドレスを前記マルチキャスト・アドレスとして保持する前記マルチキャスト・グループに、前記第1のノードを有効に参加させ、前記フェイル・オーバー・アドレスへの通信が前記ネットワークを経由して前記第1のノードへと向けられるようにすることと、
    (2) 前記マルチキャスト・アドレスを前記第1のノードと関連付けて、その結果、前記マルチキャスト・アドレスへの通信が前記ネットワークを経由して前記第1のノードへと向けられるようにすることと、
    (3) 前記ネットワークに属する1つのスイッチ上の1つのマルチキャスト・ポートを、前記第1のノード上の1つのポートにマップして、その結果、前記マルチキャスト・アドレスへの通信が、前記スイッチ上の前記マルチキャスト・ポートから前記第1のノード上の前記ポートへと向けられるようにすること、
    のいずれかである(104)ことを特徴とする、ステップと、
    前記第1のノードの障害の際(108)に、
    前記参加が、前記フェイル・オーバー・アドレスを前記第1のノードと関連付けるものである場合には、前記フェイル・オーバー・アドレスを第2のノードと関連付け、その結果、前記第2のノードを前記マルチキャスト・グループに有効に参加させ、かつ、前記フェイル・オーバー・アドレスに対する前記通信が前記第2のノードによって取り扱われるようにするステップ(114)と、
    前記参加が、前記マルチキャスト・アドレスを前記第1のノードと関連付けるものである場合には、前記ネットワークに属する前記第2のノードが前記マルチキャスト・グループに参加し、その結果、前記マルチキャスト・アドレスが前記第2のノードと関連付けられ、かつ、前記マルチキャスト・アドレスに対する前記通信が前記第2のノードによって取り扱われるようにするステップ(110)と、
    前記参加が、前記スイッチ上の前記マルチキャスト・ポートを前記第1のノード上の前記ポートにマップするものである場合には、前記スイッチ上の前記マルチキャスト・ポートを前記第2のノード上の1つのポートに再マップし、その結果、前記マルチキャスト・アドレスへの前記通信が前記第2のノード上の前記ポートへと向けられるようにするステップ(112)と、
    を有する方法。
  2. 前記ネットワークがインフィニバンド・ネットワークである、請求項1に記載の方法。
  3. 前記フェイル・オーバー・アドレスが、本質的に、
    (1) フェイル・オーバー位置識別子(LID)閾値よりも小さい値を持つフェイル・オーバー位置識別子(LID)であって、前記ネットワークがインフィニバンド・ネットワークを備える、位置識別子と、
    (2) 有効なLIDの範囲内にあるフェイル・オーバー位置識別子(LID)であって、前記ネットワークがインフィニバンド・ネットワークを備える、位置識別子と、
    (3) 前記ネットワークを経由するいかなる転送方法についても、ソースLIDとしてのチェックが行われることが無く、また、前記ネットワークを経由するいかなる転送方法についても、マルチキャスト宛先LID(DLID)としては受け入れられる、フェイル・オーバー位置識別子(LID)であって、前記ネットワークがインフィニバンド・ネットワークを備える、位置識別子、
    のいずれかである、
    請求項1に記載の方法。
  4. 前記参加が、前記マルチキャスト・アドレスまたは前記フェイル・オーバー・アドレスを前記第1のノードに関連付けるものである場合に、前記ネットワークに属する前記第2のノードが前記マルチキャスト・グループに参加するのに先立って、前記第2のノードが前記第1のノードの代わりに1つのサブネット・マネージャ(SM)に対して1つの立去り要求を送信することによって、前記第1のノードに前記マルチキャスト・グループから立去らせるステップ(706)、
    を更に有する、請求項1乃至3に記載の方法。
  5. 前記参加が、前記マルチキャスト・アドレスまたは前記フェイル・オーバー・アドレスを前記第1のノードに関連付けるものである場合に、前記第1のノードが障害から回復するに際して、前記フェイル・オーバー・アドレスを前記第1のノードに関連付け、その結果前記フェイル・オーバー・アドレスに対する通信が再び前記第1のノードによって取り扱われるようにするステップ(712)、
    を更に有する、請求項1乃至4に記載の方法。
  6. 前記参加が、前記マルチキャスト・アドレスまたは前記フェイル・オーバー・アドレスを前記第1のノードに関連付けるものである場合に、ネットワークの第1のノードによって、マルチキャスト・アドレスを持ったマルチキャスト・グループに参加するステップ前記ネットワークに属する前記第1のノードによって前記マルチキャスト・グループへ参加するステップが、前記第1のノードがサブネット・マネージャ(SM)に対して前記マルチキャスト・グループに参加することを要求するステップを有する、
    請求項1乃至5に記載の方法。
  7. 前記参加が、前記スイッチ上の前記マルチキャスト・ポートを前記第1のノード上の前記ポートにマップするものであり、前記第2のノードが、前記スイッチ上の前記マルチキャスト・ポートを自分自身に再マップすることをサブネット・マネージャ(SM)に対して要求することによって、前記スイッチ上の前記マルチキャスト・ポートが前記第2のノード上の前記ポートに再マップされる場合に、前記SMが、前記スイッチ上の前記マルチキャスト・ポートを前記第2のノード上の前記ポートに再マップすることを行う、
    請求項1または2に記載の方法。
  8. 前記参加が、前記スイッチ上の前記マルチキャスト・ポートを前記第1のノード上の前記ポートにマップするものである場合に、前記第1のノードが障害から回復するに際して、前記スイッチ上の前記マルチキャスト・ポートを前記第1のノード上の前記ポートに再マップし、その結果、前記マルチキャスト・アドレスに対する通信が再び前記第1のノード上の前記ポートへと向けられるようにするステップ(912)、
    を更に有する、請求項1乃至7に記載の方法。
  9. 複数のノードの間を接続するネットワークに属する、フェイル・オーバーを制御するノードとして機能する装置であって、
    前記ネットワークに属する第1のノードを、マルチキャスト・アドレスを持ったマルチキャスト・グループに参加させるための手段であって、前記参加が、本質的に、
    (1) フェイル・オーバー・アドレスを前記第1のノードと関連付けて、その結果、前記フェイル・オーバー・アドレスを前記マルチキャスト・アドレスとして保持する前記マルチキャスト・グループに、前記第1のノードを有効に参加させ、前記フェイル・オーバー・アドレスへの通信が前記ネットワークを経由して前記第1のノードへと向けられるようにすることと、
    (2) 前記マルチキャスト・アドレスを前記第1のノードと関連付けて、その結果、前記マルチキャスト・アドレスへの通信が前記ネットワークを経由して前記第1のノードへと向けられるようにすることと、
    (3) 前記ネットワークに属する1つのスイッチ上の1つのマルチキャスト・ポートを、前記第1のノード上の1つのポートにマップして、その結果、前記マルチキャスト・アドレスへの通信が、前記スイッチ上の前記マルチキャスト・ポートから前記第1のノード上の前記ポートへと向けられるようにすること、
    のいずれかであることを特徴とする、手段と、
    前記第1のノードの障害の際(108)に、
    前記参加が、前記フェイル・オーバー・アドレスを前記第1のノードと関連付けるものである場合には、前記フェイル・オーバー・アドレスを第2のノードと関連付け、その結果、前記第2のノードを前記マルチキャスト・グループに有効に参加させ、かつ、前記フェイル・オーバー・アドレスに対する前記通信が前記第2のノードによって取り扱われるようにするための手段と、
    前記参加が、前記マルチキャスト・アドレスを前記第1のノードと関連付けるものである場合には、前記ネットワークに属する前記第2のノードを前記マルチキャスト・グループに参加させ、その結果、前記マルチキャスト・アドレスが前記第2のノードと関連付けられ、かつ、前記マルチキャスト・アドレスに対する前記通信が前記第2のノードによって取り扱われるようにするための手段と、
    前記参加が、前記スイッチ上の前記マルチキャスト・ポートを前記第1のノード上の前記ポートにマップするものである場合には、前記スイッチ上の前記マルチキャスト・ポートを前記第2のノード上の1つのポートに再マップし、その結果、前記マルチキャスト・アドレスへの前記通信が前記第2のノード上の前記ポートへと向けられるようにするための手段と、
    を備える装置。
  10. 複数のノードの間を接続するネットワークに属する、フェイル・オーバーを制御するノードとして機能する装置が有するコンピュータ可読の媒体に含まれるコンピュータ・プログラムであって、当該装置に、
    前記ネットワークに属する第1のノードによって、マルチキャスト・アドレスを持ったマルチキャスト・グループに参加するステップ(102)であって、前記参加が、本質的に、
    (1) フェイル・オーバー・アドレスを前記第1のノードと関連付けて、その結果、前記フェイル・オーバー・アドレスを前記マルチキャスト・アドレスとして保持する前記マルチキャスト・グループに、前記第1のノードを有効に参加させ、前記フェイル・オーバー・アドレスへの通信が前記ネットワークを経由して前記第1のノードへと向けられるようにすることと、
    (2) 前記マルチキャスト・アドレスを前記第1のノードと関連付けて、その結果、前記マルチキャスト・アドレスへの通信が前記ネットワークを経由して前記第1のノードへと向けられるようにすることと、
    (3) 前記ネットワークに属する1つのスイッチ上の1つのマルチキャスト・ポートを、前記第1のノード上の1つのポートにマップして、その結果、前記マルチキャスト・アドレスへの通信が、前記スイッチ上の前記マルチキャスト・ポートから前記第1のノード上の前記ポートへと向けられるようにすること、
    のいずれかである(104)ことを特徴とする、ステップと、
    前記第1のノードの障害の際(108)に、
    前記参加が、前記フェイル・オーバー・アドレスを前記第1のノードと関連付けるものである場合には、前記フェイル・オーバー・アドレスを第2のノードと関連付け、その結果、前記第2のノードを前記マルチキャスト・グループに有効に参加させ、かつ、前記フェイル・オーバー・アドレスに対する前記通信が前記第2のノードによって取り扱われるようにするステップ(114)と、
    前記参加が、前記マルチキャスト・アドレスを前記第1のノードと関連付けるものである場合には、前記ネットワークに属する前記第2のノードが前記マルチキャスト・グループに参加し、その結果、前記マルチキャスト・アドレスが前記第2のノードと関連付けられ、かつ、前記マルチキャスト・アドレスに対する前記通信が前記第2のノードによって取り扱われるようにするステップ(110)と、
    前記参加が、前記スイッチ上の前記マルチキャスト・ポートを前記第1のノード上の前記ポートにマップするものである場合には、前記スイッチ上の前記マルチキャスト・ポートを前記第2のノード上の1つのポートに再マップし、その結果、前記マルチキャスト・アドレスへの前記通信が前記第2のノード上の前記ポートへと向けられるようにするステップ(112)と、
    を実行させるためのコンピュータ・プログラム。
JP2003518112A 2001-07-27 2002-07-26 フェイルオーバー・アドレスまたはマルチキャスト・アドレスを使用したネットワーク・ノードのフェイルオーバー Expired - Lifetime JP4038176B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/917,464 US6944786B2 (en) 2001-07-27 2001-07-27 Network node failover using multicast address or port
PCT/US2002/023633 WO2003013059A1 (en) 2001-07-27 2002-07-26 Network node failover using failover or multicast address

Publications (2)

Publication Number Publication Date
JP2004537918A JP2004537918A (ja) 2004-12-16
JP4038176B2 true JP4038176B2 (ja) 2008-01-23

Family

ID=25438828

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003518112A Expired - Lifetime JP4038176B2 (ja) 2001-07-27 2002-07-26 フェイルオーバー・アドレスまたはマルチキャスト・アドレスを使用したネットワーク・ノードのフェイルオーバー

Country Status (9)

Country Link
US (1) US6944786B2 (ja)
EP (1) EP1419612B1 (ja)
JP (1) JP4038176B2 (ja)
KR (1) KR100537583B1 (ja)
CN (1) CN100486159C (ja)
AT (1) ATE445943T1 (ja)
CA (1) CA2451101C (ja)
DE (1) DE60234037D1 (ja)
WO (1) WO2003013059A1 (ja)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7051115B2 (en) * 2001-04-19 2006-05-23 Lenovo (Singapore) Pte. Ltd. Method and apparatus for providing a single system image in a clustered environment
US6904545B1 (en) * 2001-07-11 2005-06-07 Advanced Micro Devices, Inc. Fault tolerant computing node having multiple host channel adapters
US7016299B2 (en) * 2001-07-27 2006-03-21 International Business Machines Corporation Network node failover using path rerouting by manager component or switch port remapping
US8935333B2 (en) * 2001-08-09 2015-01-13 International Business Machines Corporation Implementing multicast on a system area network channel adapter
US7177318B2 (en) * 2001-08-14 2007-02-13 Freescale Semiconductor, Inc. Method and apparatus for managing multicast data on an IP subnet
US6963932B2 (en) * 2002-01-30 2005-11-08 Intel Corporation Intermediate driver having a fail-over function for a virtual network interface card in a system utilizing Infiniband architecture
US7471645B2 (en) * 2002-10-25 2008-12-30 Hughes Network Systems, Llc Method and system for multicast in a broadband satellite system
US8122120B1 (en) * 2002-12-16 2012-02-21 Unisys Corporation Failover and failback using a universal multi-path driver for storage devices
US7137040B2 (en) * 2003-02-12 2006-11-14 International Business Machines Corporation Scalable method of continuous monitoring the remotely accessible resources against the node failures for very large clusters
US7493409B2 (en) * 2003-04-10 2009-02-17 International Business Machines Corporation Apparatus, system and method for implementing a generalized queue pair in a system area network
WO2005105889A1 (en) 2004-04-22 2005-11-10 Dow Global Technologies, Inc. Catalysts and methods for polymerizing macrocyclic oligomers
US7493424B1 (en) 2004-04-30 2009-02-17 Netapp, Inc. Network storage system with shared software stack for LDMA and RDMA
US7962562B1 (en) 2004-04-30 2011-06-14 Netapp, Inc. Multicasting message in a network storage system to local NVRAM and remote cluster partner
US7895286B1 (en) 2004-04-30 2011-02-22 Netapp, Inc. Network storage system with NVRAM and cluster interconnect adapter implemented in a single circuit module
US7769913B1 (en) * 2004-04-30 2010-08-03 Netapp, Inc. Method and apparatus for assigning a local identifier to a cluster interconnect port in a network storage system
US20060059269A1 (en) * 2004-09-13 2006-03-16 Chien Chen Transparent recovery of switch device
US8086755B2 (en) * 2004-11-29 2011-12-27 Egenera, Inc. Distributed multicast system and method in a network
JP4732823B2 (ja) * 2005-07-26 2011-07-27 株式会社日立産機システム モジュール間通信装置
JP4729117B2 (ja) * 2007-03-14 2011-07-20 富士通株式会社 エッジスイッチ及びフォワーディングテーブルの書き換え方法
US7904758B2 (en) * 2007-10-09 2011-03-08 Intel Corporation System, method and apparatus for tracing source of transmission error
US7714217B2 (en) * 2007-12-21 2010-05-11 Innovatech, Llc Marked precoated strings and method of manufacturing same
WO2010000172A1 (zh) * 2008-06-30 2010-01-07 华为技术有限公司 组播保护方法、系统、接收端设备和组播源设备
US8068482B2 (en) 2008-11-13 2011-11-29 Qlogic, Corporation Method and system for network switch element
US8094569B2 (en) * 2008-12-05 2012-01-10 Cisco Technology, Inc. Failover and failback of communication between a router and a network switch
US20110103391A1 (en) * 2009-10-30 2011-05-05 Smooth-Stone, Inc. C/O Barry Evans System and method for high-performance, low-power data center interconnect fabric
US8213315B2 (en) * 2009-11-19 2012-07-03 Mellanox Technologies Ltd. Dynamically-connected transport service
US9712340B2 (en) 2011-02-28 2017-07-18 Red Hat, Inc. Using a shared data store for peer discovery
US9641462B2 (en) * 2013-04-23 2017-05-02 Cisco Technology, Inc. Accelerating network convergence for layer 3 roams in a next generation network closet campus
CN104580010A (zh) * 2013-10-24 2015-04-29 华为技术有限公司 通信队列处理方法、装置及系统
CN105683937B (zh) 2013-11-01 2018-07-10 慧与发展有限责任合伙企业 在软件定义网络拓扑结构中的协议无关存储访问
US20170034008A1 (en) * 2014-04-29 2017-02-02 Hewlett Packard Enterprise Development Lp Network management using port announcements
US9973393B2 (en) * 2014-07-01 2018-05-15 International Business Machines Corporation Utilizing a controller for preprogramming a network before removal of a network device
WO2016069021A1 (en) 2014-10-31 2016-05-06 Hewlett Packard Enterprise Development Lp Group zoning and access control over a network
US10594565B2 (en) 2014-12-19 2020-03-17 Hewlett Packard Enterprise Development Lp Multicast advertisement message for a network switch in a storage area network
US10355992B2 (en) 2016-01-27 2019-07-16 Oracle International Corporation System and method for supporting router SMA abstractions for SMP connectivity checks across virtual router ports in a high performance computing environment
US10171353B2 (en) * 2016-03-04 2019-01-01 Oracle International Corporation System and method for supporting dual-port virtual router in a high performance computing environment
US10693815B2 (en) * 2017-03-24 2020-06-23 Oracle International Corporation System and method to use all incoming multicast packets as a basis for GUID to LID cache contents in a high performance computing environment
US10841199B2 (en) 2017-03-24 2020-11-17 Oracle International Corporation System and method for optimized path record handling in homogenous fabrics without host stack cooperation in a high performance computing environment
US10868685B2 (en) 2017-03-24 2020-12-15 Oracle International Corporation System and method to provide explicit multicast local identifier assignment for per-partition default multicast local identifiers defined as subnet manager policy input in a high performance computing environment
US10673644B2 (en) 2017-03-24 2020-06-02 Oracle International Corporation System and method to provide homogeneous fabric attributes to reduce the need for SA access in a high performance computing environment
EP3656760A1 (de) 2018-11-21 2020-05-27 Evonik Operations GmbH Lagerstabile form von 3-methylthiopropionaldehyd
CN110097660B (zh) * 2019-04-02 2022-04-26 深圳市云伽智能技术有限公司 诊断仪消息推送方法、装置、计算机设备及存储介质
US11411911B2 (en) * 2020-10-26 2022-08-09 Mellanox Technologies, Ltd. Routing across multiple subnetworks using address mapping
KR102386978B1 (ko) * 2020-11-05 2022-04-18 (주)한드림넷 이더넷 경로 페일오버 장치 및 방법

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6108300A (en) 1997-05-02 2000-08-22 Cisco Technology, Inc Method and apparatus for transparently providing a failover network device
US6185695B1 (en) 1998-04-09 2001-02-06 Sun Microsystems, Inc. Method and apparatus for transparent server failover for highly available objects
US6078957A (en) * 1998-11-20 2000-06-20 Network Alchemy, Inc. Method and apparatus for a TCP/IP load balancing and failover process in an internet protocol (IP) network clustering system
US6581166B1 (en) * 1999-03-02 2003-06-17 The Foxboro Company Network fault detection and recovery
US7000015B2 (en) * 2000-04-24 2006-02-14 Microsoft Corporation System and methods for providing physical location information and a location method used in discovering the physical location information to an application on a computing device
US6782422B1 (en) * 2000-04-24 2004-08-24 Microsoft Corporation Systems and methods for resynchronization and notification in response to network media events
US6760861B2 (en) * 2000-09-29 2004-07-06 Zeronines Technology, Inc. System, method and apparatus for data processing and storage to provide continuous operations independent of device failure or disaster
US7146432B2 (en) * 2001-01-17 2006-12-05 International Business Machines Corporation Methods, systems and computer program products for providing failure recovery of network secure communications in a cluster computing environment
US7174390B2 (en) * 2001-04-20 2007-02-06 Egenera, Inc. Address resolution protocol system and method in a virtual network
US20020198927A1 (en) * 2001-06-21 2002-12-26 International Business Machines Corporation Apparatus and method for routing internet protocol frames over a system area network
US7133405B2 (en) * 2001-08-30 2006-11-07 International Business Machines Corporation IP datagram over multiple queue pairs

Also Published As

Publication number Publication date
ATE445943T1 (de) 2009-10-15
WO2003013059A1 (en) 2003-02-13
US6944786B2 (en) 2005-09-13
JP2004537918A (ja) 2004-12-16
CA2451101C (en) 2007-06-12
DE60234037D1 (de) 2009-11-26
KR20040012978A (ko) 2004-02-11
CN1528069A (zh) 2004-09-08
CA2451101A1 (en) 2003-02-13
EP1419612A4 (en) 2009-03-25
KR100537583B1 (ko) 2005-12-20
EP1419612B1 (en) 2009-10-14
US20030023896A1 (en) 2003-01-30
CN100486159C (zh) 2009-05-06
EP1419612A1 (en) 2004-05-19

Similar Documents

Publication Publication Date Title
JP4038176B2 (ja) フェイルオーバー・アドレスまたはマルチキャスト・アドレスを使用したネットワーク・ノードのフェイルオーバー
US7016299B2 (en) Network node failover using path rerouting by manager component or switch port remapping
US8086755B2 (en) Distributed multicast system and method in a network
US8477779B1 (en) Method and system for reliable multicast
US9385941B2 (en) Data communication system and method for preventing packet proliferation in a multi-device link aggregation network
US6108701A (en) Soft switch extension for internet protocol applications
TWI383616B (zh) 指派複數個媒體存取控制給複數個處理器的方法及系統
JP4881564B2 (ja) データ転送装置、マルチキャストシステム、およびプログラム
US7532622B2 (en) Methods, devices and software for merging multicast groups in a packet switched network
US8462767B2 (en) Internet protocol compliant private branch electronic exchange and a method for redundantly configuring terminal interfaces
US20060050643A1 (en) Router for multicast redundant routing and system for multicast redundancy
US7974192B2 (en) Multicast switching in a distributed communication system
US20020049859A1 (en) Clustered computer system and a method of forming and controlling the clustered computer system
US20040008694A1 (en) Method for implementing router interface backup with virtual router redundancy protocol
US7194540B2 (en) Mechanism for allowing multiple entities on the same host to handle messages of same service class in a cluster
WO2000072421A1 (en) Reliable multi-unicast
KR20080055805A (ko) 라우팅된 네트워크에서의 내고장성 통신
JPH09259096A (ja) ネットワーク高信頼化方式及びシステム
WO2012127644A1 (ja) 通信ノード装置システム、装置、及び方法
JP2005244672A (ja) ネットワークの障害監視処理システム及び方法
JPH11313101A (ja) 二重化lanシステムのコネクション再接続の高速化方法及び方式
JP2019161257A (ja) パケット転送装置、パケット転送システム、パケット転送プログラムおよびパケット転送方法
JPH10257036A (ja) 二重化伝送装置及び二重化伝送方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060808

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20061108

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20061115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070206

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070410

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070731

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070814

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071030

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071102

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4038176

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101109

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101109

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111109

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111109

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121109

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121109

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131109

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term