JP2005527898A - チャネル・アダプタ障害に対する冗長性を提供する方法 - Google Patents

チャネル・アダプタ障害に対する冗長性を提供する方法 Download PDF

Info

Publication number
JP2005527898A
JP2005527898A JP2003585378A JP2003585378A JP2005527898A JP 2005527898 A JP2005527898 A JP 2005527898A JP 2003585378 A JP2003585378 A JP 2003585378A JP 2003585378 A JP2003585378 A JP 2003585378A JP 2005527898 A JP2005527898 A JP 2005527898A
Authority
JP
Japan
Prior art keywords
channel adapter
cache
ports
control information
host channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003585378A
Other languages
English (en)
Inventor
シュリップフ、トーマス
コンラート バイヤー、ゲルト
エックハルト、ヴォルフガング
ヘルムス、マルクス
メルグナー、ユルゲン
ライシュ、クリストフ
トイリッヒ、クラウス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2005527898A publication Critical patent/JP2005527898A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/22Alternate routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/58Association of routers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/35Switches specially adapted for specific applications
    • H04L49/356Switches specially adapted for specific applications for storage area networks
    • H04L49/358Infiniband Switches
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/55Prevention, detection or correction of errors
    • H04L49/557Error correction, e.g. fault recovery or fault tolerance

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

【課題】Infinibandファブリックに接続する任意のノードの信頼性を改善する方法を提供すること。
【解決手段】この方法は、
第1および第2の個数のポートを有する、第1および第2の物理チャネル・アダプタを提供するステップと、
第1および第2の物理チャネル・アダプタを、第1および第2のポートのいくつかを有する、1つの論理チャネル・アダプタとして登録するためのプログラム手段を提供するステップと、
第1および第2のチャネル・アダプタ用の第1および第2の制御情報を格納するため第1および第2のキャッシュ手段を提供するステップと、
第1および第2の制御情報を格納するためのシステム・メモリ手段を提供するステップと、
第1のチャネル・アダプタの障害の際に、第1の制御情報をシステム・メモリから第2のキャッシュ手段にコピーし、第1の個数のポートから第2の個数のポートへの自動パス・マイグレーションを開始する手段を提供するステップと
を含む。

Description

本発明は、一般にはデジタル・ネットワーク通信に関し、詳細には、Infinibandのサブネットまたはファブリックに接続するコンピュータ・システムまたはその他のノードの信頼性を改善することに関する。
コンピュータ業界は、高速で、パケット化された、シリアルの入出力(I/O)相互接続アーキテクチャの方向に向かっており、そうしたアーキテクチャでは、コンピューティング・ホストおよび周辺機器は、スイッチング・ファブリック(switching fabric)と一般に呼ばれるスイッチング・ネットワークによってリンクされる。このタイプのアーキテクチャがいくつか提案され、最終的にInfiniband(IB)アーキテクチャがもたらされたが、これは(インテル(Intel:Intel Corporationの米国その他の国における商標)、サン・マイクロシステムズ(Sun Microsystems: すべてのJava関連の商標およびロゴはSunMicrosystems, Inc.の米国およびその他の国における商標)、ヒューレット・パッカード(Hewlett Packard)、IBM,コンパック(Compaq)、デル(Dell)、およびマイクロソフト(Microsoft:"Microsoft" "Window"ロゴはMicrosoft Corporationの米国その他の国における商標)を含む)この業界の主要企業のグループが主導するコンソーシアムによって推進されてきた。IBアーキテクチャは、http://www.infinibandta.org/でInfinibandトレード・アソシエーション(InfiniBandTrade Association)から入手可能な、「Infinibandアーキテクチャ仕様(InfiniBand ArchitectureSpecification)」、リリース1.0.aに詳細に記述されており、これを参照により本明細書に組み込む。
Infiniband技術は、ホスト・チャネル・アダプタ(Host ChannelAdapter、HCA)を、他のHCAまたはターゲット・チャネル・アダプタ(Target Channel Adapter、TCA)に接続することによって動作する。HCAはサーバのCPUおよびメモリ付近に置かれる傾向があり、TCAはシステムのディスク・ストレージおよび他の周辺機器付近に置かれる傾向がある。スイッチまたはルータが、HCAとTCAとの間に位置して、データ・パケットを、そのデータ・パケット自体に含まれる情報に基づいて、正しいTCAの宛先に振り向けることも可能である。
HCAとTCA(または他のHCA)の間の接続は、Infinibandポイント・ツー・ポイント・リンク、またはスイッチもしくはルータであり、これによってそれぞれ、一様なInfinibandのサブネット環境またはファブリック環境を作成できるようになる。このスイッチの重要な点の1つは、これによって情報(またはデータ)のパケットを、サービス・レベル(service level、SL)や宛先識別子(destination identifier、DLID/DGID)などの変数に基づいて管理できるようになることである。
Infinibandアーキテクチャは、従来のメモリ・マップ方式I/Oインターフェース・バスではなく、シリアルのスイッチド・ファブリック(switched fabric)というアプローチで開発されている。このスイッチされるという性質(switched nature)によって、Infinibandアーキテクチャの低レイテンシで高帯域幅という特徴が可能となっている。クラスタ化されたシステムおよびネットワークでは、耐障害性のある相互接続を可能にする接続性の標準が要求される。
この要求は、先進的な障害検出/修正(fault detection andcorrection)機構を組み込んだInfinibandアーキテクチャによって満たされる。Infiniband準拠製品の1つの例が、ホストのPCI−XバスとInfinibandネットワークの間の接続性を提供する、IBM PCI−X/Infinibandホスト・チャネル・アダプタである。デュアルInfinibandポートにより、自動パス・マイグレーションを、また単一または複数のサブネット接続を単一のHCA装置でサポートする機能が提供されている。
自動パス・マイグレーション(Automatic Path Migration、APM)は、ホスト・チャネル・アダプタ(HCA)またはターゲット・チャネル・アダプタ(TCA)のポート障害、あるいはサブネットまたはファブリックの障害の場合に処理を続行する手段である。言い換えれば、APMは、HCAまたはTCAのポート障害、あるいはサブネットまたはファブリックにおけるリンク、スイッチまたはルータの障害の際に、冗長性機構を提供する。しかし、Infinibandは、HCAの1つまたは複数のポートだけが障害を起こした際の冗長性機構を定義しているに過ぎず、HCA全体が障害を起こした際の定義はしていない。
「Infinibandアーキテクチャ仕様(InfiniBandArchitecture Specification)」、リリース1.0.a、Infinibandトレード・アソシエーション(InfiniBand TradeAssociation)、www.infinibandta.org
本発明は、ホスト・チャネル・アダプタ(HCA)やターゲット・チャネル・アダプタ(TCA)などのチャネル・アダプタ(CA)に対し、完全なチャネル・アダプタ障害の際に、冗長性機構を提供する。冗長性機構がInfinibandアーキテクチャにシームレスに適合し、Infinibandアーキテクチャで指定される障害検出/修正方法を利用している点が、本発明の特定の利点である。
本発明の原理に従って設計された装置が、Infinibandアーキテクチャに完全に準拠することが可能でありながら、なお完全なチャネル・アダプタ障害に対する冗長性機構を提供することが、本発明の特定の利点である。
本発明の好ましい実施形態によれば、少なくとも2つの物理ホスト・チャネル・アダプタが提供される。この2つの物理ホスト・チャネル・アダプタが、Infinibandアーキテクチャから見ると、1つの論理ホスト・チャネル・アダプタとして登録される。両方の物理ホスト・チャネル・アダプタとも、専用のキャッシュ手段を備えており、これらは、キュー・ペア制御ブロック(Queue Pair Control Block、QPCB)の点からは、システム・メモリと協力して、キュー・ペア(Queue Pair、QP)制御情報を保存するものである。物理ホスト・チャネル・アダプタの一方の完全な障害の際は、それぞれのQPCBのコピーが残りのまだ動作している物理ホスト・チャネル・アダプタに提供される。
本発明のさらに好ましい実施形態によれば、ライト・スルー・キャッシュが使用される。この場合、システム・メモリに格納されるQPCBは、各物理ホスト・チャネル・アダプタの専用キャッシュの厳密なコピーである。
本発明のさらに好ましい実施形態によれば、ホスト・チャネル・アダプタのためにライト・バック・キャッシュが使用される。この場合、システム・メモリは、複数のある時点でキャッシュと同期がとられるのであり、必ずしも所与の任意の時点でキャッシュの実際の内容を反映するわけではない。
物理ホスト・チャネル・アダプタの完全な障害の際には、障害の起きた物理ホスト・チャネル・アダプタに属するキャッシュの内容も失われる。QPCBのシステム・メモリ・コピーが、残りの物理ホスト・チャネル・アダプタのキャッシュに提供される。
このコピーには古くなった(stale)データが含まれている可能性がある。通信の再同期をとり、QPCB情報を最新状態にするには、Infinibandアーキテクチャが提供する障害検出/修正機構が使用される。
ここに記載した好ましい実施形態では、ホスト・チャネル・アダプタ(HCA)について述べているが、本発明は、InfinibandアーキテクチャによるHCAおよびTCAを含む、チャネル・アダプタ(CA)一般を包含するものである。
以下では、次の図面を参照することによって、本発明の好ましい実施形態について詳細に説明する。
図1に、キャッシュ2およびキャッシュ・ディレクトリ3を含むホスト・チャネル・アダプタ1を有するコンピュータ・システムを示す。さらに、このコンピュータ・システムは、システム・メモリ4を有する。
システム・メモリ4、キャッシュ・ディレクトリ3、およびキャッシュ2により、キュー・ペア制御ブロック(QPCB)用のアドレス空間が仮想化される。複数のホスト・チャネル・アダプタ1が存在する際には、異なるホスト・チャネル・アダプタの間でキュー・ペア(QP)番号は互いに素(disjoint)でなければならない。
すべてのキュー・ペア制御ブロックはシステム・メモリ4内にあり、使用される(もう使用されない)ときにホスト・チャネル・アダプタのキャッシュ2にロード(アンロード)される。ホスト・チャネル・アダプタ1に障害が起きても、物理的に異なるホスト・チャネル・アダプタからこのデータにアクセスすることは妨げられない。
図2は、本発明の好ましい実施形態の、冗長性機構を示す構成図である。図2のコンピュータ・システムおよび図1のコンピュータ・システムの同じ要素は、同じ参照番号によって示されている。
このコンピュータ・システムは、1つまたは複数のポート6を有する物理ホスト・チャネル・アダプタ1および1つまたは複数のポート8を有する物理ホスト・チャネル・アダプタ7を備えている。ポート6および8は、Infinibandのサブネットまたはファブリック9に接続されている。
2つの物理ホスト・チャネル・アダプタ1および7は、Infinibandアーキテクチャに従って、1つの単一のホスト・チャネル・アダプタとして認識される。これにより、論理ホスト・チャネル・アダプタ10が構成される。論理ホスト・チャネル・アダプタ10は、物理ホスト・チャネル・アダプタ1および7のポート6および8を備えている。
物理ホスト・チャネル・アダプタ1はキャッシュ2を備え、物理ホスト・チャネル・アダプタ7はキャッシュ11を備えている。キャッシュ2および11は両方ともライト・スルー・キャッシュとして編成されている。
さらに、コンピュータ・システムは、物理ホスト・チャネル・アダプタ1および7用のキュー・ペア制御ブロック・データの格納用に、システム・メモリ4を備えている。異なる物理ホスト・チャネル・アダプタ1および7のキュー・ペア番号は、互いに素となっている。
キュー・ペア番号についてそれ以上の制限はない。説明の便宜のため、以下では、物理ホスト・チャネル・アダプタ1は、QPCB_2からQPCB_mまでのキュー・ペア制御ブロックのブロック12をもち、物理ホスト・チャネル・アダプタ7は、QPCB_m+1からQPCB_nまでのキュー・ペア制御ブロックのブロック13をもつものと仮定する。QPCB_0およびQPCB_1は、サブネット管理の目的で使用され、ここではこれ以上考察を行わない。
キャッシュ2および11はライト・スルー・キャッシュであるため、システム・メモリ4内のQPCBデータは、キャッシュ2および11内のデータと同一である。
図3に、図2の物理ホスト・チャネル・アダプタ1の完全な障害に対処するための冗長性機構を示す。
まず、ポート6を含む物理ホスト・チャネル・アダプタ1の完全なハードウェア障害が発生する。このハードウェア障害により、Infinibandアーキテクチャによって定義される自動パス・マイグレーションが呼び出される。こうして、物理ホスト・チャネル・アダプタ1のポート6に関係する1つまたは複数の通信パスが、残りの物理ホスト・チャネル・アダプタ7のポート8へとマイグレートされる。
この手続きは、Infinibandが提供する自動パス・マイグレーション(APM)機構を全面的に利用している。これは、Infinibandアーキテクチャから見ると、ホスト・チャネル・アダプタ1および7は2つの別々の(物理)ホスト・チャネル・アダプタとしてではなく、ポート6および8を提供する単一の(論理)ホスト・チャネル・アダプタ10としてのみ存在するためである。
ブロック12内のQPCBのコピーが、必要に応じてキャッシュ11内に作成される。ブロック12は、キャッシュ2の内容の厳密なコピーを含んでいるため、これ以上の回復機構は必要ない。
図4に、ライト・バック・キャッシュの場合の状況を示す。ライト・スルー・キャッシュではなく、ライト・バック・キャッシュ14が使用される場合、システム・メモリ4に格納されたQPCBは、必ずしもキャッシュ14内のQPCBデータの最新の状態を反映しない。ライト・バック・キャッシュを使用する際に、Infinibandアーキテクチャの障害検出/修正方法をさらに呼び出す必要があるのはこの理由からである。
図5に、物理ホスト・チャネル・アダプタの一方がフェイル・オーバーする前の状況を示す。
送信側(the sender)では、未処理のパケット・シーケンス番号(packetsequence number、PSN)のシーケンス15が、システム・メモリ4に格納されている。シーケンス番号Smをもつ、未処理のPSNの1つが、システム・メモリ4に格納されている情報によれば、次に送信すべきパケットである。
さらに、未処理のPSNのシーケンス16が、ライト・バック・キャッシュであるローカル・キャッシュ・メモリに格納されている。このシーケンス16は、送信されたパケットの、最新状態のシーケンスを表している。したがって、シーケンス番号Snは、このシーケンス16内において最新状態である。
受信側(the receiver)には、PSNのシーケンス17がある。受信側で予想される次のパケットは、シーケンス番号Rnをもつパケットである。物理ホスト・チャネル・アダプタの一方がフェイル・オーバーした後も、シーケンス15は、システム・メモリ4に格納されているので、影響を受けずに済んでいる。
シーケンス15のコピーが、残りのまだ動作している物理ホスト・チャネル・アダプタに提供される。こうして、障害の起きたホスト・チャネル・アダプタのキャッシュのシーケンス16は、残りのまだ動作している物理ホスト・チャネル・アダプタのキャッシュ内のシーケンス15によって置き換えられる。
ホスト・チャネル・アダプタから送られる次のパケットが、フェイル・オーバー前に送られた、古くなった(stale)シーケンス番号Smをもつパケットであるのはこの理由からである。受信側は、それを送ったホスト・チャネル・アダプタに受領通知(acknowledgement、ACK)を返し、パケットを廃棄する。
それに応答して、物理ホスト・チャネル・アダプタは、シーケンス15内で識別される次のパケットを送る。こうして、シーケンス15が処理されて行き、シーケンス16のフェイル・オーバー前の元の状態に達するまでそれが続く。この状態に達した後は、通常のシステム動作が正常に続行される。
図6に、シーケンス16の次のシーケンス番号Snをもつパケットがホスト・チャネル・アダプタから送られた状態を示す。このパケットを送った後で、ホスト・チャネル・アダプタのハードウェア障害が発生する。それでもまだ、受信側は、シーケンス番号Rn=Snをもつ、予想されるパケットを受け取っている。
それに応答して、受信側は、シーケンス番号Snをもつパケットを受け取ったことに対する受領通知を、論理ホスト・チャネル・アダプタに送る。論理ホスト・チャネル・アダプタ、すなわち残りのまだ動作している物理ホスト・チャネル・アダプタは、この受領通知をゴースト受領通知(ghost acknowledgement)と解釈し、無視する。すると、送信側は、シーケンス15のシーケンス番号Smをもつパケットを、図5に示したシナリオ通りに送る。
図7に、ホスト・チャネル・アダプタが受信側として働くというシナリオを示す。PSNのシーケンス18がシステム・メモリに格納されており、最新状態のシーケンス19がキャッシュ・メモリに格納されている。さらに、送信側が送るべき未処理のPSNのシーケンス20がある。これが、フェイル・オーバー前の状況である。
フェイル・オーバーの後、シーケンス19はシーケンス18で置き換えられる。すなわち、シーケンス18のコピーが、システム・メモリから、論理ホスト・チャネル・アダプタの、残りのまだ動作している物理ホスト・チャネル・アダプタの部分のキャッシュに提供される。シーケンス20は変更されないままである。
ホスト・チャネル・アダプタが、シーケンス20の次のシーケンス番号Snをもつパケットを送信側から受け取ると、これはシーケンス18の予想されるシーケンス番号Rmとマッチしない。それに応答して、ホスト・チャネル・アダプタは、送信側に否定受領通知(NAK)を返す。これにより、パケットがサブネットまたはファブリックで失われ、送信側はそれらのパケットを再送しなければならないことが、パケットの送信側に示される。
この否定受領通知の応答は、最後にうまく受け取ったのはどのパケットかを示すパラメータをもっている。こうして、シーケンス20は、シーケンス番号Sn=Rmにセットし直される。ここで、Rmはシーケンス18の予想されるシーケンス番号である。
専用キャッシュ・メモリ付きの単一のホスト・チャネル・アダプタの動作を示す構成図である。 ライト・スルー・キャッシュの場合の、冗長な論理ホスト・チャネル・アダプタを有するコンピュータ・システムの構成図である。 障害の起きたホスト・チャネル・アダプタを冗長性機構で置き換えた後の図2の構成図である。 ライト・バック・キャッシュについて、キャッシュおよびシステム・メモリの状態の間に発生する可能性のある不一致を示す図である。 ライト・バック・キャッシュを使用する際に、Infinibandアーキテクチャが提供する障害検出/修正方法を使用して、本発明の冗長性機構を実施する様子を示す図である。 ライト・バック・キャッシュを使用する際に、Infinibandアーキテクチャが提供する障害検出/修正方法を使用して、本発明の冗長性機構を実施する様子を示す図である。 ライト・バック・キャッシュを使用する際に、Infinibandアーキテクチャが提供する障害検出/修正方法を使用して、本発明の冗長性機構を実施する様子を示す図である。
符号の説明
1 物理ホスト・チャネル・アダプタ1
2 HCA1キャッシュ
3 HCA1キャッシュ・ディレクトリ
4 システム・メモリ
6 HCA1ポート
7 物理ホスト・チャネル・アダプタ2
8 HCA2ポート
9 Infinibandファブリック
10 論理ホスト・チャネル・アダプタ
11 HCA2キャッシュ
12 はじめにHCA1に割り当てられていたQPCBブロック
13 はじめにHCA2に割り当てられていたQPCBブロック
14 HCA1または2のキャッシュ
15 PSNシーケンス
16 PSNシーケンス
17 PSNシーケンス
18 PSNシーケンス
19 PSNシーケンス
20 PSNシーケンス

Claims (9)

  1. チャネル・アダプタ障害に対して冗長性を提供する方法であって、
    第1の個数のポートを有する第1の物理チャネル・アダプタおよび第2の個数のポートを有する第2の物理チャネル・アダプタを提供するステップと、
    前記第1および第2の物理チャネル・アダプタを、第1および第2の個数のポートのいくつかを有する、1つの論理チャネル・アダプタとして登録するためのプログラム手段を提供するステップと、
    前記第1のチャネル・アダプタ用の第1の制御情報を格納するための第1のキャッシュ手段、および前記第2のチャネル・アダプタ用の第2の制御情報を格納するための第2のキャッシュ手段を提供するステップと、
    第1および第2の制御情報を格納するためのシステム・メモリ手段を提供するステップと、
    前記第1のチャネル・アダプタの障害の際に、前記第1の制御情報を前記システム・メモリから前記第2のキャッシュ手段にコピーし、前記第1の個数のポートから、前記第2の個数のポートのうちの1つまたは複数への自動パス・マイグレーションを開始する手段を提供するステップと
    を含む方法。
  2. 前記第1および第2のキャッシュ手段がライト・スルー・キャッシュとして動作する、請求項1に記載の方法。
  3. 前記第1および第2のキャッシュ手段がストア・バック・キャッシュとして動作する、請求項1に記載の方法。
  4. Infiniband型の障害検出/修正方法を使用して、前記第2のポートの1つと別のInfinibandチャネル・アダプタの間の通信の再同期をとる手段を提供することをさらに含む、請求項3に記載の方法。
  5. 前記請求項1ないし4のいずれか一項に記載の方法を実行するコンピュータ・プログラム製品。
  6. 第1の個数のポート(6)を有する第1の物理チャネル・アダプタ(1)および第2の個数のポート(8)を有する第2の物理チャネル・アダプタ(7)と、
    前記第1および第2の物理チャネル・アダプタをInfiniband型アーキテクチャに従って、1つの論理チャネル・アダプタ(10)として登録する手段であって、前記論理チャネル・アダプタが、第1および第2のポートのいくつかを有する手段と、
    前記第1のチャネル・アダプタ用の第1の制御情報を格納するための第1のキャッシュ手段(2)および前記第2のチャネル・アダプタ用の第2の制御情報を格納するための第2のキャッシュ手段(11)と、
    第1の制御情報(12)および第2の制御情報(13)を格納するためのシステム・メモリ手段(4)と、
    前記第1のチャネル・アダプタの障害の際に、前記第1の制御情報を前記システム・メモリ手段(12)から前記第2のキャッシュ手段(11)にコピーし、前記第1の個数のポート(6)から前記第2の個数のポート(8)の1つまたは複数へのInfiniband型自動パス・マイグレーションを開始する手段と
    を含む、コンピュータ・システム。
  7. 前記第1および第2のキャッシュ手段がライト・スルー・キャッシュとして動作するように適合される、請求項6に記載のコンピュータ・システム。
  8. 前記第1および第2のキャッシュ手段がストア・バック・キャッシュとして動作するように適合される、請求項6に記載のコンピュータ・システム。
  9. Infiniband型の障害検出/修正方法を使用して、前記第2の個数のポートの1つと別のInfinibandチャネル・アダプタとの間の通信の再同期をとる手段をさらに含む、請求項6、7、または8に記載のコンピュータ・システム。
JP2003585378A 2002-04-18 2003-04-04 チャネル・アダプタ障害に対する冗長性を提供する方法 Withdrawn JP2005527898A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02008692 2002-04-18
PCT/EP2003/003530 WO2003088594A1 (en) 2002-04-18 2003-04-04 A method for providing redundancy for channel adapter failure

Publications (1)

Publication Number Publication Date
JP2005527898A true JP2005527898A (ja) 2005-09-15

Family

ID=29225590

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003585378A Withdrawn JP2005527898A (ja) 2002-04-18 2003-04-04 チャネル・アダプタ障害に対する冗長性を提供する方法

Country Status (5)

Country Link
JP (1) JP2005527898A (ja)
KR (1) KR20050002865A (ja)
CN (1) CN1647466A (ja)
AU (1) AU2003226784A1 (ja)
WO (1) WO2003088594A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018508856A (ja) * 2015-03-06 2018-03-29 オラクル・インターナショナル・コーポレイション 高性能クラウドコンピューティング環境のためのインフィニバンドSR−IOV vSwitchアーキテクチャを提供するためのシステムおよび方法
US10742734B2 (en) 2015-11-24 2020-08-11 Oracle International Corporation System and method for efficient virtualization in lossless interconnection networks
US11102112B2 (en) 2015-11-06 2021-08-24 Oracle International Corporation System and method for scalable multi-homed routing for vSwitch based HCA virtualization

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006343822A (ja) * 2005-06-07 2006-12-21 Fujitsu Ltd ライブラリ装置
US7756012B2 (en) * 2007-05-18 2010-07-13 Nvidia Corporation Intelligent failover in a load-balanced network environment
CN101510142B (zh) * 2008-02-15 2011-12-21 环旭电子股份有限公司 存储设备的多输出入接口系统与通信方法
CN102566944B (zh) * 2011-12-31 2015-09-02 曙光信息产业股份有限公司 存储路径冗余方法
CN103312564B (zh) * 2013-06-24 2016-07-06 曙光信息产业(北京)有限公司 InfiniBand网络检测方法
CN107547260B (zh) * 2017-07-24 2020-12-22 杭州沃趣科技股份有限公司 一种长距infiniband链路检测切换修复的方法
CN107451092A (zh) * 2017-08-09 2017-12-08 郑州云海信息技术有限公司 一种基于ib网络的数据传输系统
CN107592361B (zh) * 2017-09-20 2020-05-29 郑州云海信息技术有限公司 一种基于双ib网络的数据传输方法、装置、设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5835696A (en) * 1995-11-22 1998-11-10 Lucent Technologies Inc. Data router backup feature
US5963540A (en) * 1997-12-19 1999-10-05 Holontech Corporation Router pooling in a network flowswitch
US6195705B1 (en) * 1998-06-30 2001-02-27 Cisco Technology, Inc. Mobile IP mobility agent standby protocol
US6295276B1 (en) * 1999-12-31 2001-09-25 Ragula Systems Combining routers to increase concurrency and redundancy in external network access
US20010048661A1 (en) * 2000-05-24 2001-12-06 David Clear Method and apparatus for multi-protocol redundant router protocol support

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018508856A (ja) * 2015-03-06 2018-03-29 オラクル・インターナショナル・コーポレイション 高性能クラウドコンピューティング環境のためのインフィニバンドSR−IOV vSwitchアーキテクチャを提供するためのシステムおよび方法
US11132216B2 (en) 2015-03-06 2021-09-28 Oracle International Corporation System and method for providing an InfiniBand SR-IOV vSwitch architecture for a high performance cloud computing environment
US11102112B2 (en) 2015-11-06 2021-08-24 Oracle International Corporation System and method for scalable multi-homed routing for vSwitch based HCA virtualization
US10742734B2 (en) 2015-11-24 2020-08-11 Oracle International Corporation System and method for efficient virtualization in lossless interconnection networks
US10778764B2 (en) 2015-11-24 2020-09-15 Oracle International Corporation System and method for efficient virtualization in lossless interconnection networks
US11533363B2 (en) 2015-11-24 2022-12-20 Oracle International Corporation System and method for efficient virtualization in lossless interconnection networks
US11930075B2 (en) 2015-11-24 2024-03-12 Oracle International Corporation System and method for efficient virtualization in lossless interconnection networks

Also Published As

Publication number Publication date
AU2003226784A1 (en) 2003-10-27
CN1647466A (zh) 2005-07-27
KR20050002865A (ko) 2005-01-10
WO2003088594A1 (en) 2003-10-23

Similar Documents

Publication Publication Date Title
US6721806B2 (en) Remote direct memory access enabled network interface controller switchover and switchback support
US6545981B1 (en) System and method for implementing error detection and recovery in a system area network
EP1499984B1 (en) System, method, and product for managing data transfers in a network
US6724762B2 (en) System and method for implementing multi-pathing data transfers in a system area network
JP3932994B2 (ja) サーバ引継システムおよびその方法
US7509419B2 (en) Method for providing remote access redirect capability in a channel adapter of a system area network
US7974186B2 (en) Connection recovery device, method and computer-readable medium storing therein processing program
US20030065974A1 (en) Fault-tolerant switch architecture
US6760766B1 (en) Data transmission method and device
US6594776B1 (en) Mechanism to clear MAC address from Ethernet switch address table to enable network link fail-over across two network segments
US6823437B2 (en) Lazy deregistration protocol for a split socket stack
US20050078559A1 (en) Global recovery for time of day synchronization
US20050081080A1 (en) Error recovery for data processing systems transferring message packets through communications adapters
US20190044827A1 (en) Communication of a message using a network interface controller on a subnet
US20050080869A1 (en) Transferring message packets from a first node to a plurality of nodes in broadcast fashion via direct memory to memory transfer
JP2005527898A (ja) チャネル・アダプタ障害に対する冗長性を提供する方法
JP2003216592A (ja) ヘッド・オンリ循環バッファを介してインフィニバンド・ワーク及び完了キューを管理する方法及び装置
US20050080945A1 (en) Transferring message packets from data continued in disparate areas of source memory via preloading

Legal Events

Date Code Title Description
A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20061228