JP3266481B2 - クラスタ化コンピューティング・システムのディスク・アクセス・パスにおける障害から回復する方法および関連する装置 - Google Patents

クラスタ化コンピューティング・システムのディスク・アクセス・パスにおける障害から回復する方法および関連する装置

Info

Publication number
JP3266481B2
JP3266481B2 JP27866295A JP27866295A JP3266481B2 JP 3266481 B2 JP3266481 B2 JP 3266481B2 JP 27866295 A JP27866295 A JP 27866295A JP 27866295 A JP27866295 A JP 27866295A JP 3266481 B2 JP3266481 B2 JP 3266481B2
Authority
JP
Japan
Prior art keywords
disk
nodes
node
access
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP27866295A
Other languages
English (en)
Other versions
JPH08255122A (ja
Inventor
クレメント・リチャード・アタナシオ
マリア・アンジェラ・バトリコ
ジェームズ・ライル・ピーターソン
クリストス・アルキヴィアディス・ポリゾイス
スチーブン・エドウィン・スミス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH08255122A publication Critical patent/JPH08255122A/ja
Application granted granted Critical
Publication of JP3266481B2 publication Critical patent/JP3266481B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2033Failover techniques switching over of hardware resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/142Reconfiguring to eliminate the error
    • G06F11/1423Reconfiguring to eliminate the error by reconfiguration of paths
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1479Generic software techniques for error detection or fault masking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2035Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2046Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • G06F11/2092Techniques of failing over between control units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は分散コンピューティ
ング環境に関する。具体的には、本発明はクラスタ内の
各プロセッサがクラスタ内の任意のディスクにアクセス
することができるプロセッサ・クラスタで用いる方法に
係わる。
【従来の技術】
【0002】強力なマイクロプロセッサが利用可能にな
ったために、クラスタはモノリシック・システムに代わ
る魅力的なシステムとなっている。計算を複数のノード
間で分割することができるアプリケーションは、このア
ーキテクチャを利用することができ、それによって一般
にはモノリシック・システムよりも優れた価格性能比を
得ることができる。このようなアプリケーションとして
は、大規模な科学計算、データベースおよびトランザク
ション処理システム、意志決定支援システムなどがあ
る。
【0003】マイクロプロセッサ・クラスタは、ネット
ワークや通信交換機などのプロセッサ間連絡機構で結合
されたいくつかの個別のコンピューティング・システム
から成る。各コンピューティング・システムは固有のプ
ロセッサ、メモリ、および入出力サブシステムを備えて
おり、オペレーティング・システムの個々のインスタン
スを実行する。しかし、最大限の利益を得るためには、
アプリケーションは特定のコンピューティング・システ
ムにはこだわらずに、クラスタ内のすべてのノードを同
等のものとして扱うことができることが望ましい。これ
ができることを「単一システム・イメージ」と呼ぶこと
がある。
【0004】単一システム・イメージの有用な点は、同
じ入出力資源をクラスタ内のすべてのプロセッサが等し
く使用できる必要があることである。これによって、処
理タスクをプロセッサ間で自由に移動させることができ
る。さらに、計算のためにデータ共用モデルを採用する
並列アプリケーションの開発が容易になる。
【0005】すべてのプロセッサに同一入出力資源を、
好ましくは可用性の高い方式で提供するために、様々な
手法をとることができる。データ複製は、特に読取り専
用データの場合には最も単純な手法であるが、コストが
高くなり(資源を共用しないため)、時間の経過により
情報が変化すると困難が生ずる。
【0006】もう1つの手法は、多くのプロセッサに物
理的に接続することができる装置を用意することであ
る。たとえば、ツインテール(デュアル・ポート)ディ
スクが一般的である。4テール・ディスクや8テール・
ディスクも構築可能だが、より高価になり、操作も難し
くなる。
【0007】上記のいずれの場合も、各プロセッサは資
源に対して独立してアクセスすることができ、プロセッ
サやアダプタに障害が起こった場合にデータへの継続ア
クセスを行うための処置が不要である。
【0008】NFS、AFS、DFSなどの分散ファイ
ル・システムは、そのサービス用に意図されている特定
の入出力装置にはこだわらずに、それらのサービスをク
ラスタ内のプロセッサに提供する。これによって、それ
らのサービスのための入出力装置の使用が制限され、し
たがってメモリ階層内のデータの場所を明示的に認識し
ているアプリケーションには不適切である。たとえば、
データベース・システムはそれらのサービスを提供する
ためにファイル・システムに依拠せず、それ自身のバッ
ファリングに依拠することができ、ディスク上のデータ
を固有の方法で配列することができる。この場合、アプ
リケーションにとっては入出力装置への直接アクセスの
方が好ましい。
【0009】可用性の高さの点から見れば、HA−NF
SはNFSクライアントに可用性の高いNFSサーバを
提供するが、高可用性を可能にする重要な機能を提供す
るために、基礎にあるネットワーク技術(IPアドレス
引継ぎ)にかなり依拠している。
【0010】
【発明が解決しようとする課題】本発明の目的は、すべ
てのノードにすべての入出力装置を接続しなくてもクラ
スタ内のプロセッサが入出力装置を共用することができ
るシステムにおいて、ノードやアダプタの障害からの透
過的回復機能を提供し、障害にもかかわらず影響を受け
なかったノードで実行されているアプリケーションが処
理を継続できるようにすることである。透過(transpar
ent)とは、アプリケーションが、障害発生の前に出し
た要求を再発行する必要がないという意味である。
【0011】
【課題を解決するための手段】したがって、本発明はク
ラスタ化コンピューティング・システムのディスク・ア
クセス・パスの障害から回復するシステムおよび方法を
提供する。クラスタ化コンピューティング・システムの
各ノードには、そのノードで実行されているアプリケー
ションからの物理ディスク・アクセス要求を処理し、そ
のディスク・アクセス要求を、そのディスクが物理的に
接続されている適切なサーバに送るための代理ソフトウ
ェアが用意される。各ノード上の代理ソフトウェアは、
そのノードから出されたすべての保留中の要求に関する
状況情報を維持する。ディスク・アクセス・パス(たと
えばノードやディスク・アダプタなど)での障害の検出
に応答して、すべてのノード上の代理ソフトウェアはそ
れ以降のディスク・アクセス要求をすべて、同じディス
クに物理的に接続されている2次ノードに送る。
【0012】好ましい実施例では、代理ソフトウェア
は、仮想装置を定義し、それらの装置への入出力要求を
代行受信し、実装置が物理的に接続されている適切なサ
ーバ・プロセッサに要求を(書込の場合はデータも)送
ることによって、プロセッサが遠隔プロセッサに物理的
に接続されている入出力装置にアクセスできるようにす
る、ソフトウェア層として実現される。サーバ・プロセ
ッサは実際の入出力動作を行い、要求元のプロセッサに
完了メッセージを(読取りの場合はデータも)を返す。
要求元のプロセッサは完了メッセージを受け取ると、そ
れに応じて、要求を出したプロセスに通知する。
【0013】ツインテール・ディスクの場合は、次のよ
うにして高可用性を実現することができる。あるディス
クについて、そのディスクに接続されているプロセッサ
の1つを1次サーバとして指定する。正常動作時には、
クラスタ内の任意の場所から出されたそのディスクへの
入出力要求は、1次サーバに送られる。1次サーバまた
はそのディスク・アダプタに障害が発生すると、そのデ
ィスクに接続されている他のプロセッサの1つがそのデ
ィスクの1次サーバになり、各プロセッサ上にある要求
経路指定情報が変更され、新たな要求があれば新しい1
次サーバに送られる。
【0014】好ましい実施例では、サーバにはまったく
状態がなく、保留中の遠隔要求の全状態がクライアント
で維持される。したがって、サーバまたはアダプタに障
害が発生した場合、障害発生前に出された保留中の要求
は、クライアントが新しいサーバに対して再発行するこ
とができ、アプリケーションにはその障害が見えない。
【0015】
【発明の実施の形態】図1は、回復可能仮想共用ディス
ク・サブシステムを組み込んだ本発明の好ましい実施例
のブロック図である。これには、独立コンピューティン
グ・ノード(以下ノードという)100−1ないし10
0−Nの集合(クラスタ)が含まれている。
【0016】各ノードはプロセッサとメモリを有してお
り、ノード100−1の場合はプロセッサには150−
1、メモリには200−1のようにラベルを付けて示し
てある(ノード100−Nの場合は150−Nと200
−N)。当業者には、各ノードが別個のメモリを有する
ことも複数のノードが共用メモリを有することもできる
ことが容易に理解されよう。
【0017】ノードは、相互接続500を介して通信す
る。相互接続500は、交換機、ローカル・エリア・ネ
ットワーク、共用メモリ、またはクラスタ内のノードの
データ交換を可能にする他の任意の種類の媒体とするこ
とができる。
【0018】各ノードはいくつかのディスク・アダプタ
を有しており、ノード100−1の場合は300−1−
1ないし300−1−Iというラベルを付けて示してあ
る(ノード100−Nの場合は300−N−1ないし3
00−N−I)。アダプタ300−1−1には、400
−1−1−1ないし400−1−1−Jというラベルで
示されているディスクが接続されている(アダプタ30
0−N−Iには400−N−I−1ないし400−N−
I−Jというラベルのディスクが接続されている)。1
ノード当たりのアダプタ数は、すべてのノードについて
同じである必要はない。また、1アダプタ当たりのディ
スク数はすべてのディスク・アダプタについて同じであ
る必要はない。全くディスク・アダプタを持たないノー
ドもあり得る。
【0019】複数のノードによって共用されるディスク
は、ノードが直接接続されている物理ディスクをアドレ
ス指定するために使用するのと同じプログラミング・イ
ンターフェースを使用して、クラスタ全体を通じて共通
の名前でアドレス指定される。これによって、ディスク
がクラスタ内の各ノードに物理的に接続されているよう
な錯覚が生ずる。このようなアクセスを可能にするソフ
トウェアおよびプログラミング・インターフェースを仮
想共用ディスクと呼ぶ。
【0020】各プロセッサのメモリには、代理論理と、
仮想共用ディスクに関する状態データが入っている。状
態データには、従来オペレーティング・システムが物理
接続ディスクのために維持しているタイプのデータ(た
とえば装置状態、装置名、保留中の要求に関する情報な
ど)の他に、以下で述べるようなある種の追加情報も含
まれる。この論理および関連データは、ノード100−
1の場合はブロック250−1として示されている(ノ
ード100−Nの場合は250−N)。ノード100−
Kのためのこのようなブロックを、図7に詳細に示して
ある。代理論理は、図7でブロック250−K−Aとし
て示されている。
【0021】ノードまたはアダプタに障害が発生した場
合に、アクセス可能な状態のままでいる必要があるディ
スクは、いくつかの異なるノード上の複数のアダプタに
接続されている。図2にツインテール・ディスクの構成
を示す。この図で、ディスク400−L−P−Xは、ノ
ード100−L上のアダプタ300−L−Pと、ノード
100−M上のアダプタ300−M−Qに接続されてい
る。
【0022】正常動作時には、どのディスクの場合も、
そのテールの1つが1次テールとして選択されている。
どのノードも、現在1次テールを保持しているノードに
システム内のすべての仮想ディスクをマップするテーブ
ル(図7のブロック250−K−B)を有する。1次テ
ールは使用される唯一のテールである。ディスクの他の
テールは待機している。
【0023】どのノードで実行されているアプリケーシ
ョンも、すべてのディスクがローカルに接続されている
かのように任意のディスクについて入出力要求を出すこ
とができる。要求元のノードでの要求を処理する論理
を、図3に示す。要求が出されると(ブロック70
0)、前述のマップ250−K−Bを検査してどのノー
ドが1次テールを持っているかが調べられる(ブロック
710)。要求元のノードがサーバ・ノードでもある場
合(すなわち1次テールを持っている場合)、要求はロ
ーカルで処理される(ブロック715)。サーバ・ノー
ドが要求元のノードとは異なる場合は、サーバ・ノード
に要求記述子が送られる(ブロック720)。要求が書
込み要求の場合(ブロック730で判断される)、書き
込まれるデータもサーバに送られる(ブロック74
0)。
【0024】ブロック750で、要求(読取りまたは書
込み)は、遠隔サーバからの応答を待つ。応答が到着
し、要求が読取り要求だった場合(ブロック760で判
断される)は、ネットワークに着信したデータが元の要
求に提供される(ブロック770)。要求が読取りでな
かった場合、その要求は完了する(ブロック780)。
【0025】要求記述子には、従来オペレーティング・
システムが物理ディスク装置ドライバに送っているのと
同じタイプのデータ(たとえば、装置名、オフセット、
要求のサイズ、オプション・フラグ、要求タイプなど)
の他に、要求元のノード、固有要求識別子、1次ノード
のアドレスなどの追加情報が含まれる。
【0026】サーバ・ノードで要求を処理するための論
理を、図4に示す。要求(ブロック800)は、ローカ
ルで実行されているプロセスが出したものであっても遠
隔ノードからネットワークに着信したものであってもよ
い。ブロック810で、装置に対してアクセス要求が出
される。ブロック820で、この論理は要求元を判断す
る。入出力が完了すると、ローカルで出された要求の場
合には操作が完了し、要求元のプロセスに通知される。
別のノードで出された要求の場合は、ブロック830で
要求元のノードに応答が送り返される。要求が読取り要
求だった場合は、読み取られたデータも送られる。要求
元のノードに応答が届くと、操作は完了し、要求元のプ
ロセスに通知される。
【0027】プロセッサまたはアダプタに障害が発生す
ると、従来の方式でそれが検出され、それに応じてすべ
てのノードに通知される。当業者には、障害の検出に様
々な機構(たとえば定期診断に基づくものなど)を使用
できることが容易に理解されよう。
【0028】ノードの障害の場合、影響を受ける仮想共
用ディスクは、障害を起こしたノードを基礎物理装置の
1次テールとして使用していたディスクである。アダプ
タの障害の場合は、影響を受ける仮想共用ディスクは、
基礎物理装置の1次テールが障害を起こしたアダプタに
接続されていたディスクである。影響を受けるすべての
仮想共用ディスクのために、基礎物理装置の別のテール
が新しい1次テールとして選択される。選択は、(所定
の優先順位に基づいて)静的にも(ランタイム情報を使
用する方針モジュールによって)動的にも行うことがで
きる。動的な選択論理は、残りの活動テール間のロード
・バランシングを達成しようとするものであってもよ
い。
【0029】クラスタ内のノードの1つをコーディネー
タとして指定する。コーディネータは、クラスタ内のす
べてのノードに障害を通知する。コーディネータが実行
する論理を図5に示す。各関係ノードの論理を図6に示
す。コーディネータは関係ノードでもある。
【0030】障害が検出されると(ブロック900)、
コーディネータはすべての関係ノードにメッセージを同
報通信し(ブロック910)、影響を受けた仮想共用デ
ィスクを中断させるように指示する。このメッセージを
受信すると(ブロック1000)、各関係ノードは影響
を受けた仮想共用ディスクを中断させる(ブロック10
10)。仮想共用ディスクの中断とは、その仮想装置を
一時的に1次テールを持たないものとしてマークするこ
とを意味する。障害を起こしたサーバに送られていた保
留中の要求は、要求元のクライアントによって、この目
的のために用意されている待ち行列に保管される。仮想
装置の中断中に到着した要求も、要求元のクライアント
によって同じ待ち行列に入れられる。
【0031】影響を受けた装置の中断後、各関係ノード
はコーディネータに肯定応答を送り(ブロック102
0)、(影響を受けたVSDについてはそれ以上の処置
を取らずに)コーディネータから再開メッセージを受信
するのを待つ(ブロック1030)。その他の処理は影
響を受けない。コーディネータは、すべての関係ノード
が応答するのを待ってから(ブロック920)、影響を
受けた仮想共用ディスクを再開するようにすべてのノー
ドにメッセージを同報通信する(ブロック930)。こ
のメッセージを受け取ると、各関係ノードは影響を受け
た仮想装置を再開する(ブロック1040)。仮想装置
の再開とは、選択された新しい1次テールを持つノード
が、その仮想装置の宛先マップに記録されることを意味
する。再開後、関係ノードはコーディネータに肯定応答
を送り(ブロック1050)、ブロック1060ですべ
ての保留中の要求(中断前に保留になっていたものだけ
でなく中断期間中に開始された要求も)が、その装置の
新しいサーバに対して再発行される。コーディネータは
すべてのノードから2回目の肯定応答を集める(ブロッ
ク940)。
【0032】前述の2フェーズ・コミットの変形以外の
合意プロトコルを使用して、障害の影響を受けた仮想共
用ディスクの中断と再開を行うこともできる。さらに、
コーディネータが障害を起こした場合は、別のコーディ
ネータを選択して回復の調整を行わせることができる。
【0033】頻繁にアクセスされるデータまたは最近ア
クセスされたデータが入っているバッファを、ディスク
の1次テールを持つノードのメモリで維持することがで
きる。要求されたデータがメモリに入っている場合、バ
ッファに入れられているメモリ・コピーが使用される。
それ以外の場合は、物理ディスク・アクセスを行わなけ
ればならない。
【0034】ツインテールまたは一般的にマルチテール
・ディスクの場合、ディスクに物理的に接続されている
任意のノードがサーバとして機能することができる。さ
らに、ディスクに物理的に接続されているプロセッサの
任意のサブセットが同時に複数のサーバとして機能する
こともできる。すなわち、同時に活動状態になっている
1次テールが複数あってもよい。ある特定のディスクに
接続されていないノードは、その活動サーバのいずれか
に要求を送ることによってそのディスクにアクセスする
ことができる。サーバの選択は静的にも動的にも行うこ
とができる。
【0035】障害が発生した場合に処理され転送される
ディスク・アクセスは、ファイル・システム操作ではな
く物理アクセス・コマンドであるものと理解されたい。
言い換えると、本発明のシステムでは、仮想共用ディス
クを有する各ノードは、そのノードに物理ディスクがデ
ィスク・アダプタを介して直接接続されているかのよう
に、ディスク装置ドライバにコマンド(物理ディスクの
特定の場所での読取りと書込みなど)を出す。これらの
コマンドは、仮想共用ディスク・ソフトウェアから、デ
ィスクの1次テール(ポート)が直接接続されているノ
ード上のディスク・ドライバ・ソフトウェアに渡され、
次にその仮想共用ディスク・ソフトウェアが、接続され
ているポートを介してディスク制御装置にコマンドを出
す。
【0036】以上、本発明について好ましい実施例を用
いて説明したが、当業者には様々な変更や改良が考えら
れよう。したがって、この好ましい実施例は例として示
したものであり、これに限定されるものではないことを
理解されたい。本発明の範囲は特許請求の範囲によって
規定される。
【0037】まとめとして、本発明の構成に関して以下
の事項を開示する。
【0038】(1)クラスタ化コンピューティング・シ
ステムのディスク・アクセス・パスにおける障害から回
復する方法であって、 a)所与のノードで実行されているアプリケーションか
らの物理ディスク・アクセス要求を処理し、ディスク・
アクセス要求を前記ディスクが物理的に接続されている
1次ノードに送るため、各所与のノード上の代理論理
が、その所与のノードから出されたすべての保留中の要
求に関する状態情報を維持するように、前記クラスタ化
コンピューティング・システムの各所与のノードに前記
代理論理を提供するステップと、 b)ディスクへのアクセス・パスでの障害を検出するス
テップと、 c)障害の検出に応答して、すべてのノード上の代理ソ
フトウェアに、ディスクへのそれ以降のアクセス要求を
すべて前記ディスクに物理的に接続されている2次ノー
ドに送るように通知するステップを含む方法。 (2)前記アクセス・パスがディスク・アダプタと、デ
ィスクが物理的に接続されているノードとを含み、前記
障害が任意のノードおよびディスク・アダプタで検出さ
れることを特徴とする、上記(1)に記載の方法。 (3)前記障害の検出に応答して、着信したディスクへ
のアクセス要求を待ち行列に入れるステップと、待ち行
列内の要求を2次ノードを経由してディスクに転送する
ステップをさらに含むことを特徴とする、上記(1)に
記載の方法。 (4)複数のN個のノードと、NがMより多いM個のノ
ードに接続された複数のポートを有するマルチポート・
ディスクと、前記ノードに接続され、前記ディスクとそ
のディスクに物理的に接続されていない前記ノードとの
間のディスク・アクセス・パスで障害を検出する障害検
出機構と、各ノード上にあって、前記障害検出機構に接
続され、障害が検出されたときに、前記マルチポート・
ディスクへのアクセス要求を前記ディスクとそのディス
クに物理的に接続されていない前記ノードとの間の別の
ディスク・アクセス・パスに転送する代理論理とを含
む、クラスタ化多重処理システム。 (5)各ノード内にあり、着信したディスクへのアクセ
ス要求を格納する待ち行列と、待ち行列内の要求を別の
ディスク・アクセス・パスを経由して前記ディスクに転
送する手段とを含む、上記(4)に記載のシステム。 (6)前記障害検出機構が、ディスクに物理的に接続さ
れている任意のノード内の障害と、前記ディスクに物理
的に接続されている各ノードにあって前記ディスクに接
続されているディスク・アダプタ内の障害を検出する手
段を備えていることを特徴とする、上記(4)に記載の
システム。 (7)クラスタ化コンピューティング・システム内のデ
ィスク・アクセス・パスで発生した障害から回復する方
法であって、クラスタ化コンピューティング・システム
内のディスク・アクセス・パスでの障害を検出するステ
ップと、障害検出時に、そのディスクにアクセス可能な
すべてのノードにメッセージを同報通信するステップ
と、前記メッセージに応答して、各ノード上の仮想共用
ディスクを中断させ、障害が発生したアクセス・パス上
のディスクに送られていた保留中の要求を保管し、仮想
共用ディスクの中断中に着信した要求を保管するステッ
プと、前記ノードに第2のメッセージを同報通信して、
影響を受けた仮想共用ディスクを再開するステップと、
前記第2のメッセージの受信時に、新しい1次テールを
持つノードを仮想装置の宛先マップに記録することによ
って各ノードで仮想共用ディスクを再開するステップ
と、すべての要求を新しい1次テールに対して再発行す
るステップとを含む、前記方法。
【図面の簡単な説明】
【図1】本発明の好ましい実施例の全体ブロック図であ
る。
【図2】ツインテール・ディスクの好ましい編成を示す
図である。
【図3】クライアント・ノードでの要求の処理に必要な
ステップを示すフロー・チャートである。
【図4】サーバ・ノードでの要求の処理に必要なステッ
プを示すフロー・チャートである。
【図5】コーディネータ・ノードでの回復に必要なステ
ップを示すフロー・チャートである。
【図6】関係ノードでの回復に必要なステップを示すフ
ロー・チャートである。
【図7】メモリ常駐論理および仮想共用ディスクに関係
するデータの詳細ブロック図である。
【符号の説明】
250−N 論理および関連データ 100−L ノード 100ーM ノード 400−L−P−X ディスク 250−K−B マップ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 マリア・アンジェラ・バトリコ アメリカ合衆国10913 ニューヨーク州 ブラウヴェルト ヴァンウィック・ロー ド54 (72)発明者 ジェームズ・ライル・ピーターソン アメリカ合衆国78759−5108 テキサス 州オースチン バーカー・リッジ・コウ ブ 10601 (72)発明者 クリストス・アルキヴィアディス・ポリ ゾイス アメリカ合衆国10606−1935 ニューヨ ーク州ホワイトプレーンズ マーチン・ アベニュー25 アパートメント ピー・ エイチ105 (72)発明者 スチーブン・エドウィン・スミス アメリカ合衆国10541 ニューヨーク州 マホウパック ハットフィールド・ロ ード19 (56)参考文献 特開 平6−60000(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 13/10 - 13/14

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】それぞれがメモリを有する少なくとも3つ
    の相互接続されたノードであって、全ノード数よりも少
    ない数のサーバ・ノードを含む複数のノードと、 1次サーバ・ノードに物理的に接続された1次テール及
    び2次サーバ・ノードに物理的に接続された2次テール
    を有するマルチポート・ディスクと、 前記複数のノードに接続され、要求元のノードから、前
    記ディスクに物理的に接続されたサーバ・ノードに、前
    記要求元ノード、前記サーバ・ノード、及び前記ディス
    クの間に形成された1次ディスク・アクセス・パス及び
    2次ディスク・アクセス・パスの一方を介してコミュニ
    ケーションするためのディスク・アクセス要求手段と、 前記複数のノードに接続され、前記1次ディスク・アク
    セス・パス及び前記2次ディスク・アクセス・パスの一
    方における障害を検出するための障害検出手段と、 前記複数のノードの各々におけるメモリに記憶され且つ
    前記障害検出手段に接続され、前記障害が検出された
    時、非障害のディスク・アクセス・パスを介してその後
    のディスク・アクセス要求を転送するための代理論理手
    段と、 を含み、 前記代理論理手段は、 (a)前記複数のノードの1つであるコーディネータ・
    ノードが前記障害の検出に応答して障害のあるディスク
    ・アクセス・パスへのアクセスを中断させるための中断
    メッセージを関係ノードに同報通信し、すべての関係ノ
    ードからの肯定応答メッセージを待ち、 (b)前記中断メッセージを受け取った関係ノードが前
    記障害のあるディスク・アクセス・パスへのアクセスを
    中断し、前記障害のあるディスク・アクセス・パスへの
    アクセスの中断を確認する肯定応答メッセージを前記コ
    ーディネータ・ノードに送って前記コーディネータ・ノ
    ードからの再開メッセージを待ち、 (c)前記コーディネータ・ノードが、前記すべての関
    係ノードから肯定応答を受け取った時に前記再開メッセ
    ージを送り、 (d)前記関係ノードの各々が、前記再開メッセージを
    受け取った時に前記非障害のディスク・アクセス・パス
    を介して前記ディスクに前記その後のディスク・アクセ
    ス要求を転送するように作用することを特徴とするクラ
    スタ化多重処理システム。
  2. 【請求項2】前記複数のノードの各々にあって前記ディ
    スクへのアクセス要求を記憶するための待ち行列と、 前記非障害ディスク・アクセス・パスを介して前記待ち
    行列における要求を前記ディスクに送るための手段とを
    含むことを特徴とする請求項1に記載のクラスタ化多重
    処理システム。
  3. 【請求項3】すべてのサーバ・ノードが前記ディスクに
    接続されたディスク・アダプタを含むこと、及び前記障
    害検出手段は前記すべてのサーバ・ノード及びディスク
    ・アダプタにおける障害を検出するための手段を含むこ
    とを特徴とする請求項1に記載のクラスタ化多重処理シ
    ステム。
  4. 【請求項4】それぞれがメモリを有する少なくとも3つ
    の相互接続されたノードであって、全ノード数よりも少
    ない数のサーバ・ノードを含む複数のノードと、1次サ
    ーバ・ノードに物理的に接続された1次テール及び2次
    サーバ・ノードに物理的に接続された2次テールを有す
    るマルチポート・ディスクとを含むクラスタ化コンピュ
    ーティング・システムにおいてディスク・アクセス・パ
    スにおける障害から回復するための方法にして、 前記クラスタ化コンピューティング・システムにおいて
    前記1次テールと関連したディスク・アクセス・パスに
    おける障害を検出するステップと、 前記障害の検出時に前記複数のノードの1つであるコー
    ディネータ・ノードが、前記ディスクへのアクセスを有
    するすべてのノードに第1のメッセージを同報通信する
    ステップと、 前記複数のノードの各々が前記第1のメッセージを受け
    取って前記ディスクへのアクセスを中断し、前記ディス
    クへのアクセスの中断を表す肯定応答を前記コーディネ
    ータ・ノードに送るステップと、 前記肯定応答に応答して、前記ディスクへのアクセスを
    再開するように前記コーディネータ・ノードが前記複数
    のノードに第2のメッセージを同報通信するステップ
    と、 前記第2のメッセージを受け取ったノードの各々が前記
    2次テールを介して前記ディスクへのアクセスを再開す
    るステップと、とを含む方法。
  5. 【請求項5】前記第1のメッセージに応答して前記障害
    アクセス・パスに沿って前記ディスクに送られた保留状
    態にある要求を保管し且つ前記ディスクへのアクセスが
    中断している間に到着した要求を保管するステップと、 前記再開するステップに応答して前記保管されたすべて
    の要求を前記2次サーバ・ノードに対して再発行するス
    テップと、 を含む請求項4に記載の方法。
  6. 【請求項6】前記すべての要求は待ち行列に保管され、 前記再開するステップは前記待ち行列における要求を前
    記2次サーバ・ノードを介して前記ディスクに転送する
    ステップを含むことを特徴とする請求項5に記載の方
    法。
  7. 【請求項7】すべてのサーバ・ノードがディスク・アダ
    プタを含み、 前記ディスク・アクセス・パスは前記ディスク・アダプ
    タ及びサーバ・ノードを含み、 前記障害を検出するステップは前記複数のノード又は前
    記ディスク・アダプタの少なくとも1つにおける障害を
    検出するステップを含むことを特徴とする請求項4に記
    載の方法。
  8. 【請求項8】前記コーディネータ・ノードが障害を生じ
    た場合、障害の回復を行うためのバックアップ・コーデ
    ィネータを指定するステップを含む請求項4に記載の方
    法。
JP27866295A 1994-10-31 1995-10-26 クラスタ化コンピューティング・システムのディスク・アクセス・パスにおける障害から回復する方法および関連する装置 Expired - Fee Related JP3266481B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US33215794A 1994-10-31 1994-10-31
US332157 1994-10-31

Publications (2)

Publication Number Publication Date
JPH08255122A JPH08255122A (ja) 1996-10-01
JP3266481B2 true JP3266481B2 (ja) 2002-03-18

Family

ID=23296958

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27866295A Expired - Fee Related JP3266481B2 (ja) 1994-10-31 1995-10-26 クラスタ化コンピューティング・システムのディスク・アクセス・パスにおける障害から回復する方法および関連する装置

Country Status (5)

Country Link
US (1) US5668943A (ja)
EP (1) EP0709779B1 (ja)
JP (1) JP3266481B2 (ja)
KR (1) KR100232247B1 (ja)
DE (1) DE69521101T2 (ja)

Families Citing this family (206)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5696895A (en) * 1995-05-19 1997-12-09 Compaq Computer Corporation Fault tolerant multiple network servers
JPH096706A (ja) * 1995-06-22 1997-01-10 Hitachi Ltd 疎結合計算機システム
US5941994A (en) * 1995-12-22 1999-08-24 Lsi Logic Corporation Technique for sharing hot spare drives among multiple subsystems
US5961601A (en) * 1996-06-07 1999-10-05 International Business Machines Corporation Preserving state information in a continuing conversation between a client and server networked via a stateless protocol
US5852724A (en) * 1996-06-18 1998-12-22 Veritas Software Corp. System and method for "N" primary servers to fail over to "1" secondary server
US6044367A (en) * 1996-08-02 2000-03-28 Hewlett-Packard Company Distributed I/O store
US6484208B1 (en) * 1996-10-15 2002-11-19 Compaq Information Technologies Group, L.P. Local access of a remotely mirrored disk in a computer network
US5922077A (en) * 1996-11-14 1999-07-13 Data General Corporation Fail-over switching system
US6173346B1 (en) 1997-05-13 2001-01-09 Micron Electronics, Inc. Method for hot swapping a programmable storage adapter using a programmable processor for selectively enabling or disabling power to adapter slot in response to respective request signals
US6324608B1 (en) 1997-05-13 2001-11-27 Micron Electronics Method for hot swapping of network components
US5892928A (en) 1997-05-13 1999-04-06 Micron Electronics, Inc. Method for the hot add of a network adapter on a system including a dynamically loaded adapter driver
US6243838B1 (en) 1997-05-13 2001-06-05 Micron Electronics, Inc. Method for automatically reporting a system failure in a server
US6269417B1 (en) 1997-05-13 2001-07-31 Micron Technology, Inc. Method for determining and displaying the physical slot number of an expansion bus device
US6253334B1 (en) 1997-05-13 2001-06-26 Micron Electronics, Inc. Three bus server architecture with a legacy PCI bus and mirrored I/O PCI buses
US6304929B1 (en) 1997-05-13 2001-10-16 Micron Electronics, Inc. Method for hot swapping a programmable adapter by using a programmable processor to selectively disabling and enabling power thereto upon receiving respective control signals
US6179486B1 (en) 1997-05-13 2001-01-30 Micron Electronics, Inc. Method for hot add of a mass storage adapter on a system including a dynamically loaded adapter driver
US6192434B1 (en) 1997-05-13 2001-02-20 Micron Electronics, Inc System for hot swapping a programmable adapter by using a programmable processor to selectively disabling and enabling power thereto upon receiving respective control signals
US6418492B1 (en) 1997-05-13 2002-07-09 Micron Electronics Method for computer implemented hot-swap and hot-add
US6189109B1 (en) 1997-05-13 2001-02-13 Micron Electronics, Inc. Method of remote access and control of environmental conditions
US6249828B1 (en) 1997-05-13 2001-06-19 Micron Electronics, Inc. Method for the hot swap of a mass storage adapter on a system including a statically loaded adapter driver
US6249885B1 (en) 1997-05-13 2001-06-19 Karl S. Johnson Method for managing environmental conditions of a distributed processor system
US6202111B1 (en) 1997-05-13 2001-03-13 Micron Electronics, Inc. Method for the hot add of a network adapter on a system including a statically loaded adapter driver
US6163849A (en) 1997-05-13 2000-12-19 Micron Electronics, Inc. Method of powering up or powering down a server to a maintenance state
US6249834B1 (en) 1997-05-13 2001-06-19 Micron Technology, Inc. System for expanding PCI bus loading capacity
US6363497B1 (en) 1997-05-13 2002-03-26 Micron Technology, Inc. System for clustering software applications
US6163853A (en) * 1997-05-13 2000-12-19 Micron Electronics, Inc. Method for communicating a software-generated pulse waveform between two servers in a network
US6145098A (en) 1997-05-13 2000-11-07 Micron Electronics, Inc. System for displaying system status
US6219734B1 (en) 1997-05-13 2001-04-17 Micron Electronics, Inc. Method for the hot add of a mass storage adapter on a system including a statically loaded adapter driver
US6292905B1 (en) * 1997-05-13 2001-09-18 Micron Technology, Inc. Method for providing a fault tolerant network using distributed server processes to remap clustered network resources to other servers during server failure
US6247080B1 (en) 1997-05-13 2001-06-12 Micron Electronics, Inc. Method for the hot add of devices
US6499073B1 (en) 1997-05-13 2002-12-24 Micron Electronics, Inc. System using programmable processor for selectively enabling or disabling power to adapter in response to respective request signals
US6330690B1 (en) 1997-05-13 2001-12-11 Micron Electronics, Inc. Method of resetting a server
US6243773B1 (en) 1997-05-13 2001-06-05 Micron Electronics, Inc. Configuration management system for hot adding and hot replacing devices
US6195717B1 (en) 1997-05-13 2001-02-27 Micron Electronics, Inc. Method of expanding bus loading capacity
US6269412B1 (en) 1997-05-13 2001-07-31 Micron Technology, Inc. Apparatus for recording information system events
US6202160B1 (en) 1997-05-13 2001-03-13 Micron Electronics, Inc. System for independent powering of a computer system
US6338150B1 (en) 1997-05-13 2002-01-08 Micron Technology, Inc. Diagnostic and managing distributed processor system
US6170028B1 (en) 1997-05-13 2001-01-02 Micron Electronics, Inc. Method for hot swapping a programmable network adapter by using a programmable processor to selectively disabling and enabling power thereto upon receiving respective control signals
US5907849A (en) * 1997-05-29 1999-05-25 International Business Machines Corporation Method and system for recovery in a partitioned shared nothing database system using virtual share disks
US6101508A (en) * 1997-08-01 2000-08-08 Hewlett-Packard Company Clustered file management for network resources
US6067545A (en) * 1997-08-01 2000-05-23 Hewlett-Packard Company Resource rebalancing in networked computer systems
US5991893A (en) * 1997-08-29 1999-11-23 Hewlett-Packard Company Virtually reliable shared memory
US6212585B1 (en) 1997-10-01 2001-04-03 Micron Electronics, Inc. Method of automatically configuring a server after hot add of a device
US6138179A (en) * 1997-10-01 2000-10-24 Micron Electronics, Inc. System for automatically partitioning and formatting a primary hard disk for installing software in which selection of extended partition size is not related to size of hard disk
US6175490B1 (en) 1997-10-01 2001-01-16 Micron Electronics, Inc. Fault tolerant computer system
US6263387B1 (en) 1997-10-01 2001-07-17 Micron Electronics, Inc. System for automatically configuring a server after hot add of a device
US6199173B1 (en) 1997-10-01 2001-03-06 Micron Electronics, Inc. Method for mapping environmental resources to memory for program access
US6799224B1 (en) 1998-03-10 2004-09-28 Quad Research High speed fault tolerant mass storage network information server
US6185695B1 (en) 1998-04-09 2001-02-06 Sun Microsystems, Inc. Method and apparatus for transparent server failover for highly available objects
AU3861399A (en) * 1998-04-15 1999-11-01 Hewlett-Packard Company Distributed processing over a network
US6260155B1 (en) * 1998-05-01 2001-07-10 Quad Research Network information server
WO1999059064A1 (en) * 1998-05-12 1999-11-18 Sun Microsystems, Inc. Highly available cluster virtual disk system
US5964886A (en) * 1998-05-12 1999-10-12 Sun Microsystems, Inc. Highly available cluster virtual disk system
US6161191A (en) * 1998-05-12 2000-12-12 Sun Microsystems, Inc. Mechanism for reliable update of virtual disk device mappings without corrupting data
US6421787B1 (en) 1998-05-12 2002-07-16 Sun Microsystems, Inc. Highly available cluster message passing facility
US6173413B1 (en) 1998-05-12 2001-01-09 Sun Microsystems, Inc. Mechanism for maintaining constant permissions for multiple instances of a device within a cluster
US6182197B1 (en) 1998-07-10 2001-01-30 International Business Machines Corporation Real-time shared disk system for computer clusters
US6205503B1 (en) 1998-07-17 2001-03-20 Mallikarjunan Mahalingam Method for the hot swap and add of input/output platforms and devices
US6223234B1 (en) 1998-07-17 2001-04-24 Micron Electronics, Inc. Apparatus for the hot swap and add of input/output platforms and devices
US6119244A (en) 1998-08-25 2000-09-12 Network Appliance, Inc. Coordinating persistent status information with multiple file servers
US6594698B1 (en) * 1998-09-25 2003-07-15 Ncr Corporation Protocol for dynamic binding of shared resources
US6223231B1 (en) 1998-11-12 2001-04-24 Sun Microsystems, Inc. Method and apparatus for highly-available processing of I/O requests while application processing continues
JP2000172624A (ja) * 1998-12-07 2000-06-23 Hitachi Ltd 入出力処理システム
US6530036B1 (en) 1999-08-17 2003-03-04 Tricord Systems, Inc. Self-healing computer system storage
US6449731B1 (en) 1999-03-03 2002-09-10 Tricord Systems, Inc. Self-healing computer system storage
US6725392B1 (en) 1999-03-03 2004-04-20 Adaptec, Inc. Controller fault recovery system for a distributed file system
US6546482B1 (en) * 1999-05-07 2003-04-08 Advanced Micro Devices, Inc. Invalid configuration detection resource
US6961749B1 (en) 1999-08-25 2005-11-01 Network Appliance, Inc. Scalable file server with highly available pairs
WO2001014991A2 (en) * 1999-08-24 2001-03-01 Network Appliance, Inc. Scalable file server with highly available pairs
JP2001134546A (ja) * 1999-11-05 2001-05-18 Nec Corp マルチプロセッサシステムの障害処理方法
GB2359384B (en) * 2000-02-16 2004-06-16 Data Connection Ltd Automatic reconnection of partner software processes in a fault-tolerant computer system
US6782440B2 (en) 2000-07-26 2004-08-24 T.N.S. Holdings, Inc. Resource locking and thread synchronization in a multiprocessor environment
US6715059B2 (en) 2000-07-26 2004-03-30 Tas Holdings, Inc. Methods and systems for a shared memory unit with extendable functions
US6892298B2 (en) 2000-07-26 2005-05-10 Times N Systems, Inc. Load/store micropacket handling system
JP3992427B2 (ja) * 2000-08-01 2007-10-17 株式会社日立製作所 ファイルシステム
US7072916B1 (en) 2000-08-18 2006-07-04 Network Appliance, Inc. Instant snapshot
US6728922B1 (en) 2000-08-18 2004-04-27 Network Appliance, Inc. Dynamic data space
US6636879B1 (en) * 2000-08-18 2003-10-21 Network Appliance, Inc. Space allocation in a write anywhere file system
US7296073B1 (en) 2000-09-13 2007-11-13 Network Appliance, Inc. Mechanism to survive server failures when using the CIFS protocol
US6725393B1 (en) * 2000-11-06 2004-04-20 Hewlett-Packard Development Company, L.P. System, machine, and method for maintenance of mirrored datasets through surrogate writes during storage-area network transients
US7509322B2 (en) 2001-01-11 2009-03-24 F5 Networks, Inc. Aggregated lock management for locking aggregated files in a switched file system
US20040133606A1 (en) 2003-01-02 2004-07-08 Z-Force Communications, Inc. Directory aggregation for files distributed over a plurality of servers in a switched file system
US8239354B2 (en) * 2005-03-03 2012-08-07 F5 Networks, Inc. System and method for managing small-size files in an aggregated file system
US8195760B2 (en) 2001-01-11 2012-06-05 F5 Networks, Inc. File aggregation in a switched file system
US7512673B2 (en) * 2001-01-11 2009-03-31 Attune Systems, Inc. Rule based aggregation of files and transactions in a switched file system
ATE480822T1 (de) * 2001-02-13 2010-09-15 Candera Inc Failover-verarbeitung in einem speicherungssystem
DE10204457B4 (de) * 2001-03-07 2005-04-28 Conti Temic Microelectronic Mikroprozessor mit einem Taktgenerator und einer Überwachungseinheit sowie Verfahren zum Betrieb eines solchen
US6668264B1 (en) 2001-04-03 2003-12-23 Network Appliance, Inc. Resynchronization of a target volume with a source volume
US7308512B1 (en) 2001-05-16 2007-12-11 Network Appliance, Inc. Fiber channel adaptor for serial or parallel ATA disks
US6944785B2 (en) * 2001-07-23 2005-09-13 Network Appliance, Inc. High-availability cluster virtual server system
US7685126B2 (en) 2001-08-03 2010-03-23 Isilon Systems, Inc. System and methods for providing a distributed file system utilizing metadata to track information about data stored throughout the system
US7146524B2 (en) * 2001-08-03 2006-12-05 Isilon Systems, Inc. Systems and methods for providing a distributed file system incorporating a virtual hot spare
US20030033463A1 (en) 2001-08-10 2003-02-13 Garnett Paul J. Computer system storage
US6944787B2 (en) * 2001-10-01 2005-09-13 International Business Machines Corporation System-managed duplexing of coupling facility structures
JPWO2003075161A1 (ja) * 2002-03-07 2005-06-30 富士通株式会社 ストレージ仮想化システムの変換管理装置およびストレージ仮想化システムの変換管理方法
CN1647449B (zh) * 2002-04-16 2011-01-26 汤姆森许可公司 用于在双向通信装置中支持多重协作会话的方法、装置和系统
US7254745B2 (en) 2002-10-03 2007-08-07 International Business Machines Corporation Diagnostic probe management in data processing systems
AU2003291014A1 (en) * 2002-11-14 2004-06-15 Isilon Systems, Inc. Systems and methods for restriping files in a distributed file system
JP3944449B2 (ja) * 2002-12-19 2007-07-11 株式会社日立製作所 計算機システム、磁気ディスク装置、および、ディスクキャッシュ制御方法
JP2004234555A (ja) * 2003-01-31 2004-08-19 Hitachi Ltd ストレージシステムの制御方法、ストレージシステム、及びプログラム
JP4342804B2 (ja) * 2003-01-31 2009-10-14 株式会社日立製作所 ストレージシステムの制御方法、ストレージシステム、及びプログラム
JP2004234558A (ja) * 2003-01-31 2004-08-19 Hitachi Ltd 記憶デバイス制御装置、及びプログラム
US7739543B1 (en) * 2003-04-23 2010-06-15 Netapp, Inc. System and method for transport-level failover for loosely coupled iSCSI target devices
US7260589B2 (en) * 2003-12-04 2007-08-21 International Business Machines Corporation High performance support for XA protocols in a clustered shared database
US20050144299A1 (en) * 2003-12-04 2005-06-30 Blevins Delmar E. System and method for supporting XA 2-phase commit protocols with a loosely coupled clustered database server
EP1564975B1 (en) * 2004-02-12 2006-11-15 Alcatel Service request handling method and storage system
US7908445B2 (en) * 2004-07-19 2011-03-15 Infortrend Technology, Inc. Redundant controller dynamic logical media unit reassignment
JP2006039814A (ja) * 2004-07-26 2006-02-09 Hitachi Ltd ネットワークストレージシステム及び複数ネットワークストレージ間の引継方法
US20060026788A1 (en) * 2004-08-06 2006-02-09 Fischer Richard J Upright vacuum cleaner incorporating telescopic handle and wand assembly with electrified hose
GB2419697A (en) 2004-10-29 2006-05-03 Hewlett Packard Development Co Virtual overlay infrastructures each having an infrastructure controller
US8238350B2 (en) 2004-10-29 2012-08-07 Emc Corporation Message batching with checkpoints systems and methods
GB2419702A (en) 2004-10-29 2006-05-03 Hewlett Packard Development Co Virtual overlay infrastructures which can be suspended and later reactivated
US8051425B2 (en) 2004-10-29 2011-11-01 Emc Corporation Distributed system with asynchronous execution systems and methods
GB2419703A (en) 2004-10-29 2006-05-03 Hewlett Packard Development Co Isolated virtual overlay infrastructures each having an interface to control interaction with others
US8055711B2 (en) 2004-10-29 2011-11-08 Emc Corporation Non-blocking commit protocol systems and methods
US7568121B2 (en) * 2004-11-16 2009-07-28 International Business Machines Corporation Recovery from failure in data storage systems
US7885970B2 (en) 2005-01-20 2011-02-08 F5 Networks, Inc. Scalable system for partitioning and accessing metadata over multiple servers
US7958347B1 (en) 2005-02-04 2011-06-07 F5 Networks, Inc. Methods and apparatus for implementing authentication
US7496790B2 (en) * 2005-02-25 2009-02-24 International Business Machines Corporation Method, apparatus, and computer program product for coordinating error reporting and reset utilizing an I/O adapter that supports virtualization
US20060212870A1 (en) * 2005-02-25 2006-09-21 International Business Machines Corporation Association of memory access through protection attributes that are associated to an access control level on a PCI adapter that supports virtualization
JP4387968B2 (ja) * 2005-03-28 2009-12-24 富士通株式会社 障害検出装置および障害検出方法
US7849199B2 (en) 2005-07-14 2010-12-07 Yahoo ! Inc. Content router
US7631045B2 (en) 2005-07-14 2009-12-08 Yahoo! Inc. Content router asynchronous exchange
US7623515B2 (en) 2005-07-14 2009-11-24 Yahoo! Inc. Content router notification
US7797283B2 (en) 2005-10-21 2010-09-14 Isilon Systems, Inc. Systems and methods for maintaining distributed data
US7346720B2 (en) * 2005-10-21 2008-03-18 Isilon Systems, Inc. Systems and methods for managing concurrent access requests to a shared resource
US7788303B2 (en) 2005-10-21 2010-08-31 Isilon Systems, Inc. Systems and methods for distributed system scanning
US7386675B2 (en) * 2005-10-21 2008-06-10 Isilon Systems, Inc. Systems and methods for using excitement values to predict future access to resources
US7917474B2 (en) 2005-10-21 2011-03-29 Isilon Systems, Inc. Systems and methods for accessing and updating distributed data
US7551572B2 (en) * 2005-10-21 2009-06-23 Isilon Systems, Inc. Systems and methods for providing variable protection
EP1949214B1 (en) * 2005-10-28 2012-12-19 Network Appliance, Inc. System and method for optimizing multi-pathing support in a distributed storage system environment
US8024290B2 (en) 2005-11-14 2011-09-20 Yahoo! Inc. Data synchronization and device handling
US8065680B2 (en) 2005-11-15 2011-11-22 Yahoo! Inc. Data gateway for jobs management based on a persistent job table and a server table
US9367832B2 (en) * 2006-01-04 2016-06-14 Yahoo! Inc. Synchronizing image data among applications and devices
US7848261B2 (en) 2006-02-17 2010-12-07 Isilon Systems, Inc. Systems and methods for providing a quiescing protocol
US7756898B2 (en) 2006-03-31 2010-07-13 Isilon Systems, Inc. Systems and methods for notifying listeners of events
US8417746B1 (en) 2006-04-03 2013-04-09 F5 Networks, Inc. File system management with enhanced searchability
US8539056B2 (en) 2006-08-02 2013-09-17 Emc Corporation Systems and methods for configuring multiple network interfaces
US7676691B2 (en) 2006-08-18 2010-03-09 Isilon Systems, Inc. Systems and methods for providing nonlinear journaling
US7752402B2 (en) 2006-08-18 2010-07-06 Isilon Systems, Inc. Systems and methods for allowing incremental journaling
US7680842B2 (en) 2006-08-18 2010-03-16 Isilon Systems, Inc. Systems and methods for a snapshot of data
US7590652B2 (en) 2006-08-18 2009-09-15 Isilon Systems, Inc. Systems and methods of reverse lookup
US7680836B2 (en) * 2006-08-18 2010-03-16 Isilon Systems, Inc. Systems and methods for a snapshot of data
US7953704B2 (en) 2006-08-18 2011-05-31 Emc Corporation Systems and methods for a snapshot of data
US7882071B2 (en) 2006-08-18 2011-02-01 Isilon Systems, Inc. Systems and methods for a snapshot of data
US7822932B2 (en) 2006-08-18 2010-10-26 Isilon Systems, Inc. Systems and methods for providing nonlinear journaling
US7899800B2 (en) 2006-08-18 2011-03-01 Isilon Systems, Inc. Systems and methods for providing nonlinear journaling
US8286029B2 (en) 2006-12-21 2012-10-09 Emc Corporation Systems and methods for managing unavailable storage devices
US7593938B2 (en) 2006-12-22 2009-09-22 Isilon Systems, Inc. Systems and methods of directory entry encodings
US7509448B2 (en) 2007-01-05 2009-03-24 Isilon Systems, Inc. Systems and methods for managing semantic locks
GB2446177A (en) * 2007-02-03 2008-08-06 Katherine Bean Data storage system
US7900015B2 (en) 2007-04-13 2011-03-01 Isilon Systems, Inc. Systems and methods of quota accounting
US7779048B2 (en) 2007-04-13 2010-08-17 Isilon Systems, Inc. Systems and methods of providing possible value ranges
US8966080B2 (en) 2007-04-13 2015-02-24 Emc Corporation Systems and methods of managing resource utilization on a threaded computer system
WO2008147973A2 (en) 2007-05-25 2008-12-04 Attune Systems, Inc. Remote file virtualization in a switched file system
US8560691B2 (en) * 2007-06-19 2013-10-15 Microsoft Corporation Relocating item in distributed storage system
US7882068B2 (en) 2007-08-21 2011-02-01 Isilon Systems, Inc. Systems and methods for adaptive copy on write
US7966289B2 (en) 2007-08-21 2011-06-21 Emc Corporation Systems and methods for reading objects in a file system
US7949692B2 (en) 2007-08-21 2011-05-24 Emc Corporation Systems and methods for portals into snapshot data
US8548953B2 (en) 2007-11-12 2013-10-01 F5 Networks, Inc. File deduplication using storage tiers
US8352785B1 (en) * 2007-12-13 2013-01-08 F5 Networks, Inc. Methods for generating a unified virtual snapshot and systems thereof
US7949636B2 (en) 2008-03-27 2011-05-24 Emc Corporation Systems and methods for a read only mode for a portion of a storage system
US7953709B2 (en) 2008-03-27 2011-05-31 Emc Corporation Systems and methods for a read only mode for a portion of a storage system
US7870345B2 (en) 2008-03-27 2011-01-11 Isilon Systems, Inc. Systems and methods for managing stalled storage devices
US7984324B2 (en) 2008-03-27 2011-07-19 Emc Corporation Systems and methods for managing stalled storage devices
US8549582B1 (en) 2008-07-11 2013-10-01 F5 Networks, Inc. Methods for handling a multi-protocol content name and systems thereof
US8001425B2 (en) * 2009-04-08 2011-08-16 Hewlett-Packard Development Company, L.P, Preserving state information of a storage subsystem in response to communication loss to the storage subsystem
US8161142B2 (en) * 2009-10-26 2012-04-17 International Business Machines Corporation Addressing node failure during a hyperswap operation
US10721269B1 (en) 2009-11-06 2020-07-21 F5 Networks, Inc. Methods and system for returning requests with javascript for clients before passing a request to a server
US9195500B1 (en) 2010-02-09 2015-11-24 F5 Networks, Inc. Methods for seamless storage importing and devices thereof
US8204860B1 (en) 2010-02-09 2012-06-19 F5 Networks, Inc. Methods and systems for snapshot reconstitution
US8347100B1 (en) 2010-07-14 2013-01-01 F5 Networks, Inc. Methods for DNSSEC proxying and deployment amelioration and systems thereof
US9286298B1 (en) 2010-10-14 2016-03-15 F5 Networks, Inc. Methods for enhancing management of backup data sets and devices thereof
CN102455878A (zh) * 2010-10-19 2012-05-16 英业达股份有限公司 动态磁盘访问方法
US8396836B1 (en) 2011-06-30 2013-03-12 F5 Networks, Inc. System for mitigating file virtualization storage import latency
US8463850B1 (en) 2011-10-26 2013-06-11 F5 Networks, Inc. System and method of algorithmically generating a server side transaction identifier
EP2804090A4 (en) * 2012-01-13 2015-08-19 Hitachi Ltd INFORMATION PROCESSING SYSTEM
US9020912B1 (en) 2012-02-20 2015-04-28 F5 Networks, Inc. Methods for accessing data in a compressed file system and devices thereof
US20130346532A1 (en) * 2012-06-21 2013-12-26 Microsoft Corporation Virtual shared storage in a cluster
US9519501B1 (en) 2012-09-30 2016-12-13 F5 Networks, Inc. Hardware assisted flow acceleration and L2 SMAC management in a heterogeneous distributed multi-tenant virtualized clustered system
US9442852B2 (en) * 2012-11-27 2016-09-13 International Business Machines Corporation Programmable coherent proxy for attached processor
US9069674B2 (en) 2012-11-27 2015-06-30 International Business Machines Corporation Coherent proxy for attached processor
US9135174B2 (en) 2012-11-27 2015-09-15 International Business Machines Corporation Coherent attached processor proxy supporting master parking
US8938587B2 (en) 2013-01-11 2015-01-20 International Business Machines Corporation Data recovery for coherent attached processor proxy
US9021211B2 (en) 2013-01-11 2015-04-28 International Business Machines Corporation Epoch-based recovery for coherent attached processor proxy
US8990513B2 (en) 2013-01-11 2015-03-24 International Business Machines Corporation Accelerated recovery for snooped addresses in a coherent attached processor proxy
US9195483B2 (en) 2013-01-28 2015-11-24 Dell Products L.P. Systems and methods for mirroring virtual functions in a chassis configured to receive a plurality of modular information handling systems and a plurality of modular information handling resources
US10375155B1 (en) 2013-02-19 2019-08-06 F5 Networks, Inc. System and method for achieving hardware acceleration for asymmetric flow connections
US9554418B1 (en) 2013-02-28 2017-01-24 F5 Networks, Inc. Device for topology hiding of a visited network
US10404520B2 (en) 2013-05-29 2019-09-03 Microsoft Technology Licensing, Llc Efficient programmatic memory access over network file access protocols
US9641614B2 (en) 2013-05-29 2017-05-02 Microsoft Technology Licensing, Llc Distributed storage defense in a cluster
US9965363B2 (en) * 2013-12-14 2018-05-08 Netapp, Inc. Techniques for LIF placement in SAN storage cluster synchronous disaster recovery
US11838851B1 (en) 2014-07-15 2023-12-05 F5, Inc. Methods for managing L7 traffic classification and devices thereof
US10182013B1 (en) 2014-12-01 2019-01-15 F5 Networks, Inc. Methods for managing progressive image delivery and devices thereof
US11895138B1 (en) 2015-02-02 2024-02-06 F5, Inc. Methods for improving web scanner accuracy and devices thereof
US10834065B1 (en) 2015-03-31 2020-11-10 F5 Networks, Inc. Methods for SSL protected NTLM re-authentication and devices thereof
US11030045B2 (en) 2015-07-28 2021-06-08 Futurewei Technologies, Inc. Apparatus and method for utilizing different data storage types to store primary and replicated database directories
US10404698B1 (en) 2016-01-15 2019-09-03 F5 Networks, Inc. Methods for adaptive organization of web application access points in webtops and devices thereof
US10797888B1 (en) 2016-01-20 2020-10-06 F5 Networks, Inc. Methods for secured SCEP enrollment for client devices and devices thereof
US10459632B1 (en) * 2016-09-16 2019-10-29 EMC IP Holding Company LLC Method and system for automatic replication data verification and recovery
US10412198B1 (en) 2016-10-27 2019-09-10 F5 Networks, Inc. Methods for improved transmission control protocol (TCP) performance visibility and devices thereof
US10567492B1 (en) 2017-05-11 2020-02-18 F5 Networks, Inc. Methods for load balancing in a federated identity environment and devices thereof
US11223689B1 (en) 2018-01-05 2022-01-11 F5 Networks, Inc. Methods for multipath transmission control protocol (MPTCP) based session migration and devices thereof
US10833943B1 (en) 2018-03-01 2020-11-10 F5 Networks, Inc. Methods for service chaining and devices thereof
US11669256B2 (en) 2018-09-27 2023-06-06 Telefonaktiebolaget Lm Ericsson (Publ) Storage resource controller in a 5G network system
US12003422B1 (en) 2018-09-28 2024-06-04 F5, Inc. Methods for switching network packets based on packet data and devices

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0323013B1 (en) * 1987-11-30 1995-08-30 International Business Machines Corporation Method of operating a multiprocessor system employing a shared virtual memory
US5193086A (en) * 1988-08-26 1993-03-09 Hitachi, Ltd. Network system having a line switching function
JPH0394321A (ja) * 1989-06-21 1991-04-19 Hitachi Ltd アクセス制御方法
JPH03132143A (ja) * 1989-10-17 1991-06-05 Fujitsu Ltd 交換機システムにおける非常再開処理方式
CA2032620C (en) * 1989-12-22 1995-08-15 Takafumi Chujo Method for searching for alternate path in communication network
US5212785A (en) * 1990-04-06 1993-05-18 Micro Technology, Inc. Apparatus and method for controlling data flow between a computer and memory devices
US5155845A (en) * 1990-06-15 1992-10-13 Storage Technology Corporation Data storage system for providing redundant copies of data on different disk drives
JP2825630B2 (ja) * 1990-09-07 1998-11-18 株式会社日立製作所 回線切替方式

Also Published As

Publication number Publication date
KR960015278A (ko) 1996-05-22
EP0709779A3 (en) 1996-10-16
DE69521101T2 (de) 2001-10-18
KR100232247B1 (ko) 1999-12-01
US5668943A (en) 1997-09-16
JPH08255122A (ja) 1996-10-01
EP0709779A2 (en) 1996-05-01
DE69521101D1 (de) 2001-07-05
EP0709779B1 (en) 2001-05-30

Similar Documents

Publication Publication Date Title
JP3266481B2 (ja) クラスタ化コンピューティング・システムのディスク・アクセス・パスにおける障害から回復する方法および関連する装置
US6161191A (en) Mechanism for reliable update of virtual disk device mappings without corrupting data
FI101432B (fi) Vikasietoinen tietokonejärjestelmä
US5964886A (en) Highly available cluster virtual disk system
JP3364572B2 (ja) 多重パスi/o要求機構を有するデータ処理システム及びキュー・ステータス更新方法
US6173413B1 (en) Mechanism for maintaining constant permissions for multiple instances of a device within a cluster
US7664909B2 (en) Method and apparatus for a shared I/O serial ATA controller
US6345368B1 (en) Fault-tolerant access to storage arrays using active and quiescent storage controllers
US6185601B1 (en) Dynamic load balancing of a network of client and server computers
US6044367A (en) Distributed I/O store
US6868442B1 (en) Methods and apparatus for processing administrative requests of a distributed network application executing in a clustered computing environment
JP4567125B2 (ja) データ・ストレージとデータ処理システムにおける書き込みキャッシュデータの転送方法及びその装置
US6101508A (en) Clustered file management for network resources
JPH11316749A (ja) デ―タ・ストレ―ジ・システムにおける冗長デ―タの識別方法
US11200082B2 (en) Data storage system employing dummy namespaces for discovery of NVMe namespace groups as protocol endpoints
JPH11328135A (ja) 並列処理コンピュ―タ・システム
US6715099B1 (en) High-availability architecture using high-speed pipes
JPH103441A (ja) Cpu及び多重メモリ装置間のリファレンスによるコンピュータシステムデータi/o
US7003645B2 (en) Use of a storage medium as a communications network for liveness determination in a high-availability cluster
EP1084471B1 (en) Highly available cluster virtual disk system
JP4208506B2 (ja) 高性能記憶装置アクセス環境
CN113849136B (zh) 一种基于国产平台的自动化fc块存储处理方法和系统
JPH10307732A (ja) メッセージ伝送方法
US20060031622A1 (en) Software transparent expansion of the number of fabrics coupling multiple processsing nodes of a computer system
US6032267A (en) Apparatus and method for efficient modularity in a parallel, fault tolerant, message based operating system

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080111

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090111

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090111

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100111

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100111

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110111

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120111

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130111

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees