JP5185483B2 - ストレージネットワーク内のクォーラムリソースアービタ - Google Patents

ストレージネットワーク内のクォーラムリソースアービタ Download PDF

Info

Publication number
JP5185483B2
JP5185483B2 JP2001540586A JP2001540586A JP5185483B2 JP 5185483 B2 JP5185483 B2 JP 5185483B2 JP 2001540586 A JP2001540586 A JP 2001540586A JP 2001540586 A JP2001540586 A JP 2001540586A JP 5185483 B2 JP5185483 B2 JP 5185483B2
Authority
JP
Japan
Prior art keywords
quorum
volume
computer
physical
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001540586A
Other languages
English (en)
Other versions
JP2003515813A5 (ja
JP2003515813A (ja
Inventor
バン インゲン キャサリン
ピー.カスターズ ノーバート
エヌ.ガマシェ ロッド
ディー.リネ ロバート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2003515813A publication Critical patent/JP2003515813A/ja
Publication of JP2003515813A5 publication Critical patent/JP2003515813A5/ja
Application granted granted Critical
Publication of JP5185483B2 publication Critical patent/JP5185483B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5011Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0631Configuration or reconfiguration of storage systems by allocating resources to storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/505Clust

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Hardware Redundancy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Multi Processors (AREA)

Description

【0001】
(関連出願)
本出願は、本出願と同日に出願され同じ譲受人に譲渡された、以下のすべての出願に関連するものである。
第09/449577号(整理番号777245US1)「Storage Management System Having Common Volume Manager」
第09/450364号(整理番号777246US1)「Storage Management System Having Abstracted Volume Providers」
第09/451219号(整理番号777247US1)「Volume Stacking Model」
第09/450300号(整理番号777248US1)「Volume Configuration Data Administration」
第0/451220号(整理番号777249US1)「Volume Migration Between Volume Groups」
【0002】
(発明の分野)
本発明は、一般にデータ記憶デバイスに関し、より詳細には、ストレージネットワーク内での論理クォーラムリソースのアービトレーション機構に関する。
【0003】
(版権の通知/許可)
本特許文書の開示の一部には、版権保護を対象とする資料が含まれている。版権所有者は、特許商標事務所の特許ファイルまたは記録に表示されているものと同じ特許文書または特許開示を複製することに異議はないが、そうでない場合はあらゆる版権を保有する。以下の通知は、下記および図面に記載するようなソフトウェアおよびデータに適用される。
Copyright 1999, Microsoft Corporation, All Rights Reserved。
【0004】
(発明の背景)
コンピュータシステムを発展させる場合、磁気ディスクや光ディスクなどのデータ記憶デバイスを利用および構成することができる。たとえば、これらの記憶デバイスは、バスを介してコンピュータシステムに接続するか、または無線または有線のネットワークを介してコンピュータシステムに接続することができる。さらにこれらの記憶デバイスは、分離するかまたは単一キャビネット内に配置することができる。
【0005】
ストレージネットワークとは、ノードと呼ばれ、単一の記憶資源として動作する、相互接続されたコンピューティングシステムの集まりのことである。ストレージネットワークでは、ハードウェアまたはソフトウェアに障害が発生した場合でもシステムの動作を続行させることが可能であり、ノードを簡単に追加できるようにすることでスケーラビリティを高くし、管理者がノードを単一のシステムとして管理できるようにすることで管理を簡略化する。
【0006】
クラスタソフトウェアはそれぞれのノード上にあり、ストレージネットワークのクラスタに特有のすべての活動を管理する。クラスタソフトウェアは、しばしば、ノードのスタートアップを自動的に実行する。この際、クラスタソフトウェアはローカルの非共有デバイスを構成して装着する。また、クラスタソフトウェアは、ストレージネットワークの他のメンバが動作可能であるかどうかを判定するための「発見」プロセスも使用する。クラスタソフトウェアは既存のクラスタを発見すると、認証シーケンスを実行することによってそのクラスタの接合を試みる。既存クラスタのクラスタマスタは新規クラスタを認証し、接合ノードの認証が成功すれば、その状況を戻す。ノードがメンバとして認識されない場合は、接合要求が拒否される。
【0007】
発見プロセス中にクラスタが見つからない場合、ノードは独自のクラスタの形成を試みる。このプロセスは、ノードが自分の属するクラスタと通信できないときには何回でも繰り返される。従来のコンピューティングシステムでは、ノードは、ストレージネットワークを形成するために、ディスクなどの物理「クォーラムリソース」(physical “quorum resource”)に対してアービトレーションを実行する。最近のシステムでは、クォーラムリソースは、1つまたは複数の物理クォーラムリソースを含むボリュームなどの論理リソースが可能である。たとえばボリュームは、ディスクの一部分、ディスク全体、複数ディスクの一部分、または複数ディスクである可能性のある論理記憶ユニットである。
【0008】
従来のシステムでは、クラスタの所有権を決定する、すなわちアービトレーションプロセスを実施するための役割および情報が、いくつかの構成要素および/またはソフトウェアモジュール間で分配されることが多い。基礎となる記憶デバイスを構成および管理するための役割も、同様に分配されることが多い。このように役割を明確に分割しないと、所与の構成要素またはソフトウェアモジュールを変更することが困難になる。したがって、当分野では、クラスタ管理からのクラスタアービトレーションの役割と、ボリューム管理および基礎となる記憶デバイスの役割とを、より明確に分離することが求められている。
【0009】
(発明の概要)
本発明は、上記の短所、欠点、および問題点に対処するものである。本発明のクラスタ管理ソフトウェアおよびボリューム管理ソフトウェアは、ストレージネットワークのノード上で実行され、クォーラムボリュームなどの論理クォーラムリソースをアービトレーションするために、基礎となるオペレーティングシステムと協働して動作する。本発明によれば、クラスタ管理ソフトウェアは論理クォーラムリソースをアービトレーションし、基礎となる物理クォーラムリソースの知識を持たずにストレージネットワークを形成する。この方法では、クラスタ管理ソフトウェアはハードウェア特有のものではない。さらに、クラスタ管理ソフトウェアは、基礎となる物理クォーラムリソースから論理クォーラムリソースがどのように形成されるかを知っておく必要がない。たとえば、ボリューム管理ソフトウェアが管理する役割は、論理クォーラムボリュームの形成および装着のみである。ボリューム管理ソフトウェアは、アービトレーションプロセスおよび所有権決定に関する詳細な知識を持たずに、ボリューム管理を実行する。
【0010】
(発明の詳細な説明)
本発明の例示的な実施形態を詳細に説明する以下の記述では、本明細書の一部であり、本発明が実施可能な特有の例示的な実施形態が例として示されている、添付の図面を参照する。これらの実施形態は、当分野の技術者が本発明を実施できるように詳細に記述されており、他の実施形態が利用可能であること、および本発明の範囲を逸脱することなく変更が可能であることが理解されよう。したがって、以下の詳細な説明は限定的なものではなく、本発明の範囲は特許請求の範囲によってのみ定義される。
【0011】
詳細な説明は、4つのセクションに分けられる。第1のセクションは用語集である。第2のセクションでは、本発明の実施形態がそれと共に実施可能なハードウェアおよび動作環境について説明する。第3のセクションでは、本発明のシステムレベルの概要を示す。最後に第4のセクションでは、詳細な説明の結果を示す。
【0012】
[用語の定義]
損失:フォールトトレラントボリュームに、1つまたは複数のディスクまたはボリュームエクステントがないことを示す状況。たとえば、現在1つのミラーしか使用できないミラーセット。
【0013】
構成データ:物理リソースを論理ボリュームにマッピングすることを示す。
【0014】
指示された構成:プロバイダに、論理ブロックの再マッピングを選択するための規則が明示的に与えられること。
【0015】
ディスクプラッタ:ディスクパックからボリュームをエクスポートまたはインポートするのに使用される、ディスクパックのサブセット。
【0016】
ディスクパック:論理ボリュームと基礎となるディスクの集まり。ディスクパックとは、ボリュームの推移閉包の単位である。
【0017】
エクスポート:ディスクプラッタおよびそのプラッタに含まれるすべてのボリュームを、1つのディスクパックから移動すること。
【0018】
露出された:ボリュームに、関連するボリューム名(ドライブ文字)または装着位置がある場合、ボリュームはオペレーティングシステムに対して露出されている。ボリュームは、ファイルシステムまたは他のデータ格納に使用可能にする
ことができる。
【0019】
フリーエージェントドライブ:ディスクパックのメンバでないディスクドライブ。フリーエージェントドライブは、露出された論理ボリュームを含むことはできない。
【0020】
健全:ボリューム障害管理状況。ボリュームの状況には、初期、健全、損失、不健全、または再構築がある。
【0021】
健全な:有効データを含んでいるかまたは含むことができる。
【0022】
ホットスポッティング:ボリュームまたはボリュームエクステントの集まりを一時的にプレクシング(plexing)すること。
【0023】
インポート:ディスクプラッタおよびそのプラッタに含まれるすべてのボリュームを、1つのディスクパックに移動すること。
【0024】
初期化:ボリュームがボリューム構成を再発見していることを示す状況。
【0025】
LBN:論理ブロック番号
【0026】
論理ブロックマッピング:論理ボリュームプロバイダに対して露出された論理ブロックと、同じプロバイダによって露出された論理ブロックとの関係。
【0027】
論理クォーラムリソースストレージネットワークの形成に必要な論理リソース。論理ボリュームなどの論理クォーラムリソースには、ディスクなどの1つまたは複数の物理クォーラムリソースが含まれる。
【0028】
論理ボリューム:ディスクの一部分、ディスク全体、複数ディスクの一部分、または複数ディスクである可能性のある、論理記憶ユニット。
【0029】
論理ボリュームプロバイダ:論理ボリュームを露出するソフトウェア。プロバイダには、ランタイムサービス、構成データ、および管理サービスが含まれる。
【0030】
管理サービス:ボリュームの構成、モニタリング、または障害処理を実行するために、まれにしか実行されないソフトウェア。
【0031】
マッピング済みボリューム:単一のより大きなボリュームを露出するためにボリュームを連結する、単純な線形の論理ブロックマッピング。
【0032】
ミラーリング済みボリューム:2つまたはそれ以上の同一のデータコピーを維持する論理ボリューム。RAID 1とも呼ばれる。
【0033】
パリティストライピング済みボリューム:パリティチェック情報ならびにデータを維持する論理ボリューム。厳密なマッピングおよび保護方式は、ベンダ特有のものである。RAID3、4、5、6が含まれる。
【0034】
プレクシング済みボリューム:動的なミラーボリューム。プレクシングは、フォールトトレランスを提供するのではなく、ボリュームのコピーを作成するのに使用される。ミラーは、コンテンツが同期化された後に除去する意図で、ボリュームに追加される。
【0035】
RAID:Redundant Array of Independent Disks
【0036】
再構築:以前に損失したフォールトトレラントボリュームがすべてのボリュームエクステントデータを再同期化することを示す状況。
【0037】
ランタイムサービス:IOごとの要求ベースで実行されるソフトウェア。
【0038】
SCSI:Small−Computer Systems Interface
【0039】
スタック済みボリューム:複数の論理ブロックマッピング動作によって構築されたボリューム。一例として、ミラーボリュームのストライプセットが挙げられる。スタッキングには、ストリッピング、マッピング、およびプレクシングが含まれる。
【0040】
ストライピング済みボリューム:連続する論理ボリュームエクステントを複数のボリュームにまたがって分配する、論理ブロックマッピング。RAID0とも呼ばれる。
【0041】
不健全:非フォールトトレラントボリュームに、1つまたは複数のディスクまたはボリュームエクステントがないことを示す状況。不健全ボリュームに含まれるデータにアクセスしてはいけない。
【0042】
ボリューム構成安定性:ボリュームの論理対物理マッピングが変化しているかどうか。ボリュームには、安定、拡張、縮小、プレクシング、または再マッピングがある。
【0043】
ボリュームエクステント:ボリューム上に含まれる論理ブロックの連続する領域。ボリュームエクステントは、最小管理対象論理ボリューム単位である。
【0044】
ボリューム状況:システムによる現在のボリューム使用状況。ボリュームには、未使用、ホットスペア、マップ済み、使用、または未知がある。
【0045】
[ハードウェアおよび動作環境]
図1は、本発明の実施形態がそれと共に実施可能なハードウェアおよび動作環境を示す図である。図1の説明は、本発明がそれと共に実施可能な、適切なコンピュータハードウェアおよび適切なコンピューティング環境を、簡単かつ概略的に説明することを意図している。必須ではないが、本発明は、パーソナルコンピュータなどのコンピュータによって実行される、プログラムモジュールなどのコンピュータ実行可能命令の一般的な情況で説明される。一般に、プログラムモジュールには、特定のタスクを実行するか、または、特定の抽象データ型を実施する、ルーチン、プログラム、オブジェクト、構成要素、データ構造などが含まれる。
【0046】
さらに当分野の技術者であれば、本発明が、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースまたはプログラム可能な大衆消費電子製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータなどを含む、他のコンピュータシステム構成でも実施可能であることを理解されよう。本発明は、通信ネットワークを介してリンクされたリモート処理デバイスによってタスクが実行される、分散型コンピューティング環境でも実施可能である。分散型コンピューティング環境では、プログラムモジュールは、ローカルおよびリモートのどちらのメモリ記憶デバイスにも配置可能である。
【0047】
本発明を実施するための図1の例示的なハードウェアおよび動作環境には、コンピュータ20の形式の汎用コンピューティングデバイスが含まれ、これには、処理ユニット21、システムメモリ22、ならびに、システムメモリ22を含む様々なシステム構成要素を処理ユニット21に動作可能に結合するシステムバス23が含まれる。処理ユニット21は1つだけでも複数であってもよく、その結果、コンピュータ20のプロセッサには、単一の中央処理ユニット(CPU)が含まれるか、または一般に並列処理環境と呼ばれる複数の処理ユニットが含まれる。コンピュータ20は、従来のコンピュータ、分散型コンピュータ、または任意の他のタイプのコンピュータが可能であり、本発明はそのように限定されていない。
【0048】
システムバス23は、任意の様々なバスアーキテクチャを使用する、メモリバスまたはメモリ制御装置、周辺バス、およびローカルバスを含む、いくつかのタイプのバス構造のうちいずれかでよい。システムメモリは単にメモリと呼ぶことも可能であり、読取り専用メモリ(ROM)24およびランダムアクセスメモリ(RAM)25を含む。起動中などにコンピュータ20内の要素間で情報を転送するのを助ける基本ルーチンを含む基本入出力システム(BIOS)26が、ROM24に格納される。さらにコンピュータ20は、図示されていないハードディスクからの読取りおよびハードディスクへの書込みのためのハードディスクドライブ27、取外し可能磁気ディスク29からの読取りまたはこのディスクへの書込みのための磁気ディスクドライブ28、ならびに、CD−ROMまたは他の光学式媒体などの取外し可能光ディスク31からの読取りまたはこのディスクへの書込みのための光ディスクドライブ30を含む。
【0049】
ハードディスクドライブ27、磁気ディスクドライブ28、および光ディスクドライブ30は、それぞれハードディスクドライブインターフェース32、磁気ディスクドライブインターフェース33、および光ディスクドライブインターフェース34によって、システムバス23に接続される。ドライブおよびこれらに関連付けられたコンピュータ可読媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、およびコンピュータ20に関する他のデータの、不揮発性記憶域を提供する。当分野の技術者であれば、磁気カセット、フラッシュメモリカード、デジタルビデオディスク、ベルヌイカートリッジ、ランダムアクセスメモリ(RAMs)、読取り専用メモリ(ROMs)などの、コンピュータによってアクセス可能なデータを格納できる任意のタイプのコンピュータ可読媒体が、例示的動作環境で使用可能であることを理解されたい。
【0050】
いくつかのプログラムモジュールが、ハードディスク27、磁気ディスク29、光ディスク31、ROM24、あるいは、オペレーティングシステム35、1つまたは複数のアプリケーションプログラム36、他のプログラムモジュール37、およびプログラムデータ38を含むRAM25上に格納可能である。ユーザは、コマンドおよび情報を、キーボード40およびポインティングデバイス42などの入力デバイスを介して、パーソナルコンピュータ20に入力することができる。他の入力デバイス(図示せず)には、マイクロフォン、ジョイスティック、ゲームパッド、衛星放送用アンテナ、スキャナなどが含まれる。これらおよび他の入力デバイスは、システムバスに結合されたシリアルポートインターフェース46を介して、処理ユニット21に接続されることが多いが、パラレルポート、ゲームポート、またはユニバーサルシリアルバス(USB)などの他のインターフェースによって接続されることも可能である。モニタ47または他のタイプの表示デバイスも、ビデオアダプタ48などのインターフェースを介して、システムバス23に接続される。コンピュータには、モニタに加えて、典型的にはスピーカおよびプリンタなどの他の周辺出力デバイス(図示せず)が含まれる。
【0051】
コンピュータ20は、リモートコンピュータ49などの1つまたは複数のリモートコンピュータへの論理接続を使用して、ネットワーク化された環境で動作することができる。これらの論理接続は、ローカルコンピュータであるコンピュータ20に結合されたかまたはこの一部である通信デバイスによって達成され、本発明は特定タイプの通信デバイスに限定されるものではない。リモートコンピュータ49は、他のコンピュータ、サーバ、ルータ、ネットワークPC、クライアント、ピア(peer)デバイス、または他の共通ネットワークノードであってよく、典型的には、コンピュータ20に関連した前述の要素の多くまたはすべてを含むが、図1にはメモリ記憶デバイス50のみが図示されている。図1に示されている論理接続には、ローカルエリアネットワーク(LAN)51およびワイドエリアネットワーク(WAN)52が含まれる。こうしたネットワーキング環境は、事務所、全社的なコンピュータネットワーク、イントラネット、およびインターネットで、一般的に見られるものである。
【0052】
コンピュータ20は、LANネットワーキング環境で使用される場合、通信デバイスの一種であるネットワークインターフェースまたはアダプタ53を介して、ローカルネットワーク51に接続される。コンピュータ20は、WANネットワーキング環境で使用される場合、典型的には、モデム54、通信デバイスの一種、あるいはインターネットなどのワイドエリアネットワーク52を介して通信を確立するための他の任意のタイプの通信デバイスを含む。モデム54は内部または外部であってよく、シリアルポートインターフェース46を介してシステムバス23に接続される。ネットワーク化された環境では、パーソナルコンピュータ20に関連して、またはその一部として示されたプログラムモジュールは、リモートメモリ記憶デバイスに格納することができる。図示されたネットワーク接続は例示的なものであり、コンピュータ間に通信リンクを確立するための他の手段および通信デバイスが使用可能であることが理解されよう。
【0053】
以上、本発明の実施形態がそれと共に実施可能なハードウェアおよび動作環境について説明してきた。本発明の実施形態がそれと共に実施可能なコンピュータは従来のコンピュータ、分散型コンピュータ、または任意の他のタイプのコンピュータであってよく、本発明はそのように限定されていない。こうしたコンピュータには、典型的にはその処理装置として1つまたは複数の処理ユニット、およびメモリなどのコンピュータ可読媒体が含まれる。コンピュータは、ネットワークアダプタまたはモデムなどの通信デバイスも含むことができるため、他のコンピュータと通信上で結合することができる。
【0054】
[システムレベルの概要]
図2は、ネットワーク120を介してノード110に通信上で結合されたノード105を含む、ストレージネットワーク100のシステムレベルの概要を示す構成図である。ノード105および110は、図1に示されたローカルコンピュータ20またはリモートコンピュータ49などの、任意の適切なコンピューティングシステムを表す。
【0055】
ストレージネットワーク100は、記憶デバイス107、記憶デバイス108、および記憶デバイス109を含む、記憶サブシステム106をさらに含む。これらのデバイスは、単一の内部ディスク、複数の外部ディスク、またはRAIDキャビネットなどの、任意の適切な記憶媒体であってよい。記憶サブシステム106は、デュアル接続SCSI(Small−Computer Systems Interface)、ファイバチャネルなどの任意の適切な相互接続メカニズムである、バス112を介して結合される。
【0056】
ストレージネットワーク100を形成するために、ノード105および110は、クォーラムボリュームなどの論理クォーラムリソースをアービトレーションする。図2では、論理クォーラムリソースが、物理クォーラムリソース111によって集合的に形成されたクォーラムボリュームとして示されており、本実施形態では、データ記憶デバイス108およびデータ記憶デバイス109内のデータ記憶エクステントである。ノード105または110のいずれかがすべての物理クォーラムリソース111の所有権を得ることに成功すると、成功したノードはストレージネットワーク100を形成することができる。以下で説明するように、本発明のクラスタ管理ソフトウェアおよびボリューム管理ソフトウェアは各ノード上で実行し、物理クォーラムリソース111の所有権がノード105と110とで分けられている状況を解決する。各ノード上で、クラスタ管理ソフトウェアおよびボリューム管理ソフトウェアが、ストレージネットワーク100を形成するために基礎となるオペレーティングシステムと協働する。以下で説明するように、アービトレーションおよび管理の役割は、クラスタ管理ソフトウェアとボリューム管理ソフトウェアで分担され、その結果、クラスタ管理ソフトウェアは、ボリューム管理の詳細および記憶サブシステム106について知らずに、アービトレーションプロセスを処理する。ボリューム管理ソフトウェアは、ストレージネットワーク100がどのように形成されるかを知らずに、記憶サブシステム106の構成および管理を処理する。
【0057】
図3は、様々な協働するソフトウェア構成要素が本発明のアービトレーション技法を実行する、図2のノード105またはノード110などのノード200の一実施形態を示す構成図である。ノード200では、クラスタマネージャ202がすべてのクラスタに特有の活動を監視し、ディスク制御装置206を介して記憶サブシステム106のバス112(図2)と通信する。クラスタマスタとして、クラスタマネージャ202、ボリュームマネージャ204、およびオペレーティングシステム35が協働して、ストレージネットワーク100および対応する物理クォーラムリソース111のクォーラムボリュームを管理する。より具体的に言えば、クラスタマネージャ202は、ボリューム管理および記憶サブシステム106の詳細を知らずに、アービトレーションプロセスを処理する。ボリュームマネージャは、すべてのボリュームマッピングおよびストレージネットワーク100の記憶サブシステム106の構成を処理する。ディスク制御装置206は、記憶サブシステム106とのすべての通信を処理し、SCSI、IPなどの様々なデータ通信プロトコルのうち1つを実施することができる。アプリケーション210は、ストレージネットワーク100と対話する、任意のユーザモードソフトウェアモジュールを表す。以上、本セクションでは、本発明の例示的な実施形態のシステムレベルの動作概要について、詳細に説明した。
【0058】
(本発明の例示的な実施形態の方法)
前のセクションでは、本発明の例示的な実施形態のシステムレベルの動作概要について説明した。このセクションでは、例示的な実施形態を実行中のコンピュータによって実行される特定の方法について、一連の流れ図を参照しながら説明する。コンピュータによって実行される方法は、コンピュータ実行可能命令で構成されるコンピュータプログラムとなる。流れ図を参照しながらこの方法について説明することで、当分野の技術者は、適切なコンピュータ(コンピュータ読み取り可能媒体からの命令を実行中のコンピュータのプロセッサ)上で方法を実行するためのこのような命令を含む、このようなプログラムを展開することができる。
【0059】
図4は、本発明が、クラスタ管理の役割とボリューム管理の役割を明確に分離する方法を示す図である。より具体的に言えば、アービトレーションサイクル300は、ストレージネットワーク100の各ノード上でクラスタマネージャ202およびボリュームマネージャによって実行されるときの、本発明の変形アービトレーション方法の一実施形態を示す。アービトレーションサイクル300は、ストレージネットワーク100がまだ確立されていないとき、たとえば、ノード105または110のいずれかが最初にブートされるときか、またはストレージネットワーク100があらかじめ形成されているがノード105と110の間の通信が故障しているときにいつでも、などに呼び出される。
【0060】
アービトレーションサイクル300は、ノード105またはノード110のいずれかが、ブロック302からブロック304に進むことによって開始される。ブロック304では、クラスタマネージャ202(図3)が、記憶サブシステム106の現在の所有権をすべて終了させる。一実施形態では、これはバス112をリセットすることによって達成される。次にこの動作によって、ストレージネットワーク100のすべての他のノードにアービトレーションサイクル300を実行させ、すべてのボリュームをオフラインモードにする。このモードでは、ボリュームマネージャ204が記憶サブシステム106のすべてのアクセスをブロックする。一実施形態では、アービトレーション実行ノードは、ストレージネットワーク100のすべてのノードが確実にアービトレーションに入るようにするために、アービトレーションサイクル300が進行するまでの所定の遅延期間、待機する。
【0061】
ブロック306では、それぞれの新しいかまたは除去された記憶デバイス106についての構成情報を更新するために、クラスタマネージャ202が、ストレージネットワーク100内のすべての他のノードをスキャンするように、ボリュームマネージャ204に命令する。ブロック306の終わりには、他のノードによって所有されていた情報が変更されている場合があるために、ボリュームマネージャ204によって維持される構成情報は、部分的にのみ完了することになる。したがって、ブロック308では、クラスタマネージャ202が、以前にストレージネットワーク100のノードによって所有されていた、それらの記憶サブシステム106を識別するリストを生成するように、ボリュームマネージャ204に命令する。
【0062】
ブロック309では、ボリュームマネージャ204が、生成されたリストの各記憶デバイス106から情報を読み取って処理する。ボリュームマネージャ204は、内部構成データベースを再構築する。この動作によって、アービトレーションサイクル300以前に、クォーラムリソース全体が異なるノードによって所有されていた場合であっても、アービトレーション実行ノードがストレージネットワーク100に関するクォーラムリソースを確実に発見する。ブロック309が終わると、ボリュームマネージャ204は、すべての記憶サブシステム106およびそのすべてのボリュームに関する情報を得る。
【0063】
次に、ブロック310で、クラスタマネージャ202は、クォーラムボリュームに関連付けられたすべての物理クォーラムリソース111を識別するように、ボリュームマネージャ204に要求する。ボリュームマネージャ204は、すべての記憶サブシステム106が物理クォーラムリソース111を有することを判定し、ストレージネットワーク100に関するクォーラムボリューム情報を再構築する。たとえば図1を参照すると、確実にボリュームをオンライン上に持ち出すことができるようにするために、ボリュームマネージャ204が記憶デバイス108および109の所有権を必要に応じて識別する。ブロック310が完了すると、クォーラムボリューム情報は、ストレージネットワーク100のすべてのノードに対して一貫したものとなる。この時点で、クラスタマネージャ202は記憶デバイス108および109の所有権を得ようと試みる。
【0064】
ブロック312では、クラスタマネージャ202が、物理クォーラムリソース、すなわち記憶デバイス108および109をアービトレーションするために、SCSIプロトコルによって指定された技法などの、バス112によって提供された従来のアービトレーション技法を呼び出す。これらの従来のメカニズムが終わると、ノード105または110のいずれかが、記憶デバイス108および109の両方を所有することができるか、あるいは従来のアービトレーション技法に提示された競合条件により、物理クォーラムリソース111の所有権を分けることができる。
【0065】
物理クォーラムリソース111のアービトレーションが完了した後、ボリュームマネージャ204は、ローカルノード、すなわちクラスタマネージャ202を実行中のノードが、クォーラムボリュームに必要な記憶デバイス108および109の両方の所有権を首尾よく取得したかどうかを判定する。首尾よく取得した場合、ボリュームマネージャ204はクォーラムボリュームを装着し、ブロック316でクラスタマネージャ202は、ローカルノードがクラスタマスタになることを宣言し、ストレージネットワーク100が形成されたことを他のノードに通知する。この時点で、他のノードはアービトレーションを終了し、ストレージネットワーク100を接合する。
【0066】
ローカルノードが記憶デバイス108および109の両方の所有権を有していない場合、ボリュームマネージャ204はブロック314から318に進み、ローカルノードが任意のクォーラムボリュームリソース、すなわち記憶デバイス108または109のいずれかの所有権を取得したかどうかを判定する。ローカルノードがいずれかの所有権を有していない場合、制御はクラスタマネージャ202に渡り、これがブロック320でアービトレーションを終了して、最終的にクラスタマスタとなる他のノードからの通信を待つ。
【0067】
アービトレーション実行ノードが、記憶デバイス108および109の両方ではなく一方の所有権を有する場合、ボリュームマネージャ204はブロック318からブロック322に進み、ボリュームリストがクォーラムを形成するのに十分であるかどうかを判定する。ボリュームマネージャは、ボリュームリストが適切であるかどうかを判定する際に、単純な多数決または加重投票方式などの、いくつかの異なるアルゴリズムを使用する。ボリュームリストが不十分な場合、ボリュームマネージャ204は何らかのクォーラムリソースを解放する。クラスタマネージャ202はブロック320に進み、最終的にクラスタマスタになる他のノードからの通信を待つ。
【0068】
ただし、ボリュームマネージャ204が、ボリュームリストが十分であると判定した場合、ボリュームマネージャ204はブロック322からブロック323に進み、クォーラムボリュームの装着が安全かどうかを判定する。この判定は、ボリューム特有の情報に基づいて行われる。たとえば、クォーラムボリュームが連結されたかまたはストライピングされたエクステントを使用する場合、ボリュームマネージャ204は、常に、1つのエクステントのみが所有されているときにはクォーラムボリュームの装着は安全でないと判定する。他の例として、クォーラムボリュームがRAIDVである場合、ボリュームマネージャ204は、1つを除くすべてのエクステントが必要であるというような、「マイナス1」アルゴリズムを適用することができる。さらに、ボリュームマネージャ204はユーザが選択可能な基準を適用することもできる。たとえば、クォーラムボリュームがミラーである場合、ユーザはすべてのエクステントを要求するか、または単純な多数決を要求するように、ボリュームマネージャ204を構成することができる。ボリュームマネージャ204がクォーラムボリュームを安全に装着できる場合、ボリュームマネージャ204はクォーラムボリュームを装着し、クラスタマネージャ202はブロック316に進んで、ローカルノードをクラスタマスタとして宣言する。
【0069】
ただし、ボリュームマネージャ204がクォーラムボリュームの装着が安全に実行できないと判定した場合、クラスタマネージャ202は所定の期間待機する。ブロック326で、所定の時間内にクラスタマスタからの通信が受け取られなかった場合、クラスタマネージャ202はブロック304に戻り、本発明のアービトレーション方法を繰り返す。一実施形態では、アービトレーションサイクル300が反復されるごとに、遅延期間が増加する。
【0070】
[結論]
以上、ボリューム管理ならびに論理リソースの構成の基礎となる物理的特性についての知識を必要とせずに、クラスタソフトウェアが論理クォーラムリソースのアービトレーションを実行できるようにする、本発明のアービトレーション方式の様々な実施形態について説明してきた。ボリューム管理ソフトウェアは、アービトレーションプロセスを介してクラスタの所有権がどのように確立されるかを知らずに、基礎となる記憶デバイスを管理する。この方法で、本発明は、クラスタ管理の役割とボリューム管理の役割を明確に分離する。本発明は、特許請求の範囲およびその等価物によってのみ限定されるものであることが意図されている。
【図面の簡単な説明】
【図1】 本発明の実施形態がそれと共に実施可能なハードウェアおよび動作環境を示す図である。
【図2】 2つのコンピューティングシステムおよび様々な記憶デバイスを備えたストレージネットワークのシステムレベルの概要を示すブロック図である。
【図3】 クラスタアービトレーションの役割とボリュームおよび基礎となる記憶デバイスの管理とを明確に分離した、協働するソフトウェア構成要素を有するソフトウェアシステムの一実施形態を示すブロック図である。
【図4】 本発明に従ってシステムが論理クォーラムリソースをアービトレーションする、図3のソフトウェアシステムの一動作モードを示すフローチャートである。

Claims (20)

  1. 複数のコンピュータノードと、1つまたは複数の記憶デバイス内に含まれる物理クォーラムリソースを具備する記憶サブシステムとを備えるシステムにおいて、前記物理クォーラムリソースストレージネットワークの前記コンピュータノードに利用可能である前記ストレージネットワークを形成する方法であって、
    前記システムの前記コンピュータノードのそれぞれにより前記記憶サブシステムの前記物理クォーラムリソースについての何れかの現在の所有権をプロセッサが終了させるステップと、
    新しいストレージネットワークの構成情報を更新するために前記システムのそれぞれの他のコンピュータノードを前記プロセッサがスキャンするステップと、
    1つまたは複数の前記コンピュータノードにより前記物理クォーラムリソースの所有権を決定するためにアービトレーションを前記プロセッサが呼び出すステップと、
    前記物理クォーラムリソースを備えるクォーラムボリュームを前記ストレージネットワークのメンバーに前記プロセッサが組み込むステップとを備え、
    前記現在の所有権を終了させるステップと、前記アービトレーションを呼び出すステップは、第1のプログラムモジュールにより実行され、前記それぞれの他のコンピュータノードをスキャンするステップと、前記クォーラムボリュームを組み込むステップは、前記第1のプログラムモジュールと異なる第2のプログラムモジュールにより実行されることを特徴とする方法。
  2. 前記現在の所有権を終了させるステップは、前記記憶サブシステムへのアクセスをブロックすることを含むことを特徴とする請求項1に記載の方法。
  3. 前記現在の所有権を終了させるステップは、それぞれのコンピュータノードのバスをリセットすることを含むことを特徴とする請求項1に記載の方法。
  4. 前記現在の所有権を終了させるステップは、アービトレーションを呼び出す前に所定の遅延期間待機することを含むことを特徴とする請求項1に記載の方法。
  5. 前記ストレージネットワークの前記コンピュータノードにより所有された物理クォーラムリソースを含む前記記憶サブシステムのそれぞれの記憶デバイスを識別する構成情報を前記プロセッサが生成するステップを更に備えることを特徴とする請求項1に記載の方法。
  6. 内部構成データベースを再構築するために、前記生成された構成情報に含まれるそれぞれの記憶デバイスからの前記クォーラムボリュームの情報を前記プロセッサが処理するステップを更に備えることを特徴とする請求項5に記載の方法。
  7. 前記クォーラムボリュームを組み込むステップは、コンピュータノードがクォーラムボリュームに必要な全ての記憶デバイスの所有権を獲得したとき実行されることを特徴とする請求項1に記載の方法。
  8. 前記クォーラムボリュームを組み込むステップは、コンピュータノードが前記物理クォーラムリソースの過半数の所有権を獲得したとき実行されることを特徴とする請求項1に記載の方法。
  9. 1以上の前記物理クォーラムリソースは、1つまたは複数の連結されかつストライプされたボリュームエクステントを具備し、
    前記クォーラムボリュームを組み込むステップは、所有権が1より大きい前記連結されかつストライプされたボリュームエクステントのために獲得されたとき実行されることを特徴とする請求項1に記載の方法。
  10. 1以上の前記物理クォーラムリソースは、1つまたは複数の連結されかつストライプされたボリュームエクステントを具備し、
    前記クォーラムボリュームを組み込むステップは、所有権が前記1つまたは複数の連結されかつストライプされたボリュームエクステントの単純な過半数のために獲得されたとき実行されることを特徴とする請求項1に記載の方法。
  11. 複数のコンピュータノードと、1つまたは複数の記憶デバイス内に含まれる物理クォーラムリソースを具備する記憶サブシステムとを備えるシステム内で、前記物理クォーラムリソースストレージネットワークの前記コンピュータノードに利用可能である前記ストレージネットワークを形成するための各ステップを実施するコンピュータ実行可能命令を記憶するコンピュータ可読記録媒体であって、前記各ステップは、
    前記システムの前記コンピュータノードのそれぞれにより前記記憶サブシステムの前記物理クォーラムリソースについての何れかの現在の所有権をプロセッサが終了させるステップと、
    新しいストレージネットワークの構成情報を更新するために前記システムのそれぞれの他のコンピュータノードを前記プロセッサがスキャンするステップと、
    1つまたは複数の前記コンピュータノードにより前記物理クォーラムリソースの所有権を決定するためにアービトレーションを前記プロセッサが呼び出すステップと、
    前記物理クォーラムリソースを備えるクォーラムボリュームを前記ストレージネットワークのメンバーに前記プロセッサが組み込むステップとを備え、
    前記現在の所有権を終了させるステップと、前記アービトレーションを呼び出すステップは、第1のプログラムモジュールにより実行され、前記それぞれの他のコンピュータノードをスキャンするステップと、前記クォーラムボリュームを組み込むステップは、前記第1のプログラムモジュールと異なる第2のプログラムモジュールにより実行されることを特徴とするコンピュータ可読記録媒体。
  12. 前記現在の所有権を終了させるステップは、前記記憶サブシステムへのアクセスをブロックすることを含むことを特徴とする請求項11に記載のコンピュータ可読記録媒体。
  13. 前記現在の所有権を終了させるステップは、それぞれのコンピュータノードのバスをリセットすることを含むことを特徴とする請求項11に記載のコンピュータ可読記録媒体。
  14. 前記現在の所有権を終了させるステップは、アービトレーションを呼び出す前に所定の遅延期間待機することを含むことを特徴とする請求項11に記載のコンピュータ可読記録媒体。
  15. 前記ストレージネットワークの前記コンピュータノードにより所有された物理クォーラムリソースを含む前記記憶サブシステムのそれぞれの記憶デバイスを識別する構成情報を前記プロセッサが生成するステップを更に備えることを特徴とする請求項11に記載のコンピュータ可読記録媒体。
  16. 内部構成データベースを再構築するために、前記生成された構成情報に含まれるそれぞれの記憶デバイスからの前記クォーラムボリュームの情報を前記プロセッサが処理するステップを更に備えることを特徴とする請求項15に記載のコンピュータ可読記録媒体。
  17. 前記クォーラムボリュームを組み込むステップは、コンピュータノードがクォーラムボリュームに必要な全ての記憶デバイスの所有権を獲得したとき実行されることを特徴とする請求項11に記載のコンピュータ可読記録媒体。
  18. 前記クォーラムボリュームを組み込むステップは、コンピュータノードが前記物理クォーラムリソースの過半数の所有権を獲得したとき実行されることを特徴とする請求項11に記載のコンピュータ可読記録媒体。
  19. 1以上の前記物理クォーラムリソースは、1つまたは複数の連結されかつストライプされたボリュームエクステントを具備し、
    前記クォーラムボリュームを組み込むステップは、所有権が1より大きい前記連結されかつストライプされたボリュームエクステントのために獲得されたとき実行されることを特徴とする請求項11に記載のコンピュータ可読記録媒体。
  20. 1以上の前記物理クォーラムリソースは、1つまたは複数の連結されかつストライプされたボリュームエクステントを具備し、
    前記クォーラムボリュームを組み込むステップは、所有権が前記1つまたは複数の連結されかつストライプされたボリュームエクステントの単純な過半数のために獲得されたとき実行されることを特徴とする請求項11に記載のコンピュータ可読記録媒体。
JP2001540586A 1999-11-29 2000-11-21 ストレージネットワーク内のクォーラムリソースアービタ Expired - Fee Related JP5185483B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/449,579 1999-11-29
US09/449,579 US6615256B1 (en) 1999-11-29 1999-11-29 Quorum resource arbiter within a storage network
PCT/US2000/031936 WO2001038992A2 (en) 1999-11-29 2000-11-21 Quorum resource arbiter within a storage network

Publications (3)

Publication Number Publication Date
JP2003515813A JP2003515813A (ja) 2003-05-07
JP2003515813A5 JP2003515813A5 (ja) 2011-05-26
JP5185483B2 true JP5185483B2 (ja) 2013-04-17

Family

ID=23784686

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001540586A Expired - Fee Related JP5185483B2 (ja) 1999-11-29 2000-11-21 ストレージネットワーク内のクォーラムリソースアービタ

Country Status (4)

Country Link
US (1) US6615256B1 (ja)
EP (1) EP1234240A2 (ja)
JP (1) JP5185483B2 (ja)
WO (1) WO2001038992A2 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6553387B1 (en) * 1999-11-29 2003-04-22 Microsoft Corporation Logical volume configuration data management determines whether to expose the logical volume on-line, off-line request based on comparison of volume epoch numbers on each extents of the volume identifiers
US6684231B1 (en) * 1999-11-29 2004-01-27 Microsoft Corporation Migration of friendly volumes
US6769008B1 (en) * 2000-01-10 2004-07-27 Sun Microsystems, Inc. Method and apparatus for dynamically altering configurations of clustered computer systems
US7606898B1 (en) * 2000-10-24 2009-10-20 Microsoft Corporation System and method for distributed management of shared computers
US6886038B1 (en) * 2000-10-24 2005-04-26 Microsoft Corporation System and method for restricting data transfers and managing software components of distributed computers
US7093288B1 (en) 2000-10-24 2006-08-15 Microsoft Corporation Using packet filters and network virtualization to restrict network communications
US6907395B1 (en) 2000-10-24 2005-06-14 Microsoft Corporation System and method for designing a logical model of a distributed computer system and deploying physical resources according to the logical model
US7113900B1 (en) 2000-10-24 2006-09-26 Microsoft Corporation System and method for logical modeling of distributed computer systems
US6915338B1 (en) 2000-10-24 2005-07-05 Microsoft Corporation System and method providing automatic policy enforcement in a multi-computer service application
KR20040035675A (ko) 2001-07-06 2004-04-29 컴퓨터 어소시에이트스 인터내쇼날 인코포레이티드 객체 기반 클러스터를 관리하는 시스템 및 방법
US7243374B2 (en) 2001-08-08 2007-07-10 Microsoft Corporation Rapid application security threat analysis
US8285825B1 (en) * 2002-11-13 2012-10-09 Novell, Inc. Method and system for managing network resources based on a dynamic quorum
JP4516322B2 (ja) 2004-01-28 2010-08-04 株式会社日立製作所 複数の上位装置で共有される記憶装置システムを持つサイト間での共有排他制御方式を備えたコンピュータシステム
US20050193105A1 (en) * 2004-02-27 2005-09-01 Basham Robert B. Method and system for processing network discovery data
JP4820814B2 (ja) * 2004-03-09 2011-11-24 スケールアウト ソフトウェア インコーポレイテッド スケラブルなソフトウェアをベースにしたクォーラムアーキテクチャ
JP2005310243A (ja) * 2004-04-20 2005-11-04 Seiko Epson Corp メモリコントローラ、半導体集積回路装置、半導体装置、マイクロコンピュータ及び電子機器
US7979863B2 (en) 2004-05-21 2011-07-12 Computer Associates Think, Inc. Method and apparatus for dynamic CPU resource management
EP1769353A2 (en) 2004-05-21 2007-04-04 Computer Associates Think, Inc. Method and apparatus for dynamic memory resource management
EP1632854A1 (en) 2004-08-23 2006-03-08 Sun Microsystems France S.A. Method and apparatus for using a serial cable as a cluster quorum device
EP1748361A1 (en) * 2004-08-23 2007-01-31 Sun Microsystems France S.A. Method and apparatus for using a USB cable as a cluster quorum device
US20070022314A1 (en) * 2005-07-22 2007-01-25 Pranoop Erasani Architecture and method for configuring a simplified cluster over a network with fencing and quorum
US8104033B2 (en) 2005-09-30 2012-01-24 Computer Associates Think, Inc. Managing virtual machines based on business priorty
US8225313B2 (en) 2005-10-19 2012-07-17 Ca, Inc. Object-based virtual infrastructure management
US7941309B2 (en) 2005-11-02 2011-05-10 Microsoft Corporation Modeling IT operations/policies
US7483978B2 (en) 2006-05-15 2009-01-27 Computer Associates Think, Inc. Providing a unified user interface for managing a plurality of heterogeneous computing environments
US8209417B2 (en) * 2007-03-08 2012-06-26 Oracle International Corporation Dynamic resource profiles for clusterware-managed resources
US7890555B2 (en) * 2007-07-10 2011-02-15 International Business Machines Corporation File system mounting in a clustered file system
JP4577384B2 (ja) 2008-03-14 2010-11-10 日本電気株式会社 管理マシン、管理システム、管理プログラム、および、管理方法
US20110178984A1 (en) * 2010-01-18 2011-07-21 Microsoft Corporation Replication protocol for database systems
US8825601B2 (en) * 2010-02-01 2014-09-02 Microsoft Corporation Logical data backup and rollback using incremental capture in a distributed database
US8650281B1 (en) * 2012-02-01 2014-02-11 Symantec Corporation Intelligent arbitration servers for network partition arbitration
WO2016106682A1 (zh) * 2014-12-31 2016-07-07 华为技术有限公司 一种集群脑裂后仲裁处理方法、仲裁存储装置以及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5828889A (en) * 1996-05-31 1998-10-27 Sun Microsystems, Inc. Quorum mechanism in a two-node distributed computer system
US5822531A (en) 1996-07-22 1998-10-13 International Business Machines Corporation Method and system for dynamically reconfiguring a cluster of computer systems
US6253240B1 (en) * 1997-10-31 2001-06-26 International Business Machines Corporation Method for producing a coherent view of storage network by a storage network manager using data storage device configuration obtained from data storage devices

Also Published As

Publication number Publication date
WO2001038992A3 (en) 2002-06-06
WO2001038992A2 (en) 2001-05-31
JP2003515813A (ja) 2003-05-07
US6615256B1 (en) 2003-09-02
EP1234240A2 (en) 2002-08-28

Similar Documents

Publication Publication Date Title
JP5185483B2 (ja) ストレージネットワーク内のクォーラムリソースアービタ
JP2003515813A5 (ja)
US6553387B1 (en) Logical volume configuration data management determines whether to expose the logical volume on-line, off-line request based on comparison of volume epoch numbers on each extents of the volume identifiers
US7653682B2 (en) Client failure fencing mechanism for fencing network file system data in a host-cluster environment
US6904599B1 (en) Storage management system having abstracted volume providers
US7516285B1 (en) Server side API for fencing cluster hosts via export access rights
US7191357B2 (en) Hybrid quorum/primary-backup fault-tolerance model
US7036039B2 (en) Distributing manager failure-induced workload through the use of a manager-naming scheme
US7360030B1 (en) Methods and apparatus facilitating volume management
US6681310B1 (en) Storage management system having common volume manager
US8370416B2 (en) Compatibility enforcement in clustered computing systems
US7007024B2 (en) Hashing objects into multiple directories for better concurrency and manageability
US7739541B1 (en) System and method for resolving cluster partitions in out-of-band storage virtualization environments
US6081812A (en) Identifying at-risk components in systems with redundant components
JP4195209B2 (ja) ストレージ・エリア・ネットワークの構成を自動化する方法およびシステム
US9697226B1 (en) Network system to distribute chunks across multiple physical nodes
US7685358B1 (en) System and method for coordinating cluster state information
US20030065782A1 (en) Distributed system resource protection via arbitration and ownership
JPH09237226A (ja) マルチコンピュータ・システムにおける信頼性の高いディスク・フェンシングのための方法および装置
US7702757B2 (en) Method, apparatus and program storage device for providing control to a networked storage architecture
US20100251252A1 (en) Policy management framework in managed systems environment
US6684231B1 (en) Migration of friendly volumes
JP2012503249A (ja) 永続予約を介する共有書込みアクセスのリソースアービトレーション
WO2001042925A2 (en) Volume stacking model
Vallath Oracle real application clusters

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071107

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071107

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100723

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101025

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101207

A524 Written submission of copy of amendment under section 19 (pct)

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20110407

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20110408

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110408

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20110502

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20110624

RD15 Notification of revocation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7435

Effective date: 20121004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130118

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5185483

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160125

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees