JP2001109726A

JP2001109726A - 分散コンピュータ・システム内のプロセッサを再構成する方法、システム、および、記憶装置

Info

Publication number: JP2001109726A
Application number: JP2000257264A
Authority: JP
Inventors: C Briski Kenneth; ケニス・シー・ブリスキー; N Novakus Markos; マルコス・エヌ・ノヴァクス
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1999-08-31
Filing date: 2000-08-28
Publication date: 2001-04-20
Anticipated expiration: 2020-08-28
Also published as: JP3706531B2; KR100387700B1; US6490693B1; KR20010050140A

Abstract

(57)【要約】（修正有）【課題】非共用分散コンピューティング・システムの
ための、プロセッサのクォーラム・グループの動的再構
成とその回復手順を提供すること。【解決手段】プロセッサのクォーラム・グループの少
なくとも１つのプロセッサが使用不能であっても、クォ
ーラム個数の残りのプロセッサが存在すると仮定する
と、動的再構成が進行する。回復処理は、プロセッサの
グループによって実施され、その結果、グループの動的
再構成中に使用不能であった少なくとも１つのプロセッ
サが、アクティブになった後に現在の状態情報を得るこ
とができるようになる。回復処理には、現在使用可能に
なっている少なくとも１つのプロセッサに、プロセッサ
のクォーラム・グループの現在の状態を伝播するため
の、プロセッサのインカーネーション番号およびプロセ
ッサのリストの交換が含まれる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、分散コンピューテ
ィング・システムに関し、具体的には、分散コンピュー
ティング・システム内のプロセッサのクォーラム・グル
ープの動的再構成と、動的再構成中に使用不能であった
グループの１つまたは複数のプロセッサの回復手順に関
する。

【０００２】

【関連する出願】本特許出願には、以下の特許出願の内
容に関する内容が含まれる。以下の特許出願は、本特許
出願と同一の譲受人に譲渡され、本特許出願と同一の日
付（１９９９年８月３１日）に出願された。下記の特許
出願は、本明細書に関連する。米国特許出願第０９／３８７１８５号明細書（出願人整
理番号第ＰＯ９−９９−１３１号）米国特許出願第０９／３８６５４９号明細書（出願人整
理番号第ＰＯ９−９９−１３２号）米国特許出願第０９／３８７１８８号明細書（出願人整
理番号第ＰＯ９−９９−１３３号）

【０００３】

【従来の技術】分散コンピューティング・システムで
は、複数の処理要素が使用される。これらの処理要素
は、ネットワーク内で互いにリンクされた個々のプロセ
ッサ、または調整された環境で並列に動作する複数のソ
フトウェア・インスタンスとすることができる。前者の
場合、プロセッサは、ネットワーク・プロトコルをサポ
ートするネットワークを介して互いに通信する。このプ
ロトコルは、ハードウェア構成要素とソフトウェア構成
要素の組合せを使用することによって実施することがで
きる。処理要素は、通常は、共通のインターフェースを
介してメッセージまたはパケットを送受することによっ
て互いに通信する。分散コンピューティング・システム
の１種が、処理要素が記憶域を共用しない、非共用分散
システムである。そのようなシステム内では、要素は、
分散システムの状態について合意するためにメッセージ
を交換しなければならない。

【０００４】したがって、非共用分散処理システム内で
は、メッセージ交換プロトコルが必要である。たとえ
ば、メッセージ交換プロトコルでは、分散処理システム
内のデータベースの現在の状態の問題を解決しようとす
る。具体的に言うと、プロトコルでは、どの処理要素が
最新版のデータベースを有するかを定義する必要があ
る。というのは、処理要素が異なる版のデータベースを
作成する可能性があるからである。周知の通り、高可用
性システムでは、システムが処理の実行を継続している
間に、１つまたは複数の処理要素が、使用不能になるこ
とが許容される。したがって、データベースは、高可用
性分散処理ステム内では、１つまたは複数の処理要素が
使用不能（たとえばオフ・ライン）の間に変更される可
能性がある。前に使用不能であった処理要素が使用可能
になった時に、更新された版のデータベースを、その処
理要素に供給しなければならない。

【０００５】従来の非共用分散処理システムは、クォー
ラム駆動回復に参加する処理要素のグループが静的でな
ければならないという制限を有する。すなわち、サーバ
・グループが定義された後には、動的にすなわち、デー
タベースが走行しており１つまたは複数のメンバが潜在
的に使用不能である間に、メンバを追加または削除する
ことができない。従来の非共用分散処理システムで再構
成変更を行う唯一の方法は、再定義動作を使用すること
であるが、この再定義動作は、システムの全サーバでの
構成ファイルの変更を必要とし、したがって、再構成変
更のためにすべてのサーバが現在使用可能であることを
必要とする。

【０００６】

【発明が解決しようとする課題】上記にもかかわらず、
データベース・サーバなどの高可用性分散処理システム
の場合には、サーバのグループの全サーバが使用可能で
あることを必要とせずに、サーバの追加または削除を可
能にすることが望ましいと考えられる。

【０００７】

【課題を解決するための手段】本明細書で提供する分散
サーバ回復手順（ＤＳＲＰ）は、現在定義されているサ
ーバの過半数（クォーラム）が変更の進行のために使用
可能であることだけを必要とする、サーバ・グループの
構成のこの変更を可能にする。たとえば、いくつかのサ
ーバを、それがダウンしている間に構成解除（グループ
から排除）することができ、他のサーバを追加すること
ができる。１つまたは複数のサーバが使用不能である間
にサーバを追加または削除する処理を、本明細書ではプ
ロセッサのクォーラム・グループの「動的再構成」と呼
称する。やはり、分散サーバの回復のための従来の手順
は、静的構成環境を必要とする。

【０００８】要約すると、本明細書では、一態様で、高
可用性分散コンピューティング・システム内のプロセッ
サを再構成するクォーラム・ベースの方法を提供する。
この方法は、プロセッサのクォーラム・グループ内のク
ォーラムの存在を識別するステップと、前記プロセッサ
のクォーラム・グループの少なくとも１つのプロセッサ
が使用不能である間に前記プロセッサのクォーラム・グ
ループを動的に再構成するステップとを含み、前記動的
再構成が、前記少なくとも１つのプロセッサの使用不能
性にもかかわらず、前記プロセッサのクォーラム・グル
ープの前記クォーラムのプロセッサの存在と共に進行す
る。

【０００９】上で要約した方法に対応するシステムおよ
びコンピュータ・プログラム製品も、本明細書に記載さ
れ、請求される。

【００１０】言い直すと、本明細書で提供するのは、グ
ループの１つまたは複数のプロセッサが使用不能である
にもかかわらず、プロセッサのクォーラム・グループを
動的に再構成する再構成機能ならびに、１つまたは複数
の以前には使用不能であったプロセッサが使用可能にな
った時にグループのプロセッサによって実施される回復
手順である。１つまたは複数のプロセッサが使用不能で
ある間にプロセッサのグループを動的に再構成できるよ
うにすることによって、システム管理者は、１つまたは
複数のプロセッサが使用不能になった場合であっても、
クォーラム個のプロセッサが残っているならば、クリテ
ィカルなシステムが維持されることを保証できる。した
がって、本明細書の記載の動的再構成機能および回復手
順は、高可用性分散コンピューティング環境でのより高
い柔軟性をもたらす。本明細書に記載の回復手順などの
クォーラム・ベースの動作と共に使用するための、緩和
されたクォーラムの計算も提示する。

【００１１】

【発明の実施の形態】本発明によって解決される問題
は、データベース・サーバなどの分散高可用性処理シス
テムの動的再構成および回復の問題である。そのような
システムの高可用性特性によって、そのようなシステム
は、サーバ・グループのいくつかの対等サブシステムが
使用可能でない時でも、機能することができる。本明細
書ではデータベース・サーバに関して一実施形態で説明
するが、当業者は、本明細書に記載の概念が、複数の処
理要素を有する分散処理システムのプロセッサのどのグ
ループにも適用可能であることを理解するであろう。本
発明の文脈では、プロセッサは、個々のプロセッサまた
はソフトウェアで実施される処理インスタンスを含む処
理要素を意味する。本明細書で論ずるデータベース・サ
ーバは、プロセッサのグループの１例としてのみ提示さ
れる。

【００１２】本明細書で仮定されるシステムの高可用性
特性のゆえに、いくつかのプロセッサが、分散データベ
ースに対する更新を取り逃がす可能性があり、再び使用
可能になった時に回復手順を受ける必要が生じる。通
常、回復手順には、「インカーネーション番号」とも呼
ばれる、データベースのバージョン番号の検査が含まれ
る。回復は、本発明によれば、サーバ・サブシステムの
構成自体が変更されている、すなわち、そのシステム
が、「動的再構成」を受けている可能性があるという事
実によって複雑になる。本明細書で提示される分散サー
バ回復手順（ＤＳＲＰ）は、そのような場合の回復の問
題を解決し、したがって、この動的再構成の進行を可能
にする。

【００１３】この開示の用語「構成」は、具体的には、
分散システムのメンバのリストを指す。典型的な分散シ
ステムは、ネットワーク内に存在する使用可能なプロセ
ッサのプールからプロセッサを選択し、それらを一緒に
グループ化することによって構成される。通常、ネット
ワーク内のプロセッサの数は、所与の分散システム内の
数よりはるかに多い。その１例が、同一のネットワーク
内で相互接続される複数のコンピュータ（プロセッサ）
を有する大学キャンパスである。ネットワーク内に存在
するプロセッサのサブセットを、「分散システム」にグ
ループ化することが望ましいことがしばしばである。分
散システムは、さまざまな形で協力し、それらの間でタ
スクを分散することができる計算機の組として定義され
る。たとえば、ネットワークに１００台のプロセッサが
ある場合、それらを一緒に組み合わせることによって、
任意の数の分散システムを構成することができる。たと
えば、それぞれ１０プロセッサの１０個のシステム、ま
たはそれぞれ５プロセッサの２０個のシステム、または
他の組合せを作成することができる。この「構成」の重
要な態様が、どのプロセッサが特定のグループの一部で
あるかのリストである。このリストによって、同一のグ
ループに参加するメンバの組が定義され、この決定は、
グループの他のメンバからの要求の受入れまたは拒絶を
正しく行うために必要である。グループのメンバは、所
与のどの時点でも、このリストが一貫性があることに合
意しなければならない。すなわち、分散システムのすべ
てのノード（プロセッサ）が、このリストの正確に同一
のコピーを有することが必要である。

【００１４】この開示で提示される特定の技術は、プロ
セッサのグループのメンバが、それが有するリストが正
確であるかどうか、または、グループの別のメンバから
更新されたリストを得る必要があるかどうかを検証でき
るようにする方法である。本発明は、生成されるリスト
のそれぞれに特定の「インカーネーション番号」を付加
することによってこの目的を達成する。このインカーネ
ーション番号は、プロセッサ・グループのメンバのリス
トに対する変更が、少なくとも現在のグループのメンバ
の「クォーラム（定足数）」に対して行われることを保
証することによって維持される。リストの変更が発生す
るのは、分散システムのユーザが、グループにプロセッ
サを追加または削除することによって構成を変更する時
である。リストが、メンバ・プロセッサの追加または削
除によって変更される時には、インカーネーション番号
が増分される。

【００１５】分散システムのユーザが、構成の変更を要
求する時には、その変更は、次のように行うことができ
る。要求を受け取ったグループのメンバが、その要求の
コピーを他のすべてのメンバに送り、構成変更自体を行
う。変更の動作には、リスト内で変更を行うことと、イ
ンカーネーション番号の更新が含まれる。その後、その
メンバは、グループの他のメンバの応答を待つ。クォー
ラム個のメンバが成功メッセージを応答する場合には、
元の要求を受け取ったメンバは、構成変更を要求したユ
ーザに肯定のコードを返す。そうでない場合には、エラ
ーが返される（図１０参照）。エラーが返された場合に
は、分散システムのユーザは、システムを再定義しなけ
ればならず（上で説明したように）、したがって、動的
回復は不可能である。しかし、戻りコードが成功である
場合には、再構成が成功したことが保証され、リスト
は、クォーラム個のノードで一貫性を有することが保証
される。

【００１６】通常の分散システムは、構成の変更のすべ
てが、システム内のすべてのノードに対して行われるこ
とを必要とする。本発明は、変更をクォーラム個のノー
ドだけに対して行うことを必要とすることによって、構
成変更の要件を緩和する。これによって、メンバ・ノー
ドが再構成動作のために使用可能でない場合であって
も、分散システムの構成を変更することが可能になる。

【００１７】回復のシナリオでは、処理要素が、システ
ムの最新の状態、たとえばデータベースの最新版を突き
とめるために、インカーネーション番号を交換する。シ
ステム・データに対する変更（およびインカーネーショ
ン番号の増分）は、クォーラム個（過半数）のレジスト
リ・プロセッサが使用可能である時に限って許可され、
従来のクォーラム・アルゴリズム（すなわち、静的グル
ープ構成）は、単純なアルゴリズムである。従来は、過
半数のサーバが使用可能であることと、最も高いインカ
ーネーション番号を有するサーバが、データベースの最
も最近に更新された版を有すると保証されることで十分
である。しかし、このアルゴリズムは、クォーラム駆動
回復に参加するグループが静的でなければならないとい
う制約を有する。すなわち、サーバ・グループを定義し
た後には、メンバを動的に追加または削除することがで
きない。やはり、動的とは、本明細書では、データベー
スが走行中であり、潜在的に使用不能なグループのメン
バが１つまたは複数存在することを意味するように定義
されている。従来の形で再構成変更を行う唯一の方法
は、再定義動作を使用することであるが、これは、すべ
てのサーバの構成ファイルに対する変更を必要とし、し
たがって、再構成変更のためにすべてのサーバが使用可
能であることを必要とする。

【００１８】高可用性コンピューティング・システムの
場合、本出願人は、すべてのメンバが使用可能であるこ
とを必要とせずに、グループへのプロセッサの追加およ
び削除を可能にすることが望ましいと考える。図１ない
し５に、グループの１つまたは複数のメンバが使用不能
である場合のクォーラム・グループへの変更を扱うこと
の困難さを説明するのに役立つ、全体的に符号１０で示
される分散処理システムのさまざまな状態を示す。図１
では、分散処理システム１０に、３つのサーバが含まれ
る。この図が、サーバ・グループの初期構成を表すと仮
定する。このグループは、グループ・インカーネーショ
ンが１であり、サーバ１、サーバ２、およびサーバ３と
名付けられた３つのサーバがグループに存在するように
構成されたばかりである。このグループには３つのメン
バが存在するので、グループ・クォーラムは、３の過半
数の２である。

【００１９】本発明のＤＳＲＰによって解決される問題
を示すために、サーバ１が使用不能になり、たとえば電
源を切断されたと仮定する。残りの２つのサーバは、稼
動状態のままであり、したがって、グループは、まだ変
更を可能にするクォーラムを有する。さらに、管理者
が、サーバ１がダウンしたことに気付き、将来の障害に
対する保護のために新しいサーバを定義することを所望
すると仮定する。管理者は、ここでは、サーバ４、サー
バ５、およびサーバ６という番号の３つの追加のサーバ
を定義すると仮定する。サーバ１は、その時点で電源を
切断されているので、その内部状態は変更されない。こ
の分散システムの新しい状態を、図２に示す。グループ
・インカーネーション２という符号を付けられたこの新
しい状態では、各アクティブ・サーバすなわち、サーバ
２、サーバ３、サーバ４、サーバ５、およびサーバ６の
メンバ・リストに、サーバ１が含まれ、６台のサーバの
過半数は４であるから、グループ・クォーラムは４にな
る。

【００２０】ここで、システム管理者が、サーバ１を定
義解除することを決定したと仮定する。定義解除動作
も、メンバシップ変更であり、したがって、グループ・
インカーネーションが３に増分され、図３に示された状
態がもたらされる。サーバ１を定義解除することによっ
て、グループのクォーラムは３（５の過半数）になり、
これによって、このシステムは、２つの障害に耐え、な
おかつクォーラムを維持することが可能になる。図４お
よび５を、サーバ・メンバがダウンしている時にＤＳＲ
Ｐが構成変更に対処するさまを示すために提示する。図
４では、サーバ２およびサーバ３が使用不能になり、新
しいサーバ７が定義されたと仮定する。その結果の状態
を、図４に示す。

【００２１】図４からわかるように、グループ・クォー
ラムは、現在は４（６の過半数）である。この時点でグ
ループ内の走行中のメンバは正確に４つであり、したが
って、このグループはまだクォーラムを有する。次に、
管理者が、メンバのサーバ２およびサーバ３を定義解除
し、サーバの総数を４に減らしたと仮定する。この場
合、グループ・クォーラムは３になる。このシステム
は、やはりメンバの１つの障害に耐えることができる。
結果の状態（グループ・インカーネーション５）を図５
に示す。この最終状態の例は、下で説明するＤＳＲＰア
ルゴリズムの追跡の開始点である。

【００２２】図５の状態に到達するために行われた「動
的」構成変更は、いくつかのサーバがダウンしている間
に行われたので、このシステムの状態は矛盾している。
ダウンしていたサーバが、ここで電源を投入されたと仮
定する。図５から、サーバ１が最も古い状態を有するこ
とは明らかである。サーバ１のグループ・メンバシップ
には、グループの現在の数値が全く含まれないことに留
意されたい。本明細書で提示するＤＳＲＰの目的は、サ
ーバ１が、現在のグループのメンバを発見でき、したが
って、それらの１つから最新の構成を読み取る（または
受け取る）ことができるようにする探索手順を提供する
ことである。この探索は、終了条件がＴＲＵＥと評価さ
れるか、現在のグループのアクティブ・メンバから探索
停止メッセージを受け取るまで行われなければならな
い。終了条件は、探索を行うサーバが、同一のインカー
ネーション番号に同意するクォーラム個のメンバを発見
した時に、探索が完了したことを表す。図９に関して提
示するように、探索終了条件は、いくつかの場合に緩和
（クォーラム−１）することができる。

【００２３】動的再構成を可能にする回復手順によって
解決される主要な課題は、古くなったサーバの回復手順
である。サーバは、潜在的に、もはやサーバ・グループ
のメンバの正確なリストを有しなくなるほどの長期間に
わたってダウンしていた可能性がある。複数のメンバ
が、もやはメンバとして定義されていない場合がありえ
る。また、問題のサーバが、使用不能になった後に他の
稼動し続けているメンバによって定義解除されている場
合もありえる。本明細書で提示する分散サーバ回復手順
は、そのような古くなったサーバが、データベースの最
新のコピーにアクセスでき、それ自体を更新できるよう
にする分散通信プロトコルである。

【００２４】ＤＳＲＰアルゴリズムは、サーバ・グルー
プの状態の持続記憶に基づく。この状態は、インカーネ
ーション番号と、このインカーネーション番号「に投票
した」すなわち、それを増分するコミット処理に参加し
たメンバのリストからなる。ＤＳＲＰアルゴリズムを、
具体的な例を用いて下で説明する。図５に示された例で
は、回復の前のサーバ・グループの状態のスナップショ
ットが示されている。この状態は、すべてのメンバで一
貫しているわけではない。というのは、メンバの一部
（小さいインカーネーション番号を持つメンバ）が、更
新を失ってきたからである。

【００２５】ここで、データベースの最新のコピーをと
り出すためにＤＳＲＰアルゴリズムによって行われるス
テップを追跡することができる。上のシナリオでは、サ
ーバ１がもはやデータベース・サーバでなくなっている
が、サーバ１は、データへのアクセスに必要な他のクリ
ティカルなアプリケーションをホストする可能性がある
ことに留意されたい。ここで追跡するステップは、サー
バ１から始まる、図６ないし９に示された本発明のＤＳ
ＲＰアルゴリズムの実施形態に従うものである。しか
し、全体的な障害の場合（たとえば、上のシナリオでク
ラスタがリブートされた場合）には、ＤＳＲＰアルゴリ
ズムは、現在の状態からそれがサーバであることが示さ
れる（この情報が古いものである可能性はあるが）すべ
てのノードで走行することに留意されたい。

【００２６】サーバ１から始まるステップは、次の通り
である。１）サーバ１が、その持続状態を読み取る。そ
の後、サーバ１は、現行サーバ・メンバ・リストの対等
サーバに連絡し、インカーネーション番号を取り出そう
とする。サーバ１は、サーバ２がより大きいインカーネ
ーション番号（３）を有することに気付き、したがっ
て、サーバ１のサーバ・メンバ・リストが古いことを知
る。その後、サーバ１は、サーバ２からサーバ・リスト
を取り出し、新しい探索にそれを使用する。２）前のス
テップで取り出したリストを使用して、サーバ１は、新
しいリストのメンバに関して同一のプロトコルを実行す
る。サーバ１は、サーバ３に連絡することから始める。
サーバ１は、サーバ３がサーバ２と同一のインカーネー
ション番号（３）を有することに気付く。この時点で、
サーバ１は、同一のインカーネーションを有する２つの
サーバ（サーバ２およびサーバ３の両方がインカーネー
ション３である）について知る。しかし、インカーネー
ション３に関連するクォーラムは３であるから、サーバ
１は、探索を終了するためにはこのレベルのサーバをも
う１つ見つける必要がある。３）サーバ１は、今度はサ
ーバ４に連絡し、その状態を取り出す。サーバ１は、悪
いニュースを知る。すなわち、サーバ４は、より高いイ
ンカーネーション番号（５）であり、したがって、サー
バ１は、サーバ２およびサーバ３も古いことを知る。サ
ーバ１は、サーバ４から取り出した状態を使用して探索
を継続する。４）サーバ１は、ここで、新たに取り出し
たメンバ・リスト内の次の未訪問のサーバ（サーバ５）
に連絡する。サーバ１は、サーバ５もインカーネーショ
ン５であることに気付く。この時点で、サーバ１は、２
つのサーバがインカーネーション５であることを知って
いるが、インカーネーション５に関連するクォーラムは
３（４の過半数）であり、したがって、サーバ１はもう
１つの確認を必要とする。

【００２７】一実施形態では、本明細書で提示されるＤ
ＳＲＰアルゴリズムによって、いくつかの場合にクォー
ラム要件の緩和が可能になる。この場合、たとえば、サ
ーバ１は、同一のインカーネーションを有し、４個のグ
ループの一部である２つのサーバ（サーバ４およびサー
バ５）を知っている。この知識は、探索を終了するのに
十分である。というのは、残りの２つのメンバ（サーバ
６およびサーバ７）が、データベースでの変更には厳密
なクォーラム（４つの大多数すなわち３つ）が必要なの
で、より高いインカーネーション番号を有することがで
きないからである。したがって、サーバ６およびサーバ
７が、グループ内の少なくとも１つの他のサーバ（サー
バ４またはサーバ５）の参加なしで構成変更を行うこと
は不可能であったはずである。サーバ４およびサーバ５
の状態が既知なので、サーバ１は、データベースの最新
のインカーネーションが５であると仮定しても安全であ
り、探索を終了する。サーバ１のクライアント・アプリ
ケーションは、サーバ４またはサーバ５のいずれかから
の最も最近に更新されたデータベースのコピーにアクセ
スすることができる。

【００２８】図６ないし９に、本発明の原理に従って実
施される動的サーバ回復手順（ＤＳＲＰ）アルゴリズム
の流れ図実施形態を示す。具体的に言うと、図６は、各
サーバが対等サブシステム（すなわち、プロセッサのク
ォーラム・グループ内の他のプロセッサ）からのメッセ
ージを継続的に聴取する、動的サーバ回復手順を示す図
である。プロセッサは、その状態を更新する時に、受け
取るメッセージのそれぞれについて図７および８のproc
ess_message_procedure（メッセージ処理プロシージ
ャ）を実行する。process_message_procedureは、クォ
ーラム番号変数とインカーネーション変数を、探索を終
了させるのに適当な状態に設定し、サーバのクォーラム
に関する探索に使用される現行プロセッサ・リストも変
更する。各反復の終りに、プロセッサは、現行探索リス
トの対等サブシステムに、最新のインカーネーション番
号と現行探索リスト自体を送る。図９は、本発明の原理
に従って「緩和された」クォーラム数を判定する処理の
一実施形態を示す図である。

【００２９】図６からわかるように、ＤＳＲＰ処理は、
プロセッサのクォーラム・グループ内のプロセッサの始
動または再始動（１００）から開始される。my_incarna
tion（インカーネーション）およびcurrent_search_lis
t（現行探索リスト）を含む変数を初期設定する（１１
０）。その後、クォーラムが達成されたかどうかに関す
る質問を行う（１２０）。そうでない場合には、この手
順（サーバのグループの再始動されたサーバのそれぞれ
で実施される）は、メッセージを別のグループ・メンバ
から受け取ったかどうかを判定する（１３０）。そうで
ない場合には、そのサーバは、その現行サーバ・リスト
およびインカーネーション番号を含むメッセージを、グ
ループ内の他のサーバのそれぞれに送る（１４０）。そ
の後、処理は、クォーラムが達成されたかどうかの質問
（１２０）に戻る。

【００３０】メッセージがそのサーバで受け取られてい
る場合には、サーバは、下で説明する、図７および８の
process_message_procedureを実行する（１５０）。pro
cess_message_procedureルーチンは、ＴＲＵＥまたはＦ
ＡＬＳＥのいずれかの値を返す。したがって、ＤＳＲＰ
は、process_message_procedureがＴＲＵＥの値を返し
たかどうかを判定する（１６０）。そうでない場合に
は、動的サーバ回復手順が続行し（１７０）、ループ・
バックして、サーバに、その現行探索リストの対等サブ
システムのそれぞれに、その現行サーバ・リストとイン
カーネーション番号を送らせる（１４０）。process_me
ssage_returnの値がＴＲＵＥである場合には、この処理
は、サーバの現行探索リストのすべての対等サブシステ
ムにStopSearch（探索停止）メッセージを送り（１８
０）、これによって処理を完了する（１９０）。

【００３１】動的サーバ回復手順の始めに戻って、クォ
ーラムが存在する（たとえば、プロセッサのクォーラム
・グループの１つまたは複数のアクティブ・メンバから
探索停止メッセージを受け取った）場合（１２０）、回
復手順は完了する（１９０）。

【００３２】図７および図８のprocess_message_proced
ureは、以下のフィールドを含むメッセージ・データ型
を使用する。主ＩＰアドレス：送出元の連絡アドレスバックアップＩＰアドレス：第１のアドレスの障害時に
使用するバックアップ連絡アドレス incarnation：送出元が発見した最新のインカーネーシ
ョン番号 server_list：送出元が発見した最新の探索リスト

【００３３】メッセージのフィールドは、流れ図では、
「．」演算子を使用して示される。たとえば、msg.inca
rnationは、メッセージのincarnationフィールドを指
す。

【００３４】process_message_procedureでは、サーバ
が受け取った、最も高いインカーネーションを有するメ
ッセージのカウントが保存される。このルーチンは、こ
のカウントを「緩和された」クォーラム要件と比較する
が、「緩和された」クォーラム要件は、一実施形態では
図９のcalculate_quorumプロシージャから計算される。
図７および８のプロシージャは、クォーラム要件が達成
されたと判定した時に、ＤＳＲＰタスクを終了するのに
適当な値をセットする。そうでない場合には、このルー
チンは、カウンタおよび探索リストを更新し、探索を続
ける。

【００３５】図７および８を参照すると、本発明の原理
によるprocess_message_procedureの一実施形態は、受
け取ったメッセージを読み取ることによって開始され
（２００）、その後、メッセージのstop_search（探索
停止）フィールドがＴＲＵＥであるかどうかを判定する
（２１０）。そうである場合には、メッセージの送出元
に連絡して、たとえば送出元のデータベースのコピーを
用いて、データベースを更新し、送出元のインカーネー
ション番号を用いてインカーネーション番号を更新する
（２２０）。その後、ＴＲＵＥのprocess_message_retu
rn値を、図６の動的サーバ回復手順に返す（２３０）。

【００３６】メッセージのstop_searchフィールドが真
でないと仮定すると、このプロシージャは、msg.incarn
ationをmy_incarnationと比較する（２４０）。この比
較は、３つの可能な結果を有する。第１に、msg.incarn
ationとmy_incarnationが等しい場合（２５０）、count
er（カウンタ）の値を増分し、クォーラム数を計算する
（２６０）。「緩和された」クォーラム数を計算するた
めの実施形態の１つを、図９に示す（下で説明する）。
クォーラムを決定した後に、counterの値がクォーラム
値以上であるかどうかを判定する（２７０）。そうであ
る場合には、動的サーバ回復プロセスにＴＲＵＥの値を
返す（２８０）。そうでない場合には、ＦＡＬＳＥの値
を返し（２９０）、処理が完了する。

【００３７】メッセージ・ヘッダのインカーネーション
値（msg.incarnation）が、サーバのインカーネーショ
ン値より大きい場合（３１０）、サーバの現行探索リス
トを、メッセージと共に受け取った探索リストに置換
し、counterに１をセットし、サーバのインカーネーシ
ョン値を、メッセージと共に受け取ったインカーネーシ
ョン番号を用いて更新する（３２０）。その後、counte
r値がクォーラム数以上であるかどうかを問合せ（２７
０）、上で説明したように処理が進行する。受け取った
インカーネーション番号がサーバのインカーネーション
番号未満の場合（３３０）、メッセージ送出元をサーバ
のインアクティブ・サーバ・リストに追加し、メッセー
ジ送出元をアクティブ・サーバ・リストから削除し、た
とえば図９にプロシージャを使用して、クォーラムの値
を計算する（２４０）。クォーラム数を計算した後に、
処理がリターンして、counter値がクォーラム数より大
きいかどうかを判定し（２７０）、上で説明したように
進行する。

【００３８】過半数を使用することの代替案として、ク
ォーラムを、図９に示されているように計算することが
できる。このプロシージャでは、現在の探索リストでク
ォーラムを達成するのに十分な応答を受け取ったかどう
かを判定するために必要な、応答の最少数を計算する。
集合Ｓには、現行探索リストで定義されているすべての
レジストリ・サーバが含まれる。集合Ｉには、より低い
インカーネーション番号を応答し、したがって、探索か
ら排除されるサーバが含まれる。集合Ｎは、Ｓ−Ｉとし
て定義され、Ｓに関するＩの補集合である。これは、応
答が受け取られなかったメンバまたは現行のインカーネ
ーション番号を応答したメンバを識別する集合である。
条件｛Ｓ−Ｉ＞ｑ｝がＴＲＵＥの場合、クォーラム要件
から１を減算することが可能であり、クォーラム要件
は、集合Ｎの過半数として与えられる。演算子maj<>
は、オペランドを２で割り、小数部を捨て、結果に１を
足すことによって計算される。

【００３９】図９を参照すると、「緩和された」クォー
ラムを計算するためのプロシージャの１つは、変数Ｓ、
Ｉ、Ｎ、およびｑをセットすること（４１０）によって
開始される（４００）（やはり、本明細書で使用される
変数Ｓは、クォーラム・グループ内で定義されているサ
ーバの数を表し、Ｉは、グループ内のインアクティブ・
サーバの数を表し、Ｎは、グループ内のアクティブ・サ
ーバの数を表し、ｑは、定義されているサーバの数の過
半数である）。その後、定義されているサーバの数から
インアクティブ・サーバの数を引き、１を引いた値が、
定義されているサーバの数の過半数であるかどうかを判
定する（４２０）。そうである場合には、変数「Ｕ」に
１をセットし（４３０）、そうでない場合には、この値
に０をセットする（４４０）。process_message_proced
ureに返されるクォーラム数Ｑは、アクティブ・サーバ
の数の過半数から変数Ｕを引いた値に等しい。当業者
は、上に要約したクォーラム計算を、他のクォーラム・
ベースのシステム計算と組み合わせて使用することがで
きることを理解するであろう。さらに、本明細書で提示
する動的サーバ回復手順は、図９の「緩和された」過半
数ではなく、従来のクォーラム「過半」数を使用するこ
とができる。

【００４０】たとえば、本発明は、たとえばコンピュー
タ使用可能媒体を有する、製造品（たとえば１つまたは
複数のコンピュータ・プログラム製品）に含めることが
できる。この媒体は、その中に、たとえば、本発明の機
能を提供し容易にするコンピュータ可読プログラム・コ
ード手段を実施される。この製造品は、コンピュータ・
システムの一部として含めるか、別々に販売することが
できる。

【００４１】さらに、本発明の機能を実行するために、
計算機によって実行可能な命令の少なくとも１つのプロ
グラムを具体的に実施する、計算機によって読取可能な
少なくとも１つのプログラム記憶装置を提供することが
できる。

【００４２】本明細書で示した流れ図は、例として提供
される。これらの図面または本明細書に記載のステップ
（または動作）に対する、本発明の主旨から逸脱しない
変形形態がありえる。たとえば、いくつかの場合に、ス
テップを異なる順序で実行することができ、ステップを
追加、削除または変更することができる。これらの変形
形態のすべてが、請求項に記載の本発明の一部を構成す
るとみなされる。

【００４３】まとめとして、本発明の構成に関して以下
の事項を開示する。

【００４４】（１）分散コンピューティング・システム
内のプロセッサを再構成する、クォーラム・ベースの方
法であって、前記分散コンピューティング・システムの
プロセッサのクォーラム・グループ内のクォーラムの存
在を識別するステップと、前記プロセッサのクォーラム
・グループの少なくとも１つのプロセッサが使用不能で
ある間に、前記プロセッサのクォーラム・グループを動
的に再構成するステップとを含み、前記動的再構成が、
前記少なくとも１つのプロセッサの使用不能性にもかか
わらず、前記プロセッサのクォーラム・グループの前記
クォーラムのプロセッサの存在と共に進行する方法。（２）前記少なくとも１つのプロセッサが使用可能にな
った後に回復処理を実行するステップをさらに含み、前
記回復処理が、前記プロセッサのクォーラム・グループ
の１つまたは複数のプロセッサから、前記動的に再構成
されたプロセッサのクォーラム・グループの現在の状態
を取り出すステップを含む、上記（１）に記載の方法。（３）前記回復処理が、前記少なくとも１つのプロセッ
サから、前記プロセッサのクォーラム・グループの少な
くとも１つの他のプロセッサへ、前記動的に再構成され
たプロセッサのクォーラム・グループの前記現在の状態
を要求するメッセージを送るステップを含む、上記
（２）に記載の方法。（４）前記現在の状態が、前記プロセッサのクォーラム
・グループに対するメンバ・プロセッサの現行リストを
含み、前記回復処理が、前記少なくとも１つのプロセッ
サでのプロセッサのメンバ・リストを、前記プロセッサ
のクォーラム・グループの前記少なくとも１つの他のプ
ロセッサから受け取った前記メンバ・プロセッサの現行
リストを用いて更新するステップを含む、上記（３）に
記載の方法。（５）前記回復処理を実行するステップが、さらに、前
記現在の状態を有する前記プロセッサのクォーラム・グ
ループのアクティブ・プロセッサから探索停止メッセー
ジを送るステップを含み、前記探索停止メッセージが、
前記少なくとも１つのプロセッサからの前記メッセージ
に応答する、上記（３）に記載の方法。（６）前記プロセッサのクォーラム・グループの各プロ
セッサが、インカーネーション番号と、そのインカーネ
ーション番号をもたらすコミット処理に参加したプロセ
ッサのメンバ・リストとを含み、前記回復処理が、１つ
または複数のプロセッサ・インカーネーション番号と前
記インカーネーション番号をもたらした前記コミット処
理に参加したプロセッサのメンバ・リストとを使用し
て、前記現在の状態を得るために、前記プロセッサのク
ォーラム・グループの前記１つまたは複数のプロセッサ
を検査するステップを含む、上記（２）に記載の方法。（７）前記回復処理が、メンバ・プロセッサの現行リス
トを使用して得たプロセッサの現行クォーラム番号を使
用して前記現在の状態を判定するステップを含む、上記
（６）に記載の方法。（８）前記１つまたは複数のプロセッサによって維持さ
れる前記メンバ・プロセッサのリストが、前記１つまた
は複数のプロセッサのプロセッサごとに、前記グループ
のインアクティブ・プロセッサのリストと、前記グルー
プのアクティブ・プロセッサのリストとを含み、前記ク
ォーラムが、特定のプロセッサについて、定義済みのプ
ロセッサの数からそのインアクティブ・リスト内のプロ
セッサの数を減じ、１を減じた値が、そのアクティブ・
リスト内のプロセッサの数の過半数より少ない場合に、
前記プロセッサのクォーラム・グループ内の定義済みプ
ロセッサの過半数未満を含む、上記（７）に記載の方
法。（９）前記回復処理が、現行インカーネーション番号お
よび前記プロセッサのクォーラム・グループのプロセッ
サの現行リストを、使用可能になる前記少なくとも１つ
のプロセッサに伝播することができるように、前記プロ
セッサのクォーラム・グループ内のプロセッサの状態を
交換するステップを含む、上記（２）に記載の方法。（１０）前記動的再構成が、前記プロセッサのクォーラ
ム・グループへのプロセッサの追加または前記プロセッ
サのクォーラム・グループからのプロセッサの削除のい
ずれかを含む、上記（１）に記載の方法。（１１）前記分散コンピューティング・システムが、非
共用分散コンピューティング・システムを含む、上記
（１）に記載の方法。（１２）分散コンピューティング・システム内のプロセ
ッサを再構成するシステムであって、前記分散コンピュ
ーティング・システムのプロセッサのクォーラム・グル
ープ内のクォーラムの存在を識別する手段と、前記プロ
セッサのクォーラム・グループの少なくとも１つのプロ
セッサが使用不能である間に前記プロセッサのクォーラ
ム・グループを動的に再構成する手段とを含み、前記動
的に再構成する手段が、前記少なくとも１つのプロセッ
サの使用不能性にもかかわらず、前記プロセッサのクォ
ーラム・グループの前記クォーラムのプロセッサの存在
と共に前記再構成を進行させる手段を含むシステム。（１３）前記少なくとも１つのプロセッサが使用可能に
なった後に回復処理を実行する手段をさらに含み、前記
回復処理を実行する手段が、前記プロセッサのクォーラ
ム・グループの１つまたは複数のプロセッサから、前記
動的に再構成されたプロセッサのクォーラム・グループ
の現在の状態を取り出す手段を含む、上記（１２）に記
載のシステム。（１４）前記回復処理を実行する手段が、前記少なくと
も１つのプロセッサから、前記プロセッサのクォーラム
・グループの少なくとも１つの他のプロセッサへ、前記
動的に再構成されたプロセッサのクォーラム・グループ
の前記現在の状態を要求するメッセージを送る手段を含
む、上記（１３）に記載のシステム。（１５）前記現在の状態が、前記プロセッサのクォーラ
ム・グループに対するメンバ・プロセッサの現行リスト
を含み、前記回復処理を実行する手段が、前記少なくと
も１つのプロセッサでのメンバ・プロセッサのリスト
を、前記プロセッサのクォーラム・グループの前記少な
くとも１つの他のプロセッサから受け取った前記メンバ
・プロセッサの現行リストを用いて更新する手段を含
む、上記（１４）に記載のシステム。（１６）前記回復処理を実行する手段が、さらに、前記
現在の状態を有する前記プロセッサのクォーラム・グル
ープのアクティブ・プロセッサから探索停止メッセージ
を送る手段を含み、前記探索停止メッセージが、前記少
なくとも１つのプロセッサからの前記メッセージに応答
する、上記（１４）に記載のシステム。（１７）前記プロセッサのクォーラム・グループの各プ
ロセッサが、インカーネーション番号と、そのインカー
ネーション番号をもたらすコミット処理に参加したプロ
セッサのメンバ・リストとを含み、前記回復処理を実行
する手段が、１つまたは複数のプロセッサ・インカーネ
ーション番号と前記インカーネーション番号をもたらし
たコミット処理に参加したメンバ・プロセッサのリスト
とを使用して、前記現在の状態を得るために、前記プロ
セッサのクォーラム・グループの前記１つまたは複数の
プロセッサを検査する手段を含む、上記（１３）に記載
のシステム。（１８）前記回復処理を実行する手段が、メンバ・プロ
セッサの現行リストを使用して得たプロセッサの現行ク
ォーラム番号を使用して前記現在の状態を判定する手段
を含む、上記（１７）に記載のシステム。（１９）前記１つまたは複数のプロセッサによって維持
される前記メンバ・プロセッサのリストが、前記１つま
たは複数のプロセッサのプロセッサごとに、前記グルー
プのインアクティブ・プロセッサのリストと、前記グル
ープのアクティブ・プロセッサのリストとを含み、前記
クォーラムが、特定のプロセッサについて、定義済みの
プロセッサの数からそのインアクティブ・リスト内のプ
ロセッサの数を減じ、１を減じた値が、そのアクティブ
・リスト内のプロセッサの数の過半数より少ない場合
に、前記プロセッサのクォーラム・グループ内の定義済
みプロセッサの過半数未満を含む、上記（１８）に記載
のシステム。（２０）前記回復処理を実行する手段が、現行インカー
ネーション番号および前記プロセッサのクォーラム・グ
ループのメンバ・プロセッサの現行リストを、使用可能
になる前記少なくとも１つのプロセッサに伝播すること
ができるように、前記プロセッサのクォーラム・グルー
プ内のプロセッサの状態を交換する手段を含む、上記
（１３）に記載のシステム。（２１）前記動的に再構成する手段が、前記プロセッサ
のクォーラム・グループへのプロセッサの追加または前
記プロセッサのクォーラム・グループからのプロセッサ
の削除のいずれかを実行する手段を含む、上記（１２）
に記載のシステム。（２２）前記分散コンピューティング・システムが、非
共用分散コンピューティング・システムを含む、上記
（１２）に記載のシステム。（２３）プロセッサのグループであって、前記プロセッ
サのグループ内のクォーラムの存在を識別し、前記プロ
セッサのグループの少なくとも１つのプロセッサが使用
不能である間の前記プロセッサのグループの動的再構成
を可能にするように適合されたプロセッサのグループを
含み、前記動的再構成が、前記少なくとも１つのプロセ
ッサの使用不能性にかかわらず、しかし、前記プロセッ
サのグループ内の前記クォーラムのプロセッサの存在と
共に進行を許可される分散コンピューティング・システ
ム。（２４）分散コンピューティング・システム内のプロセ
ッサを再構成する方法を実行するために計算機によって
実行可能な命令の少なくとも１つのプログラムであっ
て、前記分散コンピューティング・システムのプロセッ
サのクォーラム・グループ内のクォーラムの存在を識別
するステップと、前記プロセッサのクォーラム・グルー
プの少なくとも１つのプロセッサが使用不能である間
に、前記プロセッサのクォーラム・グループを動的に再
構成するステップとを含み、前記動的再構成が、前記少
なくとも１つのプロセッサの使用不能性にもかかわら
ず、前記プロセッサのクォーラム・グループの前記クォ
ーラムのプロセッサの存在と共に進行するプログラムを
具体的に実施する、計算機によって可読の少なくとも１
つのプログラム記憶装置。

【図面の簡単な説明】

【図１】３サーバ・システムのグループ・クォーラムが
２であることを示す、最初の状態（本明細書ではインカ
ーネーション１と呼称する）の３サーバ分散処理システ
ムを示す図である。

【図２】サーバ２およびサーバ３と、新しいサーバ４、
サーバ５およびサーバ６を含み、サーバ１が使用不能で
ある、新しいグループ・インカーネーション２の、図１
の分散処理システムを示す図である。

【図３】サーバ１がクォーラム計算のために定義解除さ
れ、これによって新しいグループ・クォーラムが３にな
る、新しいグループ・インカーネーション３の、図２の
分散処理システムを示す図である。

【図４】サーバ２およびサーバ３が使用不能になり、新
しいサーバ７がシステムに追加された、新しいグループ
・インカーネーション４の、図３の分散処理システムを
示す図である。

【図５】サーバ２およびサーバ３が定義解除され、グル
ープ・クォーラムが３に改訂された、新しいグループ・
インカーネーション５の、図４の分散処理システムを示
す図である。

【図６】本発明の原理による、動的サーバ回復手順の一
実施形態の流れ図である。

【図７】本発明の原理による、process_message_proced
ureの一実施形態の流れ図である。

【図８】本発明の原理による、process_message_proced
ureの一実施形態の流れ図である。

【図９】本発明の原理による、クォーラムを計算する手
順の一実施形態の流れ図である。

【図１０】本発明の原理による、プロセッサのグループ
の構成を変更する手順の一実施形態の流れ図である。

【符号の説明】

１０分散処理システム

───────────────────────────────────────────────────── フロントページの続き (72)発明者ケニス・シー・ブリスキーアメリカ合衆国12538 ニューヨーク州ハイド・パークホースショー・ドライブ 28 (72)発明者マルコス・エヌ・ノヴァクスアメリカ合衆国12533 ニューヨーク州ホープウェル・ジャンクションリッジ・ビュー・ロード 10

Claims

【特許請求の範囲】

【請求項１】分散コンピューティング・システム内のプ
ロセッサを再構成する、クォーラム・ベースの方法であ
って、前記分散コンピューティング・システムのプロセッサの
クォーラム・グループ内のクォーラムの存在を識別する
ステップと、前記プロセッサのクォーラム・グループの少なくとも１
つのプロセッサが使用不能である間に、前記プロセッサ
のクォーラム・グループを動的に再構成するステップと
を含み、前記動的再構成が、前記少なくとも１つのプロ
セッサの使用不能性にもかかわらず、前記プロセッサの
クォーラム・グループの前記クォーラムのプロセッサの
存在と共に進行する方法。
【請求項２】前記少なくとも１つのプロセッサが使用可
能になった後に回復処理を実行するステップをさらに含
み、前記回復処理が、前記プロセッサのクォーラム・グ
ループの１つまたは複数のプロセッサから、前記動的に
再構成されたプロセッサのクォーラム・グループの現在
の状態を取り出すステップを含む、請求項１に記載の方
法。
【請求項３】前記回復処理が、前記少なくとも１つのプ
ロセッサから、前記プロセッサのクォーラム・グループ
の少なくとも１つの他のプロセッサへ、前記動的に再構
成されたプロセッサのクォーラム・グループの前記現在
の状態を要求するメッセージを送るステップを含む、請
求項２に記載の方法。
【請求項４】前記現在の状態が、前記プロセッサのクォ
ーラム・グループに対するメンバ・プロセッサの現行リ
ストを含み、前記回復処理が、前記少なくとも１つのプ
ロセッサでのプロセッサのメンバ・リストを、前記プロ
セッサのクォーラム・グループの前記少なくとも１つの
他のプロセッサから受け取った前記メンバ・プロセッサ
の現行リストを用いて更新するステップを含む、請求項
３に記載の方法。
【請求項５】前記回復処理を実行するステップが、さら
に、前記現在の状態を有する前記プロセッサのクォーラ
ム・グループのアクティブ・プロセッサから探索停止メ
ッセージを送るステップを含み、前記探索停止メッセー
ジが、前記少なくとも１つのプロセッサからの前記メッ
セージに応答する、請求項３に記載の方法。
【請求項６】前記プロセッサのクォーラム・グループの
各プロセッサが、インカーネーション番号と、そのイン
カーネーション番号をもたらすコミット処理に参加した
プロセッサのメンバ・リストとを含み、前記回復処理
が、１つまたは複数のプロセッサ・インカーネーション
番号と前記インカーネーション番号をもたらした前記コ
ミット処理に参加したプロセッサのメンバ・リストとを
使用して、前記現在の状態を得るために、前記プロセッ
サのクォーラム・グループの前記１つまたは複数のプロ
セッサを検査するステップを含む、請求項２に記載の方
法。
【請求項７】前記回復処理が、メンバ・プロセッサの現
行リストを使用して得たプロセッサの現行クォーラム番
号を使用して前記現在の状態を判定するステップを含
む、請求項６に記載の方法。
【請求項８】前記１つまたは複数のプロセッサによって
維持される前記メンバ・プロセッサのリストが、前記１
つまたは複数のプロセッサのプロセッサごとに、前記グ
ループのインアクティブ・プロセッサのリストと、前記
グループのアクティブ・プロセッサのリストとを含み、
前記クォーラムが、特定のプロセッサについて、定義済
みのプロセッサの数からそのインアクティブ・リスト内
のプロセッサの数を減じ、１を減じた値が、そのアクテ
ィブ・リスト内のプロセッサの数の過半数より少ない場
合に、前記プロセッサのクォーラム・グループ内の定義
済みプロセッサの過半数未満を含む、請求項７に記載の
方法。
【請求項９】前記回復処理が、現行インカーネーション
番号および前記プロセッサのクォーラム・グループのプ
ロセッサの現行リストを、使用可能になる前記少なくと
も１つのプロセッサに伝播することができるように、前
記プロセッサのクォーラム・グループ内のプロセッサの
状態を交換するステップを含む、請求項２に記載の方
法。
【請求項１０】前記動的再構成が、前記プロセッサのク
ォーラム・グループへのプロセッサの追加または前記プ
ロセッサのクォーラム・グループからのプロセッサの削
除のいずれかを含む、請求項１に記載の方法。
【請求項１１】前記分散コンピューティング・システム
が、非共用分散コンピューティング・システムを含む、
請求項１に記載の方法。
【請求項１２】分散コンピューティング・システム内の
プロセッサを再構成するシステムであって、前記分散コンピューティング・システムのプロセッサの
クォーラム・グループ内のクォーラムの存在を識別する
手段と、前記プロセッサのクォーラム・グループの少なくとも１
つのプロセッサが使用不能である間に前記プロセッサの
クォーラム・グループを動的に再構成する手段とを含
み、前記動的に再構成する手段が、前記少なくとも１つ
のプロセッサの使用不能性にもかかわらず、前記プロセ
ッサのクォーラム・グループの前記クォーラムのプロセ
ッサの存在と共に前記再構成を進行させる手段を含むシ
ステム。
【請求項１３】前記少なくとも１つのプロセッサが使用
可能になった後に回復処理を実行する手段をさらに含
み、前記回復処理を実行する手段が、前記プロセッサの
クォーラム・グループの１つまたは複数のプロセッサか
ら、前記動的に再構成されたプロセッサのクォーラム・
グループの現在の状態を取り出す手段を含む、請求項１
２に記載のシステム。
【請求項１４】前記回復処理を実行する手段が、前記少
なくとも１つのプロセッサから、前記プロセッサのクォ
ーラム・グループの少なくとも１つの他のプロセッサ
へ、前記動的に再構成されたプロセッサのクォーラム・
グループの前記現在の状態を要求するメッセージを送る
手段を含む、請求項１３に記載のシステム。
【請求項１５】前記現在の状態が、前記プロセッサのク
ォーラム・グループに対するメンバ・プロセッサの現行
リストを含み、前記回復処理を実行する手段が、前記少
なくとも１つのプロセッサでのメンバ・プロセッサのリ
ストを、前記プロセッサのクォーラム・グループの前記
少なくとも１つの他のプロセッサから受け取った前記メ
ンバ・プロセッサの現行リストを用いて更新する手段を
含む、請求項１４に記載のシステム。
【請求項１６】前記回復処理を実行する手段が、さら
に、前記現在の状態を有する前記プロセッサのクォーラ
ム・グループのアクティブ・プロセッサから探索停止メ
ッセージを送る手段を含み、前記探索停止メッセージ
が、前記少なくとも１つのプロセッサからの前記メッセ
ージに応答する、請求項１４に記載のシステム。
【請求項１７】前記プロセッサのクォーラム・グループ
の各プロセッサが、インカーネーション番号と、そのイ
ンカーネーション番号をもたらすコミット処理に参加し
たプロセッサのメンバ・リストとを含み、前記回復処理
を実行する手段が、１つまたは複数のプロセッサ・イン
カーネーション番号と前記インカーネーション番号をも
たらしたコミット処理に参加したメンバ・プロセッサの
リストとを使用して、前記現在の状態を得るために、前
記プロセッサのクォーラム・グループの前記１つまたは
複数のプロセッサを検査する手段を含む、請求項１３に
記載のシステム。
【請求項１８】前記回復処理を実行する手段が、メンバ
・プロセッサの現行リストを使用して得たプロセッサの
現行クォーラム番号を使用して前記現在の状態を判定す
る手段を含む、請求項１７に記載のシステム。
【請求項１９】前記１つまたは複数のプロセッサによっ
て維持される前記メンバ・プロセッサのリストが、前記
１つまたは複数のプロセッサのプロセッサごとに、前記
グループのインアクティブ・プロセッサのリストと、前
記グループのアクティブ・プロセッサのリストとを含
み、前記クォーラムが、特定のプロセッサについて、定
義済みのプロセッサの数からそのインアクティブ・リス
ト内のプロセッサの数を減じ、１を減じた値が、そのア
クティブ・リスト内のプロセッサの数の過半数より少な
い場合に、前記プロセッサのクォーラム・グループ内の
定義済みプロセッサの過半数未満を含む、請求項１８に
記載のシステム。
【請求項２０】前記回復処理を実行する手段が、現行イ
ンカーネーション番号および前記プロセッサのクォーラ
ム・グループのメンバ・プロセッサの現行リストを、使
用可能になる前記少なくとも１つのプロセッサに伝播す
ることができるように、前記プロセッサのクォーラム・
グループ内のプロセッサの状態を交換する手段を含む、
請求項１３に記載のシステム。
【請求項２１】前記動的に再構成する手段が、前記プロ
セッサのクォーラム・グループへのプロセッサの追加ま
たは前記プロセッサのクォーラム・グループからのプロ
セッサの削除のいずれかを実行する手段を含む、請求項
１２に記載のシステム。
【請求項２２】前記分散コンピューティング・システム
が、非共用分散コンピューティング・システムを含む、
請求項１２に記載のシステム。
【請求項２３】プロセッサのグループであって、前記プロセッサのグループ内のクォーラムの存在を識別
し、前記プロセッサのグループの少なくとも１つのプロセッ
サが使用不能である間の前記プロセッサのグループの動
的再構成を可能にするように適合されたプロセッサのグ
ループを含み、前記動的再構成が、前記少なくとも１つのプロセッサの
使用不能性にかかわらず、しかし、前記プロセッサのグ
ループ内の前記クォーラムのプロセッサの存在と共に進
行を許可される分散コンピューティング・システム。
【請求項２４】分散コンピューティング・システム内の
プロセッサを再構成する方法を実行するために計算機に
よって実行可能な命令の少なくとも１つのプログラムで
あって、前記分散コンピューティング・システムのプロセッサの
クォーラム・グループ内のクォーラムの存在を識別する
ステップと、前記プロセッサのクォーラム・グループの少なくとも１
つのプロセッサが使用不能である間に、前記プロセッサ
のクォーラム・グループを動的に再構成するステップと
を含み、前記動的再構成が、前記少なくとも１つのプロ
セッサの使用不能性にもかかわらず、前記プロセッサの
クォーラム・グループの前記クォーラムのプロセッサの
存在と共に進行するプログラムを具体的に実施する、計
算機によって可読の少なくとも１つのプログラム記憶装
置。