JPH1078944A - 分散コンピュータ環境におけるプロセッサ・ドメインのメンバー管理方法及び装置 - Google Patents

分散コンピュータ環境におけるプロセッサ・ドメインのメンバー管理方法及び装置

Info

Publication number
JPH1078944A
JPH1078944A JP9182167A JP18216797A JPH1078944A JP H1078944 A JPH1078944 A JP H1078944A JP 9182167 A JP9182167 A JP 9182167A JP 18216797 A JP18216797 A JP 18216797A JP H1078944 A JPH1078944 A JP H1078944A
Authority
JP
Japan
Prior art keywords
node
message
name server
domain
follow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP9182167A
Other languages
English (en)
Other versions
JP3554472B2 (ja
Inventor
Richard Badobinatsutsu Peter
ピーター・リチャード・バドビナッツ
Bart Brenner Larry
ラリー・バート・ブレンナー
Deipaku Chandora Tsushaaru
ツシャール・ディパク・チャンドラ
Theodore Kilby Oobaru
オーバル・テオドール・キルビー
Arthur Pershing John Jr
ジョン・アーサー・パーシング、ジュニア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH1078944A publication Critical patent/JPH1078944A/ja
Application granted granted Critical
Publication of JP3554472B2 publication Critical patent/JP3554472B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/142Reconfiguring to eliminate the error
    • G06F11/1425Reconfiguring to eliminate the error by reconfiguration of node membership

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)

Abstract

(57)【要約】 【課題】 分散コンピュータ環境におけるプロセッサ・
ドメインのメンバーを管理する方法を提供する。 【解決手段】 ドメイン内の使用可能な最小番号ノード
を決定し、そのノードへ他のノードから追従メッセージ
を周期的に送信する。全ての追従メッセージを受信した
ならば、最小番号ノードが2段階コミットを実行するこ
とによりそのドメイン内のプロセッサを管理するネーム
・サーバとなる。2段階コミットは、最小番号ノードか
ら他のノードへ第1段階(P1)挿入メッセージを送信
し、それに応答して他のノードから最小番号ノードへ肯
定(ACK)メッセージが送信される。肯定メッセージに
対して、最小番号ノードがネーム・サーバとなったこと
を通知するコミット・メッセージが他のノードへ送信さ
れる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、分散コンピュータ
環境に関し、特に、分散コンピュータ環境における1又
は複数のプロセッサからなるドメインのメンバーを管理
することに関する。
【0002】
【従来の技術】分散コンピュータ環境におけるコンピュ
ータは、並行にデータを処理する複数のコンピュータ・
ノードを含む。このようなシステムの多くは、これらの
ノードを複数の区画へと組織化することができ、各区画
が1又は複数のドメインを有する。各ドメインは、異な
るコンピュータ・プログラムを同時に実行することがで
きる。これらのシステムの多くにおいては、1つのノー
ドが各ドメインを制御する。各ノードがラインに加わる
か若しくは立ち上がることにより使用可能となると、そ
のノードはドメインへ割り当てられなければならず、そ
してそのドメイン内の他のノードはその新しいノードを
認知しなければならない。それにより、その区画内で実
行中のプログラムのタスクを共有することができる。こ
のことは、所与のシステムにおいては、各ノードがその
システム内の他の各ノードへメッセージを送っていずれ
のノードがそのドメインを制御しているかそしていずれ
のタスクがいずれのノードへ割り当てられているか等の
情報を判断することにより行われる。
【0003】利用度の高いアプリケーションにおいて、
故障したノードを回復させる回復プロセスのある場合、
回復しようとしているその故障したノードは、初めてラ
インに加わる(作動中となる)新しいノードと同じ情報
を見出すことが必要となる。さらに、その故障したノー
ドがそのドメインを制御するノードである場合には、区
画内においてそのドメインの制御を代わりに行う新しい
ノードを指示する必要もある。多くの場合、各ノードか
らそのドメイン内の他の各ノードへメッセージを送り、
いずれのノードが未だ使用可能であるかを判断して新し
い制御ノードを割り当てることにより行われる。このよ
うな方式によると結果的に、ノードが新たに加わったり
回復されたりする毎に大量のメッセージ・トラフィック
が送られることとなる。
【0004】
【発明が解決しようとする課題】本発明の目的は、ノー
ドが初めてライン上に加わる際にドメイン内の全てのノ
ードについてのネーム・サーバ・ノードを構築すること
である。
【0005】本発明の更なる目的は、ノードがフリッカ
ーを生じているとき、そのノードが立ち上がろうとする
のか若しくは停止しようとするのかを確認するプロトコ
ルを提供することである。
【0006】本発明の更なる目的は、古いネーム・サー
バ・ノードが故障しまたは停止してしまったとき、新し
いネーム・サーバ・ノードを選択することができるよう
な回復のプロトコルを提供することである。
【0007】
【課題を解決するための手段】本発明は、ドメインに参
加しようとする新しいノードが、新しいノードの参加を
制御するネーム・サーバ・ノードに対してメッセージを
送るのみでよいようなPROCLAIMプロトコルを提
供する。
【0008】本発明は、既に参加しているノードと新し
いノードとの間でのみ送られるメッセージによりその新
しいノードがネーム・サーバとなることができるPRO
CLAIMプロトコルを提供する。
【0009】本発明は、停止すると報告されたノードが
実際に停止するのか否か、又は停止しそうに見えるだけ
なのか否かを確認するFLICKERプロトコルを提供
する。
【0010】本発明は、故障したノードの回復を実行す
るために、ネーム・サーバ・ノードへメッセージを送る
のみでよいRECOVERプロトコルを提供する。
【0011】本発明は、古いネーム・サーバが故障した
ときに新しいネーム・サーバを決定でき、その際、RE
COVERプロトコルが新しいネーム・サーバとそのド
メイン内の他のノードとの間でメッセージを送るのみで
よいようなRECOVERプロトコルを提供する。
【0012】本発明は、RICOVERプロトコルが完
了する前に古いネーム・サーバが使用可能となった場合
に、回復プロセスを終了させて古いネーム・サーバがそ
の役割を復活できるようなRECOVERプロトコルを
提供する。
【0013】本発明における上記及び他の目的、特徴並
びに利点は、図面に示された本発明の好適な実施例のよ
り詳細な説明により明らかとされるであろう。
【0014】
【発明の実施の形態】図1は、本発明により使用可能な
分散コンピュータ・システム100の概略的構成図であ
る。分散コンピュータ・システム100としては、Inte
rnational Business Machines Corporationから市販さ
れているIBM RISC System/6000 Scalable POWERparalle
l System(SP)分散コンピュータ・システムがある。
図1に開示された実施例は、全部で8フレームを有する
SPコンピュータであり、各フレームが16個までのノ
ードを有し、全部で128のノードが可能である。全て
のノード106は、ローカル・エリア・ネットワーク
(LAN)102により結合される。当業者には周知の
通り、各ノード106はコンピュータそのものであり、
RISC System/6000ワークステーションとすることができ
る。
【0015】SPコンピュータ100のフレーム内の全
てのノードはLANセグメントに含まれ、LANセグメ
ントは、LANゲート104を介して他のLANセグメ
ントと結合される。さらに、LAN102には制御ワー
クステーション(CWS)112が接続され、これは、
SPコンピュータのオペレーションを制御する。制御ワ
ークステーションは、直接アクセス記憶装置(DAS
D)114を有し、ここにシステム・データ・リポジト
リー・ファイル(SDR)が記憶される。SDRファイ
ルは、システム内のノードのリスト及びそれらの設定等
の情報を含む。各ノード106もまた、SPコンピュー
タ100により処理されたデータを記憶するDASD装
置107を含む。
【0016】一実施例においては、各フレーム内のノー
ドがさらに、IBM Scalable POWERparallel switch(S
PS)105へ接続される。各フレームのSPSスイッ
チ105の各々は、バス110により他のフレームの隣
のSPSスイッチ105へ接続される。
【0017】周知の通り、CWSノード112が、LA
N102を用いてノード106へメッセージ及びデータ
を送る一方、ノード106は、SPスイッチ105を用
いて互いにメッセージ及びデータを送ることができる。
【0018】SPコンピュータ・システムの各ノード1
06及びCWS112は、米国特許第08/64041
2号「A Method for Managing Membership of a Group
of Processors in a Distributed Computing Environme
nt」に記載されたグループ・サービス・デーモンを含
む。各ノード106は、ソフトウェア若しくはハードウ
ェア、又はこれらの組合せによるものを含んでおり、い
ずれのノードが立ち上がり使用可能となったかを他の全
てのノードに対して報告する。いずれかのノード106
が故障した場合、ハートビート機能として知られるプロ
セスによりその識別が他のノードへ知らされる。周知の
通り、SPコンピュータ・システム100のノード10
6は、複数の区画へ分けることができる。
【0019】図2は、ノード106の区画200を示す
構成図である。区画200は、さらに1又は複数のドメ
インへと小さく分けられる。例えば、図2の区画200
は、4個のドメイン201A〜201Dへと分けられて
いる。各ドメイン201は、ネーム・サーバ202を含
む。例えば、図2の例では、ドメイン201A〜201
Dが各々ネーム・サーバ(NS)202A〜202Dを
有している。ドメイン201内のノードは、1又は複数
のグループのメンバーとなることができ、各グループは
グループ・リーダー(GL)により支援される。例え
ば、ドメイン201A内のノードは、3つのグループの
メンバーであり、各グループはグループ・リーダー20
4、205及び206により支援される。ドメイン20
1B内のノードは、2つのグループのメンバーであり、
各グループはグループ・リーダー208及び209によ
り支援される。同様に、ドメイン201C内のノード
は、4つのグループのメンバーであり、各グループはグ
ループ・リーダー210、211、212及び213に
より支援される。ドメイン201D内のノードは、1つ
のグループのメンバーであり、このグループはグループ
・リーダー215により支援される。ネーム・サーバの
主な機能は、そのドメイン内のグループに加わろうとす
る各ノードをそのグループのグループ・リーダー(G
L)へ知らせ、そしてグループ・ネームがそのドメイン
内で固有であるように保証することである。プロセッサ
のグループのメンバーを管理すること及びグループ・リ
ーダーの機能は、前述の米国特許出願第08/6404
12号に詳細に開示されている。あるグループに参加し
ようとしているノードをそのグループのグループ・リー
ダーに教えるために必要な情報は、そのドメイン内のグ
ループのために各ネーム・サーバにより保持されるテー
ブルTに記憶されている。テーブルT及びそのエントリ
については、米国特許出願第08/684246号「MA
NAGING GROUP EVENTS BYA NAME SERVER FOR A GROUP OF
PROCESSORS IN A DISTRIBUTED COMPUTING ENVIRONMEN
T」に開示されている。
【0020】本発明の目的の中に、ドメインへ新しいノ
ードを追加し、ノードが故障したときドメインからその
ノードを取り除き、そしてそのネーム・サーバ・ノード
が故障したときドメインを回復させることがある。本発
明におけるネーム・サーバの機能は、次の通りである。 1.新しいノードがネーム・サーバ・ノードを識別でき
るように、全ての新しいノードに対して宣言する。 2.ノードが故障した場合、米国特許出願第08/64
0412号に記載のグループからノードを取り除く方法
と同様に、その故障したノードをドメインから削除す
る。 3.新しいノードから追従メッセージを収集した後、ド
メインへ追従するノードを挿入する。
【0021】一実施例においては、ドメインが互いを見
出すと、小さい方のドメインのネーム・サーバ(あるい
は、大きさが同じ場合は、より大きい番号のネーム・サ
ーバ)が自分のドメインを解散する。その結果、全ての
ノードが他のドメインに加わることとなる。
【0022】図3は、新ノードがドメインに追加される
場合のPROCLAIMプロトコルのプロトコル状態図
である。各ノード106は、ただ1つのドメインに追加
される。以下の説明においては、簡単とするためにただ
1つのドメインについて説明する。新ノードが最初に使
用可能となるとき、未確定状態301に入る。その後、
新ノードはそのローカル・ハートビート機能を調べるこ
とにより、最小番号のノード(LNN)であるか否かを
判断する。本発明では、ドメイン内の最小番号ノードに
対してネーム・サーバを割り当てるようにしている。
【0023】新ノードが最小番号のノードである場合、
アセンド(ascend)状態302へ移行する。アセンド状態
にあるノードが、より小さい番号をもつ新ノードが使用
可能となったことを見出した場合、このノードは、自分
が最小番号のノードではないことを認識し、矢印303
に示すように未確定状態301へ戻る。アセンド状態に
あるノードが、このドメインには既にネーム・サーバ・
ノードが存在することを示すPROCLAIMメッセー
ジを受信した場合、このノードは挿入保留状態305へ
移行する。この状態305については後述する。アセン
ド状態302にあるノードが使用可能な他の全てのノー
ドから追従メッセージを受信した場合、後述するよう
に、このコードはアセンディング(ascending)状態30
6に移行する。アセンディング状態306にあるとき、
ノードは、そのノードに追従した他の全てのノードに対
して第1段階(P1)挿入メッセージを送る。ドメインへ
の新ノードの挿入は、グループへのノードの挿入と同じ
であり、上記の米国特許出願第08/640412号に
開示されている。
【0024】他のノードの各々が第1段階挿入メッセー
ジを受信すると、各ノードはそのアクションに同意する
ことを示す肯定(ACK)メッセージにより応答するか、
又は、そのアクションに同意しないことを示す否定(N
ACK)メッセージにより応答する。ノードがネーム・
サーバであるときは、NACKメッセージを送ることが
できる。アセンディング状態306にあるノードが、自
分が最小番号のノードでないことを認識した場合又はN
ACKメッセージを受信した場合、他のノードに対して
挿入プロセスを中止することを示す中止メッセージを同
報通信し、そして矢印307を経て未確定状態301へ
戻る。アセンディング状態306にあるノードが、ネー
ム・サーバ・ノードからPROCLAIMメッセージを
受信した場合、そのノードは中止メッセージを同報通信
し、矢印309を経て挿入保留状態305へ移行する。
【0025】アセンディング状態306にあるノード
が、他の全てのノードから肯定メッセージを受信した場
合、自分が現在ネーム・サーバであることを示すコミッ
ト(commit)・メッセージを他の全てのノードに対して送
信し、ネーム・サーバ成立状態310へ移行する。この
時点で、ドメインが形成されたことになり、全てのドメ
イン・ノードが確定状態317又は状態310にある。
そして、全てのノードが、いずれのノードがネーム・サ
ーバであるかを認知している。
【0026】未確定状態301において、新ノードが、
自分が最小番号ではないと判断した場合、矢印313を
経て追従状態312へと移行する。追従状態312にあ
るノードは、最小番号ノードに対して周期的に追従メッ
セージを送信する。最小番号ノードに対するこの追従メ
ッセージは、新ノードがそのドメインに参加しようとし
ていることを示しかつ新ノードがそのノードを最小番号
ノードとして認識していることを示す。最小番号ノード
が既にそのドメインのメンバーでありかつ別のノードを
ネーム・サーバとして認識している場合、最小番号ノー
ドは、いずれがネーム・サーバであるかを示すマイリー
ダー(MLI)・メッセージをその新ノードに対して送り
返す。MLIメッセージによりネーム・サーバとして識
別されたノードは、みなし(reputed)ネーム・サーバ(R
NS)として認知される。
【0027】追従状態312にある新ノードは、他のノ
ードがネーム・サーバとして設定されていることを示す
PROCLAIMメッセージを受信することができる。
追従状態312にある新ノードが、適切な挿入P1メッ
セージを受信した場合、矢印317を経て挿入状態31
6へ移行する。挿入状態316にある新ノードは、挿入
P1メッセージを送信しているノードに対して肯定P1
メッセージを送信する。挿入状態316にあるノードが
中止メッセージを受信した場合、新ノードは、矢印31
9を経て未確定状態301へ移行する。挿入状態316
にある新ノードが、その肯定P1メッセージに応答する
コミット・メッセージを受信した場合、新ノードは確定
状態317へ移行する。この時点で、新ノードはそのド
メインへ受け入れられ、いずれがネーム・サーバ・ノー
ドであるかを認知している。
【0028】挿入保留状態305にあるとき新ノード
は、みなしネーム・サーバ(RNS)・ノードに対して周
期的に追従メッセージを送信する。RMSノードは、M
LIメッセージ若しくはPROCLAIMメッセージの
いずれかをより早く受信することにより識別されたノー
ドである。挿入保留状態305にあるノードがそのロー
カル・ハートビート機能を介してRNSノードが故障し
たことを発見した場合、新ノードは矢印320を経て未
確定状態301へ戻る。一方、挿入保留状態305にあ
る新ノードが適切なRMSノードから挿入P1メッセー
ジを受信した場合、前述のように、挿入状態316へ移
行して肯定P1メッセージを送信する。挿入状態316
にあるノードが、そのローカル・ハートビート機能を介
してRNSノードが故障したことを発見した場合、後述
するように、そのノードは矢印330を経て未確定状態
502へ移行する。
【0029】新ノードが未確定状態301へ戻ったなら
ば必然的に、その新ノードが状態310においてネーム
・サーバとなるか又は確定状態317においてドメイン
へ受け入れられるかするまで、状態から状態へと移行す
るプロセス全体を再び開始することとなる。
【0030】アセンド状態302において、ハートビー
ト機能が他の使用可能なノードを発見できるようにコロ
ナ・タイマー350が含まれている。これにより可能な
限り大きな単一ドメインが形成される。コロナ・タイマ
ーは、アセンド状態302に入るときセットされる。全
ての使用可能なノードから追従メッセージが受信されか
つアセンド状態302においてコロナ・タイマーが時間
切れとなった場合にのみ、発見された使用可能に立ち上
がったノードが立ち上がり使用可能なノードとみなさ
れ、そして前述のように、状態はアセンディング状態3
06へ続く。コロナ・タイマーは、全ての立ち上がりノ
ードを配置するべく、SPコンピュータ・システム10
0内の全てのネットワークを探索するために十分な時間
をハートビート機能に対して与える。コロナ・タイマー
が長すぎる場合、サービス・プロバイダ使用グループ
は、それらのサービスをドメインに提供することが不必
要に遅延させられる。従って、双方の関係を満足するた
めに、合理的な中間値が選ばれる。実施例においては、
コロナ・タイマーは20秒にセットされる。
【0031】図4は、FLICKERプロトコルのプロ
トコル状態図を示しており、そこでは、可用性がフリッ
カ方式に起動、停止、再び起動するように、ノードが故
障(停止)し、そして使用可能(起動)となるように見
える。故障のように見える場合、実際に故障しているこ
ともあるし、あるいは、ノードが故障したかのように見
える区画化若しくは一時的ネットワーク状態等の結果で
あるかもしれない。前述のように、ハートビート機能
は、ドメイン内の全てのノードの状態を継続的にモニタ
している。ノードの通常状態すなわち起動状態は、図4
のブロック401に示されている。ノードが停止したこ
とをハードビート機能が報告したとき、ノードの状態が
矢印409を経てブロック402の推定停止状態へ移行
する。続いて、ノードが復帰したことをハートビート機
能が報告したとき、グループ・サービスは、ノードが実
際に再び使用可能となったことを確認しようとする。こ
うして、矢印407を経てノードの状態は、非停止状態
403へ移行する。これは過渡的状態である。非停止状
態403にあるとき、その故障したノードに対してメッ
セージが送られ、そしてそのノードが実際に起動してい
るのか停止しているのかを調べるために応答を待つ。こ
のプロセスは、PINGプロトコルとして知られてい
る。PINGメッセージに対する応答としてそのノード
から適宜の肯定応答が受信された場合には、そのノード
が起動状態にあると確認される結果、矢印404を経て
起動状態401へと戻る。各ノード間のPINGメッセ
ージについては周知の技術であり、ここでは詳細に説明
しない。PINGメッセージに対する応答として故障し
たノードから否定応答が受信された場合には、そのノー
ドが停止したと確認され、そのノードは矢印406を経
て確認停止状態405へ移行する。応答が受信されない
場合は、ノードは非停止状態403のまま維持され、そ
して応答が受信されるまでPINGメッセージが周期的
に送信される。非停止状態405にあるノードが故障し
たことをハートビート機能が報告した場合、このノード
は、矢印408を経て推定停止状態402へと戻され
る。
【0032】図5は、ネーム・サーバ・ノードが故障し
た様子がある場合におけるRECOVERプロトコルに
ついてのプロトコル状態図である。ネーム・サーバ・ノ
ードが故障したとき、回復プロセスを介して新しいネー
ム・サーバ・ノードが選択される必要があることは自明
であろう。回復プロセスは、ドメイン内のノードを適切
に操作するためにドメイン内で生き残っているノードへ
ネーム・サーバの役割を渡すことができる。ノードが故
障したとき、この事実は、前述のようにハートビート機
能を介して全てのノードへ報告される。各ノードにおけ
るグループ・サービス・デーモンが、ネーム・サーバが
故障したことを判断したとき、各ノードにおけるグルー
プ・サービス・デーモンの各々が、図5の回復プロトコ
ルを通して進行する。このプロトコルの最初において、
ノードは、図3における所与の状態317と同じ所与の
状態501にある。ネーム・サーバが故障したとき、ノ
ードの状態は所与の状態501から矢印533を経て未
確定状態502へ移行する。未確定状態502において
グループ・サービス・デーモンは、メンバシップ・リス
トを調べることにより、いずれのノードが次のネーム・
サーバとしてリスト上に載っているかを判断する。これ
については、前述の米国特許出願第08/640412
号に記載されている。この次のネーム・サーバは、クラ
ウン・プリンス(crown prince)すなわちCPとして識別
される。ノードがクラウン・プリンスである場合、その
ノードが矢印534を経てアセンド状態503へ移行す
る。そのノードが現在起動していると認識する他のノー
ドから全ての回復メッセージを受信したならば、そのノ
ードはアセンディング状態504へ移行する。コロナ・
タイマー550もまたアセンド状態503にあり、これ
は前述のコロナ・タイマー350と同じである。回復メ
ッセージについては、追従状態510に関連して詳細に
後述する。アセンディング状態504にあるCPノード
は、第1段階引継メッセージをそのドメインの他の全て
のノードへ送信する。メンバシップ・リスト中のさらに
古いCPノードが起動したためにそのノードがCPノー
ドではないことがそのローカル・ハートビート機能を介
して判明したり、あるいは、第1段階引継(TOP1)否
定メッセージを受信したりした場合には、そのノードは
他の全てのノードに対して中止メッセージを同報通信
し、そして矢印505を介して未確定状態502へ戻
る。他の全てのノードから第1段階引継肯定メッセージ
を受信したならば、CPノードは、第2段階引継(TO
P2)メッセージを他のノードへ同報通信し、矢印50
7を介してネーム・サーバ成立状態506へ移行する。
TOP2メッセージに応答して、他のノードは、新しい
ネーム・サーバ用のテーブルTを再構築するために必要
なデータを送信する。これにより新しいネーム・サーバ
はネーム・サーバの役割を引き継ぐことができる。ある
ノードがそのテーブルTデータを送信する前に故障した
場合、そのノードはネーム・サーバにより通常通りにド
メインから除かれ、そしてそのノードの欠如は何の影響
も及ぼさない。新たなネーム・サーバがテーブルTにつ
いての全データを取得した後、自らが新しいネーム・サ
ーバであることを示すためにコミット引継メッセージを
他の全てのノードに対して通信し、そして矢印545を
経て完了状態540へ移行する。完了状態540におい
ては、ネーム・サーバはいつでも前述の米国特許出願第
08/684246号に開示されたルックアップを処理
することができる。
【0033】未確定状態502にあるノードが、自身が
CPノードではないと判断した場合、矢印511を経て
追従状態510へ移行する。追従状態にあるノードは、
前述のように、メンバシップ・リストで識別されたCP
ノードに対して周期的に回復メッセージを送信する。こ
の時点で、ドメイン内の他の全てのノードが同じ回復プ
ロトコルを行っており、かつそれらのノードもCPノー
ドに対して周期的な回復メッセージを送っていることは
自明であろう。こうすることにより、前述の通り、CP
ノードがアセンド状態503に達したとき、他の全ての
ノードから全ての回復ノードを集めることができ、アセ
ンディング状態504に移行することができる。追従状
態510にあるノードが、アセンディング状態504に
あるCPノードから第1段階引継(TOP1)メッセージ
を取得すると、存在しているノードは矢印513を経て
引き継ぎ状態512へ移行し、TOP1メッセージに応
答して肯定メッセージを送信する。これにより、アセン
ディング状態504にあるCPノードは、そのドメイン
内の全てのノードから肯定メッセージを受信した後、ネ
ーム・サーバ成立状態506へ移行する。
【0034】追従状態510にあるノードが、自身がC
Pノードであると判断した場合、矢印515を経てアセ
ンド状態503へと移行する。また、アセンド状態50
3にあるノードが、メンバシップ・リスト中のより上位
のCPノードが起動したために自身がCPノード出ない
と判断した場合も、アセンド状態503から矢印516
を経て追従状態510へと移行する。追従状態510に
あるノードが、CPノードが故障したと判断した場合、
このノードは矢印517を経て未確定状態502へと戻
る。引継状態512にあるノードが、CPノードが故障
したか若しくはTOP1中止メッセージを取得したと判
断した場合、そのノードは、引継状態512から矢印5
20を経て未確定状態502へと戻る。引継状態にある
ノードが第2段階引継(TOP2)メッセージを受信した
場合、そのノードは、新しいネーム・サーバに対してT
テーブルを再構築するために必要なデータを送信し、矢
印521を経て未確定状態501へと移行する。こうし
てノードが未確定状態501へ移行すると、そのノード
は、自身がネーム・サーバでないことを再び認知する
が、いずれがネーム・サーバであるかすなわち成立状態
506となったノードを認知している。
【0035】ノードが追従状態510にあり、かつ、故
障の回復プロセスを開始しているネーム・サーバが図4
に関して述べた確認状態へ戻るとき、「王の帰還」とし
て知られる条件が検知されている。この場合、そのノー
ドは追従状態510から矢印522を経て確定状態50
1移行し、回復が停止し、そして古いネーム・サーバが
ネーム・サーバ・ノードに留まる。
【0036】PROCLAIMプロトコル又はRECO
VERプロトコルの間にいずれかのルックアップ・メッ
セージが発生された場合、そのノードがPROCLAI
M確定状態317若しくはRECOVER確定状態50
1のいずれかになるまでは、ルックアップ・メッセージ
がローカルにキューされる。PROCLAIMプロトコ
ルにおいては、ルックアップ・キュー内にローカルに記
憶されたメッセージは、そのノードが確定状態317に
入ったときそのメッセージをネーム・サーバへ送ること
により、360で処理される。RECOVERプロトコ
ルにおいては、ノードが確定状態501にありかつ新し
いネーム・サーバからコミット引継(TOC)メッセージ
を受信したとき、570に示すように、そのノードは、
ネーム・サーバに対してメッセージを送ることによりル
ックアップ・キュー内にローカルに記憶されたメッセー
ジを処理する。そして、矢印575を経て確定状態50
1に戻るすなわち留まる。
【0037】図3のPROCLAIMプロトコルの挿入
状態316へ戻って、RNSノードが故障したとノード
が判断した場合、そのノードは、いずれが新しいネーム
・サーバであるかを判断するために探さなければならな
いが、そのドメイン内にいずれかのノードが残っている
か否かについては定かでない。従ってそのノードは、未
確認フラグをセットして、矢印303を経て図5のRE
COVERプロトコルの未確定状態502へと移行す
る。
【0038】図5に戻って、アセンド状態503にある
ノードが、未確認フラグがセットされておりそして他の
全てのノードが故障したと判断した場合、そのノード
は、矢印560を経て図3のPROCLAIMプロトコ
ルの未確定状態301へ移行する。同様に、追従状態5
10にあるノードが、未確認フラグがセットされており
かつそのドメイン内の他の全てのノード故障したと判断
した場合、そのノードは、矢印565を経て図3のPR
OCLAIMプロトコルの未確定状態301へ移行す
る。これらの最後の2つの条件は、ネーム・サーバが故
障しかつそのドメイン内に他のノードがないときに生じ
る可能性がある。その場合、そのノードは、ドメインを
設立するためにPROCLAIMプロトコルへ進まなけ
ればならない。
【0039】RECOVERプロトコルの確定状態50
1又はPROCLAIMプロトコルの未確定状態301
に達したとき、未確認フラグはクリアされる。
【0040】このようにして本発明は、ドメイン内の全
てのノードが最初にライン上に出現するときにこれらの
ノードのためにネーム・サーバ・ノードを設定する。さ
らに、ノードにフリッカが生じたとき、そのノードが起
動するのか停止するのかを確認するプロトコルを提供す
る。またさらに、元のネーム・サーバ・ノードが故障す
るか停止したとき新しいネーム・サーバを選択すること
ができるプロトコルを提供する。以上、本発明の好適例
について説明したが、開示された構成に限定する意図で
ないことは自明であろう。全ての変形及び修正は本発明
の範囲内に含まれる。
【0041】まとめとして、本発明の構成に関して以下
の事項を開示する。
【0042】(1)分散コンピュータ環境におけるプロ
セッサ・ドメインのメンバーを管理する方法であって、
前記ドメイン内の使用可能な最小番号ノードを決定する
ステップと、前記ドメイン内の前記最小番号ノードに対
して他の使用可能なノードから追従メッセージを周期的
に送信するステップと、全ての前記追従メッセージを前
記最小番号ノードが受信したことに応答して、前記ドメ
イン内の前記プロセッサを管理するために前記最小番号
ノードがネーム・サーバとなるべく2段階コミット・プ
ロトコルを実行するステップとを含むプロセッサ・ドメ
インのメンバー管理方法。 (2)前記2段階コミット・プロトコルが、前記最小番
号ノードから前記他の使用可能なノードに対して第1段
階(P1)挿入メッセージを送信するステップと、前記第
1段階挿入メッセージに応答して、前記他の使用可能な
ノードから前記最小番号ノードに対して肯定(ACK)メ
ッセージを送信するステップと、前記最小番号ノードが
前記ネーム・サーバとなったことを前記他の使用可能な
ノードに対して通知するコミット・メッセージを送信す
るステップとを含む上記(1)に記載の方法。 (3)設定された時間間隔において前記追従メッセージ
の受信時を計るステップと、前記時間間隔の間でのみ前
記追従メッセージを受信するステップとを含む上記
(1)に記載の方法。 (4)前記最小番号ノードをみなしネーム・サーバ(R
NS)とした場合、該最小番号ノードによる追従メッセ
ージの受信に応答して、該最小番号ノードから該追従メ
ッセージを送信しているノードに対して該みなしネーム
・サーバを識別するマイリーダー(MLI)・メッセージ
を送信するステップと、前記マイリーダー・メッセージ
の受信に応答して、前記マイリーダー・メッセージを受
信した前記ノードから前記みなしネーム・サーバに対し
て追従メッセージを周期的に送信するステップと、前記
追従メッセージに応答して前記みなしネーム・サーバ
が、該みなしネーム・サーバを前記ネーム・サーバとし
て成立させるための前記2段階コミット・プロトコルを
実行するステップとを含む上記(2)に記載の方法。 (5)分散コンピュータ環境におけるプロセッサ・ドメ
インのメンバーを管理する装置であって、前記ドメイン
内の使用可能な最小番号ノードを決定する手段と、前記
ドメイン内の前記最小番号ノードに対して他の使用可能
なノードから追従メッセージを周期的に送信する追従メ
ッセージ手段と、全ての前記追従メッセージを前記最小
番号ノードが受信したことに応答して、前記ドメイン内
の前記プロセッサを管理するために前記最小番号ノード
がネーム・サーバとなるべく2段階コミットを実行する
2段階コミット手段とを含むプロセッサ・ドメインのメ
ンバー管理装置。 (6)前記2段階コミット手段が、前記最小番号ノード
から前記他の使用可能なノードに対して第1段階(P1)
挿入メッセージを送信する手段と、前記第1段階挿入メ
ッセージに応答して、前記他の使用可能なノードから前
記最小番号ノードに対して肯定メッセージ(ACK)を送
信する肯定手段と、前記最小番号ノードが前記ネーム・
サーバとなったことを前記他の使用可能なノードに対し
て通知するコミット・メッセージを送信するコミット・
メッセージ手段とを含む上記(5)に記載の装置。 (7)設定された時間間隔において前記追従メッセージ
の受信時を計るタイマーを有し、前記2段階コミット手
段が前記時間間隔の間でのみ前記追従メッセージを受信
する上記(5)に記載の装置。 (8)前記最小番号ノードをみなしネーム・サーバ(R
NS)とした場合、該最小番号ノードによる追従メッセ
ージの受信に応答して、該最小番号ノードから該追従メ
ッセージを送信しているノードに対して該みなしネーム
・サーバを識別するマイリーダー・メッセージを送信す
るマイリーダー(MLI)・メッセージ手段と、前記マイ
リーダー・メッセージの受信に応答して、前記マイリー
ダー・メッセージを受信した前記ノードから前記みなし
ネーム・サーバに対して追従メッセージを周期的に送信
する第2の追従メッセージ手段と、前記追従メッセージ
に応答して、前記みなしネーム・サーバにおいて該みな
しネーム・サーバを前記ネーム・サーバとして成立させ
るために前記2段階コミットを実行する第2の2段階コ
ミット手段とを含む上記(6)に記載の装置。 (9)分散コンピュータ環境におけるプロセッサ・ドメ
インのメンバーを管理するためのコンピュータ読取り可
能な媒体上に記録されたプログラム製品であって、前記
ドメイン内の使用可能な最小番号ノードを決定するステ
ップと、前記ドメイン内の前記最小番号ノードに対して
他の使用可能なノードから追従メッセージを周期的に送
信するステップと、全ての前記追従メッセージを前記最
小番号ノードが受信したことに応答して、前記ドメイン
内の前記プロセッサを管理するために前記最小番号ノー
ドがネーム・サーバとなるべく2段階コミット・プロト
コルを実行するステップとを有するプログラム製品。 (10)前記2段階コミット・プロトコルが、前記最小
番号ノードから前記他の使用可能なノードに対して第1
段階(P1)挿入メッセージを送信するステップと、前記
第1段階挿入メッセージに応答して、前記他の使用可能
なノードから前記最小番号ノードに対して肯定メッセー
ジ(ACK)を送信するステップと、前記最小番号ノード
が前記ネーム・サーバとなったことを前記他の使用可能
なノードに対して通知するコミット・メッセージを送信
するステップとを含む上記(9)に記載のプログラム製
品。 (11)設定された時間間隔において前記追従メッセー
ジの受信時を計るステップと、前記時間間隔の間でのみ
前記追従メッセージを受信するステップとを含む上記
(9)に記載のプログラム製品。 (12)前記最小番号ノードをみなしネーム・サーバ
(RNS)とした場合、該最小番号ノードによる追従メッ
セージの受信に応答して、該最小番号ノードから該追従
メッセージを送信しているノードに対して該みなしネー
ム・サーバを識別するマイリーダー(MLI)・メッセー
ジを送信するステップと、前記マイリーダー・メッセー
ジの受信に応答して、前記マイリーダー・メッセージを
受信した前記ノードから前記みなしネーム・サーバに対
して追従メッセージを周期的に送信するステップと、前
記追従メッセージに応答して前記みなしネーム・サーバ
が、該みなしネーム・サーバを前記ネーム・サーバとし
て成立させるための前記2段階コミット・プロトコルを
実行するステップとを含む上記(10)に記載のプログ
ラム製品。
【図面の簡単な説明】
【図1】本発明の分散コンピュータ・システムの概略構
成図である。
【図2】図1の分散コンピュータ・システムにおけるプ
ロセッサ・ドメインの構成図である。
【図3】プロセッサが図2のドメインを結合させるため
のPROCLAIMプロトコルのプロトコル状態図であ
る。
【図4】図2のドメイン内においてフリッカーを生じて
いるノードについてのノード状態を取得するためのFL
ICKERプロトコルのプロトコル状態図である。
【図5】図2のドメイン内において故障した後に回復さ
れようとしているノードについてのRECOVERプロ
トコルのプロトコル状態図である。
【符合の説明】
100 分散コンピュータ・システム 102 ローカル・エリア・ネットワーク(LAN) 104 LANゲート 105 SPスイッチ 106 ノード 112 制御ワークステーション 114 直接アクセス記憶装置 200 区画 201 ドメイン 202 ネーム・サーバ 204、205、206 グループ・リーダー
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ラリー・バート・ブレンナー アメリカ合衆国78759、テキサス州、オー スチン、バケロ・コーブ 8405 (72)発明者 ツシャール・ディパク・チャンドラ アメリカ合衆国10523、ニューヨーク州、 エルムスフォード、ノブ・ヒル・ドライブ 215 (72)発明者 オーバル・テオドール・キルビー アメリカ合衆国12569、ニューヨーク州、 プレザント・バレイ、デイビッド・ドライ ブ 32 (72)発明者 ジョン・アーサー・パーシング、ジュニア アメリカ合衆国10511、ニューヨーク州、 ブキャナン、コートランド・ストリート 162

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】分散コンピュータ環境におけるプロセッサ
    ・ドメインのメンバーを管理する方法であって、 前記ドメイン内の使用可能な最小番号ノードを決定する
    ステップと、 前記ドメイン内の前記最小番号ノードに対して他の使用
    可能なノードから追従メッセージを周期的に送信するス
    テップと、 全ての前記追従メッセージを前記最小番号ノードが受信
    したことに応答して、前記ドメイン内の前記プロセッサ
    を管理するために前記最小番号ノードがネーム・サーバ
    となるべく2段階コミット・プロトコルを実行するステ
    ップとを含むプロセッサ・ドメインのメンバー管理方
    法。
  2. 【請求項2】前記2段階コミット・プロトコルが、 前記最小番号ノードから前記他の使用可能なノードに対
    して第1段階(P1)挿入メッセージを送信するステップ
    と、 前記第1段階挿入メッセージに応答して、前記他の使用
    可能なノードから前記最小番号ノードに対して肯定(A
    CK)メッセージを送信するステップと、 前記最小番号ノードが前記ネーム・サーバとなったこと
    を前記他の使用可能なノードに対して通知するコミット
    ・メッセージを送信するステップとを含む請求項1に記
    載の方法。
  3. 【請求項3】設定された時間間隔において前記追従メッ
    セージの受信時を計るステップと、 前記時間間隔の間でのみ前記追従メッセージを受信する
    ステップとを含む請求項1に記載の方法。
  4. 【請求項4】前記最小番号ノードをみなしネーム・サー
    バ(RNS)とした場合、該最小番号ノードによる追従メ
    ッセージの受信に応答して、該最小番号ノードから該追
    従メッセージを送信しているノードに対して該みなしネ
    ーム・サーバを識別するマイリーダー(MLI)・メッセ
    ージを送信するステップと、 前記マイリーダー・メッセージの受信に応答して、前記
    マイリーダー・メッセージを受信した前記ノードから前
    記みなしネーム・サーバに対して追従メッセージを周期
    的に送信するステップと、 前記追従メッセージに応答して前記みなしネーム・サー
    バが、該みなしネーム・サーバを前記ネーム・サーバと
    して成立させるための前記2段階コミット・プロトコル
    を実行するステップとを含む請求項2に記載の方法。
  5. 【請求項5】分散コンピュータ環境におけるプロセッサ
    ・ドメインのメンバーを管理する装置であって、 前記ドメイン内の使用可能な最小番号ノードを決定する
    手段と、 前記ドメイン内の前記最小番号ノードに対して他の使用
    可能なノードから追従メッセージを周期的に送信する追
    従メッセージ手段と、 全ての前記追従メッセージを前記最小番号ノードが受信
    したことに応答して、前記ドメイン内の前記プロセッサ
    を管理するために前記最小番号ノードがネーム・サーバ
    となるべく2段階コミットを実行する2段階コミット手
    段とを含むプロセッサ・ドメインのメンバー管理装置。
  6. 【請求項6】前記2段階コミット手段が、 前記最小番号ノードから前記他の使用可能なノードに対
    して第1段階(P1)挿入メッセージを送信する手段と、 前記第1段階挿入メッセージに応答して、前記他の使用
    可能なノードから前記最小番号ノードに対して肯定メッ
    セージ(ACK)を送信する肯定手段と、 前記最小番号ノードが前記ネーム・サーバとなったこと
    を前記他の使用可能なノードに対して通知するコミット
    ・メッセージを送信するコミット・メッセージ手段とを
    含む請求項5に記載の装置。
  7. 【請求項7】設定された時間間隔において前記追従メッ
    セージの受信時を計るタイマーを有し、前記2段階コミ
    ット手段が前記時間間隔の間でのみ前記追従メッセージ
    を受信する請求項5に記載の装置。
  8. 【請求項8】前記最小番号ノードをみなしネーム・サー
    バ(RNS)とした場合、該最小番号ノードによる追従メ
    ッセージの受信に応答して、該最小番号ノードから該追
    従メッセージを送信しているノードに対して該みなしネ
    ーム・サーバを識別するマイリーダー・メッセージを送
    信するマイリーダー(MLI)・メッセージ手段と、 前記マイリーダー・メッセージの受信に応答して、前記
    マイリーダー・メッセージを受信した前記ノードから前
    記みなしネーム・サーバに対して追従メッセージを周期
    的に送信する第2の追従メッセージ手段と、 前記追従メッセージに応答して、前記みなしネーム・サ
    ーバにおいて該みなしネーム・サーバを前記ネーム・サ
    ーバとして成立させるために前記2段階コミットを実行
    する第2の2段階コミット手段とを含む請求項6に記載
    の装置。
  9. 【請求項9】分散コンピュータ環境におけるプロセッサ
    ・ドメインのメンバーを管理するためのコンピュータ読
    取り可能な媒体上に記録されたプログラム製品であっ
    て、 前記ドメイン内の使用可能な最小番号ノードを決定する
    ステップと、 前記ドメイン内の前記最小番号ノードに対して他の使用
    可能なノードから追従メッセージを周期的に送信するス
    テップと、 全ての前記追従メッセージを前記最小番号ノードが受信
    したことに応答して、前記ドメイン内の前記プロセッサ
    を管理するために前記最小番号ノードがネーム・サーバ
    となるべく2段階コミット・プロトコルを実行するステ
    ップとを有するプログラム製品。
  10. 【請求項10】前記2段階コミット・プロトコルが、 前記最小番号ノードから前記他の使用可能なノードに対
    して第1段階(P1)挿入メッセージを送信するステップ
    と、 前記第1段階挿入メッセージに応答して、前記他の使用
    可能なノードから前記最小番号ノードに対して肯定メッ
    セージ(ACK)を送信するステップと、 前記最小番号ノードが前記ネーム・サーバとなったこと
    を前記他の使用可能なノードに対して通知するコミット
    ・メッセージを送信するステップとを含む請求項9に記
    載のプログラム製品。
  11. 【請求項11】設定された時間間隔において前記追従メ
    ッセージの受信時を計るステップと、 前記時間間隔の間でのみ前記追従メッセージを受信する
    ステップとを含む請求項9に記載のプログラム製品。
  12. 【請求項12】前記最小番号ノードをみなしネーム・サ
    ーバ(RNS)とした場合、該最小番号ノードによる追従
    メッセージの受信に応答して、該最小番号ノードから該
    追従メッセージを送信しているノードに対して該みなし
    ネーム・サーバを識別するマイリーダー(MLI)・メッ
    セージを送信するステップと、 前記マイリーダー・メッセージの受信に応答して、前記
    マイリーダー・メッセージを受信した前記ノードから前
    記みなしネーム・サーバに対して追従メッセージを周期
    的に送信するステップと、 前記追従メッセージに応答して前記みなしネーム・サー
    バが、該みなしネーム・サーバを前記ネーム・サーバと
    して成立させるための前記2段階コミット・プロトコル
    を実行するステップとを含む請求項10に記載のプログ
    ラム製品。
JP18216797A 1996-07-23 1997-07-08 分散コンピュータ環境におけるプロセッサ・ドメインのメンバー管理方法及び装置 Expired - Fee Related JP3554472B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/686233 1996-07-23
US08/686,233 US5896503A (en) 1996-07-23 1996-07-23 Managing membership of a domain of processors in a distributed computing environment

Publications (2)

Publication Number Publication Date
JPH1078944A true JPH1078944A (ja) 1998-03-24
JP3554472B2 JP3554472B2 (ja) 2004-08-18

Family

ID=24755480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18216797A Expired - Fee Related JP3554472B2 (ja) 1996-07-23 1997-07-08 分散コンピュータ環境におけるプロセッサ・ドメインのメンバー管理方法及び装置

Country Status (2)

Country Link
US (1) US5896503A (ja)
JP (1) JP3554472B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109726A (ja) * 1999-08-31 2001-04-20 Internatl Business Mach Corp <Ibm> 分散コンピュータ・システム内のプロセッサを再構成する方法、システム、および、記憶装置
JP2002049601A (ja) * 2000-05-31 2002-02-15 Internatl Business Mach Corp <Ibm> コンピューティング環境のクラスタを自動的に構成するための方法、システム、およびプログラム製品
JP2016530636A (ja) * 2013-08-29 2016-09-29 ワンディスコ,インク. コンセンサスノードを用いた分散ファイルシステム

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5909549A (en) * 1996-11-12 1999-06-01 International Business Machines Corporation Network management system wherein the managed device reestablishes a connection to a management station after detecting a broken connection
JPH11203254A (ja) * 1998-01-14 1999-07-30 Nec Corp 共有プロセス制御装置及びプログラムを記録した機械読み取り可能な記録媒体
US6430629B1 (en) * 1999-06-10 2002-08-06 Sony Corporation Methods and apparatus for monitoring a 1394 home network
WO2002057917A2 (en) * 2001-01-22 2002-07-25 Sun Microsystems, Inc. Peer-to-peer network computing platform
US7197565B2 (en) * 2001-01-22 2007-03-27 Sun Microsystems, Inc. System and method of using a pipe advertisement for a peer-to-peer network entity in peer-to-peer presence detection
US7275102B2 (en) * 2001-01-22 2007-09-25 Sun Microsystems, Inc. Trust mechanisms for a peer-to-peer network computing platform
US7165107B2 (en) * 2001-01-22 2007-01-16 Sun Microsystems, Inc. System and method for dynamic, transparent migration of services
US7272636B2 (en) 2001-04-24 2007-09-18 Sun Microsystems, Inc. Peer group name server
US7383433B2 (en) 2001-07-31 2008-06-03 Sun Microsystems, Inc. Trust spectrum for certificate distribution in distributed peer-to-peer networks
US7222187B2 (en) 2001-07-31 2007-05-22 Sun Microsystems, Inc. Distributed trust mechanism for decentralized networks
US7203753B2 (en) * 2001-07-31 2007-04-10 Sun Microsystems, Inc. Propagating and updating trust relationships in distributed peer-to-peer networks
US7308496B2 (en) * 2001-07-31 2007-12-11 Sun Microsystems, Inc. Representing trust in distributed peer-to-peer networks
US7127613B2 (en) 2002-02-25 2006-10-24 Sun Microsystems, Inc. Secured peer-to-peer network data exchange
US7512649B2 (en) * 2002-03-22 2009-03-31 Sun Microsytems, Inc. Distributed identities
US7849140B2 (en) * 2002-08-29 2010-12-07 Oracle America, Inc. Peer-to-peer email messaging
US7263560B2 (en) * 2002-08-30 2007-08-28 Sun Microsystems, Inc. Decentralized peer-to-peer advertisement
US7349965B1 (en) * 2002-09-13 2008-03-25 Hewlett-Packard Development Company, L.P. Automated advertising and matching of data center resource capabilities
US7254608B2 (en) * 2002-10-31 2007-08-07 Sun Microsystems, Inc. Managing distribution of content using mobile agents in peer-topeer networks
US7213047B2 (en) * 2002-10-31 2007-05-01 Sun Microsystems, Inc. Peer trust evaluation using mobile agents in peer-to-peer networks
US8037202B2 (en) * 2002-10-31 2011-10-11 Oracle America, Inc. Presence detection using mobile agents in peer-to-peer networks
US8108455B2 (en) * 2002-10-31 2012-01-31 Oracle America, Inc. Mobile agents in peer-to-peer networks
US7328243B2 (en) 2002-10-31 2008-02-05 Sun Microsystems, Inc. Collaborative content coherence using mobile agents in peer-to-peer networks
US7302607B2 (en) * 2003-08-29 2007-11-27 International Business Machines Corporation Two node virtual shared disk cluster recovery
US20050144299A1 (en) * 2003-12-04 2005-06-30 Blevins Delmar E. System and method for supporting XA 2-phase commit protocols with a loosely coupled clustered database server
US7260589B2 (en) * 2003-12-04 2007-08-21 International Business Machines Corporation High performance support for XA protocols in a clustered shared database
US20060045101A1 (en) * 2004-08-31 2006-03-02 International Business Machines Corporation Efficient fault-tolerant messaging for group communication systems
US9027030B2 (en) 2007-11-29 2015-05-05 Red Hat, Inc. Commit-one-phase distributed transactions with multiple starting participants
US8352421B2 (en) 2008-05-28 2013-01-08 Red Hat, Inc. Recording distributed transactions using probabalistic data structures
US7873604B2 (en) * 2008-05-29 2011-01-18 Red Hat, Inc. Batch recovery of distributed transactions
US8171134B2 (en) * 2009-03-18 2012-05-01 At&T Intellectual Property I, L.P. Methods and apparatus to characterize and predict network health status

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0644090A (ja) * 1992-07-27 1994-02-18 Toshiba Corp マスタスレーブ計算機システム及びマスタ選定制御方法
JPH07311744A (ja) * 1994-05-17 1995-11-28 Mitsubishi Electric Corp 資源所在位置検出方式

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2284494B (en) * 1993-11-26 1998-09-09 Hitachi Ltd Distributed shared memory management system
US5793962A (en) * 1996-04-30 1998-08-11 International Business Machines Corporation System for managing membership of a group of processors in a distributed computing environment
US5787249A (en) * 1996-04-30 1998-07-28 International Business Machines Coporation Method for managing membership of a group of processors in a distributed computing environment
US5787250A (en) * 1996-04-30 1998-07-28 International Business Machines Corporation Program product for managing membership of a group of processors in a distributed computing environment
US5790788A (en) * 1996-07-23 1998-08-04 International Business Machines Corporation Managing group events by a name server for a group of processors in a distributed computing environment
US5805786A (en) * 1996-07-23 1998-09-08 International Business Machines Corporation Recovery of a name server managing membership of a domain of processors in a distributed computing environment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0644090A (ja) * 1992-07-27 1994-02-18 Toshiba Corp マスタスレーブ計算機システム及びマスタ選定制御方法
JPH07311744A (ja) * 1994-05-17 1995-11-28 Mitsubishi Electric Corp 資源所在位置検出方式

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001109726A (ja) * 1999-08-31 2001-04-20 Internatl Business Mach Corp <Ibm> 分散コンピュータ・システム内のプロセッサを再構成する方法、システム、および、記憶装置
JP2002049601A (ja) * 2000-05-31 2002-02-15 Internatl Business Mach Corp <Ibm> コンピューティング環境のクラスタを自動的に構成するための方法、システム、およびプログラム製品
JP2016530636A (ja) * 2013-08-29 2016-09-29 ワンディスコ,インク. コンセンサスノードを用いた分散ファイルシステム

Also Published As

Publication number Publication date
US5896503A (en) 1999-04-20
JP3554472B2 (ja) 2004-08-18

Similar Documents

Publication Publication Date Title
JPH1078944A (ja) 分散コンピュータ環境におけるプロセッサ・ドメインのメンバー管理方法及び装置
US5926619A (en) Apparatus and program product for recovery of a name server managing membership of a domain of processors in a distributed computing environment
Moser et al. Extended virtual synchrony
US6112249A (en) Non-disruptively rerouting network communications from a secondary network path to a primary path
CN110581782B (zh) 一种容灾数据的处理方法、装置及系统
JP2001306349A (ja) バックアップ装置及びバックアップ方法
WO2012071920A1 (zh) 分布式内存数据库的实现方法、系统、令牌控制器及内存数据库
JP2000293497A (ja) クラスタ・ノード救援信号発生システム
CN103036719A (zh) 一种基于主备集群服务器的跨地区服务容灾方法及装置
WO2016177231A1 (zh) 基于双主控的主备倒换方法及装置
CN105357057B (zh) 一种无中心的监控管理节点异地冗余方法
CN103634411A (zh) 一种具有状态一致性的市场数据实时广播系统及方法
CN106789291A (zh) 一种集群成员控制方法和装置
CN110213359B (zh) 一种基于d2d的车联网组网数据推送系统和方法
CN106817387A (zh) 一种数据同步方法、装置和系统
US20080256557A1 (en) Proactive Prevention of Service Level Degradation during Maintenance in a Clustered Computing Environment
US7240088B2 (en) Node self-start in a decentralized cluster
JP2003203018A (ja) Sanを用いた擬似クラスタシステム
CN116095145B (zh) 一种vpc集群的数据控制方法和系统
KR100363523B1 (ko) 클러스터링 서버에서의 분산 처리 제어 방법
CN114422335A (zh) 通信方法、装置、服务器及存储介质
CN112948177A (zh) 一种容灾备份方法、装置、电子设备及存储介质
CN116668269A (zh) 一种用于双活数据中心的仲裁方法、装置及系统
CN110971872B (zh) 一种基于分布式集群的视频图像信息采集方法
KR100832890B1 (ko) 정보통신 시스템의 프로세스 장애 감시방법 및 복구방법

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040507

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080514

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080514

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110514

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees