JP3967499B2 - マルチコンピュータ・システムでの復元 - Google Patents

マルチコンピュータ・システムでの復元 Download PDF

Info

Publication number
JP3967499B2
JP3967499B2 JP25385899A JP25385899A JP3967499B2 JP 3967499 B2 JP3967499 B2 JP 3967499B2 JP 25385899 A JP25385899 A JP 25385899A JP 25385899 A JP25385899 A JP 25385899A JP 3967499 B2 JP3967499 B2 JP 3967499B2
Authority
JP
Japan
Prior art keywords
computer
standby
disk
node
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP25385899A
Other languages
English (en)
Other versions
JP2000099359A (ja
JP2000099359A5 (ja
Inventor
ウィリアム アッシクロフト デレック
ロバート アトキンソン ジェオフェリー
マクキルガン フィリップ
ポール ティックヒル ステファン
Original Assignee
フジツウ サービス リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB9819523.3A external-priority patent/GB9819523D0/en
Priority claimed from GBGB9819524.1A external-priority patent/GB9819524D0/en
Priority claimed from GB9900473A external-priority patent/GB2345769A/en
Application filed by フジツウ サービス リミテッド filed Critical フジツウ サービス リミテッド
Publication of JP2000099359A publication Critical patent/JP2000099359A/ja
Publication of JP2000099359A5 publication Critical patent/JP2000099359A5/ja
Application granted granted Critical
Publication of JP3967499B2 publication Critical patent/JP3967499B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • G06F11/1662Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/203Failover techniques using migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、マルチコンピュータ・システムで復元を行うための技術に関する。
【0002】
【従来の技術】
上記マルチコンピュータ・システムは、多数のユーザをサポートし、非常に大型のデータベースを記憶するのによく使用される。例えば、通常のシステムは、50、000人のユーザをサポートする8つのサーバ・コンピュータから構成することができ、1つまたはそれ以上の300ギガバイトのデータベースを記憶することができる。
【0003】
例えば、マイクロソフト社製のオペレーションシステムであるウィンドウズNTの制御の下で動作するマイクロソフト・エクスチェンジのような標準サーバ・ソフトウェアに基づく上記システムを提供することができれば便利である。しかし、その場合1つの問題がある。それはコンピュータの中のどれかが故障した場合に、システムを復元できるようにするということである。この規模のあるシステムにクラスタ(cluster)技術を使用すると、あまりにコストが高くなり過ぎる。また、マイクロソフト・エクスチェンジは、クラスタを意識したアプリケーションではないし、また(ノードが2つだけのクラスタであっても)同じサーバ上に2つの段階(instance)のエクスチェンジを持つことはできない。
【0004】
【発明が解決しようとする課題】
本発明は、複数のコンピュータと、上記各コンピュータに対して1つずつ使用される複数のシステム・ディスク・ユニットと、上記各コンピュータに対して1つずつ使用される複数の追加ディスク・ユニットとを備えるコンピュータ・システムを動作する方法を提供し、従来技術における上述の問題を解消するものである。
【0005】
【課題を解決するための手段】
従来技術における上述の問題を解消する上記方法は、
(a)上記複数のコンピュータを稼動コンピュータとして指定し、上記コンピュータの他のものを待機コンピュータとして指定するステップと、
(b)システム・ディスク・ユニット上に保持されているデータの同期回復コピーを行うために、上記の別のデータ・ユニットを使用するステップと、
(c)上記稼動コンピュータのどれかが故障した場合、待機コンピュータに、故障したコンピュータに対応する追加ディスク・ユニットを使用させることにより、システムを再構成するステップとを含むことを特徴とする。
【0006】
【発明の実施の形態】
添付の図面を参照しながら、本発明のコンピュータ・システムを以下に説明するが、これは単に例示としてのものに過ぎない。
【0007】
本願明細書の場合、下記の用語は特定の意味で使用されている。
【0008】
「ノード」という用語は、個々のコンピュータ・ハードウェア・コンフィギュレーションを意味する。本実施形態の場合には、各ノードはICL(インターナショナル・コンピューターズ・リミテッド)のエキストラサーバ・コンピュータを備える。各ノードは一意の識別番号を持つ。
【0009】
「サーバ」という用語は、インストールされた特定のサーバ・ソフトウェアを意味する。本実施形態の場合には、各サーバは、インストールされた特定のマイクロソフトNTを備える。各サーバは、一意のサーバ名を持ち、任意のノード上で動作(すなわち、作動)することができる。必要な場合には、サーバの動作を中止し、他のノードに再配置することができる。
【0010】
「システム」という用語は、共通の記憶ユニットにアクセスしている多数のサーバを意味する。
【0011】
図1について説明すると、この図は、N+1のノード10を備えるシステムを示す。通常の動作中、ノードの中のN個が稼動状態にあり、残りの1つのノードが待機状態にある。本実施形態の場合には、Nは4つである。(すなわち、ノードは全部で5つある。)各ノード10は、サーバ11のホスト役を勤める。
【0012】
上記システムは、またそれにより、(人間の)オペレータまたはシステム管理装置がシステムを監視し、制御することができるシステム管理ワークステーションを含む。各サーバは、その名前及び現在の動作状態をワークステーション12上に表示する。1つまたはそれ以上の他のシステム(図示せず)も、同じワークステーションから制御し、監視することができる。
【0013】
すべてのノード10は、共有ディスク・アレイ13に接続している。本実施形態の場合、ディスク・アレイ13は、EMCシンメトリクス・ディスク・アレイである。上記ディスク・アレイは、多数の磁気ディスク・ユニットからなり、それらすべては復元動作にとって鏡像になっている(二重になっている)。さらに、ディスク・アレイは、ビジネス継続ボリューム(BCV)を提供する多数の追加ディスクを含む。BCVは、ワークステーション12上で動作するEMCタイムファインダ・ソフトウェアの制御の下で、1次網に接続することができ、1次網から切り離すことができる有効な第3の網である。BCVデータは、バックアップを行うために、1次網と同期させることができ、所与の時点で主なデータのスナップショトをとるために、1次網から切り離すことができる。BCVをこのように分割すると、任意の時点で再接続することができ、両者を再度同期させるために、データを1次網からBCVへ、またBCVから1次網にコピーすることができる。
【0014】
システムは、またディスク・アレイ13及び多数の自動磁気テープ・ドライブ15に接続しているアーカイブ・サーバ14を含む。動作中、アーカイブ・サーバは、周期的にBCV内に保持しているデータベースのコピーをテープにコピーすることにより、各データベースのデータをオフラインで保管する。保管が確実に行われると、BCVは、EMCタイムファインダ・ソフトウェアにより、回復BCVを形成するために、再び切り離される前に、主データベースと同期状態に戻る。
【0015】
図1に示すように、ディスク・アレイ13は、多数のシステム・ディスク16を含むが、その中の1つがサーバ11である。各システム・ディスクは、関連サーバのためのNTオペレーティング・システム・ファイル及びコンフィギュレーション・ファイルを含む。すなわち、システム・ディスクは、インストールされたサーバの「性格」を定義するすべての情報を保持する。各システム・ディスクは、関連システム・ディスクのバックアップ・コピーを含む、それに関連するBCVディスク17を持つ。通常、各BCVディスク17は、その対応するシステム・ディスクから切り離されている。上記BCVディスクは、システム・ディスクが変わった場合だけ、2つのコピーを同期させるために、その対応するシステム・ディスクに接続される。
【0016】
N個の稼動ノード10のどれかが故障した場合には、システム管理ワークステーション12上で、回復プロセスが開始する。本実施形態の場合、回復プロセスは、タイムファインダ・ソフトウェアに関連するスクリプティング言語で書かれたスクリプトを含む。このプロセスにより、待機ノードに、故障したノードのシステム・ディスクBCVを使用させ、それにより、故障したノード上のサーバを待機ノードに再配置したり、またはその逆を行わせるために、システム管理装置はシステムを再構成する回復手順を使用する。
【0017】
回復プロセスは、ノード及びサーバの可能な各組合せに対して1つずつ、予め定めた組のデバイスファイルを使用する。この例の場合には、サーバは5つ(待機中のものも含めて)であり、ノードも5つであるので、可能な組合せは25組あり、上記デバイスファイルも25供給される。これら各ファイルは、 という形により識別される。この場合、Nはノード識別名であり、Sはサーバ名の最後の3つの数字である。(もちろん、ファイルの命名には、他の慣例的方法も使用することができる。各デバイスファイルは、特定のノード上に特定のサーバをインストールするために必要なすべての情報を含む。
【0018】
図2に示すように、回復プロセスは下記のステップを含む。
【0019】
(ステップ201)回復プロセスは、最初、システム管理装置により故障したシステムの識別を行う。このステップは、1つ以上のシステムが、同じシステム管理ワークステーションにより管理されている場合だけに必要なものである。
【0020】
(ステップ202)その後、回復プロセスは、故障したノード及び待機ノードの識別番号を入手するように要求する。システム管理装置は、システム管理ワークステーション12上に表示された情報により、これらノード番号を決定することができる。
【0021】
(ステップ203)次に、回復プロセスは、故障したサーバ(すなわち、故障したノード上で、現在動作しているサーバ)の名前を入手するように要求する。回復プロセスは、また各システムに対して所定の待機サーバの名前を自動的に決定する。
【0022】
(ステップ204)回復プロセスは、また各サーバ名を特定の装置識別子に関連づける参照用テーブルを使用して、故障したサーバ及び待機サーバに関連する、BCVの装置識別子を自動的に決定する。
【0023】
(ステップ205)その後、回復プロセスは、これら2つのBCVの現在の状態を決定するために、タイムファインダ・ソフトウェアのBCV問い合わせコマンドを呼び出す。上記2つのBCVは切り離された状態でなければならない。
【0024】
情報2つのBCVの1つまたは両方が、切り離された状態でない場合には、回復プロセスは打ち切られ、システム管理装置は、適当な技術的サポート・サービスを呼び出すようにプロンプトされる。
【0025】
(ステップ206)両方のBCVが切り離されている場合には、回復プロセスは、故障したサーバ及び待機サーバの両方の動作を確実に停止するように、システム管理装置にプロンプトすることにより、その動作を継続する。回復プロセスは、上記動作の停止が行われたことの確認を待つ。
【0026】
(ステップ207)故障したサーバ及び待機サーバの両方が、その動作を停止した場合には、回復プロセスは、下記のように2つのデバイスファイル名を作成する。
【0027】
第1のファイル名は、n(W)_is_(X)である。ここで、Wは待機ノードのノード番号であり、Xは故障したサーバ名の最後の3つの数字である。
【0028】
第2のファイル名は、n(Y)_is_(Z)である。ここで、Yは故障したノードのノード番号であり、Zは待機サーバ名の最後の3つの数字である。
【0029】
(ステップ208)その後、回復プロセスは、タイムファインダBCV復元コマンドを呼び出し、それをパラメータとして第1のデバイスファイル名に渡す。そうすることにより、故障したノードのBCVが、待機サーバのシステム・ディスクにリンクされ、BCVからシステム・ディスクへのデータのコピーが開始する。これにより、故障したノード上で動作していたサーバが、待機ノード上に再配置されるのを理解することができるだろう。
【0030】
回復プロセスは、またBCV復元コマンドを呼出、それをパラメータとして第2のデバイスファイル名に渡す。そうすることにより、待機ノードのBCVが、故障したサーバのシステム・ディスクにリンクされ、このBCVからシステム・ディスクへのデータのコピーが開始する。それ故、これにより、待機ノード上で動作していたサーバが、故障したノード上に再配置される。
【0031】
一例を挙げると、図3は、ノード1が故障した場合を示す。この場合、ノード4は待機ノードである。この図に示すように、待機ノードのBCVディスクは、故障したノードのシステム・ディスクにリンクされ、故障したノードのBCVは、待機ノードのシステム・ディスクにリンクされる。
【0032】
復元コマンドが動作している間に、回復プロセスは、エラー応答をチェックし、上記応答すべてをシステム管理装置に報告する。回復プロセスは、またすべての処置を、処置直前にログ・ファイルに書き込む。
【0033】
(ステップ209)復元コマンドを発行した後で、回復プロセスは、それが作動させる新しいノード名を知らせて、回復したサーバ(すなわち、故障したノードから待機ノードに移動したサーバ)を再始動するように、システム管理装置にプロンプトする。
【0034】
復元コマンドは、背景で動作していて、通常、完了するのに約1時間掛かることに留意されたい。しかし、回復したサーバは直ちに再始動することができ、そのデータには、復元コマンドの実行の終了を待たないでアクセスすることができる。
【0035】
(ステップ210)回復手順は、タイムファインダBCV問い合わせコマンドにより、BCV復元動作の完了を監視する。
【0036】
(ステップ211)復元動作が完了すると、回復手順は、タイムファインダBCV分割コマンドを発行する。上記コマンドはBCVをシステム・ディスクから切り離す。回復はこれで完了し、回復プロセスは終了する。
【0037】
故障したノードの修理が完了すると、必要に応じて、このノードをリブートすることができ、このノードは待機サーバになる。その後、稼動ノードのどれかが故障した場合には、回復手順を反復して行うことができる。
【0038】
本発明の範囲から逸脱することなしに、上記システムを種々に修正することができることを理解されたい。例えば、異なる数のディスク及びコンピュータを使用することができる。また、他のオペレーティング・システムで、他のハードウェア・コンフィギュレーションにより本発明を実行することもできる。さらに、スクリプトにより回復手順を実行する代わりに、例えば、本発明をオペレーティング・システムに内蔵させることもできる。
【図面の簡単な説明】
【図1】本発明による多重ノードコンピュータ・システムのブロック図である。
【図2】システムのノードの中のどれかの故障を処理するための回復プロセスを示すフローチャートである。
【図3】回復プロセスにより再構成が行われた後の、システムの一例を示すブロック図である。

Claims (4)

  1. 複数のコンピュータ、前記各コンピュータに対して1つずつ使用する複数のシステム・ディスク・ユニットであって各コンピュータに対するシステム・ディスクが関連するコンピュータの性格を定義する全ての情報を保持するシステム・ディスク・ユニット及び前記各コンピュータに対して1つずつ使用する複数の追加ディスク・ユニットを備えるコンピュータ・システムの動作方法であって、
    (a)複数の前記コンピュータを稼動コンピュータとして指定し、前記コンピュータの中の他のものを待機コンピュータとして指定するステップと、
    (b)該システム・ディスク・ユニット上に保持されているデータの同期した回復コピーを行うために追加ディスク・ユニットを使用するステップと、
    (c)前記稼動コンピュータのどれかが故障した場合に、前記待機コンピュータに、前記故障したコンピュータに対応する該追加ディスク・ユニットを使用させることにより前記システムを再構成するステップとからなる方法。
  2. 請求項1に記載の方法において、前記システムを再構成するステップが、前記故障したコンピュータに関連する該追加ディスク・ユニットを前記待機コンピュータのシステム・ディスクに接続し、前記追加ディスクから前記システム・ディスクへのデータのコピーを開始するステップを含む方法。
  3. 請求項2に記載の方法であって、さらに、背景でデータのコピーが行われている間に前記待機コンピュータを再び始動するステップを含む方法。
  4. 請求項1乃至3の何れかに記載の方法であって、インストールされた特定のオペレーティング・システムと、特定のコンピュータ・ハードウェア・コンフィギュレーションとの可能な各組合せに対して1つずつ、1組のデバイスファイルを維持するステップを含み、前記システムを再構成するステップが、前記故障したコンピュータ及び前記待機コンピュータの新しいコンフィギュレーションに対応する2つのデバイスファイルを選択するステップと、前記デバイスファイルを前記システムの再構成を制御するために使用するステップとを含む方法。
JP25385899A 1998-09-08 1999-09-08 マルチコンピュータ・システムでの復元 Expired - Fee Related JP3967499B2 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
GBGB9819523.3A GB9819523D0 (en) 1998-09-08 1998-09-08 Archiving and resilience in a multi-computer system
GBGB9819524.1A GB9819524D0 (en) 1998-09-09 1998-09-09 Archiving and resilience in a multi-computer system
GB9900473.1 1999-01-12
GB9819524.1 1999-01-12
GB9900473A GB2345769A (en) 1999-01-12 1999-01-12 Failure recovery in a multi-computer system
GB9819523.3 1999-01-12

Publications (3)

Publication Number Publication Date
JP2000099359A JP2000099359A (ja) 2000-04-07
JP2000099359A5 JP2000099359A5 (ja) 2005-07-14
JP3967499B2 true JP3967499B2 (ja) 2007-08-29

Family

ID=27269473

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25385899A Expired - Fee Related JP3967499B2 (ja) 1998-09-08 1999-09-08 マルチコンピュータ・システムでの復元

Country Status (5)

Country Link
US (1) US6460144B1 (ja)
EP (1) EP0987630B1 (ja)
JP (1) JP3967499B2 (ja)
AU (1) AU753898B2 (ja)
DE (1) DE69927223T2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6829687B2 (en) * 2000-12-28 2004-12-07 International Business Machines Corporation Volume data net backup
US6868067B2 (en) 2002-06-28 2005-03-15 Harris Corporation Hybrid agent-oriented object model to provide software fault tolerance between distributed processor nodes
CA2444835A1 (en) * 2003-10-10 2005-04-10 Ibm Canada Limited - Ibm Canada Limitee System and method for grid computing
WO2006043307A1 (ja) 2004-10-18 2006-04-27 Fujitsu Limited 運用管理プログラム、運用管理方法および運用管理装置
EP1811376A4 (en) 2004-10-18 2007-12-26 Fujitsu Ltd PROGRAM, METHOD AND INSTALLATION FOR OPERATIONAL MANAGEMENT
DE602004027424D1 (de) 2004-10-18 2010-07-08 Fujitsu Ltd Operationsverwaltungsprogramm, operationsverwaltun
GB2419699A (en) 2004-10-29 2006-05-03 Hewlett Packard Development Co Configuring supercomputer for reliable operation
GB2419696B (en) 2004-10-29 2008-07-16 Hewlett Packard Development Co Communication link fault tolerance in a supercomputer
US8572431B2 (en) * 2005-02-23 2013-10-29 Barclays Capital Inc. Disaster recovery framework
JP4839841B2 (ja) * 2006-01-04 2011-12-21 株式会社日立製作所 スナップショット再起動方法
US9268659B2 (en) * 2006-01-05 2016-02-23 Emc Corporation Detecting failover in a database mirroring environment
JP4939271B2 (ja) * 2007-03-29 2012-05-23 株式会社日立製作所 ストレージ保守・管理装置の冗長化方法、及びその方法を使用する装置
WO2012073686A1 (ja) * 2010-11-30 2012-06-07 独立行政法人科学技術振興機構 ディペンダビリティ維持装置、ディペンダビリティ維持システム、障害対応システム、ディペンダビリティ維持装置の制御方法、制御プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4371754A (en) * 1980-11-19 1983-02-01 Rockwell International Corporation Automatic fault recovery system for a multiple processor telecommunications switching control
DE3136287A1 (de) * 1981-09-12 1983-04-14 Standard Elektrik Lorenz Ag, 7000 Stuttgart Mehrrechnersystem, insbesondere fuer eine bildschirmtext-zentrale
US4466098A (en) * 1982-06-11 1984-08-14 Siemens Corporation Cross channel circuit for an electronic system having two or more redundant computers
JP2755437B2 (ja) * 1989-07-20 1998-05-20 富士通株式会社 通信制御プログラムの連続運転保証処理方法
US5155729A (en) * 1990-05-02 1992-10-13 Rolm Systems Fault recovery in systems utilizing redundant processor arrangements
US5278969A (en) * 1991-08-02 1994-01-11 At&T Bell Laboratories Queue-length monitoring arrangement for detecting consistency between duplicate memories
US5408649A (en) * 1993-04-30 1995-04-18 Quotron Systems, Inc. Distributed data access system including a plurality of database access processors with one-for-N redundancy
US5870537A (en) * 1996-03-13 1999-02-09 International Business Machines Corporation Concurrent switch to shadowed device for storage controller and device errors
US5974114A (en) * 1997-09-25 1999-10-26 At&T Corp Method and apparatus for fault tolerant call processing
US6205557B1 (en) * 1998-06-09 2001-03-20 At&T Corp. Redundant call processing
US6167531A (en) * 1998-06-18 2000-12-26 Unisys Corporation Methods and apparatus for transferring mirrored disk sets during system fail-over

Also Published As

Publication number Publication date
EP0987630B1 (en) 2005-09-14
AU753898B2 (en) 2002-10-31
US6460144B1 (en) 2002-10-01
EP0987630A2 (en) 2000-03-22
JP2000099359A (ja) 2000-04-07
AU4738899A (en) 2000-03-16
EP0987630A3 (en) 2004-09-29
DE69927223D1 (de) 2005-10-20
DE69927223T2 (de) 2006-07-13

Similar Documents

Publication Publication Date Title
JP4744804B2 (ja) 強化されたエラー検出及び復元を備えた情報複製システム
US5805897A (en) System and method for remote software configuration and distribution
US6658589B1 (en) System and method for backup a parallel server data storage system
US7290017B1 (en) System and method for management of data replication
JP5102901B2 (ja) データセンタにわたる複数データサーバ間のデータ完全性を保持する方法およびシステム
US6978282B1 (en) Information replication system having automated replication storage
JP3957278B2 (ja) ファイル転送方法およびシステム
JP4400913B2 (ja) ディスクアレイ装置
US6173420B1 (en) Method and apparatus for fail safe configuration
US5822531A (en) Method and system for dynamically reconfiguring a cluster of computer systems
US6360330B1 (en) System and method for backing up data stored in multiple mirrors on a mass storage subsystem under control of a backup server
US7546484B2 (en) Managing backup solutions with light-weight storage nodes
US7689862B1 (en) Application failover in a cluster environment
US20060294413A1 (en) Fault tolerant rolling software upgrade in a cluster
US20010056554A1 (en) System for clustering software applications
US20030074426A1 (en) Dynamic cluster versioning for a group
JP3967499B2 (ja) マルチコンピュータ・システムでの復元
JP2002297456A (ja) バックアップ処理方法及びその実施システム並びにその処理プログラム
JP2000099359A5 (ja)
JP2007140777A (ja) 計算機システム、管理計算機及びデータリカバリ方法
US6247140B1 (en) Parallel remote administration of mirrored and alternate volume groups in a distributed data processing system
JPH09293001A (ja) 無停止保守システム
GB2345769A (en) Failure recovery in a multi-computer system
JP3527756B2 (ja) システムファイルの更新方法
CN114257512A (zh) 一种实现ambari大数据平台高可用的方法及系统

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041112

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060608

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060626

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061002

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070129

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070531

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees