JP3967499B2 - マルチコンピュータ・システムでの復元 - Google Patents
マルチコンピュータ・システムでの復元 Download PDFInfo
- Publication number
- JP3967499B2 JP3967499B2 JP25385899A JP25385899A JP3967499B2 JP 3967499 B2 JP3967499 B2 JP 3967499B2 JP 25385899 A JP25385899 A JP 25385899A JP 25385899 A JP25385899 A JP 25385899A JP 3967499 B2 JP3967499 B2 JP 3967499B2
- Authority
- JP
- Japan
- Prior art keywords
- computer
- standby
- disk
- node
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1658—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
- G06F11/1662—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/203—Failover techniques using migration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2038—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2094—Redundant storage or storage space
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【産業上の利用分野】
本発明は、マルチコンピュータ・システムで復元を行うための技術に関する。
【0002】
【従来の技術】
上記マルチコンピュータ・システムは、多数のユーザをサポートし、非常に大型のデータベースを記憶するのによく使用される。例えば、通常のシステムは、50、000人のユーザをサポートする8つのサーバ・コンピュータから構成することができ、1つまたはそれ以上の300ギガバイトのデータベースを記憶することができる。
【0003】
例えば、マイクロソフト社製のオペレーションシステムであるウィンドウズNTの制御の下で動作するマイクロソフト・エクスチェンジのような標準サーバ・ソフトウェアに基づく上記システムを提供することができれば便利である。しかし、その場合1つの問題がある。それはコンピュータの中のどれかが故障した場合に、システムを復元できるようにするということである。この規模のあるシステムにクラスタ(cluster)技術を使用すると、あまりにコストが高くなり過ぎる。また、マイクロソフト・エクスチェンジは、クラスタを意識したアプリケーションではないし、また(ノードが2つだけのクラスタであっても)同じサーバ上に2つの段階(instance)のエクスチェンジを持つことはできない。
【0004】
【発明が解決しようとする課題】
本発明は、複数のコンピュータと、上記各コンピュータに対して1つずつ使用される複数のシステム・ディスク・ユニットと、上記各コンピュータに対して1つずつ使用される複数の追加ディスク・ユニットとを備えるコンピュータ・システムを動作する方法を提供し、従来技術における上述の問題を解消するものである。
【0005】
【課題を解決するための手段】
従来技術における上述の問題を解消する上記方法は、
(a)上記複数のコンピュータを稼動コンピュータとして指定し、上記コンピュータの他のものを待機コンピュータとして指定するステップと、
(b)システム・ディスク・ユニット上に保持されているデータの同期回復コピーを行うために、上記の別のデータ・ユニットを使用するステップと、
(c)上記稼動コンピュータのどれかが故障した場合、待機コンピュータに、故障したコンピュータに対応する追加ディスク・ユニットを使用させることにより、システムを再構成するステップとを含むことを特徴とする。
【0006】
【発明の実施の形態】
添付の図面を参照しながら、本発明のコンピュータ・システムを以下に説明するが、これは単に例示としてのものに過ぎない。
【0007】
本願明細書の場合、下記の用語は特定の意味で使用されている。
【0008】
「ノード」という用語は、個々のコンピュータ・ハードウェア・コンフィギュレーションを意味する。本実施形態の場合には、各ノードはICL(インターナショナル・コンピューターズ・リミテッド)のエキストラサーバ・コンピュータを備える。各ノードは一意の識別番号を持つ。
【0009】
「サーバ」という用語は、インストールされた特定のサーバ・ソフトウェアを意味する。本実施形態の場合には、各サーバは、インストールされた特定のマイクロソフトNTを備える。各サーバは、一意のサーバ名を持ち、任意のノード上で動作(すなわち、作動)することができる。必要な場合には、サーバの動作を中止し、他のノードに再配置することができる。
【0010】
「システム」という用語は、共通の記憶ユニットにアクセスしている多数のサーバを意味する。
【0011】
図1について説明すると、この図は、N+1のノード10を備えるシステムを示す。通常の動作中、ノードの中のN個が稼動状態にあり、残りの1つのノードが待機状態にある。本実施形態の場合には、Nは4つである。(すなわち、ノードは全部で5つある。)各ノード10は、サーバ11のホスト役を勤める。
【0012】
上記システムは、またそれにより、(人間の)オペレータまたはシステム管理装置がシステムを監視し、制御することができるシステム管理ワークステーションを含む。各サーバは、その名前及び現在の動作状態をワークステーション12上に表示する。1つまたはそれ以上の他のシステム(図示せず)も、同じワークステーションから制御し、監視することができる。
【0013】
すべてのノード10は、共有ディスク・アレイ13に接続している。本実施形態の場合、ディスク・アレイ13は、EMCシンメトリクス・ディスク・アレイである。上記ディスク・アレイは、多数の磁気ディスク・ユニットからなり、それらすべては復元動作にとって鏡像になっている(二重になっている)。さらに、ディスク・アレイは、ビジネス継続ボリューム(BCV)を提供する多数の追加ディスクを含む。BCVは、ワークステーション12上で動作するEMCタイムファインダ・ソフトウェアの制御の下で、1次網に接続することができ、1次網から切り離すことができる有効な第3の網である。BCVデータは、バックアップを行うために、1次網と同期させることができ、所与の時点で主なデータのスナップショトをとるために、1次網から切り離すことができる。BCVをこのように分割すると、任意の時点で再接続することができ、両者を再度同期させるために、データを1次網からBCVへ、またBCVから1次網にコピーすることができる。
【0014】
システムは、またディスク・アレイ13及び多数の自動磁気テープ・ドライブ15に接続しているアーカイブ・サーバ14を含む。動作中、アーカイブ・サーバは、周期的にBCV内に保持しているデータベースのコピーをテープにコピーすることにより、各データベースのデータをオフラインで保管する。保管が確実に行われると、BCVは、EMCタイムファインダ・ソフトウェアにより、回復BCVを形成するために、再び切り離される前に、主データベースと同期状態に戻る。
【0015】
図1に示すように、ディスク・アレイ13は、多数のシステム・ディスク16を含むが、その中の1つがサーバ11である。各システム・ディスクは、関連サーバのためのNTオペレーティング・システム・ファイル及びコンフィギュレーション・ファイルを含む。すなわち、システム・ディスクは、インストールされたサーバの「性格」を定義するすべての情報を保持する。各システム・ディスクは、関連システム・ディスクのバックアップ・コピーを含む、それに関連するBCVディスク17を持つ。通常、各BCVディスク17は、その対応するシステム・ディスクから切り離されている。上記BCVディスクは、システム・ディスクが変わった場合だけ、2つのコピーを同期させるために、その対応するシステム・ディスクに接続される。
【0016】
N個の稼動ノード10のどれかが故障した場合には、システム管理ワークステーション12上で、回復プロセスが開始する。本実施形態の場合、回復プロセスは、タイムファインダ・ソフトウェアに関連するスクリプティング言語で書かれたスクリプトを含む。このプロセスにより、待機ノードに、故障したノードのシステム・ディスクBCVを使用させ、それにより、故障したノード上のサーバを待機ノードに再配置したり、またはその逆を行わせるために、システム管理装置はシステムを再構成する回復手順を使用する。
【0017】
回復プロセスは、ノード及びサーバの可能な各組合せに対して1つずつ、予め定めた組のデバイスファイルを使用する。この例の場合には、サーバは5つ(待機中のものも含めて)であり、ノードも5つであるので、可能な組合せは25組あり、上記デバイスファイルも25供給される。これら各ファイルは、 という形により識別される。この場合、Nはノード識別名であり、Sはサーバ名の最後の3つの数字である。(もちろん、ファイルの命名には、他の慣例的方法も使用することができる。各デバイスファイルは、特定のノード上に特定のサーバをインストールするために必要なすべての情報を含む。
【0018】
図2に示すように、回復プロセスは下記のステップを含む。
【0019】
(ステップ201)回復プロセスは、最初、システム管理装置により故障したシステムの識別を行う。このステップは、1つ以上のシステムが、同じシステム管理ワークステーションにより管理されている場合だけに必要なものである。
【0020】
(ステップ202)その後、回復プロセスは、故障したノード及び待機ノードの識別番号を入手するように要求する。システム管理装置は、システム管理ワークステーション12上に表示された情報により、これらノード番号を決定することができる。
【0021】
(ステップ203)次に、回復プロセスは、故障したサーバ(すなわち、故障したノード上で、現在動作しているサーバ)の名前を入手するように要求する。回復プロセスは、また各システムに対して所定の待機サーバの名前を自動的に決定する。
【0022】
(ステップ204)回復プロセスは、また各サーバ名を特定の装置識別子に関連づける参照用テーブルを使用して、故障したサーバ及び待機サーバに関連する、BCVの装置識別子を自動的に決定する。
【0023】
(ステップ205)その後、回復プロセスは、これら2つのBCVの現在の状態を決定するために、タイムファインダ・ソフトウェアのBCV問い合わせコマンドを呼び出す。上記2つのBCVは切り離された状態でなければならない。
【0024】
情報2つのBCVの1つまたは両方が、切り離された状態でない場合には、回復プロセスは打ち切られ、システム管理装置は、適当な技術的サポート・サービスを呼び出すようにプロンプトされる。
【0025】
(ステップ206)両方のBCVが切り離されている場合には、回復プロセスは、故障したサーバ及び待機サーバの両方の動作を確実に停止するように、システム管理装置にプロンプトすることにより、その動作を継続する。回復プロセスは、上記動作の停止が行われたことの確認を待つ。
【0026】
(ステップ207)故障したサーバ及び待機サーバの両方が、その動作を停止した場合には、回復プロセスは、下記のように2つのデバイスファイル名を作成する。
【0027】
第1のファイル名は、n(W)_is_(X)である。ここで、Wは待機ノードのノード番号であり、Xは故障したサーバ名の最後の3つの数字である。
【0028】
第2のファイル名は、n(Y)_is_(Z)である。ここで、Yは故障したノードのノード番号であり、Zは待機サーバ名の最後の3つの数字である。
【0029】
(ステップ208)その後、回復プロセスは、タイムファインダBCV復元コマンドを呼び出し、それをパラメータとして第1のデバイスファイル名に渡す。そうすることにより、故障したノードのBCVが、待機サーバのシステム・ディスクにリンクされ、BCVからシステム・ディスクへのデータのコピーが開始する。これにより、故障したノード上で動作していたサーバが、待機ノード上に再配置されるのを理解することができるだろう。
【0030】
回復プロセスは、またBCV復元コマンドを呼出、それをパラメータとして第2のデバイスファイル名に渡す。そうすることにより、待機ノードのBCVが、故障したサーバのシステム・ディスクにリンクされ、このBCVからシステム・ディスクへのデータのコピーが開始する。それ故、これにより、待機ノード上で動作していたサーバが、故障したノード上に再配置される。
【0031】
一例を挙げると、図3は、ノード1が故障した場合を示す。この場合、ノード4は待機ノードである。この図に示すように、待機ノードのBCVディスクは、故障したノードのシステム・ディスクにリンクされ、故障したノードのBCVは、待機ノードのシステム・ディスクにリンクされる。
【0032】
復元コマンドが動作している間に、回復プロセスは、エラー応答をチェックし、上記応答すべてをシステム管理装置に報告する。回復プロセスは、またすべての処置を、処置直前にログ・ファイルに書き込む。
【0033】
(ステップ209)復元コマンドを発行した後で、回復プロセスは、それが作動させる新しいノード名を知らせて、回復したサーバ(すなわち、故障したノードから待機ノードに移動したサーバ)を再始動するように、システム管理装置にプロンプトする。
【0034】
復元コマンドは、背景で動作していて、通常、完了するのに約1時間掛かることに留意されたい。しかし、回復したサーバは直ちに再始動することができ、そのデータには、復元コマンドの実行の終了を待たないでアクセスすることができる。
【0035】
(ステップ210)回復手順は、タイムファインダBCV問い合わせコマンドにより、BCV復元動作の完了を監視する。
【0036】
(ステップ211)復元動作が完了すると、回復手順は、タイムファインダBCV分割コマンドを発行する。上記コマンドはBCVをシステム・ディスクから切り離す。回復はこれで完了し、回復プロセスは終了する。
【0037】
故障したノードの修理が完了すると、必要に応じて、このノードをリブートすることができ、このノードは待機サーバになる。その後、稼動ノードのどれかが故障した場合には、回復手順を反復して行うことができる。
【0038】
本発明の範囲から逸脱することなしに、上記システムを種々に修正することができることを理解されたい。例えば、異なる数のディスク及びコンピュータを使用することができる。また、他のオペレーティング・システムで、他のハードウェア・コンフィギュレーションにより本発明を実行することもできる。さらに、スクリプトにより回復手順を実行する代わりに、例えば、本発明をオペレーティング・システムに内蔵させることもできる。
【図面の簡単な説明】
【図1】本発明による多重ノードコンピュータ・システムのブロック図である。
【図2】システムのノードの中のどれかの故障を処理するための回復プロセスを示すフローチャートである。
【図3】回復プロセスにより再構成が行われた後の、システムの一例を示すブロック図である。
Claims (4)
- 複数のコンピュータ、前記各コンピュータに対して1つずつ使用する複数のシステム・ディスク・ユニットであって各コンピュータに対するシステム・ディスクが関連するコンピュータの性格を定義する全ての情報を保持するシステム・ディスク・ユニット、及び前記各コンピュータに対して1つずつ使用する複数の追加ディスク・ユニットを備えるコンピュータ・システムの動作方法であって、
(a)複数の前記コンピュータを稼動コンピュータとして指定し、前記コンピュータの中の他のものを待機コンピュータとして指定するステップと、
(b)該システム・ディスク・ユニット上に保持されているデータの同期した回復コピーを行うために追加ディスク・ユニットを使用するステップと、
(c)前記稼動コンピュータのどれかが故障した場合に、前記待機コンピュータに、前記故障したコンピュータに対応する該追加ディスク・ユニットを使用させることにより前記システムを再構成するステップとからなる方法。 - 請求項1に記載の方法において、前記システムを再構成するステップが、前記故障したコンピュータに関連する該追加ディスク・ユニットを前記待機コンピュータのシステム・ディスクに接続し、前記追加ディスクから前記システム・ディスクへのデータのコピーを開始するステップを含む方法。
- 請求項2に記載の方法であって、さらに、背景でデータのコピーが行われている間に前記待機コンピュータを再び始動するステップを含む方法。
- 請求項1乃至3の何れかに記載の方法であって、インストールされた特定のオペレーティング・システムと、特定のコンピュータ・ハードウェア・コンフィギュレーションとの可能な各組合せに対して1つずつ、1組のデバイスファイルを維持するステップを含み、前記システムを再構成するステップが、前記故障したコンピュータ及び前記待機コンピュータの新しいコンフィギュレーションに対応する2つのデバイスファイルを選択するステップと、前記デバイスファイルを前記システムの再構成を制御するために使用するステップとを含む方法。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB9819523.3A GB9819523D0 (en) | 1998-09-08 | 1998-09-08 | Archiving and resilience in a multi-computer system |
GBGB9819524.1A GB9819524D0 (en) | 1998-09-09 | 1998-09-09 | Archiving and resilience in a multi-computer system |
GB9900473.1 | 1999-01-12 | ||
GB9819524.1 | 1999-01-12 | ||
GB9900473A GB2345769A (en) | 1999-01-12 | 1999-01-12 | Failure recovery in a multi-computer system |
GB9819523.3 | 1999-01-12 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2000099359A JP2000099359A (ja) | 2000-04-07 |
JP2000099359A5 JP2000099359A5 (ja) | 2005-07-14 |
JP3967499B2 true JP3967499B2 (ja) | 2007-08-29 |
Family
ID=27269473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP25385899A Expired - Fee Related JP3967499B2 (ja) | 1998-09-08 | 1999-09-08 | マルチコンピュータ・システムでの復元 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6460144B1 (ja) |
EP (1) | EP0987630B1 (ja) |
JP (1) | JP3967499B2 (ja) |
AU (1) | AU753898B2 (ja) |
DE (1) | DE69927223T2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6829687B2 (en) * | 2000-12-28 | 2004-12-07 | International Business Machines Corporation | Volume data net backup |
US6868067B2 (en) | 2002-06-28 | 2005-03-15 | Harris Corporation | Hybrid agent-oriented object model to provide software fault tolerance between distributed processor nodes |
CA2444835A1 (en) * | 2003-10-10 | 2005-04-10 | Ibm Canada Limited - Ibm Canada Limitee | System and method for grid computing |
WO2006043307A1 (ja) | 2004-10-18 | 2006-04-27 | Fujitsu Limited | 運用管理プログラム、運用管理方法および運用管理装置 |
EP1811376A4 (en) | 2004-10-18 | 2007-12-26 | Fujitsu Ltd | PROGRAM, METHOD AND INSTALLATION FOR OPERATIONAL MANAGEMENT |
DE602004027424D1 (de) | 2004-10-18 | 2010-07-08 | Fujitsu Ltd | Operationsverwaltungsprogramm, operationsverwaltun |
GB2419699A (en) | 2004-10-29 | 2006-05-03 | Hewlett Packard Development Co | Configuring supercomputer for reliable operation |
GB2419696B (en) | 2004-10-29 | 2008-07-16 | Hewlett Packard Development Co | Communication link fault tolerance in a supercomputer |
US8572431B2 (en) * | 2005-02-23 | 2013-10-29 | Barclays Capital Inc. | Disaster recovery framework |
JP4839841B2 (ja) * | 2006-01-04 | 2011-12-21 | 株式会社日立製作所 | スナップショット再起動方法 |
US9268659B2 (en) * | 2006-01-05 | 2016-02-23 | Emc Corporation | Detecting failover in a database mirroring environment |
JP4939271B2 (ja) * | 2007-03-29 | 2012-05-23 | 株式会社日立製作所 | ストレージ保守・管理装置の冗長化方法、及びその方法を使用する装置 |
WO2012073686A1 (ja) * | 2010-11-30 | 2012-06-07 | 独立行政法人科学技術振興機構 | ディペンダビリティ維持装置、ディペンダビリティ維持システム、障害対応システム、ディペンダビリティ維持装置の制御方法、制御プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4371754A (en) * | 1980-11-19 | 1983-02-01 | Rockwell International Corporation | Automatic fault recovery system for a multiple processor telecommunications switching control |
DE3136287A1 (de) * | 1981-09-12 | 1983-04-14 | Standard Elektrik Lorenz Ag, 7000 Stuttgart | Mehrrechnersystem, insbesondere fuer eine bildschirmtext-zentrale |
US4466098A (en) * | 1982-06-11 | 1984-08-14 | Siemens Corporation | Cross channel circuit for an electronic system having two or more redundant computers |
JP2755437B2 (ja) * | 1989-07-20 | 1998-05-20 | 富士通株式会社 | 通信制御プログラムの連続運転保証処理方法 |
US5155729A (en) * | 1990-05-02 | 1992-10-13 | Rolm Systems | Fault recovery in systems utilizing redundant processor arrangements |
US5278969A (en) * | 1991-08-02 | 1994-01-11 | At&T Bell Laboratories | Queue-length monitoring arrangement for detecting consistency between duplicate memories |
US5408649A (en) * | 1993-04-30 | 1995-04-18 | Quotron Systems, Inc. | Distributed data access system including a plurality of database access processors with one-for-N redundancy |
US5870537A (en) * | 1996-03-13 | 1999-02-09 | International Business Machines Corporation | Concurrent switch to shadowed device for storage controller and device errors |
US5974114A (en) * | 1997-09-25 | 1999-10-26 | At&T Corp | Method and apparatus for fault tolerant call processing |
US6205557B1 (en) * | 1998-06-09 | 2001-03-20 | At&T Corp. | Redundant call processing |
US6167531A (en) * | 1998-06-18 | 2000-12-26 | Unisys Corporation | Methods and apparatus for transferring mirrored disk sets during system fail-over |
-
1999
- 1999-08-13 EP EP99306404A patent/EP0987630B1/en not_active Expired - Lifetime
- 1999-08-13 DE DE69927223T patent/DE69927223T2/de not_active Expired - Lifetime
- 1999-08-30 US US09/385,937 patent/US6460144B1/en not_active Expired - Lifetime
- 1999-09-06 AU AU47388/99A patent/AU753898B2/en not_active Ceased
- 1999-09-08 JP JP25385899A patent/JP3967499B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP0987630B1 (en) | 2005-09-14 |
AU753898B2 (en) | 2002-10-31 |
US6460144B1 (en) | 2002-10-01 |
EP0987630A2 (en) | 2000-03-22 |
JP2000099359A (ja) | 2000-04-07 |
AU4738899A (en) | 2000-03-16 |
EP0987630A3 (en) | 2004-09-29 |
DE69927223D1 (de) | 2005-10-20 |
DE69927223T2 (de) | 2006-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4744804B2 (ja) | 強化されたエラー検出及び復元を備えた情報複製システム | |
US5805897A (en) | System and method for remote software configuration and distribution | |
US6658589B1 (en) | System and method for backup a parallel server data storage system | |
US7290017B1 (en) | System and method for management of data replication | |
JP5102901B2 (ja) | データセンタにわたる複数データサーバ間のデータ完全性を保持する方法およびシステム | |
US6978282B1 (en) | Information replication system having automated replication storage | |
JP3957278B2 (ja) | ファイル転送方法およびシステム | |
JP4400913B2 (ja) | ディスクアレイ装置 | |
US6173420B1 (en) | Method and apparatus for fail safe configuration | |
US5822531A (en) | Method and system for dynamically reconfiguring a cluster of computer systems | |
US6360330B1 (en) | System and method for backing up data stored in multiple mirrors on a mass storage subsystem under control of a backup server | |
US7546484B2 (en) | Managing backup solutions with light-weight storage nodes | |
US7689862B1 (en) | Application failover in a cluster environment | |
US20060294413A1 (en) | Fault tolerant rolling software upgrade in a cluster | |
US20010056554A1 (en) | System for clustering software applications | |
US20030074426A1 (en) | Dynamic cluster versioning for a group | |
JP3967499B2 (ja) | マルチコンピュータ・システムでの復元 | |
JP2002297456A (ja) | バックアップ処理方法及びその実施システム並びにその処理プログラム | |
JP2000099359A5 (ja) | ||
JP2007140777A (ja) | 計算機システム、管理計算機及びデータリカバリ方法 | |
US6247140B1 (en) | Parallel remote administration of mirrored and alternate volume groups in a distributed data processing system | |
JPH09293001A (ja) | 無停止保守システム | |
GB2345769A (en) | Failure recovery in a multi-computer system | |
JP3527756B2 (ja) | システムファイルの更新方法 | |
CN114257512A (zh) | 一种实现ambari大数据平台高可用的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041112 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041112 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060608 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060626 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061002 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070129 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070531 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |