JP2000099359A - マルチコンピュ―タ・システムでの復元 - Google Patents

マルチコンピュ―タ・システムでの復元

Info

Publication number
JP2000099359A
JP2000099359A JP11253858A JP25385899A JP2000099359A JP 2000099359 A JP2000099359 A JP 2000099359A JP 11253858 A JP11253858 A JP 11253858A JP 25385899 A JP25385899 A JP 25385899A JP 2000099359 A JP2000099359 A JP 2000099359A
Authority
JP
Japan
Prior art keywords
disk
node
computer
standby
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11253858A
Other languages
English (en)
Other versions
JP3967499B2 (ja
JP2000099359A5 (ja
Inventor
Derek William Ashcroft
ウィリアム アッシクロフト デレック
Geoffrey Robert Atkinson
ロバート アトキンソン ジェオフェリー
Philip Mckirgan
マクキルガン フィリップ
Stephen Paul Tickhill
ポール ティックヒル ステファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Services Ltd
Original Assignee
Fujitsu Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB9819523.3A external-priority patent/GB9819523D0/en
Priority claimed from GBGB9819524.1A external-priority patent/GB9819524D0/en
Priority claimed from GB9900473A external-priority patent/GB2345769A/en
Application filed by Fujitsu Services Ltd filed Critical Fujitsu Services Ltd
Publication of JP2000099359A publication Critical patent/JP2000099359A/ja
Publication of JP2000099359A5 publication Critical patent/JP2000099359A5/ja
Application granted granted Critical
Publication of JP3967499B2 publication Critical patent/JP3967499B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • G06F11/1662Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/203Failover techniques using migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space

Abstract

(57)【要約】 【解決手段】 多数の能動ノードと待機ノードを含む多
重ノード・コンピュータ・システム。各ノードは、イン
ストールされたサーバに対してホストしての働きをす
る。各サーバは、システム・ディスクと、上記システム
・ディスク上に保持されているデータの同期回復コピー
を含む回復ディスクを持つ。1つのノードが故障した場
合には、故障したコンピュータに対応する回復ディスク
を待機コンピュータのシステム・ディスクに接続し、こ
の回復ディスクの内容をシステム・ディスクにコピーす
ることにより、システムを再構成するために、回復プロ
セスが実行される。 【効果】 それにより、故障したノードのサーバが待機
ノードに移され、この待機ノードが能動ノードとなる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、マルチコンピュータ・
システムで復元を行うための技術に関する。
【0002】
【従来の技術】上記マルチコンピュータ・システムは、
多数のユーザをサポートし、非常に大型のデータベース
を記憶するのによく使用される。例えば、通常のシステ
ムは、50、000人のユーザをサポートする8つのサ
ーバ・コンピュータから構成することができ、1つまた
はそれ以上の300ギガバイトのデータベースを記憶す
ることができる。
【0003】例えば、マイクロソフト社製のオペレーシ
ョンシステムであるウィンドウズNTの制御の下で動作
するマイクロソフト・エクスチェンジのような標準サー
バ・ソフトウェアに基づく上記システムを提供すること
ができれば便利である。しかし、その場合1つの問題が
ある。それはコンピュータの中のどれかが故障した場合
に、システムを復元できるようにするということであ
る。この規模のあるシステムにクラスタ(cluster)技術
を使用すると、あまりにコストが高くなり過ぎる。ま
た、マイクロソフト・エクスチェンジは、クラスタを意
識したアプリケーションではないし、また(ノードが2
つだけのクラスタであっても)同じサーバ上に2つの段
階(instance)のエクスチェンジを持つことはできない。
【0004】
【発明が解決しようとする課題】本発明は、複数のコン
ピュータと、上記各コンピュータに対して1つずつ使用
される複数のシステム・ディスク・ユニットと、上記各
コンピュータに対して1つずつ使用される複数の他のデ
ィスク・ユニットとを備えるコンピュータ・システムを
動作する方法を提供し、従来技術における上述の問題を
解消するものである。
【0005】
【課題を解決するための手段】従来技術における上述の
問題を解消する上記方法は、(a)上記複数のコンピュー
タを能動コンピュータとして指定し、上記コンピュータ
の他のものを待機コンピュータとして指定するステップ
と、(b)システム・ディスク・ユニット上に保持されて
いるデータの同期回復コピーを行うために、上記の別の
データ・ユニットを使用するステップと、(c)上記能動
コンピュータのどれかが故障した場合、待機コンピュー
タに、故障したコンピュータに対応する他のディスク・
ユニットを使用させることにより、システムを再構成す
るステップとを含むことを特徴とする。
【0006】
【発明の実施の形態】添付の図面を参照しながら、本発
明のコンピュータ・システムを以下に説明するが、これ
は単に例示としてのものに過ぎない。
【0007】本願明細書の場合、下記の用語は特定の意
味で使用されている。
【0008】「ノード」という用語は、個々のコンピュ
ータ・ハードウェア・コンフィギュレーションを意味す
る。本実施形態の場合には、各ノードはICL(インタ
ーナショナル・コンピューターズ・リミテッド)のエキ
ストラサーバ・コンピュータを備える。各ノードは一意
の識別番号を持つ。
【0009】「サーバ」という用語は、インストールさ
れた特定のサーバ・ソフトウェアを意味する。本実施形
態の場合には、各サーバは、インストールされた特定の
マイクロソフトNTを備える。各サーバは、一意のサー
バ名を持ち、任意のノード上で動作(すなわち、作動)
することができる。必要な場合には、サーバの動作を中
止し、他のノードに再配置することができる。
【0010】「システム」という用語は、共通の記憶ユ
ニットにアクセスしている多数のサーバを意味する。
【0011】図1について説明すると、この図は、N+
1のノード10を備えるシステムを示す。通常の動作
中、ノードの中のN個が能動状態にあり、残りの1つの
ノードが待機状態にある。本実施形態の場合には、Nは
4つである。(すなわち、ノードは全部で5つある。)
各ノード10は、サーバ11のホスト役を勤める。
【0012】上記システムは、またそれにより、(人間
の)オペレータまたはシステム管理装置がシステムを監
視し、制御することができるシステム管理ワークステー
ションを含む。各サーバは、その名前及び現在の動作状
態をワークステーション12上に表示する。1つまたは
それ以上の他のシステム(図示せず)も、同じワークス
テーションから制御し、監視することができる。
【0013】すべてのノード10は、共有ディスク・ア
レイ13に接続している。本実施形態の場合、ディスク
・アレイ13は、EMCシンメトリクス・ディスク・ア
レイである。上記ディスク・アレイは、多数の磁気ディ
スク・ユニットからなり、それらすべては復元動作にと
って鏡像になっている(二重になっている)。さらに、
ディスク・アレイは、ビジネス継続ボリューム(BC
V)を提供する多数の他のディスクを含む。BCVは、
ワークステーション12上で動作するEMCタイムファ
インダ・ソフトウェアの制御の下で、1次網に接続する
ことができ、1次網から切り離すことができる有効な第
3の網である。BCVデータは、バックアップを行うた
めに、1次網と同期させることができ、所与の時点で主
なデータのスナップショトをとるために、1次網から切
り離すことができる。BCVをこのように分割すると、
任意の時点で再接続することができ、両者を再度同期さ
せるために、データを1次網からBCVへ、またBCV
から1次網にコピーすることができる。
【0014】システムは、またディスク・アレイ13及
び多数の自動磁気テープ・ドライブ15に接続している
アーカイブ・サーバ14を含む。動作中、アーカイブ・
サーバは、周期的にBCV内に保持しているデータベー
スのコピーをテープにコピーすることにより、各データ
ベースのデータをオフラインで保管する。保管が確実に
行われると、BCVは、EMCタイムファインダ・ソフ
トウェアにより、回復BCVを形成するために、再び切
り離される前に、主データベースと同期状態に戻る。
【0015】図1に示すように、ディスク・アレイ13
は、多数のシステム・ディスク16を含むが、その中の
1つがサーバ11である。各システム・ディスクは、関
連サーバのためのNTオペレーティング・システム・フ
ァイル及びコンフィギュレーション・ファイルを含む。
すなわち、システム・ディスクは、インストールされた
サーバの「性格」を定義するすべての情報を保持する。
各システム・ディスクは、関連システム・ディスクのバ
ックアップ・コピーを含む、それに関連するBCVディ
スク17を持つ。通常、各BCVディスク17は、その
対応するシステム・ディスクから切り離されている。上
記BCVディスクは、システム・ディスクが変わった場
合だけ、2つのコピーを同期させるために、その対応す
るシステム・ディスクに接続される。
【0016】N個の能動ノード10のどれかが故障した
場合には、システム管理ワークステーション12上で、
回復プロセスが開始する。本実施形態の場合、回復プロ
セスは、タイムファインダ・ソフトウェアに関連するス
クリプティング言語で書かれたスクリプトを含む。この
プロセスにより、待機ノードに、故障したノードのシス
テム・ディスクBCVを使用させ、それにより、故障し
たノード上のサーバを待機ノードに再配置したり、また
はその逆を行わせるために、システム管理装置はシステ
ムを再構成する回復手順を使用する。
【0017】回復プロセスは、ノード及びサーバの可能
な各組合せに対して1つずつ、予め定めた組の装置ファ
イルを使用する。この例の場合には、サーバは5つ(待
機中のものも含めて)であり、ノードも5つであるの
で、可能な組合せは25組あり、上記装置ファイルも2
5供給される。これら各ファイルは、n(N)_is_(S)とい
う形により識別される。この場合、Nはノード識別名で
あり、Sはサーバ名の最後の3つの数字である。(もち
ろん、ファイルの命名には、他の慣例的方法も使用する
ことができる。各装置ファイルは、特定のノード上に特
定のサーバをインストールするために必要なすべての情
報を含む。
【0018】図2に示すように、回復プロセスは下記の
ステップを含む。
【0019】(ステップ201)回復プロセスは、最
初、システム管理装置により故障したシステムの識別を
行う。このステップは、1つ以上のシステムが、同じシ
ステム管理ワークステーションにより管理されている場
合だけに必要なものである。
【0020】(ステップ202)その後、回復プロセス
は、故障したノード及び待機ノードの識別番号を入手す
るように要求する。システム管理装置は、システム管理
ワークステーション12上に表示された情報により、こ
れらノード番号を決定することができる。
【0021】(ステップ203)次に、回復プロセス
は、故障したサーバ(すなわち、故障したノード上で、
現在動作しているサーバ)の名前を入手するように要求
する。回復プロセスは、また各システムに対して所定の
待機サーバの名前を自動的に決定する。
【0022】(ステップ204)回復プロセスは、また
各サーバ名を特定の装置識別子に関連づける参照用テー
ブルを使用して、故障したサーバ及び待機サーバに関連
する、BCVの装置識別子を自動的に決定する。
【0023】(ステップ205)その後、回復プロセス
は、これら2つのBCVの現在の状態を決定するため
に、タイムファインダ・ソフトウェアのBCV問い合わ
せコマンドを呼び出す。上記2つのBCVは切り離され
た状態でなければならない。
【0024】情報2つのBCVの1つまたは両方が、切
り離された状態でない場合には、回復プロセスは打ち切
られ、システム管理装置は、適当な技術的サポート・サ
ービスを呼び出すようにプロンプトされる。
【0025】(ステップ206)両方のBCVが切り離
されている場合には、回復プロセスは、故障したサーバ
及び待機サーバの両方の動作を確実に停止するように、
システム管理装置にプロンプトすることにより、その動
作を継続する。回復プロセスは、上記動作の停止が行わ
れたことの確認を待つ。
【0026】(ステップ207)故障したサーバ及び待
機サーバの両方が、その動作を停止した場合には、回復
プロセスは、下記のように2つの装置ファイル名を作成
する。
【0027】第1のファイル名は、n(W)_is_(X)であ
る。ここで、Wは待機ノードのノード番号であり、Xは
故障したサーバ名の最後の3つの数字である。
【0028】第2のファイル名は、n(Y)_is_(Z)であ
る。ここで、Yは故障したノードのノード番号であり、
Zは待機サーバ名の最後の3つの数字である。
【0029】(ステップ208)その後、回復プロセス
は、タイムファインダBCV復元コマンドを呼び出し、
それをパラメータとして第1の装置ファイル名に渡す。
そうすることにより、故障したノードのBCVが、待機
サーバのシステム・ディスクにリンクされ、BCVから
システム・ディスクへのデータのコピーが開始する。こ
れにより、故障したノード上で動作していたサーバが、
待機ノード上に再配置されるのを理解することができる
だろう。
【0030】回復プロセスは、またBCV復元コマンド
を呼出、それをパラメータとして第2の装置ファイル名
に渡す。そうすることにより、待機ノードのBCVが、
故障したサーバのシステム・ディスクにリンクされ、こ
のBCVからシステム・ディスクへのデータのコピーが
開始する。それ故、これにより、待機ノード上で動作し
ていたサーバが、故障したノード上に再配置される。
【0031】一例を挙げると、図3は、ノード1が故障
した場合を示す。この場合、ノード4は待機ノードであ
る。この図に示すように、待機ノードのBCVディスク
は、故障したノードのシステム・ディスクにリンクさ
れ、故障したノードのBCVは、待機ノードのシステム
・ディスクにリンクされる。
【0032】復元コマンドが動作している間に、回復プ
ロセスは、エラー応答をチェックし、上記応答すべてを
システム管理装置に報告する。回復プロセスは、またす
べての処置を、処置直前にログ・ファイルに書き込む。
【0033】(ステップ209)復元コマンドを発行し
た後で、回復プロセスは、それが作動させる新しいノー
ド名を知らせて、回復したサーバ(すなわち、故障した
ノードから待機ノードに移動したサーバ)を再始動する
ように、システム管理装置にプロンプトする。
【0034】復元コマンドは、背景で動作していて、通
常、完了するのに約1時間掛かることに留意されたい。
しかし、回復したサーバは直ちに再始動することがで
き、そのデータには、復元コマンドの実行の終了を待た
ないでアクセスすることができる。
【0035】(ステップ210)回復手順は、タイムフ
ァインダBCV問い合わせコマンドにより、BCV復元
動作の完了を監視する。
【0036】(ステップ211)復元動作が完了する
と、回復手順は、タイムファインダBCV分割コマンド
を発行する。上記コマンドはBCVをシステム・ディス
クから切り離す。回復はこれで完了し、回復プロセスは
終了する。
【0037】故障したノードの修理が完了すると、必要
に応じて、このノードをリブートすることができ、この
ノードは待機サーバになる。その後、能動ノードのどれ
かが故障した場合には、回復手順を反復して行うことが
できる。
【0038】本発明の範囲から逸脱することなしに、上
記システムを種々に修正することができることを理解さ
れたい。例えば、異なる数のディスク及びコンピュータ
を使用することができる。また、他のオペレーティング
・システムで、他のハードウェア・コンフィギュレーシ
ョンにより本発明を実行することもできる。さらに、ス
クリプトにより回復手順を実行する代わりに、例えば、
本発明をオペレーティング・システムに内蔵させること
もできる。
【図面の簡単な説明】
【図1】本発明による多重ノードコンピュータ・システ
ムのブロック図である。
【図2】システムのノードの中のどれかの故障を処理す
るための回復プロセスを示すフローチャートである。
【図3】回復プロセスにより再構成が行われた後の、シ
ステムの一例を示すブロック図である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジェオフェリー ロバート アトキンソン イギリス国.デーエッチ2 1ユーエフ シーオー.ダーラム,チェスター−ル−ス トリート オーストン,ベラビー ドライ ヴ 79 (72)発明者 フィリップ マクキルガン イギリス国.ビーデー4 6アールキュー ウェスト ヨークシャー,イースト ビ アーレイ クリフ ホリンス レーン 197 (72)発明者 ステファン ポール ティックヒル イギリス国.エルエヌ13 0エヌジェー アルフォード,リンカーンシャー トット ヒル,ザ ホワイト ハウス

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 複数のコンピュータと、前記各コンピュ
    ータに対して1つずつ使用する複数のシステム・ディス
    ク・ユニットと、前記各コンピュータに対して1つずつ
    使用する複数の他のディスク・ユニットとを備えるコン
    ピュータ・システムの動作方法であって、 (a)複数の前記コンピュータを能動コンピュータに指定
    し、前記コンピュータの中の他のものを待機コンピュー
    タに指定するステップと、 (b)システム・ディスク・ユニット上に保持されている
    データの同期した回復コピーを行うために他のディスク
    ・ユニットを使用するステップと、 (c)前記能動コンピュータのどれかが故障した場合に、
    前記待機コンピュータに、前記故障したコンピュータに
    対応するディスク・ユニットを使用させることにより前
    記システムを再構成するステップとからなる方法。
  2. 【請求項2】 請求項1に記載の方法において、前記シ
    ステムを再構成するステップが、前記故障したコンピュ
    ータに関連する他のディスク・ユニットを前記待機コン
    ピュータのシステム・ディスクに接続し、前記他のディ
    スクから前記システム・ディスクへのデータのコピーを
    開始するステップを含む方法。
  3. 【請求項3】 請求項2に記載の方法において、さら
    に、背景でデータのコピーが行われている間に前記待機
    コンピュータを再び始動するステップを含む方法。
  4. 【請求項4】 請求項1乃至3の何れかに記載の方法に
    おいて、インストールされた特定のオペレーティング・
    システムと、特定のコンピュータ・ハードウェア・コン
    フィギュレーションとの可能な各組合せに対して1つず
    つ、1組の装置ファイルを維持するステップを含み、前
    記システムを再構成するステップが、前記故障したコン
    ピュータ及び前記待機コンピュータの新しいコンフィギ
    ュレーションに対応する2つの装置ファイルを選択する
    ステップと、前記装置ファイルを前記システムの再構成
    を制御するために使用するステップとを含む方法。
JP25385899A 1998-09-08 1999-09-08 マルチコンピュータ・システムでの復元 Expired - Fee Related JP3967499B2 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
GBGB9819523.3A GB9819523D0 (en) 1998-09-08 1998-09-08 Archiving and resilience in a multi-computer system
GBGB9819524.1A GB9819524D0 (en) 1998-09-09 1998-09-09 Archiving and resilience in a multi-computer system
GB9900473A GB2345769A (en) 1999-01-12 1999-01-12 Failure recovery in a multi-computer system
GB9819523.3 1999-01-12
GB9819524.1 1999-01-12
GB9900473.1 1999-01-12

Publications (3)

Publication Number Publication Date
JP2000099359A true JP2000099359A (ja) 2000-04-07
JP2000099359A5 JP2000099359A5 (ja) 2005-07-14
JP3967499B2 JP3967499B2 (ja) 2007-08-29

Family

ID=27269473

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25385899A Expired - Fee Related JP3967499B2 (ja) 1998-09-08 1999-09-08 マルチコンピュータ・システムでの復元

Country Status (5)

Country Link
US (1) US6460144B1 (ja)
EP (1) EP0987630B1 (ja)
JP (1) JP3967499B2 (ja)
AU (1) AU753898B2 (ja)
DE (1) DE69927223T2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008537203A (ja) * 2005-02-23 2008-09-11 リーマン・ブラザーズ・インコーポレーテッド 障害復旧フレームワーク
EP2211269A1 (en) 2004-10-18 2010-07-28 Fujitsu Limited Operation management program, operation management method, and operation management device
WO2012073686A1 (ja) * 2010-11-30 2012-06-07 独立行政法人科学技術振興機構 ディペンダビリティ維持装置、ディペンダビリティ維持システム、障害対応システム、ディペンダビリティ維持装置の制御方法、制御プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体
US8224941B2 (en) 2004-10-18 2012-07-17 Fujitsu Limited Method, apparatus, and computer product for managing operation
US8387013B2 (en) 2004-10-18 2013-02-26 Fujitsu Limited Method, apparatus, and computer product for managing operation

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6829687B2 (en) * 2000-12-28 2004-12-07 International Business Machines Corporation Volume data net backup
US6868067B2 (en) * 2002-06-28 2005-03-15 Harris Corporation Hybrid agent-oriented object model to provide software fault tolerance between distributed processor nodes
CA2444835A1 (en) * 2003-10-10 2005-04-10 Ibm Canada Limited - Ibm Canada Limitee System and method for grid computing
GB2419699A (en) 2004-10-29 2006-05-03 Hewlett Packard Development Co Configuring supercomputer for reliable operation
GB2419696B (en) * 2004-10-29 2008-07-16 Hewlett Packard Development Co Communication link fault tolerance in a supercomputer
JP4839841B2 (ja) * 2006-01-04 2011-12-21 株式会社日立製作所 スナップショット再起動方法
US9268659B2 (en) * 2006-01-05 2016-02-23 Emc Corporation Detecting failover in a database mirroring environment
JP4939271B2 (ja) * 2007-03-29 2012-05-23 株式会社日立製作所 ストレージ保守・管理装置の冗長化方法、及びその方法を使用する装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4371754A (en) * 1980-11-19 1983-02-01 Rockwell International Corporation Automatic fault recovery system for a multiple processor telecommunications switching control
DE3136287A1 (de) * 1981-09-12 1983-04-14 Standard Elektrik Lorenz Ag, 7000 Stuttgart Mehrrechnersystem, insbesondere fuer eine bildschirmtext-zentrale
US4466098A (en) * 1982-06-11 1984-08-14 Siemens Corporation Cross channel circuit for an electronic system having two or more redundant computers
JP2755437B2 (ja) * 1989-07-20 1998-05-20 富士通株式会社 通信制御プログラムの連続運転保証処理方法
US5155729A (en) * 1990-05-02 1992-10-13 Rolm Systems Fault recovery in systems utilizing redundant processor arrangements
US5278969A (en) * 1991-08-02 1994-01-11 At&T Bell Laboratories Queue-length monitoring arrangement for detecting consistency between duplicate memories
US5408649A (en) * 1993-04-30 1995-04-18 Quotron Systems, Inc. Distributed data access system including a plurality of database access processors with one-for-N redundancy
US5870537A (en) * 1996-03-13 1999-02-09 International Business Machines Corporation Concurrent switch to shadowed device for storage controller and device errors
US5974114A (en) * 1997-09-25 1999-10-26 At&T Corp Method and apparatus for fault tolerant call processing
US6205557B1 (en) * 1998-06-09 2001-03-20 At&T Corp. Redundant call processing
US6167531A (en) * 1998-06-18 2000-12-26 Unisys Corporation Methods and apparatus for transferring mirrored disk sets during system fail-over

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2211269A1 (en) 2004-10-18 2010-07-28 Fujitsu Limited Operation management program, operation management method, and operation management device
US7971089B2 (en) 2004-10-18 2011-06-28 Fujitsu Limited Switching connection of a boot disk to a substitute server and moving the failed server to a server domain pool
US8224941B2 (en) 2004-10-18 2012-07-17 Fujitsu Limited Method, apparatus, and computer product for managing operation
US8387013B2 (en) 2004-10-18 2013-02-26 Fujitsu Limited Method, apparatus, and computer product for managing operation
JP2008537203A (ja) * 2005-02-23 2008-09-11 リーマン・ブラザーズ・インコーポレーテッド 障害復旧フレームワーク
US8572431B2 (en) 2005-02-23 2013-10-29 Barclays Capital Inc. Disaster recovery framework
WO2012073686A1 (ja) * 2010-11-30 2012-06-07 独立行政法人科学技術振興機構 ディペンダビリティ維持装置、ディペンダビリティ維持システム、障害対応システム、ディペンダビリティ維持装置の制御方法、制御プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体
JP5280587B2 (ja) * 2010-11-30 2013-09-04 独立行政法人科学技術振興機構 ディペンダビリティ維持システム、変化対応サイクル実行装置、障害対応サイクル実行装置、ディペンダビリティ維持システムの制御方法、制御プログラムおよびそれを記録したコンピュータ読み取り可能な記録媒体
CN103339612A (zh) * 2010-11-30 2013-10-02 日本科学技术振兴机构 可靠性维持装置、可靠性维持系统、障碍处理系统、可靠性维持装置的控制方法、控制程序以及记录该程序用的电脑可读取记录介质
US8806272B2 (en) 2010-11-30 2014-08-12 Japan Science And Technology Agency Dependability maintenance system, change accommodation cycle execution device, failure response cycle execution device, method for controlling dependability maintenance system, control program, and computer-readable storage medium storing the control program

Also Published As

Publication number Publication date
JP3967499B2 (ja) 2007-08-29
EP0987630B1 (en) 2005-09-14
AU4738899A (en) 2000-03-16
DE69927223D1 (de) 2005-10-20
US6460144B1 (en) 2002-10-01
AU753898B2 (en) 2002-10-31
EP0987630A3 (en) 2004-09-29
DE69927223T2 (de) 2006-07-13
EP0987630A2 (en) 2000-03-22

Similar Documents

Publication Publication Date Title
EP0988596B1 (en) Method and system for recovery in a partitioned shared nothing database system using virtual shared disks
JP4744804B2 (ja) 強化されたエラー検出及び復元を備えた情報複製システム
US6360330B1 (en) System and method for backing up data stored in multiple mirrors on a mass storage subsystem under control of a backup server
US7680994B2 (en) Automatically managing the state of replicated data of a computing environment, and methods therefor
US6658589B1 (en) System and method for backup a parallel server data storage system
US5805897A (en) System and method for remote software configuration and distribution
US6915447B2 (en) File server storage arrangement
US5781910A (en) Preforming concurrent transactions in a replicated database environment
US6978282B1 (en) Information replication system having automated replication storage
US7478263B1 (en) System and method for establishing bi-directional failover in a two node cluster
JP4400913B2 (ja) ディスクアレイ装置
US7571290B1 (en) Replica synchronization using copy-on-read technique
JP3957278B2 (ja) ファイル転送方法およびシステム
US7251713B1 (en) System and method to transport data snapshots
US6247103B1 (en) Host storage management control of outboard data movement using push-pull operations
US20060294413A1 (en) Fault tolerant rolling software upgrade in a cluster
US6393537B1 (en) Host storage management control of outboard data movement
JP2004252686A (ja) 情報処理システム
JP2002297456A (ja) バックアップ処理方法及びその実施システム並びにその処理プログラム
JP3967499B2 (ja) マルチコンピュータ・システムでの復元
JP2000099359A5 (ja)
US6247140B1 (en) Parallel remote administration of mirrored and alternate volume groups in a distributed data processing system
JPH09293001A (ja) 無停止保守システム
JP3253473B2 (ja) 二重化された共用メモリの等価性回復処理方法および装置
JPH09218840A (ja) 情報処理方法とその装置と情報処理システム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041112

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060608

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060626

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061002

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070129

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070531

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees