JP2000099359A

JP2000099359A - マルチコンピュ―タ・システムでの復元

Info

Publication number: JP2000099359A
Application number: JP11253858A
Authority: JP
Inventors: Derek William Ashcroft; ウィリアムアッシクロフトデレック; Geoffrey Robert Atkinson; ロバートアトキンソンジェオフェリー; Philip Mckirgan; マクキルガンフィリップ; Stephen Paul Tickhill; ポールティックヒルステファン
Original assignee: Fujitsu Services Ltd
Current assignee: Fujitsu Services Ltd
Priority date: 1998-09-08
Filing date: 1999-09-08
Publication date: 2000-04-07
Anticipated expiration: 2019-09-08
Also published as: JP3967499B2; EP0987630B1; AU4738899A; DE69927223D1; US6460144B1; AU753898B2; EP0987630A3; DE69927223T2; EP0987630A2

Abstract

(57)【要約】【解決手段】多数の能動ノードと待機ノードを含む多
重ノード・コンピュータ・システム。各ノードは、イン
ストールされたサーバに対してホストしての働きをす
る。各サーバは、システム・ディスクと、上記システム
・ディスク上に保持されているデータの同期回復コピー
を含む回復ディスクを持つ。１つのノードが故障した場
合には、故障したコンピュータに対応する回復ディスク
を待機コンピュータのシステム・ディスクに接続し、こ
の回復ディスクの内容をシステム・ディスクにコピーす
ることにより、システムを再構成するために、回復プロ
セスが実行される。【効果】それにより、故障したノードのサーバが待機
ノードに移され、この待機ノードが能動ノードとなる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、マルチコンピュータ・
システムで復元を行うための技術に関する。

【０００２】

【従来の技術】上記マルチコンピュータ・システムは、
多数のユーザをサポートし、非常に大型のデータベース
を記憶するのによく使用される。例えば、通常のシステ
ムは、５０、０００人のユーザをサポートする８つのサ
ーバ・コンピュータから構成することができ、１つまた
はそれ以上の３００ギガバイトのデータベースを記憶す
ることができる。

【０００３】例えば、マイクロソフト社製のオペレーシ
ョンシステムであるウィンドウズＮＴの制御の下で動作
するマイクロソフト・エクスチェンジのような標準サー
バ・ソフトウェアに基づく上記システムを提供すること
ができれば便利である。しかし、その場合１つの問題が
ある。それはコンピュータの中のどれかが故障した場合
に、システムを復元できるようにするということであ
る。この規模のあるシステムにクラスタ(cluster)技術
を使用すると、あまりにコストが高くなり過ぎる。ま
た、マイクロソフト・エクスチェンジは、クラスタを意
識したアプリケーションではないし、また（ノードが２
つだけのクラスタであっても）同じサーバ上に２つの段
階(instance)のエクスチェンジを持つことはできない。

【０００４】

【発明が解決しようとする課題】本発明は、複数のコン
ピュータと、上記各コンピュータに対して１つずつ使用
される複数のシステム・ディスク・ユニットと、上記各
コンピュータに対して１つずつ使用される複数の他のデ
ィスク・ユニットとを備えるコンピュータ・システムを
動作する方法を提供し、従来技術における上述の問題を
解消するものである。

【０００５】

【課題を解決するための手段】従来技術における上述の
問題を解消する上記方法は、(a)上記複数のコンピュー
タを能動コンピュータとして指定し、上記コンピュータ
の他のものを待機コンピュータとして指定するステップ
と、(b)システム・ディスク・ユニット上に保持されて
いるデータの同期回復コピーを行うために、上記の別の
データ・ユニットを使用するステップと、(c)上記能動
コンピュータのどれかが故障した場合、待機コンピュー
タに、故障したコンピュータに対応する他のディスク・
ユニットを使用させることにより、システムを再構成す
るステップとを含むことを特徴とする。

【０００６】

【発明の実施の形態】添付の図面を参照しながら、本発
明のコンピュータ・システムを以下に説明するが、これ
は単に例示としてのものに過ぎない。

【０００７】本願明細書の場合、下記の用語は特定の意
味で使用されている。

【０００８】「ノード」という用語は、個々のコンピュ
ータ・ハードウェア・コンフィギュレーションを意味す
る。本実施形態の場合には、各ノードはＩＣＬ（インタ
ーナショナル・コンピューターズ・リミテッド）のエキ
ストラサーバ・コンピュータを備える。各ノードは一意
の識別番号を持つ。

【０００９】「サーバ」という用語は、インストールさ
れた特定のサーバ・ソフトウェアを意味する。本実施形
態の場合には、各サーバは、インストールされた特定の
マイクロソフトＮＴを備える。各サーバは、一意のサー
バ名を持ち、任意のノード上で動作（すなわち、作動）
することができる。必要な場合には、サーバの動作を中
止し、他のノードに再配置することができる。

【００１０】「システム」という用語は、共通の記憶ユ
ニットにアクセスしている多数のサーバを意味する。

【００１１】図１について説明すると、この図は、Ｎ＋
１のノード１０を備えるシステムを示す。通常の動作
中、ノードの中のＮ個が能動状態にあり、残りの１つの
ノードが待機状態にある。本実施形態の場合には、Ｎは
４つである。（すなわち、ノードは全部で５つある。）
各ノード１０は、サーバ１１のホスト役を勤める。

【００１２】上記システムは、またそれにより、（人間
の）オペレータまたはシステム管理装置がシステムを監
視し、制御することができるシステム管理ワークステー
ションを含む。各サーバは、その名前及び現在の動作状
態をワークステーション１２上に表示する。１つまたは
それ以上の他のシステム（図示せず）も、同じワークス
テーションから制御し、監視することができる。

【００１３】すべてのノード１０は、共有ディスク・ア
レイ１３に接続している。本実施形態の場合、ディスク
・アレイ１３は、ＥＭＣシンメトリクス・ディスク・ア
レイである。上記ディスク・アレイは、多数の磁気ディ
スク・ユニットからなり、それらすべては復元動作にと
って鏡像になっている（二重になっている）。さらに、
ディスク・アレイは、ビジネス継続ボリューム（ＢＣ
Ｖ）を提供する多数の他のディスクを含む。ＢＣＶは、
ワークステーション１２上で動作するＥＭＣタイムファ
インダ・ソフトウェアの制御の下で、１次網に接続する
ことができ、１次網から切り離すことができる有効な第
３の網である。ＢＣＶデータは、バックアップを行うた
めに、１次網と同期させることができ、所与の時点で主
なデータのスナップショトをとるために、１次網から切
り離すことができる。ＢＣＶをこのように分割すると、
任意の時点で再接続することができ、両者を再度同期さ
せるために、データを１次網からＢＣＶへ、またＢＣＶ
から１次網にコピーすることができる。

【００１４】システムは、またディスク・アレイ１３及
び多数の自動磁気テープ・ドライブ１５に接続している
アーカイブ・サーバ１４を含む。動作中、アーカイブ・
サーバは、周期的にＢＣＶ内に保持しているデータベー
スのコピーをテープにコピーすることにより、各データ
ベースのデータをオフラインで保管する。保管が確実に
行われると、ＢＣＶは、ＥＭＣタイムファインダ・ソフ
トウェアにより、回復ＢＣＶを形成するために、再び切
り離される前に、主データベースと同期状態に戻る。

【００１５】図１に示すように、ディスク・アレイ１３
は、多数のシステム・ディスク１６を含むが、その中の
１つがサーバ１１である。各システム・ディスクは、関
連サーバのためのＮＴオペレーティング・システム・フ
ァイル及びコンフィギュレーション・ファイルを含む。
すなわち、システム・ディスクは、インストールされた
サーバの「性格」を定義するすべての情報を保持する。
各システム・ディスクは、関連システム・ディスクのバ
ックアップ・コピーを含む、それに関連するＢＣＶディ
スク１７を持つ。通常、各ＢＣＶディスク１７は、その
対応するシステム・ディスクから切り離されている。上
記ＢＣＶディスクは、システム・ディスクが変わった場
合だけ、２つのコピーを同期させるために、その対応す
るシステム・ディスクに接続される。

【００１６】Ｎ個の能動ノード１０のどれかが故障した
場合には、システム管理ワークステーション１２上で、
回復プロセスが開始する。本実施形態の場合、回復プロ
セスは、タイムファインダ・ソフトウェアに関連するス
クリプティング言語で書かれたスクリプトを含む。この
プロセスにより、待機ノードに、故障したノードのシス
テム・ディスクＢＣＶを使用させ、それにより、故障し
たノード上のサーバを待機ノードに再配置したり、また
はその逆を行わせるために、システム管理装置はシステ
ムを再構成する回復手順を使用する。

【００１７】回復プロセスは、ノード及びサーバの可能
な各組合せに対して１つずつ、予め定めた組の装置ファ
イルを使用する。この例の場合には、サーバは５つ（待
機中のものも含めて）であり、ノードも５つであるの
で、可能な組合せは２５組あり、上記装置ファイルも２
５供給される。これら各ファイルは、n(N)_is_(S)とい
う形により識別される。この場合、Ｎはノード識別名で
あり、Ｓはサーバ名の最後の３つの数字である。（もち
ろん、ファイルの命名には、他の慣例的方法も使用する
ことができる。各装置ファイルは、特定のノード上に特
定のサーバをインストールするために必要なすべての情
報を含む。

【００１８】図２に示すように、回復プロセスは下記の
ステップを含む。

【００１９】（ステップ２０１）回復プロセスは、最
初、システム管理装置により故障したシステムの識別を
行う。このステップは、１つ以上のシステムが、同じシ
ステム管理ワークステーションにより管理されている場
合だけに必要なものである。

【００２０】（ステップ２０２）その後、回復プロセス
は、故障したノード及び待機ノードの識別番号を入手す
るように要求する。システム管理装置は、システム管理
ワークステーション１２上に表示された情報により、こ
れらノード番号を決定することができる。

【００２１】（ステップ２０３）次に、回復プロセス
は、故障したサーバ（すなわち、故障したノード上で、
現在動作しているサーバ）の名前を入手するように要求
する。回復プロセスは、また各システムに対して所定の
待機サーバの名前を自動的に決定する。

【００２２】（ステップ２０４）回復プロセスは、また
各サーバ名を特定の装置識別子に関連づける参照用テー
ブルを使用して、故障したサーバ及び待機サーバに関連
する、ＢＣＶの装置識別子を自動的に決定する。

【００２３】（ステップ２０５）その後、回復プロセス
は、これら２つのＢＣＶの現在の状態を決定するため
に、タイムファインダ・ソフトウェアのＢＣＶ問い合わ
せコマンドを呼び出す。上記２つのＢＣＶは切り離され
た状態でなければならない。

【００２４】情報２つのＢＣＶの１つまたは両方が、切
り離された状態でない場合には、回復プロセスは打ち切
られ、システム管理装置は、適当な技術的サポート・サ
ービスを呼び出すようにプロンプトされる。

【００２５】（ステップ２０６）両方のＢＣＶが切り離
されている場合には、回復プロセスは、故障したサーバ
及び待機サーバの両方の動作を確実に停止するように、
システム管理装置にプロンプトすることにより、その動
作を継続する。回復プロセスは、上記動作の停止が行わ
れたことの確認を待つ。

【００２６】（ステップ２０７）故障したサーバ及び待
機サーバの両方が、その動作を停止した場合には、回復
プロセスは、下記のように２つの装置ファイル名を作成
する。

【００２７】第１のファイル名は、n(W)_is_(X)であ
る。ここで、Ｗは待機ノードのノード番号であり、Ｘは
故障したサーバ名の最後の３つの数字である。

【００２８】第２のファイル名は、n(Y)_is_(Z)であ
る。ここで、Ｙは故障したノードのノード番号であり、
Ｚは待機サーバ名の最後の３つの数字である。

【００２９】（ステップ２０８）その後、回復プロセス
は、タイムファインダＢＣＶ復元コマンドを呼び出し、
それをパラメータとして第１の装置ファイル名に渡す。
そうすることにより、故障したノードのＢＣＶが、待機
サーバのシステム・ディスクにリンクされ、ＢＣＶから
システム・ディスクへのデータのコピーが開始する。こ
れにより、故障したノード上で動作していたサーバが、
待機ノード上に再配置されるのを理解することができる
だろう。

【００３０】回復プロセスは、またＢＣＶ復元コマンド
を呼出、それをパラメータとして第２の装置ファイル名
に渡す。そうすることにより、待機ノードのＢＣＶが、
故障したサーバのシステム・ディスクにリンクされ、こ
のＢＣＶからシステム・ディスクへのデータのコピーが
開始する。それ故、これにより、待機ノード上で動作し
ていたサーバが、故障したノード上に再配置される。

【００３１】一例を挙げると、図３は、ノード１が故障
した場合を示す。この場合、ノード４は待機ノードであ
る。この図に示すように、待機ノードのＢＣＶディスク
は、故障したノードのシステム・ディスクにリンクさ
れ、故障したノードのＢＣＶは、待機ノードのシステム
・ディスクにリンクされる。

【００３２】復元コマンドが動作している間に、回復プ
ロセスは、エラー応答をチェックし、上記応答すべてを
システム管理装置に報告する。回復プロセスは、またす
べての処置を、処置直前にログ・ファイルに書き込む。

【００３３】（ステップ２０９）復元コマンドを発行し
た後で、回復プロセスは、それが作動させる新しいノー
ド名を知らせて、回復したサーバ（すなわち、故障した
ノードから待機ノードに移動したサーバ）を再始動する
ように、システム管理装置にプロンプトする。

【００３４】復元コマンドは、背景で動作していて、通
常、完了するのに約１時間掛かることに留意されたい。
しかし、回復したサーバは直ちに再始動することがで
き、そのデータには、復元コマンドの実行の終了を待た
ないでアクセスすることができる。

【００３５】（ステップ２１０）回復手順は、タイムフ
ァインダＢＣＶ問い合わせコマンドにより、ＢＣＶ復元
動作の完了を監視する。

【００３６】（ステップ２１１）復元動作が完了する
と、回復手順は、タイムファインダＢＣＶ分割コマンド
を発行する。上記コマンドはＢＣＶをシステム・ディス
クから切り離す。回復はこれで完了し、回復プロセスは
終了する。

【００３７】故障したノードの修理が完了すると、必要
に応じて、このノードをリブートすることができ、この
ノードは待機サーバになる。その後、能動ノードのどれ
かが故障した場合には、回復手順を反復して行うことが
できる。

【００３８】本発明の範囲から逸脱することなしに、上
記システムを種々に修正することができることを理解さ
れたい。例えば、異なる数のディスク及びコンピュータ
を使用することができる。また、他のオペレーティング
・システムで、他のハードウェア・コンフィギュレーシ
ョンにより本発明を実行することもできる。さらに、ス
クリプトにより回復手順を実行する代わりに、例えば、
本発明をオペレーティング・システムに内蔵させること
もできる。

【図面の簡単な説明】

【図１】本発明による多重ノードコンピュータ・システ
ムのブロック図である。

【図２】システムのノードの中のどれかの故障を処理す
るための回復プロセスを示すフローチャートである。

【図３】回復プロセスにより再構成が行われた後の、シ
ステムの一例を示すブロック図である。

───────────────────────────────────────────────────── フロントページの続き (72)発明者ジェオフェリーロバートアトキンソンイギリス国．デーエッチ２１ユーエフシーオー．ダーラム，チェスター−ル−ストリートオーストン，ベラビードライヴ 79 (72)発明者フィリップマクキルガンイギリス国．ビーデー４６アールキューウェストヨークシャー，イーストビアーレイクリフホリンスレーン 197 (72)発明者ステファンポールティックヒルイギリス国．エルエヌ13 ０エヌジェーアルフォード，リンカーンシャートットヒル，ザホワイトハウス

Claims

【特許請求の範囲】

【請求項１】複数のコンピュータと、前記各コンピュ
ータに対して１つずつ使用する複数のシステム・ディス
ク・ユニットと、前記各コンピュータに対して１つずつ
使用する複数の他のディスク・ユニットとを備えるコン
ピュータ・システムの動作方法であって、 (a)複数の前記コンピュータを能動コンピュータに指定
し、前記コンピュータの中の他のものを待機コンピュー
タに指定するステップと、 (b)システム・ディスク・ユニット上に保持されている
データの同期した回復コピーを行うために他のディスク
・ユニットを使用するステップと、 (c)前記能動コンピュータのどれかが故障した場合に、
前記待機コンピュータに、前記故障したコンピュータに
対応するディスク・ユニットを使用させることにより前
記システムを再構成するステップとからなる方法。
【請求項２】請求項１に記載の方法において、前記シ
ステムを再構成するステップが、前記故障したコンピュ
ータに関連する他のディスク・ユニットを前記待機コン
ピュータのシステム・ディスクに接続し、前記他のディ
スクから前記システム・ディスクへのデータのコピーを
開始するステップを含む方法。
【請求項３】請求項２に記載の方法において、さら
に、背景でデータのコピーが行われている間に前記待機
コンピュータを再び始動するステップを含む方法。
【請求項４】請求項１乃至３の何れかに記載の方法に
おいて、インストールされた特定のオペレーティング・
システムと、特定のコンピュータ・ハードウェア・コン
フィギュレーションとの可能な各組合せに対して１つず
つ、１組の装置ファイルを維持するステップを含み、前
記システムを再構成するステップが、前記故障したコン
ピュータ及び前記待機コンピュータの新しいコンフィギ
ュレーションに対応する２つの装置ファイルを選択する
ステップと、前記装置ファイルを前記システムの再構成
を制御するために使用するステップとを含む方法。