JP3967499B2

JP3967499B2 - マルチコンピュータ・システムでの復元

Info

Publication number: JP3967499B2
Application number: JP25385899A
Authority: JP
Inventors: ウィリアムアッシクロフトデレック; ロバートアトキンソンジェオフェリー; マクキルガンフィリップ; ポールティックヒルステファン
Original assignee: フジツウサービスリミテッド
Priority date: 1998-09-08
Filing date: 1999-09-08
Publication date: 2007-08-29
Anticipated expiration: 2019-09-08
Also published as: EP0987630B1; AU753898B2; US6460144B1; EP0987630A2; JP2000099359A; AU4738899A; EP0987630A3; DE69927223D1; DE69927223T2

Description

【０００１】
【産業上の利用分野】
本発明は、マルチコンピュータ・システムで復元を行うための技術に関する。
【０００２】
【従来の技術】
上記マルチコンピュータ・システムは、多数のユーザをサポートし、非常に大型のデータベースを記憶するのによく使用される。例えば、通常のシステムは、５０、０００人のユーザをサポートする８つのサーバ・コンピュータから構成することができ、１つまたはそれ以上の３００ギガバイトのデータベースを記憶することができる。
【０００３】
例えば、マイクロソフト社製のオペレーションシステムであるウィンドウズＮＴの制御の下で動作するマイクロソフト・エクスチェンジのような標準サーバ・ソフトウェアに基づく上記システムを提供することができれば便利である。しかし、その場合１つの問題がある。それはコンピュータの中のどれかが故障した場合に、システムを復元できるようにするということである。この規模のあるシステムにクラスタ(cluster)技術を使用すると、あまりにコストが高くなり過ぎる。また、マイクロソフト・エクスチェンジは、クラスタを意識したアプリケーションではないし、また（ノードが２つだけのクラスタであっても）同じサーバ上に２つの段階(instance)のエクスチェンジを持つことはできない。
【０００４】
【発明が解決しようとする課題】
本発明は、複数のコンピュータと、上記各コンピュータに対して１つずつ使用される複数のシステム・ディスク・ユニットと、上記各コンピュータに対して１つずつ使用される複数の追加ディスク・ユニットとを備えるコンピュータ・システムを動作する方法を提供し、従来技術における上述の問題を解消するものである。
【０００５】
【課題を解決するための手段】
従来技術における上述の問題を解消する上記方法は、
(a)上記複数のコンピュータを稼動コンピュータとして指定し、上記コンピュータの他のものを待機コンピュータとして指定するステップと、
(b)システム・ディスク・ユニット上に保持されているデータの同期回復コピーを行うために、上記の別のデータ・ユニットを使用するステップと、
(c)上記稼動コンピュータのどれかが故障した場合、待機コンピュータに、故障したコンピュータに対応する追加ディスク・ユニットを使用させることにより、システムを再構成するステップとを含むことを特徴とする。
【０００６】
【発明の実施の形態】
添付の図面を参照しながら、本発明のコンピュータ・システムを以下に説明するが、これは単に例示としてのものに過ぎない。
【０００７】
本願明細書の場合、下記の用語は特定の意味で使用されている。
【０００８】
「ノード」という用語は、個々のコンピュータ・ハードウェア・コンフィギュレーションを意味する。本実施形態の場合には、各ノードはＩＣＬ（インターナショナル・コンピューターズ・リミテッド）のエキストラサーバ・コンピュータを備える。各ノードは一意の識別番号を持つ。
【０００９】
「サーバ」という用語は、インストールされた特定のサーバ・ソフトウェアを意味する。本実施形態の場合には、各サーバは、インストールされた特定のマイクロソフトＮＴを備える。各サーバは、一意のサーバ名を持ち、任意のノード上で動作（すなわち、作動）することができる。必要な場合には、サーバの動作を中止し、他のノードに再配置することができる。
【００１０】
「システム」という用語は、共通の記憶ユニットにアクセスしている多数のサーバを意味する。
【００１１】
図１について説明すると、この図は、Ｎ＋１のノード１０を備えるシステムを示す。通常の動作中、ノードの中のＮ個が稼動状態にあり、残りの１つのノードが待機状態にある。本実施形態の場合には、Ｎは４つである。（すなわち、ノードは全部で５つある。）各ノード１０は、サーバ１１のホスト役を勤める。
【００１２】
上記システムは、またそれにより、（人間の）オペレータまたはシステム管理装置がシステムを監視し、制御することができるシステム管理ワークステーションを含む。各サーバは、その名前及び現在の動作状態をワークステーション１２上に表示する。１つまたはそれ以上の他のシステム（図示せず）も、同じワークステーションから制御し、監視することができる。
【００１３】
すべてのノード１０は、共有ディスク・アレイ１３に接続している。本実施形態の場合、ディスク・アレイ１３は、ＥＭＣシンメトリクス・ディスク・アレイである。上記ディスク・アレイは、多数の磁気ディスク・ユニットからなり、それらすべては復元動作にとって鏡像になっている（二重になっている）。さらに、ディスク・アレイは、ビジネス継続ボリューム（ＢＣＶ）を提供する多数の追加ディスクを含む。ＢＣＶは、ワークステーション１２上で動作するＥＭＣタイムファインダ・ソフトウェアの制御の下で、１次網に接続することができ、１次網から切り離すことができる有効な第３の網である。ＢＣＶデータは、バックアップを行うために、１次網と同期させることができ、所与の時点で主なデータのスナップショトをとるために、１次網から切り離すことができる。ＢＣＶをこのように分割すると、任意の時点で再接続することができ、両者を再度同期させるために、データを１次網からＢＣＶへ、またＢＣＶから１次網にコピーすることができる。
【００１４】
システムは、またディスク・アレイ１３及び多数の自動磁気テープ・ドライブ１５に接続しているアーカイブ・サーバ１４を含む。動作中、アーカイブ・サーバは、周期的にＢＣＶ内に保持しているデータベースのコピーをテープにコピーすることにより、各データベースのデータをオフラインで保管する。保管が確実に行われると、ＢＣＶは、ＥＭＣタイムファインダ・ソフトウェアにより、回復ＢＣＶを形成するために、再び切り離される前に、主データベースと同期状態に戻る。
【００１５】
図１に示すように、ディスク・アレイ１３は、多数のシステム・ディスク１６を含むが、その中の１つがサーバ１１である。各システム・ディスクは、関連サーバのためのＮＴオペレーティング・システム・ファイル及びコンフィギュレーション・ファイルを含む。すなわち、システム・ディスクは、インストールされたサーバの「性格」を定義するすべての情報を保持する。各システム・ディスクは、関連システム・ディスクのバックアップ・コピーを含む、それに関連するＢＣＶディスク１７を持つ。通常、各ＢＣＶディスク１７は、その対応するシステム・ディスクから切り離されている。上記ＢＣＶディスクは、システム・ディスクが変わった場合だけ、２つのコピーを同期させるために、その対応するシステム・ディスクに接続される。
【００１６】
Ｎ個の稼動ノード１０のどれかが故障した場合には、システム管理ワークステーション１２上で、回復プロセスが開始する。本実施形態の場合、回復プロセスは、タイムファインダ・ソフトウェアに関連するスクリプティング言語で書かれたスクリプトを含む。このプロセスにより、待機ノードに、故障したノードのシステム・ディスクＢＣＶを使用させ、それにより、故障したノード上のサーバを待機ノードに再配置したり、またはその逆を行わせるために、システム管理装置はシステムを再構成する回復手順を使用する。
【００１７】
回復プロセスは、ノード及びサーバの可能な各組合せに対して１つずつ、予め定めた組のデバイスファイルを使用する。この例の場合には、サーバは５つ（待機中のものも含めて）であり、ノードも５つであるので、可能な組合せは２５組あり、上記デバイスファイルも２５供給される。これら各ファイルは、という形により識別される。この場合、Ｎはノード識別名であり、Ｓはサーバ名の最後の３つの数字である。（もちろん、ファイルの命名には、他の慣例的方法も使用することができる。各デバイスファイルは、特定のノード上に特定のサーバをインストールするために必要なすべての情報を含む。
【００１８】
図２に示すように、回復プロセスは下記のステップを含む。
【００１９】
（ステップ２０１）回復プロセスは、最初、システム管理装置により故障したシステムの識別を行う。このステップは、１つ以上のシステムが、同じシステム管理ワークステーションにより管理されている場合だけに必要なものである。
【００２０】
（ステップ２０２）その後、回復プロセスは、故障したノード及び待機ノードの識別番号を入手するように要求する。システム管理装置は、システム管理ワークステーション１２上に表示された情報により、これらノード番号を決定することができる。
【００２１】
（ステップ２０３）次に、回復プロセスは、故障したサーバ（すなわち、故障したノード上で、現在動作しているサーバ）の名前を入手するように要求する。回復プロセスは、また各システムに対して所定の待機サーバの名前を自動的に決定する。
【００２２】
（ステップ２０４）回復プロセスは、また各サーバ名を特定の装置識別子に関連づける参照用テーブルを使用して、故障したサーバ及び待機サーバに関連する、ＢＣＶの装置識別子を自動的に決定する。
【００２３】
（ステップ２０５）その後、回復プロセスは、これら２つのＢＣＶの現在の状態を決定するために、タイムファインダ・ソフトウェアのＢＣＶ問い合わせコマンドを呼び出す。上記２つのＢＣＶは切り離された状態でなければならない。
【００２４】
情報２つのＢＣＶの１つまたは両方が、切り離された状態でない場合には、回復プロセスは打ち切られ、システム管理装置は、適当な技術的サポート・サービスを呼び出すようにプロンプトされる。
【００２５】
（ステップ２０６）両方のＢＣＶが切り離されている場合には、回復プロセスは、故障したサーバ及び待機サーバの両方の動作を確実に停止するように、システム管理装置にプロンプトすることにより、その動作を継続する。回復プロセスは、上記動作の停止が行われたことの確認を待つ。
【００２６】
（ステップ２０７）故障したサーバ及び待機サーバの両方が、その動作を停止した場合には、回復プロセスは、下記のように２つのデバイスファイル名を作成する。
【００２７】
第１のファイル名は、n(W)_is_(X)である。ここで、Ｗは待機ノードのノード番号であり、Ｘは故障したサーバ名の最後の３つの数字である。
【００２８】
第２のファイル名は、n(Y)_is_(Z)である。ここで、Ｙは故障したノードのノード番号であり、Ｚは待機サーバ名の最後の３つの数字である。
【００２９】
（ステップ２０８）その後、回復プロセスは、タイムファインダＢＣＶ復元コマンドを呼び出し、それをパラメータとして第１のデバイスファイル名に渡す。そうすることにより、故障したノードのＢＣＶが、待機サーバのシステム・ディスクにリンクされ、ＢＣＶからシステム・ディスクへのデータのコピーが開始する。これにより、故障したノード上で動作していたサーバが、待機ノード上に再配置されるのを理解することができるだろう。
【００３０】
回復プロセスは、またＢＣＶ復元コマンドを呼出、それをパラメータとして第２のデバイスファイル名に渡す。そうすることにより、待機ノードのＢＣＶが、故障したサーバのシステム・ディスクにリンクされ、このＢＣＶからシステム・ディスクへのデータのコピーが開始する。それ故、これにより、待機ノード上で動作していたサーバが、故障したノード上に再配置される。
【００３１】
一例を挙げると、図３は、ノード１が故障した場合を示す。この場合、ノード４は待機ノードである。この図に示すように、待機ノードのＢＣＶディスクは、故障したノードのシステム・ディスクにリンクされ、故障したノードのＢＣＶは、待機ノードのシステム・ディスクにリンクされる。
【００３２】
復元コマンドが動作している間に、回復プロセスは、エラー応答をチェックし、上記応答すべてをシステム管理装置に報告する。回復プロセスは、またすべての処置を、処置直前にログ・ファイルに書き込む。
【００３３】
（ステップ２０９）復元コマンドを発行した後で、回復プロセスは、それが作動させる新しいノード名を知らせて、回復したサーバ（すなわち、故障したノードから待機ノードに移動したサーバ）を再始動するように、システム管理装置にプロンプトする。
【００３４】
復元コマンドは、背景で動作していて、通常、完了するのに約１時間掛かることに留意されたい。しかし、回復したサーバは直ちに再始動することができ、そのデータには、復元コマンドの実行の終了を待たないでアクセスすることができる。
【００３５】
（ステップ２１０）回復手順は、タイムファインダＢＣＶ問い合わせコマンドにより、ＢＣＶ復元動作の完了を監視する。
【００３６】
（ステップ２１１）復元動作が完了すると、回復手順は、タイムファインダＢＣＶ分割コマンドを発行する。上記コマンドはＢＣＶをシステム・ディスクから切り離す。回復はこれで完了し、回復プロセスは終了する。
【００３７】
故障したノードの修理が完了すると、必要に応じて、このノードをリブートすることができ、このノードは待機サーバになる。その後、稼動ノードのどれかが故障した場合には、回復手順を反復して行うことができる。
【００３８】
本発明の範囲から逸脱することなしに、上記システムを種々に修正することができることを理解されたい。例えば、異なる数のディスク及びコンピュータを使用することができる。また、他のオペレーティング・システムで、他のハードウェア・コンフィギュレーションにより本発明を実行することもできる。さらに、スクリプトにより回復手順を実行する代わりに、例えば、本発明をオペレーティング・システムに内蔵させることもできる。
【図面の簡単な説明】
【図１】本発明による多重ノードコンピュータ・システムのブロック図である。
【図２】システムのノードの中のどれかの故障を処理するための回復プロセスを示すフローチャートである。
【図３】回復プロセスにより再構成が行われた後の、システムの一例を示すブロック図である。

Claims

複数のコンピュータ、前記各コンピュータに対して１つずつ使用する複数のシステム・ディスク・ユニットであって各コンピュータに対するシステム・ディスクが関連するコンピュータの性格を定義する全ての情報を保持するシステム・ディスク・ユニット、及び前記各コンピュータに対して１つずつ使用する複数の追加ディスク・ユニットを備えるコンピュータ・システムの動作方法であって、
(a)複数の前記コンピュータを稼動コンピュータとして指定し、前記コンピュータの中の他のものを待機コンピュータとして指定するステップと、
(b)該システム・ディスク・ユニット上に保持されているデータの同期した回復コピーを行うために追加ディスク・ユニットを使用するステップと、
(c)前記稼動コンピュータのどれかが故障した場合に、前記待機コンピュータに、前記故障したコンピュータに対応する該追加ディスク・ユニットを使用させることにより前記システムを再構成するステップとからなる方法。
請求項１に記載の方法において、前記システムを再構成するステップが、前記故障したコンピュータに関連する該追加ディスク・ユニットを前記待機コンピュータのシステム・ディスクに接続し、前記追加ディスクから前記システム・ディスクへのデータのコピーを開始するステップを含む方法。
請求項２に記載の方法であって、さらに、背景でデータのコピーが行われている間に前記待機コンピュータを再び始動するステップを含む方法。
請求項１乃至３の何れかに記載の方法であって、インストールされた特定のオペレーティング・システムと、特定のコンピュータ・ハードウェア・コンフィギュレーションとの可能な各組合せに対して１つずつ、１組のデバイスファイルを維持するステップを含み、前記システムを再構成するステップが、前記故障したコンピュータ及び前記待機コンピュータの新しいコンフィギュレーションに対応する２つのデバイスファイルを選択するステップと、前記デバイスファイルを前記システムの再構成を制御するために使用するステップとを含む方法。