JP3887130B2

JP3887130B2 - 高可用性計算機システム及び同システムにおけるデータバックアップ方法

Info

Publication number: JP3887130B2
Application number: JP21714799A
Authority: JP
Inventors: 浩司山本
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1999-07-30
Filing date: 1999-07-30
Publication date: 2007-02-28
Anticipated expiration: 2019-07-30
Also published as: JP2001043105A

Description

【０００１】
【発明の属する技術分野】
本発明は、複数のサーバ計算機が連携して処理を行い、いずれかのサーバ計算機で障害が発生しても他のサーバ計算機が処理を引き継ぐことができる高可用性システム（高可用性計算機システム）に係り、特に他のクライアント計算機に対してサービスを提供する複数のサーバ計算機をネットワークによって連携させ、いずれかのサーバ計算機で障害が発生しても、他のサーバ計算機がサービスを引き継ぐことによってシステム全体としてはサービスの中断時間を可能な限り短くするデータバックアップ機能を有する高可用性計算機システム及び同システムにおけるデータバックアップ方法に関する。
【０００２】
【従来の技術】
従来の高可用性計算機システムは、サーバ計算機が２台存在し、その片方でサービスを提供し、もう片方にバックアップを行う方式を適用するのが一般的であった。
【０００３】
この種のシステムでは、サービスを提供しているサーバ計算機からバックアップ用のサーバ計算機にデータをコピーしておくことにより、サービスを提供しているサーバ計算機に障害が発生した場合に、サービスをもう片方のサーバ計算機に引き継いで、その続きを行うことができるようになっている。
【０００４】
【発明が解決しようとする課題】
上記した２台のサーバ計算機を用いて構成される従来の高可用性計算機システムでは、サービスを提供しているサーバ計算機に障害が発生した場合でも、残りの待機状態にあるサーバ計算機（バックアップ用サーバ計算機）でサービスを引き継ぐことが可能である。しかし、サーバ計算機が２台の場合、２台共障害が発生する可能性もあり得るため、用途によっては耐障害性の点で必ずしもが十分とはいえない。
【０００５】
そこで、より障害に強いシステムを構築するために、３台以上のサーバ計算機を連携させて動作させることが考えられる。この場合、サーバ計算機が多くなるほどサーバ計算機間の連携は複雑となり、また運用状態にあるサーバ計算機の負荷も大きくなることが予測される。このため、３台以上のサーバ計算機を効果的に連携させる仕組みが必要となる。
【０００６】
本発明は上記事情を考慮してなされたものでその目的は、３台以上のサーバ計算機を用いてバックアップ用のサーバ計算機（バックアップサーバ計算機）を複数確保し、その複数のバックアップサーバ計算機に対する効果的なデータコピーを行うことで、より障害に強い高可用性計算機システム及び同システムにおけるデータバックアップ方法を提供することにある。
【０００７】
本発明の他の目的は、高速ネットワークと低速ネットワークによって複数のサーバ計算機を連携させ、各ネットワークに適したデータバックアップ方式を併用することで、ネットワーク構成に柔軟に対応した効果的なデータバックアップが行える高可用性計算機システム及び同システムにおけるデータバックアップ方法を提供することにある。
【０００８】
【課題を解決するための手段】
本発明の第１の観点に係る高可用性計算機システムは、ネットワークを介して接続される少なくとも３台のサーバ計算機を備え、そのうちの１台がマスタサーバ計算機となってクライアント計算機に対してサービスを提供し、当該マスタサーバ計算機に障害が発生した場合には、所定の優先順位情報（ここでは、システム内の全計算機についてマスタとなる優先順位を示すと共にマスタが切り替わる毎に優先順位が循環使用される優先順位情報）に従って、残りの複数のサーバ計算機のいずれかが新たにマスタサーバ計算機となって処理を引き継ぐ高可用性計算機システムであって、上記各サーバ計算機に、次の各手段、即ち自計算機がマスタサーバ計算機でない場合に、マスタサーバ計算機を探すマスタ探索動作を定期的に実行するマスタ探索手段と、このマスタ探索手段によりマスタサーバ計算機が見つけられず、且つ障害が発生していないサーバ計算機の中で自計算機の優先順位が最も高い場合に、自計算機を新たにマスタサーバ計算機として設定するマスタ設定手段と、自計算機がマスタサーバ計算機の場合に、障害のあるサーバ計算機と障害のないサーバ計算機とを探索するサーバ計算機探索動作を定期的に実行するサーバ計算機探索手段と、自計算機がマスタサーバ計算機で、且つクライアント計算機から自計算機の保持するファイルのデータが変更された場合に、その変更されたデータを上記サーバ計算機探索手段により見つけられた障害のない全てのサーバ計算機に個々にコピーする、つまり１対ｎ通信方式によるデータコピーを行うコピー手段とを備えたことを特徴とする。
【０００９】
このような構成においては、クライアント計算機によりマスタサーバ計算機の持つファイルのデータが変更された場合、そのデータがマスタサーバ計算機により他の障害のない全てのサーバ計算機にコピーされて各サーバ計算機のファイルの内容の一致化が図られ、しかもマスタサーバ計算機のバックアップ用のサーバ計算機（スレーブサーバ計算機）が複数存在するため、マスタサーバ計算機に障害が発生した場合には、他の複数のバックアップサーバ計算機（スレーブサーバ計算機）のうちの１台が新たにマスタサーバ計算機となって、上記コピーされたデータを使い、障害の発生したサーバでそれまで提供されていたサービスを引き継ぐことができ、より障害に強い高可用性計算機システムが実現可能となる。
【００１０】
ここで、上記マスタ探索手段に、上記優先順位情報に従って、その時点で優先順位の最も高いサーバ計算機から始まって順位が低くなる方向に順に通信を行うことによりマスタサーバ計算機を探す機能を持たせることで、マスタ探索を効率的に行うことが可能となる。
【００１１】
また、上記サーバ計算機探索手段に、優先順位情報に従って、自計算機より１つ順位が下のサーバ計算機から始まって順位が低くなる方向に順に通信を行うことにより障害のあるサーバ計算機と障害のないサーバ計算機とを探索する機能を持たせることで、自身より優先順位が下位のサーバ計算機の障害の有無を効率的に探索できる。
【００１２】
また、自計算機がマスタサーバ計算機の場合に、上記サーバ計算機探索手段により見つけられた障害のないサーバ計算機をデータ送信先として設定するデータ送信先設定手段を設けるならば、上記コピー手段の１対ｎ通信方式によるデータコピーが、当該データ送信先設定手段の設定に従い効率的に行える。
【００１３】
ここで、上記サーバ計算機探索手段により新たに障害のないサーバ計算機が見つけられた場合には、つまり障害から復旧したサーバ計算機が検出された場合には、そのサーバ計算機をデータ送信先としてデータ送信先設定手段により追加設定し、そのサーバ計算機にマスタサーバ計算機のコピー手段によりマスタサーバ計算機の保持する全てのファイルのデータをコピーするならば、そのサーバ計算機（復旧したサーバ計算機）を確実に且つ速やかにバックアップ計算機の１つとすることができる。
【００１４】
本発明の第２の観点に係る高可用性計算機システムは、ネットワーク接続されたシステム内の各サーバ計算機に、以下の各手段、即ち自計算機がマスタサーバ計算機でない場合に、優先順位情報に従って、自計算機より１つ順位が上のサーバから始まって順位が高くなる方向に順に通信を行うことにより障害のないサーバ計算機を１つ探す第１の探索動作を定期的に実行する第１のサーバ計算機探索手段と、この第１のサーバ計算機探索手段により障害のないサーバ計算機が見つけられる前に障害のあるサーバ計算機が見つけられ、且つその計算機がマスタサーバ計算機である場合、自計算機を新たにマスタサーバ計算機として設定するマスタ設定手段と、優先順位情報に従って、自計算機より１つ順位が下のサーバから始まって順位が低くなる方向に順に通信を行うことにより障害のないサーバ計算機を１つ探す第２の探索動作を定期的に実行する第２のサーバ計算機探索手段と、自計算機がマスタサーバ計算機で、且つクライアント計算機から自計算機の保持するファイルのデータが変更された場合に、その変更されたデータを上記第２のサーバ計算機探索手段により見つけられた障害のないサーバ計算機にコピーする第１のコピー手段と、他のサーバ計算機からデータがコピーされた場合、そのデータを上記第２のサーバ計算機探索手段により見つけられた障害のないサーバ計算機にコピーする第２のコピー手段とを設けたことを特徴とする。
【００１５】
このような構成においては、クライアント計算機によりマスタサーバ計算機の持つファイルのデータが変更された場合、そのデータが、マスタサーバ計算機を除く障害のない全てのサーバ計算機（スレーブサーバ計算機）に、優先順位の並び順に先頭のサーバ計算機から最終のサーバ計算機まで各サーバ計算機を経由してコピーされる。つまりそのデータがマスタサーバ計算機から次の優先順位の並びのサーバ計算機にコピーされ、そのサーバ計算機から更に次の優先順位の並びのサーバ計算機にコピーされるというように、優先順位の並びが最後のサーバ計算機までディジーチェーン方式（リレー式）で順にコピーされる。このため、マスタサーバ計算機が他の各サーバ計算機（スレーブサーバ計算機）に１対ｎ通信方式により個々にデータコピーを行うのに比べて、速度は遅くなるものの、サーバ計算機の負荷は小さくて済み、障害に強く、より負荷に強い高可用性計算機システムが実現できる。
【００１６】
ここで、上記第２のサーバ計算機探索手段により見つけられた障害のないサーバ計算機をデータ送信先として設定するデータ送信先設定手段を設けるならば、上記第１及び第２のコピー手段のディジーチェーン方式によるデータコピーが、当該データ送信先設定手段の設定に従い効率的に行える。
【００１７】
また、上記第２のサーバ計算機探索手段により新たに障害のないサーバ計算機が見つけられた場合には、つまり障害から復旧したサーバ計算機が検出された場合には、そのサーバ計算機をデータ送信先としてデータ送信先設定手段により変更設定し、そのサーバ計算機に第１または第２のコピー手段により自計算機の保持する全てのファイルのデータをコピーするならば、そのサーバ計算機（復旧したサーバ計算機）を確実に且つ速やかにバックアップ計算機の１つとすることができる。
【００１８】
本発明の第３の観点に係る高可用性計算機システムは、第１のネットワークを介して接続される複数の第１のサーバ計算機と、第１のネットワークより低速な第２のネットワークを介して接続される複数の第２のサーバ計算機と、第１のネットワーク及び第２のネットワーク間に接続される第３のサーバ計算機とを備え、いずれか１台がマスタサーバ計算機となってクライアント計算機に対してサービスを提供し、当該マスタサーバ計算機に障害が発生した場合には、システム内の全計算機についてマスタとなる優先順位を示すと共にマスタが切り替わる毎に優先順位が循環使用される優先順位情報に従って、残りの複数のサーバ計算機のいずれかが新たにマスタサーバ計算機となって処理を引き継ぐ高可用性計算機システムであって、上記第１のサーバ計算機には、自計算機がマスタサーバ計算機で、且つクライアント計算機から自計算機の保持するファイルのデータが変更された場合に、その変更されたデータを、第１のネットワークに接続されている自計算機より優先順位が低く且つ障害のないサーバ計算機のうちの最も順位が高いサーバ計算機にコピーする第１のコピー手段と、他のサーバ計算機からデータがコピーされた場合、そのデータを、第１のネットワークに接続されている自計算機より優先順位が低く且つ障害のないサーバ計算機のうちの最も順位が高いサーバ計算機にコピーする第２のコピー手段とを備え、上記第２のサーバ計算機には、自計算機がマスタサーバ計算機で、且つクライアント計算機から自計算機の保持するファイルのデータが変更された場合に、その変更されたデータを、第２のネットワークに接続されている障害のない全てのサーバ計算機に個々にコピーする第３のコピー手段を備え、上記第３のサーバ計算機には、第１のサーバ計算機からデータがコピーされた場合に、そのデータを第２のネットワーク上の障害のない全ての第２のサーバ計算機に個々にコピーし、第２のサーバ計算機からデータがコピーされた場合に、そのデータを第１のネットワーク上の障害のない第１のサーバ計算機のうち優先順位が最も高い第１のサーバ計算機にコピーする第４のコピー手段を備えたことを特徴とする。
【００１９】
このような構成においては、高速ネットワークである第１のネットワーク上では、サーバ計算機の負荷が小さくて済むディジーチェーン方式によるデータバックアップが適用され、低速ネットワークである第２のネットワーク上では、各サーバ計算機のデータの一致化に要する時間が短くて済む１対ｎ通信方式によるデータバックアップが適用され、ネットワークの構成に柔軟に対応したシステムの構築が可能となる。
【００２０】
なお、以上の装置（高可用性計算機システム）に係る本発明は方法（高可用性計算機システムにおけるデータバックアップ方法）に係る発明としても成立する。
【００２１】
【発明の実施の形態】
以下、本発明の実施の形態につき図面を参照して説明する。
【００２２】
［第１の実施形態］
（概略構成）
図１は本発明の第１の実施形態に係る高可用性計算機システムの構成を示すブロック図である。
図１のシステムは、３台以上のサーバ計算機、例えば４台のサーバ計算機（以下、単にサーバと称する）Ｓ１，Ｓ２，Ｓ３，Ｓ４と、複数台（ここではｍ台）のクライアント計算機（以下、単にクライアントと呼ぶ）Ｃ１〜Ｃｍと、これら各サーバＳ１〜Ｓ４及びクライアントＣ１〜Ｃｍを接続するネットワークＮとから構成される。
【００２３】
サーバＳ１〜Ｓ４は、サービスを提供する１つのマスタサーバと、マスタサーバのバックアップ用となる複数のスレーブサーバに分かれる。図１の状態では、サーバＳ１がマスタサーバ、他のサーバＳ２〜Ｓ４がスレーブサーバ（バックアップサーバ）となっている。
【００２４】
クライアントＣ１〜Ｃｍは、マスタサーバ（Ｓ１）の提供するサービスを、ネットワークＮを通じて利用し、マスタサーバ（Ｓ１）の持つファイルに対し書き込みを行う。
【００２５】
マスタサーバ（Ｓ１）は、自身（自計算機）の持つファイル中のデータをスレーブサーバ（Ｓ２〜Ｓ４）にコピーすることにより、マスタサーバ（Ｓ１）とスレーブサーバ（Ｓ２〜Ｓ４）の持つファイルの内容を等しくする。これにより、図２に示すように、マスタサーバ（Ｓ１）に障害が発生した場合、スレーブサーバ（Ｓ２〜Ｓ４）のうちの１台、例えばスレーブサーバＳ２が新しくマスタサーバとなり、コピーされたデータを使い、それまでのマスタサーバ（Ｓ１）により提供されていたサービスを引き継ぎ、そのサービスの続きをクライアントＣ１〜Ｃｍに提供する。
以上が、本実施形態における高可用性計算機システムの概略構成である。
【００２６】
（サーバの内部構成）
次に、図１のシステムの中心をなすサーバＳ１〜Ｓ４の内部構成について、図３のブロック構成図を参照して説明する。
【００２７】
まず、サーバＳｉ，Ｓｊ（ｉ，ｊは１〜４、但しｉ≠ｊ）では、状態監視デーモン１１、データ受信デーモン１２、及びデータ送信デーモン１３の３つのデーモン（バックグラウンドで動作する処理手段）が動作するように構成されている。以下、サーバＳｉを例に、状態監視デーモン１１、データ受信デーモン１２、及びデータ送信デーモン１３の機能について説明する。
【００２８】
まずサーバＳｉ上の状態監視デーモン１１は、サーバＳｊ上の状態監視デーモン１１など、自身が存在するサーバＳｉ以外のすべてのサーバ上で動作している他の状態監視デーモン１１と定期的に通信を行う。この定期的な通信により、通信が行えないサーバが存在した場合、そのサーバに障害が発生したと判断することができる。
【００２９】
サーバＳｉ上の状態監視デーモン１１は、システム内のどのサーバが障害状態にあるかを内部状態として記憶する。そしてサーバＳｉ上の状態監視デーモン１１は、システム内の各サーバの状態をもとに、自サーバＳｉ上のデータ受信デーモン１２及びデータ送信デーモン１３に対し、どのサーバからデータを受信し、またどのサーバにデータを送信するかを指示する。
【００３０】
サーバＳｉ上のデータ受信デーモン１２は、サーバＳｊなど、他のサーバのデータ送信デーモン１３から送られてくるデータを受信し、自サーバＳｉのファイル蓄積手段である例えばディスク記憶装置（図示せず）に記録する、前記したように、受け取るべきデータの送信元サーバは、同じサーバＳｉ上の状態監視デーモン１１によって指定される。
【００３１】
サーバＳｉ上のデータ送信デーモン１３は、自サーバＳｉのディスク記憶装置上のデータを監視し、変更があったデータをサーバＳｊなど、他のサーバのデータ受信デーモン１２に送信する。前記したように、データを送信すべきサーバ（データの送信先サーバ）は、同じサーバＳｉ上の状態監視デーモン１１によって指定される。
【００３２】
次に、以上の構成のサーバＳ１〜Ｓ４を備えた高可用性計算機システムの動作について、１対ｎ通信方式によるバックアップを適用する場合を例に説明する。
【００３３】
（１対ｎ通信方式によるバックアップ）
まず、１対ｎ通信方式によるバックアップについて説明する。
今、図４に示すように、サーバＳ１がマスタサーバ、サーバＳ２〜Ｓ４がスレーブサーバとなっているものとする。この状態で、図１中のクライアントＣ１〜ＣｍのいずれかがマスタサーバＳ１の持つファイルに対してデータの書き込みを行った場合、当該マスタサーバＳ１は（自サーバのデータ送信デーモン１３により）、そのデータをスレーブサーバＳ２〜Ｓ４にコピー、つまりバックアップする。マスタサーバＳ１は、このマスタサーバＳ１からスレーブサーバＳ２〜Ｓ４へのデータのバックアップに１対ｎ通信方式によるバックアップを適用して、図４において符号４１〜４３で示すように、スレーブサーバＳ２〜Ｓ４に対し、ネットワークＮを介して同一のデータを個別に送信する。
【００３４】
（マスタサーバとスレーブサーバの基本動作）
次に、マスタサーバとスレーブサーバの基本動作について説明する。
まず図１のシステムでは、全てのサーバＳ１〜Ｓ４についてマスタとなる優先順位を予め定めておき、その優先順位の情報を各サーバＳ１〜Ｓ４の状態監視デーモン１１に記憶させるようにしている。優先順位は、各サーバの性能が異なる場合には、高速なサーバほど高く設定されるようにするとよい。優先順位の情報は、例えば図５に示すように、各サーバＳ１〜Ｓ４について循環した順位を示すもので、ここでは順位１（先頭順位）から順に、Ｓ１→Ｓ２→Ｓ３→Ｓ４→Ｓ１→Ｓ２→…となっている。また、システム内で現在マスタとなっているサーバ（の識別情報）も、各サーバＳ１〜Ｓ４の状態監視デーモン１１に記憶される。初期起動時は、順位１のサーバ（図５の例ではサーバＳ１）がマスタとして記憶される。
【００３５】
なお、優先順位情報をＳ１，Ｓ２，Ｓ３，Ｓ４（の４つ）だけで構成し、その並び順自体を、例えばＳ１→Ｓ２→Ｓ３→Ｓ４からＳ２→Ｓ３→Ｓ４→Ｓ１へ、更にＳ３→Ｓ４→Ｓ１→Ｓ２へと、動的に循環させるようにしてもよい。この場合、優先順位情報自体が現在マスタとなっているサーバの情報を保持していることになる。また、優先順位情報をＳ１，Ｓ２，Ｓ３，Ｓ４（の４つ）だけで構成すると共に、その並び順を固定し、マスタの位置を示すポインタを優先順位情報上でサイクリックに移動するようにしてもよい。
【００３６】
さて、各サーバＳ１〜Ｓ４の状態監視デーモン１１は、データ受信及び送信を行うべき相手サーバを次のようにして決定する。
まず初期起動時は、図５に示す優先順位情報で決まる順位１のサーバ、即ちサーバＳ１がマスタサーバとなる。
一方、マスタサーバでないサーバＳ２〜Ｓ４（の状態監視デーモン１１）は、図６のフローチャートに示す手順で、その時点で優先順位の最も高いサーバ（サーバＳ１）から始まって順位が低くなる方向に、自身以外のサーバ（の状態監視デーモン１１）に対して順に通信を行っていき、自分がマスタであるという返事を返すサーバを探す（ステップ６１〜６４）。ここでは、各サーバＳ２〜Ｓ４（の状態監視デーモン１１）は、サーバＳ１からマスタであるという返事を受け取ることになる。
【００３７】
サーバＳ２〜Ｓ４の状態監視デーモン１１は、マスタであるという返事を返すサーバ（Ｓ１）を見つけたなら（ステップ６２）、そのサーバ（Ｓ１）をマスタサーバとして記憶すると共に、自サーバ内のデータ受信デーモン１２に知らせる（ステップ６５）。
【００３８】
これに対し、サーバＳ１に障害が発生している場合など、全てのサーバを探してもマスタサーバが見つからない場合には（ステップ６２，６３）、障害が発生していないサーバの中で自身が一番優先順位が高いならば（ステップ６６）、自身がマスタサーバとなる（ステップ６７）。
ここでは、初期起動時において優先順位が最も高いサーバＳ１に障害は発生しておらず、図８に示すように当該サーバＳ１がマスタサーバとなるものとする。
【００３９】
この場合、マスタとなったサーバ（マスタサーバ）Ｓ１の状態監視デーモン１１は、図７のフローチャートに示す手順で、自身より１つ順位が下のサーバ（Ｓ２）から、２つ下のサーバ（Ｓ３）、３つ下のサーバ（Ｓ４）と、順位が低くなる方向に順に通信を行っていき、障害が発生していないサーバを全て探す（ステップ７１〜７５）。
【００４０】
もし、優先順位情報上で自身の１巡後の順位（図５の例では、順位５）の１つ手前の順位（図５では順位４）まで探しても障害が発生していないサーバを見つけられなければ（ステップ７４，７６）、マスタサーバＳ１の状態監視デーモン１１は、自サーバのデータ送信デーモン１３に動きを停止するように伝える（ステップ７７）。一方、障害が発生していないサーバを見つけたならば（ステップ７２）、マスタサーバＳ１の状態監視デーモン１１は、そのサーバをデータ送信先として自身のデータ送信デーモン１３に知らせる（ステップ７３）。
【００４１】
このようにすることによって、マスタサーバＳ１は障害の起きていないサーバを全て検出し、その障害の起きていない全てのサーバに対して自サーバのデータ送信デーモン１３から先に述べた１対ｎ通信方式により個別にデータを送る（コピーする）ことができる。
【００４２】
ここでは、図８に示すように、マスタサーバＳ１以外のサーバのうち、つまりスレーブサーバＳ２，Ｓ３，Ｓ４のうち、サーバＳ２に障害が発生しているものとすると（障害サーバには×印を付してある）、マスタサーバＳ１（のデータ送信デーモン１３）からは、図８において符号８１，８２で示すように、スレーブサーバＳ３，Ｓ４に対してのみ、個別にデータが送られる（コピーされる）。上述したマスタサーバを含む各サーバ上の状態監視デーモン１１の動作は、定期的に行われる。
【００４３】
（障害発生時の動作）
次に、このような状態で、サーバに障害が発生した場合の動作を説明する。まず、図９において符号９０で示すように、マスタサーバＳ１に障害が発生したものとする。このマスタサーバＳ１の障害発生は、図６のフローチャートの示すアルゴリズムに従い、他の正常なサーバ、つまりスレーブサーバＳ３，Ｓ４で検出される。この場合、障害が発生していないサーバＳ３，Ｓ４の中で、その時点の優先順位がマスタサーバＳ１の次に高い（順位３の）サーバＳ３、即ち優先順位が高い方のサーバＳ３が、当該マスタサーバＳ１の障害検出に応じて、図９に示すように新たにマスタサーバとなる。すると、図５の優先順位情報から明らかなように、各サーバＳ１〜Ｓ４の優先順位は、高い方からＳ３（順位３）→Ｓ４（順位４）→Ｓ１（順位５）→Ｓ２（順位６）となる。
【００４４】
新たにマスタとなったサーバＳ３の状態監視デーモン１１は、図９において符号９１，９２，９３で示すように、自身より１つ順位が下のサーバ（Ｓ４）から、２つ下のサーバ（Ｓ１）、３つ下のサーバ（Ｓ２）と、順位が低くなる方向に順に通信を行っていき、障害が発生していないサーバを全て探す。図９の例では、サーバＳ４だけが障害が発生していないサーバとして検出され、新たなマスタサーバＳ３から当該サーバ（スレーブサーバ）Ｓ４へのデータコピーが行われることになる。
【００４５】
これに対し、図８の状態で、スレーブサーバＳ３，Ｓ４、即ちバックアップサーバＳ３，Ｓ４のいずれかに障害が発生した場合には、マスタサーバＳ１の状態監視デーモン１１は、自サーバのデータ送信デーモン１３から障害が発生したサーバヘの送信を停止する。
【００４６】
（復旧時の動作）
次に、障害で停止していたサーバが復旧した場合の動作について説明する。今、図９に示すように障害で停止していたサーバＳ１が、図１０において符号１００で示すように復旧したものとする。
【００４７】
すると、マスタサーバＳ３の状態監視デーモン１１は、定期的な監視動作により、サーバＳ１が復旧したことを検出する。この場合、マスタサーバＳ３の状態監視デーモン１１は、自サーバのデータ送信デーモン１３に対し、データ送信先としてサーバＳ１を追加指定する。
【００４８】
一方、復旧したサーバＳ１の状態監視デーモン１１は、自サーバのデータ受信デーモン１２に対し、データ受信先（データ送信元）として現在のマスタサーバＳ３を指定する。そして、サーバＳ１の受信先となるマスタサーバＳ３の全データが、図１０において符号１０１で示すように、当該サーバＳ１にコピーされ、システム内の他のサーバのデータとの一致化が図られる。
【００４９】
以後、マスタサーバＳ３は、図１中のクライアントＣ１〜Ｃｍのいずれかが当該マスタサーバＳ３の持つファイルに対してデータの書き込みを行った場合、図１０において符号１０２，１０３で示すように、そのデータをサーバ（スレーブサーバ）Ｓ４，Ｓ１に順にコピーする。
【００５０】
［第２の実施形態］
以上に述べた第１の実施形態では、１対ｎ通信方式によるバックアップを適用するものとしたが、これに限るものではなく、例えばディジーチェーン方式によるバックアップを適用することも可能である。
【００５１】
そこで、ディジーチェーン方式によるバックアップを適用した本発明の第２の実施形態に係る高可用性計算機システムについて、図面を参照して説明する。なお、システム構成は便宜的に図１及び図３を援用するものとする。
【００５２】
（ディジーチェーン方式によるバックアップ）
まず、ディジーチェーン方式によるバックアップについて説明する。
今、図１１に示すように、サーバＳ１がマスタサーバ、サーバＳ２〜Ｓ４がスレーブサーバとなっているものとする。この状態で、図１中のクライアントＣ１〜ＣｍのいずれかがマスタサーバＳ１の持つファイルに対してデータの書き込みを行った場合、そのデータをスレーブサーバＳ２〜Ｓ４にコピー、つまりバックアップする動作が行われる。本実施形態では、このバックアップにディジーチェーン方式によるバックアップが次のように適用される。
【００５３】
ここでは、まずマスタサーバＳ１（のデータ送信デーモン１３）からスレーブサーバＳ２〜Ｓ４のうちの例えばサーバＳ２に、図１１において符号１１１で示すようにデータがコピーされる。次に、そのスレーブサーバＳ２（のデータ送信デーモン１３）から他の例えばスレーブサーバＳ３に、図１１において符号１１２で示すように上記データがコピーされる。そして、そのスレーブサーバＳ３（のデータ送信デーモン１３）から残りのスレーブサーバＳ４に、図１１において符号１１３で示すように上記データがコピーされる。
【００５４】
このように、デイジーチェーンによるバックアップ方式では、マスタサーバからスレーブサーバのうちの１台にデータをコピーし、次に、そのスレーブサーバから他のスレーブサーバにデータをコピーする、というように、マスタサーバから始まってリレー式でデータコピーが繰り返されて、全てのスレーブサーバにデータがコピーされる。
【００５５】
（マスタサーバとスレーブサーバの基本動作）
次に、マスタサーバとスレーブサーバの基本動作について説明する。
まず、全てのサーバＳ１〜Ｓ４についてマスタとなる優先順位を予め定めておき、その優先順位の情報を各サーバＳ１〜Ｓ４の状態監視デーモン１１に記憶させておく点と、システム内で現在マスタとなっているサーバ（の識別情報）を各サーバＳ１〜Ｓ４の状態監視デーモン１１に記憶させる点は、前記実施形態と同様である。
【００５６】
さて、各サーバＳ１〜Ｓ４の状態監視デーモン１１は、データ受信及び送信を行うべき相手サーバを次のようにして決定する。
まず初期起動時は、図５に示す優先順位情報で決まる順位１のサーバ、即ちサーバＳ１がマスタサーバとなる。
一方、マスタサーバでないサーバＳ２〜Ｓ４（の状態監視デーモン１１）は、図１２のフローチャートに示す手順で、自身より１つ順位が上のサーバから始まって、２つ順位が上のサーバ、３つ順位が上のサーバへと、順位が高くなる方向にマスタサーバＳ１まで順に通信を行っていき、障害が発生していないサーバを１つ探す（ステップ１２１〜１２４）。
【００５７】
サーバＳ２〜Ｓ４（の状態監視デーモン１１）は、障害が発生していないサーバを１つ見つけることができたなら（ステップ１２２）、上記の通信を終了すると共に、そのサーバを自サーバのデータ受信デーモン１２に知らせる（ステップ１２５）。
【００５８】
またサーバＳ２〜Ｓ４（の状態監視デーモン１１）は、障害が発生していないサーバを見つける前に、マスタサーバ（Ｓ１）に障害が発生していることを検出したならば（ステップ１２２，１２３）、その障害発生を検出したサーバが直ちにマスタサーバになる（ステップ１２６）。
【００５９】
以上の通信の後、マスタサーバ（Ｓ１）、及びスレーブサーバ（Ｓ２〜Ｓ４）のどちらも（自サーバの状態監視デーモン１１により）、図１３のフローチャートに示す手順で、自身より１つ順位が下のサーバから始まって、２つ順位が下のサーバ、３つ順位が下のサーバへと、順位が低くなる方向に、現時点における最下位のサーバまで順に通信を行っていき、障害が発生していないサーバを１つ探す（ステップ１３１〜１３４）。ここで図５の優先順位情報上で、順位４のサーバＳ４より１つ順位が下のサーバ、つまり順位５のサーバはサーバＳ１である。しかし、このサーバＳ１は現在順位１のマスタサーバであることから、順位５は当該マスタサーバＳ１自身の１巡後の順位であり、それより１つ手前の順位（順位４）のサーバＳ４が現時点で最下位のサーバであることが分かる。このためサーバＳ４は通信を行わない。
【００６０】
各サーバ（Ｓ１〜Ｓ３）は、１つ順位が下のサーバから始まって優先順位情報上で現在のマスタサーバ（Ｓ１）の１つ手前のサーバ（Ｓ４）まで探しても、つまり現マスタサーバ自身の１巡後の順位（順位５）の１つ手前（順位４）まで探しても、障害が発生していないサーバが見つからなければ（ステップ１３３，１５）、自サーバのデータ送信デーモン１３に動きを停止するように伝える（ステップ１３６）。
【００６１】
一方、各サーバ（Ｓ１〜Ｓ３）は、障害が発生していないサーバを１つ見つけることができたなら（ステップ１３２）、上記の通信を終了すると共に、そのサーバを自サーバのデータ送信デーモン１３に知らせる（ステップ１３７）。
【００６２】
このようにすることによって、図１４に示すように、サーバＳ２に障害が発生しているものとすると（障害サーバには×印を付してある）、マスタサーバＳ１のデータ送信デーモン１３にはＳ３が設定され、サーバＳ３のデータ受信デーモン１２にはＳ１が、データ送信デーモン１３にはＳ４がそれぞれ設定され、そしてサーバＳ４のデータ受信デーモン１２にはＳ３が設定される。
【００６３】
以後、図１４の状態においてマスタサーバＳ１でデータの変更があった場合、まず符号１４１に示すように、マスタサーバＳ１（のデータ送信デーモン１３）からスレーブサーバＳ３の（データ受信デーモン１２）にデータが送られてコピーされる。そして、そのデータが、図１４において符号１４２に示すように、スレーブサーバＳ３（のデータ送信デーモン１３）からスレーブサーバＳ４の（データ受信デーモン１２）に送られてコピーされる。
【００６４】
このように本実施形態では、マスタサーバから障害が発生していない全てのスレーブサーバに、マスタになる優先順位の順番で各スレーブサーバを亘ってディジーチェーン方式（リレー式）でデータが送られる。
【００６５】
（障害発生時の動作）
次に、このような状態で、サーバに障害が発生した場合の動作を説明する。まず、図１５において符号１５０で示すように、マスタサーバＳ１に障害が発生したものとする。このマスタサーバＳ１の障害発生は、図１２のフローチャートに示すアルゴリズムに従い、他の正常なスレーブサーバＳ３，Ｓ４のうち、その時点の優先順位がマスタサーバＳ１の次に高い（順位３の）サーバＳ３、即ち優先順位が高い方のサーバＳ３で最初に検出される。この場合、サーバＳ３が図１５に示すように新たにマスタサーバとなり、それまでマスタとなっていたサーバＳ１の処理を引き継ぐ。この新たなマスタサーバＳ３（のデータ受信デーモン１２）には、データ受信先（データ送信元）としてサーバＳ１が設定されていたが、その設定が解除される。ここではデータのコピーは、図１５において符号１５１で示すように、サーバＳ３からサーバＳ４に対してだけ行われる。
【００６６】
これに対し、スレーブサーバ（バックアップサーバ）に障害が発生した場合には、次のようになる。
まず、障害の発生したスレーブサーバより優先順位の高いサーバのうち、最も優先順位の低いサーバ（Ａとする）のデータ送信先が、障害の発生したスレーブサーバより優先順位の低いサーバのうち、最も優先順位の高いサーバ（Ｂとする）に変更され、逆にＢのデータ受信先（データ送信元）はＡに変更される。もしＢがマスタサーバであれば、Ａのデータ送信デーモン１３が停止する。
【００６７】
したがって、図１４の状態で、例えば図１６において符号１６０で示すようにスレーブサーバＳ３に障害が発生した場合には、マスタサーバＳ１のデータ送信先がＳ３からＳ４に変更され、スレーブサーバＳ４のデータ受信先（データ送信元）がＳ３からＳ１に変更される。この場合、データのコピーは、図１６において符号１６１で示すように、マスタサーバＳ１からスレーブサーバＳ４に対してだけ行われる。
【００６８】
（復旧時の動作）
次に、障害で停止していたサーバが復旧した場合の動作について説明する。この場合、復旧したサーバよりも優先順位の高いサーバのうち、最も優先順位の低いサーバのデータ送信先が、復旧したサーバに変更される。また、復旧したサーバよりも優先順位の低いサーバのうち、最も優先順位の高いサーバがマスタサーバでないならば、このサーバのデータ受信先（送信元）が復旧したサーバに変更される。
【００６９】
したがって、図１５に示すように障害で停止していたサーバＳ１が、図１７において符号１７０で示すように（スレーブサーバとして）復旧した場合であれば、復旧したサーバＳ１よりも優先順位の高いサーバのうち、最も優先順位の低いサーバＳ４のデータ送信先として、復旧したサーバＳ１が新たに設定される。ここでは、復旧したサーバＳ１よりも優先順位の低い正常なサーバは存在しないため、データ受信先（送信元）が変更されるサーバは存在しない。また、復旧したサーバＳ１のデータ受信先はサーバＳ４に設定される。そして、サーバＳ１の受信先となるサーバＳ４の全データが、図１７において符号１７１で示すように、当該サーバＳ１にコピーされ、システム内の他のサーバのデータとの一致化が図られる。
【００７０】
以後、図１７の状態においてマスタサーバＳ３でデータの変更があった場合のデータバックアップの手順は次のようになる。まず、図１７において符号１７２に示すように、マスタサーバＳ３からスレーブサーバＳ４に変更のあったデータがコピーされる。次に、そのデータが、図１７において符号１７３に示すように、スレーブサーバＳ４から復旧したスレーブサーバＳ１にコピーされる。
以上、障害で停止していたサーバの復旧時の動作を、復旧したサーバよりも優先順位の低い正常なサーバが存在しない場合を例に説明した。
【００７１】
次に、復旧したサーバよりも優先順位の低い正常なサーバが存在する場合のサーバ復旧時の動作の具体例について説明する。
【００７２】
今、図１４に示す状態で障害により停止していたサーバＳ２が、図１８において符号１８０で示すように（スレーブサーバとして）復旧したものとする。この場合、復旧したサーバＳ２よりも優先順位の高いサーバのうち、最も優先順位の低いサーバはマスタサーバＳ１であることから、当該サーバＳ１のデータ送信先がスレーブサーバＳ３から復旧したスレーブサーバＳ２に変更される。また、復旧したサーバＳ２よりも優先順位の低いサーバのうち、最も優先順位の高いサーバＳ３がマスタサーバでないことから、このサーバＳ３のデータ受信先（送信元）がマスタサーバＳ１から復旧したサーバＳ２に変更される。また、復旧したサーバＳ２のデータ受信先はサーバＳ１に、データ送信先はサーバＳ３に設定される。そして、サーバＳ２の受信先となるサーバＳ１（ここではマスタサーバＳ１）の全データが、図１８において符号１８１で示すように、当該サーバＳ２にコピーされ、システム内の他のサーバのデータとの一致化が図られる。
【００７３】
以後、図１８の状態においてマスタサーバＳ１でデータの変更があった場合のデータバックアップの手順は次のようになる。まず、図１８において符号１８２に示すように、マスタサーバＳ１から復旧したスレーブサーバＳ２に変更のあったデータがコピーされる。次に、そのデータが、図１８において符号１８３に示すように、スレーブサーバＳ２からスレーブサーバＳ３にコピーされる。そして、そのデータが、図１８において符号１８４に示すように、スレーブサーバＳ３からスレーブサーバＳ４にコピーされる。
【００７４】
［第３の実施形態］
次に本発明の第３の実施形態に係る高可用性計算機システムについて、図１９のブロック構成図を参照して説明する。
同図において、高速なネットワークであるＬＡＮ（ローカルエリアネットワーク）２１には複数のサーバＳ１１〜Ｓ１４が接続されている。また、低速なネットワークであるＷＡＮ（ワールドエリアネットワーク）２２にはサーバＳ１４〜Ｓ１７が接続されている。本実施形態において、サーバＳ１４は、ＬＡＮ２１及びＷＡＮ２２を相互接続するために設けられたもので、後述するように、ＬＡＮ２１側からＷＡＮ２２側へと、ＷＡＮ２２側からＬＡＮ２１側へのデータのコピー（バックアップ）を司る。
【００７５】
この図１９のシステムの特徴は、ＬＡＮ２１により接続されたサーバＳ１１〜Ｓ１４同士のバックアップにはディジーチェーン方式を適用し、ＷＡＮ２２により接続されたサーバＳ１４〜Ｓ１７同士のバックアップには１対ｎ通信方式を適用し、サーバＳ１４がその両方式の混在を可能とするインタフェースをなす点にある。ここで、少なくともＬＡＮ２１上のサーバＳ１４〜Ｓ１３では、自身がスレーブサーバの場合にも、所定のアプリケーションプログラムが動作して、固有の処理が行えるようになっているものとする。
【００７６】
さて、デイジーチェーン方式の長所は、１対ｎ通信方式と比較した場合、マスタサーバの負荷を低くすることができる点にある。逆に、１対ｎ通信方式の長所は、各スレーブサーバ（バックアップサーバ）の情報の一致が速いという点にある。そこで、高遠ＬＡＮ２１に接続されてアプリケーションが実際に動いているサーバ同士（サーバＳ１１〜Ｓ１３）では、バックアップにディジーチェーン方式を適用することで、アプリケーションの動作を妨げずに運用する。
【００７７】
しかし、低速なネットワークとしてのＷＡＮ２２に接続されているサーバ同士（サーバＳ１５〜Ｓ１７）では、バックアップにディジーチェーン方式を使うと、データのコピーに要する時間が長くなり、各サーバの持つデータの一致化が遅れて、各サーバ間でデータの不一致の度合いが大きくなってしまう。
【００７８】
そこで、ＬＡＮ２１とＷＡＮ２２との間にＬＡＮ２１側からＷＡＮ２２側へと、ＷＡＮ２２側からＬＡＮ２１側へのデータのコピーを司る機能を持つ専用サーバＳ１４を置いて、ＬＡＮ２１側からＷＡＮ２２側のサーバ（Ｓ１５〜Ｓ１７）にデータをコピーする必要がある場合には、そのデータを当該サーバＳ１４で受け取って、当該サーバＳ１４からＷＡＮ２２上の各サーバ（Ｓ１５〜Ｓ１７）に１対ｎ通信方式でコピーする。また、ＷＡＮ２２側からＬＡＮ２１側のサーバ（Ｓ１１〜Ｓ１３）にデータをコピーする必要がある場合には、そのデータを当該サーバＳ１４で受け取って、当該サーバＳ１４からＬＡＮ２１上の最も優先順位の高いサーバ（Ｓ１５〜Ｓ１７）にデータをコピーする。そして、そのサーバからＬＡＮ２１上の他のサーバに、優先順位に従ってディジーチェーン方式でデータが順にコピーする。
【００７９】
次に、図１９のシステムにおけるデータコピー（データバックアップ）の具体例を説明する。ここでは、優先順位がＳ１１→Ｓ１２→Ｓ１３→Ｓ１４→Ｓ１５→Ｓ１６→Ｓ１７の順であり、サーバＳ１１がマスタサーバであるものとする。
【００８０】
まず、マスタサーバＳ１１からサーバ（スレーブサーバ）Ｓ１２に、図１９において符号１９１で示すように、ＬＡＮ２１を介してデータがコピーされる。次に、そのデータが、図１９において符号１９２で示すように、サーバＳ１２からサーバＳ１３にＬＡＮ２１を介してコピーされる。次に、そのデータが、図１９において符号１９３で示すように、サーバＳ１３からサーバＳ１４にＬＡＮ２１を介してコピーされる。サーバＳ１４は、サーバＳ１３からのデータを１対ｎ通信方式により、図１９において符号１９４，１９５，１９６に示すように、ＷＡＮ２２上の他のサーバＳ１５，Ｓ１６，Ｓ１７に順にコピーする。なお、ＬＡＮ２１上にサーバＳ１４より優先順位が低いサーバが存在する場合には、サーバＳ１４は（ディジーチェーン方式のバックアップを適用するＬＡＮ２１上のサーバとして）、そのうちの最も優先順位が高いサーバにもデータをコピーする。
【００８１】
ＷＡＮ２２側からＬＡＮ２１側へのデータのコピーの場合にもデータの方向が逆になる点を除けば上記と同様である。以下、ＷＡＮ２２側からＬＡＮ２１側へのデータコピーの具体例を、図２０に示すように、優先順位がＳ１５→Ｓ１６→Ｓ１７→Ｓ１１→Ｓ１２→Ｓ１３→Ｓ１４の順であり、サーバＳ１５がマスタサーバである場合を例に説明する。
【００８２】
まず、ＷＡＮ２２上のマスタサーバＳ１５から当該ＷＡＮ２２上の他のサーバ（スレーブサーバ）Ｓ１６，Ｓ１７，Ｓ１４に、図２０において符号２０１，２０２，２０３で示すように、１対ｎ通信方式により同一データがＷＡＮ２２を介して順にコピーされる。次に、そのデータが、図２０において符号２０４で示すように、サーバＳ１４からＬＡＮ２１上の（当該サーバＳ１４を除いて）最も優先順位が高いサーバＳ１１にコピーされる。次に、そのデータが、図２０において符号２０５で示すように、サーバＳ１１から（次の優先順位の）サーバＳ１２にＬＡＮ２１を介してコピーされる。次に、そのデータが、図２０において符号２０６で示すように、サーバＳ１２から（次の優先順位の）サーバＳ１３にＬＡＮ２１を介してコピーされる。
【００８３】
その後、上記データを、サーバＳ１３から（次の優先順位の）サーバＳ１４にコピーしても構わないが、本実施形態ではＷＡＮ２２側のサーバがマスタとなっているため、サーバＳ１４へのデータコピーは行わない。その理由は、ＷＡＮ２２側のサーバがマスタとなっている場合、上記データはサーバＳ１４からＬＡＮ２１上のサーバにコピーされたものであり、当該サーバＳ１４上に既に存在するためである。なお、サーバＳ１４がマスタの場合、サーバＳ１４は、ＬＡＮ２１上の自身を除いて最も優先順位が高いサーバ（ここではサーバＳ１１）にデータをコピーすると共に、ＷＡＮ２２上の他のサーバＳ１５〜Ｓ１７にデータを順にコピーする。
【００８４】
このように本実施形態では、高速なＬＡＮにより接続されたサーバと低速なＷＡＮにより接続されたサーバとが混在するシステムにおいて、ＬＡＮとＷＡＮとの間のデータコピーを司る専用サーバを設けると共に、高速ＬＡＮ上ではディジーチェーン方式を、低速ＷＡＮ上では１対ｎ通信方式を適用することで、ネットワークの構成に柔軟に対応したシステムを構築することが可能である。
【００８５】
【発明の効果】
以上詳述したように本発明によれば、３台以上のサーバ計算機を用いてバックアップサーバ計算機を複数確保し、その複数のバックアップサーバ計算機に対する効果的なデータコピーを行うことで、より障害に強い高可用性計算機システム、更には負荷に強い高可用性計算機システムが構築できる。
【００８６】
また本発明によれば、高速ネットワークと低速ネットワークによって複数のサーバ計算機を連携させ、各ネットワークに適したデータバックアップ方式を併用することにより、ネットワーク構成に柔軟に対応した効果的なデータバックアップが実現でき、より効率のよい高可用性計算機システムが構築できる。
【図面の簡単な説明】
【図１】本発明の第１の実施形態に係る高可用性計算機システムの構成を示すブロック図。
【図２】同実施形態においてマスタサーバに障害が発生した場合のサービスの引き継ぎを説明するための図。
【図３】同実施形態における各サーバの内部構成を示すブロック図。
【図４】同実施形態で適用される１対ｎ通信方式によるデータバックアップを説明するための図。
【図５】同実施形態で適用されるマスタとなる優先順位を説明するための図。
【図６】同実施形態におけるスレーブサーバ（の状態監視デーモン１１）の動作手順を説明するためのフローチャート。
【図７】同実施形態におけるマスタサーバ（の状態監視デーモン１１）の動作手順を説明するためのフローチャート。
【図８】図１のシステムにおけるマスタサーバＳ１の基本動作をサーバＳ２に障害が発生している場合を例に説明するための図。
【図９】図８の状態でマスタサーバＳ１に障害が発生してサーバＳ３が新たにマスタサーバとなった場合の動作を説明するための図。
【図１０】図９の状態でサーバＳ１が復旧した場合の動作を説明するための図。
【図１１】本発明の第２の実施形態に係る高可用性計算機システムで適用されるディジーチェーン方式によるデータバックアップを説明するための図。
【図１２】同第２の実施形態におけるスレーブサーバ（の状態監視デーモン１１）の動作手順を説明するためのフローチャート。
【図１３】同第２の実施形態におけるマスタサーバ及びスレーブサーバ（の状態監視デーモン１１）の動作手順を説明するためのフローチャート。
【図１４】同第２の実施形態における各サーバの基本動作をサーバＳ２に障害が発生している場合を例に説明するための図。
【図１５】図１４の状態でマスタサーバＳ１に障害が発生してサーバＳ３が新たにマスタサーバとなった場合の動作を説明するための図。
【図１６】図１４の状態でスレーブサーバＳ３に障害が発生した場合の動作を説明するための図。
【図１７】図１５の状態でサーバＳ１が復旧した場合の動作を説明するための図。
【図１８】図１４の状態でサーバＳ２が復旧した場合の動作を説明するための図。
【図１９】本発明の第３の実施形態に係る高可用性計算機システムで適用される１対ｎ通信方式とディジーチェーン方式併用によるデータバックアップを、ＬＡＮ２１上のサーバＳ１１がマスタの場合を例に説明するための図。
【図２０】同第３の実施形態においてＷＡＮ２２上のサーバＳ１５がマスタの場合のデータバックアップを説明するための図。
【符号の説明】
Ｓ１〜Ｓ４…サーバ（サーバ計算機）
Ｓ１１〜Ｓ１３…サーバ（第１のサーバ計算機）
Ｓ１４…サーバ（第３のサーバ計算機）
Ｓ１５〜Ｓ１７…サーバ（第２のサーバ計算機）
Ｎ…ネットワーク
１１…状態監視デーモン（マスタ探索手段、マスタ設定手段、サーバ計算機探索手段、第１のサーバ計算機探索手段、第２のサーバ計算機探索手段、データ送信先設定手段）
１２…データ受信デーモン
１３…データ送信デーモン（コピー手段、第１のコピー手段、第２のコピー手段、第３のコピー手段、第４のコピー手段）
２１…ＬＡＮ（ローカルエリアネットワーク、第１のネットワーク）
２２…ＷＡＮ（ワイドエリアネットワーク、第２のネットワーク）

Claims

第１のネットワークを介して接続される複数の第１のサーバ計算機と、前記第１のネットワークより低速な第２のネットワークを介して接続される複数の第２のサーバ計算機と、前記第１のネットワーク及び前記第２のネットワーク間に接続される第３のサーバ計算機とを備え、いずれか１台がマスタサーバ計算機となってクライアント計算機に対してサービスを提供し、当該マスタサーバ計算機に障害が発生した場合には、システム内の全計算機についてマスタとなる優先順位を示すと共にマスタが切り替わる毎に優先順位が循環使用される優先順位情報に従って、残りの複数のサーバ計算機のいずれかが新たにマスタサーバ計算機となって処理を引き継ぐ高可用性計算機システムであって、
前記第１のサーバ計算機は、
自計算機がマスタサーバ計算機で、且つクライアント計算機から自計算機の保持するファイルのデータが変更された場合に、その変更されたデータを、前記第１のネットワークに接続されている自計算機より優先順位が低く且つ障害のないサーバ計算機のうちの最も順位が高いサーバ計算機にコピーする第１のコピー手段と、他のサーバ計算機からデータがコピーされた場合、そのデータを、前記第１のネットワークに接続されている自計算機より優先順位が低く且つ障害のないサーバ計算機のうちの最も順位が高いサーバ計算機にコピーする第２のコピー手段とを備え、
前記第２のサーバ計算機は、
自計算機がマスタサーバ計算機で、且つクライアント計算機から自計算機の保持するファイルのデータが変更された場合に、その変更されたデータを、前記第２のネットワークに接続されている障害のない全てのサーバ計算機に個々にコピーする第３のコピー手段を備え、
前記第３のサーバ計算機は、
前記第１のサーバ計算機からデータがコピーされた場合には、そのデータを前記第２のネットワーク上の障害のない全ての前記第２のサーバ計算機に個々にコピーし、前記第２のサーバ計算機からデータがコピーされた場合には、そのデータを前記第１のネットワーク上の障害のない前記第１のサーバ計算機のうち優先順位が最も高い第１のサーバ計算機にコピーする第４のコピー手段を備えていることを特徴とする高可用性計算機システム。
第１のネットワークを介して接続される複数の第１のサーバ計算機と、前記第１のネットワークより低速な第２のネットワークを介して接続される複数の第２のサーバ計算機と、前記第１のネットワーク及び前記第２のネットワーク間に接続される第３のサーバ計算機とを備え、いずれか１台がマスタサーバ計算機となってクライアント計算機に対してサービスを提供し、当該マスタサーバ計算機に障害が発生した場合には、システム内の全計算機についてマスタとなる優先順位を示すと共にマスタが切り替わる毎に優先順位が循環使用される優先順位情報に従って、残りの複数のサーバ計算機のいずれかが新たにマスタサーバ計算機となって処理を引き継ぐ高可用性計算機システムにおけるデータバックアップ方法であって、
前記第１のサーバ計算機がマスタサーバ計算機で、且つクライアント計算機から当該第１のサーバ計算機の保持するファイルのデータが変更された場合に、その変更されたデータを、前記第１のネットワークに接続されている当該第１のサーバ計算機より優先順位が低く且つ障害のないサーバ計算機のうちの最も順位が高いサーバ計算機に当該第１のサーバ計算機がコピーするステップと、
前記第１のサーバ計算機に他のサーバ計算機からデータがコピーされた場合、そのデータを、前記第１のネットワークに接続されている当該第１のサーバ計算機より優先順位が低く且つ障害のないサーバ計算機のうちの最も順位が高いサーバ計算機に当該第１のサーバ計算機がコピーするステップと、
前記第２のサーバ計算機がマスタサーバ計算機で、且つクライアント計算機から当該第２のサーバ計算機の保持するファイルのデータが変更された場合に、その変更されたデータを、前記第２のネットワークに接続されている障害のない全てのサーバ計算機に当該第２のサーバ計算機が個々にコピーするステップと、
前記第１のサーバ計算機から前記第３のサーバ計算機にデータがコピーされた場合には、そのデータを前記第２のネットワーク上の障害のない全ての前記第２のサーバ計算機に当該第３のサーバ計算機が個々にコピーするステップと、
前記第２のサーバ計算機から前記第３のサーバ計算機にデータがコピーされた場合には、そのデータを前記第１のネットワーク上の障害のない前記第１のサーバ計算機のうち優先順位が最も高い第１のサーバ計算機に当該第３のサーバ計算機がコピーするステップと
を具備することを特徴とする高可用性計算機システムにおけるデータバックアップ方法。