WO2014080492A1

WO2014080492A1 - 計算機システム、クラスタ管理方法、及び管理計算機

Info

Publication number: WO2014080492A1
Application number: PCT/JP2012/080326
Authority: WO
Inventors: 洋司大西; 記弘仲; 高本　良史
Original assignee: 株式会社日立製作所
Priority date: 2012-11-22
Filing date: 2012-11-22
Publication date: 2014-05-30
Also published as: US9201740B2; US20150254143A1

Abstract

　障害が発生した現用系サーバから予備系サーバへの高速な切替処理を実現するシステム及び方法を提供する。　複数の計算機と、複数の計算機から構成されるクラスタを管理する管理計算機と、を備える計算機システムであって、クラスタは、記憶デバイスを用いて業務を実行する複数の第１の計算機と、業務を引き継ぐ複数の第２の計算機とを含み、管理計算機は、バックアップ取得部と、リストアペア管理部とを有し、リストアペア管理部は、複数の第１の計算機を、業務を提供するためのソフトウェア構成が共通する複数のグループに分類し、複数のグループ毎に、一つのグループに含まれる一つ以上の第１の計算機と、少なくとも一つ以上の第２の計算機とを対応づけることによって、一つ以上のリストアペアを生成し、一つのリストアペアに含まれる一つ以上の第１の計算機のバックアップイメージの中から共通イメージを決定する。

Description

計算機システム、クラスタ管理方法、及び管理計算機

　本発明は、クラスタが構成された計算機システムにおいて、障害発生時に、計算機の切り替えの高速化を実現するシステム、方法、及び計算機に関する。

　計算機システムの可用性を確保するために、業務を実行する現用系サーバ、及び障害発生時に業務を引き継ぐ予備系サーバから構成されるクラスタシステムが用いられる。このようなクラスタシステムとして、コールドスタンバイ方式のシステムが知られている。

　クラスタシステムでは、業務の実行に必要なデータが外部のストレージシステム又はサーバが備える内部記憶装置の少なくともいずれかに格納される。

　前述したデータがストレージに格納される場合、現用系サーバ及び予備系サーバが、ＳＡＮ（Ｓｔｏｒａｇｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）を介して、同一のストレージシステムに接続される。通常、現用系サーバとストレージシステムとの間の通信経路が確立され、現用系サーバがストレージシステムに格納されたデータを用いて業務を実行する。

　ストレージシステムを用いたクラスタシステムは信頼性を重視するシステムにおいて用いられ、内部記憶装置を用いたクラスタシステムは価格を重視するシステムにおいて用いられる。

　現用系サーバに障害が発生した場合、前述した二つの方式では、以下のようにして現用系サーバから予備系サーバに切り替えられる。

　ストレージシステムを用いたクラスタシステムでは、現用系サーバとストレージシステムとの間の通信経路から、予備系サーバとストレージシステムとの間の通信経路に切り替えられる。内部記憶装置を用いたクラスタシステムでは、現用系サーバの内部記憶装置に格納されるデータのバックアップデータを取得し、予備系サーバの内部記憶装置に当該バックアップデータをリストアする。

　現用系サーバから予備系サーバへの切り替え方法としては、様々な方法が知られている（例えば、特許文献１参照）。

特開２００９－１２９１４８号公報

　特許文献１に記載の発明では、管理サーバが、予め、障害が発生した現用系サーバが提供する業務サービスと同様のディスクイメージを、予備系サーバに配信する。これによってフェイルオーバ完了までの時間を短縮することができる。

　しかし、特許文献１では、予備系サーバに配信されたディスクイメージの業務が、障害が発生した現用系サーバの業務と異なる場合、現用系サーバのディスクイメージを再配信する必要がある。そのため、フェイルオーバ完了までの時間を短縮することができない場合がある。また、予備系サーバに配信されたディスクイメージは、障害発生時の現用系サーバの状態とは異なるため、障害発生前の現用系サーバの業務状態を復元することができない。すなわち、予備系サーバに配信されたディスクイメージが陳腐化するという問題がある。

　本発明は、前述した課題を解決することを目的とする。すなわち、予備系サーバに適切なディスクイメージを予め配信し、かつ、障害発生前の現用系サーバの業務状態を復元することが可能なシステム及び方法を提供することを目的とする。

　本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、複数の計算機と、前記複数の計算機から構成されるクラスタを管理する管理計算機と、を備える計算機システムであって、前記複数の計算機の各々は、第１のプロセッサ、前記第１のプロセッサに接続される第１のメモリ、前記第１のプロセッサに接続される記憶デバイス、及び前記第１のプロセッサに接続される第１のネットワークインタフェースを有し、前記管理計算機は、第２のプロセッサ、前記第２のプロセッサに接続される第２のメモリ、及び前記第２のプロセッサに接続される第２のネットワークインタフェースを有し、前記クラスタを構成する前記複数の計算機は、前記記憶デバイスを用いて業務を実行する複数の第１の計算機と、障害が発生した第１の計算機が実行する業務を引き継ぐ複数の第２の計算機とを含み、前記管理計算機は、前記複数の第１の計算機の各々のバックアップイメージを取得するバックアップ取得部と、一つ以上の第１の計算機と、一つ以上の第２の計算機とから構成される複数のリストアペアを生成し、前記複数のリストアペア毎に、一つのリストアペアに含まれる前記一つ以上の第２の計算機にリストアする共通イメージを選択するリストアペア管理部と、を有し、前記クラスタを構成する複数の計算機の各々のハードウェア構成の情報及びソフトウェア構成の情報を管理するサーバ管理情報を保持し、前記リストアペア管理部は、前記クラスタの構成が変更されたことを検出した場合に、前記サーバ管理情報を参照して、前記複数の第１の計算機を、前記業務を提供するためのソフトウェア構成が共通する複数のグループに分類し、前記サーバ管理情報を参照して、前記複数の第１の計算機の各々のハードウェア構成の情報及び前記複数の第２の計算機の各々のハードウェア構成の情報に基づいて、前記複数のグループの各々に、少なくとも一つ以上の第２の計算機を割り当て、前記複数のグループ毎に、一つのグループに含まれる一つ以上の第１の計算機と、前記一つのグループに割り当てられた少なくとも一つ以上の第２の計算機とを対応づけることによって、一つ以上のリストアペアを生成し、前記複数のリストアペア毎に、前記一つのリストアペアに含まれる前記一つ以上の第１の計算機の前記バックアップイメージの中から、前記共通イメージを決定し、前記リストアペアの識別情報、前記リストアペアに含まれる前記一つ以上の第１の計算機の識別情報、前記リストアペアに含まれる前記一つ以上の第２の計算機の識別情報、及び前記リストアペアの前記共通イメージの識別情報を対応づけたリストアペア管理情報を生成することを特徴とする。

　本発明によれば、リストアペア内の複数の第１の計算機は業務を提供するためのソフトウェア構成が共通するため、予備系サーバにバックアップイメージを再度配信する必要がない。また、共通イメージと、リストアペアに含まれる第１の計算機の各々のバックアップイメージとの差異を小さくできる。したがって、第２の計算機に適切なバックアップイメージを配信でき、かつ、第２の計算機への迅速な切り替えを実現できる。

　上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。

本発明の実施例における計算機システムの構成を示すブロック図である。本発明の実施例１の管理サーバのハードウェア構成及びソフトウェア構成を説明するブロック図である。本発明の実施例１のサーバのハードウェア構成及びソフトウェア構成を説明するブロック図である。本発明の実施例１におけるサーバテーブルの一例を示す説明図である。本発明の実施例１におけるコールドスタンバイグループテーブルの一例を示す説明図である。本発明の実施例１におけるリストアペアテーブルの一例を示す説明図である。本発明の実施例１におけるフルバックアップイメージ構成テーブルの一例を示す説明図である。本発明の実施例１における個別イメージ構成テーブルの一例を示す説明図である。本発明の実施例１におけるバックアップデータテーブルの一例を示す説明図である。本発明の実施例１における処理の概要を示す説明図である。本発明の実施例１における管理サーバが実行する処理の概要を説明するフローチャートである。本発明の実施例１における管理サーバが実行する処理の概要を説明するフローチャートである。本発明の実施例１におけるバックアップイメージを示す説明図である。本発明の実施例１におけるバックアップテーブルの一例を示す説明図である。本発明の実施例１における管理サーバが実行するリストアペア生成処理の一例を説明するフローチャートである。本発明の実施例１における管理サーバが実行する共通イメージ決定処理の一例を説明するフローチャートである。本発明の実施例１における管理サーバが実行する共通イメージリストア処理の一例を説明するフローチャートである。本発明の実施例１におけるリストアペアテーブルの一例を示す説明図である。本発明の実施例１における管理サーバが実行する個別イメージ生成処理の一例を説明するフローチャートである。本発明の実施例１における管理サーバが実行するサーバ切替処理の一例を説明するフローチャートである。本発明の実施例１における管理サーバが実行する予備系サーバ選択処理の一例を説明するフローチャートである。本発明の実施例１における管理サーバが実行するリストア処理の一例を説明するフローチャートである。本発明の実施例２における管理サーバが実行する共通イメージ決定処理の一例を説明するフローチャートである。

　以下、本発明の実施例を添付図面に基づいて説明する。

　図１は、本発明の実施例１における計算機システムの構成を示すブロック図である。

　本実施例の計算機システムは、管理サーバ１００、複数のサーバ１１０、複数のストレージ装置１２０、外部ストレージ装置１８０、ＦＣ（Ｆｉｂｅｒ　Ｃｈａｎｎｅｌ）－ＳＷ１３０、及びハードウェア構成変更検出部１５０から構成される。

　管理サーバ１００は、ネットワーク１４０を介して、複数のサーバ１１０、複数のストレージ装置１２０、及びハードウェア構成変更検出部１５０と接続される。また、管理サーバ１００は、ネットワークを介して、又は、直接外部ストレージ装置１８０と接続される。

　ハードウェア構成変更検出部１５０は、複数のサーバ１１０と接続される。複数のサーバ１１０は、ＦＣ－ＳＷ１３０から構成されるＳＡＮを介して、複数のストレージ装置１２０と接続される。

　なお、本発明は、ネットワーク１４０の接続形式に限定されず、ＷＡＮ（Ｗｉｄe　Ａｒｅａ　Ｎｅｔｗｏｒｋ）又はＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）が考えられる。また、ハードウェア構成変更検出部１５０は、ネットワークを介して、又は、直接、複数のサーバ１１０と接続されてもよい。

　サーバ１１０は、業務を実行する計算機である。本実施例では、実際に業務を実行する現用系サーバ１１０と、現用系サーバ１１０に障害が発生した場合に、業務を引き継ぐ予備系サーバ１１０とを含む。

　現用系サーバ１１０は、内部記憶デバイス３０５（図３参照）又はＬＵ（Ｌｏｇｉｃａｌ　Ｕｎｉｔ）１２１の少なくともいずれかを用いて、所定の業務を実行する。本実施例では、現用系サーバ１１０は、内部記憶デバイス３０５（図３参照）及びＬＵ１２１の両方を用いて業務を実行するものとする。

　なお、本発明は、現用系サーバ１１０が内部記憶デバイス３０５（図３参照）のみを用いて業務を実行している場合でも同様の効果を奏する。

　サーバ１１０のハードウェア構成及びソフトウェア構成については、図３を用いて後述する。なお、現用系サーバ１１０及び予備系サーバ１１０は同一のハードウェア構成である。

　本実施例では、コールドスタンバイ方式のクラスタが構成された計算機システムを想定する。具体的には、複数のサーバ１１０からコールドスタンバイグループ１６０が構成される。この場合、コールドスタンバイグループ１６０に含まれるサーバ１１０間で業務が引き継がれる。コールドスタンバイグループ１６０に含まれるサーバ１１０のうち、予備系サーバ１１０は、電源ＯＦＦの状態となっている。

　また、本実施例では、後述するように、コールドスタンバイグループ１６０内に複数のリストアペア１７０が生成される点に特徴がある。

　ここで、リストアペア１７０は、一つ以上の現用系サーバ１１０と一つ以上の予備系サーバ１１０とから構成されるグループである。リストアペア１７０は、効率的なバックアップイメージの取得、及び、高速なバックアップイメージのリストアを実現できるように生成される。リストアペア１７０の生成方法については後述する。

　また、リストアペア１７０に含まれる現用系サーバ１１０に障害が発生した場合、同一のリストアペア１７０に含まれる予備系サーバ１１０が業務を引き継ぐ。

　図１に示す例では、現用系サーバＡ、現用系サーバＢ及び予備系サーバＸから構成されるリストアペア１と、現用系サーバＣ及び予備系サーバＹから構成されるリストアペア２とが生成される。

　ハードウェア構成変更検出部１５０は、サーバ１１０のハードウェア構成の変更を検出する。本実施例では、ハードウェア構成変更検出部１５０は、一つの装置として記載しているが本発明はこれに限定されない。例えば、管理サーバ１００、サーバ１１０又はストレージ装置１２０が、プログラムモジュールとしてハードウェア構成変更検出部１５０を備えてもよい。

　管理サーバ１００は、コールドスタンバイ方式のクラスタが構成される計算機システム全体を管理する。具体的には、管理サーバ１００は、リストアペア１７０を生成し、リストアペア１７０毎に、現用系サーバ１１０のバックアップイメージを取得する。また、管理サーバ１００は、現用系サーバ１１０の挙動を監視し、現用系サーバ１１０の障害を検出した場合に、予備系サーバ１１０に切り替える。

　本実施例では、管理サーバ１００は、前述した制御を実現するために、サーバ管理部１０１及びバックアップ部１０２を備える。

　サーバ管理部１０１は、サーバ１１０の情報及びクラスタの情報を管理する。バックアップ部１０２は、業務を引き継ぐために必要なバックアップイメージを取得する。また、バックアップ部１０２は、最適なバックアップイメージを取得するために、リストアペア１７０を生成する。

　サーバ管理部１０１及びバックアップ部１０２は、現用系サーバ１１０の障害を検出した場合に、互いに連携してサーバ切替処理を実行する。このとき、バックアップ部１０２は、予備系サーバ１１０へのバックアップイメージのリストア処理を実行する。

　管理サーバ１００のハードウェア構成及びソフトウェア構成については、図２を用いて後述する。

　ストレージ装置１２０は、現用系サーバ１１０に割り当てる記憶領域を提供する。ストレージ装置１２０は、ディスクコントローラ（図示省略）、複数の記憶デバイス（図示省略）、ディスクインタフェース（図示省略）を備える。また、ストレージ装置１２０は、管理サーバ１００と接続するための管理インタフェース１２２を備える。

　本実施例では、ストレージ装置１２０は、複数の記憶デバイスの記憶領域からＬＵ１２１が生成し、当該ＬＵ１２１を現用系サーバ１１０に提供する。なお、ＬＵ１２１には、ＯＳ（Ｏｐｅｒａｔｉｏｎｇ　Ｓｙｓｔｅｍ）及びアプリケーション等のプログラム及びプログラムの実行に必要な各種情報が格納される。また、記憶デバイスとしては、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）及びＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）等が考えられる。また、ストレージ装置１３０は、複数の記憶デバイスを用いてＲＡＩＤを構成してもよい。

　外部ストレージ装置１８０は、管理サーバ１００が処理を実行するために必要なプログラム及び情報を格納する。本実施例では、外部ストレージ装置１８０に、現用系サーバ１１０のバックアップイメージが格納される。なお、外部ストレージ装置１８０は、ストレージ装置１２０と同一の構成であるものとする。なお、外部ストレージ装置１８０は、記憶デバイスとしてテープを用いてもよい。

　ＦＣ－ＳＷ１３０は、複数のサーバ１１０と複数のストレージ装置１２０とを接続するＳＡＮを構成する。図１では、一つのＦＣ－ＳＷ１３０がＳＡＮを構成するが、複数のＦＣ－ＳＷ１３０からＳＡＮが構成されてもよい。

　なお、管理サーバ１００及びサーバ１１０の種別は、物理サーバ、ブレードサーバ、仮想化サーバ、又は、論理物理分割若しくは物理分割されたサーバ等のいずれであってもよい。本発明は、管理サーバ１００及びサーバ１１０の種別に限定されず、本発明の効果を得ることができる。

　図２は、本発明の実施例１の管理サーバ１００のハードウェア構成及びソフトウェア構成を説明するブロック図である。

　管理サーバ１００は、プロセッサ２０１、メモリ２０２、ネットワークインタフェース２０３、及びディスクインタフェース２０４を備える。なお、管理サーバ１００は、キーボード及びマウス等の入力装置、並びにディスプレイ等の出力装置を備えてもよい。

　プロセッサ２０１は、一つ以上の演算装置を備え、メモリ２０２に格納されるプログラムを実行する。プロセッサ２０１がプログラムを実行することによって、管理サーバ１００が備える機能を実現することができる。以下、プログラムを主体にして説明する場合、プロセッサ２０１によって当該プログラムが実行されていることを示す。

　メモリ２０２は、プロセッサ２０１によって実行されるプログラム及び当該プログラムの実行に必要な情報を格納する。メモリ２０２に格納されるプログラム及び情報については、後述する。

　ネットワークインタフェース２０３は、ＩＰネットワークを介して、他の装置と通信するためのインタフェースである。ディスクインタフェース２０４は、ストレージ装置１２０等にアクセスするためのインタフェースである。

　図２では、ネットワークインタフェース２０３及びディスクインタフェース２０４を、それぞれ代表して一つずつ示しているが、管理サーバ１００は、複数のネットワークインタフェース２０３及び複数のディスクインタフェース２０４を備えてもよい。

　例えば、管理サーバ１００が二つのネットワークインタフェース２０３を備える場合、一つのネットワークインタフェース２０３を介して管理用のネットワークと接続し、他方のネットワークインタフェース２０３を介して業務用のネットワークと接続することが考えられる。

　次に、メモリ２０２に格納されるプログラム及び情報について説明する。

　メモリ２０２は、サーバ管理部１０１及びバックアップ部１０２を実現するプログラム及び管理テーブル群を格納する。なお、メモリ２０２は、図示しないプログラム及び情報を格納してもよい。まず、サーバ管理部１０１について説明する。

　サーバ管理部１０１は、複数のサーバ１１０のハードウェア構成及びソフトウェア構成を管理する。サーバ管理部１０１は、複数のプログラムモジュール及び複数のテーブルから構成される。

　具体的には、サーバ管理部１０１は、サーバ構成情報取得部２１１、ＢＩＯＳ情報取得部２１２、コールドスタンバイグループ生成部２１３、切替先サーバ選択部２１４、ＷＷＮ変更部２１５、ＢＩＯＳ情報リストア部２１６、サーバテーブル２２１、及びコールドスタンバイグループテーブル２２２を含む。

　サーバ構成情報取得部２１１は、ネットワーク１４０を介して、コールドスタンバイグループ１６０に含まれる複数のサーバ１１０から、ハードウェア構成及びソフトウェア構成等のサーバ１１０の性能情報を取得する。

　例えば、サーバ構成情報取得部２１１は、各サーバ１１０に情報収集用のエージェントを送信し、当該エージェントからサーバ１１０の性能情報を取得する方法が考えられる。また、サーバ構成情報取得部２１１は、現用系サーバ１１０上で稼働するＯＳに問い合わせることによって、サーバ１１０の性能情報を取得する方法も考えられる。なお、前述したサーバ１１０の性能情報の取得方法は一例であって、本発明はこれに限定されない。

　ＢＩＯＳ情報取得部２１２は、ネットワーク１４０を介して、コールドスタンバイグループ１６０に含まれる複数の現用系サーバ１１０から、ＢＩＯＳ情報を取得する。ここで、ＢＩＯＳ情報には、現用系サーバ１１０におけるＢＩＯＳの設定及びブート順等が含まれる。

　例えば、ＢＩＯＳ情報取得部２１２は、現用系サーバ１１０上で稼働するＯＳに問い合わせることによって、ＢＩＯＳ情報を取得する方法も考えられる。なお、前述したＢＩＯＳ情報の取得方法は一例であって、本発明はこれに限定されない。

　コールドスタンバイグループ生成部２１３は、管理者又はユーザ等の指示にしたがって、コールドスタンバイグループ１６０を生成する。

　切替先サーバ選択部２１４は、コールドスタンバイグループ１６０に含まれる現用系サーバ１１０の障害が検出された場合に、当該現用系サーバ１１０の業務を引き継ぐ予備系サーバ１１０、すなわち、切り替え先の予備系サーバ１１０を選択する。

　ＷＷＮ変更部２１５は、業務に必要な情報を格納する記憶領域を提供するストレージ装置１２０と、サーバ１１０との接続を切り替える。すなわち、ＷＷＮ変更部２１５は、障害が発生した現用系サーバ１１０から予備系サーバ１１０にＬＵとの接続を切り替える。

　具体的には、ＷＷＮ変更部２１５は、サーバ１１０がＬＵ１２１とファイバチャネル通信を行うために用いるＷＷＮ（Ｗｏｒｌｄ　Ｗｉｄｅ　Ｎａｍｅ）を切り替える。ＷＷＮは、ユニークなデバイス識別子である。なお、サーバ１１０とストレージ装置１２０とがＩＰ－ＳＡＮなどを介して接続される場合、ｉＳＣＳＩ　Ｑｕａｌｉｆｉｅｄ　ＮａｍｅのようなＷＷＮと同等の識別子が変更される。

　ＢＩＯＳ情報リストア部２１６は、切り替え先の予備系サーバ１１０に、ＢＩＯＳ情報取得部２１２によって取得されたＢＩＯＳ情報をリストアする。

　サーバテーブル２２１は、複数のサーバ１１０の構成に関する情報を格納する。具体的には、サーバ構成情報取得部２１１によって取得されたサーバ１１０の構成情報及びＢＩＯＳ情報取得部２１２によって取得されたＢＩＯＳ情報が格納される。サーバテーブル２２１の詳細については、図４を用いて後述する。

　コールドスタンバイグループテーブル２２２は、コールドスタンバイグループ１６０の構成に関する情報を格納する。具体的には、コールドスタンバイグループ生成部２１３によって生成されたコールドスタンバイグループ１６０に関する情報が格納される。コールドスタンバイグループテーブル２２２の詳細については、図５を用いて後述する。

　次に、バックアップ部１０２について説明する。

　バックアップ部１０２は、コールドスタンバイグループ１６０に含まれる現用系サーバ１１０のバックアップイメージを取得し、障害復旧のための各種設定を行う。バックアップ部１０２は、複数のプログラムモジュール及び複数のテーブルから構成される。

　具体的には、バックアップ部１０２は、リストアペア生成部２３１、フルバックアップ取得部２３２、共通イメージ決定部２３３、個別イメージ生成部２３４、差分情報受信部２３５、バックアップ取得／復元エージェント２３６、リストア部２３７、構成変更受信部２３８、リストアペアテーブル２４１、フルバックアップイメージ構成テーブル２４２、個別イメージ構成テーブル２４３、及びバックアップデータテーブル２４４を含む。

　リストアペア生成部２３１は、サーバ１１０の性能情報等に基づいて、リストアペア１７０を生成する。

　フルバックアップ取得部２３２は、現用系サーバ１１０のフルバックアップイメージを取得する。

　共通イメージ決定部２３３は、リストアペア１７０に含まれる予備系サーバ１１０にリストアする共通イメージを決定する。ここで、共通イメージは、リストアペア１７０に含まれる任意の現用系サーバ１１０のフルバックアップイメージを示す。

　個別イメージ生成部２３４は、共通イメージと各サーバ１１０のフルバックアップイメージとの差分データである個別イメージを生成する。

　差分情報受信部２３５は、フルバックアップイメージを取得した後に内部記憶デバイス３０５（図３参照）に格納されるデータのうち、更新されたデータに関する差分情報を取得する。後述するように、差分情報は、現用系サーバ１１０上で稼働する差分情報取得部３１１（図３参照）によって取得される。

　バックアップ取得／復元エージェント２３６は、現用系サーバ１１０からフルバックアップイメージを取得し、また、予備系サーバ１１０にフルバックアップイメージ、個別イメージ及び差分情報をリストアする。

　バックアップ取得／復元エージェント２３６は、フルバックアップイメージの取得時に現用系サーバ１１０にデプロイされ、バックアップイメージのリストア時に予備系サーバ１１０にデプロイされる。なお、現用系サーバ１１０にバックアップ取得／復元エージェント２３６をインストールしてもよい。例えば、現用系サーバ１１０の内部記憶デバイス３０５（図３参照）、又は、現用系サーバ１１０が使用するＬＵ１２１に予め格納する方法が考えられる。

　リストア部２３７は、業務を引き継ぐために必要なバックアップイメージ、個別イメージ、及び差分情報を予備系サーバ１１０にリストアする。

　構成変更受信部２３８は、計算機システム内のハードウェア構成及びソフトウェア構成の変更があった旨を受信する。ハードウェア構成の変更としては、サーバ１１０の追加又は削除等が考えられる。また、ソフトウェア構成の変更としては、現用系サーバ１１０のＯＳの変更、ＯＳのバージョンアップ、及び、アプリケーションの追加又は削除等が考えられる。

　リストアペアテーブル２４１は、リストアペア生成部２３１によって生成されたリストアペア１７０を管理するための情報を格納する。リストアペアテーブル２４１の詳細については、図６を用いて後述する。

　フルバックアップイメージ構成テーブル２４２は、業務システムが運用を開始してから現在までに取得された現用系サーバ１１０のフルバックアップイメージを管理するための情報を格納する。フルバックアップイメージ構成テーブル２４２の詳細については、図７を用いて後述する。

　個別イメージ構成テーブル２４３は、個別イメージを管理するための情報を格納する。個別イメージ構成テーブル２４３の詳細については、図８を用いて後述する。

　バックアップデータテーブル２４４は、最新の現用系サーバ１１０におけるバックアップイメージを管理するための情報を格納する。バックアップデータテーブル２４４の詳細については、図９を用いて後述する。

　なお、各複数のプログラムモジュールの各々が有する機能をまとめて一つプログラムモジュールとして実現してもよいし、一つのプログラムモジュールが有する複数の機能の各々を複数のプログラムモジュールとして実現してもよい。

　例えば、管理サーバ１００は、リストアペア生成部２３１、共通イメージ決定部２３３、及び個別イメージ生成部２３４によって実現される機能を備えたリストアペア管理部を備えてもよい。また、管理サーバ１００は、リストア部２３７の代わりに、共通イメージをリストアする共通イメージリストア部、個別イメージをリストアする個別イメージリストア部、及び差分情報をリストアする差分情報リストア部を備えてもよい。

　図３は、本発明の実施例１のサーバ１１０のハードウェア構成及びソフトウェア構成を説明するブロック図である。

　サーバ１１０は、プロセッサ３０１、メモリ３０２、ネットワークインタフェース３０３、ディスクインタフェースを備える。なお、サーバ１１０は、キーボード及びマウス等の入力装置、並びにディスプレイ等の出力装置を備えてもよい。

　プロセッサ３０１は、一つ以上の演算装置を備え、メモリ３０２に格納されるプログラムを実行する。プロセッサ３０１がプログラムを実行することによって、サーバ１１０が備える機能を実現することができる。以下、プログラムを主体にして説明する場合、プロセッサ３０１によって当該プログラムが実行されていることを示す。

　メモリ３０２は、プロセッサ３０１によって実行されるプログラム及び当該プログラムの実行に必要な情報を格納する。メモリ３０２に格納されるプログラム及び情報については、後述する。

　ネットワークインタフェース３０３は、ＩＰネットワークを介して、他の装置と通信するためのインタフェースである。ディスクインタフェース３０４は、ストレージ装置１２０等にアクセスするためのインタフェースである。

　図３では、ネットワークインタフェース３０３及びディスクインタフェース３０４を、それぞれ代表して一つずつ示しているが、管理サーバ１００は、複数のネットワークインタフェース３０３及び複数のディスクインタフェース３０４を備えてもよい。

　例えば、サーバ１１０が二つのネットワークインタフェース３０３を備える場合、一つのネットワークインタフェース３０３を介して管理用のネットワークと接続し、他方のネットワークインタフェース３０３を介して業務用のネットワークと接続することが考えられる。

　内部記憶デバイス３０５は、業務の実行に必要な情報を格納する。例えば、ＯＳ、アプリケーション等を実現するプログラムが格納される。なお、内部記憶デバイス３０５の記憶領域は、一つ以上のパーティションが格納されるファイル領域と、パーティションの情報及び内部記憶デバイス３０５の構成を管理するＭＢＲ（Ｍａｓｔｅｒ　Ｂｏｏｔ　Ｒｅｃｏｒｄ）が格納される領域とを含む。また、パーティションには複数のファイルが格納される。以下、複数のファイルをファイルセットとも記載する。

　現用系サーバ１１０のメモリ３０２には、差分情報取得部３１１及びソフトウェア構成変更検出部３１２を実現するためのプログラムが格納される。図示していないが、メモリ３０２にはＯＳ及びアプリケーションも格納される。なお、予備系サーバ１１０は電源ＯＦＦの状態であるため、前述したプログラムはメモリ３０２上にはロードされない。

　差分情報取得部３１１は、内部記憶デバイス３０５に格納されるファイルの状態を監視し、当該データが更新された場合に、ファイルが更新された旨を管理サーバ１００に通知する。なお、当該通知には、更新されたファイルに関する情報として、ファイルの識別情報及び更新されたファイルの内容が含まれる。

　ソフトウェア構成変更検出部３１２は、現用系サーバ１１０におけるプログラムの構成を監視し、当該プログラムの構成が変更された場合に、プログラムの構成が変更された旨を管理サーバ１００に通知する。プログラムの構成が変更される場合としては、新たなアプリケーションの追加、ＯＳのバージョンアップ、及びＯＳの種類の変更等が考えられる。

　次に、管理サーバ１００が備える各テーブルの構成について説明する。

　図４は、本発明の実施例１におけるサーバテーブル２２１の一例を示す説明図である。

　サーバテーブル２２１は、計算機システムに含まれるサーバ１１０の性能情報及びＢＩＯＳ情報を格納する。具体的には、サーバテーブル２２１は、サーバ名４０１、プロセッサ４０２、メモリ４０３、記憶デバイス４０４、読み出しエラー回数４０５、ＯＳ４０６、ストレージ装置４０７、ＷＷＮ４０８、ＬＵ４０９、及びＢＩＯＳ情報４１０を含む。

　プロセッサ４０２、メモリ４０３、記憶デバイス４０４、読み出しエラー回数４０５、ＯＳ４０６、ストレージ装置４０７、ＷＷＮ４０８、及びＬＵ４０９には、サーバ構成情報取得部２１１によって取得されたサーバ１１０の性能情報が格納される。また、ＢＩＯＳ情報４１０には、ＢＩＯＳ情報取得部２１２によって取得されたＢＩＯＳ情報が格納される。

　サーバ名４０１には、サーバ１１０を一意に識別するための識別情報が格納される。本実施例では、サーバ１１０の識別情報として、サーバ１１０の名称が用いられる。なお、本発明はこれに限定されず、計算機システム内でサーバ１１０を一意に識別できる情報であればどのような情報でもよい。

　プロセッサ４０２には、サーバ１１０が備えるプロセッサ３０１の性能情報が格納される。プロセッサ３０１の性能情報としては、プロセッサ３０１の種別、クロック数、コア数等が考えられる。ここで、プロセッサ３０１の種別とは、プロセッサ３０１の製品名、又はアーキテクチャ名等を示す。

　メモリ４０３には、サーバ１１０が備えるメモリ３０２の性能情報が格納される。メモリの性能情報としては、メモリ３０２の規格、容量、レイテイシ等が考えられる。

　記憶デバイス４０４には、サーバ１１０が備える内部記憶デバイス３０５の性能情報が格納される。内部記憶デバイス３０５の性能情報としては、記憶デバイスのバージョン、読出速度、書込速度、及び容量等が考えられる。

　読み出しエラー回数４０５には、内部記憶デバイス３０５におけるデータの読み出し時のエラー回数が格納される。なお、業務システムの構築時には、初期値として「０」が格納される。

　ＯＳ４０６には、現用系サーバ１１０上で稼働するＯＳの種別に関する情報が格納される。なお、予備系サーバ１１０上ではＯＳが稼働していない。したがって、予備系サーバ１１０に対応するエントリのＯＳ４０６は空欄である。

　ストレージ装置４０７には、業務を実行する現用系サーバ１１０と接続されるストレージ装置１２０を一意に識別するための識別情報が格納される。本実施例では、識別情報として、ストレージ装置１２０の名称を用いる。なお、本発明はこれに限定されず、計算機システム内でストレージ装置１２０を一意に識別できる情報であればどのような情報でもよい。ＷＷＮ４０８は、ストレージ装置１２０と接続時に用いられるＷＷＮを格納する。

　なお、予備系サーバ１１０は、障害発生時に、現用系サーバ１１０の業務を引き継ぐために予め、ストレージ装置４０７と接続されている。そのため、予備系サーバ１１０に対応するエントリのストレージ装置４０７及びＷＷＮ４０８には、所定の情報が格納される。

　ＬＵ４０９には、現用系サーバ１１０に割り当てられたＬＵ１２１の性能情報が格納される。ＬＵ１２１の性能情報としては、ＬＵ１２１の容量等が考えられる。なお、予備系サーバ１１０にはＬＵ１２１が割り当てられていない、すなわち、ＬＵ１２１との接続が有効化されていない。したがって、予備系サーバ１１０に対応するエントリのＬＵ４０９は空欄である。

　ＢＩＯＳ情報４１０には、サーバ１１０のＢＩＯＳ情報を格納するファイルの識別情報が格納される。ここで、ＢＩＯＳ情報とは、ＢＩＯＳの設定及びブート順等を含む情報である。ＢＩＯＳ情報は、業務を引き継ぐ予備系サーバ１１０の起動に必要な情報である。

　なお、サーバ１１０の性能情報は、前述したものに限られず、ネットワークインタフェース３０３の性能、サーバ１１０上で実行されるアプリケーションの種別等が含まれてもよい。また、仮想計算機が現用系サーバ１１０及び予備系サーバ１１０として用いられる計算機システムでは、サーバ１１０の性能情報として、仮想計算機を管理する仮想化部を実現するプログラムの種別、及びバージョン等が含まれてもよい。

　図５は、本発明の実施例１におけるコールドスタンバイグループテーブル２２２の一例を示す説明図である。

　コールドスタンバイグループテーブル２２２は、コールドスタンバイグループ１６０の構成に関する情報を格納する。具体的には、コールドスタンバイグループテーブル２２２は、コールドスタンバイグループ名５０１、現用系サーバ名５０２、及び予備系サーバ名５０３を含む。

　コールドスタンバイグループ名５０１には、コールドスタンバイグループ１６０を一意に識別するための識別情報が格納される。本実施例では、コールドスタンバイグループ１６０の識別情報としてコールドスタンバイグループ１６０の名称が用いられる。なお、本発明はこれに限定されず、コールドスタンバイグループ１６０を一意に識別できる情報であればどのような情報であってもよい。

　現用系サーバ名５０２には、コールドスタンバイグループ１６０に含まれる現用系サーバ１１０を一意に識別するための識別情報が格納される。予備系サーバ名５０３には、コールドスタンバイグループ１６０に含まれる予備系サーバ１１０を一意に識別するための識別情報が格納される。現用系サーバ名５０２及び予備系サーバ名５０３には、サーバ名４０１と同一の情報が用いられる。

　図６は、本発明の実施例１におけるリストアペアテーブル２４１の一例を示す説明図である。

　リストアペアテーブル２４１は、リストアペア１７０の構成に関する情報を格納する。具体的には、リストアペアテーブル２４１は、リストアペア名６０１、コールドスタンバイグループ名６０２、予備系サーバ名６０３、現用系サーバ名６０４、優先順位６０５、共通イメージ名６０６、及びリストアフラグ６０７を含む。

　リストアペア名６０１には、リストアペア１７０を一意に識別するための識別情報が格納される。本実施例では、リストアペア１７０の識別情報としてリストアペア１７０の名称が用いられる。なお、本発明はこれに限定されず、リストアペア１７０を一意に識別できる情報であればどのような情報でもあってもよい。

　コールドスタンバイグループ名６０２は、リストアペア１７０が生成されたコールドスタンバイグループ１６０を一意に識別するための識別情報が格納される。コールドスタンバイグループ名６０２にはコールドスタンバイグループ名５０１と同一の情報が用いられる。

　予備系サーバ名６０３には、リストアペア１７０に含まれる予備系サーバ１１０を一意に識別するための識別情報が格納され、また、現用系サーバ名６０４には、リストアペア１７０に含まれる現用系サーバ１１０を一意に識別するための識別情報が格納される。予備系サーバ名６０３には予備系サーバ名５０３と同一の情報が用いられ、また、現用系サーバ名６０４には現用系サーバ名５０２と同一の情報が用いられる。

　優先順位６０５には、共通イメージを決定する場合に用いられる値が格納される。本実施例では、値が小さいものほど優先順位が上位であるものとする。また、本実施例では、障害が発生しやすい現用系サーバ１１０ほど上位の優先順位、すなわち、小さな値が設定される。

　共通イメージ名６０６には、リストアペア１７０における共通イメージの識別情報が格納される。本実施例では、共通イメージの識別情報として共通イメージの名称が用いられる。なお、本発明はこれ限定されず、共通イメージを一意に識別できる情報であればどのような情報であってもよい。

　リストアフラグ６０７には、予備系サーバ１１０に共通イメージをリストア済みであるか否かを示す情報が格納される。本実施例では、予備系サーバ１１０に共通イメージがリストアされていない場合、リストアフラグ６０７には「未」が格納され、予備系サーバ１１０に共通イメージがリストア済みである場合、リストアフラグ６０７には「済」が格納される。

　図６に示す例では、一つのリストアペア１７０は、一つの予備系サーバ１１０と一つ以上の現用系サーバ１１０とから構成される。

　なお、本発明はこれに限定されず、リストアペア１７０は、複数の予備系サーバ１１０と複数の現用系サーバとから構成されてもよい。この場合、リストアペア１７０に含まれる予備系サーバ１１０の数は、リストアペア１７０に含まれる現用系サーバ１１０の数より小さいほうが望ましい。これは、計算機システムに、多くの予備系サーバ１１０を準備する必要があるためコストがかかり、また、計算機リソースが有効に活用されないためである。

　図７は、本発明の実施例１におけるフルバックアップイメージ構成テーブル２４２の一例を示す説明図である。

　フルバックアップイメージ構成テーブル２４２は、現用系サーバ１１０から取得されたフルバックアップイメージの構成に関する情報を格納する。具体的には、フルバックアップイメージ構成テーブル２４２は、フルバックアップイメージ名７０１、現用系サーバ名７０２、ＭＢＲイメージ名７０３、ファイルセット名７０４、及びタイムスタンプ７０５を含む。

　フルバックアップイメージ名７０１には、現用系サーバ１１０から取得されたフルバックアップイメージを識別するための識別情報が格納される。本実施例では、フルバックアップイメージの識別情報として、フルバックアップイメージの名称が用いられる。なお、本発明はこれに限定されずフルバックアップイメージを識別できる情報であればどのような情報であってもよい。

　現用系サーバ名７０２には、フルバックアップイメージが取得されたサーバ１１０を一意に識別するための識別情報が格納される。現用系サーバ名７０２には現用系サーバ名５０２と同一の情報が用いられる。

　ＭＢＲイメージ名７０３には、内部記憶デバイス３０５の記憶領域に含まれるＭＢＲのイメージを一意に識別するための識別情報が格納される。本実施例では、ＭＢＲのイメージの識別情報としてＭＢＲのイメージの名称が用いられる。なお、本発明はこれに限定されずＭＢＲのイメージを一意に識別できる情報であればどのような情報であって絵もよい。

　ファイルセット名７０４には、パーティションに格納されるファイルセットを識別するための識別情報が格納される。本実施例では識別情報として、パーティションの名称及びファイルセットの名称が用いられる。なお、本発明はこれに限定されずファイルセットを識別できる情報であればどのような情報であってもよい。

　タイムスタンプ７０５には、フルバックアップイメージが生成された時刻が格納される。

　なお、業務システムの構築時に、フルバックアップイメージが取得されていない場合、フルバックアップイメージ構成テーブル２４２には、現用系サーバ１１０にデプロイされたデプロイイメージに関する情報、又は、現用系サーバ１１０にインストールされたイメージに関する情報が格納される。この場合、ＭＢＲイメージ名７０３、ファイルセット名７０４及びタイムスタンプ７０５は空欄のままである。

　図８は、本発明の実施例１における個別イメージ構成テーブル２４３の一例を示す説明図である。

　個別イメージ構成テーブル２４３は、共通イメージと各サーバ１１０のフルバックアップイメージとの差分データである個別イメージの構成に関する情報を格納する。具体的には、個別イメージ構成テーブル２４３は、個別イメージ名８０１、ＭＢＲイメージ名８０２、ファイルセット名８０３、８０４、及びタイムスタンプ８０５を含む。

　個別イメージ名８０１には、個別イメージを一意に識別するための識別情報が格納される。本実施例では、個別イメージの識別情報として個別イメージの名称が用いられる。なお、本発明はこれに限定されず、個別イメージを識別できる情報であればどのような情報であってもよい。

　ＭＢＲイメージ名８０２は、サーバ１１０のフルバックアップイメージに含まれるＭＢＲのイメージを一意に識別するための識別情報が格納される。ＭＢＲイメージ名８０２には、ＭＢＲイメージ名７０３と同一の情報が用いられる。

　ファイルセット名８０３には、共通イメージとサーバ１１０のフルバックアップイメージとの間の差分データのうち、共通イメージから追加又は更新されたファイルセットの識別情報が格納される。ファイルセット名８０４には、共通イメージとサーバ１１０のフルバックアップイメージとの間の差分データのうち、共通イメージから削除されたファイルの識別情報が格納される。ファイルセット名８０３及びファイルセット名８０４には、ファイルセット名７０４と同一の情報が用いられる。

　タイムスタンプ８０５には、個別イメージが生成された時刻が格納される。

　図９は、本発明の実施例１におけるバックアップデータテーブル２４４の一例を示す説明図である。

　バックアップデータテーブル２４４は、最新の現用系サーバ１１０のバックアップイメージを管理するための情報を格納する。具体的には、バックアップデータテーブル２４４は、現用系サーバ名９０１、共通イメージ名９０２、個別イメージ名９０３、差分情報名９０４、及びタイムスタンプ９０５を含む。

　現用系サーバ名９０１には、現用系サーバ１１０を一意に識別するための識別情報が格納される。現用系サーバ名９０１には、サーバ名４０１と同一の情報が用いられる。

　共通イメージ名９０２には、現用系サーバ名９０１に対応する現用系サーバ１１０が含まれるリストアペア１７０における共通イメージを一意に識別するための識別情報が格納される。共通イメージ名９０２には、共通イメージ名６０６と同一の情報が用いられる。

　個別イメージ名９０３には、現用系サーバ１１０に対して生成された個別イメージを一意に識別するための識別情報が格納される。個別イメージ名９０３には、個別イメージ名８０１と同一の情報が用いられる。

　差分情報名９０４には、フルバックアップイメージが取得される期間の間に、現用系サーバ１１０の更新されたデータである差分情報を一意に識別するための識別情報が格納される。本実施例では、差分情報を識別する情報として差分情報の名称が用いられる。

　タイムスタンプ９０５には、差分情報が生成された時刻が格納される。

　次に、具体的な処理について説明する。まず、本実施例における処理の概要について説明する。

　図１０は、本発明の実施例１における処理の概要を示す説明図である。

　初めに、計算機システム上に業務システムが構築される。業務システムの構築時には、以下のような処理が実行される。

　まず、サーバ１１０にＯＳ等のソフトウェアが手動でインストールされ、又は、管理サーバ１００等からデプロイされる。次に、管理サーバ１００は、管理者又はユーザからの入力に基づいて、コールドスタンバイグループ１６０を生成する。例えば、管理者又はユーザは、所定のインタフェースを用いて、コールドスタンバイグループ１６０を生成するための各種情報を設定する。

　次に、管理サーバ１００は、現用系サーバ１１０のフルバックアップイメージを取得する。管理サーバ１００は、複数のリストアペア１７０を生成し、各リストアペア１７０における共通イメージを決定する。管理サーバ１００は、各リストアペア内の予備系サーバ１１０に決定された共通イメージをリストアする。さらに、管理サーバ１００は、各リストアペアに含まれる現用系サーバ１１０の個別イメージを生成する。

　業務システムが構築され、当該システムの運用が開始されると、管理サーバ１００は、周期的にフルバックアップイメージを取得する。フルバックアップイメージの取得時には、以下のような処理が実行される。

　管理サーバ１００は、現用系サーバ１１０のフルバックアップイメージを取得する。管理サーバ１００は、複数のリストアペア１７０を生成し、各リストアペア１７０における共通イメージを決定する。管理サーバ１００は、各リストアペア内の予備系サーバ１１０に決定された共通イメージをリストアする。さらに、管理サーバ１００は、各リストアペアに含まれる現用系サーバ１１０の個別イメージを生成する。

　また、管理サーバ１００は、フルバックアップイメージを取得し、次にフルバックアップイメージを取得するまでの間に、差分情報を取得する。

　また、管理サーバ１００は、業務システムの運用中、現用系サーバ１１０の挙動を監視しており、現用系サーバ１１０の障害発生を検出された場合、以下のような処理を実行する。

　管理サーバ１００は、サーバ切替処理を実行する。このとき、障害が発生した現用系サーバ１１０が含まれるリストアペア１７０内の予備系サーバ１１０が、当該現用系サーバ１１０の業務を引き継ぐ。

　具体的には、管理サーバ１００は、障害が発生した現用系サーバ１１０の個別イメージ、及び共通イメージを用いて、業務が実行可能な状態、すなわち、フルバックアップイメージが取得された時の現用系サーバ１１０の状態を復元する。

　このように、予備系サーバ１１０の内部記憶デバイス３０５に共通イメージが予めリストアされているため、管理サーバ１００は、共通イメージに個別イメージを適用すればよい。したがって、現用系サーバ１１０の障害発生時における復旧を高速化することができる。

　さらに、管理サーバ１００は、差分情報を適用することによって、障害が発生する前の現用系サーバ１１０の状態を復元することができる。

　管理サーバ１００は、サーバ切替処理が完了した後、現用系サーバ１１０のフルバックアップイメージを取得する。管理サーバ１００は、複数のリストアペア１７０を生成し、各リストアペア１７０における共通イメージを決定する。管理サーバ１００は、各リストアペア内の予備系サーバ１１０に決定された共通イメージをリストアする。さらに、管理サーバ１００は、各リストアペアに含まれる現用系サーバ１１０の個別イメージを生成する。

　前述したように、リストアペア１７０毎に、予備系サーバ１１０に共通イメージがリストアされる。このとき、障害が発生した現用系サーバ１１０が実行する業務を提供可能な共通イメージをリストアする必要がある。予備系サーバ１１０に再度バックアップイメージをリストアする処理を削減することによって、高速なサーバ１１０の切り替えを実現するためである。

　そこで、管理サーバ１００は、現用系サーバ１１０の構成に基づいて、業務の種別、及び業務実行のための構成が同一又は類似する現用系サーバ１１０を分類し、当該分類結果に基づいてリストアペア１７０を生成する。これによって、共通イメージによって実現される業務と障害が発生した現用系サーバ１１０が実行する業務とが異なるという課題を解決することができる。

　また、管理サーバ１００は、サーバ１１０の切り替え時に、フルバックアップイメージの取得周期の間に生じた差分情報を適用することによって、障害が発生する前の現用系サーバ１１０の状態を復元することができる。

　図１１Ａ及び図１１Ｂは、本発明の実施例１における管理サーバ１００が実行する処理の概要を説明するフローチャートである。

　管理サーバ１００は、業務システムを構築するために、サーバ１１０に、ＯＳ及びアプリケーション等のソフトウェアを設定する（ステップＳ１１０１）。

　例えば、管理サーバ１００は、管理者又はユーザから、ソフトウェアの入力を受け付け、所定のサーバ１１０に当該ソフトウェアをインストールする。また、管理サーバ１００は、外部ストレージ装置１８０から、ソフトウェアを読み出し、所定のサーバ１１０に当該ソフトウェアをデプロイする。

　このとき、サーバ構成情報取得部２１１がサーバ１１０からサーバ１１０の性能情報を取得し、また、ＢＩＯＳ情報取得部２１２が現用系サーバ１１０として設定されたサーバ１１０からＢＩＯＳ情報を取得する。サーバ管理部１０１は、取得されたサーバ１１０の性能情報及びＢＩＯＳ情報に基づいて、サーバテーブル２２１を更新する。また、サーバ管理部１０１は、外部ストレージ装置１８０に取得されたＢＩＯＳ情報を格納する。サーバ１１０から各種情報を取得する方法は公知の技術を用いればよいため説明を省略する。

　次に、管理サーバ１００は、管理者又はユーザからの入力に基づいて、コールドスタンバイグループ１６０を生成する（ステップＳ１１０２）。

　具体的には、コールドスタンバイグループ生成部２１３が、コールドスタンバイグループを生成する。コールドスタンバイグループ１６０の生成方法は、公知の技術を用いればよいため説明を省略する。

　本実施例では、コールドスタンバイグループ１６０が生成された後に、管理サーバ１００は、現用系サーバ１１０の監視を開始する。なお、本発明は、現用系サーバ１１０の監視処理の開始タイミングに限定されない。

　次に、管理サーバ１００は、コールドスタンバイグループ１６０に含まれる現用系サーバ１１０のフルバックアップイメージを取得する（ステップＳ１１０３）。具体的には、以下のような処理が実行される。

　管理サーバ１００は、現用系サーバ１１０にバックアップ取得／復元エージェント２３６を送信し、フルバックアップイメージの取得を指示する。現用系サーバ１１０上で稼働するバックアップ取得／復元エージェント２３６は、内部記憶デバイス３０５のフルバックアップイメージを取得し、管理サーバ１００に取得されたフルバックアップイメージを送信する。

　管理サーバ１００のフルバックアップ取得部２３２は、受信したフルバックアップイメージを外部ストレージ装置１８０に格納し、また、フルバックアップイメージ構成テーブル２４２を更新する。また、管理サーバ１００は、バックアップデータテーブル２４４を初期化する。バックアップデータテーブル２４４は、最新のバックアップイメージを管理するテーブルであるためである。

　なお、業務システムの構築時には、フルバックアップイメージが取得されなくてもよい。また、バックアップ取得／復元エージェント２３６は、現用系サーバ１１０上で稼働し続けるものとする。

　以上がステップＳ１１０３の処理である。

　次に、管理サーバ１００は、業務システムを用いて実行される業務が終了したか否かを判定する（ステップＳ１１０４）。例えば、業務の停止に伴ってコールドスタンバイグループ１６０が削除された場合、管理サーバ１００は、業務が終了したと判定する。

　業務が終了したと判定された場合、管理サーバ１００は、一連の処理を終了する。

　業務が終了していないと判定された場合、管理サーバ１００は、リストアペア生成処理を実行する（ステップＳ１１０５）。リストアペア生成処理の詳細については、図１４及び図１５を用いて後述する。

　管理サーバ１００は、共通イメージリストア処理を実行する（ステップＳ１１０６）。共通イメージリストア処理の詳細については、図１６を用いて後述する。

　管理サーバ１００は、個別イメージ生成処理を実行する（ステップＳ１１０７）。個別イメージ生成処理の詳細については、図１８を用いて後述する。

　ここで、フルバックアップイメージ、共通イメージ、及び個別イメージについて説明する。

　図１２は、本発明の実施例１におけるバックアップイメージを示す説明図である。

　図１２では、共通イメージ、サーバＡのフルバックイメージ及びサーバＤのフルバックアップイメージを一例として示す。

　サーバ１１０の内部記憶デバイス３０５には、ＭＢＲ及び一つ以上のパーティションから構成される。パーティションは、論理的な区画であり、パーティション内に複数のファイル（ファイルセット）が格納される。

　管理サーバ１００は、後述するように、共通イメージとサーバＡのフルバックアップイメージとを比較することによって個別イメージＡを生成し、また、共通イメージとサーバＤのフルバックアップイメージＤとを比較することによって個別イメージＤを生成する。

　図１１Ａ及び図１１Ｂの説明に戻る。

　次に、管理サーバ１００は、現用系サーバ１１０の障害を検出したか否かを判定する（ステップＳ１１０８）。なお、現用系サーバ１１０の障害を検出するタイミングはこれに限定されず、どの処理ステップにおいて検出されてもよい。

　現用系サーバ１１０の障害を検出していないと判定された場合、管理サーバ１００は、ステップＳ１０１０に進む。

　現用系サーバ１１０の障害を検出したと判定された場合、管理サーバ１００は、サーバ切替処理を実行し（ステップＳ１１０９）、その後ステップＳ１１０８に戻る。サーバ切替処理の詳細については、図１９を用いて後述する。

　次に、管理サーバ１００は、システム構成の変更を検出したか否かを判定する（ステップＳ１１１０）。

　例えば、管理サーバ１００の構成変更受信部２３８が、ハードウェア構成変更検出部１５０から、サーバ１１０の追加又はサーバ１１０の削除の通知を受信した場合、管理サーバ１００は、システム構成の変更を検出したと判定する。また、管理サーバ１００は、ソフトウェア構成変更検出部３１２からＯＳのバージョン変更、ＯＳの変更、又は仮想化部の変更等が通知された場合、システム構成の変更を検出したと判定する。

　システム構成の変更を検出したと判定された場合、管理サーバ１００は、ステップＳ１１０３に戻る。これは、改めてリストアペア１７０を生成する必要があるためである。

　システム構成の変更を検出していないと判定された場合、管理サーバ１００は、現用系サーバ１１０の内部記憶デバイス３０５の差分が検出されたか否かを判定する（ステップＳ１１１１）。

　具体的には、管理サーバ１００の差分情報受信部２３５が差分情報取得部３１１から差分情報を受信した場合、管理サーバ１００は、現用系サーバ１１０の内部記憶デバイス３０５の差分を検出したと判定する。なお、差分情報取得部３１１は、現用系サーバ１１０の識別情報及び差分情報の生成時刻とともに差分情報を送信する。

　現用系サーバ１１０の内部記憶デバイス３０５の差分が検出されていないと判定された場合、管理サーバ１００は、ステップＳ１１１３に進む。

　現用系サーバ１１０の内部記憶デバイス３０５の差分が検出されたと判定された場合、管理サーバ１００は、受信した差分情報を外部ストレージ装置１８０に格納し、また、バックアップデータテーブル２４４を更新する（ステップＳ１１１２）。具体的には、以下のような処理が実行される。

　管理サーバ１００の差分情報受信部２３５は、バックアップデータテーブル２４４を参照し、受信した現用系サーバ１１０の識別情報に一致するエントリを検索する。管理サーバ１００は、検索されたエントリの差分情報名９０４に受信した差分情報の識別情報を格納し、検索されたエントリのタイムスタンプ９０５に受信した生成時刻を格納する。

　図１３は、本発明の実施例１におけるバックアップテーブル２４５の一例を示す説明図である。管理サーバは、差分情報を受信するたびに、対応する現用系サーバ１１０のエントリに差分情報の識別情報及び生成時刻を格納する。すなわち、一つの現用系サーバ１１０から複数の差分情報を受信した場合、管理サーバ１００は、当該現用系サーバ１１０に対応するエントリに複数の差分情報に関する情報を格納する。

　以上が、ステップＳ１１１２の処理である。

　次に、管理サーバ１００は、フルバックアップイメージを取得してから一定期間経過したか否かを判定する（ステップＳ１１１３）。すなわち、フルバックアップイメージの取得周期を経過したか否かが判定される。

　フルバックアップイメージの取得周期を経過していないと判定された場合、管理サーバ１００は、ステップＳ１１１１に戻る。

　フルバックアップイメージの取得周期を経過したと判定された場合、管理サーバ１００は、ステップＳ１１０３に戻る。

　図１４は、本発明の実施例１における管理サーバ１００が実行するリストアペア生成処理の一例を説明するフローチャートである。

　予備系サーバ１１０にリストアされたイメージに含まれるＯＳと、障害が発生した現用系サーバ１１０のＯＳとが異なる場合、当該リストアされたイメージを使用することができず、現用系サーバ１１０のフルバックアップイメージを再度リストアする必要がある。したがって、高速なサーバ１１０の切り替えを実現できない。

　本発明では、コールドスタンバイグループ１６０に含まれる複数の現用系サーバ１１０を、業務を実行のための構成が同一又は類似のサーバ１１０毎に分類することによって、効率的なフルバックアップイメージのリストアを行うためのリストアペア１７０を生成する。これによって、高速なサーバ１１０の切り替えが実現できる。

　リストアペア生成部２３１は、コールドスタンバイグループ１６０毎にリストアペア生成処理を実行する。以下では、コールドスタンバイグループ１６０が一つの場合を例に説明する。

　リストアペア生成部２３１は、コールドスタンバイグループ１６０に含まれる複数の現用系サーバ１１０を複数のグループに分類する（ステップＳ１４０１）。具体的には、以下のような処理が実行される。

　リストアペア生成部２３１は、コールドスタンバイグループテーブル２２２を参照してコールドスタンバイグループ１６０に含まれる複数の現用系サーバ１１０を特定する。また、リストアペア生成部２３１は、サーバテーブル２２１を参照して、特定された全ての現用系サーバ１１０の構成に関する情報を取得する。

　本実施例では、リストアペア生成部２３１は、サーバテーブル２２１のＯＳ４０６に格納される情報を取得する。リストアペア生成部２３１は、ＯＳの種別毎に、複数の現用系サーバ１１０を複数のグループに分類する。なお、グループには、少なくとも一つ以上の現用系サーバ１１０が含まれる。

　なお、前述した分類方法は一例であって、本発明はこれに限定されない。例えば、リストアペア生成部２３１は、現用系サーバ１１０の種別等のハードウェア構成、アプリケーションの種別、又は仮想化ソフトウェアの種別等のソフトウェア構成に基づいて、複数の現用系サーバ１１０を複数のグループに分類してもよい。

　以上が、ステップＳ１４０１の処理である。

　次に、リストアペア生成部２３１は、各グループに対して、コールドスタンバイグループ１６０に含まれる複数の予備系サーバ１１０を割り当てる（ステップＳ１４０２）。

　具体的には、リストアペア生成部２３１は、各グループに含まれる現用系サーバ１１０の数に基づいて、各グループに割り当てる予備系サーバ１１０の数を決定する。

　さらに、リストアペア生成部２３１は、サーバテーブル２２１を参照して、グループに含まれる現用系サーバ１１０のハードウェア構成と同一又は類似のハードウェア構成の予備系サーバ１１０を、各グループに決定された数だけ割り当てる。

　なお、前述した予備系サーバ１１０の割り当て方法は一例であって、本発明はこれに限定されない。

　次に、リストアペア生成部２３１は、各グループについて、当該グループに含まれる現用系サーバ１１０の優先順位を決定する（ステップＳ１４０３）。

　具体的には、リストアペア生成部２３１は、障害が発生する可能性のある現用系サーバ１１０の優先順位が高くなるように決定する。例えば、以下のような決定方法が考えられる。

　一つの方法は、内部記憶デバイス３０５の読み出しエラー等の障害履歴情報に基づいて決定する方法である。この場合、リストアペア生成部２３１は、サーバテーブル２２１を参照して、グループに含まれる現用系サーバ１１０に対応するエントリの読み出しエラー回数４０５の値が大きいものから順に、高い優先順位を決定する。

　他の方法は、現用系サーバ１１０の稼働時間に基づいて決定する方法である。この場合、リストアペア生成部２３１は、稼働時間が長い現用系サーバ１１０から順に、高い優先順位を決定する。

　業務システムの構成時には障害が発生する可能性が不明である場合がある。この場合、リストアペア生成部２３１は、サーバテーブル２２１のエントリ順に、高い優先順位を決定すればよい。

　なお、前述した優先順位の決定方法は一例であって、本発明はこれに限定されない。

　次に、リストアペア生成部２３１は、各グループに含まれる現用系サーバと、各グループに割り当てられた予備系サーバ１１０とを対応づけることによって、複数のリストアペア１７０を生成する（ステップＳ１４０４）。具体的には、以下のような処理が実行される。

　リストアペア生成部２３１は、処理対象となるグループを一つ選択する。リストアペア生成部２３１は、選択されたグループに含まれる現用系サーバ１１０の優先順位に基づいて、現用系サーバ１１０と予備系サーバ１１０とを対応づけることによって、一つ以上のリストアペア１７０を生成する。また、リストアペア生成部２３１は、生成された複数のリストアペア１７０の識別情報を決定する。

　本実施例では、選択されたグループに一つの予備系サーバ１１０が割り当てられる場合、一つのリストアペア１７０が生成され、また、選択されたグループに複数の予備系サーバ１１０が割り当てられる場合、予備系サーバ１１０の数だけ複数のリストアペア１７０が生成される。複数のリストアペア１７０を生成する方法としては、例えば、以下のような方法が考えられる。

　グループに二つの予備系サーバ１１０が割り当てられている場合、リストアペア生成部２３１は、一つの予備系サーバ１１０と、優先順位の値が奇数である現用系サーバ１１０とを対応づけ、また、他の予備系サーバ１１０と、優先順位が偶数である現用系サーバ１１０とを対応づける。

　また、他の方法としては以下のような方法が考えられる。グループにｎ台の予備系サーバ１１０が割り当てられている場合、リストアペア生成部２３１は、各予備系サーバ１１０に「０」から「ｎ－１」の番号を割り当てる。リストアペア生成部２３１は、現用系サーバ１１０の優先順位の値を「ｎ」で除算した余りを算出する。リストアペア生成部２３１は、割り当てられた番号が「ｋ」である予備系サーバと、算出された余りが「ｋ」である現用系サーバ１１０とを対応づける。

　前述した方法は一例であって、本発明はこれに限定されない。障害が発生する可能性の高い現用系サーバ１１０が、一つの予備系サーバ１１０に集中しないように対応づけられる方法であればどのような方法であってもよい。

　本実施例では、一つの予備系サーバと一つ以上の現用系サーバ１１０とからリストアペア１７０が構成される。現用系サーバ１１０に障害が発生した場合、リストアペア１７０に含まれる予備系サーバ１１０が業務を引き継ぐ。

　リストアペア生成部２３１は、全てのグループに対して前述した処理を実行する。

　以上がステップＳ１４０４の処理である。

　次に、リストアペア生成部２３１は、生成された複数のリストアペア１７０に関する情報に基づいて、リストアペアテーブル２４１を更新する（ステップＳ１４０５）。具体的には、以下のような処理が実行される。

　リストアペア生成部２３１は、リストアペア名６０１に、生成された複数のリストアペア１７０の各々の識別情報を格納し、コールドスタンバイグループ名６０２にコールドスタンバイグループ１６０の識別情報を格納する。

　また、リストアペア生成部２３１は、予備系サーバ名６０３に、リストアペア１７０に含まれる予備系サーバ１１０の識別情報を格納し、現用系サーバ名６０４に、リストアペア１７０に含まれる現用系サーバ１１０の識別情報を格納する。さらに、リストアペア生成部２３１は、優先順位６０５に、ステップ１４０３において決定された優先順位を格納する。このとき、共通イメージ名６０６及びリストアフラグ６０７は空欄の状態となっている。

　以上がステップＳ１４０５の処理である。

　次に、リストアペア生成部２３１は、共通イメージ決定部２３３に対して、共通イメージ決定処理の実行指示を出力する（ステップＳ１４０６）。リストアペア生成部２３１は、共通イメージ決定部２３３から処理が終了した旨の通知を受信するまで待ち状態となる。なお、共通イメージ決定処理の詳細については、図１６を用いて後述する。

　リストアペア生成部２３１は、共通イメージ決定部２３３から受信した処理結果に基づいて、リストアペアテーブル２４１を更新し（ステップＳ１４０７）、処理を終了する。

　具体的には、リストアペア生成部２３１は、処理結果に含まれるリストアペア１７０の識別情報に基づいて、リストアペアテーブル２４１を参照し、更新するエントリを特定する。リストアペア生成部２３１は、特定されたエントリの共通イメージ名６０６に決定された共通イメージの識別情報を格納し、リストアフラグ６０７に「未」を格納する。

　なお、ステップＳ１４０３の処理を省略してもよい。この場合、リストアペア生成部２３１は、各グループに含まれる現用系サーバ１１０と、当該グループに割り当てられた一つ以上の予備系サーバ１１０とを対応づけることによって、リストアペア１７０を生成する。

　ここで、図４を用いて、ステップＳ１４０１からステップＳ１４０４までの処理の具体例について説明する。

　ステップＳ１４０１では、以下のような処理が実行される。

　リストアペア生成部２３１は、コールドスタンバイグループテーブル２２２を参照して、「コールドスタンバイグループテーブル１」には現用系サーバ１１０としてサーバＡ、サーバＢ、サーバＣ、サーバＤ、及びサーバＥの五つの現用系サーバ１１０が含まれることを特定する。

　リストアペア生成部２３１は、サーバテーブル２２１を参照して、ＯＳ４０６が「ＯＳ１」であるグループ１と、ＯＳ４０６が「ＯＳ２」であるグループ２とに分類する。グループ１には、サーバＡ、サーバＢ、サーバＤ、及びサーバＥが含まれ、グループ２には、サーバＣが含まれる。

　ステップＳ１４０２では、以下のような処理が実行される。

　リストアペア生成部２３１は、グループ１に含まれる現用系サーバ１１０の数は「４」であり、グループ２に含まれる現用系サーバ１１０の数は「１」であるため、リストアペア生成部２３１は、４対１の比率となるように、各グループに割り当てる予備系サーバ１１０の数を決定する。なお、当該比率は目安であり、必ずしも当該比率と完全に一致するように予備系サーバ１１０の数を決定する必要はない。

　「コールドスタンバイグループ１」に含まれる予備系サーバ１１０の数は「３」であるため、リストアペア生成部２３１は、前述した比率に基づいて、グループ１に予備系サーバ１１０を二つ、グループ２に予備系サーバを一つ割り当てる。ここでは、リストアペア生成部２３１は、グループ１にサーバＸ、及びサーバＹを割り当て、グループ２にサーバＺを割り当てるものとする。

　ステップＳ１４０３では、以下のような処理が実行される。ここでは、読み出しエラー回数４０５に基づく優先順位の決定方法を適用した場合について説明する。

　リストアペア生成部２３１は、グループ１ではサーバＤ、サーバＢ、サーバＡ、サーバＥの順に高い優先順位を付与し、グループ２ではサーバＣに高い優先順位を付与する。

　ステップＳ１４０４では、以下のような処理が実行される。

　リストアペア生成部２３１は、サーバＸとサーバＤ及びサーバＡとを対応づけて、予備系サーバＹとサーバＢ及びサーバＥとを対応付けて、また、サーバＺとサーバＣとを対応づけることによって、三つのリストアペア１７０を生成する。

　図１５は、本発明の実施例１における管理サーバ１００が実行する共通イメージ決定処理の一例を説明するフローチャートである。

　共通イメージ決定部２３３は、リストアペア生成部２３１から共通イメージ決定処理の実行指示を受信すると処理を開始する。

　共通イメージ決定部２３３は、リストアペアテーブル２４１を参照して、生成された複数のリストアペア１７０の中から、処理対象のリストアペア１７０を選択する（ステップＳ１５０１）。

　具体的には、共通イメージ決定部２３３は、リストアペアテーブル２４１から、リストアペア１７０のエントリを選択する。本実施例では、リストアペアテーブル２４１の上から順にエントリが選択されるものとする。

　ステップＳ１５０１～ステップＳ１５０７は、リストアペア１７０のループ処理である。各リストアペア１７０に対して、ステップＳ１５０２～ステップＳ１５０６の処理が繰り返し実行される。

　共通イメージ決定部２３３は、選択されたリストアペア１７０に含まれる全ての現用系サーバ１１０のフルバックアップイメージがデプロイイメージであるか否かを判定する（ステップＳ１５０２）。すなわち、業務システムの構成時の処理、又は、業務システムの運用時の処理の何れであるかが判定される。全ての現用系サーバ１１０のフルバックアップイメージがデプロイイメージである場合、業務システム構成時の処理であると判定される。具体的には以下のような処理が実行される。

　共通イメージ決定部２３３は、リストアペアテーブル２４１を参照して、選択されたリストアペア１７０に含まれる全ての現用系サーバ１１０の識別情報を取得する。

　共通イメージ決定部２３３は、取得されたサーバ１１０の識別情報に基づいて、フルバックアップイメージ構成テーブル２４２を参照して、選択されたリストアペア１７０に含まれる各現用系サーバ１１０のフルバックアップイメージの識別情報を取得する。具体的には、共通イメージ決定部２３３は、現用系サーバ名７０２が取得されたサーバ１１０の識別情報と一致するエントリを検索し、検索されたエントリのフルバックアップイメージ名７０１からフルバックアップイメージの識別情報を取得する。

　共通イメージ決定部２３３は、取得されたフルバックアップイメージの識別情報に基づいて、選択されたリストアペア１７０に含まれる各現用系サーバ１１０のフルバックアップイメージがデプロイイメージであるか否かを判定する。

　共通イメージ決定部２３３は、前述した判定結果に基づいて、選択されたリストアペア１７０に含まれる全ての現用系サーバ１１０のフルバックアップイメージがデプロイイメージであるか否かを判定する。

　以上がステップＳ１５０２の処理である。

　リストアペア１７０に含まれる全ての現用系サーバ１１０のフルバックアップイメージがデプロイイメージであると判定された場合、共通イメージ決定部２３３は、デプロイイメージの中から、最も適用回数が多いデプロイイメージを共通イメージとして決定する（ステップＳ１５０３）。例えば、管理サーバ１００が、デプロイイメージの適用回数を保持し、当該適用回数に基づいて共通イメージを決定する。

　ステップＳ１５０２において、リストアペア１７０に含まれる全ての現用系サーバ１１０のフルバックアップイメージがデプロイイメージでないと判定された場合、共通イメージ決定部２３３は、リストアペア１７０に含まれる全ての現用系サーバ１１０の最新のフルバックアップイメージを選択する（ステップＳ１５０４）。

　具体的には、共通イメージ決定部２３３は、フルバックアップイメージ構成テーブル２４２を参照して、リストアペア１７０に含まれる全ての現用系サーバ１１０に対応するエントリを特定する。共通イメージ決定部２３３は、特定されたエントリのうち、タイムスタンプ８０５が最新のエントリを選択する。

　共通イメージ決定部２３３は、選択されたフルバックイメージを比較することによって、各フルバックイメージの共通部分を特定する（ステップＳ１５０５）。

　例えば、リストアペア１７０に現用系サーバ１１０としてサーバＡ、サーバＢ、及びサーバＣの三つの現用系サーバ１１０が含まれる場合、共通イメージ決定部２３３は、サーバＡ、サーバＢ、及びサーバＣのフルバックアップイメージをそれぞれ比較する。すなわち、共通イメージ決定部２３３は、サーバＡのフルバックアップイメージについて、サーバＢ及びサーバＣのフルバックアップイメージと比較し、サーバＢのフルバックアップイメージについて、サーバＡ及びサーバＣのフルバックアップイメージと比較し、サーバＣのフルバックアップイメージについて、サーバＡ及びサーバＢのフルバックアップイメージと比較する。

　共通イメージ決定部２３３は、フルバックアップイメージの比較結果に基づいて、他のフルバックアップイメージとの共通部分が最も多いフルバックアップイメージを共通イメージとして決定する（ステップＳ１５０６）。

　本実施例では、共通するファイルの数、又は共通するファイルのデータ容量が最も多いフルバックアップイメージが共通イメージとして決定される。例えば、サーバＡのフルバックイメージがサーバＢ及びサーバＣのフルバックアップイメージと共通するファイルの数が「１００」、サーバＢのフルバックアップイメージがサーバＡ及びサーバＣのフルバックアップイメージと共通するファイルの数が「２００」、サーバＣのフルバックアップイメージがサーバＡ及びサーバＢのフルバックアップイメージと共通するファイル数が「１２０」である場合、サーバＢのフルバックアップイメージが共通イメージとして決定される。

　ステップＳ１５０７において、全てのリストアペア１７０について処理が完了していない場合、共通イメージ決定部２３３は、ステップＳ１５０２に戻り、次のリストアペア１７０を選択する。ステップＳ１５０７において、全てのリストアペア１７０について処理が完了している場合、共通イメージ決定部２３３は、処理を終了する。

　なお、共通イメージ決定部２３３は、処理が終了した後、共通イメージの識別情報、及びリストアペアの識別情報を含む処理完了通知をリストアペア生成部２３１に送信する。

　図１６は、本発明の実施例１における管理サーバ１００が実行する共通イメージリストア処理の一例を説明するフローチャートである。

　共通イメージリストア処理は、リストア部２３７によって実行される。

　リストア部２３７は、リストアペアテーブル２４１を参照して、複数のリストアペア１７０の中から、処理対象のリストアペア１７０を選択する（ステップＳ１６０１）。

　具体的には、リストア部２３７は、リストアペアテーブル２４１から、リストアペア１７０のエントリを選択する。本実施例では、リストアペアテーブル２４１の上から順にエントリが選択されるものとする。

　ステップＳ１６０１～ステップＳ１６０４は、リストアペア１７０のループ処理である。各リストアペア１７０に対して、ステップＳ１６０２～ステップＳ１６０３の処理が繰り返し実行される。

　リストア部２３７は、選択されたリストアペア１７０に含まれる予備系サーバ１１０に、共通イメージをリストアする（ステップＳ１６０２）。具体的には、以下のような処理が実行される。

　リストア部２３７は、リストアペアテーブル２４１を参照し、選択されたリストアペア１７０に対応するエントリの共通イメージ名６０６に基づいて、共通イメージを特定する。リストア部２３７は、特定された共通イメージに対応するフルバックアップイメージを外部ストレージ装置１８０から取得する。

　リストア部２３７は、当該エントリの予備系サーバ名６０３に対応する予備系サーバ１１０にバックアップ取得／復元エージェント２３６とともに、起動指示を送信する。これによって、予備系サーバ１１０上でバックアップ取得／復元エージェント２３６が稼働する。

　リストア部２３７は、予備系サーバ１１０に、取得されたフルバックアップイメージを送信する。このとき、予備系サーバ１１０上で稼働するバックアップ取得／復元エージェント２３６が、受信したイメージを、内部記憶デバイス３０５にリストアする。

　以上がステップＳ１６０２の処理である。

　次に、リストア部２３７は、リストアペアテーブル２４１のリストアフラグ６０７を更新する（ステップＳ１６０３）。

　具体的には、リストア部２３７は、リストアペアテーブル２４１のリストアフラグ６０７に、「済」を格納する。

　全てのリストアペア１７０について処理が完了していない場合、リストア部２３７は、ステップＳ１６０２に戻り、次のリストアペア１７０を選択する。全てのリストアペア１７０について処理が完了している場合、リストア部２３７は、処理を終了する。

　図１７は、本発明の実施例１におけるリストアペアテーブル２４１の一例を示す説明図である。図１７に示すリストアペアテーブル２４１は、共通イメージリストア処理が終了した後の状態を示す。

　図１８は、本発明の実施例１における管理サーバ１００が実行する個別イメージ生成処理の一例を説明するフローチャートである。

　共通イメージ決定部２３３は、リストアペアテーブル２４１を参照して、複数のリストアペア１７０の中から、処理対象のリストアペア１７０を選択する（ステップＳ１８０１）。

　ステップＳ１８０１～ステップＳ１８１１の処理は、リストアペア１７０のループ処理である。各リストアペア１７０に対して、ステップＳ１８０２～ステップＳ１８１０の処理が繰り返し実行される。

　個別イメージ生成部２３４は、選択されたリストアペア１７０に含まれる現用系サーバを一つ選択する（ステップＳ１８０２）。

　ステップＳ１８０２～ステップＳ１８１０の処理は、現用系サーバ１１０のループ処理である。各現用系サーバ１１０に対して、ステップＳ１８０３～ステップＳ１８０９の処理が繰り返し実行される。

　個別イメージ生成部２３４は、選択されたリストアペア１７０の共通イメージ、及び選択された現用系サーバ１１０のフルバックアップイメージを特定する（ステップＳ１８０３）。具体的には、以下のような処理が実行される。

　個別イメージ生成部２３４は、リストアペアテーブル２４１を参照して、選択されたリストアペア１７０に対応するエントリを特定し、特定されたエントリの共通イメージ名６０６から共通イメージの識別情報を取得する。また、個別イメージ生成部２３４は、共通イメージの識別情報に基づいて、フルバックアップイメージ構成テーブル２４２を参照することによって、共通イメージに対応するフルバックアップイメージのエントリを特定する。

　また、個別イメージ生成部２３４は、フルバックアップイメージ構成テーブル２４２を参照して、選択された現用系サーバ１１０に対応するエントリを特定する。

　以下の説明では、選択されたリストアペア１７０の共通イメージを対象共通イメージとも記載し、選択された現用系サーバ１１０のフルバックアップイメージを対象フルバックアップイメージとも記載する。

　以上がステップＳ１８０３の処理である。

　次に、個別イメージ生成部２３４は、対象フルバックアップイメージのＭＢＲイメージを特定する（ステップＳ１８０４）。

　具体的には、個別イメージ生成部２３４は、特定された現用系サーバ１１０のエントリのＭＢＲイメージ名７０３を参照することによって、対象フルバックアップイメージのＭＢＲイメージを特定する。

　次に、個別イメージ生成部２３４は、対象フルバックアップイメージのファイル領域の中からパーティションを一つ選択する（ステップＳ１８０５）。

　ステップＳ１８０５～ステップＳ１８０７の処理は、パーティションのループ処理である。対象フルバックアップイメージのパーティション毎に、ステップＳ１８０６の処理が繰り返し実行される。

　個別イメージ生成部２３４は、対象フルバックアップイメージのパーティションと、当該パーティションに対応する対象共通イメージのパーティションとを比較し、差分ファイルセットを記録する（ステップＳ１８０６）。

　具体的には、個別イメージ生成部２３４は、対象共通イメージのパーティションに格納されるファイルセットから変更されたファイル及び削除されたファイルを差分ファイルセットとして、メモリ２０２上に記録する。なお、差分ファイルセットは、外部ストレージ装置１８０に記録されてもよい。

　ステップＳ１８０７において、対象フルバックアップイメージの全てのパーティションについて処理が完了していない場合、個別イメージ生成部２３４は、ステップＳ１８０５に戻り、次のパーティションについて同様の処理を実行する。

　ステップＳ１８０７において、対象フルバックアップイメージの全てのパーティションについて処理が完了している場合、個別イメージ生成部２３４は、ステップＳ１８０４において特定されたＭＢＲイメージ、及びステップＳ１８０６において記録された差分ファイルに基づいて、個別イメージを生成する（ステップＳ１８０８）。生成された個別イメージは、外部ストレージ装置１８０に格納される。

　なお、個別イメージ生成部２３４は、具体的なイメージを生成しなくともよい。例えば、個別イメージ生成部２３４は、ＭＢＲイメージ及び差分ファイルを対応づけることによって、個別イメージとして認識できる情報を生成できればよい。

　個別イメージ生成部２３４は、生成された個別イメージの情報に基づいて、個別イメージ構成テーブル２４３及びバックアップデータテーブル２４４を更新する（ステップＳ１８０９）。

　個別イメージ構成テーブル２４３については以下のように更新される。

　個別イメージ生成部２３４は、個別イメージ構成テーブル２４３にエントリを追加し、当該エントリの個別イメージ名８０１に、生成された個別イメージの識別情報を格納し、ＭＢＲイメージ名８０２に、ステップＳ１８０２において特定されたＭＢＲの識別情報を格納する。

　また、個別イメージ生成部２３４は、追加されたエントリのファイルセット名８０３に、差分ファイルセットのうち、追加又は更新されたファイルセットの識別情報を格納し、ファイルセット名８０４に差分ファイルセットのうち、削除されたファイルセットの識別情報を格納する。さらに、個別イメージ生成部２３４は、タイムスタンプ８０５に、個別イメージが生成された時刻を格納する。

　バックアップデータテーブル２４４については以下のように更新される。

　個別イメージ生成部２３４は、バックアップデータテーブル２４４に新たなエントリを追加し、当該エントリの現用系サーバ名９０１に、選択された現用系サーバ１１０の識別情報を格納する。また、個別イメージ生成部２３４は、追加されたエントリの共通イメージ名９０２に、特定された共通イメージの識別情報を格納し、個別イメージ名９０３に、生成された個別イメージの識別情報を付与する。

　なお、差分情報名９０４及びタイムスタンプ９０５は、空欄の状態である。

　以上がステップＳ１８０９の処理である。

　ステップＳ１８１０において、個別イメージ生成部２３４は、選択されたリストアペア１７０に含まれる全ての現用系サーバ１１０について処理が完了していない場合、個別イメージ生成部２３４は、ステップＳ１８０２に戻り、次の現用系サーバ１１０を選択して同様の処理を実行する。

　ステップ１８１０において選択されたリストアペア１７０に含まれる全ての現用系サーバ１１０について処理が完了している場合、個別イメージ生成部２３４は、ステップＳ１８１１に進む。

　ステップＳ１８１１において、全てのリストアペア１７０について処理が完了していない場合、ステップＳ１８０１に戻り、次のリストアペア１７０を選択して同様の処理を実行する。

　ステップＳ１８１１において、全てのリストアペア１７０について処理が完了している場合、個別イメージ生成部２３４は、処理を終了する。

　なお、個別イメージ生成部２３４は、バックアップデータテーブル２４４の一つのエントリの差分情報名９０４に所定数以上の差分情報が格納されている場合、又は、周期的に、個別イメージに差分情報を反映させることによって、新たな個別イメージを生成してもよい。

　図１９は、本発明の実施例１における管理サーバ１００が実行するサーバ切替処理の一例を説明するフローチャートである。

　管理サーバ１００は、現用系サーバ１１０の障害を検出すると、サーバ切替処理を開始する。本実施例では、サーバ管理部１０１は、障害が発生した現用系サーバ１１０の識別情報、及び障害の原因等の情報を取得するものとする。

　なお、本発明は現用系サーバ１１０の障害検出方法に限定されない。障害が発生した現用系サーバ１１０を特定できる方法であればどのような方法を用いてもよい。

　管理サーバ１００は、障害が発生した現用系サーバ１１０を停止させる（ステップＳ１９０１）。

　例えば、管理サーバ１００は、現用系サーバ１１０上で稼働するバックアップ取得／復元エージェント２３６に停止指示を送信する。バックアップ取得／復元エージェント２３６は、当該停止指示を受信すると、現用系サーバ１１０を電源ＯＦＦの状態に変更する。

　管理サーバ１００は、予備系サーバ１１０を選択するための予備系サーバ選択処理を実行する（ステップＳ１９０２）。また、管理サーバ１００は、選択された予備系サーバ１１０にバックアップデータをリストアするためのリストア処理を実行する（ステップＳ１９０３）。

　予備系サーバ選択処理の詳細については、図２０を用いて後述する。また、リストア処理の詳細については、図２１を用いて後述する。

　管理サーバ１００は、予備系サーバ選択処理によって選択された予備系サーバに、現用系サーバ１１０のＷＷＮを付与する（ステップＳ１９０４）。

　具体的には、ＷＷＮ変更部２１５が、予備系サーバ１１０に、現用系サーバ１１０が使用していたＷＷＮを付与する。

　管理サーバ１００は、予備系サーバ選択処理によって選択された予備系サーバ１１０に、現用系サーバ１１０のＢＩＯＳの設定情報を設定する（ステップＳ１９０５）。具体的には、以下のような処理が実行される。

　ＢＩＯＳ情報リストア部２１６が、現用系サーバ１１０の識別情報に基づいてサーバテーブル２２１を参照して、現用系サーバ１１０のエントリを検索する。ＢＩＯＳ情報リストア部２１６は、検索されたエントリのＢＩＯＳ情報４１０に基づいて、現用系サーバ１１０のＢＩＯＳ情報の識別情報を取得する。

　ＢＩＯＳ情報リストア部２１６は、取得されたＢＩＯＳ情報の識別情報に基づいて、外部ストレージ装置１８０から、特定された現用系サーバ１１０のＢＩＯＳ情報を取得する。さらに、ＢＩＯＳ情報リストア部２１６は、取得されたＢＩＯＳ情報を、予備系サーバ１１０に設定する。

　以上がステップＳ１９０５の処理である。

　次に、管理サーバ１００は、選択された予備系サーバ１１０を起動させ（ステップＳ１９０６）、処理を終了する。例えば、管理サーバ１００は、予備系サーバ１１０上で稼働するバックアップ取得／復元エージェント２３６に、予備系サーバ１１０の起動指示を送信する。

　図２０は、本発明の実施例１における管理サーバ１００が実行する予備系サーバ選択処理の一例を説明するフローチャートである。

　管理サーバ１００は、障害が発生した現用系サーバ１１０がリストアペア１７０に含まれる現用系サーバ１１０であるか否かを判定する（ステップＳ２００１）。

　具体的には、切替先サーバ選択部２１４は、障害が発生した現用系サーバ１１０の識別情報に基づいて、リストアペアテーブル２４１の現用系サーバ名６０４を参照する。現用系サーバ名６０４に、障害が発生した現用系サーバ１１０の識別情報が格納されるエントリが見つかった場合、切替先サーバ選択部２１４は、当該現用系サーバ１１０がリストアペア１７０に含まれる現用系サーバ１１０であると判定する。

　障害が発生した現用系サーバがリストアペア１７０に含まれる現用系サーバ１１０であると判定された場合、管理サーバ１００は、当該リストアペア１７０に含まれる予備系サーバ１１０の中から予備系サーバ１１０を選択し（ステップＳ２００２）、処理を終了する。

　例えば、切替先サーバ選択部２１４は、現用系サーバ１１０のハードウェア構成と同一のハードウェア構成である予備系サーバ１１０を選択する方法が考えられる。なお、本発明は切替先の予備系サーバ１１０の選択方法に限定されない。

　なお、本実施例では、一つ以上の現用系サーバ１１０と一つの予備系サーバ１１０とからリストアペア１７０が構成されるため、切替先の予備系サーバ１１０は自動的に選択される。

　障害が発生した現用系サーバがリストアペア１７０に含まれる現用系サーバ１１０でないと判定された場合、管理サーバ１００は、コールドスタンバイグループ１６０に含まれる予備系サーバ１１０の中から任意の予備系サーバ１１０を選択し（ステップＳ２００３）、処理を終了する。

　図２１は、本発明の実施例１における管理サーバ１００が実行するリストア処理の一例を説明するフローチャートである。

　管理サーバ１００は、切替先の予備系サーバ１１０に共通イメージがリストアされているか否かを判定する（ステップＳ２１０１）。

　具体的には、リストア部２３７は、切替先の予備系サーバ１１０の識別情報に基づいて、リストアペアテーブル２４１を参照して、当該予備系サーバ１１０に対応するエントリを検索する。リストア部２３７は、検索されたエントリのリストアフラグ６０７に「済」が格納されているか否かを判定する。

　切替先の予備系サーバ１１０に共通イメージがリストアされていないと判定された場合、管理サーバ１００は、当該予備系サーバ１１０に、共通イメージをリストアし（ステップＳ２１０２）、ステップＳ２１０３に進む。

　具体的には、リストア部２３７は、検索されたエントリの共通イメージ名６０６を参照して共通イメージを特定し、外部ストレージ装置１８０から特定共通イメージを取得する。さらに、リストア部２３７は、取得された共通イメージを切替先の予備系サーバ１１０にリストアする。

　切替先の予備系サーバ１１０に共通イメージがリストアされていると判定された場合、管理サーバ１００は、当該予備系サーバ１１０に、現用系サーバ１１０の個別イメージをリストアする（ステップＳ２１０３）。具体的には、以下のような処理が実行される。

　リストア部２３７は、障害が発生した現用系サーバ１１０の識別情報に基づいて、バックアップデータテーブル２４４を参照し、当該現用系サーバ１１０に対応するエントリを検索する。リストア部２３７は、検索されたエントリの個別イメージ名９０３を参照して、個別イメージの識別情報を特定する。

　リストア部２３７は、特定された個別イメージ情報の識別情報に基づいて、外部ストレージ装置１８０から個別イメージを取得し、取得された個別イメージを予備系サーバ１１０にリストアする。

　以上がステップＳ２１０３の処理である。

　次に、管理サーバ１００は、予備系サーバ１１０に、現用系サーバ１１０の差分情報をリストアし（ステップＳ２１０４）、処理を終了する。具体的には、以下のような処理が実行される。

　リストア部２３７は、障害が発生した現用系サーバ１１０の識別情報に基づいて、バックアップデータテーブル２４４を参照し、当該現用系サーバ１１０のエントリを検索する。リストア部２３７は、検索されたエントリの差分情報名９０４及びタイムスタンプ９０５を参照して、差分情報の識別情報及び生成時刻を取得する。

　リストア部２３７は、取得された差分情報の識別情報に基づいて、外部ストレージ装置１８０から、差分情報を取得する。リストア部２３７は、生成時刻が古いものから順に、取得された差分情報を切替先の予備系サーバ１１０にリストアする。

　なお、個別イメージそのものが生成されない場合、ステップＳ２１０３の処理の一部が異なる。具体的には、リストア部２３７は、検索されたエントリの個別イメージ名９０３を参照して、個別イメージの識別情報を特定した後の処理が異なる。

　リストア部２３７は、特定された個別イメージの識別情報に基づいて、個別イメージ構成テーブル２４３を参照し、個別イメージ名８０１に取得された個別イメージの識別情報が格納されるエントリを検索する。リストア部２３７は、検索されたエントリのＭＢＲイメージ名８０２、ファイルセット名８０３、８０４に基づいて、個別イメージを構成する情報を特定する。

　さらに、リストア部２３７は、外部ストレージ装置１８０から、個別イメージを構成する情報を取得し、取得された情報を予備系サーバ１１０にリストアする。

　以上で説明したように、本発明は、業務を実行するための構成が共通する現用系サーバ１１０が同一のリストアペア１７０に含まれることに特徴がある。また、本発明は、リストアペア１７０毎に予備系サーバ１１０にリストアする共通イメージを決定することに特徴がある。

　これによって、障害が発生した現用系サーバ１１０の個別イメージを共通イメージに反映させるのみで、予備系サーバ１１０が業務を引き継ぐことができる。すなわち、異なるフルバックイメージを予備系サーバ１１０にリストアする必要がなくなるため、予備系サーバ１１０への切替時間を短縮することができる。

　また、本発明は、他のフルバックアップイメージとの共通部分が多いフルバックアップイメージを共通イメージとして、予め予備系サーバ１１０リストアすることに特徴がある。

　これによって、共通イメージと、各現用系サーバ１１０のフルバックアップイメージとの間の差異が最小となるため個別イメージのデータサイズが最小となり、予備系サーバ１１０への切替時間をより短縮することができる。

　また、実施例１では、さらに、共通イメージに差分情報を反映させることによって、現用系サーバ１１０の障害が発生する前の業務の状態を復元できるため、バックアップイメージの陳腐化を防止することができる。

　第１の実施例では、フルバックアップイメージ間の共通部分に基づいて、共通イメージを決定していたが、第２の実施例では、障害発生の可能性を示す指標に基づいて決定する点が異なる。以下、第１の実施例との差異を中心に説明する。

　第２の実施例の計算機システム、管理サーバ１００、サーバ１１０、及び各テーブルの構成は、第１の実施例と同一であるため説明を省略する。

　第２の実施例では、共通イメージ決定処理が異なる。

　図２２は、本発明の実施例２における管理サーバ１００が実行する共通イメージ決定処理の一例を説明するフローチャートである。

　ステップＳ１５０１からステップＳ１５０３の処理、及びステップＳ１５０７の処理は、第１の実施例と同一であるため説明を省略する。

　ステップＳ１５０２において、リストアペア１７０に含まれる全ての現用系サーバ１１０のフルバックアップイメージがデプロイイメージでないと判定された場合、共通イメージ決定部２３３は、サーバテーブル２２１を参照して（ステップＳ２２０１）、障害発生の可能性が最も高い現用系サーバ１１０のフルバックアップイメージを共通イメージとして決定する（ステップＳ２２０２）。

　具体的には、共通イメージ決定部２３３は、リストアペアテーブル２４１を参照して、選択されたリストアペア１７０に対応するエントリを特定する。共通イメージ決定部２３３は、特定されたエントリの優先順位６０５を参照して、当該優先順位６０５の値が最も小さい現用系サーバ１１０を選択する。共通イメージ決定部２３３は、選択された現用系サーバ１１０のフルバックアップイメージを共通イメージとして決定する。

　本実施例では、優先順位６０５は、読み出しエラー回数等に基づいて決定されているため、障害発生の可能性を示す指標となる。

　その他の処理は、第１の実施例と同一であるため説明を省略する。

　実施例２によれば、障害が発生する可能性の高い現用系サーバ１１０のフルバックアップイメージを共通イメージとして予備系サーバ１１０にリストアすることによって、当該現用系サーバ１１０から予備系サーバ１１０へ高速に切り替えることができる。

　なお、第１の実施例及び第２の実施例を組合せてもよい。例えば、業務システムの構築時に、共通イメージ決定部２３３は、フルバックアップイメージの共通部分に基づいて共通イメージを決定し、業務システムの運用時に、優先順位６０５に基づいて共通イメージを決定する実施例が考えられる。

　なお、本実施例で例示した種々のソフトウェアは、電磁的、電子的及び光学式等の種々の記録媒体（例えば、非一時的な記憶媒体）に格納可能であり、インターネット等の通信網を通じて、コンピュータにダウンロード可能である。

　さらに、本実施例では、ソフトウェアによる制御を用いた例について説明したが、その一部をハードウェアによって実現することも可能である。

　以上、本発明を添付の図面を参照して詳細に説明したが、本発明はこのような具体的構成に限定されるものではなく、添付した請求の範囲の趣旨内における様々な変更及び同等の構成を含むものである。

Claims

　複数の計算機と、前記複数の計算機から構成されるクラスタを管理する管理計算機と、を備える計算機システムであって、
　前記複数の計算機の各々は、第１のプロセッサ、前記第１のプロセッサに接続される第１のメモリ、前記第１のプロセッサに接続される記憶デバイス、及び前記第１のプロセッサに接続される第１のネットワークインタフェースを有し、
　前記管理計算機は、第２のプロセッサ、前記第２のプロセッサに接続される第２のメモリ、及び前記第２のプロセッサに接続される第２のネットワークインタフェースを有し、
　前記クラスタを構成する前記複数の計算機は、前記記憶デバイスを用いて業務を実行する複数の第１の計算機と、障害が発生した第１の計算機が実行する業務を引き継ぐ複数の第２の計算機とを含み、
　前記管理計算機は、
　前記複数の第１の計算機の各々のバックアップイメージを取得するバックアップ取得部と、
　一つ以上の第１の計算機と、一つ以上の第２の計算機とから構成される複数のリストアペアを生成し、前記複数のリストアペア毎に、一つのリストアペアに含まれる前記一つ以上の第２の計算機にリストアする共通イメージを選択するリストアペア管理部と、を有し、
　前記クラスタを構成する複数の計算機の各々のハードウェア構成の情報及びソフトウェア構成の情報を管理するサーバ管理情報を保持し、
　前記リストアペア管理部は、
　前記クラスタの構成が変更されたことを検出した場合に、前記サーバ管理情報を参照して、前記複数の第１の計算機を、前記業務を提供するためのソフトウェア構成が共通する複数のグループに分類し、
　前記サーバ管理情報を参照して、前記複数の第１の計算機の各々のハードウェア構成の情報及び前記複数の第２の計算機の各々のハードウェア構成の情報に基づいて、前記複数のグループの各々に、少なくとも一つ以上の第２の計算機を割り当て、
　前記複数のグループ毎に、一つのグループに含まれる一つ以上の第１の計算機と、前記一つのグループに割り当てられた少なくとも一つ以上の第２の計算機とを対応づけることによって、一つ以上のリストアペアを生成し、
　前記複数のリストアペア毎に、前記一つのリストアペアに含まれる前記一つ以上の第１の計算機の前記バックアップイメージの中から、前記共通イメージを決定し、
　前記リストアペアの識別情報、前記リストアペアに含まれる前記一つ以上の第１の計算機の識別情報、前記リストアペアに含まれる前記一つ以上の第２の計算機の識別情報、及び前記リストアペアの前記共通イメージの識別情報を対応づけたリストアペア管理情報を生成することを特徴とする計算機システム。
　請求項１に記載の計算機システムであって、
　前記複数のリストアペアの各々には、前記複数の第１の計算機が含まれ、
　前記リストアペア管理部は、
　前記共通イメージを選択する場合に、前記複数のリストアペアの中から処理対象のリストアペアを選択し、
　前記選択されたリストアペアに含まれる前記複数の第１の計算機の各々の前記バックアップイメージを比較して、共通部分を算出し、
　前記算出の結果に基づいて、前記共通部分が最も多い第１の計算機の前記バックアップイメージを、前記共通イメージとして選択し、
　前記選択されたリストアペアに含まれる前記一つ以上の第２の計算機に、前記選択された共通イメージをリストアすることを特徴とする計算機システム。
　請求項１に記載の計算機システムであって、
　前記複数のリストアペアの各々には、前記複数の第１の計算機が含まれ、
　前記サーバ管理情報は、前記複数の第１の計算機の稼働状態を示す稼働履歴情報を含み、
　前記リストアペア管理部は、
　前記共通イメージを選択する場合に、前記複数のリストアペアの中から処理対象のリストアペアを選択し、
　前記サーバ管理情報を参照して、前記選択されたリストアペアに含まれる前記複数の第１の計算機の前記稼働履歴情報を取得し、
　前記取得された稼働履歴情報に基づいて、障害が発生する可能性の高い第１の計算機を特定し、
　前記特定された第１の計算機の前記バックアップイメージを前記共通イメージとして選択し、
　前記選択されたリストアペアに含まれる前記一つ以上の第２の計算機に、前記選択された共通イメージをリストアすることを特徴とする計算機システム。
　請求項２又は請求項３に記載の計算機システムであって、
　前記管理計算機は、
　制御部と、Ｉ／Ｏインタフェースと、複数の記憶デバイスとを有し、前記複数の第１の計算機の各々の前記バックアップイメージを格納するストレージ装置と接続され、
　前記第１の計算機の識別情報と、前記第１の計算機のバックアップイメージの識別情報とを対応づけたバックアップイメージ管理情報を保持し、
　前記リストアペア管理部は、
　前記複数のリストアペアの中から処理対象のリストアペアを選択し、
　前記リストアペア管理情報及び前記バックアップイメージ管理情報に基づいて、前記選択されたリストアペアに含まれる前記複数の第１の計算機の各々の前記バックアップイメージと、前記選択されたリストアペアの前記共通イメージとを特定し、
　前記特定された複数の第１の計算機の各々の前記バックアップイメージと、前記特定された共通イメージとを比較して、複数の第１の差分情報を取得し、
　前記取得された複数の第１の差分情報に基づいて、前記共通イメージに反映することによって前記複数の第１の計算機の各々が実行する業務の状態を復元するための複数の個別イメージを生成し、
　前記生成された複数の個別イメージを前記ストレージ装置に格納することを特徴とする計算機システム。
　請求項４に記載の計算機システムであって、
　前記管理計算機は、
　第１の計算機の障害が検出された場合に、当該第１の計算機が含まれるリストアペアに含まれる前記一つ以上の第２の計算機の中から、切替先の第２の計算機を決定する切替先サーバ決定部と、
　障害が発生した第１の計算機が実行する業務の状態を復元するためにバックアップデータをリストアするリストア部と、を有し、
　第１の計算機の識別情報、共通イメージの識別情報、及び個別イメージの識別情報を対応づけたバックアップデータ管理情報を保持し、
　前記切替先サーバ決定部は、
　前記障害が発生した第１の計算機の識別情報に基づいて、前記リストアペア管理情報を参照して、前記障害が発生した第１の計算機が含まれるリストアペアを特定し、
　前記特定されたリストアペアに含まれる前記一つ以上の第２の計算機の中から、切替先となる第２の計算機を選択し、
　前記リストア部は、
　前記障害が発生した第１の計算機の識別情報に基づいて、前記バックアップデータ管理情報を参照して、前記ストレージ装置から、前記障害が発生した第１の計算機の個別イメージを取得し、
　前記取得された個別イメージを、前記選択された第２の計算機に格納される前記共通イメージに反映することによって、前記障害が発生した第１の計算機が実行する業務の状態を復元することを特徴とする計算機システム。
　請求項５に記載の計算機システムであって、
　前記複数の第１の計算機の各々は、前記記憶デバイスに生じた差分データを、第２の差分情報として取得し、前記取得された第２の差分情報を前記管理計算機に送信する差分情報取得部を有し、
　前記管理計算機は、前記バックアップイメージが取得されてから次に前記バックアップイメージが取得されるまでの間に、前記第２の差分情報を受信した場合に、前記受信した第２の差分情報を前記ストレージ装置に格納し、
　第２の差分情報の識別情報、前記第２の差分情報が生成された時間、及び前記第２の差分情報を送信した第１の計算機の識別情報を対応づけて前記バックアップデータ管理情報に格納し、
　前記リストア部は、
　前記取得された個別イメージを、前記選択された第２の計算機に格納される前記共通イメージに反映した後、前記バックアップデータ管理情報を参照して、前記ストレージ装置から、前記障害が発生した第１の計算機から受信した前記第２の差分情報を取得し、
　前記取得された第２の差分情報が生成された時間が古いものから順に、前記取得された第２の差分情報を、前記個別イメージが反映された共通イメージに反映することによって、前記障害が発生した第１の計算機が実行する業務の状態を復元することを特徴とする計算機システム。
　複数の計算機から構成されるクラスタを含む計算機システムにおけるクラスタ管理方法であって、
　前記計算機システムは、前記クラスタを管理する管理計算機を有し、
　前記複数の計算機の各々は、第１のプロセッサ、前記第１のプロセッサに接続される第１のメモリ、前記第１のプロセッサに接続される記憶デバイス、及び前記第１のプロセッサに接続される第１のネットワークインタフェースを有し、
　前記管理計算機は、第２のプロセッサ、前記第２のプロセッサに接続される第２のメモリ、及び前記第２のプロセッサに接続される第２のネットワークインタフェースを有し、
　前記クラスタを構成する前記複数の計算機は、前記記憶デバイスを用いて業務を実行する複数の第１の計算機と、第１の計算機に障害が発生した場合に、前記第１の計算機が実行する業務を引き継ぐ複数の第２の計算機とを含み、
　前記管理計算機は、
　前記複数の第１の計算機の各々のバックアップイメージを取得するバックアップ取得部と、
　一つ以上の第１の計算機と、一つ以上の第２の計算機とから構成される複数のリストアペアを生成し、前記複数のリストアペア毎に、一つのリストアペアに含まれる前記一つ以上の第２の計算機にリストアする共通イメージを選択するリストアペア管理部と、を有し、
　前記クラスタを構成する複数の計算機の各々のハードウェア構成の情報及びソフトウェア構成の情報を管理するサーバ管理情報を保持し、
　前記方法は、
　前記リストアペア管理部が、前記クラスタの構成が変更されたことを検出した場合に、前記サーバ管理情報を参照して、前記複数の第１の計算機を、前記業務を提供するためのソフトウェア構成が共通する複数のグループに分類する第１のステップと、
　前記リストアペア管理部が、前記サーバ管理情報を参照して、前記複数の第１の計算機の各々のハードウェア構成の情報及び前記複数の第２の計算機の各々のハードウェア構成の情報に基づいて、前記複数のグループの各々に、少なくとも一つ以上の第２の計算機を割り当てる第２のステップと、
　前記リストアペア管理部が、前記複数のグループ毎に、一つのグループに含まれる一つ以上の第１の計算機と、前記一つのグループに割り当てられた少なくとも一つ以上の第２の計算機とを対応づけることによって、一つ以上のリストアペアを生成する第３のステップと、
　前記リストアペア管理部が、前記複数のリストアペア毎に、前記一つのリストアペアに含まれる前記一つ以上の第１の計算機の前記バックアップイメージの中から、前記共通イメージを決定する第４のステップと、
　前記リストアペア管理部が、前記リストアペアの識別情報、前記リストアペアに含まれる一つ以上の第１の計算機の識別情報、前記リストアペアに含まれる一つ以上の第２の計算機の識別情報、及び前記リストアペアの共通イメージの識別情報を対応づけたリストアペア管理情報を生成する第５のステップと、
　を含むことを特徴とするクラスタ管理方法。
　請求項７に記載のクラスタ管理方法であって、
　前記複数のリストアペアの各々には、前記複数の第１の計算機が含まれ、
　前記第４のステップは、
　前記複数のリストアペアの中から処理対象のリストアペアを選択するステップと、
　前記選択されたリストアペアに含まれる前記複数の第１の計算機の各々の前記バックアップイメージを比較して、共通部分を算出するステップと、
　前記算出の結果に基づいて、前記共通部分が最も多い第１の計算機の前記バックアップイメージを、前記共通イメージとして選択するステップと、
　前記選択されたリストアペアに含まれる前記一つ以上の第２の計算機に、前記選択された共通イメージをリストアするステップと、
　を含むことを特徴とするクラスタ管理方法。
　請求項７に記載のクラスタ管理方法であって、
　前記複数のリストアペアの各々には、前記複数の第１の計算機が含まれ、
　前記サーバ管理情報は、前記複数の第１の計算機の稼働状態を示す稼働履歴情報を含み、
　前記第４のステップは、
　前記複数のリストアペアの中から処理対象のリストアペアを選択するステップと、
　前記サーバ管理情報を参照して、前記選択されたリストアペアに含まれる前記複数の第１の計算機の前記稼働履歴情報を取得するステップと、
　前記取得された稼働履歴情報に基づいて、障害が発生する可能性の高い第１の計算機を特定するステップと、
　前記特定された第１の計算機の前記バックアップイメージを前記共通イメージとして選択するステップと、
　前記選択されたリストアペアに含まれる前記一つ以上の第２の計算機に、前記選択された共通イメージをリストアするステップと、
　を含むことを特徴とするクラスタ管理方法。
　請求項８又は請求項９に記載のクラスタ管理方法であって、
　前記管理計算機は、
　制御部と、Ｉ／Ｏインタフェースと、複数の記憶デバイスとを有し、前記複数の第１の計算機の各々の前記バックアップイメージを格納するストレージ装置と接続され、
　前記第１の計算機の識別情報と、前記第１の計算機のバックアップイメージの識別情報とを対応づけたバックアップイメージ管理情報を保持し、
　前記方法は、
　前記リストアペア管理部が、前記複数のリストアペアの中から処理対象のリストアペアを選択するステップと、
　前記リストアペア管理部が、前記リストアペア管理情報及び前記バックアップイメージ管理情報に基づいて、前記選択されたリストアペアに含まれる前記複数の第１の計算機の各々の前記バックアップイメージと、前記選択されたリストアペアの前記共通イメージとを特定するステップと、
　前記リストアペア管理部が、前記特定された複数の第１の計算機の各々の前記バックアップイメージと、前記特定された共通イメージとを比較して、複数の第１の差分情報を取得するステップと、
　前記リストアペア管理部が、前記取得された複数の第１の差分情報に基づいて、前記共通イメージに反映することによって前記複数の第１の計算機の各々が実行する業務の状態を復元するための複数の個別イメージを生成するステップと、
　前記リストアペア管理部が、前記生成された複数の個別イメージを前記ストレージ装置に格納するステップと、
　を含むことを特徴とするクラスタ管理方法。
　請求項１０に記載のクラスタ管理方法であって、
　前記管理計算機は、
　第１の計算機の障害が検出された場合に、当該第１の計算機が含まれるリストアペアに含まれる前記一つ以上の第２の計算機の中から、切替先の第２の計算機を決定する切替先サーバ決定部と、
　障害が発生した第１の計算機が実行する業務の状態を復元するためにバックアップデータをリストアするリストア部と、を有し、
　第１の計算機の識別情報、共通イメージの識別情報、及び個別イメージの識別情報を対応づけたバックアップデータ管理情報を保持し、
　前記方法は、
　前記切替先サーバ決定部が、前記障害が発生した第１の計算機の識別情報に基づいて、前記リストアペア管理情報を参照して、前記障害が発生した第１の計算機が含まれるリストアペアを特定するステップと、
　前記切替先サーバ決定部が、前記特定されたリストアペアに含まれる前記一つ以上の第２の計算機の中から、切替先となる第２の計算機を選択するステップと、
　前記リストア部が、前記障害が発生した第１の計算機の識別情報に基づいて、前記バックアップデータ管理情報を参照して、前記ストレージ装置から、前記障害が発生した第１の計算機の個別イメージを取得するステップと、
　前記リストア部が、前記取得された個別イメージを、前記選択された第２の計算機に格納される前記共通イメージに反映することによって、前記障害が発生した第１の計算機が実行する業務の状態を復元するステップと、
　を含むことを特徴とするクラスタ管理方法。
　請求項１１に記載のクラスタ管理方法であって、
　前記複数の第１の計算機の各々は、前記記憶デバイスに生じた差分データを、第２の差分情報として取得し、前記取得された第２の差分情報を前記管理計算機に送信する差分情報取得部を有し、
　前記方法は、
　前記管理計算機が、前記バックアップイメージが取得されてから次に前記バックアップイメージが取得されるまでの間に、前記第２の差分情報を受信した場合に、前記受信した第２の差分情報を前記ストレージ装置に格納するステップと、
　前記管理計算機が、第２の差分情報の識別情報、前記第２の差分情報が生成された時間、及び前記第２の差分情報を送信した第１の計算機の識別情報を対応づけて前記バックアップデータ管理情報に格納するステップと、
　前記リストア部が、前記取得された個別イメージを、前記選択された第２の計算機に格納される前記共通イメージに反映した後、前記バックアップデータ管理情報を参照して、前記ストレージ装置から、前記障害が発生した第１の計算機から受信した前記第２の差分情報を取得するステップと、
　前記リストア部が、前記取得された第２の差分情報が生成された時間が古いものから順に、前記取得された第２の差分情報を、前記個別イメージが反映された共通イメージに反映することによって、前記障害が発生した第１の計算機が実行する業務の状態を復元するステップと、
　を含むことを特徴とするクラスタ管理方法。
　複数の計算機から構成されるクラスタを管理する管理計算機であって、
　前記複数の計算機の各々は、第１のプロセッサ、前記第１のプロセッサに接続される第１のメモリ、前記第１のプロセッサに接続される記憶デバイス、前記第１のプロセッサに接続される第１のネットワークインタフェース、及び前記第１のプロセッサに接続される第１のＩ／Ｏインタフェースを有し、
　前記管理計算機は、第２のプロセッサ、前記第２のプロセッサに接続される第２のメモリ、及び前記第２のプロセッサに接続される第２のネットワークインタフェースを有し、
　前記クラスタを構成する前記複数の計算機は、前記記憶デバイスを用いて業務を実行する複数の第１の計算機と、障害が発生した第１の計算機が実行する業務を引き継ぐ複数の第２の計算機とを含み、
　前記管理計算機は、
　前記複数の第１の計算機の各々のバックアップイメージを取得するバックアップ取得部と、
　一つ以上の第１の計算機と、一つ以上の第２の計算機とから構成される複数のリストアペアを生成し、前記複数のリストアペア毎に、一つのリストアペアに含まれる前記一つ以上の第２の計算機にリストアする共通イメージを選択するリストアペア管理部と、を有し、
　前記クラスタを構成する複数の計算機の各々のハードウェア構成の情報及びソフトウェア構成の情報を管理するサーバ管理情報を保持し、
　前記リストアペア管理部は、
　前記クラスタの構成が変更されたことを検出した場合に、前記サーバ管理情報を参照して、前記複数の第１の計算機の各々のソフトウェア構成の情報を取得し、
　前記取得された複数の第１の計算機の各々のソフトウェア構成の情報に基づいて、前記複数の第１の計算機を、前記業務を提供するためのソフトウェア構成が共通する複数のグループに分類し、
　前記サーバ管理情報を参照して、前記複数の第１の計算機の各々のハードウェア構成の情報及び前記複数の第２の計算機の各々のハードウェア構成の情報を取得し、
　前記取得された複数の第１の計算機の各々のハードウェア構成の情報及び前記取得された複数の第２の計算機の各々のハードウェア構成の情報に基づいて、前記複数のグループの各々に、少なくとも一つ以上の第２の計算機を割り当て、
　前記複数のグループ毎に、一つのグループに含まれる一つ以上の第１の計算機と、前記一つのグループに割り当てられた少なくとも一つ以上の第２の計算機とを対応づけることによって、一つ以上のリストアペアを生成し、
　前記複数のリストアペア毎に、前記一つのリストアペアに含まれる前記一つ以上の第１の計算機の前記バックアップイメージの中から、前記共通イメージを決定し、
　前記リストアペアの識別情報、前記リストアペアに含まれる前記一つ以上の第１の計算機の識別情報、前記リストアペアに含まれる前記一つ以上の第２の計算機の識別情報、及び前記リストアペアの前記共通イメージの識別情報を対応づけたリストアペア管理情報を生成することを特徴とする管理計算機。
　請求項１３に記載の管理計算機であって、
　前記複数のリストアペアの各々には、前記複数の第１の計算機が含まれ、
　前記リストアペア管理部は、
　前記共通イメージを選択する場合に、前記複数のリストアペアの中から処理対象のリストアペアを選択し、
　前記選択されたリストアペアに含まれる前記複数の第１の計算機の各々の前記バックアップイメージを比較して、共通部分を算出し、
　前記算出の結果に基づいて、前記共通部分が最も多い第１の計算機の前記バックアップイメージを、前記共通イメージとして選択し、
　前記選択されたリストアペアに含まれる前記一つ以上の第２の計算機に、前記選択された共通イメージをリストアすることを特徴とする管理計算機。
　請求項１３に記載の管理計算機であって、
　前記複数のリストアペアの各々には、前記複数の第１の計算機が含まれ、
　前記サーバ管理情報は、前記複数の第１の計算機の稼働状態を示す稼働履歴情報を含み、
　前記リストアペア管理部は、
　前記共通イメージを選択する場合に、前記複数のリストアペアの中から処理対象のリストアペアを選択し、
　前記サーバ管理情報を参照して、前記選択されたリストアペアに含まれる前記複数の第１の計算機の前記稼働履歴情報を取得し、
　前記取得された稼働履歴情報に基づいて、障害が発生する可能性の高い第１の計算機を特定し、
　前記特定された第１の計算機の前記バックアップイメージを前記共通イメージとして選択し、
　前記選択されたリストアペアに含まれる前記一つ以上の第２の計算機に、前記選択された共通イメージをリストアすることを特徴とする管理計算機。