JP6179119B2

JP6179119B2 - 管理装置、管理方法、及び管理プログラム

Info

Publication number: JP6179119B2
Application number: JP2013030128A
Authority: JP
Inventors: 正憲蒲倉
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2013-02-19
Filing date: 2013-02-19
Publication date: 2017-08-16
Anticipated expiration: 2033-02-19
Also published as: US20140237306A1; JP2014160329A; US9300530B2

Description

本発明は管理装置、管理方法、及び管理プログラムに関し、特に、仮想計算機の管理装置、管理方法、及び管理プログラムに関する。

物理的な計算機上で動作する仮想計算機を、障害や、高負荷といった事象が発生した場合、他の物理的な計算機に移行させる装置の例が、特許文献１や特許文献２に記載されている。

特許文献１には、障害が発生した物理サーバで動作する仮想サーバを、他の物理サーバで動作する他の仮想サーバと置き換えて動作させる管理サーバが記載されている。特許文献１の管理サーバは、移動させる仮想サーバより優先度が低い仮想サーバの中で、使用リソースが移動させる仮想サーバの使用リソース以上で、最も優先度が高い仮想サーバを選択する。使用リソースは、プロセッサの性能とメモリ容量である。管理サーバは、選択された仮想サーバが動作する物理サーバを、移動させる仮想サーバの移動先に決める。管理サーバは、選択された仮想サーバを次に移動させる仮想サーバとして、同様の処理を繰り返す。管理サーバは、優先度が低く、再配置先の物理サーバが無い仮想サーバの動作を停止させる。

特許文献２には、例えば仮想サーバの負荷の指標値が閾値を超えるような、仮想サーバの移行契機が検出された場合、その仮想サーバを他の物理サーバに移行させる管理計算機が記載されている。管理計算機は、予め設定された移行経路グループと、各物理サーバの現在および過去の移行状況などから、移行対象の仮想サーバの移行先と移行経路を選定する。移行経路は、システム構成の一致度や、使用するストレージ装置の異同により決められている。管理計算機は、選定された移行先と移行経路に基づき、移行対象の仮想サーバを移行させる。

特開２００９−２５２２０４号公報特開２０１１−２３２９１６号公報

計算機と、その計算機がアクセスを行うストレージ装置の間は、アクセス経路の障害への耐性の向上のために、複数の経路で接続されている場合がある。例えば、計算機とストレージ装置とを接続する複数の経路のいずれかに障害が発生しても、計算機はストレージ装置にアクセスできる。しかし、いずれかの経路における障害の発生等により、計算機とストレージ装置とを接続する経路の数が減少すると、アクセス経路の障害への耐性は低下する。計算機上で動作する仮想計算機の、その仮想計算機が使用するストレージ装置に対するアクセス経路の障害への耐性も同様に、仮想計算機が動作する計算機とストレージ装置との間のアクセス経路の数が減少すると低下する。

特許文献１および２の技術では、仮想計算機の移行先の計算機を、アクセス経路の障害への耐性の、移行の前後における変化に関係なく決定する。特許文献１および２の技術では、仮想計算機の、その仮想計算機が動作する計算機とストレージ装置との間におけるアクセス経路の障害への耐性の減少を小さくすることはできない。

本発明の目的は、複数の経路でストレージ装置に接続されている計算機で動作する仮想計算機の、ストレージ装置と計算機との間の経路の障害に対する耐性の低下を小さくする管理装置を提供することにある。

本発明の管理装置は、それぞれ複数の経路でストレージ装置に接続され、仮想計算機を稼働させる複数のサーバから、いずれかの前記経路の障害を検出する障害検出手段と、前記経路の障害が検出された前記サーバである故障サーバで稼働する前記仮想計算機を抽出する抽出手段と、前記複数のサーバの各々に対して、当該サーバと前記ストレージ装置との間の経路の冗長性の高さを表す冗長度を算出する冗長度算出手段と、前記冗長度が高い前記サーバを選択する選択手段と、抽出された前記仮想計算機の識別子と、選択された前記サーバの識別子を含む移行指示情報を送信する送信手段とを含む。

本発明の管理方法は、それぞれ複数の経路でストレージ装置に接続され、仮想計算機を稼働させる複数のサーバから、いずれかの前記経路の障害を検出し、前記経路の障害が検出された前記サーバである故障サーバで稼働する前記仮想計算機を抽出し、前記複数のサーバの各々に対して、当該サーバと前記ストレージ装置との間の経路の冗長性の高さを表す冗長度を算出し、前記冗長度が高い前記サーバを選択し、抽出された前記仮想計算機の識別子と、選択された前記サーバの識別子を含む移行指示情報を送信する。

本発明の管理プログラムは、コンピュータを、それぞれ複数の経路でストレージ装置に接続され、仮想計算機を稼働させる複数のサーバから、いずれかの前記経路の障害を検出する障害検出手段と、前記経路の障害が検出された前記サーバである故障サーバで稼働する前記仮想計算機を抽出する抽出手段と、前記複数のサーバの各々に対して、当該サーバと前記ストレージ装置との間の経路の冗長性の高さを表す冗長度を算出する冗長度算出手段と、前記冗長度が高い前記サーバを選択する選択手段と、抽出された前記仮想計算機の識別子と、選択された前記サーバの識別子を含む移行指示情報を送信する送信手段として動作させる。

本発明には、複数の経路でストレージ装置に接続されている計算機で動作する仮想計算機の、ストレージ装置と計算機との間の経路の障害に対する耐性の低下を小さくすることができるという効果がある。

図１は、第１の実施形態の情報処理システム７の構成の例を表す図である。図２は、管理装置１と物理サーバ２との間の接続の例を表す図である。図３は、物理サーバ２とストレージ装置３との間の接続の、他の例を表す図である。図４は、第１の実施形態の管理装置１の動作を表すフローチャートである。図５は、第１の実施形態のパス情報テーブルの一例を表す図である。図６は、第１の実施形態のリソース情報テーブルの一例を表す図である。図７は、構成例における計算機システムの構成を表す図である。図８は、構成例におけるパス情報テーブルの一例を表す図である。図９は、構成例におけるリソース情報テーブル１５０の一例を表す図である。図１０は、構成例における仮想ディスク情報テーブル１６０の一例を表す図である。図１１は、構成例における構成情報テーブル３２０の一例を表す図である。図１２は、構成例の計算機システムの、さらに具体的な構成の一例を表す図である。図１３は、構成例の具体例におけるパス情報テーブルの例を表す図である。図１４は、構成例の具体例におけるリソース情報テーブルの例を表す図である。図１５は、構成例の具体例における仮想ディスク情報テーブルの例を表す図である。図１６は、構成例の具体例におけるパス情報テーブルの例を表す図である。図１７は、構成例の具体例におけるリソース情報テーブルの例を表す図である。図１８は、構成例の具体例における仮想ディスク情報テーブルの例を表す図である。図１９は、構成例の具体例における構成情報テーブルの例を表す図である。図２０は、構成例の具体例における仮想サーバパス冗長度の例を表す図である。図２１は、構成例の具体例における物理サーバパス冗長度の例を表す図である。図２２は、障害発生後のパス情報テーブル１４０の一例を表す図である。図２３は、障害発生後に再計算された仮想サーバパス冗長度の一例を表す図である。図２４は、障害発生後に再計算された物理サーバパス冗長度の一例を表す図である。図２５は、移行後の仮想サーバパス冗長度の一例を表す図である。図２６は、変形された構成例における計算機システムの構成の一例を表す図である。図２７は、第２の実施形態の管理装置１の構成の例を表す図である。

次に、本発明の第１の実施の形態について図面を参照して詳細に説明する。

図１は、第１の実施形態の情報処理システム７の構成の例を表す図である。

図１を参照すると、情報処理システム７は、管理装置１と、複数の物理サーバ２と、ストレージ装置３を含む。物理サーバ２は、単に、サーバとも表記される。情報処理システム７は、複数のストレージ装置３を含んでいてもよい。管理装置１と物理サーバ２は、直接ケーブルや無線により接続されていてもよい。管理装置１と物理サーバ２は、ネットワークを介して接続されていてもよい。管理装置１は、物理サーバ２に含まれていてもよい。

図２は、管理装置１と物理サーバ２との間の接続の例を表す図である。

図２の例では、管理装置１と物理サーバ２は、管理ネットワーク４によって接続されている。また、情報処理システム７は、物理サーバ２上で動作する仮想サーバ２１のための、物理サーバ２のリソースを管理する仮想サーバ管理装置５を含んでいてもよい。そして、物理サーバ２と仮想サーバ管理装置５は、管理ネットワーク４によって接続されていてもよい。仮想サーバ管理装置５は、各物理サーバ２に対して、仮想サーバ２１の生成、仮想サーバ２１の削除、仮想サーバ２１へのストレージ装置３内のディスク３１の割り当て、他の物理サーバ２への移行等の指示を送信する。各物理サーバ２は、仮想サーバ管理装置５からの指示に従って、仮想サーバ２１に対するこれらの処理を行う。仮想サーバ管理装置５は、仮想ディスクを提供する各ストレージ装置３に接続され、各ストレージ装置３に対して、ストレージ装置３の仮想ディスクの他のストレージ装置３への移行の指示を行ってもよい。図１では、仮想サーバ管理装置５は省略されている。また、管理装置１が仮想サーバ管理装置５として動作してもよい。その場合、情報処理システム７は、管理装置１と異なる仮想サーバ管理装置５を含まなくてよい。

各物理サーバ２とストレージ装置３は、複数の経路で接続されている。各物理サーバ２とストレージ装置３は、例えば、物理サーバ２が含む複数のポート２０のいずれかとストレージ装置３が含む複数のポート３０のいずれかとの間を接続する、複数のケーブルによって接続されている。物理サーバ２の一つのポート２０に、１台のストレージ装置３が含む複数のポート３０が接続されていてもよい。物理サーバ２の複数のポート２０が、ストレージ装置３の一つのポート３０に接続されていてもよい。互いに接続されている、物理サーバ２のポート２０とストレージ装置３のポート３０を経由する通信路が、物理サーバ２とストレージ装置３の間の接続の経路である。互いに接続されている、ある物理サーバ２のポート２０とあるストレージ装置３のポート３０の組み合わせの数が、その物理サーバ２とそのストレージ装置３の間を接続する経路の数である。物理サーバ２は、いずれかの経路を介して、ストレージ装置３にアクセスする。図１の物理サーバ２とストレージ装置３との間の接続は単なる例である。物理サーバ２とストレージ装置３との間の接続は、図１の構成に限定されない。

図３は、物理サーバ２とストレージ装置３との間の接続の、他の例を表す図である。

図３の例では、各物理サーバ２と、各ストレージ装置３は、スイッチ６を介して接続されている。スイッチ６は、例えば、ＦＣ（ＦｉｂｅｒＣｈａｎｎｅｌ）スイッチである。この場合、物理サーバ２のＦＣＨＢＡ（ＨｏｓｔＢｕｓＡｄａｐｔｅｒ）の各ポート２０は、ＦＣケーブルにより、ＦＣスイッチに接続されている。そして、ＦＣスイッチは、ＦＣケーブルでストレージ装置３のＦＣポートであるポート３０に接続されている。そして、各物理サーバ２は、ＦＣプロトコルを用いて、各ストレージ装置３にアクセスする。スイッチ６は、ＩＰ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ）ネットワークのネットワークスイッチであってもよい。この場合、各物理サーバ２は、例えばｉＳＣＳＩ（ＩｎｔｅｒｎｅｔＳｍａｌｌＣｏｍｐｕｔｅｒＳｙｓｔｅｍＩｎｔｅｒｆａｃｅ）プロトコルで、各ストレージ装置３にアクセスする。

管理装置１は、障害検出部１０と、抽出部１１と、冗長度算出部１２と、選択部１３と、送信部１４と、冗長度記憶部１５を含む。管理装置１は、負荷検出部１６を含んでいてもよい。

各物理サーバ２は、複数のポート２０と、仮想サーバ管理部２２と、パス管理部２３と、リソース記憶部２４を含む。また、各物理サーバ２では、仮想サーバ２１が稼働している。仮想サーバ２１は、仮想計算機とも表記される。図１の例では仮想サーバ２１の台数は１台であるが、仮想サーバ２１の台数は、１台でなくてよい。

各ストレージ装置３は、複数のポート３０と、ディスク３１を含む。ディスク３１は、複数であってもよい。ディスク３１は、１台以上のハードディスクドライブから構成される論理ディスクであってもよい。ディスク３１は、１個以上の論理ディスクの全部又は一部から構成される、仮想的なディスクである仮想ディスクであってもよい。

仮想サーバ管理部２２は、仮想サーバ２１への、プロセッサ、メモリ、ディスク等のリソースの割り当てを行う。そして、仮想サーバ管理部２２は、仮想サーバ２１を構成して稼働させる。また、仮想サーバ管理部２２は、仮想サーバ２１を他の物理サーバ２に移行させる指示を受信すると、指示に基づき、仮想サーバ２１を他の物理サーバ２に移行させるマイグレーションを行う。仮想サーバ２１を他の物理サーバ２に移行させる指示は、移行させる仮想サーバ２１の識別子と、仮想サーバ２１の移行先の物理サーバ２の識別子を含む。仮想サーバ２１を他の物理サーバ２に移行させる指示は、移行させる仮想サーバ２１の識別子と、仮想サーバ２１の移行先の物理サーバ２の識別子であってもよい。また、仮想サーバ管理部２２は、物理サーバ２上の各仮想サーバ２１に対して、仮想サーバ２１の識別子と、その仮想サーバ２１に割り当てられているストレージの識別子とを対応付けて、リソース記憶部２４に格納する。ストレージの識別子は、例えば、ディスク３１の識別子や、ディスク３１を含むストレージ装置３の識別子である。仮想サーバ管理部２２は、物理サーバ２上の各仮想サーバ２１に割り当てられている、プロセッサの個数、プロセッサの識別子、メモリの容量等を、リソース記憶部２４に格納してもよい。

リソース記憶部２４は、物理サーバ２上の各仮想サーバ２１に対して、仮想サーバ２１に割り当てられているストレージの識別子を記憶する。例えば、リソース記憶部２４は、各仮想サーバ２１に対して、仮想サーバ２１の識別子と、その仮想サーバ２１に割り当てられているディスク３１の識別子とを、対応付けて記憶する。リソース記憶部２４は、各仮想サーバ２１に対して、仮想サーバ２１の識別子と、その仮想サーバ２１に割り当てられているディスク３１を含むストレージ装置３の識別子とを、対応付けて記憶する。ディスク３１が仮想ディスクである場合、リソース記憶部２４は、仮想サーバ２１の識別子と、その仮想サーバ２１に割り当てられている仮想ディスクの識別子とを、対応付けて記憶していてもよい。そして、リソース記憶部２４は、各仮想ディスクに対して、仮想ディスクの識別子と、その仮想ディスクを構成する論理ディスクの識別子とを、対応付けて記憶していてもよい。また、リソース記憶部２４は、各論理ディスクに対して、論理ディスクの識別子と、その論理ディスクを含むストレージ装置３の識別子とを、対応付けて記憶していてもよい。リソース記憶部２４は、各仮想サーバ２１に対して、仮想サーバ２１の識別子と、そのプロセッサに割り当てられている、プロセッサの個数、プロセッサの識別子、メモリの容量等を、対応付けて記憶していてもよい。

パス管理部２３は、物理サーバ２とストレージ装置３との間の各経路に対して、その経路における通信の障害の有無を検出する。パス管理部２３は、例えば、ストレージ装置３へのアクセスでＩ／Ｏ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）エラーが発生した場合、そのアクセスで経由した経路を特定することで、その経路における障害の発生を検出する。パス管理部２３は、Ｉ／Ｏエラーが発生した場合、Ｉ／Ｏを再発行することで、Ｉ／Ｏを継続させる。パス管理部２３は、各経路に対して障害が検出された場合、障害の発生を、管理装置１の障害検出部１０に送信してもよい。前述のように、互いに接続されている、物理サーバ２のポート２０とそのポート２０に接続されているストレージ装置３のポート３０を経由する通信線が、物理サーバ２とストレージ装置３との間の経路である。

パス管理部２３は、各経路に対して、検出された障害の有無を表す情報であるパス状態を、経路の識別子に対応付けてリソース記憶部２４に格納する。パス状態は、例えば、「正常」を表す所定値と、「障害」を表す他の所定値のいずれかである。パス管理部２３は、Ｉ／Ｏエラーが発生した場合、Ｉ／Ｏエラーが発生した経路の識別子に対応付けられているパス状態を更新して、「障害」にすればよい。経路は、以下では、アクセスパスとも表記される。経路の識別子は、例えば、物理サーバ２のポート２０の識別子と、ストレージ装置３のポート３０の識別子の組み合わせである。経路の識別子は、経路を識別することができればどのような識別子であってもよい。

パス管理部２３は、物理サーバ２がアクセスする各ストレージの識別子に対して、そのストレージとの間の全ての経路の、識別子とパス状態の組を、対応付けてリソース記憶部２４に格納してもよい。前述のように、ストレージの識別子は、例えば、ディスク３１の識別子や、ディスク３１を含むストレージ装置３の識別子である。例えば、リソース記憶部２４が、仮想サーバ２１の識別子とストレージ装置３の識別子を対応付けて記憶している場合、パス管理部２３が経路の識別子とパス状態の組に対応付けるストレージの識別子は、ストレージ装置３の識別子である。例えば、リソース記憶部２４が、仮想サーバ２１の識別子とディスク３１の識別子を対応付けて記憶している場合、パス管理部２３が経路の識別子とパス状態の組に対応付けるストレージの識別子は、ディスク３１の識別子である。ただし、ディスク３１が仮想ディスクである場合、ストレージの識別子は、論理ディスクの識別子であってよい。

リソース記憶部２４は、さらに、各経路に対して、検出された障害の有無を表す情報であるパス状態を、経路の識別子に対応付けて記憶する。リソース記憶部２４は、物理サーバ２がアクセスする各ストレージの識別子に対して、そのストレージとの間の全ての経路の、識別子とパス状態の組を、対応付けて記憶してもよい。

障害検出部１０は、各物理サーバ２に対して、物理サーバ２が各ストレージ装置３にアクセスする各経路における障害の有無を検出する。

抽出部１１は、経路の障害が検出された物理サーバ２で稼働する仮想サーバ２１の各々から、検出された障害による影響を受ける仮想サーバ２１を抽出する。抽出部１１が抽出した仮想サーバ２１が、移行の対象の仮想サーバ２１である。

冗長度算出部１２は、物理サーバ２とストレージ装置３との間の経路の冗長性の高さを表す値である冗長度を算出する。以下の説明では、冗長度の値が大きいほど冗長性が高いことを表す。冗長度の値の大きさと冗長性の高さの関係は、逆でも構わない。冗長度算出部１２により算出される、物理サーバ２とストレージ装置３との間の経路の冗長度は、物理サーバパス冗長度とも表記される。物理サーバパス冗長度は、第１の冗長度とも表記される。物理サーバパス冗長度は、単に、冗長度とも表記される。また、冗長度算出部１２は、複数の物理サーバ２のそれぞれに対して、物理サーバ２と、仮想サーバ２１が使用するストレージ装置３との間の経路の第１の冗長度を算出する。仮想サーバ２１が複数のストレージ装置３を使用する場合、冗長度算出部１２は、仮想サーバ２１が使用する複数のストレージ装置３のそれぞれに対して、物理サーバ２とストレージ装置３の間の第１の冗長度を算出する。冗長度算出部１２は、物理サーバ２と、仮想サーバ２１が使用するそれぞれのストレージ装置３との間の第１の冗長度の中で、最も冗長性が低いことを表す値を、物理サーバ２における仮想サーバ２１の第２の冗長度として選択する。第２の冗長度は、仮想サーバパス冗長度とも表記される。第２の冗長度は、仮想サーバ２１が物理サーバ２上で動作する場合に、仮想サーバ２１が、使用しているディスク３１にアクセスする際の、その物理サーバ２と、ディスク３１を含むストレージ装置３との間の経路の冗長性の程度を表す値である。第２の冗長度は、物理サーバ２と仮想サーバ２１の組み合わせに対して定まる。

選択部１３は、障害による影響を受ける仮想サーバ２１に対して、その仮想サーバ２１が稼働する物理サーバ２より、第２の冗長度が高い物理サーバ２を選択する。選択部１３は、障害による影響を受ける仮想サーバ２１に対して、例えば、第２の冗長度が最も冗長性が高いことを表す値である物理サーバ２を選択する。選択部１３が選択する物理サーバ２は、障害による影響を受ける仮想サーバ２１が稼働する物理サーバ２より、第２の冗長度が高い物理サーバ２であれば、必ずしも第２の冗長度が最も高い物理サーバ２でなくても構わない。選択部１３が選択した物理サーバ２が、移行対象の仮想サーバ２１の移行先の物理サーバ２である。複数の仮想サーバ２１が抽出された場合、選択部１３は、抽出されたそれぞれの仮想サーバ２１に対して、その仮想サーバ２１に対して選択された第２の冗長度が最も冗長性が高いことを表す値である物理サーバ２を選択する。

送信部１４は、障害による影響を受ける仮想サーバ２１の識別子と、その仮想サーバ２１の、第２の冗長度が最も高い物理サーバ２として選択された物理サーバの識別子とを含む、移行指示の情報を出力する。移行指示の情報は、単に移行指示とも表記される。送信部１４は、例えば、検出された障害による影響を受ける仮想サーバ２１が稼働する物理サーバ２に対して、その仮想サーバ２１の、第２の冗長度が最も高い物理サーバ２として選択された物理サーバへの、移行指示を送信する。移行対象の仮想サーバ２１を移行先の物理サーバ２に移行させる指示は、移行の対象である仮想サーバ２１の識別子と、移行先の物理サーバ２の識別子を含む。移行対象の仮想サーバ２１を移行先の物理サーバ２に移行させる指示は、移行の対象である仮想サーバ２１の識別子と、移行先の物理サーバ２の識別子そのものであってもよい。この場合、送信部１４は、検出された障害による影響を受ける仮想サーバ２１が稼働する物理サーバ２に対して、その抽出された仮想サーバ２１の識別子と、選択された物理サーバ２の識別子を送信する。物理サーバ２は、仮想サーバ２１の識別子と物理サーバ２の識別子を受信すると、受信した識別子で特定される仮想サーバ２１を、受信した識別子で特定される物理サーバ２に移行させる、マイグレーションを行う。マイグレーションの方法は、既存の任意の方法でよい。移行指示の出力先は、仮想サーバ管理装置５であってもよい。この場合、仮想サーバ管理装置５が、移行指示に識別子が含まれる仮想サーバ２１を、移行指示に識別子が含まれる物理サーバ２に移行させる処理を行えばよい。移行指示の出力先は、例えば、情報処理システム７の管理者の端末であってもよい。情報処理システム７の管理者の端末は、管理者に対して、受信した移行指示の情報を表示してもよい。そして、管理者が、移行指示に識別子が含まれる仮想サーバ２１を、移行指示に識別子が含まれる物理サーバ２に移行させる処理を行えばよい。情報処理システム７の管理者の端末は、図示されない。

負荷検出部１６は、各物理サーバ２の負荷の大きさを検出する。

冗長度記憶部１５は、各物理サーバ２で稼働する各仮想サーバ２１の、第２の冗長度を記憶する。冗長度記憶部１５は、各仮想サーバ２１に対して、仮想サーバ２１の識別子と、第２の冗長度を記憶していればよい。

次に、本実施形態の管理装置１の動作について、図面を参照して詳細に説明する。

図４は、本実施形態の管理装置１の動作を表すフローチャートである。

本実施形態の例では、図４の動作の開始時には、各物理サーバ２のリソース記憶部２４には、物理サーバ２とストレージ装置３を接続する各経路の異常の有無が、例えば後述のパス情報テーブルとして格納されている。また、各物理サーバ２のリソース記憶部２４には、仮想サーバ２１が稼働する物理サーバ２と仮想サーバ２１が利用するディスク３１を含むストレージ装置３の間の経路と、仮想サーバ２１の対応付けが可能な情報が格納されている。仮想サーバ２１の対応付けが可能な情報は、例えば、後述のリソース情報テーブルである。仮想サーバ２１の対応付けが可能な情報は、さらに、後述の仮想ディスク情報テーブルや、ディスク情報テーブルを含んでいてもよい。

図５は、物理サーバ２のリソース記憶部２４に格納されている、パス情報テーブルの一例を表す図である。図５のパス情報テーブルは、ストレージＩＤ（Ｉｄｅｎｔｉｆｉｅｒ）と、経路ＩＤと、パス状態の組を含む。ストレージＩＤは、ストレージ装置３の識別子である。経路ＩＤは、パス情報テーブルが格納されているリソース記憶部２４を含む物理サーバ２と、ストレージ装置３を接続する経路の識別子である。図５の例では、経路ＩＤは、物理サーバ２が含むポート２０であるサーバ側ポートの識別子と、ストレージ装置３が含むポート３０であるストレージ側ポートの識別子の組で表される。パス状態は、物理サーバ２とストレージ装置３を接続する経路に検出された障害の有無を表す。図５の例では、パス状態が「正常」である場合、その経路に障害が検出されていない。パス状態が「障害」である場合、その経路に障害が検出されている。パス情報テーブルには、ストレージＩＤの代わりに、ストレージ装置３が含むディスク３１の識別子であるディスクＩＤが、経路ＩＤ及びパス状態に対応付けられていてもよい。

図６は、物理サーバ２のリソース記憶部２４に格納されている、リソース情報テーブルの一例を表す図である。図６のリソース情報テーブルは、仮想サーバＩＤとストレージＩＤの組を含む。図６の例では、仮想サーバＩＤは、ディスク情報テーブルを記憶するリソース記憶部２４を含む物理サーバ２で稼働する、仮想サーバ２１の識別子である。ストレージＩＤは、ストレージＩＤに対応する仮想サーバＩＤの仮想サーバ２１が使用するディスク３１を含む、ストレージ装置３の識別子である。仮想サーバ２１が使用するディスク３１は、例えば仮想サーバ管理部２２により、仮想サーバ２１に割り当てられているディスク３１である。図６の例では、識別子が仮想サーバＡ１である仮想サーバ２１は、ストレージＩＤがストレージ１であるストレージ装置３に含まれるディスク３１と、ストレージＩＤがストレージ２であるストレージ装置３に含まれるディスク３１を使用する。

リソース情報テーブルは、仮想サーバＩＤとストレージＩＤの組の代わりに、仮想サーバＩＤと、その仮想サーバＩＤの仮想サーバ２１が使用するディスク３１のディスクＩＤの組を含んでいてもよい。その場合、リソース記憶部２４は、各ディスク３１に対する、ディスク３１のディスクＩＤとディスク３１を含むストレージ装置３のストレージＩＤの組を含む、ディスク情報テーブルを記憶する。ディスク３１が仮想ディスクである場合、リソース記憶部２４は、仮想ディスクである各ディスク３１に対して、ディスク３１の仮想ディスクＩＤと、ディスク３１を構成する論理ディスクの論理ディスクＩＤとの組を含む、論理ディスク情報テーブルを記憶していてもよい。仮想ディスクと論理ディスクの対応は、一対一でなくてよい。複数の仮想ディスクが、一つの論理ディスクによって構成されていても構わない。一つの仮想ディスクは、複数の論理ディスクにより構成されていても構わない。そして、ディスク情報テーブルは、各論理ディスクに対する、論理ディスクの論理ディスクＩＤと、その論理ディスクを含むストレージ装置３のストレージＩＤとの組を含んでいてもよい。

図４を参照すると、まず、障害検出部１０が、各物理サーバ２と各ストレージ装置３との間の経路の障害を検出する（ステップＳ１０１）。

障害検出部１０は、既存の任意の方法により、各物理サーバ２と各ストレージ装置３との間の経路の障害を検出する。障害検出部１０は、例えば、各物理サーバ２から、経路の障害の発生を受信することにより、各経路の障害を検出すればよい。障害検出部１０は、リソース記憶部２４からそれぞれのパス状態を読み出し、パス状態が「正常」から「障害」に変化したことを検出することにより、そのパス状態に対応する経路における障害の発生を検出してもよい。その場合、障害検出部１０は、読み出したパス状態を記憶すればよい。そして、障害検出部１０は、記憶しているパス状態が「正常」であり、リソース記憶部２４から新しく読み出したパス状態が「障害」である経路が存在する場合に、経路の障害が発生したと判定すればよい。障害検出部１０は、各物理サーバ２格納されるストレージ装置３へのアクセスの履歴から、Ｉ／Ｏエラーを検出することで、経路の障害を検出してもよい。

いずれの経路にも障害が検出されない場合（ステップＳ１０２、Ｎ）、処理はステップＳ１０１に戻る。

いずれかの経路に障害が検出された場合（ステップＳ１０２、Ｙ）、抽出部１１は、障害の影響を受ける仮想サーバ２１を抽出する（ステップＳ１０３）。

抽出部１１は、例えば、検出された障害の発生により、仮想サーバ２１が稼働している物理サーバ２における、仮想サーバ２１の第２の冗長度（仮想サーバパス冗長度）が減少した仮想サーバ２１を、障害の影響を受ける仮想サーバ２１として抽出する。

第２の冗長度は、冗長度算出部１２により、たとえば以下のように導出される。冗長度算出部１２は、まず、物理サーバ２のリソース記憶部２４から、パス情報テーブルを読み出す。冗長度算出部１２は、パス情報テーブルから、ストレージ装置３毎に、パス状態が「正常」である経路の数を求める。冗長度算出部１２は、ストレージ装置３毎のパス状態が「正常」である経路の数を、その物理サーバ２とストレージ装置３との間の経路の第１の冗長度（物理サーバパス冗長度）にする。

また、冗長度算出部１２は、物理サーバ２のリソース記憶部２４から、リソース情報テーブルを読み出す。物理サーバ２のリソース記憶部２４に仮想ディスク情報テーブルやディスク情報テーブルが格納されている場合、冗長度算出部１２は、それらのテーブルも読み出す。そして、冗長度算出部１２は、物理サーバ２と、物理サーバ２上で動作する仮想サーバ２１が使用するストレージ装置３との間の経路の第１の冗長度を、第２の冗長度にする。仮想サーバ２１が複数のストレージ装置３を使用している場合、冗長度算出部１２は、例えば、物理サーバ２と、物理サーバ２上で動作する仮想サーバ２１が使用するストレージ装置３との間の経路の第１の冗長度の最小値を、第２の冗長度にする。

また、冗長度記憶部１５は、前回冗長度算出部１２が導出した、仮想サーバ２１毎の第２の冗長度を記憶している。

抽出部１１は、仮想サーバ２１毎に、冗長度記憶部１５が記憶する第２の冗長度より、新たに導出した第２の冗長度を比較する。抽出部１１は、冗長度記憶部１５が記憶する第２の冗長度より、新たに導出した第２の冗長度が小さい仮想サーバ２１を、すなわち、第２の冗長度が減少した仮想サーバ２１を、検出された障害の影響を受ける仮想サーバ２１として抽出する。

障害の影響を受ける仮想サーバ２１が抽出されない場合（ステップＳ１０４、Ｎ）、処理はステップＳ１０１に戻る。

障害の影響を受ける仮想サーバ２１が抽出された場合（ステップＳ１０４、Ｙ）、冗長度算出部１２は、各物理サーバ２における、抽出された仮想サーバ２１の、第２の冗長度を導出する（ステップＳ１０５）。前述のように、第２の冗長度は、仮想サーバパス冗長度とも表記される。

すなわち、冗長度算出部１２は、仮想サーバ２１が稼働する物理サーバ２における仮想サーバ２１の第２の冗長度と、その仮想サーバ２１を他の物理サーバ２のそれぞれに移行させた場合のその仮想サーバ２１の第２の冗長度を算出する。他の物理サーバ２は、対象の仮想サーバ２１が稼働する物理サーバ２以外の物理サーバ２である。抽出された仮想サーバ２１が稼働する物理サーバ２における、その抽出された仮想サーバ２１の第２の冗長度が、ステップＳ１０３において既に導出されている場合、冗長度算出部１２は、他の物理サーバ２における、仮想サーバ２１の第２の冗長度を導出すればよい。第２の冗長度の算出方法は、ステップＳ１０３の説明における第２の冗長度の算出方法と同じである。

管理装置１は、ステップＳ１０５とステップＳ１０７の動作の間に、ステップＳ１０６の動作を行ってもよい。管理装置１は、ステップＳ１０６の動作を行わなくてもよい。

ステップＳ１０６で、負荷検出部１６は、各物理サーバ２の負荷を検出する。負荷検出部１６が検出する負荷は、例えば、物理サーバ２のＣＰＵ使用率や、物理サーバ２のメモリ使用率や、物理サーバ２のネットワーク使用率などである。負荷検出部１６が検出する負荷は、例えば情報処理システム７の設計者により選択された、既存の任意の指標で表された物理サーバ２の負荷でよい。ステップＳ１０６の処理が行われない場合、負荷検出部１６は存在しなくてよい。

次に、選択部１３は、仮想サーバ２１の移行先の物理サーバ２を選択する（ステップＳ１０７）。

選択部１３は、ステップＳ１０３で抽出された、障害の影響を受ける仮想サーバ２１のそれぞれに対して、移行先の物理サーバ２を抽出する。選択部１３は、例えば、ステップＳ１０５で算出された、仮想サーバ２１の第２の冗長度が最も大きい物理サーバ２を、その仮想サーバ２１の移行先の物理サーバ２として選択する。

ステップＳ１０６の処理が行われ、各物理サーバ２の負荷が検出されている場合、選択部１３は、検出された負荷が所定の閾値を上回る物理サーバ２を選択の対象から除外して、前述のように物理サーバ２を選択すればよい。

次に、送信部１４が、ステップＳ１０３で抽出された仮想サーバ２１の識別子と、その仮想サーバ２１の移行先として選択された物理サーバ２の識別子を、その仮想サーバ２１が稼働する物理サーバ２に送信する（ステップＳ１０８）。送信部１４は、ステップＳ１０３で抽出された全ての仮想サーバ２１に対して、ステップＳ１０８の動作を行う。

仮想サーバ２１の識別子と、他の物理サーバ２の識別子を受信した物理サーバ２は、受信した識別子で特定される物理サーバ２に、受信した識別子で特定される仮想サーバ２１を移行させる。仮想サーバ２１の移行方法は、既存の任意の方法でよい。ステップＳ１０３で抽出された仮想サーバ２１が稼働する物理サーバ２における、その仮想サーバ２１の第２の冗長度が、それぞれの物理サーバ２におけるその仮想サーバ２１の第２の冗長度の中で最も大きい場合、送信部１４はステップＳ１０８の動作を行わない。

なお、ステップＳ１０８では、必ずしも上述の通りの動作が行われなくてもよい。ステップＳ１０８では、移行させる仮想サーバ２を、移行先の物理サーバ２に移行させる処理が行われればよい。例えば、送信部１４は、ステップＳ１０３で抽出された仮想サーバ２１の識別子と、その仮想サーバ２１の移行先として選択された物理サーバ２の識別子を、図示されないスーパバイザサーバに送信してもよい。そして、そのスーパバイザサーバが、移行させる仮想サーバ２を、移行先の物理サーバ２に移行させる処理を行ってもよい。あるいは、送信部１４は、ステップＳ１０３で抽出された仮想サーバ２１の識別子と、その仮想サーバ２１の移行先として選択された物理サーバ２の識別子を、移行先の物理サーバ２に送信してもよい。そして、移行先の物理サーバ２が、移行させる仮想サーバ２を、移行先の物理サーバ２に移行させる処理を行ってもよい。

以上で説明した本実施形態には、複数の経路でストレージ装置３に接続されている物理サーバ２で動作する仮想サーバ２１の、ストレージ装置３と物理サーバ２との間の経路の障害に対する耐性の低下を小さくすることができるという効果がある。

その理由は、選択部１３が、障害の影響がある仮想サーバ２１として抽出された仮想サーバ２１に対して、前述の第２の冗長度が最も大きい物理サーバ２を選択するからである。障害の影響がある仮想サーバ２１は、その仮想サーバ２１が稼働する物理サーバ２と、その仮想サーバ２１が使用するストレージ装置３との間の冗長性が、その障害によって低下した仮想サーバ２１である。第２の冗長度が最も大きい物理サーバ２は、その物理サーバ２と、仮想サーバ２１が使用するストレージ装置３との間の経路の冗長性が、最も大きい物理サーバ２である。ステップＳ１０６で抽出された仮想サーバ２１が、第２の冗長度が最も大きい物理サーバ２に移行することにより、その仮想サーバ２１が稼働する物理サーバ２１とその仮想サーバ２１が使用するストレージ装置３の間の経路の冗長性の低下は、小さくなる。

（構成例）
次に、第１の実施形態の情報処理システム７の構成例について、図面を参照して詳細に説明する。

図７は、本構成例の計算機システムの構成を表す図である。

図７各構成要素と、図１及び図２の各構成要素の対応は、以下の通りである。

計算機システムが、情報処理システム７に対応する。物理サーバ１００は、物理サーバ２に対応する。ストレージ装置４００は、ストレージ装置３に対応する。管理サーバ３００は、管理装置１及び仮想サーバ管理装置５に対応する。管理ネットワーク６００は、管理ネットワーク４に対応する。アクセスパス５００は、物理サーバ２とストレージ装置３の間の経路である。仮想サーバ２００は、仮想サーバ２１に対応する。

物理サーバ１００の図示されないプロセッサは、パス管理プログラム１２０を実行することにより、パス管理部２３として動作する。ポート１１０は、ポート２０に対応する。以下では、各プログラムを実行するプロセッサの動作を、そのプログラムの動作として説明される。

仮想ディスク４３０は、ディスク３１に対応する。仮想ディスク４３０は、論理ディスク４２０上に構築される。ポート４１０は、ポート３０に対応する。

管理サーバ３００の図示されないプロセッサは、リソース管理プログラム３１０を実行することにより、仮想サーバ管理部２２及び管理装置１の、冗長度記憶部１５を除く各部として動作する。管理サーバ３００の図示されないメモリは、冗長度記憶部１５として動作する。また、管理サーバ３００の図示されないプロセッサが、リソース管理プログラム３１０を実行することにより、管理サーバ３００は、仮想サーバ管理装置５として動作する。

本構成例における計算機システムは、２つ以上の物理サーバ１００と、１つの管理サーバ３００、２つ以上のストレージ装置４００で構成されている。

物理サーバ１００は、２つ以上のポート１１０を含む。物理サーバ１００では、１つのパス管理プログラム１２０、１つの仮想サーバ管理プログラム１３０、および、１つ以上の仮想サーバ２００が動作している。物理サーバ１００は、パス管理プログラム１２０が使用する情報として、パス情報テーブル１４０を含む。また、物理サーバ１００は、仮想サーバ管理プログラム１３０が使用する情報として、リソース情報テーブル１５０、および、仮想ディスク情報テーブル１６０を含む。パス情報テーブル１４０とリソース情報テーブル１５０と仮想ディスク情報テーブル１６０は、リソース記憶部２４に格納されている。

管理サーバ３００は、図示されないプロセッサにより、リソース管理プログラム３１０を実行している。管理サーバ３００は、リソース管理プログラム３１０が使用する情報を含む、構成管理テーブル３２０が格納された構成記憶部３００を含む。

ストレージ装置４００は、２つ以上のポート４１０と、１つ以上の論理ディスク４２０を有している。論理ディスク４２０は、論理ディスク４２０上の記憶領域内に任意の個数の仮想ディスク４３０を含むことができる。

ある物理サーバ１００上の１つのポート１１０から、あるストレージ装置４００上の１つのポート４１０へ結ぶ経路は、アクセスパス５００と呼ばれる。

本構成例における計算機システムでは、それぞれの物理サーバ１００から、それぞれのストレージ装置４００への、アクセスパス５００は２つ以上存在する。１つのアクセスパス５００は、１つの物理サーバ１００上にあるポート１１０から、１つのストレージ装置３００上のポート３１０への経路を指す。

アクセスパス５００の実装方法の一例として、ＦＣケーブルを使用し、物理サーバに実装されたＦＣＨＢＡから、ＦＣスイッチを経由し、ストレージ装置のＦＣポートへＦＣプロトコルを用いて接続する方法が挙げられる。また、アクセスパス５００の実装方法の一例として、ＩＰネットワークで、ｉＳＣＳＩプロトコルを用いて接続する方法などが挙げられる。本構成例では、アクセスパス５００は、ＦＣプロトコルを用いて接続する方法を用いて実装される。

また、本構成例における計算機システムでは、すべての物理サーバ１００と管理サーバ３００は、互いに管理ネットワーク６００で接続されている。

次に、物理サーバ１００上で動作するプログラムについて説明する。

パス管理プログラム１２０は、物理サーバ１００からストレージ装置４００上の論理ディスク４２０へのアクセスパス５００を管理するプログラムである。パス管理プログラム１２０は、あるアクセスパス上で障害が発生したときに、他のアクセスパスへフェイルオーバすることでアクセスパスの冗長化を実現する。また、パス管理プログラム１２０は、複数のアクセスパスへＩ／Ｏを発行することで、負荷分散を実現する。

仮想サーバ管理プログラム１３０は、物理サーバ１００上で動作する仮想サーバ２００を管理するプログラムである。仮想サーバ管理プログラム１３０は、それぞれの仮想サーバ２００がどの仮想ディスク４３０を使用するかを管理する。仮想サーバ管理プログラム１３０は、管理サーバ３００上のリソース管理プログラム３１０からの命令により、ある仮想サーバをほかの物理サーバに移行する。また、仮想サーバ管理プログラム１３０は、ある仮想ディスクを別のストレージ装置の論理ディスクへ移行してもよい。

管理サーバ３００上で動作するリソース管理プログラム３１０は、それぞれの物理サーバ上１００にあるパス管理プログラム１２０、および、仮想サーバ管理プログラム１３０と通信し、現在のアクセスパスの状態を取得する。また、リソース管理プログラム３１０は、仮想サーバ管理プログラム１３０へ命令を発行することにより、ある仮想サーバをほかの物理サーバへ移行させることや、ある仮想ディスクをほかの論理ディスクへ移行させる。

次に、それぞれのプログラムが使用するデータについて説明する。

図８は、本構成例のパス情報テーブル１４０の一例を表す図である。

図８に示す、パス情報テーブル１４０は、アクセスパス５００の位置情報と状態を含むテーブルである。パス情報テーブル１４０のエントリは、論理ディスクＩＤ、サーバ側ポートＩＤ、ストレージ側ポートＩＤ、および、パス状態である。論理ディスクＩＤは、論理ディスクの識別子である。サーバ側ポートＩＤは、ポート１１０の識別子である。ストレージ側ポートＩＤは、ポート４３０の識別子である。パス状態は正常／障害のいずれかの状態を持つ。

図９は、本構成例のリソース情報テーブル１５０の一例を表す図である。

図９に示す、リソース情報テーブル１５０は、仮想サーバ２００と、仮想サーバ２００に割り当てられている仮想ディスク４３０の対応を表す。リソース情報テーブル１５０は、エントリとして、仮想サーバ２００の識別子である仮想サーバＩＤと、仮想ディスク４３０の識別子である仮想ディスクＩＤを含む。

図１０は、本構成例の仮想ディスク情報テーブル１６０の一例を表す図である。

図１０に示す、仮想ディスク情報テーブル１６０は、仮想ディスクと、その仮想ディスクがある論理ディスクの対応を示す。仮想ディスク情報テーブル１６０は、エントリとして、仮想ディスクＩＤと論理ディスクＩＤを含む。

図１１は、本構成例の構成情報テーブル３２０の一例を表す図である。

図１１に示す、構成情報テーブル３２０は、仮想サーバと、その仮想サーバが配置されている物理サーバの対応を表す。構成情報テーブル３２０は、エントリとして、仮想サーバＩＤと物理サーバＩＤを含む。構成管理テーブル３２０は、構成記憶部３３０に格納される。

次に、本構成例の動作について図面を参照して説明する。

まず、各テーブルの更新動作について説明する。

パス情報テーブル１４０の初期値は空のテーブルである。パス管理プログラム１２０は、物理サーバ１００が、あるアクセスパス５００を経由し、あるストレージ装置４００へ接続されたとき、接続先の論理ディスクと４２０と、アクセスパス５００の位置情報を検知する。すなわち、パス管理プログラム１２０は、接続を行ったアクセスパス５００の両端にあるサーバ側ポート１１０とストレージ側ポート４１０を検知する。パス管理プログラム１２０は、パス情報テーブル１４０の対応するエントリに、検知された情報を追加する。

パス管理プログラム１２０は、アクセスパス５００を経由した、論理ディスク４２０へのＩ／Ｏに対してエラー応答を検出したとき、そのアクセスパスを閉塞させる。そして、パス管理プログラム１２０は、ほかのアクセスパス５００へＩ／Ｏを再発行することで、Ｉ／Ｏを継続させる。この操作はパスフェイルオーバと呼ばれる。このとき、パス管理プログラム１２０は、パス情報テーブル１４０上で、エラーを検出した論理ディスク４２０、サーバ側ポート１１０、および、ストレージ側ポート３１０に一致するエントリのパス状態を「障害」に更新する。

また、結線変更によるアクセスパスの変更や、論理ディスクの削除などによる構成変更に伴い、ある論理ディスク４２０へあるアクセスパス５００経由でのアクセスができなくなることがある。その場合、パス管理プログラム１２０は、対応するエントリをパス情報テーブル１４０から削除する。

リソース情報テーブル１５０の初期値は空のテーブルである。リソース管理プログラム３１０は、仮想サーバ２００に、その仮想サーバ２００が使用する仮想ディスク４３０を割り当てる。そのとき、リソース管理プログラム３１０は、割り当ての対象の仮想サーバ２００が稼働する、物理サーバ１００上の仮想サーバ管理プログラム１３０に、割り当て命令を送信する。割り当て命令を受信した仮想サーバ管理プログラム１３０は、仮想サーバ２００への仮想ディスク４３０の割り当てを行い、リソース情報テーブル１５０の対応するエントリに情報を追加する。

リソース管理プログラム３１０は、また、仮想サーバ２００が使用する仮想ディスク４３０の割り当てを解除する。このとき、物理サーバ１００上の仮想サーバ管理プログラム１３０に割り当て解除命令を送信する。解除命令を受信した仮想サーバ管理プログラム１３０は、仮想サーバ２００への仮想ディスク４３０の割り当てを解除し、リソース情報テーブル１５０の対応するエントリから情報を削除する。

仮想ディスク情報テーブル１６０の初期値は空のテーブルである。リソース管理プログラム３１０は、仮想ディスク４３０の配置先として、１つの論理ディスク４２０を指定する。そのとき、リソース管理プログラム３１０は、その論理ディスク４２０へアクセス可能な、物理サーバ１００上の仮想サーバ管理プログラム１３０に配置命令を送信する。仮想サーバ管理プログラム１３０は、その論理ディスク４２０への仮想ディスク４３０の配置を行い、仮想ディスク情報テーブル１６０の対応するエントリに情報を追加する。

構成情報テーブル３２０の初期値は空のテーブルである。リソース管理プログラム３１０は、ある仮想サーバ２００を１つの物理サーバ１００に割り当てる。そのとき、リソース管理プログラム３１０は、構成情報テーブル３２０の対応するエントリに情報を追加する。

リソース管理プログラム３１０は、ある仮想ディスク４３０の割当先を、ある論理ディスク４２０からほかの論理ディスク４２０へ移行する。この操作はストレージマイグレーションと呼ばれる。ストレージマイグレーションが完了したとき、リソース管理プログラム３１０は、仮想ディスク情報テーブル１６０の、移行が行われた仮想ディスク４３０に対応するエントリの論理ディスク１６２を更新する。

リソース管理プログラム３１０は、また、ある仮想サーバ２００割当先を、ある物理サーバ１００からほかの物理サーバ１００へ移行する。この操作はマイグレーションと呼ばれる。マイグレーションが完了したとき、リソース管理プログラム３１０は、構成情報テーブル３２０の、移行が行われた仮想サーバ２００に対応するエントリの物理サーバ３１２を更新する。また、リソース管理プログラム３１０は、仮想サーバ２００の移行に伴い、移行元の物理サーバ１００上のリソース情報テーブル１５０と仮想ディスク情報テーブル１６０から、移行が行われた仮想サーバ２００に対応するエントリを削除する。さらに、リソース管理プログラム３１０は、移行先の物理サーバ１００上のリソース情報テーブル１５０と仮想ディスク情報テーブル１６０に、移行が行われた仮想サーバ２００に対応するエントリを追加する。

次に、それぞれの仮想サーバ２００が使用している論理ディスク４２０に対するパス冗長度の求め方を説明する。

リソース管理プログラム３１０は、ある仮想サーバ２００に対して、構成情報テーブル３２０の対応するエントリを探すことにより、その仮想サーバ２００の割当先の物理サーバ１００を特定する。

リソース管理プログラム３１０は、通信ネットワーク６００を用いて、特定された物理サーバ１００上のパス情報テーブル１４０、リソース情報テーブル１５０、および、仮想ディスク情報テーブル１６０を参照する。リソース管理プログラム３１０は、まず、リソース情報テーブル１５０から当該仮想サーバ２００に対応するエントリを検索することにより、対象の仮想サーバが使用している仮想ディスク４３０を特定する。

次に、リソース管理プログラム３１０は、仮想ディスク情報テーブル１６０から、特定した仮想ディスク４３０に該当するエントリを検索することにより、当該仮想ディスク４３０が配置されている論理ディスク４２０を特定する。

さらに、リソース管理プログラム３１０は、パス情報テーブル１４０から、特定した論理ディスク４２０に該当するエントリを検索し、パス状態１４４が「正常」であるエントリ数を求める。リソース管理プログラム３１０は、このエントリ数を、仮想サーバ２００が使用している論理ディスク４２０に対する仮想サーバパス冗長度とする。

次に、それぞれの物理サーバ１００からアクセスできる論理ディスク４２０のパス冗長度の求め方を説明する。

リソース管理プログラム３１０は、通信ネットワーク６００を用いて、パス冗長度の算出の対象である物理サーバ１００上のパス情報テーブル１４０を参照する。

リソース管理プログラム３１０は、パス情報テーブル１４０から当該論理ディスク４２０と一致するエントリを検索し、パス状態１４４が「正常」であるエントリ数を求める。リソース管理プログラム３１０は、このエントリ数を、物理サーバ１００と論理ディスク４２０との間の経路の冗長性の高さを表す、物理サーバパス冗長度にする。

次に、アクセスパス障害が発生したときの、仮想サーバ移行の動作について説明する。

はじめに、アクセスパス障害が発生したときに、どの仮想サーバが影響を受けるかを割り出す方法を説明する。

パス管理プログラム１２０は、アクセスパス障害を検出したとき、前述のパスフェイルオーバを実施し、パス情報テーブル１４０のうち、障害が発生したアクセスパス５００のパス状態１４４を「障害」とする。そのあとで、パス管理プログラム１２０は、管理サーバ３００上のリソース管理プログラム３１０に、通信ネットワーク６００を通して、障害が発生したことを通知する。

障害発生の通知を受けたリソース管理プログラム３１０は、前述のパス冗長度の求め方の手順に従い、物理サーバ１００上のそれぞれの仮想サーバ２００が使用している論理ディスクのパス冗長度を求める。障害発生前後でパス冗長度の値が低下した仮想サーバ２００が、障害の影響を受けている仮想サーバ２００である。

次に、影響を受ける仮想サーバの移行先を求める方法を説明する。

リソース管理プログラム３１０は、前述の方法で、それぞれの物理サーバ１００と論理ディスク４２０との間のパス冗長度を求める。リソース管理プログラム３１０は、仮想サーバが移行可能な物理サーバ１００の中で、移行先のパス冗長度が最も高い物理サーバ１００を選べばよい。

リソース管理プログラム３１０による、移行可能な物理サーバ１００を特定する方法は、仮想サーバを動作させるために十分なリソースがある物理サーバ１００を移行可能と判定することなど、既存の技術による方法でよい。

パス冗長度が最も高い物理サーバ１００が複数ある場合、パス冗長度が最も高い複数の物理サーバ１００から移行先の物理サーバ１００を選択する方法は既存の任意の方法でよい。移行先の選択方法の一例として、移行にかかる時間が小さい物理サーバ１００を選択することや、移行後のＩ／Ｏ負荷が所定の閾値を越えない物理サーバ１００などが挙げられる。

次に、本構成例での移行先物理サーバの決定動作について、具体例を用いて説明する。

図１２は、本構成例の計算機システムの、さらに具体的な構成の一例を表す図である。

図１２を参照すると、本構成例の計算機システムは、２つの物理サーバ（物理サーバ１００ａと物理サーバ１００ｂ）と、１つの管理サーバ（管理サーバ３００ａ）と、２つのストレージ装置（ストレージ装置４００ａとストレージ装置４００ｂ）を含む。

物理サーバ１００ａは、２つのポート（ポート１１０ａ１とポート１１０ａ２）を含む。物理サーバ１００ａでは、パス管理プログラム１２０ａ、仮想サーバ管理プログラム１３０ａと、１つの仮想サーバ２００ａが動作している。物理サーバ１００ａのリソース記憶部２４には、パス情報テーブル１４０ａ、リソース情報テーブル１５０ａ、および、仮想ディスク情報テーブル１６０ａが格納されている。

物理サーバ１００ｂも同様に、２つのポート（ポート１１０ｂ１とポート１１０ｂ２）を含む。物理サーバ１００ｂでは、パス管理プログラム１２０ｂ、仮想サーバ管理プログラム１３０ｂと、１つの仮想サーバ２００ｂが動作している。物理サーバ１００ｂのリソース記憶部２４には、パス情報テーブル１４０ｂ、リソース情報テーブル１５０ｂ、および、仮想ディスク情報テーブル１６０ｂが格納されている。

管理サーバ３００ａでは、リソース管理プログラム３１０ａが動作している。管理サーバ３００ａの構成記憶部３００には、仮想サーバ情報テーブル３２０ａが格納されている。

ストレージ装置４００ａは、２つのポート（ポート４１０ａ１とポート４１０ａ２）と、１つの論理ディスク４２０ａとを含む。

ストレージ装置４００ｂも同様に、２つのポート（ポート４１０ｂ１とポート４１０ｂ２）と、１つの論理ディスク４２０ｂとを含む。

物理サーバ１００ａ、および、１００ｂと、ストレージ装置４００ａおよび、４００ｂとは、図６に示されるように、２つのＦＣスイッチ（ＦＣスイッチ５２０ａ及びＦＣスイッチ５２０ｂ）を経由して、接続されている。これらの装置を接続するのは、８つのＦＣケーブル５１０ａ１、５１０ａ２、５１０ｂ１、５１０ｂ２、５１０ｃ１、５１０ｃ２、５１０ｃ２、５１０ｄ１、および、５１０ｄ２である。

物理サーバ１００ａ、および、１００ｂは、それぞれ、論理ディスク４２０ａ、および、４２０ｂにアクセス可能である。

物理サーバ１００ａと、物理サーバ１００ｂと、管理サーバ３００ａとは、通信ネットワーク６００ａで接続されている。

仮想サーバ２００ａは、仮想ディスク４３０ａを使用している。仮想ディスク４３０ａは、ストレージ装置４００ａが含む、論理ディスク４２０ａ上に配置されている。

仮想サーバ２００ｂは、仮想ディスク４３０ｂを使用している。仮想ディスク４３０ｂは、ストレージ装置４００ｂが含む、論理ディスク４２０ｂ上に配置されている。

この例では、仮想サーバ２００ａ、および、２００ｂは、それぞれ、物理サーバ１００ａ、および、１００ｂのどちらにも配置可能である。また、物理サーバ１００ａ、および、１００ｂは、それぞれ、仮想サーバ２００ａ、および、２００ｂの両方を同時に動作させることが可能である。また、ストレージ装置４００ａ、および、４００ｂはストレージマイグレーションに対応していない。仮想ディスク４３０ａ、および、４３０ｂを、ストレージマイグレーションを用いてほかの論理ディスクに移動することはできない。

図１３及び図１６は、本構成例の具体例におけるパス情報テーブルの例を表す図である。

図１４及び図１７は、本構成例の具体例におけるリソース情報テーブルの例を表す図である。

図１５及び図１８は、本構成例の具体例における仮想ディスク情報テーブルの例を表す図である。

図１２に示される接続構成の物理サーバ１００ａには、それぞれ、図１３、図１４、および、図１５で表されるパス情報テーブル１４０ａ、リソース情報テーブル１５０ａ、および、仮想ディスク情報テーブル１６０ａが格納されている。

また、図１２に示される接続構成での物理サーバ１００ｂには、ぞれぞれ、図１０、図１１、および、図１２で表される、パス情報テーブル１４０ｂ、リソース情報テーブル１５０ｂ、および、仮想ディスク情報テーブル１６０ｂが格納されている。

図１９は、図１２の構成の例において、管理サーバ３００ａに格納されている、構成情報テーブル３２０ａの例を表す図である。

リソース管理プログラム３１０ａは、図１３から図１９のテーブルから、前述の方法で、各仮想サーバの仮想サーバパス冗長度と、物理サーバパス冗長度を計算する。

図２０は、各仮想サーバの仮想サーバパス冗長度の例を表す図である。図２０は、リソース管理プログラム３１０ａが、図１３から図１９のテーブルから、前述の方法で計算した、各仮想サーバの仮想サーバパス冗長度を表す。

図２１は、各物理サーバの物理サーバパス冗長度の例を表す図である。図２１は、リソース管理プログラム３１０ａが、図１３から図１９のテーブルから、前述の方法で計算した物理サーバパス冗長度を表す。

物理サーバ１００ａ上のポート１１０ａ１とＦＣスイッチ５２０ａを結ぶ経路上で障害が発生した場合、計算機システムの各装置の各プログラムは、以下のように動作する。

物理サーバ１００ａで動作している、パス管理プログラム１２０ａは、上述の経路で発生した障害を検出し、パス情報テーブル１４０ａを更新する。

図２２は、障害発生後のパス情報テーブル１４０の一例を表す図である。上述の障害の検出後、パス管理プログラム１２０ａは、パス情報テーブル１４０を図２２のように更新する。

次に、リソース管理プログラム３１０ａは、更新後のパス情報テーブル１４０を用いて、仮想サーバパス冗長度と、物理サーバパス冗長度を再計算する。

図２３は、障害発生後に再計算された仮想サーバパス冗長度の一例を表す図である。図２３は、更新後のパス情報テーブル１４０を用いて、パス管理プログラム１２０ａが再計算した仮想サーバパス冗長度を表す。

図２４は、障害発生後に再計算された物理サーバパス冗長度の一例を表す図である。図２４は、更新後のパス情報テーブル１４０を用いて、パス管理プログラム１２０ａが再計算した物理サーバパス冗長度を表す。

次に、リソース管理プログラム３１０ａは、障害の影響を受ける仮想サーバを特定する。リソース管理プログラム３１０ａは、障害検出前の仮想サーバパス冗長度と、障害検出後の仮想サーバパス冗長度を比較し、使用している論理ディスクの仮想サーバパス冗長度が減少している仮想サーバを抽出する。図２１の障害検出前の仮想サーバパス冗長度と、図２３の障害検出後の仮想サーバパス冗長度を比較すると、仮想サーバ２００ａが使用している論理ディスク４２０ａの冗長度が４から２に減少している。リソース管理プログラム３１０ａは、障害の影響を受けている仮想サーバとして、仮想サーバ２００ａを抽出する。

次に、リソース管理プログラム３１０ａは、仮想サーバ２００ａの移行先の物理サーバを決定する。リソース管理プログラム３１０ａは、仮想サーバ２００ａを移行させることができるサーバの中で、仮想サーバ２００ａが使用する論理ディスクへのパスの冗長度が最も高い物理サーバを選択する。そして、リソース管理プログラム３１０ａは、選択されたサーバを、仮想サーバ２００ａの移行先の物理サーバを決定する。

図２４の障害発生後の物理サーバパス冗長度では、物理サーバ１００ａと、仮想サーバ２００ａが使用している論理ディスク４２０ａとの間のパスの、物理サーバパス冗長度は２である。図２１と図２４を比較すると、仮想サーバ２００ａが使用している論理ディスク４２０ａとの間のパスの、物理サーバパス冗長度は、障害発生後、４から２に減少している。一方、物理サーバ１００ｂと論理ディスク４２０ａとの間のパスの物理サーバパス冗長度は４である。物理サーバ１００ｂと論理ディスク４２０ａとの間のパスの物理サーバパス冗長度は、障害発生後も４のままである。リソース管理プログラム３１０ａは、物理サーバ１００ｂを選択する。

仮想サーバ２００ａは、物理サーバ１００ｂに移行させても動作することが可能である。また、物理サーバ１００ｂは、仮想サーバ２００ａと２００ｂの両方を同時に動作させることができる。従って、仮想サーバ２００ａを、物理サーバ１００ｂに移行させることは可能である。リソース管理プログラム３１０ａは、仮想サーバ２００ａの移行先を、物理サーバ１００ｂに決定する。

リソース管理プログラム３１０ａは、仮想サーバ２００ａを物理サーバ１００ａから１００ｂに移行させる。

図２５は、移行後の仮想サーバパス冗長度の一例を表す図である。図２５は、リソース管理プログラム３１０ａは、仮想サーバ２００ａを物理サーバ１００ａから１００ｂに移行させた後の仮想サーバパス冗長度を表す。図２４と図２５を比較すると、移行後の仮想サーバ２００ａの仮想サーバパス冗長度は、移行前より増加している。

本構成例を、各仮想サーバが、ストレージ装置に含まれる論理サーバを直接アクセスするように変形することも可能である。

図２６は、本構成例がそのように変形された変形例の計算機システムの構成を表す図である。本変形例の構成は、以下の点を除き、図７の構成と同じである。本変形例の計算機システムでは、仮想サーバ２００がパス管理テーブル２２０を含んでいてもよい。また、仮想サーバ２００上で、パス管理プログラム２１０が動作していてもよい。パス管理プログラム２１０は、上述のパス管理プログラム１２０と同様の動作を行う。パス管理プログラム２１０は、パス管理テーブル１４０ではなく、仮想サーバ２００が含むパス管理テーブル２２０を更新する。仮想サーバパス冗長度を計算する際、リソース管理プログラム３１０は、物理サーバ１００上のパス情報テーブル１４０に加え、仮想サーバ１００上のパス情報テーブル２２０の情報を読み出す。

また、第１の実施形態や構成例では、管理装置１や管理サーバ３００は、実際の障害発生をトリガーとして、計算機資源の移行先を決定する。一方、管理装置１や管理サーバ３００は、実際には障害が発生していない状態で、さまざまな経路で障害が発生した場合のパス冗長度を算出し、障害が発生した場合の仮想サーバ２００の移行の計画を作成することも可能である。

次に、本発明の第２の実施形態について、図面を参照して詳細に説明する。

図２７は、本実施形態の管理装置１の構成を表すブロック図である。

図２７を参照すると、本実施形態の管理装置１は、それぞれ複数の経路でストレージ装置３に接続され、仮想サーバ２１を稼働させる複数の物理サーバ２から、いずれかの前記経路の障害を検出する障害検出部１０と、前記経路の障害が検出された前記物理サーバ２である故障サーバで稼働する前記仮想サーバ２１を抽出する抽出部１１と、前記複数の物理サーバ２の各々に対して、当該物理サーバ２と前記ストレージ装置３との間の経路の冗長性の高さを表す冗長度を算出する冗長度算出部１２と、前記冗長度が高い前記物理サーバ２を選択する選択部１３と、抽出された前記仮想サーバ２１の識別子と、選択された前記物理サーバ２の識別子を含む移行指示情報を送信する送信部１４とを含む。

前述のように、物理サーバ２は、単に、サーバとも表記される。仮想サーバ２１は、仮想計算機とも表記される。

以上で説明した本実施形態には、第１の実施形態と同じ効果がある。その理由は、第１の実施形態における理由と同じである。

管理装置１、物理サーバ２、ストレージ装置３は、それぞれ、コンピュータ及びコンピュータを制御するプログラム、専用のハードウェア、又は、コンピュータ及びコンピュータを制御するプログラムと専用のハードウェアの組合せにより実現することができる。

障害検出部１０、抽出部１１、冗長度算出部１２、選択部１３、送信部１４、負荷検出部１６、仮想サーバ２１、仮想サーバ管理部２２、パス管理部２３は、例えば、プログラムを記憶する記録媒体からメモリに読み込まれた、各部の機能を実現するための専用のプログラムと、そのプログラムを実行するプロセッサにより実現することができる。また、冗長度記憶部１５、リソース記憶部２４、ディスク３１は、コンピュータが含むメモリやハードディスク装置により実現することができる。あるいは、障害検出部１０、抽出部１１、冗長度算出部１２、選択部１３、送信部１４、冗長度記憶部１５、負荷検出部１６、仮想サーバ２１、仮想サーバ管理部２２、パス管理部２３、リソース記憶部２４、ディスク３１の一部又は全部を、各部の機能を実現する専用の回路によって実現することもできる。

以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

１管理装置
２、１００、１００ａ、１００ｂ物理サーバ
３、４００、４００ａ、４００ｂストレージ装置
４、６００管理ネットワーク
５仮想サーバ管理装置
６スイッチ
７情報処理システム
１０障害検出部
１１抽出部
１２冗長度算出部
１３選択部
１４送信部
１５冗長度記憶部
１６負荷検出部
２０、３０、１１０、１１０ａ１、１１０ａ２、１１０ｂ１、１１０ｂ２、４１０４１０ａ１、４１０ａ２、４１０ｂ１、４１０ｂ２ポート
２１、２００仮想サーバ
２２仮想サーバ管理部
２３パス管理部
２４リソース記憶部
３１ディスク
１２０、１２０ａ、１２０ｂ、２１０パス管理プログラム
１３０、１３０ａ、１３０ｂ仮想サーバ管理プログラム
１４０、１４０ａ、１４０ｂ、２２０パス情報テーブル
１５０、１５０ａ、１５０ｂリソース情報テーブル
１６０、１６０ａ、１６０ｂ仮想ディスク情報テーブル
３００、３００ａ管理サーバ
３１０、３１０ａリソース管理プログラム
３２０、３２０ａ構成情報テーブル
３３０構成記憶部
４２０、４２０ａ、４２０ｂ論理ディスク
４３０、４３０ａ、４３０ｂ仮想ディスク
５００アクセスパス
５１０ａ１、５１０ａ２、５１０ｂ１、５１０ｂ２、５１０ｃ１、５１０ｃ２、５１０ｄ１、５１０ｄ２ＦＣケーブル
５２０、５２０ａ、５２０ｂＦＣスイッチ

Claims

それぞれ複数の経路でストレージ装置に接続され、仮想計算機を稼働させる複数のサーバの各々に対して、当該サーバと前記ストレージ装置との間の経路の冗長性の高さを表す冗長度を算出する冗長度算出手段と、
前記経路の障害を検出する障害検出手段と、
前記経路の障害によって前記冗長度が低下した前記サーバを特定し、当該サーバで稼働する前記仮想計算機を抽出する抽出手段と、
前記複数のサーバのうち、前記冗長度が、前記冗長度が低下した前記サーバの前記冗長度よりも高い前記サーバを選択する選択手段と、
抽出された前記仮想計算機の識別子と、選択された前記サーバの識別子を含む移行指示情報を送信する送信手段と
を含む管理装置。
前記複数のサーバは、それぞれ複数の経路で、複数の前記ストレージ装置のいずれか１個以上に接続され、
前記冗長度算出手段は、前記サーバと、前記サーバで稼働する前記仮想計算機が使用する前記ストレージ装置の各々との間の、冗長性の高さを表す値を算出し、前記値の最小値を、当該サーバの前記冗長度として算出し、
前記抽出手段は、前記複数のサーバのそれぞれにつき、前記冗長度が前記経路の障害により低下するか否かを判定し、前記冗長度が前記経路の障害により低下すると判定された前記仮想計算機を抽出し、
前記選択手段は、前記複数のサーバのうち、抽出された前記仮想計算機を稼働させた場合の前記冗長度が、前記冗長度が低下した前記サーバの前記冗長度よりも高くなる前記サーバを選択する
請求項１に記載の管理装置。
前記複数のサーバの各々の負荷を検出する負荷検出手段を備え、
前記選択手段は、検出された前記負荷が所定の閾値より小さい前記複数のサーバの中から前記サーバを選択する
請求項１又は２に記載の管理装置。
前記サーバと、前記ストレージ装置と、請求項１から３のいずれか一項に記載の管理装置と
を含む情報処理システム。
それぞれ複数の経路でストレージ装置に接続され、仮想計算機を稼働させる複数のサーバの各々に対して、当該サーバと前記ストレージ装置との間の経路の冗長性の高さを表す冗長度を算出し、
前記経路の障害を検出し、
前記経路の障害によって前記冗長度が低下した前記サーバを特定し、当該サーバで稼働する前記仮想計算機を抽出し、
前記複数のサーバのうち、前記冗長度が、前記冗長度が低下した前記サーバの前記冗長度よりも高い前記サーバを選択し、
抽出された前記仮想計算機の識別子と、選択された前記サーバの識別子を含む移行指示情報を送信する
管理方法。
前記複数のサーバを、それぞれ複数の経路で、複数の前記ストレージ装置のいずれか１個以上に接続し、
前記サーバと、前記サーバで稼働する前記仮想計算機が使用する前記ストレージ装置の各々との間の、冗長性の高さを表す値を算出し、前記値の最小値を、当該サーバの前記冗長度として算出し、
前記複数のサーバのそれぞれにつき、前記冗長度が前記経路の障害により低下するか否かを判定し、
前記冗長度が前記経路の障害により低下すると判定された前記仮想計算機を抽出し、
前記複数のサーバのうち、抽出された前記仮想計算機を稼働させた場合の前記冗長度が、前記冗長度が低下した前記サーバの前記冗長度よりも高くなる前記サーバを選択する
請求項５に記載の管理方法。
前記複数のサーバの各々の負荷を検出し、
検出された前記負荷が所定の閾値より小さい前記複数のサーバの中から前記サーバを選択する
請求項５又は６に記載の管理方法。
コンピュータを、
それぞれ複数の経路でストレージ装置に接続され、仮想計算機を稼働させる複数のサーバの各々に対して、当該サーバと前記ストレージ装置との間の経路の冗長性の高さを表す冗長度を算出する冗長度算出手段と、
前記経路の障害を検出する障害検出手段と、
前記経路の障害が検出された前記サーバである故障サーバで稼働する前記仮想計算機を抽出する抽出手段と、
前記経路の障害によって前記冗長度が低下した前記サーバを特定し、当該サーバで稼働する前記仮想計算機を抽出する抽出手段と、
前記複数のサーバのうち、前記冗長度が、前記冗長度が低下した前記サーバの前記冗長度よりも高い前記サーバを選択する選択手段と、
抽出された前記仮想計算機の識別子と、選択された前記サーバの識別子を含む移行指示情報を送信する送信手段と
して動作させる管理プログラム。
前記複数のサーバは、それぞれ複数の経路で、複数の前記ストレージ装置のいずれか１個以上に接続され、
コンピュータを、
前記サーバと、前記サーバで稼働する前記仮想計算機が使用する前記ストレージ装置の各々との間の、冗長性の高さを表す値を算出し、前記値の最小値を、当該サーバの前記冗長度として算出する前記冗長度算出手段と、
前記経路の障害を検出する前記障害検出手段と、
前記複数のサーバのそれぞれにつき、前記冗長度が前記経路の障害により低下するか否かを判定し、前記冗長度が前記経路の障害により低下すると判定された前記仮想計算機を抽出する前記抽出手段と、
前記複数のサーバのうち、抽出された前記仮想計算機を稼働させた場合の前記冗長度が、前記冗長度が低下した前記サーバの前記冗長度よりも高くなる前記サーバを選択する前記選択手段と
して動作させる請求項８に記載の管理プログラム。
コンピュータを、
前記複数のサーバの各々の負荷を検出する負荷検出手段と、
検出された前記負荷が所定の閾値より小さい前記複数のサーバの中から前記サーバを選択する前記選択手段と
して動作させる請求項８又は９に記載の管理プログラム。