WO2007108065A1

WO2007108065A1 - サーバ管理方法、プログラム及び装置

Info

Publication number: WO2007108065A1
Application number: PCT/JP2006/305373
Authority: WO
Inventors: Kiyoshi Kouge
Original assignee: Fujitsu Limited
Priority date: 2006-03-17
Filing date: 2006-03-17
Publication date: 2007-09-27
Also published as: JPWO2007108065A1; JP4700104B2

Abstract

　実サーバ上に構築された仮想サーバを管理サーバにより管理する。計算機計画部は、仮想サーバの凍結時刻と再開時刻を設定した計算機計画情報を作成し、現在時刻が凍結時刻に到達した際に計算機管理部に凍結を指示し、現在時刻が前記再開時刻に到達した際に前記計算機管理部に再開を指示する。ジョブ管理部は、キューから受付けたジョブを取出し、計算機管理部に問合せてジョブの実行を依頼する仮想サーバを決定した際に、ジョブの実行終了時刻が凍結時刻より前の場合は決定した仮想サーバのジョブ制御部にジョブの実行を依頼し、実行終了時刻が前記凍結時刻を過ぎている場合は計算機管理部に再度問合せて実行終了時刻が前記凍結時刻前となる仮想サーバを決定する処理を繰り返す。計算機管理部は凍結指示又は再開指示を受けた際に、依頼先の仮想サーバを凍結又は再開させる。

Description

サーバ管理方法、プログラム及び装置

技術分野

[0001] 本発明は、実サーバ上に構築される仮想サーバを管理するサーバ管理方法、プログラム及び装置に関し、特に、コンピューティンググリッド環境における各種シミュレ一シヨン計算等のジョブを複数の仮想サーバに分散して実行する際の仮想サーバの停止と再開を制御するサーバ管理方法、プログラム及び装置に関する。

背景技術

[0002] 従来、地球環境や気象環境等の各種のシミュレーション計算は、非常に長時間を要し、計算ジョブが長時間計算機資源を使用した状態が継続され、膨大な計算機資源を必要とするため、近年、コンピューティンググリッド環境における各種シミュレーシヨン計算システムが構築されて、る。

[0003] コンピューティンググリッド環境によるシミュレーション計算システムは、計算ジョブを最適な計算機資源に割り当て、分散された計算機資源を効率的に利用する。またコンピューティンググリッド環境の場合、計算機資源はシミュレーション計算ジョブのための占有リソースでない場合があり、他の利用目的で計算機資源が利用される場合があり、計算機資源の貸し借りが必要となる。

[0004] 長時間の実行を要するシミュレーション計算ジョブが計算機資源を利用している場合、他の目的で同じ計算機資源を利用できない。また、他の目的で利用することが判つて、る計算機資源をシミュレーション計算ジョブで利用することもできな、。

[0005] このためコンピューティンググリッド環境に割り当てた計算機資源であっても、オフィス業務など他の目的で利用中の計算機資源は除外し、空き計算機資源でシミュレ一シヨン計算ジョブを実行させる。しかし、シミュレーション計算ジョブが長時間にわたり計算機資源を占有した場合、他の業務でその計算機資源を使、たくても使えな!/、などの問題が発生する。

[0006] この問題を解決する一般的な方法として、ジョブのチェックポイント 'リスタート機能がある。チェックポイント 'リスタート機能は、ジョブを司るジョブ管理制御装置と計算ァプリケーシヨンが連携し、アプリケーションにおける計算処理がどこまで進んでいるかを定期的に保存し、一時的に計算ジョブを停止させ、他の目的で計算機資源を利用でさるよう〖こする。

[0007] このため、長時間を要するシミュレーション計算ジョブを、チェックポイント ·リスタート機能によるジョブ実行と停止を繰り返して少ない空き計算機資源を積み重ねることで、他の業務に影響を与えることなくシミュレーション計算ジョブを継続することができる特許文献 1：特開 2005— 208919号公報

特許文献 2 :特開 2005— 196561号公報

発明の開示

発明が解決しょうとする課題

[0008] し力しながら、このような従来のチェックポイント 'リスタート機能を利用した計算機資源の利用方法にあっては、シミュレーション計算ジョブとして動作するアプリケーションにおいて、チヱックポイント 'リスタートのための制御処理が必須であり、アプリケーシヨンの開発コストが膨らむという問題がある。

[0009] また、巿販ソフトウェアなどチェックポイント ·リスタート機能を保持しな、アプリケーシヨンによりシミュレーション計算ジョブを実行する場合、一時的にシミュレーション計算ジョブを停止させることが困難である。

[0010] また、他の目的で計算機資源を利用する際に、サーバ自身を別の OS等で再起動するような運用を行いたい場合、チェックポイント 'リスタート機能は利用できない。この理由は、チェックポイント 'リスタート機能では、チェックポイントを採るためには、ァプリケーシヨン側にチェックポイントを採るためのロジックが必須である。また、チェックポイントによる情報が保存された資源はジョブ単位で管理され、ジョブ管理制御装置の配下で管理される。

[0011] このため、サーバ自身を停止させて別の OSで計算機資源を利用する場合は、ジョブ管理制御装置が停止してしまうため、シミュレーション計算ジョブを一時的に凍結しても、その後再開することは困難である。

[0012] また他の業務で使用している計算機資源の空き時間を利用してシミュレーション計算ジョブに計算機資源を割り当てる環境においては、計算機資源を夜間および休日のみ利用する場合、数十台あるいは数百台ある計算機資源を手動で切り替えるのは運用コストが増大するため、外部のスケジュール機能などを利用した時刻管理による自動化運用が行われる。

[0013] しかし、計算機資源の利用を時刻管理により自動化した場合、終了時刻を迎える直前に実行時間の短いジョブが計算機へ依頼されたとき、ジョブ実行中に終了時刻となってチェックポイント 'リスタート機能によりジョブの実行が中断される。このため、実行時間の短、ジョブであっても、次の利用開始時刻に達してジョブが再開されな、限り、ジョブの実行結果を得ることができず、ジョブの実行に長時間待たされることで、処理効率が大きく低下する問題がある。

[0014] 本発明は、実サーバ上に構築される仮想サーバに計算ジョブを実行させ、アプリケーシヨンや OSに依存することなくジョブの停止と再開を任意のタイミングで可能とすると同時に、時刻管理により計算機資源の利用する際のジョブ実行を資源利用の中断によって長時間待たせな!/、ようにするサーバ管理方法、プログラム及び装置を提供することを目的とする。

課題を解決するための手段

[0015] 本発明はサーバ管理方法を提供する。本発明は、実サーバ上に構築された仮想サーバを管理サーバにより管理するサーバ管理方法に於いて、

仮想サーバの凍結時刻と再開時刻を含む計算機計画情報を管理し、現在時刻が凍結時刻に到達した際に凍結を指示し、現在時刻が再開時刻に到達した際に再開を指示する計算機計画ステップと、

ジョブの依頼を受付けてキューに格納するジョブ受付ステップと、

キュー力もジョブを取出し、サーバ管理情報に基づいてジョブ依頼先の仮想サーバを決定した際に、ジョブ管理情報力も得られたジョブの実行終了時刻と仮想サーバの凍結時刻とを比較し、実行終了時刻が凍結時刻より前の場合は決定した仮想サーバのジョブ制御部にジョブの実行を依頼し、実行終了時刻が凍結時刻を過ぎてヽる場合は、実行終了時刻が凍結時刻前となる仮想サーバを決定する処理を繰り返すジョブ実行依頼ステップと仮想サーバの凍結指示を受けた際に、依頼先の仮想サーバが稼動状態にあることを判別して、仮想サーバを構築する実サーバの仮想サーバ制御部に凍結指示を送信し、稼動中の仮想サーバを凍結させる凍結ステップと、

仮想サーバの再開指示を受けた際に、依頼先の仮想サーバが凍結状態にあることを判別して仮想サーバを構築する実サーバの仮想サーバ制御部に再開指示を送信し、凍結中の仮想サーバを稼動してジョブの実行を再開させる再開ステップと、仮想サーバのジョブ終了を認識した際に、仮想サーバのジョブ制御部に依頼して終了したジョブを回収するジョブ回収ステップと、

を備えたことを特徴とする。

[0016] ここで、ジョブ管理情報は、ジョブ識別子、ジョブが凍結が可能か又は不可かを示す凍結可否情報、ジョブが凍結不可の場合の予想実行時間を含み、

ジョブ実行依頼ステップは、キュー力取出したジョブが凍結不可で且つ予想実行時間から求めた実行終了時刻が前記凍結時刻を過ぎて!/ヽる場合に、実行終了時刻が凍結時刻より前となるジョブ依頼先となる仮想サーバを決定する処理を繰り返す。

[0017] サーバ管理情報は、

ジョブを実行するサーバ名又はネットワークアドレス、実サーバか仮想サーバかの種別、各サーバの稼動、停止又は凍結の状態、各サーバの実行ジョブ数を含む分散制御情報と、

実サーバと仮想サーバの対応関係、仮想サーバの稼動、停止又は凍結の状態、仮想サーバ毎の実行中のジョブ一覧を含む仮想サーバ管理情報と、

を備える。

[0018] ジョブ実行依頼ステップは、分散制御情報を参照して稼動状態にある複数の仮想サーバの中から実行ジョブ数が最小の仮想サーバをジョブ依頼先として検索。

[0019] 凍結ステップ及び再開ステップは、仮想サーバ管理情報力仮想サーバの状態と仮想サーバを構築している実サーバを検索して凍結指示又は再開指示を行。

[0020] ジョブ実行依頼ステップは、実サーバ上に構築されている仮想サーバとの通信途絶による異常を検出した際に、記サーバ管理情報を参照してサーバの凍結状態を認識した場合は正常と判断して異常検出を破棄する。 [0021] ジョブ受付ステップは、コンピューティング環境によるジョブを受付けて複数の仮想サーバにジョブ実行を依頼させる。

[0022] (プログラム）

本発明はサーバ管理プログラムを提供する。本発明は、実サーバ上に構築された仮想サーバを管理するサーバ管理装置のコンピュータに、

キュー力もジョブを取出し、サーバ管理情報に基づいてジョブ依頼先の仮想サーバを決定した際に、ジョブ管理情報力も得られたジョブの実行終了時刻と仮想サーバの凍結時刻とを比較し、実行終了時刻が凍結時刻より前の場合は決定した仮想サーバのジョブ制御部にジョブの実行を依頼し、実行終了時刻が凍結時刻を過ぎてヽる場合は、実行終了時刻が凍結時刻前となる仮想サーバを決定する処理を繰り返すジョブ実行依頼ステップと

仮想サーバの凍結指示を受けた際に、依頼先の仮想サーバが稼動状態にあることを判別して、仮想サーバを構築する実サーバの仮想サーバ制御部に凍結指示を送信し、稼動中の仮想サーバを凍結させる凍結ステップと、

を実行させることを特徴とする。

[0023] (装置）

本発明はサーバ管理装置を提供する。本発明は、実サーバ上に構築された仮想サーバを管理するサーバ管理装置に於、て、前記仮想サーバの凍結時刻と再開時刻を含む計算機計画情報を管理する計算機計画部と、

前記仮想サーバに設けられたジョブ制御部を管理するジョブ管理部と、前記仮想サーバを構築する物理サーバの仮想サーバ制御部を管理する計算機管理部と、

を備え、

計算機計画部は、

仮想サーバの凍結時刻と再開時刻を設定した計算機計画情報を作成する計画作成部と、

現在時刻が前記凍結時刻に到達した際に計算機管理部に凍結を指示し、現在時刻が再開時刻に到達した際に計算機管理部に再開を指示する計画指示部と、を備え、

ジョブ管理部は、

ジョブの依頼を受付けてキューに格納するジョブ受付部と、

キュー力ジョブを取出し、計算機管理部に問合せてジョブの実行を依頼する仮想サーバを決定した際に、ジョブ管理情報力も得られたジョブの実行終了時刻と仮想サーバの凍結時刻とを比較し、実行終了時刻が凍結時刻より前の場合は決定した仮想サーバのジョブ制御部にジョブの実行を依頼し、実行終了時刻が凍結時刻を過ぎている場合は計算機管理部に再度問合せて実行終了時刻が凍結時刻前となる仮想サーバを決定する処理を繰り返すジョブ実行依頼部と、

仮想サーバのジョブ終了を認識した際に、仮想サーバのジョブ制御部に依頼して終了したジョブを回収するジョブ回収部と、

を備え、

計算機管理部は、

ジョブ管理部から問合せを受けた際に、ジョブ依頼先の実サーバと仮想サーバを検索して計画指示部の計算機計画情報力得られた凍結時刻と共に応答する依頼先検索部と、

仮想サーバの凍結指示を受けた際に、依頼先の仮想サーバが実行状態にあることを判別して、仮想サーバを構築する実サーバの仮想サーバ制御部に凍結指示を送信し、ジョブ実行中の仮想サーバを凍結させる凍結部と、

仮想サーバの再開指示を受けた際に、依頼先の仮想サーバが凍結状態にあることを判別して、仮想サーバを構築する実サーバの仮想サーバ制御部に再開指示を送信し、凍結中の仮想サーバにジョブの実行を再開させる再開部と、

を備えたことを特徴とする。

発明の効果

[0024] 本発明によければ、仮想サーバにジョブの実行を依頼する際に，依頼するジョブが凍結不可である場合は、計算機計画情報を参照して依頼先の仮想サーバがこれから依頼しょうとしているジョブが終了する前に計画的に凍結される力否か判定し、もしジョブ終了前に凍結する計画となっている場合は、ジョブ終了後に凍結する計画のある他の仮想サーバを検索してジョブを依頼し、これによつて短時間で終了するはずのジョブが。凍結する計画ある仮想サーバで実行されることで、長時間待たないとジョブ実行結果がえられな、と、う問題を回避することができる。

[0025] また仮想サーバに対する時刻管理による凍結と再開の指示により、例えば昼間は事務処理等の業務で利用している計算機資源を夜間のみコンピューティンググリッド環境によるシミュレーション計算ジョブに利用でき、サーバ仮想化基盤の導入コストだけで、連続して計算機の空き時間を有効に利用して長時間を要するシミュレーション計算を実行することができる。

[0026] また仮想サーバを凍結することで計算機資源を開放するため、シミュレーション計算ジョブとして動作して、るアプリケーション側にぉ、て、従来のようなチェックポイント 'リスタート機能を実装する必要がなぐアプリケーションの開発コスト、保守コストを大幅に削減することができる。

[0027] また、チェックポイント 'リスタート機能を実装していない市販のアプリケーションなど、どのようなアプリケーションでも仮想サーバ上で計算ジョブを実行することで、任意のタイミングで一時凍結し、また任意のタイミングで再開することができる。

図面の簡単な説明

[0028] [図 1]本発明が適用されるコンピューティンググリッド環境の説明図

[図 2]本実施形態における管理サーバと実サーバ上に構築される仮想サーバを示した機能構成のブロック図

[図 3]本実施形態における仮想サーバの論理アーキテクチャの説明図

[図 4]図 2のジョブ管理テーブルの説明図

[図 5]図 2の計算機計画テーブルの説明図

[図 6]図 2の分散制御テーブルの説明図

[図 7]図 2の仮想サーバ管理テーブルの説明図

[図 8]本実施形態における仮想サーバの凍結と再開の処理機能の説明図

[図 9]本実施形態の管理サーバが適用されるコンピュータのハードウェア環境の説明図

[図 10]本実施形態のサーバ管理処理のタイムチャート

[図 11]図 10に続く本実施形態のサーバ管理処理のタイムチャート

[図 12]図 2の管理サーバにおけるジョブ管理処理のフローチャート

[図 13]図 12のステップ 6の非同期ジョブ終了待合せ処理のフローチャート

[図 14]図 2の仮想サーバにおける計算機計画処理のフローチャート

[図 15]図 2の管理サーバにおける計算機管理処理のフローチャート

[図 16]図 2の仮想サーバにおけるジョブ制御処理のフローチャート

[図 17]図 16のステップ 4における非同期ジョブ終了待ち合せ処理のフローチャート

[図 18]図 2の実サーバにおける仮想サーバ制御処理のフローチャート

発明を実施するための最良の形態

[0029] 図 1は本発明が適用されるコンピューティンググリッド環境の説明図である。図 1において、本実施形態の管理サーバ 10はネットワーク 12に接続され、ネットワーク 12 にはシミュレーション計算ジョブなどを依頼する計算機群 14として、本実施形態にあつては実サーバ 16— 1〜16— 39を接続している。

[0030] 管理サーバ 10に対しては、オペレータ 18— 1の操作でシミュレーション計算ジョブのジョブ投入 20が行われ、管理サーバ 10による管理の下に、計算機群 14に含まれる実サーバ 16— 1〜16— 39のいずれかにジョブを依頼して実行させる。

[0031] また管理サーバ 10に対しては、実行中のジョブに対し仮想サーバに対する凍結' 再開指示 22をオペレータ 18— 2から行うことができる。 [0032] 外部スケジューラ 24には計算機計画を作成するために使用する定義ファイル 26が準備されており、定義ファイル 26に基づいて管理サーバ 16は計算機群 14の実サーノ 16— 1〜16— 39に構築される仮想サーバの凍結時刻と再開時刻を含む計算機計画テーブルを作成して管理する。

[0033] 図 2は本実施形態における管理サーバと実サーバ上に構築される仮想サーバを示した機能構成のブロック図である。図 2において、本実施形態にあっては、説明を簡単にするため、管理サーバ 10に対し 1台の実サーバ 16を配置した場合を例にとっている。

[0034] 管理サーバ 10には、ジョブ管理部 28、計算機管理部 30、分散制御テーブル 32、仮想サーバ管理テーブル 34,ジョブ管理テーブル 44、計算機計画部 46、計算機計画テーブル 48が設けられる。

[0035] 一方、実サーバ 16には仮想サーバ 36と仮想サーバ制御部 38が設けられ、仮想サーバ 36の中にはジョブ制御部 40と計算ジョブ 42が設けられることになる。

[0036] ここで、管理サーバ 10及び実サーバ 16におけるそれぞれの機能は、コンピュータによるプログラムの実行により実現される機能である。

[0037] 管理サーバ 10のジョブ管理部 28には、ジョブ受付部 28— 1、ジョブ実行依頼部 28 —2、ジョブ回収部 28— 3が設けられる。ジョブ受付部 28— 1は、図 1に示したようなオペレータ 18— 2もしくは外部スケジューラ 24からのジョブ投入 20によるジョブの依頼を受けて、内蔵したキューに格納する。

[0038] ジョブ実行依頼部 28— 2は、キュー力もジョブを取り出し、計算機管理部 30に依頼して決定した仮想サーバ 36のジョブ制御部 40にジョブの実行を依頼する。更に、ジョブ実行依頼部 28— 2は、計算機管理部 30に問合せてジョブの実行を依頼する仮想サーバを決定した際に、依頼しょうとしているジョブが凍結不可の場合、ジョブの実行終了時刻と仮想サーバの凍結時刻とを比較し、実行終了時刻が凍結時刻より前の場合は決定した仮想サーバ 16のジョブ制御部 36にジョブの実行を依頼し、実行終了時刻が凍結時刻を過ぎている場合は計算機管理部あわに再度問合せて実行終了時刻が凍結時刻前となる仮想サーバを決定する処理を繰り返す。

[0039] ここでジョブ管理テーブル 44には、ジョブ識別子、ジョブが凍結可能か又は凍結不可かを示す凍結可否情報、ジョブが凍結不可の場合の予想実行時間が登録されており、ジョブ実行依頼部 30は、現在時刻にジョブ管理テーブル 44から取得した予想実行時間を加算して実行終了時刻を求め、計算機管理部 30側カゝら得られた依頼先の仮想サーバ 16の凍結時刻と比較する。

[0040] ジョブ回収部 28— 1は、仮想サーバ 36のジョブ終了を認識した際に、ジョブ制御部 40に依頼して終了したジョブを回収する。

[0041] 計算機管理部 30には、依頼先検索部 30— 1、凍結処理部 30— 2及び再開処理部 30— 3が設けられている。依頼先検索部 30— 1は、ジョブ管理部 28からの問合せを受けた際に、ジョブ依頼先の実サーバ 16と仮想サーバ 36を検索し、計算機計画部 4 6の計算機計画テーブル 48から得られた凍結時刻と共に応答する。

[0042] 図 2にあっては実サーバ 16は 1台で、且つ実サーバ 16上に構築された仮想サーバ 36も 1台である力実際には図 1のように管理サーバ 10の依頼先となる実サーバは計算機群 14に示すように複数であり、また実サーバ 16上に構築される仮想サーバ 3 6の数も複数台構築される場合がある。

[0043] 凍結処理部 30— 2は、外部からの操作依頼 22又は計算機計画部 46から仮想サーバ 36の凍結依頼を受けた際に、依頼先の仮想サーバ 36が計算ジョブ 42の実行状態にあることを判別して、仮想サーバ 36を構築する実サーバ 16の仮想サーバ制御部 38に凍結指示を送信し、計算ジョブ 42によるジョブ実行中の仮想サーバ 36を凍結させる。

[0044] 再開処理部 30— 3は、外部からの操作依頼 22又は計算機計画部 46から仮想サーバ 36の再開依頼を受けた際に、依頼先の仮想サーバ 36が凍結状態にあることを判別して、仮想サーバ 36を構築する実サーバ 16の仮想サーバ制御部 38に再開指示を送信し、凍結中の仮想サーバ 36に計算ジョブ 42の実行を再開させる。

[0045] 計算機計画部 46には計画作成部 46— 1と計画指示部 46— 2が設けられる。計画作成部 46— 1は、図 1の外部スケジューラ 24の定義ファイル 26を読込んで仮想サーバの凍結時刻と再開時刻を含む計算機計画テーブル 48を作成する。計画指示部 4 6— 2は、計算機計画テーブル 48の凍結時刻と再開時刻を現在時刻と比較しており、現在時刻が凍結時刻に到達した際に計算機管理部 30に凍結を指示し、現在時刻が再開時刻に到達した際に計算機管理部 30に再開を指示する。

[0046] 一方、実サーバ 16に構築された仮想サーバ 36のジョブ制御部 40は、管理サーバ 10のジョブ管理部 28からジョブ実行依頼を受け付け、アプリケーションにより計算ジョブ 42を実行し、計算ジョブ 42が終了すると実行終了をジョブ管理部 28に通知する。これを受けてジョブ管理部 28は、終了したジョブの回収を依頼し、依頼を受けてジョブ制御部 40は、終了したジョブを編集する。

[0047] 管理サーバ 36が構築された実サーバ 16に設けた仮想サーバ制御部 38は、管理サーバ 10の計算機管理部 30からの操作依頼を受けて仮想サーバ 36を制御する。この操作依頼として本発明にあっては、計算機管理部 30は凍結指示または再開指示を発行することから、凍結指示を受け付けたときには仮想サーバ 36を凍結し、その後、仮想サーバ 36の凍結中に再開指示を受け付けると、凍結している仮想サーバ 36 を復元して計算ジョブ 42を実行させる。

[0048] 更に、本実施形態において、管理サーバ 10の計算機管理部 30の指示で仮想サーバ 36が凍結された場合、管理サーバ 10に設けているジョブ管理部 28と仮想サーバ 36の通信が途絶することになる力ジョブ管理部 28が通信途絶による仮想サーバ 3 6の異常を検出した際には、仮想サーバ管理テーブル 34を参照すれば、異常を起こして、る仮想サーバにっき「凍結」の状態を知ることができる。

[0049] このためジョブ管理部 28は、仮想サーバ 36との通信途絶による異常を検出しても、これは異常ではなく仮想サーバが凍結状態にあるものと判断し、異常と判断した場合に、ジョブを異常終了するか、別の計算機に異常終了したジョブの再実行を依頼するなどの不必要な処理を回避することができる。

[0050] 図 3は本実施形態における仮想サーバの論理アーキテクチャの説明図である。図 3 において、実サーバに相当する計算機 50上にはハードウェア 52が構築され、ハードウェア 52を基板としてウィンドウズ (R)などの OS54が動作する。 OS54上には仮想プラットフォーム 56が構築され、この仮想プラットフォーム 56上で例えば仮想 OS58 —1, 58— 2が動作し、それぞれ個別にアプリケーションを実行することができる。

[0051] このような仮想プラットフォーム 56及び仮想 OS58— 1, 58— 2としては、例えば V Mウェア（R)やマイクロソフト（R) 'バーチャルサーバ 2005などのサーバ仮想化製品を実装することができる。

[0052] 図 4は図 2の管理サーバ 10に設けた分散制御テーブル 32の説明図である。分散制御テーブル 32は、計算機名 60、計算機種別 62、状態 64、ジョブ多重度 66及びジョブ数 68を登録している。計算機名 60としては、ジョブを実行する計算機のホスト名または IPアドレスを登録する。

[0053] 計算機種別 62は実サーバまたは仮想サーバである。状態 64は実サーバまたは仮想サーバの状態であり、この状態は、実サーバの場合には「稼動」又は「停止」の 2つの状態があり、仮想サーバにあっては「稼動」、「停止」又は「凍結」の 3つの状態がある。

[0054] 分散制御テーブル 32における実サーバ及び仮想サーバの状態 64は、各計算機のハートビートに基づいて状態を監視している。即ち状態「稼動」とは、計算機のハートビートにより正常に稼動していることが確認できた状態である。また状態「停止」は、計算機のハートビートに失敗し、稼動していると確認できない状態である。更に本実施形態の仮想サーバに固有な状態である「凍結」は、仮想サーバが凍結指示を受けて凍結された状態である。

[0055] なお、ハートビート (heart beat)とは、 HYPERLINK〃http：〃 e— words.jp/w/E3838DE 38383E38388E383AFE383BCE382AF.html"ネットワーク上で、 HYPERLINK〃http:/ /e-words.jp/w/E382B3E383B3E38394E383A5E383BCE382BF.html"コンピュータやネットワーク機器が自身が正常に稼動していることを一定時間ごとに外部に知らせるために信号やパケットを送ることである。

[0056] 分散制御テーブル 32のジョブ多重度 66は、各計算機に依頼可能なジョブ数の上限値である。更にジョブ数 68は各計算機で現在処理中のジョブ数であり、状態が「凍結」の計算機の場合は凍結状態のジョブ数を示して、る。

[0057] この分散制御テーブル 32は、図 2のジョブ管理部 28に外部からジョブの依頼を受けた際に、計算機管理部 30の依頼先検索部 30— 1により参照され、状態 64が「稼動」となって!/、る計算機を依頼先候補として選択し、複数候補が選択された場合には例えば最小ジョブ数となる計算機を依頼先として決定する。もちろん、この場合、状態が「停止」または「凍結」となって!/、る計算機は依頼先力除外されることになる。 [0058] 図 5は図 2の管理サーバ 10に設けた仮想サーバ管理テーブル 34の説明図である。仮想サーバ管理テーブル 34は、実サーバ名 70、仮想サーバ名 72、各仮想サーバの状態 74、及び各仮想サーバのジョブ一覧 76で構成されている。実サーバ名 70は実計算機のホスト名または IPアドレスである。仮想サーバ名 72は実サーバ上で起動されて稼動して、る仮想サーバのホスト名または IPアドレスである。

[0059] ここで、実サーバ名 70と仮想サーバ名 72から、実サーバと仮想サーバの対応関係が分かる。例えば実サーノ名 70として、実サーノ「r— host01」上にはサーノ名「v — host01」及び「v— host02」を持つ 2台の仮想サーバが構築されている。

[0060] 状態 74は各仮想サーバの状態であり、「稼動」、「停止」又は「凍結」の、ずれかであり、それぞれ図 4の分散制御テーブル 32の状態と同じ内容である。ジョブ一覧 76 には、各仮想サーバに実行を依頼中のジョブ番号の一覧が登録されている。

[0061] 図 6は図 2のジョブ管理部 28に対し設けたジョブ管理テーブル 44の説明図である。

ジョブ管理テーブル 44は、ジョブ ID78、凍結可否 80、予想実行時間 82、その他のジョブ情報 84を登録する。

[0062] ジョブ ID78は依頼されたジョブの識別子である。凍結可否 80は、仮想サーバに依頼する際に、実行途中で凍結しても良いか否かを示し、実行中に凍結しても問題な V、ジョブにつヽては「可能」が設定され、実行中に凍結してはならな!、ジョブにっ、ては「不可」を設定している。この凍結可否 80を「不可」とするジョブは、例えば比較的短時間で実行できるジョブである。

[0063] 予想実行時間 82は、凍結可否 80を「不可」に設定したジョブについて設定され、この予想実行時間を現在時刻に力さすることで、ジョブの実行終了時刻を求めることができる。

[0064] 図 7は図 2の計算機計画部 46で生成された計算機計画テーブル 48の説明図である。計算機計画テーブル 46には、計算機名 86、凍結時刻 88、再開時刻 90が登録される。計算機名 86には凍結及び再開が行われる仮想計算機のホスト名又は IPァドレスが登録される。

[0065] 凍結時刻 88と再開時刻 90は図 1の定義ファイル 26から作成され、各仮想サーバをシミュレーション計算に利用する夜間から朝にかけての計画時間帯が設定されている。この時間計画テーブル 48に基づき計算機計画部 46は計算機管理部 30に仮想計算機の凍結と再開を依頼することになる。

[0066] 図 8は本実施形態における仮想サーバの凍結と再開の処理機能の説明図である。

図 8において、実サーバ 16にはハードウェアとして物理ボリューム 92及び各種デバイス 94が設けられており、物理ボリューム 92に格納している OSを実行することで仮想プラットフォーム 56が構築され、仮想プラットフォーム 56上で仮想サーバ 36が動作している。

[0067] この仮想サーバ 36には、実サーバ 16の計算機資源を使用して、仮想メモリ 96、仮想ボリューム 98及び仮想デバイス 100が構成され、これら仮想計算機資源を使用して、図 3に示したように、 1または複数の仮想 OS58— 1, 58— 2力実行され、これらの OS上でアプリケーションとしての計算ジョブが実行される。

[0068] 仮想サーバ 36によるジョブ実行中に、図 2に示した管理サーバ 10の計算機管理部 30より凍結指示 102が仮想プラットフォーム 56に与えられると、仮想プラットフォーム 56は仮想サーバ 36全体を凍結処理 106に示すように物理ボリューム 92に vmxfファィル 110として保存さし、実行中のジョブを停止した凍結状態とする。

[0069] 凍結状態で仮想プラットフォーム 56に対し図 2の管理サーバ 10の計算機管理部 3 0より再開指示 104が与えられると、仮想プラットフォーム 56は、物理ボリューム 92に退避して!/、る vmxfファイル 110を再開処理 108に示すように読み出して管理サーバ 36を再構築し、凍結したジョブの実行を再開する。

[0070] 仮想プラットフォーム 56に対する凍結指示 102及び再開指示 104は、図 2の計算機管理部 30から発行されるコマンドであり、凍結指示 102は例えばコマンド「vmrun suspendファイル名」となり、また再開指示 104はコマンド「vmrun startファイル名」となる。

[0071] 即ち凍結コマンドは、仮想サーバ 36の全情報を物理ボリューム 92の vmxfファイル 110という専用の制御ファイルに保存する命令となる。また再開コマンドは、コマンドで指定された制御ファイル例えば vmxfファイル 110に保存されてヽる情報を元に、仮想サーバ 36の状態を復元する命令となる。

[0072] 図 9は本実施形態の管理サーバが適用されるコンピュータのハードウェア環境の説明図である。図 7において、 CPU112のノス 114には、 RAM116、 ROM118、ハードディスクドライブ 120、キーボード 124,マウス 126及びディスプレイ 128を接続するデバイスインタフェース 122、及びネットワークアダプタ 130が接続されて!、る。

[0073] ハードディスクドライブ 120には本実施形態のサーバ管理プログラムが格納されており、コンピュータ起動によるブート後の OSの RAM116への読出展開による実行に続いて、サーバ管理プログラムが RAMI 16に読み出され、 CPU112により実行される。

[0074] 図 10及び図 11は本実施形態のサーバ管理処理のタイムチャートである。図 10において、管理サーバ 10のジョブ管理部 28にあっては、ステップ S1で外部からのジョブ依頼 132を受け付けると、受付けたジョブをキューに格納するキューイングを行う。

[0075] 続!、てステップ S2でキューから受け付けたジョブを取り出し、ステップ S3で実行を依頼する計算機を計算機管理部 30に問い合わせて決定する。計算機管理部 30は、ジョブ管理部 28からの問合せを受けると、ステップ S101で図 4の分散制御テープル 32を参照し、状態 58が「稼動」となっている計算機を依頼先候補として検索し、複数候補が検索された場合にはジョブ数 62が最小となる計算機を依頼先として応答する。

[0076] この場合に依頼先として仮想サーバ 36が検索された場合には、図 5の仮想サーバ管理テーブル 34を参照し、依頼先に決定された仮想サーバ 36を構築している実サ一バ名を取得して応答する。同時に計算機管理部 30は計算機計画部 46にアクセスして候補計算機が仮想サーバの場合の凍結時刻を取得して応答する。

[0077] ジョブ管理部 28にあっては、計算機管理部 30に対する問合せで、もし仮想サーバを依頼先として決定した場合には、図 6のジョブ管理テーブル 48を参照して受付けているジョブの凍結可否 82を参照し、例えばジョブ ID=02であったとすると、凍結可否 82は「不可」であることから、その予想実行時間 82として「180秒」を取得し、実行終了時刻 =現在時刻 + 180秒

を求める。

[0078] そして、計算機管理部 30に対する問合せの応答してえられている凍結時刻と実行終了時刻を比較し、 (実行終了時刻）< (凍結時刻）

であれば、凍結時刻前にジョブ実行を終了することから、応答のあった仮想サーバ及び仮想サーバを構築してヽる実サーバを依頼先として決定し、ステップ S4で決定したサーバにジョブの実行を依頼する。

[0079] これに対し

(実行終了時刻） > (凍結時刻）

の場合には、凍結時刻後にジョブ実行が終了してジョブが長時間再開待ちになることから、この仮想サーバは不適切と判断し、再度、計算機管理部 30にジョブ依頼先の計算機を問合せ、凍結時刻前にジョブ実行を終了する仮想サーバを決定してステツプ S 3でジョブの実行を依頼する。

[0080] ステップ S4におけるサーバにジョブの依頼は、仮想サーバ 36を構築している実サーバ 16の例えば IPアドレスなどの指定でジョブを依頼し、ジョブ依頼に仮想サーバ 3 6の IPアドレスを含めておくことで、仮想サーバ 36のジョブ制御部 40に対しジョブを依頼することができる。仮想サーバ 36のジョブ制御部 40は、管理サーバ 10のジョブ管理部 28からのジョブの依頼を受け付けて、計算機ジョブにステップ S401のようにジョブを実行させる。

[0081] 凍結不可のジョブについては、仮想サーバ 36の凍結時刻前にジョブの実行が終了し，ジョブ実行結果が管理サーバ 10に回収されてファイルに保存される。

[0082] 一方、凍結可能なジョブの実行を仮想サーバ 36に依頼している場合には、仮想サーバ 36によるジョブ実行中に管理サーバ 10の計算機管理部 30に対し凍結依頼 13 4が行われると、ステップ S 102で仮想サーバの凍結依頼を受け付け、ステップ S 103 で仮想サーバ 36を管理する実サーバ 16を図 5の仮想サーバ管理テーブル 34から検索し、ステップ S104で検索した実サーバ 16の仮想サーバ制御部 38に対し凍結を指示する。

[0083] これを受けて実サーバ 16の仮想サーバ制御部 38は、ステップ S201で計算機管理部 30からの凍結指示を受け、仮想サーバ 36にステップ S302で凍結操作を行って凍結させる。仮想サーバの凍結により凍結完了通知力 Sステップ S303で仮想サーバ制御部 38に応答されると、ステップ S202で凍結完了応答を管理サーバ 10の計算機管理部 30に対し行う。

[0084] これを受けて計算機管理部 30は、ステップ S 106で図 4の分散制御テーブル 32及び図 5の仮想サーバ管理テーブル 34における対応する仮想サーバの状態を、それまでの「稼動」から「凍結」に変更する。

[0085] なお、図 8のステップ S302, S303の処理は、ジョブ制御部 40の処理として説明の都合上示しているが、実際には仮想サーバ 36の凍結制御と凍結完了通知となる。

[0086] 続いて図 9において、管理サーバ 10の計算機管理部 30に対し再開依頼 136が行われると、これをステップ S 106で受け付け、ステップ S 107で図 5の仮想サーバ管理部 34の参照により仮想サーバ 36を管理する実サーバ 16を検索し、ステップ S108で実サーバ 16の仮想サーバ制御部 38に再開指示のコマンドを送る。

[0087] 仮想サーバ制御部 38はステップ S203で再開指示を受けて仮想サーバ 36はステップ S304で再開制御を行い、これによつて計算ジョブ 42がステップ S 103のように稼動状態となってジョブ実行が再開される。

[0088] 仮想サーバの再開制御が完了すると、ステップ S305で再開完了通知が仮想サーバ制御部 38に送られ、ステップ S204で再開完了応答を管理サーバ 10の計算機管理部 30に送る。これを受けて計算機管理部 30は、ステップ S 109で仮想サーバ 36の状態を「稼動」に変更する。

[0089] 更に仮想サーバ 36で実行している計算ジョブが終了すると、ジョブ制御部 40はステツプ S306で、終了通知を管理サーバ 10の計算機管理部 30を経由してジョブ管理部 28に通知する。このジョブ終了通知を認識したジョブ管理部 28は、ステップ S5で仮想サーバ 36のジョブ制御部 40にジョブ回収を依頼し、これを受けてジョブ制御部 40は、ステップ S307でジョブを回収して応答し、ジョブ管理部 28はステップ S6で、回収したジョブをファイルに保存する。

[0090] 図 12は図 2の管理サーバ 10に設けたジョブ管理部 28によるジョブ管理処理のフロ一チャートである。図 12において、ジョブ管理処理は、ステップ S1で外部からのジョブ依頼を受け付けると、ステップ S2で受け付けたジョブをキューにキューイングした後、ステップ S3でジョブをキューから取り出し、ステップ S4で計算機管理部 30に問い合わせて実行を依頼する計算機を決定する。この問合せに対し計算機管理部 30は依頼先の計算機として仮想サーバを検索した場合には、仮想サーバを構築している実サーバと、仮想サーバの凍結時刻を併せて応答する。

[0091] 続いてステップ S5でジョブを依頼する計算機が決定できた力否か判別し、決定でき無い場合はステップ S3に戻り、次のジョブをキューから取出してジョブを依頼する計算機を決定する。

[0092] ステップ S5でジョブを依頼する計算機を決定した場合はステップ S6に進み、仮想サーノか否力判定する。仮想サーバの場合は、ステップ S7で図 6のジョブ管理テーブル 44の参照でジョブは凍結可能力否か判定し、凍結不可であればステップ S8に進み、

(予測実行終了時刻） > (凍結時刻）

であれば、決定した仮想サーバは不適切としてステップ S4に戻って別の計算機を依頼先として決定する処理を繰り返す。

[0093] ステップ S8の条件に該当せず、ジョブが凍結時刻前に終了する場合はステップ S9 に進み、決定した仮想サーバ 36のジョブ制御部 40にジョブを依頼し、これによつて計算ジョブ 42によるジョブの実行が開始される。

[0094] 続いてステップ S10で非同期ジョブ終了待ち合せ処理を実行している。この非同期ジョブ終了待ち合せ処理は、図 13に取り出して示すように、シグナルノヽンドラとしてのサブルーチンにより実行されている。非同期ジョブ終了待ち合せ処理は、ステップ S1 でジョブ終了通知の受信の有無をチェックしており、もしジョブ終了通知を受信すると、ステップ S2でジョブ管理部 28におけるジョブ状態を「実行終了」に設定した後、ステツプ S3で実行終了を図 12のジョブ管理処理のメインルーチンに返信する。

[0095] 再び図 12を参照するに、ステップ S10の非同期ジョブ終了待ち合せ処理に続いて、ステップ S11でジョブは終了状態か否かチェックしており、ジョブ実行中にあっては終了状態でないことから、ステップ S12に進み、依頼先の仮想サーバは凍結状態か否かチェックする。

[0096] もし依頼先の仮想サーバが凍結状態であった場合には、ステップ S13で依頼先の仮想サーバ 36のジョブ制御部 40に状態を確認し、ステップ S 14で一定時間例えば 2 分の待ち合せを行った後、ステップ S6で非同期ジョブ終了待ち合せ処理に戻る。 [0097] このような仮想サーバにおけるジョブ実行状態でジョブが終了し、ステップ S7でジョブ終了状態を判別するとステップ S15に進み、依頼した仮想サーバ 36のジョブ制御部 40にジョブの回収を依頼し、ステップ S 16でジョブを回収してファイルに保存する。

[0098] 図 14は図 2の計算機計画処理部 46による計算機計画処理のフローチャートである。図 14において、計算機計画処理は、ステップ S1で図 1の外部スケジューラ 24から定義ファイル 26を読込み、図 7の計算機計画テーブル 48をメモリ上に作成する。次にステップ S2に進み、計算機計画テーブル 48から現在時刻に対し最初に操作を依頼する時刻を検索する。

[0099] 続いてステップ S3で検索した時刻が凍結時刻であることを判別するとステップ S4で種別を「凍結」にセットし、凍結時刻出なければステップ S5に進んで種別を「再開」にセットする。

[0100] 続ヽて現在時刻が検索した待合せ時刻に到達した力否力判定し、待合せ時刻になるとステップ S7で種別が凍結であればステップ S8で計算機管理部 30に凍結を指示し、種別が凍結出なければステップ S9で計算機管理部 30に再開を指示する。このステップ S2〜S9の処理をステップ S10で停止指示を判別するまで繰り返す。

[0101] 図 15は図 2の管理サーバ 10に設けた計算機管理部 30における計算機処理のフロ一チャートである。図 15において、計算機管理処理は、ステップ S1で仮想サーバの操作依頼を受け付けると、ステップ S2で操作依頼が凍結依頼力否かチェックする。

[0102] 凍結依頼であった場合にはステップ S3に進み、依頼先の管理サーバ 36が稼動中か否かチェックし、稼動中であった場合にはステップ S4に進み、図 5の仮想サーバ管理テーブル 34から依頼先の仮想サーバを管理する実サーバを検索する。

[0103] 次にステップ S5で、検索した実サーバ 16の仮想サーバ制御部 38に凍結をコマンド送信により指示して仮想サーバ 36を凍結させる。次にステップ S6で、図 4の分散制御テーブル 32及び図 5の仮想サーバ管理テーブル 34における依頼先の仮想サーバの状態を「凍結」に変更する。なおステップ S3で凍結依頼を受けたにも関わらず仮想サーバが稼動中でなかった場合には、ステップ S 7で操作不可エラーメッセージを出力して処理を終了する。

[0104] 一方、ステップ S1で受け付けた仮想サーバの操作命令が再開依頼であった場合には、ステップ S2からステップ S8に進み、仮想サーバ 36が凍結中か否かチェックし、凍結中であれば、ステップ S9で仮想サーバ 36を管理する実サーバ 16の仮想サーバ制御部 38に再開を指示するコマンドを送って、凍結状態にある仮想サーバ 36を復元して稼動状態とする。これにより一旦凍結された計算ジョブ 42の実行が再開される。

[0105] 次にステップ S 11で、図 4の分散制御テーブル 32及び図 5の仮想サーバ管理テーブル 34の状態を「稼動」に変更する。なおステップ S8で再開依頼を受けたにも関わらず仮想サーバが凍結中でな力つた場合には、ステップ S12で操作不可エラーメッセージを出力して処理を終了する。

[0106] また計算機管理処理は、ジョブ管理部 30からの問合せに対し、ジョブを依頼する計算機を検索して応答し、もし仮想計算機を検索した場合は、凍結時刻を同時に応答するが、図 15は、この問合せに対する応答処理は省略している。

[0107] 図 16は図 2の実サーバ 16上に構築される仮想サーバ 36のジョブ制御部 40によるジョブ制御処理のフローチャートである。図 16のジョブ制御処理にあっては、ステップ S1で管理サーバ 10のジョブ管理部 28からジョブの実行依頼を受け付け、計算ジョブ 42をステップ S 2で起動し、ステップ S3でジョブ状態を稼動中に設定する。

[0108] 続いてステップ S4で非同期ジョブ終了待ち合せ処理を実行する。この非同期ジョブ終了待ち合せ処理は、図 17に示すように、ステップ S1でジョブプロセス終了検知の有無をチェックし、終了を検知すると、ステップ S 2でジョブ状態を「実行終了」に設定し、ステップ S3で図 13のジョブ制御処理のメインルーチンに実行終了を返信する

[0109] 続いて図 16のステップ S5で管理サーバ 10のジョブ管理部 28から状態の問合せがある力否かチェックし、状態問合せがあった場合には、ステップ S6でジョブ状態は稼動中か否かチェックし、稼動中であれば、ステップ S 7でジョブ実行中を返信する。一方、ステップ S6でジョブ状態が「停止」であった場合には、ステップ S8で実行終了を管理サーバ 10のジョブ管理部 28に返信する。

[0110] 図 18は図 2の実サーバ 16に設けた仮想サーバ制御部 38による仮想サーバ制御処理のフローチャートである。図 18において、仮想サーバ制御処理にあっては、ステップ SIで管理サーバ 10の計算機管理部 30から仮想サーバ 36の操作依頼を受け付け、ステップ S 2で操作依頼が凍結依頼であることを判別すると、ステップ S3で仮想サーバ 36にコマンドにより凍結を依頼し、仮想サーバ 36を凍結する。

[0111] 一方、ステップ S1で受け付けた操作依頼が仮想サーバの再開依頼であった場合には、ステップ S2からステップ S4に進み、仮想サーバ 36にコマンドによって再開を依頼し、凍結中の仮想サーバ 36を復元して稼動することで、凍結中のジョブの実行を再開する。

[0112] ステップ S3またはステップ S4の処理が済むと、ステップ S5で処理結果を管理サーノ 10の計算機管理部 30に返信し、分散制御テーブル 32及び仮想サーバ管理テーブル 34における状態を「凍結」または「再開」に変更させる。

[0113] また本実施形態は図 2の管理サーバ 10で実行されるサーバ管理プログラムを提供するものであり、このサーバ管理プログラムは図 12〜図 18のフローチャートに示した内容を持つことになる。

[0114] また本実施形態は、管理サーバ 10を構成するコンピュータで可読なサーバ管理プログラムを格納した記憶媒体を提供する。この記憶媒体は、 CD-ROM,フロッピィ（ R)ディスク、 DVDディスク、光磁気ディスク、 ICカードなどの可搬型記憶媒体や、コンピュータシステムの内外に備えられたハードディスクドライブなどの記憶装置の他、回線を介してプログラムを保持するデータベース、あるいは他のコンピュータシステム並びにそのデータベースや、更に回線上の伝送媒体を含むものである。

[0115] なお上記の実施形態はコンピューティンググリッド環境の仮想サーバに対するサーバ管理を例に取るものであった力これ以外の適宜の仮想サーバを使用したコンビュータシステムにっき、そのまま適用することができる。

[0116] また本発明は、その目的と利点を損なうことのない適宜の変形を含み、更に上記の実施形態で示した数値による限定は受けない。

Claims

請求の範囲

[1] 実サーバ上に構築された仮想サーバを管理するサーバ管理方法に於いて、前記仮想サーバの凍結時刻と再開時刻を含む計算機計画情報を管理し、現在時刻が前記凍結時刻に到達した際に凍結を指示し、現在時刻が前記再開時刻に到達した際に再開を指示する計算機計画ステップと、

前記キュー力もジョブを取出し、サーバ管理情報に基づいてジョブ依頼先の仮想サーバを決定した際に、ジョブ管理情報力得られたジョブの実行終了時刻と前記仮想サーバの凍結時刻とを比較し、前記実行終了時刻が前記凍結時刻より前の場合は決定した仮想サーバのジョブ制御部にジョブの実行を依頼し、前記実行終了時刻が前記凍結時刻を過ぎている場合は、前記実行終了時刻が前記凍結時刻前となる仮想サーバを決定する処理を繰り返すジョブ実行依頼ステップと

前記仮想サーバの凍結指示を受けた際に、依頼先の仮想サーバが稼動状態にあることを判別して、前記仮想サーバを構築する実サーバの仮想サーバ制御部に凍結指示を送信し、稼動中の前記仮想サーバを凍結させる凍結ステップと、

前記仮想サーバの再開指示を受けた際に、依頼先の仮想サーバが凍結状態にあることを判別して前記仮想サーバを構築する実サーバの仮想サーバ制御部に再開指示を送信し、凍結中の前記仮想サーバを稼動してジョブの実行を再開させる再開ステップと、

前記仮想サーバのジョブ終了を認識した際に、前記仮想サーバのジョブ制御部に依頼して終了したジョブを回収するジョブ回収ステップと、

を備えたことを特徴とするサーバ管理方法。

[2] 請求項 1記載のサーバ管理方法に於!、て、

前記ジョブ管理情報は、ジョブ識別子、ジョブが凍結が可能か又は不可かを示す凍結可否情報、ジョブが凍結不可の場合の予想実行時間を含み、

前記ジョブ実行依頼ステップは、前記キュー力も取出したジョブが凍結不可で且つ前記予想実行時間から求めた実行終了時刻が前記凍結時刻を過ぎている場合に、前記実行終了時刻が前記凍結時刻より前となる仮想サーバを決定する処理を繰り返すことを特徴とする仮想サーバ予測方法。

[3] 請求項 1記載のサーバ管理方法に於!、て、前記サーバ管理情報は、

実サーバと仮想サーバの対応関係、前記仮想サーバの稼動、停止又は凍結の状態、前記仮想サーバ毎の実行中のジョブ一覧を含む仮想サーバ管理情報と、を備えたことを特徴とするサーバ管理方法。

[4] 請求項 2記載のサーバ管理方法に於、て、前記ジョブ実行依頼ステップは、前記分散制御情報を参照して稼動状態にある複数の仮想サーバの中力実行ジョブ数が最小の仮想サーバをジョブ依頼先として検索することを特徴とするサーバ管理方法。

[5] 請求項 2記載のサーバ管理方法に於いて、前記凍結ステップ及び再開ステップは、前記仮想サーバ管理情報力仮想サーバの状態と仮想サーバを構築して、る実サーバを検索して凍結指示又は再開指示を行うことを特徴とするサーバ管理方法。

[6] 請求項 1記載のサーバ管理方法に於!、て、前記ジョブ実行依頼ステップは、前記実サーバ上に構築されている仮想サーバとの通信途絶による異常を検出した際に、前記サーバ管理情報を参照して前記サーバの凍結状態を認識した場合は正常と判断して前記異常検出を破棄することを特徴とするサーバ管理方法。

[7] 請求項 1記載のサーバ管理方法に於!、て、前記ジョブ受付ステップは、コンビユーティング環境によるジョブを受付けて複数の仮想サーバにジョブ実行を依頼させることを特徴とするサーバ管理方法。

[8] 実サーバ上に構築された仮想サーバを管理するサーバ管理装置のコンピュータに前記仮想サーバの凍結時刻と再開時刻を含む計算機計画情報を管理し、現在時刻が前記凍結時刻に到達した際に凍結を指示し、現在時刻が前記再開時刻に到達した際に再開を指示する計算機計画ステップと、

ジョブの依頼を受付けてキューに格納するジョブ受付ステップと、前記キュー力もジョブを取出し、サーバ管理情報に基づいてジョブ依頼先の仮想サーバを決定した際に、ジョブ管理情報力得られたジョブの実行終了時刻と前記仮想サーバの凍結時刻とを比較し、前記実行終了時刻が前記凍結時刻より前の場合は決定した仮想サーバのジョブ制御部にジョブの実行を依頼し、前記実行終了時刻が前記凍結時刻を過ぎている場合は、前記実行終了時刻が前記凍結時刻前となる仮想サーバを決定する処理を繰り返すジョブ実行依頼ステップと

を実行させることを特徴とする仮想サーバ管理フプログラム。

[9] 請求項 8記載のサーバ管理プログラムに於いて、

前記ジョブ実行依頼ステップは、前記キュー力も取出したジョブが凍結不可で且つ前記予想実行時間から求めた実行終了時刻が前記凍結時刻を過ぎている場合に、前記実行終了時刻が前記凍結時刻より前となる仮想サーバを決定する処理を繰り返すことを特徴とするサーバ管理プログラム。

[10] 請求項 8記載のサーバ管理プログラムに於いて、前記サーバ管理情報は、

実サーバと仮想サーバの対応関係、前記仮想サーバの稼動、停止又は凍結の状態、前記仮想サーバ毎の実行中のジョブ一覧を含む仮想サーバ管理情報と、を備えたことを特徴とするサーバ管理プログラム。

[11] 請求項 10記載のサーバ管理プログラムに於いて、前記ジョブ実行依頼ステップは

、前記分散制御情報を参照して稼動状態にある複数の仮想サーバの中から実行ジョブ数が最小の仮想サーバをジョブ依頼先として決定することを特徴とするサーバ管理プログラム。

[12] 請求項 10記載のサーバ管理プログラムに於いて、前記凍結ステップ及び再開ステップは、前記仮想サーバ管理情報力仮想サーバの状態と仮想サーバを構築してヽる実サーバを検索して凍結指示又は再開指示を行うことを特徴とするサーバ管理プログラム。

[13] 請求項 8記載のサーバ管理プログラムに於いて、前記ジョブ実行依頼ステップは、前記実サーバ上に構築されている仮想サーバとの通信途絶による異常を検出した際に、前記サーバ管理情報を参照して前記サーバの凍結状態を認識した場合は正常と判断して前記異常検出を破棄することを特徴とするサーバ管理プログラム。

[14] 請求項 8記載のサーバ管理プログラムに於、て、前記ジョブ受付ステップは、コンビユーティング環境によるジョブを受付けて複数の仮想サーバにジョブ実行を依頼させることを特徴とするサーバ管理プログラム。

[15] 実サーバ上に構築された仮想サーバを管理するサーバ管理装置に於いて、

前記仮想サーバの凍結時刻と再開時刻を含む計算機計画情報を管理する計算機計画部と、

を備え、

前記計算機計画部は、

現在時刻が前記凍結時刻に到達した際に前記計算機管理部に凍結を指示し、現在時刻が前記再開時刻に到達した際に前記計算機管理部に再開を指示する計画指示部と、

を備え、

前記ジョブ管理部は、

前記キュー力ジョブを取出し、前記計算機管理部に問合せてジョブの実行を依頼する仮想サーバを決定した際に、ジョブ管理情報力も得られたジョブの実行終了時刻と前記仮想サーバの凍結時刻とを比較し、前記実行終了時刻が前記凍結時刻より前の場合は決定した仮想サーバのジョブ制御部にジョブの実行を依頼し、前記実行終了時刻が前記凍結時刻を過ぎている場合は前記計算機管理部に再度問合せて前記実行終了時刻が前記凍結時刻前となる仮想サーバを決定する処理を繰り返すジョブ実行依頼部と、

前記仮想サーバのジョブ終了を認識した際に、前記仮想サーバのジョブ制御部に依頼して終了したジョブを回収するジョブ回収部と、

を備え、

前記計算機管理部は、

前記ジョブ管理部力問合せを受けた際に、ジョブ依頼先の実サーバと仮想サーバを検索して前記計画指示部の計算機計画情報力得られた凍結時刻と共に応答する依頼先検索部と、

前記仮想サーバの凍結指示を受けた際に、依頼先の仮想サーバが実行状態にあることを判別して、前記仮想サーバを構築する実サーバの仮想サーバ制御部に凍結指示を送信し、ジョブ実行中の前記仮想サーバを凍結させる凍結部と、

前記仮想サーバの再開指示を受けた際に、依頼先の仮想サーバが凍結状態にあることを判別して、前記仮想サーバを構築する実サーバの仮想サーバ制御部に再開指示を送信し、凍結中の前記仮想サーバにジョブの実行を再開させる再開部と、を備えたことを特徴とするサーバ管理装置。

請求項 15記載のサーバ管理装置に於いて、

前記ジョブ実行依頼部は、前記キュー力取出したジョブが凍結不可で且つ前記予想実行時間から求めた実行終了時刻が前記凍結時刻を過ぎてヽる場合に、前記実行終了時刻が前記凍結時刻より前となる仮想サーバを決定する処理を繰り返すことを特徴とするサーバ管理装置。

[17] 請求項 15記載のサーバ管理装置に於いて、前記サーバ管理情報は、

実サーバと仮想サーバの対応関係、前記仮想サーバの稼動、停止又は凍結の状態、前記仮想サーバ毎の実行中のジョブ一覧を含む仮想サーバ管理情報と、を備えたことを特徴とするサーバ管理装置。

[18] 請求項 17記載のサーバ管理装置に於いて、前記依頼先検索部は、前記分散制御情報を参照して稼動状態にある複数の仮想サーバの中力実行ジョブ数が最小の仮想サーバをジョブ依頼先として決定することを特徴とするサーバ管理装置。

[19] 請求項 17記載のサーバ管理装置に於いて、前記凍結処理部及び再開処理部は、前記仮想サーバ管理情報力仮想サーバの状態と仮想サーバを構築している実サーバを検索して凍結指示又は再開指示を行うことを特徴とするサーバ管理装置。

[20] 請求項 15記載のサーバ管理装置に於いて、前記ジョブ実行依頼部は、前記実サーバ上に構築されている仮想サーバとの通信途絶による異常を検出した際に、前記サーバ管理情報を参照して前記サーバの凍結状態を認識した場合は正常と判断して前記異常検出を破棄することを特徴とするサーバ管理装置。