JPWO2007108062A1 - サーバ管理方法、プログラム及び装置 - Google Patents

サーバ管理方法、プログラム及び装置 Download PDF

Info

Publication number
JPWO2007108062A1
JPWO2007108062A1 JP2008506078A JP2008506078A JPWO2007108062A1 JP WO2007108062 A1 JPWO2007108062 A1 JP WO2007108062A1 JP 2008506078 A JP2008506078 A JP 2008506078A JP 2008506078 A JP2008506078 A JP 2008506078A JP WO2007108062 A1 JPWO2007108062 A1 JP WO2007108062A1
Authority
JP
Japan
Prior art keywords
server
job
virtual server
virtual
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008506078A
Other languages
English (en)
Inventor
清志 ▲高▼下
清志 ▲高▼下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2007108062A1 publication Critical patent/JPWO2007108062A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Multi Processors (AREA)
  • Hardware Redundancy (AREA)

Abstract

サーバ管理装置は、仮想サーバに設けられたジョブ制御部を管理するジョブ管理部と、仮想サーバを構築する実サーバの仮想サーバ制御部を管理する計算機管理部とを備える。ジョブ管理部は、ジョブの依頼を受付け、キューからジョブを取出し、計算機管理部に依頼して決定した仮想サーバのジョブ制御部にジョブの実行を依頼する。計算機管理部はジョブ管理部から問合せを受けた際に、ジョブ依頼先の実サーバと仮想サーバを検索して応答する。凍結処理部は、仮想サーバの凍結依頼を受けた際に、依頼先の仮想サーバが実行状態にあることを判別して、仮想サーバを構築する実サーバの仮想サーバ制御部に凍結指示を送信し、ジョブ実行中の仮想サーバを凍結させる。再開処理部は、再開依頼を受けた際に、依頼先の仮想サーバが凍結状態にあることを判別して、仮想サーバを構築する実サーバの仮想サーバ制御部に再開指示を送信し、凍結中の仮想サーバにジョブの実行を再開させる。

Description

本発明は、実サーバ上に構築される仮想サーバを管理するサーバ管理方法、プログラム及び装置に関し、特に、コンピューティンググリッド環境における各種シミュレーション計算等のジョブを複数の仮想サーバに分散して実行する際の仮想サーバの停止と再開を制御するサーバ管理方法、プログラム及び装置に関する。
従来、地球環境や気象環境等の各種のシミュレーション計算は、非常に長時間を要し、計算ジョブが長時間計算機資源を使用した状態が継続され、膨大な計算機資源を必要とするため、近年、コンピューティンググリッド環境における各種シミュレーション計算システムが構築されている。
コンピューティンググリッド環境によるシミュレーション計算システムは、計算ジョブを最適な計算機資源に割り当て、分散された計算機資源を効率的に利用する。またコンピューティンググリッド環境の場合、計算機資源はシミュレーション計算ジョブのための占有リソースでない場合があり、他の利用目的で計算機資源が利用される場合があり、計算機資源の貸し借りが必要となる。
長時間の実行を要するシミュレーション計算ジョブが計算機資源を利用している場合、他の目的で同じ計算機資源を利用できない。また、他の目的で利用することが判っている計算機資源をシミュレーション計算ジョブで利用することもできない。
このためコンピューティンググリッド環境に割り当てた計算機資源であっても、オフィス業務など他の目的で利用中の計算機資源は除外し、空き計算機資源でシミュレーション計算ジョブを実行させる。しかし、シミュレーション計算ジョブが長時間にわたり計算機資源を占有した場合、他の業務でその計算機資源を使いたくても使えないなどの問題が発生する。
この問題を解決する一般的な方法として、ジョブのチェックポイント・リスタート機能がある。チェックポイント・リスタート機能は、ジョブを司るジョブ管理制御装置と計算アプリケーションが連携し、アプリケーションにおける計算処理がどこまで進んでいるかを定期的に保存し、一時的に計算ジョブを停止させ、他の目的で計算機資源を利用できるようする。
このため、長時間を要するシミュレーション計算ジョブを、チェックポイント・リスタート機能によるジョブ実行と停止を繰り返して少ない空き計算機資源を積み重ねることで、他の業務に影響を与えることなくシミュレーション計算ジョブを継続することができる。
特開2005−208919号公報 特開2005−196561号公報
しかしながら、このような従来のチェックポイント・リスタート機能を利用した計算機資源の利用方法にあっては、シミュレーション計算ジョブとして動作するアプリケーションにおいて、チェックポイント・リスタートのための制御処理が必須であり、アプリケーションの開発コストが膨らむという問題がある。
また、市販ソフトウェアなどチェックポイント・リスタート機能を保持しないアプリケーションによりシミュレーション計算ジョブを実行する場合、一時的にシミュレーション計算ジョブを停止させることが困難である。
また、他の目的で計算機資源を利用する際に、サーバ自身を別のOSなどで再起動するような運用を行いたい場合、チェックポイント・リスタート機能は利用できない。この理由は、チェックポイント・リスタート機能では、チェックポイントを採るためには、アプリケーション側にチェックポイントを採るためのロジックが必須である。また、チェックポイントによる情報が保存された資源はジョブ単位で管理され、ジョブ管理制御装置の配下で管理される。
このため、サーバ自身を停止させて別のOSで計算機資源を利用する場合は、ジョブ管理制御装置が停止してしまうため、シミュレーション計算ジョブを一時的に凍結しても、その後再開することは困難である。
本発明は、実サーバ上に構築される仮想サーバに計算ジョブを実行させ、アプリケーションやOSに依存することなく、ジョブの停止と再開を任意のタイミングで可能とするサーバ管理方法、プログラム及び装置を提供することを目的とする。
本発明はサーバ管理方法を提供する。本発明は、実サーバ上に構築された仮想サーバを管理するサーバ管理方法に於いて、
ジョブの依頼を受付けてキューに格納するジョブ受付ステップと、
キューからジョブを取出し、サーバ管理情報に基づいて決定した実サーバ上に構築された仮想サーバのジョブ制御部にジョブの実行を依頼するジョブ実行依頼ステップと、
凍結依頼を受けた際に、仮想サーバが稼動状態にあることを判別して、実サーバの仮想サーバ制御部に凍結指示を送信し、稼動中の仮想サーバを凍結させる凍結ステップと、
再開依頼を受けた際に、仮想サーバが凍結状態にあることを判別して、仮想サーバ制御部に再開指示を送信し、凍結中の仮想サーバを稼動してジョブの実行を再開させる再開ステップと、
仮想サーバのジョブ終了を認識した際に、仮想サーバのジョブ制御部に依頼して終了したジョブを回収するジョブ回収ステップと、
を備えたことを特徴とする。
ここで、サーバ管理情報は、
ジョブを実行するサーバ名又はネットワークアドレス、実サーバか仮想サーバかの種別、各サーバの稼動、停止又は凍結の状態及び各サーバの実行ジョブ数を含む分散制御情報と、
実サーバと仮想サーバの対応関係、仮想サーバの稼動、停止又は凍結の状態及び仮想サーバ毎の実行中のジョブ一覧を含む仮想サーバ管理情報と、
を備える。
ジョブ実行依頼ステップは、制御情報を参照して稼動状態にある複数の仮想サーバの中から実行ジョブ数が最小の仮想サーバを検索し、検索した仮想サーバを構築している実サーバを仮想サーバ管理情報から検索し、検索した実サーバと仮想サーバに基づいてジョブの実行を依頼する。
凍結ステップ及び再開ステップは、仮想サーバ管理情報から仮想サーバの状態と仮想サーバを構築している実サーバを検索して凍結指示又は再開指示を行う。
ジョブ実行依頼ステップは、実サーバ上に構築されている仮想サーバとの通信途絶による異常を検出した際に、サーバ管理情報を参照してサーバの凍結状態を認識した場合は正常と判断して異常検出を破棄する。
ジョブ受付ステップは、コンピューティンググリッド環境によるジョブを受付けて複数の仮想サーバにジョブ実行を依頼させる。
(プログラム)
本発明はサーバ管理プログラムを提供する。本発明のサーバ管理プログラムは、実サーバ上に構築された仮想サーバを管理するサーバ管理装置のコンピュータに、
ジョブの依頼を受付けてキューに格納するジョブ受付ステップと、
キューからジョブを取出し、サーバ管理情報に基づいて決定した実サーバ上に構築された仮想サーバのジョブ制御部にジョブの実行を依頼するジョブ実行依頼ステップと、
凍結依頼を受けた際に、仮想サーバが稼動状態にあることを判別して、実サーバの仮想サーバ制御部に凍結指示を送信し、稼動中の仮想サーバを凍結させる凍結ステップと、
再開依頼を受けた際に、仮想サーバが凍結状態にあることを判別して、想サーバ制御部に再開指示を送信し、凍結中の仮想サーバを稼動してジョブの実行を再開させる再開ステップと、
仮想サーバのジョブ終了を認識した際に、仮想サーバのジョブ制御部に依頼して終了したジョブを回収するジョブ回収ステップと、
を実行させることを特徴とする。
(装置)
本発明は、サーバ管理装置を提供する。本発明は、実サーバ上に構築された仮想サーバを管理するサーバ管理装置に於いて、
仮想サーバに設けられたジョブ制御部を管理するジョブ管理部と、
仮想サーバを構築する物理サーバの仮想サーバ制御部を管理する計算機管理部と、
を備え、
ジョブ管理部は、
ジョブの依頼を受付けてキューに格納するジョブ受付部と、
キューからジョブを取出し、計算機管理部に依頼して決定した仮想サーバのジョブ制御部にジョブの実行を依頼するジョブ実行依頼部と、
仮想サーバのジョブ終了を認識した際に、仮想サーバのジョブ制御部に依頼して終了したジョブを回収するジョブ回収部と、
を備え、
計算機管理部は、
ジョブ管理部から問合せを受けた際に、ジョブ依頼先の実サーバと仮想サーバを検索して応答する依頼先検索部と、
凍結依頼を受けた際に、仮想サーバが実行状態にあることを判別して、実サーバの仮想サーバ制御部に凍結指示を送信し、ジョブ実行中の前記仮想サーバを凍結させる凍結部と、
再開依頼を受けた際に、仮想サーバが凍結状態にあることを判別して、実サーバの仮想サーバ制御部に再開指示を送信し、凍結中の仮想サーバにジョブの実行を再開させる再開処理部と、
を備えたことを特徴とする。
本発明によければ、例えば昼間は事務処理等の業務で利用している計算機資源を夜間のみコンピューティンググリッド環境によるシミュレーション計算ジョブが利用可能な場合、時間内に仮想サーバで計算ジョブが完了しない場合は、一時的に仮想サーバを凍結してジョブを中断して計算機資源を開放し、再度計算機資源が利用可能となった場合に仮想サーバに再開を指示してジョブを再開することができ、サーバ仮想化基盤の導入コストだけで、連続して計算機の空き時間を有効に利用して長時間を要するシミュレーション計算を実行することができる。
また仮想サーバを凍結することで計算機資源を開放するため、シミュレーション計算ジョブとして動作しているアプリケーション側において、従来のようなチェックポイント・リスタート機能を実装する必要がなく、アプリケーションの開発コスト、保守コストを大幅に削減することができる。
また、チェックポイント・リスタート機能を実装していない市販のアプリケーションなど、どのようなアプリケーションでも仮想サーバ上で計算ジョブを実行することで、任意のタイミングで一時凍結し、また任意のタイミングで再開することができる。
本発明が適用されるコンピューティンググリッド環境の説明図 本実施形態における管理サーバと実サーバ上に構築される仮想サーバを示した機能構成のブロック図 本実施形態における仮想サーバの論理アーキテクチャの説明図 図2の分散制御テーブルの説明図 図2の仮想サーバ管理テーブルの説明図 本実施形態における仮想サーバの凍結と再開の処理機能の説明図 本実施形態の管理サーバが適用されるコンピュータのハードウェア環境の説明図 本実施形態のサーバ管理処理のタイムチャート 図8に続く本実施形態のサーバ管理処理のタイムチャート 図2の管理サーバにおけるジョブ管理処理のフローチャート 図10のステップ6の非同期ジョブ終了待合せ処理のフローチャート 図2の管理サーバにおける計算機管理処理のフローチャート 図2の仮想サーバにおけるジョブ制御処理のフローチャート 図12のステップ4における非同期ジョブ終了待ち合せ処理のフローチャート 図2の実サーバにおける仮想サーバ制御処理のフローチャート
図1は本発明が適用されるコンピューティンググリッド環境の説明図である。図1において、本実施形態の管理サーバ10はネットワーク12に接続され、ネットワーク12にはシミュレーション計算ジョブなどを依頼する計算機群14として、本実施形態にあっては実サーバ16−1〜16−39を接続している。
管理サーバ10に対しては、オペレータ18−1の操作でシミュレーション計算ジョブのジョブ投入20が行われ、管理サーバ10による管理の下に、計算機群14に含まれる実サーバ16−1〜16−39のいずれかにジョブを依頼して実行させる。
また管理サーバ10に対しては、実行中のジョブに対し仮想サーバに対する凍結・再開指示22をオペレータ18−2から行うことができる。この凍結・再開指示22は、管理サーバ10に対し設けている外部スケジューラ24から行うこともできる。
外部スケジューラ24にはスケジュールリスト26のように凍結時刻と再開時刻が設定されており、凍結時刻への到達で凍結指示を管理サーバ10に送り、再開時刻への到達で再開指示を管理サーバ10に送る。
図2は本実施形態における管理サーバと実サーバ上に構築される仮想サーバを示した機能構成のブロック図である。図2において、本実施形態にあっては、説明を簡単にするため、管理サーバ10に対し1台の実サーバ16を配置した場合を例にとっている。
管理サーバ10には、ジョブ管理部28、計算機管理部30、分散制御テーブル32、仮想サーバ管理テーブル34が設けられる。一方、実サーバ16には仮想サーバ36と仮想サーバ制御部38が設けられ、仮想サーバ36の中にはジョブ制御部40と計算ジョブ42が設けられることになる。
ここで、管理サーバ10及び実サーバ16におけるそれぞれの機能は、コンピュータによるプログラムの実行により実現される機能である。
管理サーバ10のジョブ管理部28には、ジョブ受付部28−1、ジョブ実行依頼部28−2、ジョブ回収部28−3が設けられる。ジョブ受付部28−1は、図1に示したようなオペレータ18−2もしくは外部スケジューラ24からのジョブ投入20によるジョブの依頼を受けて、内蔵したキューに格納する。ジョブ実行依頼部28−2は、キューからジョブを取り出し、計算機管理部30に依頼して決定した仮想サーバ36のジョブ制御部40にジョブの実行を依頼する。
ジョブ回収部28−1は、仮想サーバ36のジョブ終了を認識した際に、ジョブ制御部40に依頼して終了したジョブを回収する。
計算機管理部30には、依頼先検索部30−1、凍結処理部30−2及び再開処理部30−3が設けられている。依頼先検索部30−1は、ジョブ管理部28からの問合せを受けた際に、ジョブ依頼先となる実サーバ16と仮想サーバ36を検索して応答する。
図2にあっては実サーバ16は1台で、且つ実サーバ16上に構築された仮想サーバ36も1台であるが、実際には図1のように管理サーバ10の依頼先となる実サーバは計算機群14に示すように複数であり、また実サーバ16上に構築される仮想サーバ36の数も複数台構築される場合がある。
凍結処理部30−2は、外部から仮想サーバ36の凍結依頼22を受けた際に、依頼先の仮想サーバ36が計算ジョブ42の実行状態にあることを判別して、仮想サーバ36を構築する実サーバ16の仮想サーバ制御部38に凍結指示を送信し、計算ジョブ42によるジョブ実行中の仮想サーバ36を凍結させる。
再開処理部30−3は、外部から仮想サーバの再開依頼を受けた際に、依頼先の仮想サーバ36が凍結状態にあることを判別して、仮想サーバ36を構築する実サーバ16の仮想サーバ制御部38に再開指示を送信し、凍結中の仮想サーバ36に計算ジョブ42の実行を再開させる。
実サーバ16に構築された仮想サーバ36のジョブ制御部40は、管理サーバ10のジョブ管理部28からジョブ実行依頼を受け付け、アプリケーションにより計算ジョブ42を実行し、計算ジョブ42が終了すると実行終了をジョブ管理部28に通知する。これを受けてジョブ管理部28は、終了したジョブの回収を依頼し、依頼を受けてジョブ制御部40は、終了したジョブを編集する。
管理サーバ36が構築された実サーバ16に設けた仮想サーバ制御部38は、管理サーバ10の計算機管理部30からの操作依頼を受けて仮想サーバ36を制御する。この操作依頼として本発明にあっては、計算機管理部30は凍結指示または再開指示を発行することから、凍結指示を受け付けたときには仮想サーバ36を凍結し、その後、仮想サーバ36の凍結中に再開指示を受け付けると、凍結している仮想サーバ36を復元して計算ジョブ42を実行させる。
更に、本実施形態において、管理サーバ10の計算機管理部30の指示で実サーバ16の仮想サーバ36が凍結された場合、管理サーバ10に設けているジョブ管理部28と仮想サーバ36の通信が途絶することになるが、ジョブ管理部28で通信途絶による仮想サーバ36の異常を検出した際には、仮想サーバ管理テーブル34を参照すれば、異常を起こしている仮想サーバにつき「凍結」の状態を知ることができる。
このためジョブ管理部28は、仮想サーバ36との通信途絶による異常を検出しても、これは異常ではなく仮想サーバが凍結状態にあるものと判断し、異常と判断した場合に、ジョブを異常終了するか、別の計算機に異常終了したジョブの再実行を依頼するなどの不必要な処理を回避することができる。
図3は本実施形態における仮想サーバの論理アーキテクチャの説明図である。図3において、実サーバに相当する計算機44上にはハードウエア46が構築され、ハードウエア46を基板としてウィンドウズ(R)などのOS48が動作する。OS48上には仮想プラットフォーム50が構築され、この仮想プラットフォーム50上で例えば仮想OS52−1,52−2が動作し、それぞれ個別にアプリケーションを実行することができる。
このような仮想プラットフォーム50及び仮想OS52−1,52−2としては、例えばVMウエア(R)やマイクロソフト(R)・バーチャルサーバ2005などのサーバ仮想化製品を実装することができる。
図4は図2の管理サーバ10に設けた分散制御テーブル32の説明図である。分散制御テーブル32は、計算機名54、計算機種別56、状態58、ジョブ多重度60及びジョブ数62を登録している。計算機名54としては、ジョブを実行する計算機のホスト名またはIPアドレスを登録する。
計算機種別56は実サーバまたは仮想サーバである。状態58は実サーバまたは仮想サーバの状態であり、この状態は、実サーバの場合には「稼動」又は「停止」の2つの状態があり、仮想サーバにあっては「稼動」、「停止」又は「凍結」の3つの状態がある。
分散制御テーブル32における実サーバ及び仮想サーバの状態58は、各計算機のハートビートに基づいて状態を監視している。即ち状態「稼動」とは、計算機のハートビートにより正常に稼動していることが確認できた状態である。また状態「停止」は、計算機のハートビートに失敗し、稼動していると確認できない状態である。更に本実施形態の仮想サーバに固有な状態である「凍結」は、仮想サーバが凍結指示を受けて凍結された状態である。
なお、ハートビート(heart beat)とは、 HYPERLINK "http://e-words.jp/w/E3838DE38383E38388E383AFE383BCE382AF.html" ネットワーク上で、 HYPERLINK "http://e-words.jp/w/E382B3E383B3E38394E383A5E383BCE382BF.html" コンピュータやネットワーク機器が自身が正常に稼動していることを一定時間ごとに外部に知らせるために信号やパケットを送ることである。
分散制御テーブル32のジョブ多重度60は、各計算機に依頼可能なジョブ数の上限値である。更にジョブ数62は各計算機で現在処理中のジョブ数であり、状態が「凍結」の計算機の場合は凍結状態のジョブ数を示している。
この分散制御テーブル32は、図2のジョブ管理部28に外部からジョブの依頼を受けた際に、計算機管理部30の依頼先検索部30−1により参照され、状態58が「稼動」となっている計算機を依頼先候補として選択し、複数候補が選択された場合には例えば最小ジョブ数となる計算機を依頼先として決定する。もちろん、この場合、状態が「停止」または「凍結」となっている計算機は依頼先から除外されることになる。
図5は図2の管理サーバ10に設けた仮想サーバ管理テーブル34の説明図である。仮想サーバ管理テーブル34は、実サーバ名64、仮想サーバ名66、各仮想サーバの状態68、及び各仮想サーバのジョブ一覧70で構成されている。実サーバ名64は実計算機のホスト名またはIPアドレスである。仮想サーバ名66は実サーバ上で起動されて稼動している仮想サーバのホスト名またはIPアドレスである。
ここで、実サーバ名64と仮想サーバ名66から、実サーバと仮想サーバの対応関係が分かる。例えば実サーバ名64として、実サーバ「r_host01」上にはサーバ名「v_host01」及び「v_host02」を持つ2台の仮想サーバが構築されている。
状態48は各仮想サーバの状態であり、「稼動」、「停止」又は「凍結」のいずれかであり、それぞれ図4の分散制御テーブル32の状態と同じ内容である。ジョブ一覧70には、各仮想サーバに実行を依頼中のジョブ番号の一覧が登録されている。
図6は本実施形態における仮想サーバの凍結と再開の処理機能の説明図である。図6において、実サーバ16にはハードウエアとして物理ボリューム72及び各種デバイス74が設けられており、物理ボリューム72に格納しているOSを実行することで仮想プラットフォーム50が構築され、仮想プラットフォーム50上で仮想サーバ36が動作している。
この仮想サーバ36には、実サーバ16の計算機資源を使用して、仮想メモリ76、仮想ボリューム78及び仮想デバイス80が構成され、これら仮想計算機資源を使用して、図3に示したように、1または複数の仮想OS52−1,52−2が実行され、これらのOS上でアプリケーションとしての計算ジョブが実行される。
仮想サーバ36によるジョブ実行中に、図2に示した管理サーバ10の計算機管理部30より凍結指示82が仮想プラットフォーム50に与えられると、仮想プラットフォーム50は仮想サーバ36全体を凍結処理86に示すように物理ボリューム72にvmxfファイル90として保存され、実行中のジョブを停止した凍結状態とする。
凍結状態で仮想プラットフォーム50に対し図2の管理サーバ10の計算機管理部30より再開指示84が与えられると、仮想プラットフォーム50は、物理ボリューム72に退避しているvmxfファイル90を再開処理88に示すように読み出して管理サーバ36を再構築し、凍結したジョブの実行を再開する。
仮想プラットフォーム50に対する凍結指示82及び再開指示84は、図2の計算機管理部30から発行されるコマンドであり、凍結指示82は例えばコマンド「vmrun suspendファイル名」となり、また再開指示84はコマンド「vmrun startファイル名」となる。
即ち凍結コマンドは、仮想サーバ36の全情報を物理ボリューム72のvmxfファイルという専用の制御ファイルに保存する命令となる。また再開コマンドは、コマンドで指定された制御ファイル例えばvmxfファイル90に保存されている情報を元に、仮想サーバ36の状態を復元する命令となる。
図7は本実施形態の管理サーバが適用されるコンピュータのハードウエア環境の説明図である。図7において、CPU92のバス94には、RAM96、ROM98、ハードディスクドライブ100、キーボード104,マウス106及びディスプレイ108を接続するデバイスインタフェース102、及びネットワークアダプタ110が接続されている。
ハードディスクドライブ100には本実施形態のサーバ管理プログラムが格納されており、コンピュータ起動によるブート後のOSのRAM96への読出展開による実行に続いて、サーバ管理プログラムがRAM96に読み出され、CPU92により実行される。
図8及び図9は本実施形態のサーバ管理処理のタイムチャートである。図8において、管理サーバ10のジョブ管理部28にあっては、ステップS1で外部からのジョブ依頼112を受け付けると、受付けたジョブをキューに格納するキューイングを行う。
続いてステップS2でキューから受け付けたジョブを取り出し、ステップS3で実行を依頼する計算機を計算機管理部30に問い合わせて決定する。計算機管理部30は、ジョブ管理部28からの問合せを受けると、ステップS101で図4の分散制御テーブル32を参照し、状態58が「稼動」となっている計算機を依頼先候補として検索し、複数候補が検索された場合にはジョブ数62が最小となる計算機を依頼先として応答する。
この場合に依頼先として仮想サーバが検索された場合には、図5の仮想サーバ管理テーブル34を参照し、依頼先に決定された仮想サーバを構築している実サーバ名を取得して応答する。したがってジョブ管理部28にあっては、計算機管理部30に対する問合せで、もし仮想サーバを依頼先として決定した場合には、仮想サーバ及び仮想サーバを構築している実サーバを依頼先として決定することになる。
続いてステップS4で、決定したサーバにジョブを依頼する。この例では、依頼先として仮想サーバ36を構築している実サーバ16の例えばIPアドレスなどの指定でジョブを依頼し、ジョブ依頼に仮想サーバ36のIPアドレスを含めておくことで、仮想サーバ36のジョブ制御部40に対しジョブを依頼することができる。仮想サーバ36のジョブ制御部40は、管理サーバ10のジョブ管理部28からのジョブの依頼を受け付けて、計算機ジョブにステップS401のようにジョブを実行させる。
このような仮想サーバ36におけるジョブ実行中に管理サーバ10の計算機管理部30に対し外部から凍結依頼114が行われると、ステップS102で仮想サーバの凍結依頼を受け付け、ステップS103で仮想サーバ36を管理する実サーバ16を図5の仮想サーバ管理テーブル34から検索し、ステップS104で検索した実サーバ16の仮想サーバ制御部38に対し凍結を指示する。
これを受けて実サーバ16の仮想サーバ制御部38は、ステップS201で計算機管理部30からの凍結指示を受け、仮想サーバ36にステップS302で凍結操作を行って凍結させる。仮想サーバの凍結により凍結完了通知がステップS303で仮想サーバ制御部38に応答されると、ステップS202で凍結完了応答を管理サーバ10の計算機管理部30に対し行う。
これを受けて計算機管理部30は、ステップS106で図4の分散制御テーブル32及び図5の仮想サーバ管理テーブル34における対応する仮想サーバの状態を、それまでの「稼動」から「凍結」に変更する。
なお、図8のステップS302,S303の処理は、ジョブ制御部40の処理として説明の都合上示しているが、実際には仮想サーバ36の凍結制御と凍結完了通知となる。
続いて図9において、外部から管理サーバ10の計算機管理部30に対し再開依頼116が行われると、これをステップS106で受け付け、ステップS107で図5の仮想サーバ管理部34の参照により仮想サーバ36を管理する実サーバ16を検索し、ステップS108で実サーバ16の仮想サーバ制御部38に再開指示のコマンドを送る。
仮想サーバ制御部38はステップS203で再開指示を受けて仮想サーバ36はステップS304で再開制御を行い、これによって計算ジョブ42がステップS103のように稼動状態となってジョブ実行が再開される。
仮想サーバの再開制御が完了すると、ステップS305で再開完了通知が仮想サーバ制御部38に送られ、ステップS204で再開完了応答を管理サーバ10の計算機管理部30に送る。これを受けて計算機管理部30は、ステップS109で仮想サーバ36の状態を「稼動」に変更する。
更に仮想サーバ36で実行している計算ジョブが終了すると、ジョブ制御部40はステップS306で、終了通知を管理サーバ10の計算機管理部30を経由してジョブ管理部28に通知する。このジョブ終了通知を認識したジョブ管理部28は、ステップS5で仮想サーバ36のジョブ制御部40にジョブ回収を依頼し、これを受けてジョブ制御部40は、ステップS307でジョブを回収して応答し、ジョブ管理部28はステップS6で、回収したジョブをファイルに保存する。
図10は図2の管理サーバ10に設けたジョブ管理部28によるジョブ管理処理のフローチャートである。図10において、ジョブ管理処理は、ステップS1で外部からのジョブ依頼を受け付けると、ステップS2で受け付けたジョブをキューにキューイングした後、ステップS3でジョブをキューから取り出し、ステップS4で計算機管理部30に問い合わせて実行を依頼するサーバを決定する。この場合、依頼先が仮想サーバであった場合には、仮想サーバを構築している実サーバも決定される。
ステップS4で仮想サーバが決定されたとすると、次にステップS5で決定した仮想サーバ36のジョブ制御部40にジョブを依頼し、これによって計算ジョブ42によるジョブの実行が開始される。
続いてステップS6で非同期ジョブ終了待ち合せ処理を実行している。この非同期ジョブ終了待ち合せ処理は、図11に取り出して示すように、シグナルハンドラとしてのサブルーチンにより実行されている。非同期ジョブ終了待ち合せ処理は、ステップS1でジョブ終了通知の受信の有無をチェックしており、もしジョブ終了通知を受信すると、ステップS2でジョブ管理部28におけるジョブ状態を「実行終了」に設定した後、ステップS3で実行終了を図10のジョブ管理処理のメインルーチンに返信する。
再び図10を参照するに、ステップS6の非同期ジョブ終了待ち合せ処理に続いて、ステップS7でジョブは終了状態か否かチェックしており、ジョブ実行中にあっては終了状態でないことから、ステップS8に進み、依頼先の仮想サーバは凍結状態か否かチェックする。もし依頼先の仮想サーバが凍結状態であった場合には、ステップS9で依頼先の仮想サーバ36のジョブ制御部40に状態を確認し、ステップS10で一定時間例えば2分の待ち合せを行った後、ステップS6で非同期ジョブ終了待ち合せ処理に戻る。
このような仮想サーバにおけるジョブ実行状態でジョブが終了し、ステップS7でジョブ終了状態を判別するとステップS11に進み、依頼した仮想サーバ36のジョブ制御部40にジョブの回収を依頼し、ステップS12でジョブを回収してファイルに保存する。
図12は図2の管理サーバ10に設けた計算機管理部30における計算機処理のフローチャートである。図12において、計算機管理処理は、ステップS1で外部からの仮想サーバの操作依頼を受け付けると、ステップS2で操作依頼が凍結依頼か否かチェックする。
凍結依頼であった場合にはステップS3に進み、依頼先の管理サーバ36が稼動中か否かチェックし、稼動中であった場合にはステップS4に進み、図5の仮想サーバ管理テーブル34から依頼先の仮想サーバを管理する実サーバを検索する。
次にステップS5で、検索した実サーバ16の仮想サーバ制御部38に凍結をコマンド送信により指示して仮想サーバ36を凍結させる。次にステップS6で、図4の分散制御テーブル32及び図5の仮想サーバ管理テーブル34における依頼先の仮想サーバの状態を「凍結」に変更する。なおステップS3で凍結依頼を受けたにも関わらず仮想サーバが稼動中でなかった場合には、ステップS7で操作不可エラーメッセージを出力して処理を終了する。
一方、ステップS1で受け付けた仮想サーバの操作命令が再開依頼であった場合には、ステップS2からステップS8に進み、仮想サーバ36が凍結中か否かチェックし、凍結中であれば、ステップS9で仮想サーバ36を管理する実サーバ16を検索し、ステップS10で実サーバ16の仮想サーバ制御部38に再開を指示するコマンドを送って、凍結状態にある仮想サーバ36を復元して稼動状態とする。これにより一旦凍結された計算ジョブ42の実行が再開される。
次にステップS11で、図4の分散制御テーブル32及び図5の仮想サーバ管理テーブル34の状態を「稼動」に変更する。なおステップS8で再開依頼を受けたにも関わらず仮想サーバが凍結中でなかった場合には、ステップS12で操作不可エラーメッセージを出力して処理を終了する。
図13は図2の実サーバ16上に構築される仮想サーバ36のジョブ制御部40によるジョブ制御処理のフローチャートである。図13のジョブ制御処理にあっては、ステップS1で管理サーバ10のジョブ管理部28からジョブの実行依頼を受け付け、計算ジョブ42をステップS2で起動し、ステップS3でジョブ状態を稼動中に設定する。
続いてステップS4で非同期ジョブ終了待ち合せ処理を実行する。この非同期ジョブ終了待ち合せ処理は、図14に示すように、ステップS1でジョブプロセス終了検知の有無をチェックし、終了を検知すると、ステップS2でジョブ状態を「実行終了」に設定し、ステップS3で図13のジョブ制御処理のメインルーチンに実行終了を返信する。
続いて図13のステップS5で管理サーバ10のジョブ管理部28から状態の問合せがあるか否かチェックし、状態問合せがあった場合には、ステップS6でジョブ状態は稼動中か否かチェックし、稼動中であれば、ステップS7でジョブ実行中を返信する。一方、ステップS6でジョブ状態が「停止」であった場合には、ステップS8で実行終了を管理サーバ10のジョブ管理部28に返信する。
図15は図2の実サーバ16に設けた仮想サーバ制御部38による仮想サーバ制御処理のフローチャートである。図15において、仮想サーバ制御処理にあっては、ステップS1で管理サーバ10の計算機管理部30から仮想サーバ36の操作依頼を受け付け、ステップS2で操作依頼が凍結依頼であることを判別すると、ステップS3で仮想サーバ36にコマンドにより凍結を依頼し、仮想サーバ36を凍結する。
一方、ステップS1で受け付けた操作依頼が仮想サーバの再開依頼であった場合には、ステップS2からステップS4に進み、仮想サーバ36にコマンドによって再開を依頼し、凍結中の仮想サーバ36を復元して稼動することで、凍結中のジョブの実行を再開する。
ステップS3またはステップS4の処理が済むと、ステップS5で処理結果を管理サーバ10の計算機管理部30に返信し、分散制御テーブル32及び仮想サーバ管理テーブル34における状態を「凍結」または「再開」に変更させる。
また本実施形態は図2の管理サーバ10で実行されるサーバ管理プログラムを提供するものであり、このサーバ管理プログラムは図12〜図15のフローチャートに示した内容を持つことになる。
また本実施形態は、管理サーバ10を構成するコンピュータで可読なサーバ管理プログラムを格納した記憶媒体を提供する。この記憶媒体は、CD−ROM、フロッピィ(R)ディスク、DVDディスク、光磁気ディスク、ICカードなどの可搬型記憶媒体や、コンピュータシステムの内外に備えられたハードディスクドライブなどの記憶装置の他、回線を介してプログラムを保持するデータベース、あるいは他のコンピュータシステム並びにそのデータベースや、更に回線上の伝送媒体を含むものである。
なお上記の実施形態はコンピューティンググリッド環境の仮想サーバに対するサーバ管理を例に取るものであったが、これ以外の適宜の仮想サーバを使用したコンピュータシステムにつき、そのまま適用することができる。
また本発明は、その目的と利点を損なうことのない適宜の変形を含み、更に上記の実施形態で示した数値による限定は受けない。

Claims (18)

  1. 実サーバ上に構築された仮想サーバを管理するサーバ管理方法に於いて、
    ジョブの依頼を受付けてキューに格納するジョブ受付ステップと、
    前記キューからジョブを取出し、サーバ管理情報に基づいて決定した実サーバ上に構築された仮想サーバのジョブ制御部にジョブの実行を依頼するジョブ実行依頼ステップと、
    凍結依頼を受けた際に、前記仮想サーバが稼動状態にあることを判別して前記実サーバの仮想サーバ制御部に凍結指示を送信し、稼動中の前記仮想サーバを凍結させる凍結ステップと、
    再開依頼を受けた際に、前記仮想サーバが凍結状態にあることを判別して前記実サーバの仮想サーバ制御部に再開指示を送信し、凍結中の前記仮想サーバを稼動してジョブの実行を再開させる再開ステップと、
    前記仮想サーバのジョブ終了を認識した際に、前記仮想サーバのジョブ制御部に依頼して終了したジョブを回収するジョブ回収ステップと、
    を備えたことを特徴とするサーバ管理方法。
  2. 請求項1記載のサーバ管理方法に於いて、前記サーバ管理情報は、
    ジョブを実行するサーバ名又はネットワークアドレス、実サーバか仮想サーバかの種別、各サーバの稼動、停止又は凍結の状態及び各サーバの実行ジョブ数を含む分散制御情報と、
    実サーバと仮想サーバの対応関係、前記仮想サーバの稼動、停止又は凍結の状態及び前記仮想サーバ毎の実行中のジョブ一覧を含む仮想サーバ管理情報と、
    を備えたことを特徴とするサーバ管理方法。
  3. 請求項2記載のサーバ管理方法に於いて、前記ジョブ実行依頼ステップは、前記分散制御情報を参照して稼動状態にある複数の仮想サーバの中から実行ジョブ数が最小の仮想サーバを検索し、検索した仮想サーバを構築している実サーバを前記仮想サーバ管理情報から検索し、検索した実サーバと仮想サーバに基づいてジョブの実行を依頼することを特徴とするサーバ管理方法。
  4. 請求項2記載のサーバ管理方法に於いて、前記計算機管理部の凍結ステップ及び再開ステップは、前記仮想サーバ管理情報から仮想サーバの状態と仮想サーバを構築している実サーバを検索して凍結指示又は再開指示を行うことを特徴とするサーバ管理方法。
  5. 請求項1記載のサーバ管理方法に於いて、前記ジョブ実行依頼ステップは、前記実サーバ上に構築されている仮想サーバとの通信途絶による異常を検出した際に、前記サーバ管理情報を参照して前記サーバの凍結状態を認識した場合は正常と判断して前記異常検出を破棄することを特徴とするサーバ管理方法。
  6. 請求項1記載のサーバ管理方法に於いて、前記ジョブ受付ステップは、コンピューティンググリッド環境によるジョブを受付けて複数の仮想サーバにジョブの実行を依頼させることを特徴とするサーバ管理方法。
  7. 実サーバ上に構築された仮想サーバを管理するサーバ管理装置のコンピュータに、
    ジョブの依頼を受付けてキューに格納するジョブ受付ステップと、
    前記キューからジョブを取出し、サーバ管理情報に基づいて決定した実サーバ上に構築された仮想サーバのジョブ制御部にジョブの実行を依頼するジョブ実行依頼ステップと、
    凍結依頼を受けた際に、前記仮想サーバが稼動状態にあることを判別して、前記実サーバの仮想サーバ制御部に凍結指示を送信し、稼動中の前記仮想サーバを凍結させる凍結ステップと、
    再開依頼を受けた際に、前記仮想サーバが凍結状態にあることを判別して前記実サーバの仮想サーバ制御部に再開指示を送信し、凍結中の前記仮想サーバを稼動してジョブの実行を再開させる再開ステップと、
    前記仮想サーバのジョブ終了を認識した際に、前記仮想サーバのジョブ制御部に依頼して終了したジョブを回収するジョブ回収ステップと、
    を実行させることを特徴とするサーバ管理プログラム。
  8. 請求項7記載のサーバ管理プログラムに於いて、前記サーバ管理情報は、
    ジョブを実行するサーバ名又はネットワークアドレス、実サーバか仮想サーバかの種別、各サーバの稼動、停止又は凍結の状態及び各サーバの実行ジョブ数を含む分散制御情報と、
    実サーバと仮想サーバの対応関係、前記仮想サーバの稼動、停止又は凍結の状態及び前記仮想サーバ毎の実行中のジョブ一覧を含む仮想サーバ管理情報と、
    を備えたことを特徴とするサーバ管理プログラム。
  9. 請求項8記載のサーバ管理プログラムに於いて、前記ジョブ実行依頼ステップは、前記分散制御情報を参照して稼動状態にある複数の仮想サーバの中から実行ジョブ数が最小の仮想サーバを検索し、検索した仮想サーバを構築している実サーバを前記仮想サーバ管理情報から検索し、検索した実サーバと仮想サーバに基づいてジョブの実行を依頼することを特徴とするサーバ管理プログラム。
  10. 請求項8記載のサーバ管理プログラムに於いて、前記計算機管理部の凍結ステップ及び再開ステップは、前記仮想サーバ管理情報から仮想サーバの状態と仮想サーバを構築している実サーバを検索して凍結指示又は再開指示を行うことを特徴とするサーバ管理プログラム。
  11. 請求項7記載のサーバ管理プログラムに於いて、前記ジョブ実行依頼ステップは、前記実サーバ上に構築されている仮想サーバとの通信途絶による異常を検出した際に、前記サーバ管理情報を参照して前記サーバの凍結状態を認識した場合は正常と判断して前記異常検出を破棄することを特徴とするサーバ管理プログラム。
  12. 請求項7記載のサーバ管理プログラムに於いて、前記ジョブ受付ステップは、コンピューティンググリッド環境によるジョブを受付けて複数の仮想サーバにジョブの実行を依頼させることを特徴とするサーバ管理方法。
  13. 実サーバ上に構築された仮想サーバを管理するサーバ管理装置に於いて、
    前記仮想サーバに設けられたジョブ制御部を管理するジョブ管理部と、
    前記仮想サーバを構築する実サーバの仮想サーバ制御部を管理する計算機管理部と、
    を備え、
    前記ジョブ管理部は、
    ジョブの依頼を受付けてキューに格納するジョブ受付部と、
    前記キューからジョブを取出し、前記計算機管理部に依頼して決定した仮想サーバのジョブ制御部にジョブの実行を依頼するジョブ実行依頼部と、
    前記仮想サーバのジョブ終了を認識した際に、前記仮想サーバのジョブ制御部に依頼して終了したジョブを回収するジョブ回収部と、
    を備え、
    前記計算機管理部は、
    前記ジョブ管理部から問合せを受けた際に、ジョブ依頼先の実サーバと仮想サーバを検索して応答する依頼先検索部と、
    凍結依頼を受けた際に、前記仮想サーバが実行状態にあることを判別して、前記実サーバの仮想サーバ制御部に凍結指示を送信し、ジョブ実行中の前記仮想サーバを凍結させる凍結処理部と、
    再開依頼を受けた際に、前記仮想サーバが凍結状態にあることを判別して、前記実サーバの仮想サーバ制御部に再開指示を送信し、凍結中の前記仮想サーバにジョブの実行を再開させる再開処理部と、
    を備えたことを特徴とするサーバ管理装置。
  14. 請求項13記載のサーバ管理装置に於いて、前記サーバ管理情報は、
    ジョブを実行するサーバ名又はネットワークアドレス、実サーバか仮想サーバかの種別、各サーバの稼動、停止又は凍結の状態及び各サーバの実行ジョブ数を含む分散制御情報と、
    実サーバと仮想サーバの対応関係、前記仮想サーバの稼動、停止又は凍結の状態及び前記仮想サーバ毎の実行中のジョブ一覧を含む仮想サーバ管理情報と、
    を備えたことを特徴とするサーバ管理装置。
  15. 請求項14記載のサーバ管理装置に於いて、前記計算機管理部の前記依頼先検索部は、前記ジョブ管理部から問合せを受けた際に、前記分散制御情報から稼動状態にある複数の仮想サーバの中から実行ジョブ数が最小の仮想サーバを検索し、検索した仮想サーバを構築している実サーバを前記仮想サーバ管理情報から検索し、検索した実サーバと仮想サーバの情報を応答することを特徴とするサーバ管理装置。
  16. 請求項14記載のサーバ管理装置に於いて、前記計算機管理部の凍結処理部及び再開処理部は、前記仮想サーバ管理情報から仮想サーバの状態と仮想サーバを構築している実サーバを検索して凍結指示又は再開指示を行うことを特徴とするサーバ管理装置。
  17. 請求項13記載のサーバ管理装置に於いて、前記ジョブ管理部は、前記実サーバ上に構築されている仮想サーバとの通信途絶による異常を検出した際に、前記サーバ管理情報を参照して前記サーバの凍結状態を認識した場合は正常と判断して前記異常検出を破棄することを特徴とするサーバ管理装置。
  18. 請求項13記載のサーバ管理装置に於いて、前記ジョブ管理部は、コンピューティンググリッド環境によるジョブを受付けて複数の仮想サーバにジョブ実行を依頼することを特徴とするサーバ管理装置。
JP2008506078A 2006-03-17 2006-03-17 サーバ管理方法、プログラム及び装置 Pending JPWO2007108062A1 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/305361 WO2007108062A1 (ja) 2006-03-17 2006-03-17 サーバ管理方法、プログラム及び装置

Publications (1)

Publication Number Publication Date
JPWO2007108062A1 true JPWO2007108062A1 (ja) 2009-07-30

Family

ID=38522103

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008506078A Pending JPWO2007108062A1 (ja) 2006-03-17 2006-03-17 サーバ管理方法、プログラム及び装置

Country Status (2)

Country Link
JP (1) JPWO2007108062A1 (ja)
WO (1) WO2007108062A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5642338B2 (ja) 2008-03-10 2014-12-17 富士通株式会社 ジョブ管理プログラムおよびジョブ管理方法
JP5619179B2 (ja) * 2010-11-10 2014-11-05 株式会社日立製作所 計算機システム、ジョブ実行管理方法、及びプログラム
US9571379B2 (en) 2012-06-12 2017-02-14 Nec Corporation Computer system, communication control server, communication control method, and program
JP6547363B2 (ja) * 2015-03-26 2019-07-24 日本電気株式会社 管理装置、管理装置の制御方法、及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07254918A (ja) * 1994-03-16 1995-10-03 Fujitsu Ltd モデム監視装置
JP2004252629A (ja) * 2003-02-19 2004-09-09 Ntt Data Corp マルチオペレーティングシステムおよびマルチオペレーティングシステム制御方法
JP2005250597A (ja) * 2004-03-01 2005-09-15 Toyota Motor Corp プログラム及びコンピュータ

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07254918A (ja) * 1994-03-16 1995-10-03 Fujitsu Ltd モデム監視装置
JP2004252629A (ja) * 2003-02-19 2004-09-09 Ntt Data Corp マルチオペレーティングシステムおよびマルチオペレーティングシステム制御方法
JP2005250597A (ja) * 2004-03-01 2005-09-15 Toyota Motor Corp プログラム及びコンピュータ

Also Published As

Publication number Publication date
WO2007108062A1 (ja) 2007-09-27

Similar Documents

Publication Publication Date Title
JP4920391B2 (ja) 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム
JP4980792B2 (ja) 仮想計算機の性能監視方法及びその方法を用いた装置
CN105357038B (zh) 监控虚拟机集群的方法和系统
JP5110315B2 (ja) 仮想マシン管理装置、仮想マシン管理方法およびプログラム
JP5140633B2 (ja) 仮想化環境において生じる障害の解析方法、管理サーバ、及びプログラム
JP5427011B2 (ja) 仮想ハードディスクの管理サーバおよび管理方法、管理プログラム
JP5708937B2 (ja) 構成情報管理システム、構成情報管理方法、及び構成情報管理用プログラム
US9304849B2 (en) Implementing enhanced error handling of a shared adapter in a virtualized system
US20080209423A1 (en) Job management device, cluster system, and computer-readable medium storing job management program
US10067695B2 (en) Management server, computer system, and method
WO2012066640A1 (ja) 計算機システム、マイグレーション方法及び管理サーバ
JPH10143381A (ja) 遊休ワークステーションを共用するための装置および方法
JP5422342B2 (ja) インシデント管理方法および運用管理サーバ
CN109033814B (zh) 智能合约触发方法、装置、设备及存储介质
JP2015075898A (ja) 処理再開方法、処理再開プログラムおよび情報処理システム
US7904564B2 (en) Method and apparatus for migrating access to block storage
JPWO2007108062A1 (ja) サーバ管理方法、プログラム及び装置
JP2009217587A (ja) バッチ処理装置及び方法
US7797473B2 (en) System for executing system management interrupts and methods thereof
JP4700104B2 (ja) サーバ管理方法、プログラム及び装置
JP2014002798A (ja) 計算機システム及びプログラム
JP4723465B2 (ja) ジョブ割当プログラム及びジョブ割当方法
JP5390651B2 (ja) 計算機システム及びプログラム
JP4992745B2 (ja) チェックポイント・リスタート装置及びチェックポイント・リスタート方法
JP2005209150A (ja) コンピュータシステム及びそれを用いた系切り替え制御方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100816

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100914