JP4700104B2 - Server management method, program and apparatus - Google Patents

Server management method, program and apparatus Download PDF

Info

Publication number
JP4700104B2
JP4700104B2 JP2008506081A JP2008506081A JP4700104B2 JP 4700104 B2 JP4700104 B2 JP 4700104B2 JP 2008506081 A JP2008506081 A JP 2008506081A JP 2008506081 A JP2008506081 A JP 2008506081A JP 4700104 B2 JP4700104 B2 JP 4700104B2
Authority
JP
Grant status
Grant
Patent type
Prior art keywords
job
server
virtual server
computer
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008506081A
Other languages
Japanese (ja)
Other versions
JPWO2007108065A1 (en )
Inventor
清志 ▲高▼下
Original Assignee
富士通株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Grant date

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5013Request control
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/504Resource capping
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing
    • Y02D10/20Reducing energy consumption by means of multiprocessor or multiprocessing based techniques, other than acting upon the power supply
    • Y02D10/22Resource allocation

Description

本発明は、実サーバ上に構築される仮想サーバを管理するサーバ管理方法、プログラム及び装置に関し、特に、コンピューティンググリッド環境における各種シミュレーション計算等のジョブを複数の仮想サーバに分散して実行する際の仮想サーバの停止と再開を制御するサーバ管理方法、プログラム及び装置に関する。 The present invention is a server management method for managing a virtual server built on a real server, a program and a device, in particular, when performing distributed jobs of various simulation calculation in a computing grid environment to a plurality of virtual servers server management method for controlling a virtual server stopping and restarting a program and apparatus.

従来、地球環境や気象環境等の各種のシミュレーション計算は、非常に長時間を要し、計算ジョブが長時間計算機資源を使用した状態が継続され、膨大な計算機資源を必要とするため、近年、コンピューティンググリッド環境における各種シミュレーション計算システムが構築されている。 Conventionally, various simulation calculations such as environmental or weather environment, very time consuming, computation job is continued while using long computer resources, because it requires extensive computer resources, recently, various simulation calculation system in a computing grid environment is built.

コンピューティンググリッド環境によるシミュレーション計算システムは、計算ジョブを最適な計算機資源に割り当て、分散された計算機資源を効率的に利用する。 Simulation calculation system according to the computing grid environment allocates computational jobs optimal computer resources, utilize distributed computer resources efficiently. またコンピューティンググリッド環境の場合、計算機資源はシミュレーション計算ジョブのための占有リソースでない場合があり、他の利用目的で計算機資源が利用される場合があり、計算機資源の貸し借りが必要となる。 In the case of the computing grid environment, computing resources are may not be occupied resources for the simulation calculation job, sometimes computer resources for other purposes are used, lending and borrowing of computer resources are required.

長時間の実行を要するシミュレーション計算ジョブが計算機資源を利用している場合、他の目的で同じ計算機資源を利用できない。 If the simulation calculation job requiring a long run utilizing computer resources can not utilize the same computing resources for other purposes. また、他の目的で利用することが判っている計算機資源をシミュレーション計算ジョブで利用することもできない。 It is also not possible to use the computer resources known to be utilized for other purposes in the simulation calculation job.

このためコンピューティンググリッド環境に割り当てた計算機資源であっても、オフィス業務など他の目的で利用中の計算機資源は除外し、空き計算機資源でシミュレーション計算ジョブを実行させる。 Therefore even computer resources allocated to the computing grid environment, computing resources in use for other purposes, such as office work are excluded, to execute the simulation calculation jobs free computer resources. しかし、シミュレーション計算ジョブが長時間にわたり計算機資源を占有した場合、他の業務でその計算機資源を使いたくても使えないなどの問題が発生する。 However, if the simulation calculation job they have possession of the computer resources for a long period of time, such as can not be used even want to use the computer resources in other business problems.

この問題を解決する一般的な方法として、ジョブのチェックポイント・リスタート機能がある。 As a general method for solving this problem, there is a check point restart function of the job. チェックポイント・リスタート機能は、ジョブを司るジョブ管理制御装置と計算アプリケーションが連携し、アプリケーションにおける計算処理がどこまで進んでいるかを定期的に保存し、一時的に計算ジョブを停止させ、他の目的で計算機資源を利用できるようにする。 Checkpoint restart function, the calculated application job management control device that controls the job is cooperation, regularly save or calculation processing in the application has progressed to where, temporarily the calculation job is stopped, other purposes in to be able to use the computer resources.

このため、長時間を要するシミュレーション計算ジョブを、チェックポイント・リスタート機能によるジョブ実行と停止を繰り返して少ない空き計算機資源を積み重ねることで、他の業務に影響を与えることなくシミュレーション計算ジョブを継続することができる。 For this reason, the simulation calculation job requiring a long period of time, by stacking a free computer resources less by repeating the stop and job execution by the checkpoint restart function, to continue the simulation calculation job without affecting the other business be able to.
特開2005−208919号公報 JP 2005-208919 JP 特開2005−196561号公報 JP 2005-196561 JP

しかしながら、このような従来のチェックポイント・リスタート機能を利用した計算機資源の利用方法にあっては、シミュレーション計算ジョブとして動作するアプリケーションにおいて、チェックポイント・リスタートのための制御処理が必須であり、アプリケーションの開発コストが膨らむという問題がある。 However, in the method of using such a computer resource using a conventional checkpoint restart feature, the applications that run as a simulation calculation job, the control process for the checkpoint restart is required, the cost of developing applications there is a problem that swell.

また、市販ソフトウェアなどチェックポイント・リスタート機能を保持しないアプリケーションによりシミュレーション計算ジョブを実行する場合、一時的にシミュレーション計算ジョブを停止させることが困難である。 Also, if you run a simulation calculation job by not holding the checkpoint restart function such as commercial software application, it is difficult to temporarily stop the simulation calculation job.

また、他の目的で計算機資源を利用する際に、サーバ自身を別のOS等で再起動するような運用を行いたい場合、チェックポイント・リスタート機能は利用できない。 In addition, when using the computer resources for other purposes, if you want to operate so as to restart the server itself in a different operating system (OS), checkpoint restart function is not available. この理由は、チェックポイント・リスタート機能では、チェックポイントを採るためには、アプリケーション側にチェックポイントを採るためのロジックが必須である。 The reason for this is that, in the checkpoint restart function, in order to take a checkpoint, logic to take a checkpoint in the application side is essential. また、チェックポイントによる情報が保存された資源はジョブ単位で管理され、ジョブ管理制御装置の配下で管理される。 Moreover, the resource information according checkpoint is stored is managed for each job, they are managed under the control of job management controller.

このため、サーバ自身を停止させて別のOSで計算機資源を利用する場合は、ジョブ管理制御装置が停止してしまうため、シミュレーション計算ジョブを一時的に凍結しても、その後再開することは困難である。 Therefore, when to stop the server itself to use the computer resources in a different OS, because the job management controller will stop, even if temporarily freeze the simulation calculation job, difficult to subsequently resume it is.

また他の業務で使用している計算機資源の空き時間を利用してシミュレーション計算ジョブに計算機資源を割り当てる環境においては、計算機資源を夜間および休日のみ利用する場合、数十台あるいは数百台ある計算機資源を手動で切り替えるのは運用コストが増大するため、外部のスケジュール機能などを利用した時刻管理による自動化運用が行われる。 In an environment where using the free time of the computer resources that are used in other business assigning the computer resources in the simulation calculation job, when using the computer resources at night and holidays only, dozens or hundreds certain computer for switch the resources manually increasing operational costs, automated operation by the time management using an external schedule function is performed.

しかし、計算機資源の利用を時刻管理により自動化した場合、終了時刻を迎える直前に実行時間の短いジョブが計算機へ依頼されたとき、ジョブ実行中に終了時刻となってチェックポイント・リスタート機能によりジョブの実行が中断される。 However, computer when it is automated by using time management of resources, when the short job of execution time is requested to the computer just before celebrating the end time, job by the check point restart function is the end time during job execution the execution is interrupted. このため、実行時間の短いジョブであっても、次の利用開始時刻に達してジョブが再開されない限り、ジョブの実行結果を得ることができず、ジョブの実行に長時間待たされることで、処理効率が大きく低下する問題がある。 Therefore, even in short job execution time, as long as the job reaches the next available start time is not resumed, it is impossible to obtain the execution result of the job, that the wait long time to run the job, the processing there is a problem that the efficiency is greatly reduced.

本発明は、実サーバ上に構築される仮想サーバに計算ジョブを実行させ、アプリケーションやOSに依存することなくジョブの停止と再開を任意のタイミングで可能とすると同時に、時刻管理により計算機資源の利用する際のジョブ実行を資源利用の中断によって長時間待たせないようにするサーバ管理方法、プログラム及び装置を提供することを目的とする。 The present invention relates to a virtual server, which is built on the real server to execute the calculation job, at the same time to allow the job is stopped and resumed at any time without depending on the application and OS, utilization of computer resources by time management server management method to prevent waiting a long time by interrupting the job execution resource use at the time of, and to provide a program and device.

本発明はサーバ管理方法を提供する。 The present invention provides a server management method. 本発明は、実サーバ上に構築された仮想サーバを管理サーバにより管理するサーバ管理方法に於いて、 The present invention, in the server management method for managing a management server virtual server built on a real server,
仮想サーバの凍結時刻と再開時刻を含む計算機計画情報を管理し、現在時刻が凍結時刻に到達した際に凍結を指示し、現在時刻が再開時刻に到達した際に再開を指示する計算機計画ステップと、 Manage computer plan information including the freezing time and restart time of the virtual server, the current time is instructed to freeze upon reaching freezing time, the computer program step of current time to indicate resume upon reaching the restart time ,
ジョブの依頼を受付けてキューに格納するジョブ受付ステップと、 And job accepting step to be stored in the queue to accept the request of the job,
キューからジョブを取出し、サーバ管理情報に基づいてジョブ依頼先の仮想サーバを決定した際に、ジョブ管理情報から得られたジョブの実行終了時刻と仮想サーバの凍結時刻とを比較し、実行終了時刻が凍結時刻より前の場合は決定した仮想サーバのジョブ制御部にジョブの実行を依頼し、実行終了時刻が凍結時刻を過ぎている場合は、実行終了時刻が凍結時刻前となる仮想サーバを決定する処理を繰り返すジョブ実行依頼ステップと 仮想サーバの凍結指示を受けた際に、依頼先の仮想サーバが稼動状態にあることを判別して、仮想サーバを構築する実サーバの仮想サーバ制御部に凍結指示を送信し、稼動中の仮想サーバを凍結させる凍結ステップと、 Retrieves the job from the queue, when determining the virtual servers of the job request destination on the basis of server management information, compares the execution end time of the obtained job from the job management information and freezing time of the virtual server, execution end time determined but requests the execution of the job to the job control unit of the virtual server determined in the case of prior freezing time, if the execution end time is past the freezing time, a virtual server execution end time is prior to freezing time a job execution requesting step of repeating the process for a time of receiving the freezing instruction of the virtual server, to determine that the virtual server request destination is in running state, frozen to the virtual server control unit of the real server to build a virtual server sends instructions to a freezing step of freezing the virtual servers running,
仮想サーバの再開指示を受けた際に、依頼先の仮想サーバが凍結状態にあることを判別して仮想サーバを構築する実サーバの仮想サーバ制御部に再開指示を送信し、凍結中の仮想サーバを稼動してジョブの実行を再開させる再開ステップと、 When receiving the restart instruction of the virtual server, transmits a restart instruction virtual server request destination is the virtual server control unit of the real server to build a virtual server to determine that it is in frozen state, the virtual server in the frozen and the resumption step to resume the execution of the job running the,
仮想サーバのジョブ終了を認識した際に、仮想サーバのジョブ制御部に依頼して終了したジョブを回収するジョブ回収ステップと、 Upon recognizing the job end of the virtual server, a job recovery step of recovering the job ended by requesting the job control unit of the virtual server,
を備えたことを特徴とする。 Characterized by comprising a.

ここで、ジョブ管理情報は、ジョブ識別子、ジョブが凍結が可能か又は不可かを示す凍結可否情報、ジョブが凍結不可の場合の予想実行時間を含み、 Here, the job management information includes the job identifier, job frozen availability information indicating whether freezing may or impossible, job expected execution time for the freezing not,
ジョブ実行依頼ステップは、キューから取出したジョブが凍結不可で且つ予想実行時間から求めた実行終了時刻が前記凍結時刻を過ぎている場合に、実行終了時刻が凍結時刻より前となるジョブ依頼先となる仮想サーバを決定する処理を繰り返す。 Job execution requesting step, when the execution end time job taken out of the queue obtained from and expected execution time in a freeze-Call is past the freezing time, and job request destination execution end time is earlier than freezing time comprising repeating the processing for determining the virtual server.

サーバ管理情報は、 Server management information,
ジョブを実行するサーバ名又はネットワークアドレス、実サーバか仮想サーバかの種別、各サーバの稼動、停止又は凍結の状態、各サーバの実行ジョブ数を含む分散制御情報と、 Server name or network address to perform the job, whether the real server or virtual server type, the operation of each server, and the distributed control information including the stop or frozen state, the number of executed job of each server,
実サーバと仮想サーバの対応関係、仮想サーバの稼動、停止又は凍結の状態、仮想サーバ毎の実行中のジョブ一覧を含む仮想サーバ管理情報と、 Correspondence between the real and virtual servers, virtual servers running the virtual server management information including stop or freeze state, the job list during the execution of each virtual server,
を備える。 Equipped with a.

ジョブ実行依頼ステップは、分散制御情報を参照して稼動状態にある複数の仮想サーバの中から実行ジョブ数が最小の仮想サーバをジョブ依頼先として検索する Job execution requesting step, the number of execution job search for minimum virtual servers as the job request destination from the plurality of virtual servers in the operating state by referring to the distributed control information.

凍結ステップ及び再開ステップは、仮想サーバ管理情報から仮想サーバの状態と仮想サーバを構築している実サーバを検索して凍結指示又は再開指示を行 Freezing step and resume step, intends row freezing instruction or restart instruction by searching the real server are building a virtual server and status of the virtual server from the virtual server management information.

ジョブ実行依頼ステップは、実サーバ上に構築されている仮想サーバとの通信途絶による異常を検出した際に、 記サーバ管理情報を参照してサーバの凍結状態を認識した場合は正常と判断して異常検出を破棄する。 Job execution requesting step, when an abnormality is detected by the communication interruption between virtual servers that are built on the real server, if it recognizes the frozen state of the server before Symbol with reference server management information is recognized as the discard the abnormality detection Te.

ジョブ受付ステップは、コンピューティング環境によるジョブを受付けて複数の仮想サーバにジョブ実行を依頼させる。 Job receiving step causes the requested job execution to a plurality of virtual servers accepts job by computing environments.

(プログラム) (program)
本発明はサーバ管理プログラムを提供する。 The present invention provides a server management program. 本発明は、実サーバ上に構築された仮想サーバを管理するサーバ管理装置のコンピュータに、 The present invention allows a computer of the server management device for managing the virtual server built on a real server,
仮想サーバの凍結時刻と再開時刻を含む計算機計画情報を管理し、現在時刻が凍結時刻に到達した際に凍結を指示し、現在時刻が再開時刻に到達した際に再開を指示する計算機計画ステップと、 Manage computer plan information including the freezing time and restart time of the virtual server, the current time is instructed to freeze upon reaching freezing time, the computer program step of current time to indicate resume upon reaching the restart time ,
ジョブの依頼を受付けてキューに格納するジョブ受付ステップと、 And job accepting step to be stored in the queue to accept the request of the job,
キューからジョブを取出し、サーバ管理情報に基づいてジョブ依頼先の仮想サーバを決定した際に、ジョブ管理情報から得られたジョブの実行終了時刻と仮想サーバの凍結時刻とを比較し、実行終了時刻が凍結時刻より前の場合は決定した仮想サーバのジョブ制御部にジョブの実行を依頼し、実行終了時刻が凍結時刻を過ぎている場合は、実行終了時刻が凍結時刻前となる仮想サーバを決定する処理を繰り返すジョブ実行依頼ステップと 仮想サーバの凍結指示を受けた際に、依頼先の仮想サーバが稼動状態にあることを判別して、仮想サーバを構築する実サーバの仮想サーバ制御部に凍結指示を送信し、稼動中の仮想サーバを凍結させる凍結ステップと、 Retrieves the job from the queue, when determining the virtual servers of the job request destination on the basis of server management information, compares the execution end time of the obtained job from the job management information and freezing time of the virtual server, execution end time determined but requests the execution of the job to the job control unit of the virtual server determined in the case of prior freezing time, if the execution end time is past the freezing time, a virtual server execution end time is prior to freezing time a job execution requesting step of repeating the process for a time of receiving the freezing instruction of the virtual server, to determine that the virtual server request destination is in running state, frozen to the virtual server control unit of the real server to build a virtual server sends instructions to a freezing step of freezing the virtual servers running,
仮想サーバの再開指示を受けた際に、依頼先の仮想サーバが凍結状態にあることを判別して仮想サーバを構築する実サーバの仮想サーバ制御部に再開指示を送信し、凍結中の仮想サーバを稼動してジョブの実行を再開させる再開ステップと、 When receiving the restart instruction of the virtual server, transmits a restart instruction virtual server request destination is the virtual server control unit of the real server to build a virtual server to determine that it is in frozen state, the virtual server in the frozen and the resumption step to resume the execution of the job running the,
仮想サーバのジョブ終了を認識した際に、仮想サーバのジョブ制御部に依頼して終了したジョブを回収するジョブ回収ステップと、 Upon recognizing the job end of the virtual server, a job recovery step of recovering the job ended by requesting the job control unit of the virtual server,
を実行させることを特徴とする。 Characterized in that for the execution.

(装置) (apparatus)
本発明はサーバ管理装置を提供する。 The present invention provides a server management device. 本発明は、実サーバ上に構築された仮想サーバを管理するサーバ管理装置に於いて、 The present invention, in the server management device for managing the virtual server built on a real server,
前記仮想サーバの凍結時刻と再開時刻を含む計算機計画情報を管理する計算機計画部と、 And computer program unit for managing the computer plan information including the freezing time and restart time of the virtual server,
前記仮想サーバに設けられたジョブ制御部を管理するジョブ管理部と、 A job management unit for managing the job control unit provided in the virtual server,
前記仮想サーバを構築する物理サーバの仮想サーバ制御部を管理する計算機管理部と、 And computer management unit for managing the virtual server control unit of physical servers to build the virtual server,
を備え、 Equipped with a,
計算機計画部は、 Computer planning unit is,
仮想サーバの凍結時刻と再開時刻を設定した計算機計画情報を作成する計画作成部と、 And planning unit for creating a computer planning information you set the frozen time and restart time of the virtual server,
現在時刻が前記凍結時刻に到達した際に計算機管理部に凍結を指示し、現在時刻が再開時刻に到達した際に計算機管理部に再開を指示する計画指示部と、 Current time indicates a frozen computer management unit upon reaching the freezing time, and the plan instructing section the current time to indicate the resume computer management unit upon reaching restart time,
を備え、 Equipped with a,
ジョブ管理部は、 Job management unit,
ジョブの依頼を受付けてキューに格納するジョブ受付部と、 And the job receiving unit to be stored in the queue to accept the request of the job,
キューからジョブを取出し、計算機管理部に問合せてジョブの実行を依頼する仮想サーバを決定した際に、ジョブ管理情報から得られたジョブの実行終了時刻と仮想サーバの凍結時刻とを比較し、実行終了時刻が凍結時刻より前の場合は決定した仮想サーバのジョブ制御部にジョブの実行を依頼し、実行終了時刻が凍結時刻を過ぎている場合は計算機管理部に再度問合せて実行終了時刻が凍結時刻前となる仮想サーバを決定する処理を繰り返すジョブ実行依頼部と、 Retrieves the job from the queue, comparing the time of determining the query the computer management unit a virtual server for requesting execution of the job, the execution end time of the obtained job from the job management information and freezing time of the virtual server, execute end time is requested to execute the job to the job control unit of the virtual server determined in the case of prior freezing time, execution end time when the execution end time is past the freezing time inquiry computer management unit again freeze a job execution requesting part for repeating the processing for determining the virtual server time the front,
仮想サーバのジョブ終了を認識した際に、仮想サーバのジョブ制御部に依頼して終了したジョブを回収するジョブ回収部と、 Upon recognizing the job end of the virtual server, the job recovery unit for recovering a job has been completed by requesting the job control unit of the virtual server,
を備え、 Equipped with a,
計算機管理部は、 Computer management unit,
ジョブ管理部から問合せを受けた際に、ジョブ依頼先の実サーバと仮想サーバを検索して計画指示部の計算機計画情報から得られた凍結時刻と共に応答する依頼先検索部と、 Upon receiving an inquiry from the job management unit, and the request destination searching unit that responds with freezing time obtained from the computer planning information planning instruction unit searches the real and virtual servers job request destination,
仮想サーバの凍結指示を受けた際に、依頼先の仮想サーバが実行状態にあることを判別して、仮想サーバを構築する実サーバの仮想サーバ制御部に凍結指示を送信し、ジョブ実行中の仮想サーバを凍結させる凍結部と、 When subjected to freezing instruction of the virtual server, to determine that the virtual server request destination is in the execution state, it sends a freezing instruction to the virtual server control unit of the real server to build a virtual server, the job execution a freezing unit for freezing the virtual server,
仮想サーバの再開指示を受けた際に、依頼先の仮想サーバが凍結状態にあることを判別して、仮想サーバを構築する実サーバの仮想サーバ制御部に再開指示を送信し、凍結中の仮想サーバにジョブの実行を再開させる再開部と、 When receiving the restart instruction of the virtual server, the virtual server request destination is determined to be in the frozen state, transmits a restart instruction to the virtual server control unit of the real server to build a virtual server, virtual during freezing and the resumption unit configured to resume execution of the job to the server,
を備えたことを特徴とする。 Characterized by comprising a.

本発明によければ、仮想サーバにジョブの実行を依頼する際に,依頼するジョブが凍結不可である場合は、計算機計画情報を参照して依頼先の仮想サーバがこれから依頼しようとしているジョブが終了する前に計画的に凍結されるか否か判定し、もしジョブ終了前に凍結する計画となっている場合は、ジョブ終了後に凍結する計画のある他の仮想サーバを検索してジョブを依頼し、これによって短時間で終了するはずのジョブが。 If you are satisfied with the present invention, when requesting the execution of the job to the virtual server, if the job to ask is frozen not, the job that the virtual server is trying to request future reference to the request destination of the computer plan information Exit strategically determined whether frozen before, if you are if a plan to freeze before the job end, to request the job search for other virtual server with the plan to freeze after the job completion , this job should be finished in a short time by the. 凍結する計画ある仮想サーバで実行されることで、長時間待たないとジョブ実行結果がえられないという問題を回避することができる。 By running in plan is a virtual server for freezing, it is possible to avoid the problem of the not wait long job execution result is not be obtained.

また仮想サーバに対する時刻管理による凍結と再開の指示により、例えば昼間は事務処理等の業務で利用している計算機資源を夜間のみコンピューティンググリッド環境によるシミュレーション計算ジョブに利用でき、サーバ仮想化基盤の導入コストだけで、連続して計算機の空き時間を有効に利用して長時間を要するシミュレーション計算を実行することができる。 By freezing and resuming instruction by the time management for the virtual server also e.g. daytime available computer resources that are utilized in the business paperwork such as at night only simulation calculation job by computing grid environment, the introduction of server virtualization infrastructure in cost only, it is possible to perform a simulation calculation that takes a long time by effectively utilizing the free time of the computer continuously.

また仮想サーバを凍結することで計算機資源を開放するため、シミュレーション計算ジョブとして動作しているアプリケーション側において、従来のようなチェックポイント・リスタート機能を実装する必要がなく、アプリケーションの開発コスト、保守コストを大幅に削減することができる。 Since opening the computer resources by freezing the virtual server, the application side operating as a simulation calculation job, it is not necessary to implement a conventional checkpoint restart functions such as application development costs, maintenance the cost can be significantly reduced.

また、チェックポイント・リスタート機能を実装していない市販のアプリケーションなど、どのようなアプリケーションでも仮想サーバ上で計算ジョブを実行することで、任意のタイミングで一時凍結し、また任意のタイミングで再開することができる。 Further, such as the commercially available applications that do not implement the checkpoint restart feature enables In any application perform calculations job on the virtual server, and freeze one o'clock at an arbitrary timing, also resumed at any time be able to.

本発明が適用されるコンピューティンググリッド環境の説明図 Illustration of a computing grid environment in which the invention is applied 本実施形態における管理サーバと実サーバ上に構築される仮想サーバを示した機能構成のブロック図 Block diagram of a functional configuration showing the virtual servers that are built on the management server and the real server in this embodiment 本実施形態における仮想サーバの論理アーキテクチャの説明図 Illustration of the logical architecture of a virtual server in this embodiment 図2のジョブ管理テーブルの説明図 Illustration of the job management table in FIG. 2 図2の計算機計画テーブルの説明図 Illustration of a computer program table in FIG. 2 図2の分散制御テーブルの説明図 Illustration of distributed control table in FIG. 2 図2の仮想サーバ管理テーブルの説明図 Illustration of the virtual server management table of FIG. 2 本実施形態における仮想サーバの凍結と再開の処理機能の説明図 Illustration of freezing and resume processing function of the virtual server in this embodiment 本実施形態の管理サーバが適用されるコンピュータのハードウェア環境の説明図 Illustration of the hardware environment of a computer management server of the present embodiment is applied 本実施形態のサーバ管理処理のタイムチャート Time chart of the server management process of the present embodiment 図10に続く本実施形態のサーバ管理処理のタイムチャート Time chart of server management processing of the present embodiment following FIG. 10 図2の管理サーバにおけるジョブ管理処理のフローチャート Flowchart of a job management process in the management server of FIG. 2 図12のステップ6の非同期ジョブ終了待合せ処理のフローチャート Flow chart of the asynchronous job end queuing process in step 6 in FIG. 12 図2の仮想サーバにおける計算機計画処理のフローチャート Flowchart of a computer program process in the virtual server 2 図2の管理サーバにおける計算機管理処理のフローチャート Flow chart of the computer management process in the management server of FIG. 2 図2の仮想サーバにおけるジョブ制御処理のフローチャート Flowchart of the job control process in the virtual server 2 図16のステップ4における非同期ジョブ終了待ち合せ処理のフローチャート Flow chart of the asynchronous job end waiting process in step 4 in FIG. 16 図2の実サーバにおける仮想サーバ制御処理のフローチャート Flowchart of the virtual server control process in the real server 2

図1は本発明が適用されるコンピューティンググリッド環境の説明図である。 Figure 1 is an explanatory diagram of a computing grid environment in which the present invention is applied. 図1において、本実施形態の管理サーバ10はネットワーク12に接続され、ネットワーク12にはシミュレーション計算ジョブなどを依頼する計算機群14として、本実施形態にあっては実サーバ16−1〜16−39を接続している。 In Figure 1, the management server 10 of the present embodiment is connected to the network 12, as computer group 14 to the network 12 to request such simulation calculation job, in the present embodiment the real server 16-1~16-39 It is connected to.

管理サーバ10に対しては、オペレータ18−1の操作でシミュレーション計算ジョブのジョブ投入20が行われ、管理サーバ10による管理の下に、計算機群14に含まれる実サーバ16−1〜16−39のいずれかにジョブを依頼して実行させる。 For the management server 10, the simulation calculation jobs job submission 20 are performed by operating the operator 18-1, under the management by the management server 10, the real server included in the computer group 14 16-1~16-39 either to request a job to be executed in the.

また管理サーバ10に対しては、実行中のジョブに対し仮想サーバに対する凍結・再開指示22をオペレータ18−2から行うことができる。 Also with respect to the management server 10 can perform freeze-resumption instruction 22 to the virtual server to running jobs from the operator 18-2.

外部スケジューラ24には計算機計画を作成するために使用する定義ファイル26が準備されており、定義ファイル26に基づいて管理サーバ16は計算機群14の実サーバ16−1〜16−3 に構築される仮想サーバの凍結時刻と再開時刻を含む計算機計画テーブルを作成して管理する。 The external scheduler 24 are ready definition file 26 to be used to create a computer program, the management server 16 on the basis of the definition file 26 is built real server 16-1 to 16-3 6 in the computer group 14 frozen time of the virtual server to create and manage computer plan table, including the resumption time that.

図2は本実施形態における管理サーバと実サーバ上に構築される仮想サーバを示した機能構成のブロック図である。 Figure 2 is a block diagram of a functional configuration showing the virtual servers that are built on the management server and the real server in this embodiment. 図2において、本実施形態にあっては、説明を簡単にするため、管理サーバ10に対し1台の実サーバ16を配置した場合を例にとっている。 2, in the present embodiment, for simplicity of explanation, taking as an example the case where to the management server 10 is arranged a real server 16 one.

管理サーバ10には、ジョブ管理部28、計算機管理部30、分散制御テーブル32、仮想サーバ管理テーブル34,ジョブ管理テーブル44、計算機計画部46、計算機計画テーブル48が設けられる。 The management server 10, the job management unit 28, computer management unit 30, distributed control table 32, the virtual server management table 34, the job management table 44, the computer program portion 46, the computer program table 48 is provided.

一方、実サーバ16には仮想サーバ36と仮想サーバ制御部38が設けられ、仮想サーバ36の中にはジョブ制御部40と計算ジョブ42が設けられることになる。 On the other hand, the virtual server 36 is the virtual server control unit 38 provided on the real server 16, so that the computing job 42 job control unit 40 is provided in the virtual server 36.

ここで、管理サーバ10及び実サーバ16におけるそれぞれの機能は、コンピュータによるプログラムの実行により実現される機能である。 Here, each of the functions in the management server 10 and the real server 16 is a function realized by executing a program by a computer.

管理サーバ10のジョブ管理部28には、ジョブ受付部28−1、ジョブ実行依頼部28−2、ジョブ回収部28−3が設けられる。 The job management unit 28 of the management server 10, the job accepting unit 28-1, the job execution requesting part 28-2, the job recovery unit 28-3 are provided. ジョブ受付部28−1は、図1に示したようなオペレータ18−2もしくは外部スケジューラ24からのジョブ投入20によるジョブの依頼を受けて、内蔵したキューに格納する。 Job receiving unit 28-1 receives a request for job by job input 20 from the operator 18-2 or an external scheduler 24 as shown in FIG. 1, and stored in the built-in queues.

ジョブ実行依頼部28−2は、キューからジョブを取り出し、計算機管理部30に依頼して決定した仮想サーバ36のジョブ制御部40にジョブの実行を依頼する。 Job submission part 28-2 retrieves the job from the queue, a request for execution of the job to the job control unit 40 of the virtual server 36 determined by requesting the computer management unit 30. 更に、ジョブ実行依頼部28−2は、計算機管理部30に問合せてジョブの実行を依頼する仮想サーバを決定した際に、依頼しようとしているジョブが凍結不可の場合、ジョブの実行終了時刻と仮想サーバの凍結時刻とを比較し、実行終了時刻が凍結時刻より前の場合は決定した仮想サーバ16のジョブ制御部36にジョブの実行を依頼し、実行終了時刻が凍結時刻を過ぎている場合は計算機管理部30に再度問合せて実行終了時刻が凍結時刻前となる仮想サーバを決定する処理を繰り返す。 Furthermore, the job execution requesting part 28-2, when determining the virtual servers by querying the computer management unit 30 requests the execution of a job, if a job that you are trying to request the freezing not, and virtual execution end time of the job comparing the freezing time of the server, if the execution end time of requesting execution of the job to the job control unit 36 ​​of the virtual server 16 determines if prior to freezing time, execution end time is past the freezing time again contact the computer management unit 30 executes end time repeats a process of determining a virtual server to which the pre-freezing time.

ここでジョブ管理テーブル44には、ジョブ識別子、ジョブが凍結可能か又は凍結不可かを示す凍結可否情報、ジョブが凍結不可の場合の予想実行時間が登録されており、ジョブ実行依頼部30は、現在時刻にジョブ管理テーブル44から取得した予想実行時間を加算して実行終了時刻を求め、計算機管理部30側から得られた依頼先の仮想サーバ16の凍結時刻と比較する。 Here, the job management table 44 includes a job identifier, job frozen availability information indicating whether freezable or freeze not, the job is registered is expected execution time for the freezing not, the job execution requesting part 30, adding the expected execution time acquired from the job management table 44 to the current time seeking execution end time, compared with the freezing time of the virtual server 16 of the request destination obtained from the computer management unit 30 side.

ジョブ回収部28−1は、仮想サーバ36のジョブ終了を認識した際に、ジョブ制御部40に依頼して終了したジョブを回収する。 Job recovery unit 28-1, upon recognizing the job end of the virtual server 36, to recover the job ended by requesting the job control unit 40.

計算機管理部30には、依頼先検索部30−1、凍結処理部30−2及び再開処理部30−3が設けられている。 The computer management unit 30, the request-destination search unit 30-1, freeze processing section 30-2 and the restart processing section 30-3 is provided. 依頼先検索部30−1は、ジョブ管理部28からの問合せを受けた際に、ジョブ依頼先の実サーバ16と仮想サーバ36を検索し、計算機計画部46の計算機計画テーブル48から得られた凍結時刻と共に応答する。 Request destination search unit 30-1, upon receiving an inquiry from the job management unit 28 searches the virtual server 36 and the real server 16 the job request destination, obtained from the computer program table 48 of the computer planning unit 46 to respond with the frozen time.

図2にあっては実サーバ16は1台で、且つ実サーバ16上に構築された仮想サーバ36も1台であるが、実際には図1のように管理サーバ10の依頼先となる実サーバは計算機群14に示すように複数であり、また実サーバ16上に構築される仮想サーバ36の数も複数台構築される場合がある。 In one real servers 16 In the Figure 2, and is a virtual server 36 one also built on the real server 16 actually becomes the request destination of the management server 10 as shown in FIG. 1 the actual server which may calculate a plurality as shown in unit group 14, and the number of virtual servers 36 constructed on the real server 16 is also constructed a plurality.

凍結処理部30−2は、外部からの操作依頼22又は計算機計画部46から仮想サーバ36の凍結依頼を受けた際に、依頼先の仮想サーバ36が計算ジョブ42の実行状態にあることを判別して、仮想サーバ36を構築する実サーバ16の仮想サーバ制御部38に凍結指示を送信し、計算ジョブ42によるジョブ実行中の仮想サーバ36を凍結させる。 Freezing unit 30-2 determines that when subjected to freeze request of the virtual server 36 from the operation request 22 or computer planning unit 46 from outside, the virtual server 36 of the request destination is in the execution state of the computing job 42 to, send a freezing instruction to the virtual server control unit 38 of the real server 16 to construct a virtual server 36, to freeze the virtual server 36 in the job execution by computing job 42.

再開処理部30−3は、外部からの操作依頼22又は計算機計画部46から仮想サーバ36の再開依頼を受けた際に、依頼先の仮想サーバ36が凍結状態にあることを判別して、仮想サーバ36を構築する実サーバ16の仮想サーバ制御部38に再開指示を送信し、凍結中の仮想サーバ36に計算ジョブ42の実行を再開させる。 Restart processing section 30-3, when having received the resumption request of the virtual server 36 from the operation request 22 or computer planning unit 46 from outside, the virtual server 36 of the request destination is determined to be in the frozen state, virtual It sends a restart instruction to the virtual server control unit 38 of the real server 16 to build a server 36 to resume execution of the computational jobs 42 to the virtual server 36 during freezing.

計算機計画部46には計画作成部46−1と計画指示部46−2が設けられる。 It is planning unit 46-1 and planning instruction unit 46-2 is provided in the computer planning unit 46. 計画作成部46−1は、図1の外部スケジューラ24の定義ファイル26を読込んで仮想サーバの凍結時刻と再開時刻を含む計算機計画テーブル48を作成する。 Planning unit 46-1 creates a computer program table 48 including freezing time and restart time of the virtual server Nde read the definition file 26 of the external scheduler 24 of FIG. 計画指示部46−2は、計算機計画テーブル48の凍結時刻と再開時刻を現在時刻と比較しており、現在時刻が凍結時刻に到達した際に計算機管理部30に凍結を指示し、現在時刻が再開時刻に到達した際に計算機管理部30に再開を指示する。 Planning instruction unit 46-2, freeze time and restart time of the computer planning table 48 is compared to the current time, and instructs the frozen computer management unit 30 when the current time reaches the freezing time, the current time instructing restart the computer management section 30 upon reaching the restart time.

一方、実サーバ16に構築された仮想サーバ36のジョブ制御部40は、管理サーバ10のジョブ管理部28からジョブ実行依頼を受け付け、アプリケーションにより計算ジョブ42を実行し、計算ジョブ42が終了すると実行終了をジョブ管理部28に通知する。 On the other hand, the job control unit 40 of the virtual server 36 constructed in real server 16 accepts a request job execution from the job management unit 28 of the management server 10 executes the computing job 42 by the application, computational jobs 42 ends the execution It notifies the end to the job management unit 28. これを受けてジョブ管理部28は、終了したジョブの回収を依頼し、依頼を受けてジョブ制御部40は、終了したジョブを編集する。 The job management unit 28 receives this, ask the collection of the completed job, the job control unit 40 receives a request to edit a job has been completed.

管理サーバ36が構築された実サーバ16に設けた仮想サーバ制御部38は、管理サーバ10の計算機管理部30からの操作依頼を受けて仮想サーバ36を制御する。 Virtual server control unit 38 the management server 36 is provided on the real server 16 constructed controls the virtual server 36 receives the operation request from the computer management unit 30 of the management server 10. この操作依頼として本発明にあっては、計算機管理部30は凍結指示または再開指示を発行することから、凍結指示を受け付けたときには仮想サーバ36を凍結し、その後、仮想サーバ36の凍結中に再開指示を受け付けると、凍結している仮想サーバ36を復元して計算ジョブ42を実行させる。 In the present invention as the operation request, computer management unit 30 from issuing a freeze instruction or resumption instruction, upon receiving a freeze instruction freezes virtual server 36, then resumed during freezing of the virtual servers 36 When accepting an instruction to execute a computing job 42 to restore the virtual servers 36 are frozen.

更に、本実施形態において、管理サーバ10の計算機管理部30の指示で仮想サーバ36が凍結された場合、管理サーバ10に設けているジョブ管理部28と仮想サーバ36の通信が途絶することになるが、ジョブ管理部28が通信途絶による仮想サーバ36の異常を検出した際には、仮想サーバ管理テーブル34を参照すれば、異常を起こしている仮想サーバにつき「凍結」の状態を知ることができる。 Further, in this embodiment, if the virtual server 36 is frozen at the direction of computer management unit 30 of the management server 10, so that the communication with the job management unit 28 provided for the management server 10 virtual servers 36 are interrupted but, when the job management unit 28 detects an abnormality in the virtual server 36 by the communication disruption may be known by referring to the virtual server management table 34, the state of "frozen" per virtual server that abnormally .

このためジョブ管理部28は、仮想サーバ36との通信途絶による異常を検出しても、これは異常ではなく仮想サーバが凍結状態にあるものと判断し、異常と判断した場合に、ジョブを異常終了するか、別の計算機に異常終了したジョブの再実行を依頼するなどの不必要な処理を回避することができる。 Therefore job management unit 28 also detects an abnormality by communication interruption with the virtual server 36, which is a virtual server without a malfunction is determined to be in the frozen state, when it is determined that abnormality, abnormal jobs can be avoided or terminated, unnecessary processing, such as requesting a re-execution of the job terminates abnormally another computer.

図3は本実施形態における仮想サーバの論理アーキテクチャの説明図である。 Figure 3 is an illustration of the logical architecture of a virtual server in this embodiment. 図3において、実サーバに相当する計算機50上にはハードウエア52が構築され、ハードウエア52を基板としてウィンドウズ(R)などのOS54が動作する。 3, on the computer 50 corresponding to the real server hardware 52 is constructed and operates OS54 is such Windows (R) hardware 52 as a substrate. OS54上には仮想プラットフォーム56が構築され、この仮想プラットフォーム56上で例えば仮想OS58−1,58−2が動作し、それぞれ個別にアプリケーションを実行することができる。 On OS54 virtual platform 56 is constructed and the virtual platform 56 on, for example, virtual OS58-1,58-2 operates, can each run the application separately.

このような仮想プラットフォーム56及び仮想OS58−1,58−2としては、例えばVMウエア(R)やマイクロソフト(R)・バーチャルサーバ2005などのサーバ仮想化製品を実装することができる。 Such a virtual platform 56 and the virtual OS58-1,58-2 may be, for example, to implement a server virtualization products such as VM ware (R) and Microsoft (R) · Virtual Server 2005.

図4は図2の管理サーバ10に設けた分散制御テーブル32の説明図である。 Figure 4 is an explanatory diagram of a distributed control table 32 provided in the management server 10 of FIG. 分散制御テーブル32は、計算機名60、計算機種別62、状態64、ジョブ多重度66及びジョブ数68を登録している。 Distributed control table 32, a computer name 60, calculation model-specific 62, state 64, and registers the job multiplicity 66 and the job number 68. 計算機名60としては、ジョブを実行する計算機のホスト名またはIPアドレスを登録する。 As computer name 60 registers the host name or IP address of the computer executing the job.

計算機種別62は実サーバまたは仮想サーバである。 Calculation model-specific 62 is a real or virtual server. 状態64は実サーバまたは仮想サーバの状態であり、この状態は、実サーバの場合には「稼動」又は「停止」の2つの状態があり、仮想サーバにあっては「稼動」、「停止」又は「凍結」の3つの状態がある。 State 64 is the state of the real or virtual server, this state, if the real server has two states in the "active" or "stop", in the virtual server "active", "stop" or there are three states of the "frozen".

分散制御テーブル32における実サーバ及び仮想サーバの状態64は、各計算機のハートビートに基づいて状態を監視している。 State 64 of a real server and a virtual server in the distributed control table 32, monitors the state based on the heartbeat of each computer. 即ち状態「稼動」とは、計算機のハートビートにより正常に稼動していることが確認できた状態である。 That is, the state "operation", a state in which it is operating normally by the heart beat of the computer could be confirmed. また状態「停止」は、計算機のハートビートに失敗し、稼動していると確認できない状態である。 The state "Stop" will fail in the heartbeat of the computer, is a state that can not be confirmed to be operating. 更に本実施形態の仮想サーバに固有な状態である「凍結」は、仮想サーバが凍結指示を受けて凍結された状態である。 Furthermore, "frozen" a specific state to the virtual server of the present embodiment is a state in which the virtual server is frozen undergoing freezing instruction.

なお、ハートビート(heart beat)とは、 HYPERLINK "http://e-words.jp/w/E3838DE38383E38388E383AFE383BCE382AF.html" ネットワーク上で、 HYPERLINK "http://e-words.jp/w/E382B3E383B3E38394E383A5E383BCE382BF.html" コンピュータやネットワーク機器が自身が正常に稼動していることを一定時間ごとに外部に知らせるために信号やパケットを送ることである。 It is to be noted that the heart beat (heart beat), at HYPERLINK "http://e-words.jp/w/E3838DE38383E38388E383AFE383BCE382AF.html" on the network, HYPERLINK "http://e-words.jp/w/E382B3E383B3E38394E383A5E383BCE382BF.html "it is to send a signal or packet to inform the outside for each of the computers and network equipment itself is operating normally fixed time.

分散制御テーブル32のジョブ多重度66は、各計算機に依頼可能なジョブ数の上限値である。 Job multiplicity 66 of distributed control table 32 is an upper limit value of the number of possible requested jobs to respective computers. 更にジョブ数68は各計算機で現在処理中のジョブ数であり、状態が「凍結」の計算機の場合は凍結状態のジョブ数を示している。 A further number of jobs currently being processed by the number 68 each computer jobs, if the state is in the computer the "frozen" indicates the number of jobs frozen state.

この分散制御テーブル32は、図2のジョブ管理部28に外部からジョブの依頼を受けた際に、計算機管理部30の依頼先検索部30−1により参照され、状態64が「稼動」となっている計算機を依頼先候補として選択し、複数候補が選択された場合には例えば最小ジョブ数となる計算機を依頼先として決定する。 The distributed control table 32, upon receiving a request job from the outside to the job management unit 28 of FIG. 2, is referred to by the request destination search unit 30-1 of the computer management unit 30, the state 64 becomes "active" and select that computer as a request destination candidate, if the plurality of candidates is selected for determining a request destination of the computer to be a minimum number of jobs, for example. もちろん、この場合、状態が「停止」または「凍結」となっている計算機は依頼先から除外されることになる。 Of course, in this case, computer state is "stop" or "freeze" will be excluded from the request destination.

図5は図2の管理サーバ10に設けた仮想サーバ管理テーブル34の説明図である。 Figure 5 is an explanatory diagram of a virtual server management table 34 provided in the management server 10 of FIG. 仮想サーバ管理テーブル34は、実サーバ名70、仮想サーバ名72、各仮想サーバの状態74、及び各仮想サーバのジョブ一覧76で構成されている。 Virtual server management table 34, real server name 70, and a virtual server name 72, state 74 of each virtual server, and the job list 76 for each virtual server. 実サーバ名70は実計算機のホスト名またはIPアドレスである。 Real server name 70 is a host name or IP address of the real machine. 仮想サーバ名72は実サーバ上で起動されて稼動している仮想サーバのホスト名またはIPアドレスである。 Virtual server name 72 is a host name or IP address of the virtual server running is started on the real server.

ここで、実サーバ名70と仮想サーバ名72から、実サーバと仮想サーバの対応関係が分かる。 Here, the virtual server name 72 and the real server name 70, the correspondence between the real and virtual servers is known. 例えば実サーバ名70として、実サーバ「r_host01」上にはサーバ名「v_host01」及び「v_host02」を持つ2台の仮想サーバが構築されている。 For example as a real server name 70, on the real server "r_host01" has two virtual servers having the server name "v_host01" and "v_host02" is built.

状態74は各仮想サーバの状態であり、「稼動」、「停止」又は「凍結」のいずれかであり、それぞれ図4の分散制御テーブル32の状態と同じ内容である。 State 74 is the state of each virtual server, "operation" is either "Stop" or "frozen", the same content as the state of the distributed control table 32 of FIG. 4, respectively. ジョブ一覧76には、各仮想サーバに実行を依頼中のジョブ番号の一覧が登録されている。 The job list 76, a list of job numbers in the request execution to each virtual server is registered.

図6は図2のジョブ管理部28に対し設けたジョブ管理テーブル44の説明図である。 6 is an explanatory view of a job management table 44 provided to the job management unit 28 of FIG. ジョブ管理テーブル44は、ジョブID78、凍結可否80、予想実行時間82、その他のジョブ情報84を登録する。 The job management table 44 includes a job ID78, frozen propriety 80 registers the expected execution time 82, and other job information 84.

ジョブID78は依頼されたジョブの識別子である。 Job ID78 is an identifier of the job that has been requested. 凍結可否80は、仮想サーバに依頼する際に、実行途中で凍結しても良いか否かを示し、実行中に凍結しても問題ないジョブについては「可能」が設定され、実行中に凍結してはならないジョブについては「不可」を設定している。 Freezing propriety 80, when requesting the virtual server, indicating whether it may be frozen in the middle of execution, for no problem even if frozen during the job is set to "enable", frozen during execution It is set to "impossible" for not job you are. この凍結可否80を「不可」とするジョブは、例えば比較的短時間で実行できるジョブである。 Job that the freeze whether 80 the "impossible" is, for example, a job that can be executed in a relatively short period of time.

予想実行時間82は、凍結可否80を「不可」に設定したジョブについて設定され、この予想実行時間を現在時刻に加算することで、ジョブの実行終了時刻を求めることができる。 Expected execution time 82 is set for the job set frozen propriety 80 to "impossible", by adding the estimated duration to the current time, it is possible to determine the execution end time of the job.

図7は図2の計算機計画部46で生成された計算機計画テーブル48の説明図である。 Figure 7 is an explanatory diagram of a computer program table 48 generated by the computer program 46 in FIG. 2. 計算機計画テーブル46には、計算機名86、凍結時刻88、再開時刻90が登録される。 In computer plan table 46, computer name 86, freezing time 88, restart time 90 is registered. 計算機名86には凍結及び再開が行われる仮想計算機のホスト名又はIPアドレスが登録される。 Host name or IP address of the virtual machine to freezing and resumption is performed is registered in the computer name 86.

凍結時刻88と再開時刻90は図1の定義ファイル26から作成され、各仮想サーバをシミュレーション計算に利用する夜間から朝にかけての計画時間帯が設定されている。 Frozen time 88 and resume time 90 is created from the definition file 26 of FIG. 1, the planned periods are set of over the morning from the night to use the each virtual server to the simulation calculation. この時間計画テーブル48に基づき計算機計画部46は計算機管理部30に仮想計算機の凍結と再開を依頼することになる。 Computer planning unit 46 based on the time plan table 48 will ask the freezing and resuming of the virtual machine computer management unit 30.

図8は本実施形態における仮想サーバの凍結と再開の処理機能の説明図である。 Figure 8 is an explanatory view of freezing and resume processing function of the virtual server in this embodiment. 図8において、実サーバ16にはハードウエアとして物理ボリューム92及び各種デバイス94が設けられており、物理ボリューム92に格納しているOSを実行することで仮想プラットフォーム56が構築され、仮想プラットフォーム56上で仮想サーバ36が動作している。 8, the real server 16 has a physical volume 92 and various devices 94 is provided as hardware, virtual platform 56 is constructed by executing an OS that contains the physical volume 92, a virtual platform 56 above in the virtual server 36 is running.

この仮想サーバ36には、実サーバ16の計算機資源を使用して、仮想メモリ96、仮想ボリューム98及び仮想デバイス100が構成され、これら仮想計算機資源を使用して、図3に示したように、1または複数の仮想OS58−1,58−2が実行され、これらのOS上でアプリケーションとしての計算ジョブが実行される。 The virtual server 36, using the computer resources of the real server 16, virtual memory 96, the virtual volume 98 and the virtual device 100 is configured, using these virtual computer resources, as shown in FIG. 3, 1 or more virtual OS58-1,58-2 is performed, computational jobs as an application is executed on these of the OS.

仮想サーバ36によるジョブ実行中に、図2に示した管理サーバ10の計算機管理部30より凍結指示102が仮想プラットフォーム56に与えられると、仮想プラットフォーム56は仮想サーバ36全体を凍結処理106に示すように物理ボリューム92にvmxfファイル110として保存さし、実行中のジョブを停止した凍結状態とする。 During job execution by the virtual server 36, when the freeze instruction 102 from the computer management unit 30 of the management server 10 shown in FIG. 2 is applied to the virtual platform 56, the virtual platform 56 to indicate the entire virtual server 36 to freezing 106 the pointing stored in the physical volume 92 as vmxf file 110, a frozen state of stopping the running job.

凍結状態で仮想プラットフォーム56に対し図2の管理サーバ10の計算機管理部30より再開指示104が与えられると、仮想プラットフォーム56は、物理ボリューム92に退避しているvmxfファイル110を再開処理108に示すように読み出して管理サーバ36を再構築し、凍結したジョブの実行を再開する。 Virtual platform 56 when restart instruction 104 from the computer management unit 30 of the management server 10 of FIG. 2 is given to a frozen state, the virtual platform 56 shows vmxf file 110 that is retracted to the physical volume 92 to resume processing 108 rebuilding the management server 36 reads way, resume execution of the frozen job.

仮想プラットフォーム56に対する凍結指示102及び再開指示104は、図2の計算機管理部30から発行されるコマンドであり、凍結指示102は例えばコマンド「vmrun suspendファイル名」となり、また再開指示104はコマンド「vmrun startファイル名」となる。 Freezing instruction 102 and restart instruction 104 to the virtual platform 56 is a command issued by the computer management unit 30 of FIG. 2, freezing instruction 102 is for example the command "vmrun suspend File Name", and also restart instruction 104 commands "vmrun the start file name ".

即ち凍結コマンドは、仮想サーバ36の全情報を物理ボリューム92のvmxfファイル110という専用の制御ファイルに保存する命令となる。 That freeze command is a command to store all the information of the virtual server 36 to a dedicated control file named vmxf file 110 of the physical volume 92. また再開コマンドは、コマンドで指定された制御ファイル例えばvmxfファイル110に保存されている情報を元に、仮想サーバ36の状態を復元する命令となる。 The Resume command, based on the information stored in the control file example vmxf file 110 specified by the command, a command for restoring the state of the virtual server 36.

図9は本実施形態の管理サーバが適用されるコンピュータのハードウエア環境の説明図である。 Figure 9 is an illustration of the hardware environment of a computer management server of the present embodiment is applied. 図7において、CPU112のバス114には、RAM116、ROM118、ハードディスクドライブ120、キーボード124,マウス126及びディスプレイ128を接続するデバイスインタフェース122、及びネットワークアダプタ130が接続されている。 7, the bus 114 of the CPU112 is, RAM 116, ROM 118, hard disk drive 120, a keyboard 124, a device interface 122 and a network adapter 130 connects the mouse 126 and a display 128 are connected.

ハードディスクドライブ120には本実施形態のサーバ管理プログラムが格納されており、コンピュータ起動によるブート後のOSのRAM116への読出展開による実行に続いて、サーバ管理プログラムがRAM116に読み出され、CPU112により実行される。 The hard disk drive 120 is stored server management program of the present embodiment, following the execution by reading expansion into RAM 116 of the OS booting by the computer startup, server management program is read out to the RAM 116, executed by the CPU112 It is.

図10及び図11は本実施形態のサーバ管理処理のタイムチャートである。 10 and FIG. 11 is a time chart of the server management processing in this embodiment. 図10において、管理サーバ10のジョブ管理部28にあっては、ステップS1で外部からのジョブ依頼132を受け付けると、受付けたジョブをキューに格納するキューイングを行う。 10, in the job management unit 28 of the management server 10, when receiving the job request 132 from the outside, queuing for storing received job to the queue performed in step S1.

続いてステップS2でキューから受け付けたジョブを取り出し、ステップS3で実行を依頼する計算機を計算機管理部30に問い合わせて決定する。 Then removed job accepted from the queue in step S2, query determines the computer to request execution in step S3 in computer management unit 30. 計算機管理部30は、ジョブ管理部28からの問合せを受けると、ステップS101で図4の分散制御テーブル32を参照し、状態58が「稼動」となっている計算機を依頼先候補として検索し、複数候補が検索された場合にはジョブ数62が最小となる計算機を依頼先として応答する。 Computer management unit 30 receives an inquiry from the job management unit 28 refers to the distributed control table 32 of FIG. 4 in step S101, searches the computer status 58 is "active" as the requested candidate, If multiple candidates are searched responds a computer job number 62 is minimized as the requested.

この場合に依頼先として仮想サーバ36が検索された場合には、図5の仮想サーバ管理テーブル34を参照し、依頼先に決定された仮想サーバ36を構築している実サーバ名を取得して応答する。 If the virtual server 36 is retrieved as the requested in this case, refers to the virtual server management table 34 of FIG. 5, to obtain the real name of the server constructs a virtual server 36 determined the request-destination respond. 同時に計算機管理部30は計算機計画部46にアクセスして候補計算機が仮想サーバの場合の凍結時刻を取得して応答する。 At the same time computer management unit 30 candidate computer to access the computer planning unit 46 responds by acquiring the freezing time of the case of the virtual server.

ジョブ管理部28にあっては、計算機管理部30に対する問合せで、もし仮想サーバを依頼先として決定した場合には、図6のジョブ管理テーブル48を参照して受付けているジョブの凍結可否82を参照し、例えばジョブID=02であったとすると、凍結可否82は「不可」であることから、その予想実行時間82として「180秒」を取得し、 In the job management unit 28, a query for the computer management unit 30, if when determining the virtual server as a request destination, a freeze whether 82 of jobs accepted by referring to the job management table 48 in FIG. 6 reference, for example, and which was a job ID = 02, since the freezing whether 82 is "impossible", acquires "180 seconds" as its expected running time 82,
実行終了時刻=現在時刻+180秒を求める。 Execution end time = seek the current time +180 seconds.

そして、計算機管理部30に対する問合せの応答してえられている凍結時刻と実行終了時刻を比較し、 Then, comparing freezing time are E in response queries on the computer management unit 30 and the execution end time,
(実行終了時刻)<(凍結時刻) (Execution end time) <(freezing time)
であれば、凍結時刻前にジョブ実行を終了することから、応答のあった仮想サーバ及び仮想サーバを構築している実サーバを依頼先として決定し、ステップS4で決定したサーバにジョブの実行を依頼する。 If, because it ends the job execution before freezing time, to determine the real server are building virtual servers and virtual server have a response as the requested, the execution of the job to the server determined in step S4 to ask.

これに対し(実行終了時刻)>(凍結時刻) On the other hand (execution end time)> (freezing time)
の場合には、凍結時刻後にジョブ実行が終了してジョブが長時間再開待ちになることから、この仮想サーバは不適切と判断し、再度、計算機管理部30にジョブ依頼先の計算機を問合せ、凍結時刻前にジョブ実行を終了する仮想サーバを決定してステップS3でジョブの実行を依頼する。 In the case of, from the fact that the job is a long time resumption waiting in the job has finished running after freezing time, this virtual server is deemed inappropriate, again, query the job request destination of computer to computer management unit 30, to determine the virtual server to terminate the job execution requesting execution of the job in step S3 before freezing time.

ステップS4におけるサーバにジョブの依頼は、仮想サーバ36を構築している実サーバ16の例えばIPアドレスなどの指定でジョブを依頼し、ジョブ依頼に仮想サーバ36のIPアドレスを含めておくことで、仮想サーバ36のジョブ制御部40に対しジョブを依頼することができる。 Request jobs to the server in step S4, by including the IP address of the virtual server 36 the job with the specified, e.g., IP address of the real server 16 that constructs a virtual server 36 to request the job request, You can request a job to the job control unit 40 of the virtual server 36. 仮想サーバ36のジョブ制御部40は、管理サーバ10のジョブ管理部28からのジョブの依頼を受け付けて、計算機ジョブにステップS401のようにジョブを実行させる。 Job control unit 40 of the virtual server 36 accepts a request job from the job management unit 28 of the management server 10 to execute the job as computer step S401 the job.

凍結不可のジョブについては、仮想サーバ36の凍結時刻前にジョブの実行が終了し,ジョブ実行結果が管理サーバ10に回収されてファイルに保存される。 For freezing not the job, the job has finished running before freezing time of the virtual servers 36 are stored the job execution result is collected to the management server 10 to the file.

一方、凍結可能なジョブの実行を仮想サーバ36に依頼している場合には、仮想サーバ36によるジョブ実行中に管理サーバ10の計算機管理部30に対し凍結依頼134が行われると、ステップS102で仮想サーバの凍結依頼を受け付け、ステップS103で仮想サーバ36を管理する実サーバ16を図5の仮想サーバ管理テーブル34から検索し、ステップS104で検索した実サーバ16の仮想サーバ制御部38に対し凍結を指示する。 On the other hand, if you are requested to execute the freezable job to the virtual server 36, when the freeze request 134 to computer management unit 30 of the management server 10 during job execution is performed by the virtual server 36, at step S102 accepting freeze request of the virtual server, the real server 16 that manages the virtual server 36 searches the virtual server management table 34 of FIG. 5 in step S103, frozen to the virtual server control unit 38 of the real server 16 retrieved in step S104 to instruct.

これを受けて実サーバ16の仮想サーバ制御部38は、ステップS201で計算機管理部30からの凍結指示を受け、仮想サーバ36にステップS302で凍結操作を行って凍結させる。 In response to this virtual server control unit 38 of the real server 16 receives a freezing instruction from the computer management unit 30 in step S201, is frozen and freeze-operated in step S302 to the virtual server 36. 仮想サーバの凍結により凍結完了通知がステップS303で仮想サーバ制御部38に応答されると、ステップS202で凍結完了応答を管理サーバ10の計算機管理部30に対し行う。 When freezing completion notification by freezing of the virtual server is responsive to the virtual server control unit 38 in step S303, performed with respect to computer management unit 30 of the management server 10 Frozen completion response in step S202.

これを受けて計算機管理部30は、ステップS106で図4の分散制御テーブル32及び図5の仮想サーバ管理テーブル34における対応する仮想サーバの状態を、それまでの「稼動」から「凍結」に変更する。 Computer management unit 30 receives this, changing the state of the corresponding virtual server in the virtual server management table 34 of the distributed control table 32 and 5 of Figure 4 at step S106, from the "active" until then to "freeze" to.

なお、図8のステップS302,S303の処理は、ジョブ制御部40の処理として説明の都合上示しているが、実際には仮想サーバ36の凍結制御と凍結完了通知となる。 The processing of steps S302, S303 of FIG. 8 illustrates the convenience of explanation as the processing of the job control unit 40, a freezing completion notification freeze control of the virtual server 36 in practice.

続いて図9において、管理サーバ10の計算機管理部30に対し再開依頼136が行われると、これをステップS106で受け付け、ステップS107で図5の仮想サーバ管理部34の参照により仮想サーバ36を管理する実サーバ16を検索し、ステップS108で実サーバ16の仮想サーバ制御部38に再開指示のコマンドを送る。 Subsequently in FIG. 9, the resume request 136 is performed on the computer management unit 30 of the management server 10, which received in step S106, the virtual server 36 by referring to the virtual server management unit 34 of FIG. 5 in step S107 Management to search the real server 16 sends a command for resumption instruction to the virtual server control unit 38 of the real server 16 in step S108.

仮想サーバ制御部38はステップS203で再開指示を受けて仮想サーバ36はステップS304で再開制御を行い、これによって計算ジョブ42がステップS103のように稼動状態となってジョブ実行が再開される。 Virtual server control unit 38 the virtual server 36 receives a restart instruction in step S203 performs the resume control at step S304, thereby computing job 42 is a job execution is resumed in a working state, as in step S103.

仮想サーバの再開制御が完了すると、ステップS305で再開完了通知が仮想サーバ制御部38に送られ、ステップS204で再開完了応答を管理サーバ10の計算機管理部30に送る。 Resuming control of the virtual server is completed, restart completion notice in step S305 is sent to the virtual server control unit 38, and sends the computer management unit 30 of the management server 10 to resume complete response at step S204. これを受けて計算機管理部30は、ステップS109で仮想サーバ36の状態を「稼動」に変更する。 Computer management unit 30 receives this changes the state of the virtual server 36 to "active" at step S109.

更に仮想サーバ36で実行している計算ジョブが終了すると、ジョブ制御部40はステップS306で、終了通知を管理サーバ10の計算機管理部30を経由してジョブ管理部28に通知する。 Furthermore the calculation jobs running on the virtual server 36 is completed, the job control unit 40 in step S306, and notifies the job management unit 28 via the computer management unit 30 of the management server 10 a completion notification. このジョブ終了通知を認識したジョブ管理部28は、ステップS5で仮想サーバ36のジョブ制御部40にジョブ回収を依頼し、これを受けてジョブ制御部40は、ステップS307でジョブを回収して応答し、ジョブ管理部28はステップS6で、回収したジョブをファイルに保存する。 The job management unit 28 recognizes the job end notification, requests the job recovery to the job control unit 40 of the virtual server 36 in step S5, the job control unit 40 receives this, to recover the job at step S307 response and, the job management unit 28 in step S6, stores the collected job file.

図12は図2の管理サーバ10に設けたジョブ管理部28によるジョブ管理処理のフローチャートである。 Figure 12 is a flowchart of a job management process by the job management unit 28 provided in the management server 10 of FIG. 図12において、ジョブ管理処理は、ステップS1で外部からのジョブ依頼を受け付けると、ステップS2で受け付けたジョブをキューにキューイングした後、ステップS3でジョブをキューから取り出し、ステップS4で計算機管理部30に問い合わせて実行を依頼する計算機を決定する。 12, the job management process accepts the job request from the outside in step S1, after queuing the job accepted in step S2 in the queue retrieves the job from the queue in step S3, computer management unit in step S4 inquiry to 30 to determine the computer to ask the run. この問合せに対し計算機管理部30は依頼先の計算機として仮想サーバを検索した場合には、仮想サーバを構築している実サーバと、仮想サーバの凍結時刻を併せて応答する。 Computer management unit 30 with respect to the query when searching virtual servers as the requested computer is a real server which constructs a virtual server responds together freezing time of the virtual server.

続いてステップS5でジョブを依頼する計算機が決定できたか否か判別し、決定でき無い場合はステップS3に戻り、次のジョブをキューから取出してジョブを依頼する計算機を決定する。 Subsequently discriminates whether or not the computer requesting a job could be determined in step S5, if not be determined returns to step S3, to determine the computer for requesting a job retrieves the next job from the queue.

ステップS5でジョブを依頼する計算機を決定した場合はステップS6に進み、仮想サーバか否か判定する。 If you decide to computer for requesting a job at step S5 advances to step S6, it is determined whether the virtual server. 仮想サーバの場合は、ステップS7で図6のジョブ管理テーブル44の参照でジョブは凍結可能か否か判定し、凍結不可であればステップS8に進み、 For a virtual server, the job judges whether it is possible to freeze the reference of the job management table 44 in FIG. 6 at step S7, the process proceeds to step S8 if frozen not,
(予測実行終了時刻)>(凍結時刻) (Predicted execution end time)> (freezing time)
であれば、決定した仮想サーバは不適切としてステップS4に戻って別の計算機を依頼先として決定する処理を繰り返す。 If the determined virtual server repeats a process of determining another computer as the requested returns to step S4 as inappropriate.

ステップS8の条件に該当せず、ジョブが凍結時刻前に終了する場合はステップS9に進み、決定した仮想サーバ36のジョブ制御部40にジョブを依頼し、これによって計算ジョブ42によるジョブの実行が開始される。 Does not correspond to the condition of step S8, the job proceeds to step S9 if terminated before freezing time, determined requested the job to the job control unit 40 of the virtual server 36, whereby execution of the job by the computing job 42 It is started.

続いてステップS10で非同期ジョブ終了待ち合せ処理を実行している。 Then running asynchronous job end waiting processing at step S10. この非同期ジョブ終了待ち合せ処理は、図13に取り出して示すように、シグナルハンドラとしてのサブルーチンにより実行されている。 This asynchronous job termination waiting process, as shown taken out in Figure 13, being executed by a subroutine as a signal handler. 非同期ジョブ終了待ち合せ処理は、ステップS1でジョブ終了通知の受信の有無をチェックしており、もしジョブ終了通知を受信すると、ステップS2でジョブ管理部28におけるジョブ状態を「実行終了」に設定した後、ステップS3で実行終了を図12のジョブ管理処理のメインルーチンに返信する。 Asynchronous job end waiting processing, it is checked whether the reception of the job end notice in step S1, when if receives a job end notification, after setting the job status in the job management unit 28 in the "execution ended" in step S2 , and it returns an execution completion to the main routine of the job management process of FIG. 12 in step S3.

再び図12を参照するに、ステップS10の非同期ジョブ終了待ち合せ処理に続いて、ステップS11でジョブは終了状態か否かチェックしており、ジョブ実行中にあっては終了状態でないことから、ステップS12に進み、依頼先の仮想サーバは凍結状態か否かチェックする。 Referring again to FIG. 12, following the asynchronous job end waiting processing in step S10, the job in step S11 it is checked whether the end state, since In the job execution not the end state, step S12 proceed to, the virtual server of the request destination to check whether or not the frozen state.

もし依頼先の仮想サーバが凍結状態であった場合には、ステップS13で依頼先の仮想サーバ36のジョブ制御部40に状態を確認し、ステップS14で一定時間例えば2分の待ち合せを行った後、ステップS6で非同期ジョブ終了待ち合せ処理に戻る。 If when the virtual server request destination is the frozen state, check the status in the job control unit 40 of the virtual server 36 request destination in step S13, after the predetermined time, for example waiting for 2 minutes in step S14 returns to the asynchronous job end waiting processing at step S6.

このような仮想サーバにおけるジョブ実行状態でジョブが終了し、ステップS7でジョブ終了状態を判別するとステップS15に進み、依頼した仮想サーバ36のジョブ制御部40にジョブの回収を依頼し、ステップS16でジョブを回収してファイルに保存する。 Such job is completed by the job execution status in the virtual server, the process proceeds to step S15 when determining a job end state in step S7, and requests the recovery of the job to the job control unit 40 of the virtual server 36 has requested, in step S16 save to recover the job to a file.

図14は図2の計算機計画処理部46による計算機計画処理のフローチャートである。 Figure 14 is a flow chart of a computer program processed by the computer program processing unit 46 in FIG. 2. 図14において、計算機計画処理は、ステップS1で図1の外部スケジューラ24から定義ファイル26を読込み、図7の計算機計画テーブル48をメモリ上に作成する。 14, computer planning process creates a definition file 26 from outside the scheduler 24 in FIG. 1 in step S1 reads a computer program table 48 of FIG. 7 in the memory. 次にステップS2に進み、計算機計画テーブル48から現在時刻に対し最初に操作を依頼する時刻を検索する。 Next, in step S2, first to find the time to request an operation to the current time from the computer planning table 48.

続いてステップS3で検索した時刻が凍結時刻であることを判別するとステップS4で種別を「凍結」にセットし、凍結時刻なければステップS5に進んで種別を「再開」にセットする。 Then the time retrieved in step S3 is set to "freeze" the type in step S4 if it is determined that the freezing time, and sets the type proceeds to step S5 if not freeze time to "resume".

続いて現在時刻が検索した待合せ時刻に到達したか否か判定し、待合せ時刻になるとステップS7で種別が凍結であればステップS8で計算機管理部30に凍結を指示し、種別が凍結出なければステップS9で計算機管理部30に再開を指示する。 Then it is determined whether the host vehicle has reached the waiting time of searching the current time, and instructs the frozen computer management unit 30 in step S8 if type is frozen in step S7 becomes the waiting time, if the type is not out frozen instructing restart the computer management unit 30 in step S9. このステップS2〜S9の処理をステップS10で停止指示を判別するまで繰り返す。 Repeat step S2~S9 until determining a stop instruction at step S10.

図15は図2の管理サーバ10に設けた計算機管理部30における計算機処理のフローチャートである。 Figure 15 is a flowchart of a computer process in the computer managing section 30 provided in the management server 10 of FIG. 図15において、計算機管理処理は、ステップS1で仮想サーバの操作依頼を受け付けると、ステップS2で操作依頼が凍結依頼か否かチェックする。 15, computer management process, when receiving an operation request of the virtual server in step S1, the operation request in step S2 it is checked whether the freeze request.

凍結依頼であった場合にはステップS3に進み、依頼先の仮想サーバ36が稼働中か否かチェックし、稼働中であった場合にはステップS4に進み、図5の仮想サーバ管理テーブル34から依頼先の仮想サーバを管理する実サーバを検索する。 Step S3 in the case was frozen request, the virtual server 36 of the request destination is checked whether in operation, in the case was in operation proceeds to step S4, the virtual server management table 34 of FIG. 5 Search the real server that manages the requested virtual server.

次にステップS5で、検索した実サーバ16の仮想サーバ制御部38に凍結をコマンド送信により指示して仮想サーバ36を凍結させる。 In step S5, to freeze the virtual server 36 instructs the transmission command freeze to the virtual server control unit 38 of the real server 16 to search. 次にステップS6で、図4の分散制御テーブル32及び図5の仮想サーバ管理テーブル34における依頼先の仮想サーバの状態を「凍結」に変更する。 In step S6, it changes the state of the virtual server request receiving in the virtual server management table 34 of the distributed control table 32 and 5 of FIG. 4 to "freeze". なおステップS3で凍結依頼を受けたにも関わらず仮想サーバが稼動中でなかった場合には、ステップS7で操作不可エラーメッセージを出力して処理を終了する。 Incidentally virtual servers despite receiving the freeze request in step S3 is when not in operation terminates the output and processing operations inability error message in step S7.

一方、ステップS1で受け付けた仮想サーバの操作命令が再開依頼であった場合には、ステップS2からステップS8に進み、仮想サーバ36が凍結中か否かチェックし、凍結中であれば、ステップS9で仮想サーバ36を管理する実サーバ16の仮想サーバ制御部38に再開を指示するコマンドを送って、凍結状態にある仮想サーバ36を復元して稼動状態とする。 On the other hand, when the operation instruction of the virtual server accepted in step S1 is a resume request, the process proceeds from step S2 to step S8, the virtual server 36 checks whether or not the freeze, if during freezing, step S9 in sending a command for instructing the restart the virtual server control unit 38 of the real server 16 that manages the virtual server 36, the operating state to restore the virtual server 36 in a frozen state. これにより一旦凍結された計算ジョブ42の実行が再開される。 Performing calculations job 42 thereby is once frozen is resumed.

次にステップS11で、図4の分散制御テーブル32及び図5の仮想サーバ管理テーブル34の状態を「稼動」に変更する。 In step S11, it changes the state of the virtual server management table 34 of the distributed control table 32 and 5 of FIG. 4 to "active". なおステップS8で再開依頼を受けたにも関わらず仮想サーバが凍結中でなかった場合には、ステップS12で操作不可エラーメッセージを出力して処理を終了する。 Incidentally virtual servers despite receiving the resume request in step S8 when not being frozen terminates the output and processing operations inability error message at step S12.

また計算機管理処理は、ジョブ管理部30からの問合せに対し、ジョブを依頼する計算機を検索して応答し、もし仮想計算機を検索した場合は、凍結時刻を同時に応答するが、図15は、この問合せに対する応答処理は省略している。 The computer management process, in response to the inquiry from the job management unit 30, in response to search the computer for requesting a job, if a search for a virtual machine, which responds with the freezing time at the same time, FIG. 15, this response process to the inquiry is omitted.

図16は図2の実サーバ16上に構築される仮想サーバ36のジョブ制御部40によるジョブ制御処理のフローチャートである。 Figure 16 is a flowchart of the job control processing by the job control unit 40 of the virtual server 36 which is built on the real server 16 of FIG. 図16のジョブ制御処理にあっては、ステップS1で管理サーバ10のジョブ管理部28からジョブの実行依頼を受け付け、計算ジョブ42をステップS2で起動し、ステップS3でジョブ状態を稼動中に設定する。 In the job control processing of FIG. 16 receives a job execution request from the job management unit 28 of the management server 10 in step S1, activates the computing job 42 in step S2, sets the job state during operation in the step S3 to.

続いてステップS4で非同期ジョブ終了待ち合せ処理を実行する。 Then perform asynchronous job end waiting process in step S4. この非同期ジョブ終了待ち合せ処理は、図17に示すように、ステップS1でジョブプロセス終了検知の有無をチェックし、終了を検知すると、ステップS2でジョブ状態を「実行終了」に設定し、ステップS3で図13のジョブ制御処理のメインルーチンに実行終了を返信する。 This asynchronous job termination waiting process, as shown in FIG. 17, checks for job process ends detected in step S1, when detecting the completion, set the job status to "execution ended" in step S2, in step S3 It returns an execution completion to the main routine of job control processing of FIG. 13.

続いて図16のステップS5で管理サーバ10のジョブ管理部28から状態の問合せがあるか否かチェックし、状態問合せがあった場合には、ステップS6でジョブ状態は稼動中か否かチェックし、稼動中であれば、ステップS7でジョブ実行中を返信する。 Then check whether there is a status inquiry from the job management unit 28 of the management server 10 in step S5 in FIG. 16, if there is a status inquiry, the job status is checked whether running in step S6 , if running, and returns the job executed in step S7. 一方、ステップS6でジョブ状態が「停止」であった場合には、ステップS8で実行終了を管理サーバ10のジョブ管理部28に返信する。 On the other hand, if the job status is "stopped" in the step S6, and returns an execution completion to the job management unit 28 of the management server 10 in step S8.

図18は図2の実サーバ16に設けた仮想サーバ制御部38による仮想サーバ制御処理のフローチャートである。 Figure 18 is a flowchart of the virtual server control process by the virtual server control unit 38 provided on the real server 16 of FIG. 図18において、仮想サーバ制御処理にあっては、ステップS1で管理サーバ10の計算機管理部30から仮想サーバ36の操作依頼を受け付け、ステップS2で操作依頼が凍結依頼であることを判別すると、ステップS3で仮想サーバ36にコマンドにより凍結を依頼し、仮想サーバ36を凍結する。 18, in the virtual server control process receives an operation request of the virtual server 36 from the computer management unit 30 of the management server 10 in step S1, when the operation request in step S2 it is determined that the freeze request, step freezing the command to the virtual server 36 and request in S3, freeze the virtual server 36.

一方、ステップS1で受け付けた操作依頼が仮想サーバの再開依頼であった場合には、ステップS2からステップS4に進み、仮想サーバ36にコマンドによって再開を依頼し、凍結中の仮想サーバ36を復元して稼動することで、凍結中のジョブの実行を再開する。 On the other hand, when the operation request accepted in step S1 is a resumption request of the virtual server, the process proceeds from step S2 to step S4, and request to resume the command to the virtual server 36 restores the virtual server 36 during freezing by running Te, resume the execution of the job of being frozen.

ステップS3またはステップS4の処理が済むと、ステップS5で処理結果を管理サーバ10の計算機管理部30に返信し、分散制御テーブル32及び仮想サーバ管理テーブル34における状態を「凍結」または「再開」に変更させる。 Upon completion of the processing of step S3 or S4, and back to the computer management unit 30 of the processing result management server 10 in step S5, the state in the distributed control table 32 and the virtual server management table 34 to "freeze" or "resume" to change.

また本実施形態は図2の管理サーバ10で実行されるサーバ管理プログラムを提供するものであり、このサーバ管理プログラムは図12〜図18のフローチャートに示した内容を持つことになる。 In the first embodiment there is provided a server management program that is executed by the management server 10 of FIG. 2, the server management program will have the content shown in the flowchart of FIGS. 12 to 18.

また本実施形態は、管理サーバ10を構成するコンピュータで可読なサーバ管理プログラムを格納した記憶媒体を提供する。 The present embodiment provides a storage medium storing a readable server management program on the computer that constitutes the management server 10. この記憶媒体は、CD−ROM、フロッピィ(R)ディスク、DVDディスク、光磁気ディスク、ICカードなどの可搬型記憶媒体や、コンピュータシステムの内外に備えられたハードディスクドライブなどの記憶装置の他、回線を介してプログラムを保持するデータベース、あるいは他のコンピュータシステム並びにそのデータベースや、更に回線上の伝送媒体を含むものである。 The storage medium, CD-ROM, floppy (R) disk, DVD disk, a magneto-optical disk, or a portable storage medium such as an IC card, other storage devices such as hard disk drives provided inside or outside the computer system, the line database holds the program via the or or another computer system and its database,, and further a transmission medium on a line.

なお上記の実施形態はコンピューティンググリッド環境の仮想サーバに対するサーバ管理を例に取るものであったが、これ以外の適宜の仮想サーバを使用したコンピュータシステムにつき、そのまま適用することができる。 Note The above embodiments have been intended to take as an example the server management for the virtual server computing grid environment, every computer system using other appropriate virtual server, it is possible to directly apply.

また本発明は、その目的と利点を損なうことのない適宜の変形を含み、更に上記の実施形態で示した数値による限定は受けない。 The present invention includes arbitrary modifications that do not impair the object and advantages thereof and is limited by the numerical values ​​shown in the above embodiments is not subjected.

Claims (2)

  1. 処理の割当対象である実サーバ上に構築された仮想サーバに対応する凍結時刻に基づいて、 凍結可でない処理については前記仮想サーバを前記割当対象から除外する指示を行う指示部と、 Based on the freezing time corresponding to the virtual server built on a real server, which is a process assignment target, an instruction unit for processing non-freeze-friendly it is for instructing to exclude the virtual server from the assigned target,
    処理の凍結可否情報に基づいて、受け付けた処理依頼が凍結可でないと判定された場合に、該処理依頼の終了予定時刻が、前記仮想サーバについて設定された凍結時刻を越えるか否かの判定を行う判定部と、 Based on the freezing availability information processing, when the processing request accepted is determined not to be frozen friendly, scheduled end time of the processing request is determined whether it exceeds freezing time set for the virtual server a determination unit that performs,
    凍結可でないと判定された処理依頼については、前記判定の結果、前記終了予定時刻が前記凍結時刻を越えない場合に、前記仮想サーバに前記処理依頼を送信し、処理の凍結可否情報に基づいて、受け付けた処理依頼が凍結可であると判定された処理依頼については、処理の途中で凍結され、再開される仮想サーバも処理依頼の送信対象として許容する送信部と、 For the determined processing request is not the freezing friendly, the result of the determination, if the scheduled end time does not exceed the freezing time, and sends the processing request to the virtual server, on the basis of the freezing availability information processing for the processing request processing request accepted is determined to be in the frozen-friendly, frozen in the course of processing, a transmission unit for acceptable transmission target also processing request virtual server is restarted,
    を含むことを特徴とする管理装置。 Management apparatus which comprises a.
  2. 処理の割当対象である実サーバ上に構築された仮想サーバに対応する凍結時刻に基づいて、 凍結可でない処理については前記仮想サーバを前記割当対象から除外する指示を行う指示ステップと、 Based on the freezing time corresponding to the virtual server built on a real server, which is a process assignment target, the instruction step for instructing to exclude the virtual server from the assigned target for treatment not freeze-friendly,
    処理の凍結可否情報に基づいて、受け付けた処理依頼が凍結可でないと判定された場合に、該処理依頼の終了予定時刻が、前記仮想サーバについて設定された凍結時刻を越えるか否かの判定を行う判定ステップと、 Based on the freezing availability information processing, when the processing request accepted is determined not to be frozen friendly, scheduled end time of the processing request is determined whether it exceeds freezing time set for the virtual server a determination step of performing,
    凍結可でないと判定された処理依頼については、前記判定の結果、前記終了予定時刻が前記凍結時刻を越えない場合に、前記仮想サーバに前記処理依頼を送信し、処理の凍結可否情報に基づいて、受け付けた処理依頼が凍結可であると判定された処理依頼については、処理の途中で凍結され、再開される仮想サーバも処理依頼の送信対象として許容する送信ステップと、 For the determined processing request is not the freezing friendly, the result of the determination, if the scheduled end time does not exceed the freezing time, and sends the processing request to the virtual server, on the basis of the freezing availability information processing for the processing request processing request accepted is determined to be in the frozen-friendly, frozen in the course of processing, a transmission step of acceptable transmission target also processing request virtual server is restarted,
    を備えたことを特徴とする管理方法。 Management method characterized by comprising a.
JP2008506081A 2006-03-17 2006-03-17 Server management method, program and apparatus Active JP4700104B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/305373 WO2007108065A1 (en) 2006-03-17 2006-03-17 Server management method, program, and device

Publications (2)

Publication Number Publication Date
JPWO2007108065A1 true JPWO2007108065A1 (en) 2009-07-30
JP4700104B2 true JP4700104B2 (en) 2011-06-15

Family

ID=38522106

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008506081A Active JP4700104B2 (en) 2006-03-17 2006-03-17 Server management method, program and apparatus

Country Status (2)

Country Link
JP (1) JP4700104B2 (en)
WO (1) WO2007108065A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5359401B2 (en) * 2009-03-11 2013-12-04 富士通株式会社 Program, computer and control method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07254918A (en) * 1994-03-16 1995-10-03 Fujitsu Ltd Modem monitor
JP2004302741A (en) * 2003-03-31 2004-10-28 Fujitsu Ltd Method for providing resource of system using grid computing, surveillance device for system, program therefor, and program for resource providing terminal of system
JP2005250597A (en) * 2004-03-01 2005-09-15 Toyota Motor Corp Program and computer

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07254918A (en) * 1994-03-16 1995-10-03 Fujitsu Ltd Modem monitor
JP2004302741A (en) * 2003-03-31 2004-10-28 Fujitsu Ltd Method for providing resource of system using grid computing, surveillance device for system, program therefor, and program for resource providing terminal of system
JP2005250597A (en) * 2004-03-01 2005-09-15 Toyota Motor Corp Program and computer

Also Published As

Publication number Publication date Type
JPWO2007108065A1 (en) 2009-07-30 application
WO2007108065A1 (en) 2007-09-27 application

Similar Documents

Publication Publication Date Title
US4435755A (en) Balanced channel finding method
US6802062B1 (en) System with virtual machine movable between virtual machine systems and control method
US6754736B1 (en) Information processing apparatus, data inputting/outputting method, and program storage medium therefor
US20030084213A1 (en) Low overhead I/O interrupt
US20060085794A1 (en) Information processing system, information processing method, and program
US20040193969A1 (en) Method and apparatus for managing faults in storage system having job management function
US6880021B2 (en) Intelligent interrupt with hypervisor collaboration
US20090307436A1 (en) Hypervisor Page Fault Processing in a Shared Memory Partition Data Processing System
Vadhiyar et al. A performance oriented migration framework for the grid
US20050050271A1 (en) Virtualization controller, access path control method and computer system
US8418181B1 (en) Managing program execution based on data storage location
US8321558B1 (en) Dynamically monitoring and modifying distributed execution of programs
US8296419B1 (en) Dynamically modifying a cluster of computing nodes used for distributed execution of a program
US7203700B1 (en) Online instance addition and deletion in a multi-instance computer system
US20100268790A1 (en) Complex Remote Update Programming Idiom Accelerator
US5974462A (en) Method and apparatus for controlling the number of servers in a client/server system
US20080229320A1 (en) Method, an apparatus and a system for controlling of parallel execution of services
US20080313641A1 (en) Computer system, method and program for managing volumes of storage system
US6178421B1 (en) Method of performing parallel cleanup of segments of a lock structure
US20080295095A1 (en) Method of monitoring performance of virtual computer and apparatus using the method
US6233644B1 (en) System of performing parallel cleanup of segments of a lock structure located within a coupling facility
US20020162049A1 (en) Method for correcting a program running on computer system
US8082315B2 (en) Programming idiom accelerator for remote update
US8719415B1 (en) Use of temporarily available computing nodes for dynamic scaling of a cluster
US20060130062A1 (en) Scheduling threads in a multi-threaded computer

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100615

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100816

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100816

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100816

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100816

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100816

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100907

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100907

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100907

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100907

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101021

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101021

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101021

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110117

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110117

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110117

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110208

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110303