WO2007108065A1 - サーバ管理方法、プログラム及び装置 - Google Patents

サーバ管理方法、プログラム及び装置 Download PDF

Info

Publication number
WO2007108065A1
WO2007108065A1 PCT/JP2006/305373 JP2006305373W WO2007108065A1 WO 2007108065 A1 WO2007108065 A1 WO 2007108065A1 JP 2006305373 W JP2006305373 W JP 2006305373W WO 2007108065 A1 WO2007108065 A1 WO 2007108065A1
Authority
WO
WIPO (PCT)
Prior art keywords
server
job
virtual server
time
virtual
Prior art date
Application number
PCT/JP2006/305373
Other languages
English (en)
French (fr)
Inventor
Kiyoshi Kouge
Original Assignee
Fujitsu Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Limited filed Critical Fujitsu Limited
Priority to JP2008506081A priority Critical patent/JP4700104B2/ja
Priority to PCT/JP2006/305373 priority patent/WO2007108065A1/ja
Publication of WO2007108065A1 publication Critical patent/WO2007108065A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5013Request control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/504Resource capping
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Definitions

  • the present invention relates to a server management method, program, and apparatus for managing a virtual server built on a real server, and in particular, jobs such as various simulation calculations in a computing grid environment to a plurality of virtual servers.
  • the present invention relates to a server management method, program, and apparatus for controlling stop and restart of virtual servers when distributedly executed.
  • a simulation calculation system based on a computing grid environment allocates a calculation job to an optimal computer resource and efficiently uses the distributed computer resource.
  • computer resources may not be occupied resources for simulation calculation jobs, and computer resources may be used for other purposes, and it is necessary to lend and borrow computer resources. .
  • Checkpoint 'Restart function is a job management control device that manages jobs and a computer Precedence cooperates to save regularly how far the calculation processing in the application has progressed, temporarily stop the calculation job, and try to use computer resources for other purposes.
  • Patent Document 1 JP 2005-208919 A
  • Patent Document 2 JP 2005-196561
  • the checkpoint 'restart function when using computer resources for other purposes, if you want to perform an operation that restarts the server with another OS, the checkpoint 'restart function cannot be used. The reason for this is that the checkpoint 'restart function requires logic to take a checkpoint on the application side in order to take a checkpoint. In addition, resources that store checkpoint information are managed on a job-by-job basis and managed under the job management control device.
  • the simulation time is calculated by using the free time of computer resources used in other business.
  • computer resources are allocated to computing jobs, when using computer resources only at night and on holidays, manually switching dozens or hundreds of computer resources increases the operating cost, so an external schedule function, etc. Automated operation is performed by time management using.
  • the present invention allows a virtual server built on a real server to execute a calculation job, and allows the job to be stopped and restarted at any timing without depending on the application or OS, and at the same time, It is an object of the present invention to provide a server management method, program, and apparatus that does not allow a job execution when using computer resources to wait for a long time due to interruption of resource use!
  • the present invention provides a server management method.
  • the present invention relates to a server management method for managing a virtual server built on a real server by a management server.
  • a computer planning step for managing computer plan information including the freezing time and resuming time of the virtual server, instructing freezing when the current time reaches the freezing time, and instructing resuming when the current time reaches the resuming time; ,
  • the execution end time of the job for which the job management information power was obtained is compared with the freezing time of the virtual server. If is before the freeze time, the job control unit of the determined virtual server is requested to execute the job, and if the execution end time is past the freeze time, the virtual server whose execution end time is before the freeze time Job execution request step that repeats the process of determining When the virtual server freeze instruction is received, it is determined that the requested virtual server is in operation, and the freeze instruction is sent to the virtual server control unit of the real server that constructs the virtual server.
  • a virtual server restart instruction When a virtual server restart instruction is received, it is determined that the requested virtual server is in a frozen state, and the restart instruction is sent to the virtual server control unit of the real server that constructs the virtual server.
  • the job management information includes a job identifier, freezing availability information indicating whether or not the job can be frozen, and an expected execution time when the job cannot be frozen.
  • the job execution request step is a job whose execution end time is earlier than the freezing time when the extracted job cannot be frozen and the execution end time obtained from the expected execution time passes the freeze time! Repeat the process of determining the virtual server to be requested.
  • the server management information is
  • Server name or network address for job execution type of real server or virtual server, status of each server's operation, stop or freeze, distribution control information including the number of jobs executed by each server,
  • Virtual server management information including correspondence between real servers and virtual servers, virtual server operation, stop or freeze status, list of jobs being executed for each virtual server,
  • the job execution request step refers to the distributed control information and searches for a virtual server with the smallest number of execution jobs as a job request destination from a plurality of virtual servers in an operating state.
  • the freezing step and the resuming step search for the status of the virtual server management information virtual server and the real server constructing the virtual server, and issue a freezing instruction or a resuming instruction.
  • the job execution request step detects an abnormality due to a communication interruption with a virtual server built on a real server
  • the job execution request step refers to the server management information and recognizes the frozen state of the server. It is judged normal and the anomaly detection is discarded.
  • the job reception step a job in a computing environment is received and a plurality of virtual servers are requested to execute the job.
  • the present invention provides a server management program.
  • the present invention provides a computer of a server management apparatus that manages a virtual server constructed on a real server.
  • a computer planning step for managing computer plan information including the freezing time and resuming time of the virtual server, instructing freezing when the current time reaches the freezing time, and instructing resuming when the current time reaches the resuming time; ,
  • the execution end time of the job for which the job management information power was obtained is compared with the freezing time of the virtual server. If is before the freeze time, the job control unit of the determined virtual server is requested to execute the job, and if the execution end time is past the freeze time, the virtual server whose execution end time is before the freeze time Job execution request step that repeats the process of determining
  • the freeze instruction is sent to the virtual server control unit of the real server that constructs the virtual server.
  • a freezing step for freezing the virtual server is sent to the virtual server control unit of the real server that constructs the virtual server.
  • a virtual server restart instruction When a virtual server restart instruction is received, it is determined that the requested virtual server is in a frozen state, and the restart instruction is sent to the virtual server control unit of the real server that constructs the virtual server.
  • the present invention provides a server management apparatus.
  • the present invention relates to a server management apparatus for managing a virtual server constructed on a real server, and a computer for managing computer plan information including a freeze time and a resume time of the virtual server. Planning department,
  • a job management unit that manages a job control unit provided in the virtual server; a computer management unit that manages a virtual server control unit of a physical server that constructs the virtual server;
  • a plan instructing unit for instructing the computer management unit to freeze when the current time reaches the freezing time, and instructing the computer management unit to resume when the current time reaches the resumption time
  • a job reception unit that receives job requests and stores them in a queue
  • the job execution end time obtained for job management information is compared with the virtual server freeze time. If the execution end time is earlier than the freezing time, the job control unit of the determined virtual server is requested to execute the job. If the execution end time is past the freezing time, the computer management unit is again queried to execute the execution end time.
  • a job execution request unit that repeats the process of determining a virtual server before the freezing time
  • a job collection unit that collects the completed job by requesting the job control unit of the virtual server when it recognizes the job termination of the virtual server;
  • a request destination search unit that searches the real server and virtual server of the job request destination and responds with the freeze time obtained by the computer plan information power of the plan instruction unit;
  • the freeze instruction is sent to the virtual server control unit of the real server that constructs the virtual server.
  • a freezing unit that freezes the virtual server that is executing the job
  • a virtual server restart instruction When a virtual server restart instruction is received, it is determined that the requested virtual server is in a frozen state, and the restart instruction is sent to the virtual server control unit of the real server that constructs the virtual server.
  • a resuming unit that causes the virtual server to resume job execution;
  • the requested job when requesting job execution to a virtual server, if the requested job cannot be frozen, refer to the computer plan information and request the requested virtual server from now on. Determine whether the planned job is frozen before the job ends, and if it is planned to freeze before the job ends, search for other virtual servers with a plan to freeze after the job ends Request a job, and this will allow the job to finish in a short time.
  • executing on a virtual server that has a plan to freeze it is possible to avoid the problem that job execution results cannot be obtained without waiting for a long time.
  • any application such as a commercially available application that does not implement the checkpoint 'restart function, can be temporarily frozen at any timing by executing a calculation job on the virtual server. You can resume at.
  • FIG. 1 is an explanatory diagram of a computing grid environment to which the present invention is applied.
  • FIG. 3 is an explanatory diagram of the logical architecture of the virtual server in this embodiment.
  • FIG. 6 is an explanatory diagram of the distributed control table of FIG.
  • FIG. 7 Explanatory diagram of the virtual server management table of FIG.
  • FIG. 8 Explanatory diagram of processing functions for freezing and resuming a virtual server in this embodiment
  • FIG. 9 A description of the hardware environment of a computer to which the management server of this embodiment is applied.
  • FIG. 10 Time chart of server management processing of this embodiment
  • FIG. 11 Time chart of the server management process of this embodiment following FIG.
  • FIG. 12 is a flowchart of job management processing in the management server in FIG.
  • FIG. 13 Flow chart of asynchronous job end waiting process in step 6 of FIG.
  • FIG. 14 is a flowchart of computer planning processing in the virtual server of FIG.
  • FIG. 15 is a flowchart of computer management processing in the management server of FIG.
  • FIG. 16 is a flowchart of job control processing in the virtual server of FIG.
  • FIG. 18 is a flowchart of virtual server control processing in the real server of FIG.
  • FIG. 1 is an explanatory diagram of a computing grid environment to which the present invention is applied.
  • the management server 10 of the present embodiment is connected to a network 12, and a computer group 14 for requesting a simulation calculation job or the like to the network 12 is used as a real server 16-1 to 16 in this embodiment.
  • — 39 is connected.
  • a simulation calculation job is submitted 20 to the management server 10 by the operation of the operator 18-1, and the real server 16-1 included in the computer group 14 is managed by the management server 10.
  • ⁇ 16- Request a job from any of 39 and execute it.
  • the operator 18-2 can issue a freeze / resume instruction 22 to the virtual server for the job being executed to the management server 10.
  • the external scheduler 24 is provided with a definition file 26 that is used to create a computer plan.
  • the management server 16 can manage the real servers 16-1 to 16-39 of the computer group 14. Create and manage a computer plan table that includes the freezing time and resumption time of the virtual server built in
  • FIG. 2 is a block diagram of a functional configuration showing a management server and a virtual server constructed on a real server in the present embodiment.
  • a case where one real server 16 is arranged with respect to the management server 10 is taken as an example in order to simplify the description.
  • the management server 10 is provided with a job management unit 28, a computer management unit 30, a distributed control table 32, a virtual server management table 34, a job management table 44, a computer planning unit 46, and a computer plan table 48.
  • the virtual server 36 and the virtual server control unit 38 are provided in the real server 16, and the job control unit 40 and the calculation job 42 are provided in the virtual server 36.
  • each function in the management server 10 and the real server 16 is a function realized by execution of a program by a computer.
  • the job management unit 28 of the management server 10 includes a job reception unit 28-1, a job execution requesting unit 28-2, and a job collection unit 28-3.
  • the job reception unit 28-1 receives the job request from the operator 18-2 or the job input 20 from the external scheduler 24 as shown in FIG. 1, and stores it in the built-in queue.
  • the job execution requesting unit 28-2 takes out the job of the queue power, and requests the job control unit 40 of the virtual server 36 determined by requesting the computer management unit 30 to execute the job. Furthermore, when the job execution requesting unit 28-2 makes an inquiry to the computer management unit 30 to determine a virtual server to request job execution and the job to be requested cannot be frozen, the job execution end time and If the execution end time is earlier than the freeze time, the job control unit 36 of the determined virtual server 16 is requested to execute the job, and the execution end time has passed the freeze time. In this case, the computer management unit is re-inquired and the process of determining a virtual server whose execution end time is before the freezing time is repeated.
  • the job management table 44 includes a job identifier, whether the job can be frozen or not frozen. Freezing availability information indicating whether or not the job can be frozen is registered, and the job execution requesting unit 30 adds the estimated execution time acquired from the job management table 44 to the current time and finishes execution. The time is obtained and compared with the freezing time of the requested virtual server 16 obtained from the computer management unit 30 side.
  • the job collection unit 28-1 When the job collection unit 28-1 recognizes the job end of the virtual server 36, the job collection unit 28-1 requests the job control unit 40 to collect the completed job.
  • the computer management unit 30 is provided with a request destination search unit 30-1, a freezing processing unit 30-2, and a resumption processing unit 30-3.
  • the request destination search unit 30—1 searches the real server 16 and virtual server 36 of the job request destination and obtains them from the computer plan table 48 of the computer plan unit 46. Respond with freezing time.
  • FIG. 2 there is only one real server 16 and one virtual server 36 built on the real server 16. In fact, as shown in FIG. There are a plurality of real servers as shown in the computer group 14, and there may be a plurality of virtual servers 36 built on the real server 16.
  • the freeze processing unit 30-2 receives a request for freezing the virtual server 36 from the external operation request 22 or the computer planning unit 46, the requested virtual server 36 executes the calculation job 42. And a freeze instruction is transmitted to the virtual server control unit 38 of the real server 16 that constructs the virtual server 36, and the virtual server 36 that is executing the job by the calculation job 42 is frozen.
  • the restart processing unit 30-3 When the restart processing unit 30-3 receives a request for restarting the virtual server 36 from the external operation request 22 or the computer planning unit 46, the restart processing unit 30-3 determines that the requested virtual server 36 is in a frozen state. Separately, a restart instruction is transmitted to the virtual server control unit 38 of the real server 16 constructing the virtual server 36, and the execution of the calculation job 42 is restarted by the frozen virtual server 36.
  • the computer planning unit 46 is provided with a plan creation unit 46-1 and a plan instruction unit 46-2.
  • the plan creation unit 46-1 reads the definition file 26 of the external scheduler 24 shown in FIG. 1 and creates a computer plan table 48 including the freezing time and resumption time of the virtual server.
  • the plan instructing unit 4 6— 2 compares the freezing time and the restart time in the computer plan table 48 with the current time. When the current time reaches the freezing time, it instructs the computer management unit 30 to freeze the current time. When the computer reaches the restart time, the computer management unit 30 is instructed to restart.
  • the job control unit 40 of the virtual server 36 constructed in the real server 16 receives a job execution request from the job management unit 28 of the management server 10, executes the calculation job 42 by the application, and calculates the calculation job 42.
  • the job management unit 28 is notified of the end of execution.
  • the job management unit 28 requests collection of the completed job, and upon receiving the request, the job control unit 40 edits the completed job.
  • the virtual server control unit 38 provided in the real server 16 in which the management server 36 is constructed receives the operation request from the computer management unit 30 of the management server 10 and controls the virtual server 36.
  • the virtual server 36 is frozen when the freezing instruction is accepted, and then the virtual server 36 is being frozen.
  • the restart instruction is received, the frozen virtual server 36 is restored and the calculation job 42 is executed.
  • the job management unit 28 detects an abnormality due to the interruption of communication with the virtual server 36, it determines that this is not an abnormality and that the virtual server is in a frozen state. Unnecessary processing such as abnormally terminating the job or requesting another computer to re-execute the abnormally terminated job can be avoided.
  • FIG. 3 is an explanatory diagram of the logical architecture of the virtual server in the present embodiment.
  • hardware 52 is constructed on a computer 50 corresponding to a real server, and an OS 54 such as Windows (R) operates using the hardware 52 as a board.
  • OS 54 such as Windows (R) operates using the hardware 52 as a board.
  • a virtual platform 56 is constructed on the OS 54, and for example, virtual OSs 58-1 and 58-2 operate on the virtual platform 56, and applications can be executed individually.
  • Examples of such virtual platform 56 and virtual OS 58-1, 58-2 include server virtualization products such as VMware (R) and Microsoft (R) 'Virtual Server 2005 Can be implemented.
  • FIG. 4 is an explanatory diagram of the distributed control table 32 provided in the management server 10 of FIG.
  • the distributed control table 32 registers computer name 60, computer type 62, status 64, job multiplicity 66, and number of jobs 68.
  • As the computer name 60 register the host name or IP address of the computer that executes the job.
  • the computer type 62 is a real server or a virtual server.
  • Status 64 is the status of the real server or virtual server. This status has two statuses, “active” and “stopped” for real servers, and “active” and “virtual” for virtual servers. There are three states: “Stopped” or “Freeze”.
  • the status 64 of the real server and the virtual server in the distributed control table 32 is monitored based on the heartbeat of each computer.
  • the state “operating” is a state in which it is confirmed that the computer is operating normally by the heartbeat of the computer.
  • the status “stopped” is a state in which the heartbeat of the computer has failed and it cannot be confirmed that it is running.
  • “freezing”, which is a state unique to the virtual server of this embodiment, is a state in which the virtual server is frozen in response to a freezing instruction.
  • the heart beat is HYPERLINK ⁇ http: ⁇ e—words.jp/w/E3838DE 38383E38388E383AFE383BCE382AF.html "On the network, HYPERLINK ⁇ http: / /e-words.jp/w/ E382B3E383B3E38394E383A5E383BCE382BF.html "To send a signal or packet to inform the outside that the computer or network device is operating normally at regular intervals.
  • the job multiplicity 66 of the distributed control table 32 is an upper limit value of the number of jobs that can be requested to each computer. Furthermore, the number of jobs 68 is the number of jobs currently being processed in each computer, and in the case of a computer whose state is “frozen”, it indicates the number of jobs in a frozen state.
  • the distributed control table 32 is referred to by the request destination search unit 30-1 of the computer management unit 30 when the job management unit 28 of FIG. “!” Is selected as a request destination candidate, and when multiple candidates are selected, for example, the computer having the minimum number of jobs is determined as the request destination. Of course, in this case, the computer whose status is “Stopped” or “Freezing” is excluded.
  • FIG. 5 is an explanatory diagram of the virtual server management table 34 provided in the management server 10 of FIG.
  • the virtual server management table 34 includes a real server name 70, a virtual server name 72, a status 74 of each virtual server, and a job list 76 of each virtual server.
  • the real server name 70 is the host name or IP address of the real computer.
  • Virtual server name 72 is the host name or IP address of the virtual server that is started and running on the real server.
  • the correspondence between the real server and the virtual server can be understood.
  • the actual sano name 70 two virtual servers having the sano names “v—host01” and “v—host02” are constructed on the actual sano “r-host01”.
  • the state 74 is the state of each virtual server, which is “active”, “stopped”, or “frozen”, and has the same contents as the state of the distributed control table 32 in FIG.
  • the job list 76 a list of job numbers that are requested to be executed by each virtual server is registered.
  • FIG. 6 is an explanatory diagram of the job management table 44 provided for the job management unit 28 of FIG.
  • the job management table 44 registers a job ID 78, freeze availability 80, expected execution time 82, and other job information 84.
  • the job ID 78 is an identifier of the requested job.
  • Freeze availability 80 indicates whether or not the virtual server can be frozen during execution, and V and jobs that can be frozen during execution are set to “possible”. It must be frozen during execution! The job is set to “Not possible”.
  • the estimated execution time 82 is set for a job in which the freeze availability 80 is set to “impossible”, and the execution end time of the job can be obtained by adding the expected execution time to the current time.
  • FIG. 7 is an explanatory diagram of the computer plan table 48 generated by the computer plan unit 46 of FIG.
  • a computer name 86 a freezing time 88, and a restart time 90 are registered.
  • the host name or IP address of the virtual machine to be frozen and resumed is registered.
  • Freezing time 88 and resuming time 90 are created from definition file 26 in Fig. 1, and each virtual server is used for simulation calculation with a planned time zone from night to morning . Based on this time plan table 48, the computer planning unit 46 requests the computer management unit 30 to freeze and restart the virtual computer.
  • FIG. 8 is an explanatory diagram of the virtual server freezing and resuming processing function in the present embodiment.
  • the physical server 16 is provided with a physical volume 92 and various devices 94 as hardware.
  • the virtual platform 56 is constructed, and the virtual platform Virtual server 36 is running on 56.
  • a virtual memory 96, a virtual volume 98, and a virtual device 100 are configured using the computer resources of the real server 16, and these virtual computer resources are used and are shown in FIG.
  • one or a plurality of virtual OSs 58-1, 58-2 are executed, and a calculation job as an application is executed on these OSs.
  • the virtual platform 56 freezes the entire virtual server 36 106.
  • the vmxf file 110 is stored in the physical volume 92, and the job being executed is stopped and frozen.
  • the freeze instruction 102 and the resume instruction 104 for the virtual platform 56 are commands issued from the computer management unit 30 in FIG. 2.
  • the freeze instruction 102 is, for example, the command “vmrun suspend file name”, and the resume instruction 104 Is the command "vmrun start file name”.
  • the freeze command is an instruction to save all information of the virtual server 36 in a dedicated control file called the vmxf file 110 of the physical volume 92.
  • the resume command is a command for restoring the state of the virtual server 36 based on information stored in the control file specified by the command, for example, the vmxf file 110.
  • FIG. 9 illustrates the hardware environment of a computer to which the management server of this embodiment is applied. It is a clear diagram.
  • a RAM 116, a ROM 118, a hard disk drive 120, a keyboard 124, a mouse 126, a device interface 122 for connecting a display 128, and a network adapter 130 are connected to a node 114 of the CPU 112.
  • the hard disk drive 120 stores the server management program of the present embodiment, and the server management program is read to the RAMI 16 following execution by reading and expanding the OS into the RAM 116 after booting by computer startup. This is executed by the CPU 112.
  • FIG. 10 and FIG. 11 are time charts of the server management process of the present embodiment.
  • the job management unit 28 of the management server 10 accepts an external job request 132 in step S1, it performs queuing to store the accepted job in the queue.
  • step S2 the accepted job is extracted from the queue, and in step S3, the computer that requests execution is inquired of the computer management unit 30 and determined.
  • the computer management unit 30 receives an inquiry from the job management unit 28, in step S101, the computer management unit 30 refers to the distributed control table 32 in FIG. 4 and searches for a computer whose status 58 is “active” as a request destination candidate. When multiple candidates are found, the computer with the smallest number of jobs 62 is returned as the request destination.
  • the virtual server 36 when the virtual server 36 is searched as a request destination, the virtual server 36 that is determined as the request destination is referred to the virtual server management table 34 in FIG. Get a name and respond.
  • the computer management unit 30 accesses the computer planning unit 46 to acquire and respond to the freeze time when the candidate computer is a virtual server.
  • the freezing time obtained in response to the inquiry to the computer management unit 30 is compared with the execution end time, (Execution end time) ⁇ (Freezing time)
  • the job request to the server in step S4 is to request the job by specifying, for example, the IP address of the real server 16 that has constructed the virtual server 36, and the IP address of the virtual server 36 in the job request.
  • a job can be requested to the job control unit 40 of the virtual server 36.
  • the job control unit 40 of the virtual server 36 receives a job request from the job management unit 28 of the management server 10 and causes the computer job to execute the job as in step S401.
  • the job execution ends before the freezing time of the virtual server 36, and the job execution results are collected by the management server 10 and stored in a file.
  • a freeze request 13 4 is sent to the computer management unit 30 of the management server 10 during the job execution by the virtual server 36.
  • the virtual server freezing request is accepted.
  • the real server 16 managing the virtual server 36 is searched from the virtual server management table 34 in FIG. 5, and the real server 16 searched in step S104 is searched. Instructs the virtual server control unit 38 to freeze.
  • the virtual server control unit 38 of the real server 16 receives a freezing instruction from the computer management unit 30 in step S201, and freezes the virtual server 36 by performing a freezing operation in step S302. Freezing completion notification power due to freezing of the virtual server
  • a freezing completion response is sent to the management server 10 in step S202. This is done for Science Department 30.
  • the computer management unit 30 changes the status of the corresponding virtual server in the distributed control table 32 of FIG. 4 and the virtual server management table 34 of FIG. Change to "Freeze".
  • steps S302 and S303 in FIG. 8 is shown as processing of the job control unit 40 for convenience of explanation, but actually it is freezing control of the virtual server 36 and freezing completion notification.
  • step S106 when a restart request 136 is made to the computer management unit 30 of the management server 10, this is accepted in step S106, and in step S107, by referring to the virtual server management unit 34 in FIG.
  • the real server 16 that manages the virtual server 36 is searched, and a restart instruction command is sent to the virtual server control unit 38 of the real server 16 in step S108.
  • the virtual server control unit 38 receives a restart instruction in step S203, and the virtual server 36 performs restart control in step S304, whereby the calculation job 42 enters the active state as in step S103. Job execution resumes.
  • a restart completion notification is sent to the virtual server control unit 38 in step S305, and a restart completion response is sent to the computer management unit 30 of the management server 10 in step S204.
  • the computer management unit 30 changes the status of the virtual server 36 to “active” in step S109.
  • the job control unit 40 notifies the job management unit 28 of the completion notification via the computer management unit 30 of the management server 10 in step S306. . Recognizing this job end notification, the job management unit 28 requests the job control unit 40 of the virtual server 36 to collect the job in step S5, and in response to this, the job control unit 40 collects the job and responds in step S307. In step S6, the job management unit 28 saves the collected job in a file.
  • FIG. 12 is a flowchart of job management processing by the job management unit 28 provided in the management server 10 of FIG.
  • the job management process accepts an external job request in step S1
  • the job accepted in step S2 is queued, then the job is taken out from the queue in step S3, and the computer is managed in step S4.
  • Contact department 30 to determine the computer to request execution.
  • the computer management unit 30 When a virtual server is searched as the requested computer, it responds with the real server that is building the virtual server and the freezing time of the virtual server.
  • step S5 it is determined whether or not the computer that requests the job has been determined. If it cannot be determined, the process returns to step S3 to determine the computer that requests the job by taking the next job from the queue. To do.
  • step S5 If the computer that requests the job is determined in step S5, the process proceeds to step S6 to determine whether or not it is a virtual sano. In the case of a virtual server, it is determined in step S7 whether or not the job can be frozen by referring to the job management table 44 in FIG. 6, and if it cannot be frozen, the process proceeds to step S8.
  • step S4 the process returns to step S4 to repeat the process of determining another computer as the request destination.
  • step S8 If the condition of step S8 is not met and the job ends before the freezing time, the process proceeds to step S9, the job control unit 40 of the determined virtual server 36 is requested, and the calculation job 42 The job execution is started.
  • step S10 asynchronous job completion waiting processing is executed.
  • This asynchronous job completion waiting process is executed by a subroutine as a signal handler as shown in FIG.
  • Asynchronous job end wait processing checks whether or not a job end notification has been received in step S1, and if a job end notification is received, after setting the job status in the job management unit 28 to "execution end" in step S2.
  • step S3 the end of execution is returned to the main routine of the job management process in FIG.
  • step S11 it is checked in step S11 whether or not the job is in an end state. Proceed to step S12 to check whether the requested virtual server is frozen.
  • step S13 If the requested virtual server is in a frozen state, the status is confirmed with the job control unit 40 of the requested virtual server 36 in step S13, and a waiting time of, for example, 2 minutes is met in step S14. Then, in step S6, the process returns to the asynchronous job end waiting process.
  • step S15 When the job is completed in such a virtual server job execution state and the job end state is determined in step S7, the process proceeds to step S15, and the requested job control unit 40 of the requested virtual server 36 is requested to collect the job. In step S16, the job is collected and saved in a file.
  • FIG. 14 is a flowchart of the computer plan processing by the computer plan processing unit 46 of FIG.
  • the definition file 26 is read from the external scheduler 24 of FIG. 1 in step S1, and the computer plan table 48 of FIG. 7 is created on the memory.
  • the process proceeds to step S2, and the computer planning table 48 is searched for the time at which the operation is first requested for the current time.
  • step S3 when it is determined that the time searched in step S3 is the freezing time, the type is set to "Freeze” in step S4, and if the freezing time does not come, the process proceeds to step S5 and the type is set to "Resume” .
  • step S7 the computer management unit 30 is instructed to freeze in step S8, and the type is If it does not freeze, the computer management unit 30 is instructed to resume in step S9.
  • steps S2 to S9 are repeated until a stop instruction is determined in step S10.
  • FIG. 15 is a flowchart of computer processing in the computer management unit 30 provided in the management server 10 of FIG.
  • the computer management process receives a virtual server operation request in step S1, it checks in step S2 whether the operation request is freezing request power.
  • step S3 it is checked whether or not the requested management server 36 is in operation. If it is in operation, the process proceeds to step S4, and the virtual server management in FIG. The physical server that manages the requested virtual server is searched from the physical table 34.
  • step S5 the virtual server control unit 38 of the searched real server 16 is instructed to freeze by command transmission, and the virtual server 36 is frozen.
  • step S6 the status of the requested virtual server in the distributed control table 32 in FIG. 4 and the virtual server management table 34 in FIG. 5 is changed to “frozen”. If the virtual server is not in operation even though a freezing request is received in step S3, an operation impossible error message is output in step S7 and the process is terminated.
  • step S2 when the virtual server operation command received in step S1 is a restart request In step S2, the process proceeds from step S2 to step S8 to check whether the virtual server 36 is frozen. If it is frozen, the virtual server control unit 38 of the real server 16 that manages the virtual server 36 is resumed in step S9. Is sent to restore the virtual server 36 in the frozen state to the operational state. As a result, the execution of the calculation job 42 once frozen is resumed.
  • step S 11 the statuses of the distributed control table 32 in FIG. 4 and the virtual server management table 34 in FIG. 5 are changed to “active”. If the virtual server is in a frozen state in spite of receiving a restart request in step S8, an operation impossible error message is output in step S12 and the process is terminated.
  • the computer management process responds to an inquiry from the job management unit 30 by searching for a computer that requests a job, and if a virtual computer is searched, the freeze time is responded simultaneously. In FIG. 15, the response process for this query is omitted.
  • FIG. 16 is a flowchart of job control processing by the job control unit 40 of the virtual server 36 constructed on the real server 16 of FIG.
  • a job execution request is received from the job management unit 28 of the management server 10 in step S1
  • the calculation job 42 is started in step S2
  • the job status is set to active in step S3. Set.
  • asynchronous job completion waiting processing is executed in step S4.
  • this asynchronous job completion waiting process checks whether or not a job process completion has been detected in step S1, and if the completion is detected, sets the job status to “execution completed” in step S2, In step S3, execution completion is returned to the main routine of the job control process in FIG.
  • step S5 in FIG. 16 it is checked whether there is a status inquiry from the job management unit 28 of the management server 10. If there is a status inquiry, is the job status active in step S6? If it is in operation, it returns a message indicating that the job is being executed in step S7. On the other hand, if the job status is “stopped” in step S6, an end of execution is returned to the job management unit 28 of the management server 10 in step S8.
  • FIG. 18 is a flowchart of virtual server control processing by the virtual server control unit 38 provided in the real server 16 of FIG.
  • the virtual server control process When an operation request for the virtual server 36 is received from the computer management unit 30 of the management server 10 using SI and it is determined in step S2 that the operation request is a freezing request, a command is sent to the virtual server 36 in step S3.
  • the virtual server 36 is frozen by requesting freezing.
  • step S1 if the operation request received in step S1 is a virtual server restart request, the process proceeds from step S2 to step S4, the virtual server 36 is requested to restart by a command, and the frozen virtual server 36 The job that has been frozen is resumed by restoring and operating.
  • step S3 or step S4 the processing result is returned to computer management unit 30 of management server 10 in step S5, and the statuses in distributed control table 32 and virtual server management table 34 are "frozen”. Or change to “Resume”.
  • the present embodiment provides a server management program executed by the management server 10 of FIG. 2, and this server management program has the contents shown in the flowcharts of FIGS.
  • the present embodiment provides a storage medium that stores a computer-readable server management program that constitutes the management server 10.
  • This storage medium can be a portable storage medium such as a CD-ROM, floppy (R) disk, DVD disk, magneto-optical disk, or IC card, or a storage device such as a hard disk drive provided inside or outside the computer system. It includes databases that hold programs via lines, or other computer systems and their databases, as well as transmission media on the lines.
  • the above embodiment is a force that takes server management for a virtual server in a computing grid environment as an example, and can be applied as it is to a computer system that uses other appropriate virtual servers.
  • the present invention includes appropriate modifications that do not impair the object and advantages thereof, and is not limited by the numerical values shown in the above embodiments.

Abstract

 実サーバ上に構築された仮想サーバを管理サーバにより管理する。計算機計画部は、仮想サーバの凍結時刻と再開時刻を設定した計算機計画情報を作成し、現在時刻が凍結時刻に到達した際に計算機管理部に凍結を指示し、現在時刻が前記再開時刻に到達した際に前記計算機管理部に再開を指示する。ジョブ管理部は、キューから受付けたジョブを取出し、計算機管理部に問合せてジョブの実行を依頼する仮想サーバを決定した際に、ジョブの実行終了時刻が凍結時刻より前の場合は決定した仮想サーバのジョブ制御部にジョブの実行を依頼し、実行終了時刻が前記凍結時刻を過ぎている場合は計算機管理部に再度問合せて実行終了時刻が前記凍結時刻前となる仮想サーバを決定する処理を繰り返す。計算機管理部は凍結指示又は再開指示を受けた際に、依頼先の仮想サーバを凍結又は再開させる。

Description

サーバ管理方法、プログラム及び装置
技術分野
[0001] 本発明は、実サーバ上に構築される仮想サーバを管理するサーバ管理方法、プロ グラム及び装置に関し、特に、コンピューティンググリッド環境における各種シミュレ一 シヨン計算等のジョブを複数の仮想サーバに分散して実行する際の仮想サーバの停 止と再開を制御するサーバ管理方法、プログラム及び装置に関する。
背景技術
[0002] 従来、地球環境や気象環境等の各種のシミュレーション計算は、非常に長時間を 要し、計算ジョブが長時間計算機資源を使用した状態が継続され、膨大な計算機資 源を必要とするため、近年、コンピューティンググリッド環境における各種シミュレーシ ヨン計算システムが構築されて 、る。
[0003] コンピューティンググリッド環境によるシミュレーション計算システムは、計算ジョブを 最適な計算機資源に割り当て、分散された計算機資源を効率的に利用する。またコ ンピューティンググリッド環境の場合、計算機資源はシミュレーション計算ジョブのた めの占有リソースでない場合があり、他の利用目的で計算機資源が利用される場合 があり、計算機資源の貸し借りが必要となる。
[0004] 長時間の実行を要するシミュレーション計算ジョブが計算機資源を利用している場 合、他の目的で同じ計算機資源を利用できない。また、他の目的で利用することが判 つて 、る計算機資源をシミュレーション計算ジョブで利用することもできな 、。
[0005] このためコンピューティンググリッド環境に割り当てた計算機資源であっても、オフィ ス業務など他の目的で利用中の計算機資源は除外し、空き計算機資源でシミュレ一 シヨン計算ジョブを実行させる。しかし、シミュレーション計算ジョブが長時間にわたり 計算機資源を占有した場合、他の業務でその計算機資源を使 、たくても使えな!/、な どの問題が発生する。
[0006] この問題を解決する一般的な方法として、ジョブのチェックポイント 'リスタート機能 がある。チェックポイント 'リスタート機能は、ジョブを司るジョブ管理制御装置と計算ァ プリケーシヨンが連携し、アプリケーションにおける計算処理がどこまで進んでいるか を定期的に保存し、一時的に計算ジョブを停止させ、他の目的で計算機資源を利用 でさるよう〖こする。
[0007] このため、長時間を要するシミュレーション計算ジョブを、チェックポイント ·リスタート 機能によるジョブ実行と停止を繰り返して少ない空き計算機資源を積み重ねることで 、他の業務に影響を与えることなくシミュレーション計算ジョブを継続することができる 特許文献 1:特開 2005— 208919号公報
特許文献 2 :特開 2005— 196561号公報
発明の開示
発明が解決しょうとする課題
[0008] し力しながら、このような従来のチェックポイント 'リスタート機能を利用した計算機資 源の利用方法にあっては、シミュレーション計算ジョブとして動作するアプリケーショ ンにおいて、チヱックポイント 'リスタートのための制御処理が必須であり、アプリケー シヨンの開発コストが膨らむという問題がある。
[0009] また、巿販ソフトウェアなどチェックポイント ·リスタート機能を保持しな 、アプリケーシ ヨンによりシミュレーション計算ジョブを実行する場合、一時的にシミュレーション計算 ジョブを停止させることが困難である。
[0010] また、他の目的で計算機資源を利用する際に、サーバ自身を別の OS等で再起動 するような運用を行いたい場合、チェックポイント 'リスタート機能は利用できない。こ の理由は、チェックポイント 'リスタート機能では、チェックポイントを採るためには、ァ プリケーシヨン側にチェックポイントを採るためのロジックが必須である。また、チェック ポイントによる情報が保存された資源はジョブ単位で管理され、ジョブ管理制御装置 の配下で管理される。
[0011] このため、サーバ自身を停止させて別の OSで計算機資源を利用する場合は、ジョ ブ管理制御装置が停止してしまうため、シミュレーション計算ジョブを一時的に凍結し ても、その後再開することは困難である。
[0012] また他の業務で使用している計算機資源の空き時間を利用してシミュレーション計 算ジョブに計算機資源を割り当てる環境においては、計算機資源を夜間および休日 のみ利用する場合、数十台あるいは数百台ある計算機資源を手動で切り替えるのは 運用コストが増大するため、外部のスケジュール機能などを利用した時刻管理による 自動化運用が行われる。
[0013] しかし、計算機資源の利用を時刻管理により自動化した場合、終了時刻を迎える直 前に実行時間の短いジョブが計算機へ依頼されたとき、ジョブ実行中に終了時刻と なってチェックポイント 'リスタート機能によりジョブの実行が中断される。このため、実 行時間の短 、ジョブであっても、次の利用開始時刻に達してジョブが再開されな 、限 り、ジョブの実行結果を得ることができず、ジョブの実行に長時間待たされることで、 処理効率が大きく低下する問題がある。
[0014] 本発明は、実サーバ上に構築される仮想サーバに計算ジョブを実行させ、アプリケ ーシヨンや OSに依存することなくジョブの停止と再開を任意のタイミングで可能とする と同時に、時刻管理により計算機資源の利用する際のジョブ実行を資源利用の中断 によって長時間待たせな!/、ようにするサーバ管理方法、プログラム及び装置を提供 することを目的とする。
課題を解決するための手段
[0015] 本発明はサーバ管理方法を提供する。本発明は、実サーバ上に構築された仮想 サーバを管理サーバにより管理するサーバ管理方法に於いて、
仮想サーバの凍結時刻と再開時刻を含む計算機計画情報を管理し、現在時刻が 凍結時刻に到達した際に凍結を指示し、現在時刻が再開時刻に到達した際に再開 を指示する計算機計画ステップと、
ジョブの依頼を受付けてキューに格納するジョブ受付ステップと、
キュー力もジョブを取出し、サーバ管理情報に基づいてジョブ依頼先の仮想サーバ を決定した際に、ジョブ管理情報力も得られたジョブの実行終了時刻と仮想サーバの 凍結時刻とを比較し、実行終了時刻が凍結時刻より前の場合は決定した仮想サーバ のジョブ制御部にジョブの実行を依頼し、実行終了時刻が凍結時刻を過ぎて ヽる場 合は、実行終了時刻が凍結時刻前となる仮想サーバを決定する処理を繰り返すジョ ブ実行依頼ステップと 仮想サーバの凍結指示を受けた際に、依頼先の仮想サーバが稼動状態にあること を判別して、仮想サーバを構築する実サーバの仮想サーバ制御部に凍結指示を送 信し、稼動中の仮想サーバを凍結させる凍結ステップと、
仮想サーバの再開指示を受けた際に、依頼先の仮想サーバが凍結状態にあること を判別して仮想サーバを構築する実サーバの仮想サーバ制御部に再開指示を送信 し、凍結中の仮想サーバを稼動してジョブの実行を再開させる再開ステップと、 仮想サーバのジョブ終了を認識した際に、仮想サーバのジョブ制御部に依頼して 終了したジョブを回収するジョブ回収ステップと、
を備えたことを特徴とする。
[0016] ここで、ジョブ管理情報は、ジョブ識別子、ジョブが凍結が可能か又は不可かを示 す凍結可否情報、ジョブが凍結不可の場合の予想実行時間を含み、
ジョブ実行依頼ステップは、キュー力 取出したジョブが凍結不可で且つ予想実行 時間から求めた実行終了時刻が前記凍結時刻を過ぎて!/ヽる場合に、実行終了時刻 が凍結時刻より前となるジョブ依頼先となる仮想サーバを決定する処理を繰り返す。
[0017] サーバ管理情報は、
ジョブを実行するサーバ名又はネットワークアドレス、実サーバか仮想サーバかの 種別、各サーバの稼動、停止又は凍結の状態、各サーバの実行ジョブ数を含む分 散制御情報と、
実サーバと仮想サーバの対応関係、仮想サーバの稼動、停止又は凍結の状態、 仮想サーバ毎の実行中のジョブ一覧を含む仮想サーバ管理情報と、
を備える。
[0018] ジョブ実行依頼ステップは、分散制御情報を参照して稼動状態にある複数の仮想 サーバの中から実行ジョブ数が最小の仮想サーバをジョブ依頼先として検索。
[0019] 凍結ステップ及び再開ステップは、仮想サーバ管理情報力 仮想サーバの状態と 仮想サーバを構築している実サーバを検索して凍結指示又は再開指示を行。
[0020] ジョブ実行依頼ステップは、実サーバ上に構築されている仮想サーバとの通信途 絶による異常を検出した際に、記サーバ管理情報を参照してサーバの凍結状態を認 識した場合は正常と判断して異常検出を破棄する。 [0021] ジョブ受付ステップは、コンピューティング環境によるジョブを受付けて複数の仮想 サーバにジョブ実行を依頼させる。
[0022] (プログラム)
本発明はサーバ管理プログラムを提供する。本発明は、実サーバ上に構築された 仮想サーバを管理するサーバ管理装置のコンピュータに、
仮想サーバの凍結時刻と再開時刻を含む計算機計画情報を管理し、現在時刻が 凍結時刻に到達した際に凍結を指示し、現在時刻が再開時刻に到達した際に再開 を指示する計算機計画ステップと、
ジョブの依頼を受付けてキューに格納するジョブ受付ステップと、
キュー力もジョブを取出し、サーバ管理情報に基づいてジョブ依頼先の仮想サーバ を決定した際に、ジョブ管理情報力も得られたジョブの実行終了時刻と仮想サーバの 凍結時刻とを比較し、実行終了時刻が凍結時刻より前の場合は決定した仮想サーバ のジョブ制御部にジョブの実行を依頼し、実行終了時刻が凍結時刻を過ぎて ヽる場 合は、実行終了時刻が凍結時刻前となる仮想サーバを決定する処理を繰り返すジョ ブ実行依頼ステップと
仮想サーバの凍結指示を受けた際に、依頼先の仮想サーバが稼動状態にあること を判別して、仮想サーバを構築する実サーバの仮想サーバ制御部に凍結指示を送 信し、稼動中の仮想サーバを凍結させる凍結ステップと、
仮想サーバの再開指示を受けた際に、依頼先の仮想サーバが凍結状態にあること を判別して仮想サーバを構築する実サーバの仮想サーバ制御部に再開指示を送信 し、凍結中の仮想サーバを稼動してジョブの実行を再開させる再開ステップと、 仮想サーバのジョブ終了を認識した際に、仮想サーバのジョブ制御部に依頼して 終了したジョブを回収するジョブ回収ステップと、
を実行させることを特徴とする。
[0023] (装置)
本発明はサーバ管理装置を提供する。本発明は、実サーバ上に構築された仮想 サーバを管理するサーバ管理装置に於 、て、 前記仮想サーバの凍結時刻と再開時刻を含む計算機計画情報を管理する計算機 計画部と、
前記仮想サーバに設けられたジョブ制御部を管理するジョブ管理部と、 前記仮想サーバを構築する物理サーバの仮想サーバ制御部を管理する計算機管 理部と、
を備え、
計算機計画部は、
仮想サーバの凍結時刻と再開時刻を設定した計算機計画情報を作成する計画作 成部と、
現在時刻が前記凍結時刻に到達した際に計算機管理部に凍結を指示し、現在時 刻が再開時刻に到達した際に計算機管理部に再開を指示する計画指示部と、 を備え、
ジョブ管理部は、
ジョブの依頼を受付けてキューに格納するジョブ受付部と、
キュー力 ジョブを取出し、計算機管理部に問合せてジョブの実行を依頼する仮想 サーバを決定した際に、ジョブ管理情報力も得られたジョブの実行終了時刻と仮想サ ーバの凍結時刻とを比較し、実行終了時刻が凍結時刻より前の場合は決定した仮想 サーバのジョブ制御部にジョブの実行を依頼し、実行終了時刻が凍結時刻を過ぎて いる場合は計算機管理部に再度問合せて実行終了時刻が凍結時刻前となる仮想サ ーバを決定する処理を繰り返すジョブ実行依頼部と、
仮想サーバのジョブ終了を認識した際に、仮想サーバのジョブ制御部に依頼して 終了したジョブを回収するジョブ回収部と、
を備え、
計算機管理部は、
ジョブ管理部から問合せを受けた際に、ジョブ依頼先の実サーバと仮想サーバを検 索して計画指示部の計算機計画情報力 得られた凍結時刻と共に応答する依頼先 検索部と、
仮想サーバの凍結指示を受けた際に、依頼先の仮想サーバが実行状態にあること を判別して、仮想サーバを構築する実サーバの仮想サーバ制御部に凍結指示を送 信し、ジョブ実行中の仮想サーバを凍結させる凍結部と、
仮想サーバの再開指示を受けた際に、依頼先の仮想サーバが凍結状態にあること を判別して、仮想サーバを構築する実サーバの仮想サーバ制御部に再開指示を送 信し、凍結中の仮想サーバにジョブの実行を再開させる再開部と、
を備えたことを特徴とする。
発明の効果
[0024] 本発明によければ、仮想サーバにジョブの実行を依頼する際に,依頼するジョブが 凍結不可である場合は、計算機計画情報を参照して依頼先の仮想サーバがこれか ら依頼しょうとしているジョブが終了する前に計画的に凍結される力否か判定し、もし ジョブ終了前に凍結する計画となっている場合は、ジョブ終了後に凍結する計画のあ る他の仮想サーバを検索してジョブを依頼し、これによつて短時間で終了するはずの ジョブが。凍結する計画ある仮想サーバで実行されることで、長時間待たないとジョブ 実行結果がえられな 、と 、う問題を回避することができる。
[0025] また仮想サーバに対する時刻管理による凍結と再開の指示により、例えば昼間は 事務処理等の業務で利用している計算機資源を夜間のみコンピューティンググリッド 環境によるシミュレーション計算ジョブに利用でき、サーバ仮想化基盤の導入コストだ けで、連続して計算機の空き時間を有効に利用して長時間を要するシミュレーション 計算を実行することができる。
[0026] また仮想サーバを凍結することで計算機資源を開放するため、シミュレーション計 算ジョブとして動作して 、るアプリケーション側にぉ 、て、従来のようなチェックポイン ト 'リスタート機能を実装する必要がなぐアプリケーションの開発コスト、保守コストを 大幅に削減することができる。
[0027] また、チェックポイント 'リスタート機能を実装していない市販のアプリケーションなど 、どのようなアプリケーションでも仮想サーバ上で計算ジョブを実行することで、任意 のタイミングで一時凍結し、また任意のタイミングで再開することができる。
図面の簡単な説明
[0028] [図 1]本発明が適用されるコンピューティンググリッド環境の説明図
[図 2]本実施形態における管理サーバと実サーバ上に構築される仮想サーバを示し た機能構成のブロック図
[図 3]本実施形態における仮想サーバの論理アーキテクチャの説明図
[図 4]図 2のジョブ管理テーブルの説明図
[図 5]図 2の計算機計画テーブルの説明図
[図 6]図 2の分散制御テーブルの説明図
[図 7]図 2の仮想サーバ管理テーブルの説明図
[図 8]本実施形態における仮想サーバの凍結と再開の処理機能の説明図
[図 9]本実施形態の管理サーバが適用されるコンピュータのハードウェア環境の説明 図
[図 10]本実施形態のサーバ管理処理のタイムチャート
[図 11]図 10に続く本実施形態のサーバ管理処理のタイムチャート
[図 12]図 2の管理サーバにおけるジョブ管理処理のフローチャート
[図 13]図 12のステップ 6の非同期ジョブ終了待合せ処理のフローチャート
[図 14]図 2の仮想サーバにおける計算機計画処理のフローチャート
[図 15]図 2の管理サーバにおける計算機管理処理のフローチャート
[図 16]図 2の仮想サーバにおけるジョブ制御処理のフローチャート
[図 17]図 16のステップ 4における非同期ジョブ終了待ち合せ処理のフローチャート
[図 18]図 2の実サーバにおける仮想サーバ制御処理のフローチャート
発明を実施するための最良の形態
[0029] 図 1は本発明が適用されるコンピューティンググリッド環境の説明図である。図 1に おいて、本実施形態の管理サーバ 10はネットワーク 12に接続され、ネットワーク 12 にはシミュレーション計算ジョブなどを依頼する計算機群 14として、本実施形態にあ つては実サーバ 16— 1〜16— 39を接続している。
[0030] 管理サーバ 10に対しては、オペレータ 18— 1の操作でシミュレーション計算ジョブ のジョブ投入 20が行われ、管理サーバ 10による管理の下に、計算機群 14に含まれ る実サーバ 16— 1〜16— 39のいずれかにジョブを依頼して実行させる。
[0031] また管理サーバ 10に対しては、実行中のジョブに対し仮想サーバに対する凍結' 再開指示 22をオペレータ 18— 2から行うことができる。 [0032] 外部スケジューラ 24には計算機計画を作成するために使用する定義ファイル 26が 準備されており、定義ファイル 26に基づいて管理サーバ 16は計算機群 14の実サー ノ 16— 1〜16— 39に構築される仮想サーバの凍結時刻と再開時刻を含む計算機 計画テーブルを作成して管理する。
[0033] 図 2は本実施形態における管理サーバと実サーバ上に構築される仮想サーバを示 した機能構成のブロック図である。図 2において、本実施形態にあっては、説明を簡 単にするため、管理サーバ 10に対し 1台の実サーバ 16を配置した場合を例にとって いる。
[0034] 管理サーバ 10には、ジョブ管理部 28、計算機管理部 30、分散制御テーブル 32、 仮想サーバ管理テーブル 34,ジョブ管理テーブル 44、計算機計画部 46、計算機計 画テーブル 48が設けられる。
[0035] 一方、実サーバ 16には仮想サーバ 36と仮想サーバ制御部 38が設けられ、仮想サ ーバ 36の中にはジョブ制御部 40と計算ジョブ 42が設けられることになる。
[0036] ここで、管理サーバ 10及び実サーバ 16におけるそれぞれの機能は、コンピュータ によるプログラムの実行により実現される機能である。
[0037] 管理サーバ 10のジョブ管理部 28には、ジョブ受付部 28— 1、ジョブ実行依頼部 28 —2、ジョブ回収部 28— 3が設けられる。ジョブ受付部 28— 1は、図 1に示したような オペレータ 18— 2もしくは外部スケジューラ 24からのジョブ投入 20によるジョブの依 頼を受けて、内蔵したキューに格納する。
[0038] ジョブ実行依頼部 28— 2は、キュー力もジョブを取り出し、計算機管理部 30に依頼 して決定した仮想サーバ 36のジョブ制御部 40にジョブの実行を依頼する。更に、ジョ ブ実行依頼部 28— 2は、計算機管理部 30に問合せてジョブの実行を依頼する仮想 サーバを決定した際に、依頼しょうとしているジョブが凍結不可の場合、ジョブの実行 終了時刻と仮想サーバの凍結時刻とを比較し、実行終了時刻が凍結時刻より前の場 合は決定した仮想サーバ 16のジョブ制御部 36にジョブの実行を依頼し、実行終了 時刻が凍結時刻を過ぎている場合は計算機管理部あわに再度問合せて実行終了 時刻が凍結時刻前となる仮想サーバを決定する処理を繰り返す。
[0039] ここでジョブ管理テーブル 44には、ジョブ識別子、ジョブが凍結可能か又は凍結不 可かを示す凍結可否情報、ジョブが凍結不可の場合の予想実行時間が登録されて おり、ジョブ実行依頼部 30は、現在時刻にジョブ管理テーブル 44から取得した予想 実行時間を加算して実行終了時刻を求め、計算機管理部 30側カゝら得られた依頼先 の仮想サーバ 16の凍結時刻と比較する。
[0040] ジョブ回収部 28— 1は、仮想サーバ 36のジョブ終了を認識した際に、ジョブ制御部 40に依頼して終了したジョブを回収する。
[0041] 計算機管理部 30には、依頼先検索部 30— 1、凍結処理部 30— 2及び再開処理部 30— 3が設けられている。依頼先検索部 30— 1は、ジョブ管理部 28からの問合せを 受けた際に、ジョブ依頼先の実サーバ 16と仮想サーバ 36を検索し、計算機計画部 4 6の計算機計画テーブル 48から得られた凍結時刻と共に応答する。
[0042] 図 2にあっては実サーバ 16は 1台で、且つ実サーバ 16上に構築された仮想サーバ 36も 1台である力 実際には図 1のように管理サーバ 10の依頼先となる実サーバは 計算機群 14に示すように複数であり、また実サーバ 16上に構築される仮想サーバ 3 6の数も複数台構築される場合がある。
[0043] 凍結処理部 30— 2は、外部からの操作依頼 22又は計算機計画部 46から仮想サー バ 36の凍結依頼を受けた際に、依頼先の仮想サーバ 36が計算ジョブ 42の実行状 態にあることを判別して、仮想サーバ 36を構築する実サーバ 16の仮想サーバ制御 部 38に凍結指示を送信し、計算ジョブ 42によるジョブ実行中の仮想サーバ 36を凍 結させる。
[0044] 再開処理部 30— 3は、外部からの操作依頼 22又は計算機計画部 46から仮想サー バ 36の再開依頼を受けた際に、依頼先の仮想サーバ 36が凍結状態にあることを判 別して、仮想サーバ 36を構築する実サーバ 16の仮想サーバ制御部 38に再開指示 を送信し、凍結中の仮想サーバ 36に計算ジョブ 42の実行を再開させる。
[0045] 計算機計画部 46には計画作成部 46— 1と計画指示部 46— 2が設けられる。計画 作成部 46— 1は、図 1の外部スケジューラ 24の定義ファイル 26を読込んで仮想サー バの凍結時刻と再開時刻を含む計算機計画テーブル 48を作成する。計画指示部 4 6— 2は、計算機計画テーブル 48の凍結時刻と再開時刻を現在時刻と比較しており 、現在時刻が凍結時刻に到達した際に計算機管理部 30に凍結を指示し、現在時刻 が再開時刻に到達した際に計算機管理部 30に再開を指示する。
[0046] 一方、実サーバ 16に構築された仮想サーバ 36のジョブ制御部 40は、管理サーバ 10のジョブ管理部 28からジョブ実行依頼を受け付け、アプリケーションにより計算ジョ ブ 42を実行し、計算ジョブ 42が終了すると実行終了をジョブ管理部 28に通知する。 これを受けてジョブ管理部 28は、終了したジョブの回収を依頼し、依頼を受けてジョ ブ制御部 40は、終了したジョブを編集する。
[0047] 管理サーバ 36が構築された実サーバ 16に設けた仮想サーバ制御部 38は、管理 サーバ 10の計算機管理部 30からの操作依頼を受けて仮想サーバ 36を制御する。こ の操作依頼として本発明にあっては、計算機管理部 30は凍結指示または再開指示 を発行することから、凍結指示を受け付けたときには仮想サーバ 36を凍結し、その後 、仮想サーバ 36の凍結中に再開指示を受け付けると、凍結している仮想サーバ 36 を復元して計算ジョブ 42を実行させる。
[0048] 更に、本実施形態において、管理サーバ 10の計算機管理部 30の指示で仮想サー バ 36が凍結された場合、管理サーバ 10に設けているジョブ管理部 28と仮想サーバ 36の通信が途絶することになる力 ジョブ管理部 28が通信途絶による仮想サーバ 3 6の異常を検出した際には、仮想サーバ管理テーブル 34を参照すれば、異常を起こ して 、る仮想サーバにっき「凍結」の状態を知ることができる。
[0049] このためジョブ管理部 28は、仮想サーバ 36との通信途絶による異常を検出しても、 これは異常ではなく仮想サーバが凍結状態にあるものと判断し、異常と判断した場合 に、ジョブを異常終了するか、別の計算機に異常終了したジョブの再実行を依頼する などの不必要な処理を回避することができる。
[0050] 図 3は本実施形態における仮想サーバの論理アーキテクチャの説明図である。図 3 において、実サーバに相当する計算機 50上にはハードウェア 52が構築され、ハード ウェア 52を基板としてウィンドウズ (R)などの OS54が動作する。 OS54上には仮想 プラットフォーム 56が構築され、この仮想プラットフォーム 56上で例えば仮想 OS58 —1, 58— 2が動作し、それぞれ個別にアプリケーションを実行することができる。
[0051] このような仮想プラットフォーム 56及び仮想 OS58— 1, 58— 2としては、例えば V Mウェア(R)やマイクロソフト(R) 'バーチャルサーバ 2005などのサーバ仮想化製品 を実装することができる。
[0052] 図 4は図 2の管理サーバ 10に設けた分散制御テーブル 32の説明図である。分散 制御テーブル 32は、計算機名 60、計算機種別 62、状態 64、ジョブ多重度 66及び ジョブ数 68を登録している。計算機名 60としては、ジョブを実行する計算機のホスト 名または IPアドレスを登録する。
[0053] 計算機種別 62は実サーバまたは仮想サーバである。状態 64は実サーバまたは仮 想サーバの状態であり、この状態は、実サーバの場合には「稼動」又は「停止」の 2つ の状態があり、仮想サーバにあっては「稼動」、「停止」又は「凍結」の 3つの状態があ る。
[0054] 分散制御テーブル 32における実サーバ及び仮想サーバの状態 64は、各計算機 のハートビートに基づいて状態を監視している。即ち状態「稼動」とは、計算機のハー トビートにより正常に稼動していることが確認できた状態である。また状態「停止」は、 計算機のハートビートに失敗し、稼動していると確認できない状態である。更に本実 施形態の仮想サーバに固有な状態である「凍結」は、仮想サーバが凍結指示を受け て凍結された状態である。
[0055] なお、ハートビート (heart beat)とは、 HYPERLINK〃http:〃 e— words.jp/w/E3838DE 38383E38388E383AFE383BCE382AF.html"ネットワーク上で、 HYPERLINK〃http:/ /e-words.jp/w/E382B3E383B3E38394E383A5E383BCE382BF.html"コンピュータ やネットワーク機器が自身が正常に稼動していることを一定時間ごとに外部に知らせ るために信号やパケットを送ることである。
[0056] 分散制御テーブル 32のジョブ多重度 66は、各計算機に依頼可能なジョブ数の上 限値である。更にジョブ数 68は各計算機で現在処理中のジョブ数であり、状態が「凍 結」の計算機の場合は凍結状態のジョブ数を示して 、る。
[0057] この分散制御テーブル 32は、図 2のジョブ管理部 28に外部からジョブの依頼を受 けた際に、計算機管理部 30の依頼先検索部 30— 1により参照され、状態 64が「稼動 」となって!/、る計算機を依頼先候補として選択し、複数候補が選択された場合には例 えば最小ジョブ数となる計算機を依頼先として決定する。もちろん、この場合、状態が 「停止」または「凍結」となって!/、る計算機は依頼先力 除外されることになる。 [0058] 図 5は図 2の管理サーバ 10に設けた仮想サーバ管理テーブル 34の説明図である 。仮想サーバ管理テーブル 34は、実サーバ名 70、仮想サーバ名 72、各仮想サーバ の状態 74、及び各仮想サーバのジョブ一覧 76で構成されている。実サーバ名 70は 実計算機のホスト名または IPアドレスである。仮想サーバ名 72は実サーバ上で起動 されて稼動して 、る仮想サーバのホスト名または IPアドレスである。
[0059] ここで、実サーバ名 70と仮想サーバ名 72から、実サーバと仮想サーバの対応関係 が分かる。例えば実サーノ名 70として、実サーノ 「r— host01」上にはサーノ名「v — host01」及び「v— host02」を持つ 2台の仮想サーバが構築されている。
[0060] 状態 74は各仮想サーバの状態であり、「稼動」、「停止」又は「凍結」の 、ずれかで あり、それぞれ図 4の分散制御テーブル 32の状態と同じ内容である。ジョブ一覧 76 には、各仮想サーバに実行を依頼中のジョブ番号の一覧が登録されている。
[0061] 図 6は図 2のジョブ管理部 28に対し設けたジョブ管理テーブル 44の説明図である。
ジョブ管理テーブル 44は、ジョブ ID78、凍結可否 80、予想実行時間 82、その他の ジョブ情報 84を登録する。
[0062] ジョブ ID78は依頼されたジョブの識別子である。凍結可否 80は、仮想サーバに依 頼する際に、実行途中で凍結しても良いか否かを示し、実行中に凍結しても問題な V、ジョブにつ ヽては「可能」が設定され、実行中に凍結してはならな!、ジョブにっ 、て は「不可」を設定している。この凍結可否 80を「不可」とするジョブは、例えば比較的 短時間で実行できるジョブである。
[0063] 予想実行時間 82は、凍結可否 80を「不可」に設定したジョブについて設定され、こ の予想実行時間を現在時刻に力さすることで、ジョブの実行終了時刻を求めることが できる。
[0064] 図 7は図 2の計算機計画部 46で生成された計算機計画テーブル 48の説明図であ る。計算機計画テーブル 46には、計算機名 86、凍結時刻 88、再開時刻 90が登録さ れる。計算機名 86には凍結及び再開が行われる仮想計算機のホスト名又は IPァドレ スが登録される。
[0065] 凍結時刻 88と再開時刻 90は図 1の定義ファイル 26から作成され、各仮想サーバを シミュレーション計算に利用する夜間から朝にかけての計画時間帯が設定されている 。この時間計画テーブル 48に基づき計算機計画部 46は計算機管理部 30に仮想計 算機の凍結と再開を依頼することになる。
[0066] 図 8は本実施形態における仮想サーバの凍結と再開の処理機能の説明図である。
図 8において、実サーバ 16にはハードウェアとして物理ボリューム 92及び各種デバ イス 94が設けられており、物理ボリューム 92に格納している OSを実行することで仮 想プラットフォーム 56が構築され、仮想プラットフォーム 56上で仮想サーバ 36が動 作している。
[0067] この仮想サーバ 36には、実サーバ 16の計算機資源を使用して、仮想メモリ 96、仮 想ボリューム 98及び仮想デバイス 100が構成され、これら仮想計算機資源を使用し て、図 3に示したように、 1または複数の仮想 OS58— 1, 58— 2力実行され、これらの OS上でアプリケーションとしての計算ジョブが実行される。
[0068] 仮想サーバ 36によるジョブ実行中に、図 2に示した管理サーバ 10の計算機管理部 30より凍結指示 102が仮想プラットフォーム 56に与えられると、仮想プラットフォーム 56は仮想サーバ 36全体を凍結処理 106に示すように物理ボリューム 92に vmxfファ ィル 110として保存さし、実行中のジョブを停止した凍結状態とする。
[0069] 凍結状態で仮想プラットフォーム 56に対し図 2の管理サーバ 10の計算機管理部 3 0より再開指示 104が与えられると、仮想プラットフォーム 56は、物理ボリューム 92に 退避して!/、る vmxfファイル 110を再開処理 108に示すように読み出して管理サーバ 36を再構築し、凍結したジョブの実行を再開する。
[0070] 仮想プラットフォーム 56に対する凍結指示 102及び再開指示 104は、図 2の計算 機管理部 30から発行されるコマンドであり、凍結指示 102は例えばコマンド「vmrun suspendファイル名」となり、また再開指示 104はコマンド「vmrun startファイル名 」となる。
[0071] 即ち凍結コマンドは、仮想サーバ 36の全情報を物理ボリューム 92の vmxfファイル 110という専用の制御ファイルに保存する命令となる。また再開コマンドは、コマンド で指定された制御ファイル例えば vmxfファイル 110に保存されて ヽる情報を元に、 仮想サーバ 36の状態を復元する命令となる。
[0072] 図 9は本実施形態の管理サーバが適用されるコンピュータのハードウェア環境の説 明図である。図 7において、 CPU112のノ ス 114には、 RAM116、 ROM118、ハー ドディスクドライブ 120、キーボード 124,マウス 126及びディスプレイ 128を接続する デバイスインタフェース 122、及びネットワークアダプタ 130が接続されて!、る。
[0073] ハードディスクドライブ 120には本実施形態のサーバ管理プログラムが格納されて おり、コンピュータ起動によるブート後の OSの RAM116への読出展開による実行に 続いて、サーバ管理プログラムが RAMI 16に読み出され、 CPU112により実行され る。
[0074] 図 10及び図 11は本実施形態のサーバ管理処理のタイムチャートである。図 10に おいて、管理サーバ 10のジョブ管理部 28にあっては、ステップ S1で外部からのジョ ブ依頼 132を受け付けると、受付けたジョブをキューに格納するキューイングを行う。
[0075] 続!、てステップ S2でキューから受け付けたジョブを取り出し、ステップ S3で実行を 依頼する計算機を計算機管理部 30に問い合わせて決定する。計算機管理部 30は 、ジョブ管理部 28からの問合せを受けると、ステップ S101で図 4の分散制御テープ ル 32を参照し、状態 58が「稼動」となっている計算機を依頼先候補として検索し、複 数候補が検索された場合にはジョブ数 62が最小となる計算機を依頼先として応答す る。
[0076] この場合に依頼先として仮想サーバ 36が検索された場合には、図 5の仮想サーバ 管理テーブル 34を参照し、依頼先に決定された仮想サーバ 36を構築している実サ 一バ名を取得して応答する。同時に計算機管理部 30は計算機計画部 46にアクセス して候補計算機が仮想サーバの場合の凍結時刻を取得して応答する。
[0077] ジョブ管理部 28にあっては、計算機管理部 30に対する問合せで、もし仮想サーバ を依頼先として決定した場合には、図 6のジョブ管理テーブル 48を参照して受付けて いるジョブの凍結可否 82を参照し、例えばジョブ ID=02であったとすると、凍結可否 82は「不可」であることから、その予想実行時間 82として「180秒」を取得し、 実行終了時刻 =現在時刻 + 180秒
を求める。
[0078] そして、計算機管理部 30に対する問合せの応答してえられている凍結時刻と実行 終了時刻を比較し、 (実行終了時刻)< (凍結時刻)
であれば、凍結時刻前にジョブ実行を終了することから、応答のあった仮想サーバ及 び仮想サーバを構築して ヽる実サーバを依頼先として決定し、ステップ S4で決定し たサーバにジョブの実行を依頼する。
[0079] これに対し
(実行終了時刻) > (凍結時刻)
の場合には、凍結時刻後にジョブ実行が終了してジョブが長時間再開待ちになること から、この仮想サーバは不適切と判断し、再度、計算機管理部 30にジョブ依頼先の 計算機を問合せ、凍結時刻前にジョブ実行を終了する仮想サーバを決定してステツ プ S 3でジョブの実行を依頼する。
[0080] ステップ S4におけるサーバにジョブの依頼は、仮想サーバ 36を構築している実サ ーバ 16の例えば IPアドレスなどの指定でジョブを依頼し、ジョブ依頼に仮想サーバ 3 6の IPアドレスを含めておくことで、仮想サーバ 36のジョブ制御部 40に対しジョブを 依頼することができる。仮想サーバ 36のジョブ制御部 40は、管理サーバ 10のジョブ 管理部 28からのジョブの依頼を受け付けて、計算機ジョブにステップ S401のように ジョブを実行させる。
[0081] 凍結不可のジョブについては、仮想サーバ 36の凍結時刻前にジョブの実行が終了 し,ジョブ実行結果が管理サーバ 10に回収されてファイルに保存される。
[0082] 一方、凍結可能なジョブの実行を仮想サーバ 36に依頼している場合には、仮想サ ーバ 36によるジョブ実行中に管理サーバ 10の計算機管理部 30に対し凍結依頼 13 4が行われると、ステップ S 102で仮想サーバの凍結依頼を受け付け、ステップ S 103 で仮想サーバ 36を管理する実サーバ 16を図 5の仮想サーバ管理テーブル 34から 検索し、ステップ S104で検索した実サーバ 16の仮想サーバ制御部 38に対し凍結を 指示する。
[0083] これを受けて実サーバ 16の仮想サーバ制御部 38は、ステップ S201で計算機管理 部 30からの凍結指示を受け、仮想サーバ 36にステップ S302で凍結操作を行って凍 結させる。仮想サーバの凍結により凍結完了通知力 Sステップ S303で仮想サーバ制 御部 38に応答されると、ステップ S202で凍結完了応答を管理サーバ 10の計算機管 理部 30に対し行う。
[0084] これを受けて計算機管理部 30は、ステップ S 106で図 4の分散制御テーブル 32及 び図 5の仮想サーバ管理テーブル 34における対応する仮想サーバの状態を、それ までの「稼動」から「凍結」に変更する。
[0085] なお、図 8のステップ S302, S303の処理は、ジョブ制御部 40の処理として説明の 都合上示しているが、実際には仮想サーバ 36の凍結制御と凍結完了通知となる。
[0086] 続いて図 9において、管理サーバ 10の計算機管理部 30に対し再開依頼 136が行 われると、これをステップ S 106で受け付け、ステップ S 107で図 5の仮想サーバ管理 部 34の参照により仮想サーバ 36を管理する実サーバ 16を検索し、ステップ S108で 実サーバ 16の仮想サーバ制御部 38に再開指示のコマンドを送る。
[0087] 仮想サーバ制御部 38はステップ S203で再開指示を受けて仮想サーバ 36はステ ップ S304で再開制御を行い、これによつて計算ジョブ 42がステップ S 103のように稼 動状態となってジョブ実行が再開される。
[0088] 仮想サーバの再開制御が完了すると、ステップ S305で再開完了通知が仮想サー バ制御部 38に送られ、ステップ S204で再開完了応答を管理サーバ 10の計算機管 理部 30に送る。これを受けて計算機管理部 30は、ステップ S 109で仮想サーバ 36の 状態を「稼動」に変更する。
[0089] 更に仮想サーバ 36で実行している計算ジョブが終了すると、ジョブ制御部 40はス テツプ S306で、終了通知を管理サーバ 10の計算機管理部 30を経由してジョブ管理 部 28に通知する。このジョブ終了通知を認識したジョブ管理部 28は、ステップ S5で 仮想サーバ 36のジョブ制御部 40にジョブ回収を依頼し、これを受けてジョブ制御部 40は、ステップ S307でジョブを回収して応答し、ジョブ管理部 28はステップ S6で、 回収したジョブをファイルに保存する。
[0090] 図 12は図 2の管理サーバ 10に設けたジョブ管理部 28によるジョブ管理処理のフロ 一チャートである。図 12において、ジョブ管理処理は、ステップ S1で外部からのジョ ブ依頼を受け付けると、ステップ S2で受け付けたジョブをキューにキューイングした 後、ステップ S3でジョブをキューから取り出し、ステップ S4で計算機管理部 30に問い 合わせて実行を依頼する計算機を決定する。この問合せに対し計算機管理部 30は 依頼先の計算機として仮想サーバを検索した場合には、仮想サーバを構築している 実サーバと、仮想サーバの凍結時刻を併せて応答する。
[0091] 続いてステップ S5でジョブを依頼する計算機が決定できた力否か判別し、決定でき 無い場合はステップ S3に戻り、次のジョブをキューから取出してジョブを依頼する計 算機を決定する。
[0092] ステップ S5でジョブを依頼する計算機を決定した場合はステップ S6に進み、仮想 サーノ か否力判定する。仮想サーバの場合は、ステップ S7で図 6のジョブ管理テー ブル 44の参照でジョブは凍結可能力否か判定し、凍結不可であればステップ S8に 進み、
(予測実行終了時刻) > (凍結時刻)
であれば、決定した仮想サーバは不適切としてステップ S4に戻って別の計算機を依 頼先として決定する処理を繰り返す。
[0093] ステップ S8の条件に該当せず、ジョブが凍結時刻前に終了する場合はステップ S9 に進み、決定した仮想サーバ 36のジョブ制御部 40にジョブを依頼し、これによつて 計算ジョブ 42によるジョブの実行が開始される。
[0094] 続いてステップ S10で非同期ジョブ終了待ち合せ処理を実行している。この非同期 ジョブ終了待ち合せ処理は、図 13に取り出して示すように、シグナルノヽンドラとしての サブルーチンにより実行されている。非同期ジョブ終了待ち合せ処理は、ステップ S1 でジョブ終了通知の受信の有無をチェックしており、もしジョブ終了通知を受信すると 、ステップ S2でジョブ管理部 28におけるジョブ状態を「実行終了」に設定した後、ス テツプ S3で実行終了を図 12のジョブ管理処理のメインルーチンに返信する。
[0095] 再び図 12を参照するに、ステップ S10の非同期ジョブ終了待ち合せ処理に続いて 、ステップ S11でジョブは終了状態か否かチェックしており、ジョブ実行中にあっては 終了状態でないことから、ステップ S12に進み、依頼先の仮想サーバは凍結状態か 否かチェックする。
[0096] もし依頼先の仮想サーバが凍結状態であった場合には、ステップ S13で依頼先の 仮想サーバ 36のジョブ制御部 40に状態を確認し、ステップ S 14で一定時間例えば 2 分の待ち合せを行った後、ステップ S6で非同期ジョブ終了待ち合せ処理に戻る。 [0097] このような仮想サーバにおけるジョブ実行状態でジョブが終了し、ステップ S7でジョ ブ終了状態を判別するとステップ S15に進み、依頼した仮想サーバ 36のジョブ制御 部 40にジョブの回収を依頼し、ステップ S 16でジョブを回収してファイルに保存する。
[0098] 図 14は図 2の計算機計画処理部 46による計算機計画処理のフローチャートである 。図 14において、計算機計画処理は、ステップ S1で図 1の外部スケジューラ 24から 定義ファイル 26を読込み、図 7の計算機計画テーブル 48をメモリ上に作成する。次 にステップ S2に進み、計算機計画テーブル 48から現在時刻に対し最初に操作を依 頼する時刻を検索する。
[0099] 続いてステップ S3で検索した時刻が凍結時刻であることを判別するとステップ S4で 種別を「凍結」にセットし、凍結時刻出なければステップ S5に進んで種別を「再開」に セットする。
[0100] 続ヽて現在時刻が検索した待合せ時刻に到達した力否力判定し、待合せ時刻に なるとステップ S7で種別が凍結であればステップ S8で計算機管理部 30に凍結を指 示し、種別が凍結出なければステップ S9で計算機管理部 30に再開を指示する。こ のステップ S2〜S9の処理をステップ S10で停止指示を判別するまで繰り返す。
[0101] 図 15は図 2の管理サーバ 10に設けた計算機管理部 30における計算機処理のフロ 一チャートである。図 15において、計算機管理処理は、ステップ S1で仮想サーバの 操作依頼を受け付けると、ステップ S2で操作依頼が凍結依頼力否かチェックする。
[0102] 凍結依頼であった場合にはステップ S3に進み、依頼先の管理サーバ 36が稼動中 か否かチェックし、稼動中であった場合にはステップ S4に進み、図 5の仮想サーバ管 理テーブル 34から依頼先の仮想サーバを管理する実サーバを検索する。
[0103] 次にステップ S5で、検索した実サーバ 16の仮想サーバ制御部 38に凍結をコマン ド送信により指示して仮想サーバ 36を凍結させる。次にステップ S6で、図 4の分散制 御テーブル 32及び図 5の仮想サーバ管理テーブル 34における依頼先の仮想サー バの状態を「凍結」に変更する。なおステップ S3で凍結依頼を受けたにも関わらず仮 想サーバが稼動中でなかった場合には、ステップ S 7で操作不可エラーメッセージを 出力して処理を終了する。
[0104] 一方、ステップ S1で受け付けた仮想サーバの操作命令が再開依頼であった場合 には、ステップ S2からステップ S8に進み、仮想サーバ 36が凍結中か否かチェックし 、凍結中であれば、ステップ S9で仮想サーバ 36を管理する実サーバ 16の仮想サー バ制御部 38に再開を指示するコマンドを送って、凍結状態にある仮想サーバ 36を 復元して稼動状態とする。これにより一旦凍結された計算ジョブ 42の実行が再開され る。
[0105] 次にステップ S 11で、図 4の分散制御テーブル 32及び図 5の仮想サーバ管理テー ブル 34の状態を「稼動」に変更する。なおステップ S8で再開依頼を受けたにも関わ らず仮想サーバが凍結中でな力つた場合には、ステップ S12で操作不可エラーメッ セージを出力して処理を終了する。
[0106] また計算機管理処理は、ジョブ管理部 30からの問合せに対し、ジョブを依頼する計 算機を検索して応答し、もし仮想計算機を検索した場合は、凍結時刻を同時に応答 するが、図 15は、この問合せに対する応答処理は省略している。
[0107] 図 16は図 2の実サーバ 16上に構築される仮想サーバ 36のジョブ制御部 40による ジョブ制御処理のフローチャートである。図 16のジョブ制御処理にあっては、ステップ S1で管理サーバ 10のジョブ管理部 28からジョブの実行依頼を受け付け、計算ジョブ 42をステップ S 2で起動し、ステップ S3でジョブ状態を稼動中に設定する。
[0108] 続いてステップ S4で非同期ジョブ終了待ち合せ処理を実行する。この非同期ジョ ブ終了待ち合せ処理は、図 17に示すように、ステップ S1でジョブプロセス終了検知 の有無をチェックし、終了を検知すると、ステップ S 2でジョブ状態を「実行終了」に設 定し、ステップ S3で図 13のジョブ制御処理のメインルーチンに実行終了を返信する
[0109] 続いて図 16のステップ S5で管理サーバ 10のジョブ管理部 28から状態の問合せが ある力否かチェックし、状態問合せがあった場合には、ステップ S6でジョブ状態は稼 動中か否かチェックし、稼動中であれば、ステップ S 7でジョブ実行中を返信する。一 方、ステップ S6でジョブ状態が「停止」であった場合には、ステップ S8で実行終了を 管理サーバ 10のジョブ管理部 28に返信する。
[0110] 図 18は図 2の実サーバ 16に設けた仮想サーバ制御部 38による仮想サーバ制御 処理のフローチャートである。図 18において、仮想サーバ制御処理にあっては、ステ ップ SIで管理サーバ 10の計算機管理部 30から仮想サーバ 36の操作依頼を受け付 け、ステップ S 2で操作依頼が凍結依頼であることを判別すると、ステップ S3で仮想サ ーバ 36にコマンドにより凍結を依頼し、仮想サーバ 36を凍結する。
[0111] 一方、ステップ S1で受け付けた操作依頼が仮想サーバの再開依頼であった場合 には、ステップ S2からステップ S4に進み、仮想サーバ 36にコマンドによって再開を 依頼し、凍結中の仮想サーバ 36を復元して稼動することで、凍結中のジョブの実行 を再開する。
[0112] ステップ S3またはステップ S4の処理が済むと、ステップ S5で処理結果を管理サー ノ 10の計算機管理部 30に返信し、分散制御テーブル 32及び仮想サーバ管理テー ブル 34における状態を「凍結」または「再開」に変更させる。
[0113] また本実施形態は図 2の管理サーバ 10で実行されるサーバ管理プログラムを提供 するものであり、このサーバ管理プログラムは図 12〜図 18のフローチャートに示した 内容を持つことになる。
[0114] また本実施形態は、管理サーバ 10を構成するコンピュータで可読なサーバ管理プ ログラムを格納した記憶媒体を提供する。この記憶媒体は、 CD-ROM,フロッピィ( R)ディスク、 DVDディスク、光磁気ディスク、 ICカードなどの可搬型記憶媒体や、コ ンピュータシステムの内外に備えられたハードディスクドライブなどの記憶装置の他、 回線を介してプログラムを保持するデータベース、あるいは他のコンピュータシステム 並びにそのデータベースや、更に回線上の伝送媒体を含むものである。
[0115] なお上記の実施形態はコンピューティンググリッド環境の仮想サーバに対するサー バ管理を例に取るものであった力 これ以外の適宜の仮想サーバを使用したコンビュ ータシステムにっき、そのまま適用することができる。
[0116] また本発明は、その目的と利点を損なうことのない適宜の変形を含み、更に上記の 実施形態で示した数値による限定は受けない。

Claims

請求の範囲
[1] 実サーバ上に構築された仮想サーバを管理するサーバ管理方法に於いて、 前記仮想サーバの凍結時刻と再開時刻を含む計算機計画情報を管理し、現在時 刻が前記凍結時刻に到達した際に凍結を指示し、現在時刻が前記再開時刻に到達 した際に再開を指示する計算機計画ステップと、
ジョブの依頼を受付けてキューに格納するジョブ受付ステップと、
前記キュー力もジョブを取出し、サーバ管理情報に基づいてジョブ依頼先の仮想サ ーバを決定した際に、ジョブ管理情報力 得られたジョブの実行終了時刻と前記仮 想サーバの凍結時刻とを比較し、前記実行終了時刻が前記凍結時刻より前の場合 は決定した仮想サーバのジョブ制御部にジョブの実行を依頼し、前記実行終了時刻 が前記凍結時刻を過ぎている場合は、前記実行終了時刻が前記凍結時刻前となる 仮想サーバを決定する処理を繰り返すジョブ実行依頼ステップと
前記仮想サーバの凍結指示を受けた際に、依頼先の仮想サーバが稼動状態にあ ることを判別して、前記仮想サーバを構築する実サーバの仮想サーバ制御部に凍結 指示を送信し、稼動中の前記仮想サーバを凍結させる凍結ステップと、
前記仮想サーバの再開指示を受けた際に、依頼先の仮想サーバが凍結状態にあ ることを判別して前記仮想サーバを構築する実サーバの仮想サーバ制御部に再開 指示を送信し、凍結中の前記仮想サーバを稼動してジョブの実行を再開させる再開 ステップと、
前記仮想サーバのジョブ終了を認識した際に、前記仮想サーバのジョブ制御部に 依頼して終了したジョブを回収するジョブ回収ステップと、
を備えたことを特徴とするサーバ管理方法。
[2] 請求項 1記載のサーバ管理方法に於!、て、
前記ジョブ管理情報は、ジョブ識別子、ジョブが凍結が可能か又は不可かを示す凍 結可否情報、ジョブが凍結不可の場合の予想実行時間を含み、
前記ジョブ実行依頼ステップは、前記キュー力も取出したジョブが凍結不可で且つ 前記予想実行時間から求めた実行終了時刻が前記凍結時刻を過ぎている場合に、 前記実行終了時刻が前記凍結時刻より前となる仮想サーバを決定する処理を繰り返 すことを特徴とする仮想サーバ予測方法。
[3] 請求項 1記載のサーバ管理方法に於!、て、前記サーバ管理情報は、
ジョブを実行するサーバ名又はネットワークアドレス、実サーバか仮想サーバかの 種別、各サーバの稼動、停止又は凍結の状態、各サーバの実行ジョブ数を含む分 散制御情報と、
実サーバと仮想サーバの対応関係、前記仮想サーバの稼動、停止又は凍結の状 態、前記仮想サーバ毎の実行中のジョブ一覧を含む仮想サーバ管理情報と、 を備えたことを特徴とするサーバ管理方法。
[4] 請求項 2記載のサーバ管理方法に於 、て、前記ジョブ実行依頼ステップは、前記 分散制御情報を参照して稼動状態にある複数の仮想サーバの中力 実行ジョブ数 が最小の仮想サーバをジョブ依頼先として検索することを特徴とするサーバ管理方 法。
[5] 請求項 2記載のサーバ管理方法に於いて、前記凍結ステップ及び再開ステップは 、前記仮想サーバ管理情報力 仮想サーバの状態と仮想サーバを構築して 、る実 サーバを検索して凍結指示又は再開指示を行うことを特徴とするサーバ管理方法。
[6] 請求項 1記載のサーバ管理方法に於!、て、前記ジョブ実行依頼ステップは、前記 実サーバ上に構築されている仮想サーバとの通信途絶による異常を検出した際に、 前記サーバ管理情報を参照して前記サーバの凍結状態を認識した場合は正常と判 断して前記異常検出を破棄することを特徴とするサーバ管理方法。
[7] 請求項 1記載のサーバ管理方法に於!、て、前記ジョブ受付ステップは、コンビユー ティング環境によるジョブを受付けて複数の仮想サーバにジョブ実行を依頼させるこ とを特徴とするサーバ管理方法。
[8] 実サーバ上に構築された仮想サーバを管理するサーバ管理装置のコンピュータに 前記仮想サーバの凍結時刻と再開時刻を含む計算機計画情報を管理し、現在時 刻が前記凍結時刻に到達した際に凍結を指示し、現在時刻が前記再開時刻に到達 した際に再開を指示する計算機計画ステップと、
ジョブの依頼を受付けてキューに格納するジョブ受付ステップと、 前記キュー力もジョブを取出し、サーバ管理情報に基づいてジョブ依頼先の仮想サ ーバを決定した際に、ジョブ管理情報力 得られたジョブの実行終了時刻と前記仮 想サーバの凍結時刻とを比較し、前記実行終了時刻が前記凍結時刻より前の場合 は決定した仮想サーバのジョブ制御部にジョブの実行を依頼し、前記実行終了時刻 が前記凍結時刻を過ぎている場合は、前記実行終了時刻が前記凍結時刻前となる 仮想サーバを決定する処理を繰り返すジョブ実行依頼ステップと
前記仮想サーバの凍結指示を受けた際に、依頼先の仮想サーバが稼動状態にあ ることを判別して、前記仮想サーバを構築する実サーバの仮想サーバ制御部に凍結 指示を送信し、稼動中の前記仮想サーバを凍結させる凍結ステップと、
前記仮想サーバの再開指示を受けた際に、依頼先の仮想サーバが凍結状態にあ ることを判別して前記仮想サーバを構築する実サーバの仮想サーバ制御部に再開 指示を送信し、凍結中の前記仮想サーバを稼動してジョブの実行を再開させる再開 ステップと、
前記仮想サーバのジョブ終了を認識した際に、前記仮想サーバのジョブ制御部に 依頼して終了したジョブを回収するジョブ回収ステップと、
を実行させることを特徴とする仮想サーバ管理フプログラム。
[9] 請求項 8記載のサーバ管理プログラムに於いて、
前記ジョブ管理情報は、ジョブ識別子、ジョブが凍結が可能か又は不可かを示す凍 結可否情報、ジョブが凍結不可の場合の予想実行時間を含み、
前記ジョブ実行依頼ステップは、前記キュー力も取出したジョブが凍結不可で且つ 前記予想実行時間から求めた実行終了時刻が前記凍結時刻を過ぎている場合に、 前記実行終了時刻が前記凍結時刻より前となる仮想サーバを決定する処理を繰り返 すことを特徴とするサーバ管理プログラム。
[10] 請求項 8記載のサーバ管理プログラムに於いて、前記サーバ管理情報は、
ジョブを実行するサーバ名又はネットワークアドレス、実サーバか仮想サーバかの 種別、各サーバの稼動、停止又は凍結の状態、各サーバの実行ジョブ数を含む分 散制御情報と、
実サーバと仮想サーバの対応関係、前記仮想サーバの稼動、停止又は凍結の状 態、前記仮想サーバ毎の実行中のジョブ一覧を含む仮想サーバ管理情報と、 を備えたことを特徴とするサーバ管理プログラム。
[11] 請求項 10記載のサーバ管理プログラムに於いて、前記ジョブ実行依頼ステップは
、前記分散制御情報を参照して稼動状態にある複数の仮想サーバの中から実行ジョ ブ数が最小の仮想サーバをジョブ依頼先として決定することを特徴とするサーバ管 理プログラム。
[12] 請求項 10記載のサーバ管理プログラムに於いて、前記凍結ステップ及び再開ステ ップは、前記仮想サーバ管理情報力 仮想サーバの状態と仮想サーバを構築して ヽ る実サーバを検索して凍結指示又は再開指示を行うことを特徴とするサーバ管理プ ログラム。
[13] 請求項 8記載のサーバ管理プログラムに於いて、前記ジョブ実行依頼ステップは、 前記実サーバ上に構築されている仮想サーバとの通信途絶による異常を検出した際 に、前記サーバ管理情報を参照して前記サーバの凍結状態を認識した場合は正常 と判断して前記異常検出を破棄することを特徴とするサーバ管理プログラム。
[14] 請求項 8記載のサーバ管理プログラムに於 、て、前記ジョブ受付ステップは、コンビ ユーティング環境によるジョブを受付けて複数の仮想サーバにジョブ実行を依頼させ ることを特徴とするサーバ管理プログラム。
[15] 実サーバ上に構築された仮想サーバを管理するサーバ管理装置に於いて、
前記仮想サーバの凍結時刻と再開時刻を含む計算機計画情報を管理する計算機 計画部と、
前記仮想サーバに設けられたジョブ制御部を管理するジョブ管理部と、 前記仮想サーバを構築する物理サーバの仮想サーバ制御部を管理する計算機管 理部と、
を備え、
前記計算機計画部は、
仮想サーバの凍結時刻と再開時刻を設定した計算機計画情報を作成する計画作 成部と、
現在時刻が前記凍結時刻に到達した際に前記計算機管理部に凍結を指示し、現 在時刻が前記再開時刻に到達した際に前記計算機管理部に再開を指示する計画 指示部と、
を備え、
前記ジョブ管理部は、
ジョブの依頼を受付けてキューに格納するジョブ受付部と、
前記キュー力 ジョブを取出し、前記計算機管理部に問合せてジョブの実行を依頼 する仮想サーバを決定した際に、ジョブ管理情報力も得られたジョブの実行終了時 刻と前記仮想サーバの凍結時刻とを比較し、前記実行終了時刻が前記凍結時刻より 前の場合は決定した仮想サーバのジョブ制御部にジョブの実行を依頼し、前記実行 終了時刻が前記凍結時刻を過ぎている場合は前記計算機管理部に再度問合せて 前記実行終了時刻が前記凍結時刻前となる仮想サーバを決定する処理を繰り返す ジョブ実行依頼部と、
前記仮想サーバのジョブ終了を認識した際に、前記仮想サーバのジョブ制御部に 依頼して終了したジョブを回収するジョブ回収部と、
を備え、
前記計算機管理部は、
前記ジョブ管理部力 問合せを受けた際に、ジョブ依頼先の実サーバと仮想サー バを検索して前記計画指示部の計算機計画情報力 得られた凍結時刻と共に応答 する依頼先検索部と、
前記仮想サーバの凍結指示を受けた際に、依頼先の仮想サーバが実行状態にあ ることを判別して、前記仮想サーバを構築する実サーバの仮想サーバ制御部に凍結 指示を送信し、ジョブ実行中の前記仮想サーバを凍結させる凍結部と、
前記仮想サーバの再開指示を受けた際に、依頼先の仮想サーバが凍結状態にあ ることを判別して、前記仮想サーバを構築する実サーバの仮想サーバ制御部に再開 指示を送信し、凍結中の前記仮想サーバにジョブの実行を再開させる再開部と、 を備えたことを特徴とするサーバ管理装置。
請求項 15記載のサーバ管理装置に於いて、
前記ジョブ管理情報は、ジョブ識別子、ジョブが凍結が可能か又は不可かを示す凍 結可否情報、ジョブが凍結不可の場合の予想実行時間を含み、
前記ジョブ実行依頼部は、前記キュー力 取出したジョブが凍結不可で且つ前記 予想実行時間から求めた実行終了時刻が前記凍結時刻を過ぎて ヽる場合に、前記 実行終了時刻が前記凍結時刻より前となる仮想サーバを決定する処理を繰り返すこ とを特徴とするサーバ管理装置。
[17] 請求項 15記載のサーバ管理装置に於いて、前記サーバ管理情報は、
ジョブを実行するサーバ名又はネットワークアドレス、実サーバか仮想サーバかの 種別、各サーバの稼動、停止又は凍結の状態、各サーバの実行ジョブ数を含む分 散制御情報と、
実サーバと仮想サーバの対応関係、前記仮想サーバの稼動、停止又は凍結の状 態、前記仮想サーバ毎の実行中のジョブ一覧を含む仮想サーバ管理情報と、 を備えたことを特徴とするサーバ管理装置。
[18] 請求項 17記載のサーバ管理装置に於いて、前記依頼先検索部は、前記分散制御 情報を参照して稼動状態にある複数の仮想サーバの中力 実行ジョブ数が最小の 仮想サーバをジョブ依頼先として決定することを特徴とするサーバ管理装置。
[19] 請求項 17記載のサーバ管理装置に於いて、前記凍結処理部及び再開処理部は、 前記仮想サーバ管理情報力 仮想サーバの状態と仮想サーバを構築している実サ ーバを検索して凍結指示又は再開指示を行うことを特徴とするサーバ管理装置。
[20] 請求項 15記載のサーバ管理装置に於いて、前記ジョブ実行依頼部は、前記実サ ーバ上に構築されている仮想サーバとの通信途絶による異常を検出した際に、前記 サーバ管理情報を参照して前記サーバの凍結状態を認識した場合は正常と判断し て前記異常検出を破棄することを特徴とするサーバ管理装置。
PCT/JP2006/305373 2006-03-17 2006-03-17 サーバ管理方法、プログラム及び装置 WO2007108065A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008506081A JP4700104B2 (ja) 2006-03-17 2006-03-17 サーバ管理方法、プログラム及び装置
PCT/JP2006/305373 WO2007108065A1 (ja) 2006-03-17 2006-03-17 サーバ管理方法、プログラム及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/305373 WO2007108065A1 (ja) 2006-03-17 2006-03-17 サーバ管理方法、プログラム及び装置

Publications (1)

Publication Number Publication Date
WO2007108065A1 true WO2007108065A1 (ja) 2007-09-27

Family

ID=38522106

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2006/305373 WO2007108065A1 (ja) 2006-03-17 2006-03-17 サーバ管理方法、プログラム及び装置

Country Status (2)

Country Link
JP (1) JP4700104B2 (ja)
WO (1) WO2007108065A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010211615A (ja) * 2009-03-11 2010-09-24 Fujitsu Ltd プログラム、コンピュータ及び制御方法
CN109388487A (zh) * 2018-10-16 2019-02-26 Oppo广东移动通信有限公司 应用程序处理方法和装置、电子设备、计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07254918A (ja) * 1994-03-16 1995-10-03 Fujitsu Ltd モデム監視装置
JP2004302741A (ja) * 2003-03-31 2004-10-28 Fujitsu Ltd グリッドコンピューティングを用いたシステムにおけるリソース提供方法,そのシステムにおける監視装置,その監視装置用プログラムおよびそのシステムにおけるリソース提供端末用プログラム
JP2005250597A (ja) * 2004-03-01 2005-09-15 Toyota Motor Corp プログラム及びコンピュータ

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07254918A (ja) * 1994-03-16 1995-10-03 Fujitsu Ltd モデム監視装置
JP2004302741A (ja) * 2003-03-31 2004-10-28 Fujitsu Ltd グリッドコンピューティングを用いたシステムにおけるリソース提供方法,そのシステムにおける監視装置,その監視装置用プログラムおよびそのシステムにおけるリソース提供端末用プログラム
JP2005250597A (ja) * 2004-03-01 2005-09-15 Toyota Motor Corp プログラム及びコンピュータ

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SATO O. ET AL.: "UML Scrapbook to Snapshot Programming Kankyo no Jitsugen", LINUX CONFERENCE SHOROKUSHU, RONBUN BANGO CP-15, JAPAN LINUX ASSOCIATION, vol. 1, 1 November 2003 (2003-11-01), pages 1 - 11, XP003017883 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010211615A (ja) * 2009-03-11 2010-09-24 Fujitsu Ltd プログラム、コンピュータ及び制御方法
CN109388487A (zh) * 2018-10-16 2019-02-26 Oppo广东移动通信有限公司 应用程序处理方法和装置、电子设备、计算机可读存储介质

Also Published As

Publication number Publication date
JPWO2007108065A1 (ja) 2009-07-30
JP4700104B2 (ja) 2011-06-15

Similar Documents

Publication Publication Date Title
JP4606404B2 (ja) 計算資源管理プログラムおよび計算資源管理装置
JP4920391B2 (ja) 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム
JP4980792B2 (ja) 仮想計算機の性能監視方法及びその方法を用いた装置
EP1451687B1 (en) Real composite objects for providing high availability of resources on networked systems
Vadhiyar et al. A performance oriented migration framework for the grid
Marshall et al. Improving utilization of infrastructure clouds
US8260840B1 (en) Dynamic scaling of a cluster of computing nodes used for distributed execution of a program
WO2012066640A1 (ja) 計算機システム、マイグレーション方法及び管理サーバ
CN101309208B (zh) 一种适用于网格环境的基于可靠性代价的作业调度系统
CN106874084B (zh) 一种分布式工作流调度的方法、装置及计算机设备
US9112750B2 (en) Job management server and job management method
JP5737057B2 (ja) プログラム、ジョブスケジューリング方法、および情報処理装置
JP5422342B2 (ja) インシデント管理方法および運用管理サーバ
US20060070067A1 (en) Method of using scavenger grids in a network of virtualized computers
JPWO2007108062A1 (ja) サーバ管理方法、プログラム及び装置
JP4700104B2 (ja) サーバ管理方法、プログラム及び装置
JP5597293B2 (ja) 計算機システム及びプログラム
Saphir et al. Job management requirements for NAS parallel systems and clusters
JP4723465B2 (ja) ジョブ割当プログラム及びジョブ割当方法
US20120303720A1 (en) Rapid notification system
US20230418663A1 (en) System and methods for dynamic workload migration and service utilization based on multiple constraints
JP5390651B2 (ja) 計算機システム及びプログラム
Chrabakh et al. Gridsat: Design and implementation of a computational grid application
JP2010140106A (ja) ジョブ実行システム、該システムに用いられるジョブフロー引継ぎ方法及びジョブフロー引継ぎ制御プログラム
Gourlay et al. Performance evaluation of a SNAP-based grid resource broker

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 06729363

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2008506081

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 06729363

Country of ref document: EP

Kind code of ref document: A1