WO2011061870A1 - 計算機システム、管理サーバ及び電力削減方法 - Google Patents

計算機システム、管理サーバ及び電力削減方法 Download PDF

Info

Publication number
WO2011061870A1
WO2011061870A1 PCT/JP2010/001580 JP2010001580W WO2011061870A1 WO 2011061870 A1 WO2011061870 A1 WO 2011061870A1 JP 2010001580 W JP2010001580 W JP 2010001580W WO 2011061870 A1 WO2011061870 A1 WO 2011061870A1
Authority
WO
WIPO (PCT)
Prior art keywords
power
saving operation
power saving
load
computer system
Prior art date
Application number
PCT/JP2010/001580
Other languages
English (en)
French (fr)
Inventor
愛甲和秀
志賀陽子
高本良史
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Publication of WO2011061870A1 publication Critical patent/WO2011061870A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode

Definitions

  • the present invention relates to a computer system, a management server, and a power reduction method, and is suitable for application to, for example, dynamic operation of computer resources.
  • the system configuration can be changed flexibly and easily according to the application.
  • the power consumption of the system can be reduced by changing the system configuration based on the usage status in the system.
  • Japanese Patent Application Laid-Open No. 2004-228561 discloses a technique for reducing the power consumption of the system by changing the system configuration based on the amount of change in power consumption before and after the change of the system configuration.
  • the present invention has been made in view of the above points, and intends to propose a computer system, a management server, and a power reduction method capable of appropriately suppressing power consumption even when the system load frequently changes. It is.
  • the management server includes one or more of the physical servers. Calculate the time during the power saving operation where the amount of power consumed from when the server is instructed to save power and when the power saving operation ends is equal to the amount of power that can be reduced by the power saving operation.
  • the time when the load is predicted to be lower than the predetermined threshold is calculated, and the calculated time during the power saving operation and the Whether the load is predicted to be less than a predetermined threshold or not, and whether or not to put the one or more physical servers into power saving operation based on the comparison result Determination characterized in that it.
  • a management server connected to a plurality of physical servers via a network
  • the time during the power saving operation is calculated. Is calculated by comparing the time during which the power saving operation is calculated and the time during which the load is predicted to be lower than the predetermined threshold. Based on the result, it is determined whether or not the one or more physical servers are to be put into power saving operation.
  • the management server includes one or more physical servers. Calculates the time during the power saving operation where the amount of power consumed from when the power saving operation is instructed until the power saving operation ends is equal to the amount of power that can be reduced by the power saving operation.
  • the management server compares a calculated time during the power saving operation with a time during which the load is predicted to be equal to or less than a predetermined threshold.
  • the management server characterized in that it comprises a fourth step of determining whether the one or more the physical server operating power saving based on the comparison result.
  • reference numeral 1 denotes a computer system according to this embodiment installed in a data center as a whole.
  • a management server 2 and a client terminal 3 are connected to a plurality of physical servers 5 via a network switch 4, and the management server 2 and each physical server 5 are each connected to a storage device 7 via a storage switch 6. It is comprised by connecting with.
  • the management server 2 includes a personal computer or a workstation, and includes a memory 21, a CPU (Central Processing Unit) 22, a network interface 23, and a disk interface 24 as shown in FIG.
  • a CPU Central Processing Unit 22
  • a network interface 23 As shown in FIG.
  • the CPU 22 is a processor that controls operation of the entire management server 2, and executes necessary processing based on a control program group 211 and a management table group 212 described later stored in the memory 21.
  • the memory 21 is used not only for storing a control program group 211 and a management table group 212, which will be described later, but also used as a work memory for the CPU 22.
  • the network interface 23 is a communication interface corresponding to the network switch 4 (FIG. 1), and performs protocol control when the management server 2 communicates with each physical server 5.
  • the disk interface 24 is a communication interface corresponding to the storage switch 6, and performs protocol control when the management server 2 communicates with the storage apparatus 7.
  • the physical server 5 is composed of a personal computer or a workstation like the management server 2 and includes a CPU 55, a memory 54, a network interface 56, and a disk interface 57 as shown in FIG.
  • the CPU 55, the memory 54, the network interface 56, and the disk interface 57 have the same functions as the CPU 22, the memory 21, the network interface 23, and the disk interface 24 of the management server 2, respectively, and therefore, detailed description thereof is omitted. To do.
  • the storage device 7 includes a plurality of disk devices (not shown) operated by, for example, a RAID (Redundant Array of Inexpensive Disks) method. As shown in FIG. 1, a plurality of volumes 71 are defined on the storage areas provided by the plurality of disk devices.
  • the volume 71A stores virtualization means 72 for operating a virtual server 53, which will be described later, on the physical server 5, and the volumes 71B to 71B have OS (Operating System) 73A to H (OS-0 to OS-7) respectively.
  • OS Operating System
  • the virtualization means 72 includes a hypervisor.
  • each physical server 5 operates as a normal server under the control of the OS 52 (OS-0).
  • OS-0 the physical server 5A reads the OS 73A (OS-0) stored in the volume 71B into the memory 54 as the OS 51 (OS-0), and starts the read OS 51 (OS-0). To do.
  • the physical server 5B operates the virtual server 53A loaded with OS-1 and the virtual server 53B loaded with OS-2 under the control of the virtualization means 52A.
  • the process to reach this state will be described.
  • the physical server 5B reads the virtualization unit 72 stored in the volume 71A as the virtualization unit 52A into the memory 54, and the virtualization unit 52A stores the OS 73B (OS -1) is read into the memory 54, and the virtual server 53A loaded with OS-1 is activated. Further, the virtualization unit 52A reads the OS 73C (OS-2) stored in the volume 71D into the memory 54, and starts the virtual server 53B equipped with OS-2. The same applies to the physical servers 5C to E.
  • the physical server 5 and / or the virtual server 53 are rearranged by power saving operation. That is, not only the physical server 5 and / or the virtual server 53 but also the virtual server 53 is migrated. As a prerequisite for migration, resources required by the operating virtual server 53 must be secured in the physical server 5 that is the migration destination.
  • the virtual server 53 must be able to access the volume 71 of the storage apparatus 7 before and after the migration.
  • the physical server 5 or the virtual server 53 can share the volume 71.
  • the management server 2 includes an operation status monitoring program 2111, a parameter information collection program 2112, a power saving operation program 2113, as a control program group 211 in the memory 21.
  • a configuration change permission determination program 2114 and a server placement program 2115 are included. Each of these programs is divided for ease of explanation, but may be realized as one, or may be arbitrarily divided depending on the mounting convenience.
  • the operating condition monitoring program 2111 generates or updates a model for predicting the time when the load is again equal to or greater than a predetermined threshold in response to a user operation or a request from the configuration change enable / disable determination program 2114,
  • the performance information of the server 5 is collected and registered in the configuration information table 2121.
  • the parameter information collection program 2112 measures the power consumed by the newly registered physical server 5 and the time required for the physical server 5 to start and stop each time a new physical server 5 is registered. Each time 53 is newly registered, the power consumed by the virtual server 53 and the virtualization means 52 and the time required for the virtualization means 52 to start and stop are measured, and the measured information is registered in the power data information table 2122 To do.
  • the power saving operation program 2113 collects the specific virtual server 53 into the specific physical server 5 and operates the virtual server 53 according to the system load.
  • An aggregation plan composed of powering off the physical servers 5 that are not yet created is created, and the aggregation plan is transmitted to the configuration change possibility determination program 2114. More specifically, regarding the consolidation plan, as many virtual servers 53 as possible are migrated to the physical servers 5 having a small power consumption value per performance, and as many physical servers 5 where no virtual servers 53 operate are provided as much as possible.
  • the power of the physical server 5 in which no virtual server 53 is operated is turned off, and the technique of Patent Document 1 is used.
  • the performance here refers to a CPU frequency or a memory capacity. Note that the meaning of the term “power off” includes hypernation, which is a process of turning off the power by writing data in the memory to the disk, instead of the OS shutdown operation.
  • the configuration change possibility determination program 2114 Upon receiving the aggregation plan from the power saving operation program 2113, the configuration change possibility determination program 2114 calculates the minimum maintenance time and the load increase prediction time, compares the calculated minimum maintenance time with the load increase prediction time, Based on the comparison result, it is determined whether or not the power saving operation should be performed. When it is determined that the power saving operation should be performed, the server arrangement program 2115 is requested to execute the aggregation plan.
  • the minimum maintenance time is the amount of power consumed between the physical server that is powered off according to the aggregation plan being restarted after being instructed to power off and the amount of power that can be reduced by turning off the power is equal. It's time to go.
  • the predicted load rise time is a predicted time from when the load on the entire system becomes equal to or lower than a predetermined threshold until the load becomes equal to or higher than the predetermined threshold.
  • a known technique is used. For example, using a moving average method, the daily load fluctuation is predicted from the average value of the load history information at the same time for the latest one week.
  • the configuration change possibility determination program 2114 updates the model for predicting the time for the load to rise again in the operation status monitoring program 2111 when the time during which the actual system load is decreasing is shorter than the minimum maintenance time. Request.
  • the server placement program 2115 executes the placement change in the physical servers 5A to 5E of the virtual servers 53A to G and the power control of the physical servers 5A to E in accordance with the request for implementation of the aggregation plan from the configuration change permission determination program 2114.
  • the management server 2 has a configuration information table 2121, a power data configuration table 2122, and a minimum maintenance time calculation formula list 2123 as a management table group 212 in the memory 21.
  • the configuration information table 2121 is installed directly in the physical server identifier column 21211, the processor performance and memory capacity 21212 as resources of the physical server 5, the virtualization identifier column 21213 of the virtualization means 52, and the physical server 5 Virtualization means or OS column 21214, virtual server 53 identifier column 21215, processor performance and memory capacity column 21216 as the virtual server 53 resource, guest OS identifier column 21217 on the virtual server 53, and performance It has a column 21218 for allowable degradation time.
  • the allowable performance deterioration time is a time during which the performance is deteriorated that the physical server 5 or the virtual server 53 can tolerate for the OS.
  • the processor performance is indicated by the processor clock frequency and the number of processors having the performance for simplicity. Examples of names and numerical values shown in the configuration information table 2121 represent the system configuration of FIG. 1, and operations using these examples will be described later, so the details are omitted here.
  • the power data information table 2122 includes a measurement target column 21221, a power column 21222 in a state where no load is applied to the measurement target, a state where the load is applied to the CPU and memory of the measurement target Power column 21223, measurement target start time column 21224, and stop time column 21225.
  • the minimum maintenance time calculation formula list 2123 includes a calculation formula 21231 for calculating the minimum maintenance time, and a dependency parameter column 21232 representing variables necessary for calculating the minimum maintenance time in the calculation formula 21231.
  • each variable in the minimum maintenance time calculation formula list 2123 is calculated by the following formula.
  • FIG. 7 shows that an aggregation plan is created in which the virtual server 53 is migrated to the three physical servers 5 and the power of the two physical servers 5 in which no virtual server 53 is operating is turned off. It is a figure showing transition of electric power when the load to the whole system falls. A change in power consumption of the entire system in the power saving operation in which the aggregation is performed is indicated by a broken line, and a change in power consumption of the entire system in the normal operation in which the aggregation is not executed is indicated by a solid line.
  • P base represents the sum of the base power of the physical server 5 and the virtualization means 52
  • P meter represents the power consumption of the physical server 5, and the following relational expression is established.
  • the load decreases at time T0.
  • the management server 2 detects a decrease in load at time T1, and starts an aggregation operation such as migration of the virtual server 53 and powering off of the physical server 5 in the physical server 5.
  • the power saving operation and the normal operation are compared between the time T1 and the time T2 at which the power off of the physical server 5 ends, the power saving operation uses the power to use the power associated with the power off operation. Consume a lot. If this wasted power per physical server is P Off , it can be calculated by the following formula.
  • P max is the power consumption of the physical server 5 when the load on the CPU 55 and the memory 54 is 100%.
  • the number of physical servers 5, the number of virtual servers 53, and the load on the virtual server 53 in the time from time T1 to time T2 are the same. Only the power required for processing is increased. Therefore, in the example of FIG. 7, since the number of physical servers to be powered off is two, the difference to be obtained is the sum of the two physical servers.
  • the power-off operation is performed after the virtual server 53 has moved to another physical server 5 and is always loaded with 100% load. You may measure the electric power concerning actual power-off operation, and use the measured value. Furthermore, when power consumption is reduced by shifting to the power saving mode provided by hardware or OS instead of turning off the power, the result of measuring the power required for the shifting operation is used instead of the value of equation (8). do it.
  • the power-off operation is completed at time T2
  • the number of servers operating is changed from five to three. Therefore, comparing the power saving operation with the normal operation, the normal operation is more effective in the power saving operation. As much power as the base power of the physical server 5 that is turned off is consumed. Since the load on the virtual server 53 is the same, the reduced base power for two physical servers is a reduction amount.
  • the management server 2 detects that a time obtained by subtracting the boot processing time from the time T4 at which the load increase is predicted at the time T3, and starts processing for returning the configuration. At that time, comparing the power saving operation with the normal operation, the power saving operation consumes a lot of power accompanying the power-on operation. This can be calculated by the same calculation formula as the power-off operation.
  • ⁇ P reboot (n) is defined as follows:
  • the amount of power to be reduced is larger than the amount of wasted power due to the power operation on the physical server 5.
  • T OFF When the power-off time is represented by T OFF , the power-on time is represented by T ON , and the minimum maintenance time is represented by T low in the equation (14).
  • the management server 2 performs control so that the power saving operation is executed when the aggregated time T low is larger than the value of the right type, and the normal operation is executed when the time T low is smaller than the value of the right type. As a result, the power reduction effect can be obtained with certainty.
  • the two physical servers 5 are powered off.
  • the minimum maintenance time T low can be defined as in the following equation. This calculation formula is stored in the calculation formula 21231 of the minimum maintenance time calculation list 2123.
  • the five programs of the operation status monitoring program 2111, the parameter information collection program 2112, the power saving operation program 2113, the configuration change enable / disable determination program 2114, and the server arrangement program 2115 are executed in parallel processing.
  • the processing subject of various processes is described as a “program” installed in the management server 2, but in practice, the CPU 22 (FIG. 2) of the management server 2 executes the process based on the program. Needless to say.
  • the operation status monitoring program 2111 of the management server 2 will be described in detail with reference to FIG.
  • the operation status monitoring program 2111 determines whether or not there has been a load prediction model setting operation by the user or an update event notification from the configuration change enable / disable determination program 2114 (SP101). ).
  • the load prediction model is a method of taking a sample for predicting a future load and a calculation formula for a predicted value.
  • step 101 If a negative result is obtained in the determination of step 101, the process proceeds to step 103.
  • the operating condition monitoring program 2111 If an affirmative result is obtained in the determination in step 101, the operating condition monitoring program 2111 generates a load prediction model according to the detected setting operation or update event (SP102), and the process proceeds to step 103.
  • step 103 the operation status monitoring program 2111 determines whether or not a predetermined performance information collection cycle has come (SP103).
  • step 103 If a negative result is obtained in the determination in step 103, the process returns to step 101.
  • the operation status monitoring program 2111 collects performance information of each physical server 5 (SP104), and stores / updates it in the memory 21 of the management server 2 as performance history information. (SP105), it returns to step 101.
  • the parameter information collection program 2112 of the management server 2 will be described with reference to FIG.
  • the parameter information collection program 2112 determines whether or not the physical server 5 is newly registered (SP201).
  • step 201 If a negative result is obtained in the determination of step 201, the process proceeds to step 207.
  • the parameter information collection program 2112 starts the newly registered physical server 5 in a state where the OS is not installed, measures a stable power value, and calculates the measured power value.
  • the base power of the physical server 5 is registered in the power data information table 2122 (SP202).
  • the parameter information collection program 2112 transmits the load application program to the newly registered physical server 5 for installation (SP203).
  • the parameter information collection program 2112 generates a state in which the load is applied to the CPU 55 and the memory 54 of the newly registered physical server 5 by using the loading program, and measures the power value at that time. The result is registered in the power data information table 2122 as MAX power of the physical server 5 (SP204).
  • the parameter information collection program 2112 starts and stops the newly registered physical server 5, measures the time required to start and stop, and uses the measured time as the start and stop time of the physical server 5 in the power data information table 2122. Register (SP205).
  • the parameter information collection program 2112 uninstalls the load application program on the newly registered physical server 5 (SP206), and proceeds to step 207.
  • the parameter information collection program 2112 determines whether or not the virtual server 53 is newly registered (SP207).
  • step 207 If a negative result is obtained in the determination of step 207, the process returns to step 201.
  • the parameter information collection program 2112 starts the physical server 5 in which the virtual server 53 is newly registered in a state where only the virtualization means 52 is installed, and generates a stable power value. Is registered in the power data information table 2122 as the base power of the converting means 52 (SP208).
  • the parameter information collection program 2112 starts / stops the virtualization unit 52 and registers the time required for startup / stop in the power data information table 2122 as the startup / stop time of the virtualization unit 52 (SP209).
  • the parameter information collection program 2112 is activated in a state where only one virtual server 53 is generated on the virtualization unit 52, and the difference between the stable power and the base power of the physical server 5 measured in step 202 is determined by the virtual server 53.
  • the base power is registered in the power data information table 2122 (SP210), and the process returns to step 201.
  • the power saving operation program 2113 of the management server 2 will be described in detail with reference to FIG.
  • the power saving operation program 2113 determines whether or not the load on the server system has become a predetermined threshold value or less (SP301).
  • step 301 If a negative result is obtained in the determination of step 301, the process returns to step 301.
  • the power saving operation program 2113 creates a virtual server aggregation plan based on the load information of the current server system, and determines the number of physical servers that can be powered off and which physical server. It is determined whether to turn off (SP302), the result is notified to the configuration change possibility determination program 2114 (SP303), and the process returns to step 301.
  • the configuration change permission determination program 2114 of the management server 2 will be described in detail with reference to FIG. First, when the configuration change enable / disable determination program 2114 receives an aggregation plan from the power saving operation program 2113 (SP401), the power value of the power data information table 2122 is supplied to each physical server 5 to be powered off based on the received aggregation plan. Then, the reboot power and the reboot time are calculated using the reboot power calculation formula and the reboot time calculation formula in the minimum maintenance time calculation list 2123 (SP402).
  • the configuration change enable / disable determining program 2114 gives the power value of the power data information table 2122, the reboot power and reboot time calculated in step 402, and the minimum maintenance time calculation formula list for each physical server 5 to be powered off.
  • the minimum maintenance time is calculated using the minimum maintenance time calculation formula in 2123 (SP403).
  • the configuration change possibility determination program 2114 calculates the predicted time of the next load increase from the predicted value of the time until the configuration is restored, the load fluctuation history information, and the load prediction model (SP404).
  • the configuration change enable / disable determination program 2114 determines that the sum of the estimated load increase time calculated in step 404 and the allowable performance degradation time in the configuration information table 2121 of the virtual server running on the physical server to be powered off is obtained in step 403. It is determined whether or not the calculated value is greater than the minimum maintenance time value (SP405). By considering the allowable performance degradation time, it is possible to keep the physical server power off for a long time while keeping the impact on the business within the allowable range of the administrator. Can be reduced.
  • SP405 minimum maintenance time value
  • step 405 If a negative result is obtained in the determination of step 405, the process is terminated.
  • the configuration change enable / disable determination program 2114 requests the server placement program 2115 to change the configuration, and reduces the power consumption of the system by turning off the physical server 5 (SP406).
  • the configuration change possibility determination program 2114 detects an increase in system load from the server placement program 2115, and determines whether or not there is a notification that the configuration has been restored (SP407).
  • the configuration change enable / disable determination program 2114 returns to step 407 and waits until notified from the server arrangement program 2115.
  • the configuration change permission determination program 2114 determines whether or not the minimum maintenance time has elapsed since the server placement program 2115 was requested to change the configuration (SP408).
  • step 408 If a positive result is obtained in the determination in step 408, the process is terminated.
  • the configuration change possibility determination program 2114 requests the operation status monitoring program 2111 to generate an update event of the load prediction model (SP409), and ends the process. For example, when the minimum maintenance time has not elapsed in step 408, that is, when it is determined that the load prediction has been missed, the operating condition monitoring program 2111 increases the number of samples of the moving average method from one week to one month, Updates are performed by weighting sample values.
  • the server placement program 2115 of the management server 2 will be described in detail with reference to FIG. 12 [9].
  • the server placement program 2115 performs migration of the virtual server 53 and power-off of the physical server 5 according to the received aggregation plan (SP502).
  • the server placement program 2115 determines whether or not the system load has exceeded a predetermined threshold (SP503).
  • step 503 If a negative result is obtained in the determination in step 503, the server placement program 2115 returns to step 503 and waits until the system load increases.
  • the server arrangement program 2115 returns the system configuration that has been changed according to the aggregation plan to the state before the aggregation (SP504), and a configuration change permission determination program 2114 to that effect. (SP505), and the process ends.
  • the amount of power that can be reduced by turning off the physical server 5 is the amount of power required to turn off the physical server 5 and the power required to start up the physical server 5.
  • the power saving operation is performed, and when the amount is smaller, the normal operation is performed to appropriately save power.
  • the computer system 1 updates the model for predicting the time at which the load re-rises. Can be predicted.
  • the management server 2 has described the case where the control program group 211 and the management table group 212 are stored in the memory 21.
  • the present invention is not limited to this, and the storage device 7 is stored in the external storage.
  • the control program group 211 and the management table group 212 may be stored in the volume 71.
  • the virtualization unit 52 is realized by software.
  • the present invention is not limited to this, and the function is divided between software and firmware from the viewpoint of high performance. It may be realized.
  • each physical server 5 reads the virtualization unit 72 from the volume 71A.
  • the present invention is not limited to this, and a virtualization unit is provided for each physical server 5. It may be stored in the storage device 7 and each physical server 5 may read dedicated virtualization means.
  • the present invention is not limited to this, and the management server 2 Alternatively, the client terminal 3 and each physical server 5 may be connected via a LAN (Local Area Network) or the like.
  • LAN Local Area Network
  • the present invention is not limited thereto, and other than that, The number and performance of communication interfaces connected to an input / output device, a storage device (disk volume), or a network may be applied.
  • the moving average method is used to calculate the load increase prediction time.
  • the present invention is not limited to this, and other prediction methods such as the exponential smoothing method are used. May be used.
  • the present invention is not limited to this, and the above condition is satisfied.
  • the administrator's permission may be obtained, and when the administrator's permission is obtained, the configuration of the computer system 1 may be changed.
  • FIG. 13 shows an example of a screen image of the management server 2 in this embodiment.
  • the management screen of the management server 2 has a configuration information pane 1201, a performance information pane 1202, a configuration change proposal pane 1203, and a configuration change execution confirmation pane 1204.
  • the configuration information pane 1201 is a pane for displaying information corresponding to the system configuration in FIG. 1 and allowing the user to check the configuration.
  • the performance information pane 1202 is a pane for displaying the current time T1, the performance history information accumulated by the operation status monitoring program 2111, and the performance prediction information calculated from the load prediction model, and allowing the user to check the performance prediction result. .
  • the configuration change pane 1203 displays the configuration change proposal calculated by the power saving operation program 2113, the configuration change power amount calculated by the configuration change enable / disable determination program 2114, and the configuration maintenance time so that the user can confirm the effect of the configuration change.
  • the configuration maintenance time is the minimum maintenance time
  • the configuration change power amount is the product of the reboot power calculated in step 402 and the minimum maintenance time.
  • the configuration change execution confirmation pane 1204 is a pane for requesting a determination by the user before requesting a configuration change to the server arrangement program 2115 in step 406.
  • the present invention can be widely applied to a computer system including a plurality of physical servers each operating one or a plurality of virtual servers.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)
  • Debugging And Monitoring (AREA)

Abstract

 適切に消費電力を抑えることが可能な計算機システム、管理サーバ、及び電力削減方法を提案する。 計算機システムにおいて、複数の物理サーバと、物理サーバとネットワークを介して接続される管理サーバとから構成され、管理サーバは、1又は複数の物理サーバが電源オフを指示されてから再起動するまでに消費する消費電力量と当該電源オフによって削減できる削減電力量とが等しくなる、当該電源オフである間の時間を算出し、計算機システムに対する負荷が所定の閾値以下になった場合に、当該負荷が所定の閾値以下であると予測される時間を算出し、算出された電源オフである間の時間と負荷が所定の閾値以下であると予測される時間とを比較し、比較した結果に基づいて1又は複数の前記物理サーバの電源をオフするか否かを決定する。

Description

計算機システム、管理サーバ及び電力削減方法
 本発明は、計算機システム、管理サーバ及び電力削減方法に関し、例えば、計算機資源の動的な運用に適用して好適なものである。
 従来、プライベートクラウドシステムにおいては、用途に応じてシステム構成を柔軟に、かつ容易に変更する事ができる。そして、本システムにおいては、システム内の使用状況に基づいて、システム構成を変更することによって、システムの消費電力を削減することができる。
 特許文献1では、システム構成の変更前後における消費電力の変化量をもとにシステム構成を変更して、システムの消費電力を削減する技術が開示されている。
特開2007-310791号公報
 しかしながら、特許文献1の技術では、構成変更中に消費する電力量が考慮されていないため、システムの負荷が頻繁に変わることによりシステム構成が頻繁に変更するような状況においては、再起動操作によって消費する無駄な電力が増大することにより、かえってシステム構成を変更しない場合よりもシステム全体の消費電力量が増加してしまう。
 本発明は、以上の点を考慮してなされたもので、システムの負荷が頻繁に変わる場合でも適切に消費電力を抑えることが可能な計算機システム、管理サーバ及び電力削減方法を提案しようとするものである。
 かかる課題を解決するため本発明においては、複数の物理サーバと、前記物理サーバとネットワークを介して接続される管理サーバとから構成される計算機システムにおいて、前記管理サーバは、1又は複数の前記物理サーバが省電力運用を指示されてから省電力運用が終了するまでに消費する消費電力量と当該省電力運用によって削減できる削減電力量とが等しくなる、当該省電力運用である間の時間を算出し、当該計算機システムに対する負荷が所定の閾値以下になった場合に、当該負荷が所定の閾値以下であると予測される時間を算出し、算出された前記省電力運用である間の時間と前記負荷が所定の閾値以下であると予測される時間とを比較し、比較した結果に基づいて前記1又は複数の前記物理サーバを省電力運用にするか否かを決定することを特徴とする。
 また本発明においては、複数の物理サーバにネットワークを介して接続される管理サーバにおいて、1又は複数の前記物理サーバが省電力運用を指示されてから省電力運用が終了するまでに消費する消費電力量と当該省電力運用によって削減できる削減電力量とが等しくなる、当該省電力運用である間の時間を算出し、前記複数の物理サーバに対する負荷が所定の閾値以下になった場合に、当該負荷が所定の閾値以下であると予測される時間を算出し、算出された前記省電力運用である間の時間と前記負荷が所定の閾値以下であると予測される時間とを比較し、比較した結果に基づいて前記1又は複数の前記物理サーバを省電力運用にするか否かを決定することを特徴とする。
 さらに本発明においては、複数の物理サーバと、前記物理サーバとネットワークを介して接続される管理サーバとから構成される計算機システムの省電力方法において、前記管理サーバが、1又は複数の前記物理サーバが省電力運用を指示されてから省電力運用が終了するまでに消費する消費電力量と当該省電力運用によって削減できる削減電力量とが等しくなる、当該省電力運用である間の時間を算出する第1のステップと、前記管理サーバが、当該計算機システムに対する負荷が所定の閾値以下になった場合に、当該負荷が所定の閾値以下であると予測される時間を算出する第2のステップと、前記管理サーバが、算出された前記省電力運用である間の時間と前記負荷が所定の閾値以下であると予測される時間とを比較する第3のステップと、前記管理サーバが、比較した結果に基づいて前記1又は複数の前記物理サーバを省電力運用するか否かを決定する第4のステップと、を備えることを特徴とする。
 本発明によれば、適切に消費電力を抑えることが可能な計算機システム、管理サーバ、及び電力削減方法を実現できる。
本実施の形態による計算機システムの構成を示すブロック図である。 管理サーバの構成を示すブロック図である。 物理サーバの構成を示すブロック図である。 構成情報テーブルを説明するための図である。 電力データ情報テーブルを説明するための図である。 最低維持時間算出式リストを説明するための図である。 集約を実行した場合におけるシステム全体の消費電力の時間変化の一例を示す図である。 稼動状況監視プログラムの処理フローチャートである。 パラメータ情報収集プログラムの処理フローチャートである。 省電力運用プログラムの処理フローチャートである。 構成変更可否決定プログラムの処理フローチャートである。 サーバ配置プログラムの処理フローチャートである。 管理サーバの画面イメージの一例を示す図である。
 以下、図面について本発明の一実施の形態を詳述する。
(1)本実施の形態による計算機システムの構成
 図1において、1は全体としてデータセンタに設置された本実施の形態による計算機システムを示す。この計算機システム1は、管理サーバ2及びクライアント端末3がネットワークスイッチ4を介して複数の物理サーバ5と接続されると共に、管理サーバ2及び各物理サーバ5がそれぞれストレージスイッチ6を介してストレージ装置7と接続されることにより構成されている。
 管理サーバ2は、パーソナルコンピュータ又はワークステーションなどから構成され、図2に示すように、メモリ21、CPU(Central Processing Unit)22、ネットワークインタフェース23及びディスクインタフェース24を備える。
 CPU22は、管理サーバ2全体の動作制御を司るプロセッサであり、メモリ21に格納された後述の制御プログラム群211及び管理テーブル群212に基づいて必要な処理を実行する。メモリ21は、後述する制御プログラム群211及び管理テーブル群212を記憶するために用いられるほか、CPU22のワークメモリとしても用いられる。
 ネットワークインタフェース23は、ネットワークスイッチ4(図1)に対応した通信インタフェースであり、管理サーバ2が各物理サーバ5と通信する際のプロトコル制御を行う。またディスクインタフェース24は、ストレージスイッチ6に対応した通信インタフェースであり、管理サーバ2がストレージ装置7と通信する際のプロトコル制御を行う。
 物理サーバ5は、管理サーバ2と同様にパーソナルコンピュータ又はワークステーションなどから構成され、図3に示すように、CPU55、メモリ54、ネットワークインタフェース56及びディスクインタフェース57を備える。これらCPU55、メモリ54、ネットワークインタフェース56及びディスクインタフェース57は、それぞれ管理サーバ2のCPU22、メモリ21、ネットワークインタフェース23及びディスクインタフェース24と同様の機能を有するものであるため、その詳細については説明を省略する。
 ストレージ装置7(図1)は、例えばRAID(Redundant Array of Inexpensive Disks)方式で運用される複数のディスク装置(図不掲載)を備えて構成される。図1に示すように、これら複数のディスク装置が提供する記憶領域上には複数のボリューム71が定義される。ボリューム71Aは、後述の仮想サーバ53を物理サーバ5上で動作させる仮想化手段72を格納し、ボリューム71B~Iは、それぞれOS(Operating System)73A~H(OS-0~OS-7)を格納する。なお、仮想化手段72としては、ハイパーバイザがある。
 ここで、図1を参照して、各物理サーバ5の稼働状態の例について説明する。例えば、物理サーバ5Aは、OS52(OS-0)の制御の下で通常のサーバとして動作している。この状態に至る過程を説明すると、物理サーバ5Aは、ボリューム71Bに格納されているOS73A(OS-0)をOS51(OS-0)としてメモリ54に読み込み、読み込んだOS51(OS-0)を起動する。
 例えば、物理サーバ5Bは、仮想化手段52Aの制御の下で、OS-1を搭載した仮想サーバ53Aと、OS-2を搭載した仮想サーバ53Bとを動作させている。この状態に至る過程を説明すると、物理サーバ5Bが、ボリューム71Aに格納された仮想化手段72を仮想化手段52Aとしてメモリ54に読み込み、仮想化手段52Aが、ボリューム71Cに格納されたOS73B(OS-1)をメモリ54に読み込み、OS-1を搭載した仮想サーバ53Aを起動する。また、仮想化手段52Aは、ボリューム71Dに格納されたOS73C(OS-2)をメモリ54に読み込み、OS-2を搭載した仮想サーバ53Bを起動する。物理サーバ5C~Eについても同様である。
 本実施の形態では、省電力運用により物理サーバ5及び/又は仮想サーバ53を再配置することを説明する。すなわち物理サーバ5及び/又は仮想サーバ53を停止するだけでなく、仮想サーバ53をマイグレーション(移行)する。マイグレーションの前提として、動作中の仮想サーバ53が必要としているリソースがマイグレーション先の物理サーバ5に確保されていなければならない。
 仮想サーバ53は、マイグレーションの前後でストレージ装置7のボリューム71に同様にアクセスできなければならない。ここでは、物理サーバ5又は仮想サーバ53は、ボリューム71を共用できることを前提としている。
(2)各種プログラム及び各種テーブルの構成
 管理サーバ2は、図2に示すように、メモリ21内に制御プログラム群211として、稼動状況監視プログラム2111、パラメータ情報収集プログラム2112、省電力運用プログラム2113、構成変更可否決定プログラム2114及びサーバ配置プログラム2115を有する。これらの各プログラムは、説明の分かり易さのために分けてあるが、一つに纏めて実現されても良いし、実装上の都合により任意に分けてもよい。
 稼動状況監視プログラム2111は、ユーザの操作、又は構成変更可否決定プログラム2114の要求に応じて、負荷が再び所定の閾値以上になる時間を予測するモデルを生成又は更新したり、周期毎に各物理サーバ5の性能情報を収集して構成情報テーブル2121に登録したりする。
 パラメータ情報収集プログラム2112は、物理サーバ5が新規登録されるたびに、新規登録された物理サーバ5が消費する電力と、物理サーバ5が起動・停止に要する時間とを測定し、また、仮想サーバ53が新規登録されるたびに、仮想サーバ53及び仮想化手段52が消費する電力と、仮想化手段52が起動・停止に要する時間とを測定し、測定した情報を電力データ情報テーブル2122に登録する。
 省電力運用プログラム2113は、システムの負荷が所定の閾値以下になった場合に、システムの負荷に応じて、特定の仮想サーバ53の特定の物理サーバ5への集約と、仮想サーバ53が稼働していない物理サーバ5の電源オフとから構成される集約案を作成し、構成変更可否決定プログラム2114に集約案を送信する。集約案について、具体的に述べると、性能あたりの消費電力値が小さい物理サーバ5にできるだけ多くの仮想サーバ53をマイグレーションさせて、仮想サーバ53が一台も稼働しない物理サーバ5を出来るだけ多く設け、仮想サーバ53が一台も稼働しない物理サーバ5の電源をオフするような案のことであり、特許文献1の技術が使用される。ここでいう性能とは、CPU周波数であったり、メモリの容量であったりする。なお「電源オフ」の用語の意味には、OSのシャットダウン操作の代わりに、メモリ内のデータをディスクに記載して電源を落とす処理であるハイパーネーションも含まれるものとする。
 構成変更可否決定プログラム2114は、省電力運用プログラム2113から集約案を受信すると、最低維持時間と負荷上昇予測時間とを算出し、算出した最低維持時間と負荷上昇予測時間とを比較して、その比較結果に基づいて省電力運用を行うべきか否かを判定し、省電力運用を行うべきと判定した場合には、サーバ配置プログラム2115に集約案の実行を要求する。最低維持時間とは、集約案によって電源オフされる物理サーバが電源オフを指示されてから再起動するまでに消費する消費電力量と電源オフによって削減できる削減電力量とが等しくなる、電源が切れている間の時間である。負荷予測上昇時間とは、システム全体への負荷が所定の閾値以下になってから所定の閾値以上になるまでの予測される時間であり、そのために公知技術が使用される。例えば、移動平均法を用いて、直近の一週間分の同時刻の負荷履歴情報の平均値から1日の負荷変動を予測する。
 また、構成変更可否決定プログラム2114は、実際のシステムの負荷が低下している時間が最低維持時間より短い場合には、稼動状況監視プログラム2111に、負荷が再上昇する時間を予測するモデルの更新を要求する。
 サーバ配置プログラム2115は、構成変更可否決定プログラム2114からの集約案実施の要求に従って、仮想サーバ53A~Gの物理サーバ5A~Eにおける配置変更、及び物理サーバ5A~Eの電源制御を実行する。
 また、管理サーバ2は、メモリ21内に管理テーブル群212として、構成情報テーブル2121、電力データ構成テーブル2122、及び最低維持時間算出式リスト2123を有する。
 構成情報テーブル2121は、図4に示すように、物理サーバ識別子欄21211、物理サーバ5のリソースとしてのプロセッサ性能とメモリ容量21212、仮想化手段52の仮想化識別子欄21213、物理サーバ5に直接インストールされている仮想化手段又はOSの欄21214、仮想サーバ53の識別子欄21215、仮想サーバ53のリソースとしてのプロセッサ性能とメモリ容量の欄21216、仮想サーバ53上のゲストOSの識別子欄21217、及び性能劣化許容時間の欄21218を有する。性能劣化許容時間とは、物理サーバ5又は仮想サーバ53がそのOSに対して許容できる、その性能が劣化している時間である。プロセッサ性能は、簡単のためにプロセッサのクロック周波数とその性能を持つプロセッサの個数で示してある。構成情報テーブル2121に示す名称や数値の例は、図1のシステム構成を表したものであり、これらの例を用いた動作を後述するので、ここでは詳細を省略する。
 電力データ情報テーブル2122は、図5に示すように、測定対象の欄21221と、測定対象に負荷がかかっていない状態の電力の欄21222、測定対象のCPU、メモリに負荷が100%かかった状態の電力の欄21223、測定対象の起動時間の欄21224、及び停止時間の欄21225を有する。
 最低維持時間算出式リスト2123は、図6に示すように、最低維持時間を算出するための算出式21231と、算出式21231において最低維持時間を算出するために必要な変数を表す依存パラメータ欄21232を有する。
 ただし、最低維持時間算出式リスト2123の各変数は以下の式で算出する。
Figure JPOXMLDOC01-appb-M000001

 
Figure JPOXMLDOC01-appb-M000002

 
Figure JPOXMLDOC01-appb-M000003

 
Figure JPOXMLDOC01-appb-M000004
(3)最低維持時間の算出方法
 ここで、最低維持時間の算出方法について具体例を用いて説明する。図7は、仮想サーバ53を3台の物理サーバ5にマイグレーションさせて、仮想サーバ53が1台も稼働しない2台の物理サーバ5の電源をオフするような集約案を作成されるような、システム全体に対する負荷が低下した場合の電力の推移を表した図である。そして、集約を実行する省電力運用の場合のシステム全体の消費電力変化を破線で、集約を実行しない通常運用の場合のシステム全体の消費電力変化を実線で示している。Pbaseは、物理サーバ5と仮想化手段52とのベース電力の和を表し、Pmeterは、物理サーバ5の消費電力を表しており、以下の関係式が成立する。
Figure JPOXMLDOC01-appb-M000005

 
Figure JPOXMLDOC01-appb-M000006
 図7の例では、時刻T0で負荷が低下する。管理サーバ2は、時刻T1に管理サーバ2が負荷低下を検知し、物理サーバ5における仮想サーバ53のマイグレーション及び物理サーバ5の電源オフ等の集約操作を開始する。時刻T1から、物理サーバ5の電源オフが終了する時刻T2までの時間において、省電力運用と通常運用とを比較すると、省電力運用の方が電源オフ操作に伴う電力を使用するために電力を多く消費する。物理サーバ1台あたりのこの無駄な電力をPOffとすると、以下の式で算出することができる。
Figure JPOXMLDOC01-appb-M000007
 ここで、Pmaxは、CPU55、メモリ54に対する負荷が100%の状態の物理サーバ5の消費電力である。省電力運用と通常運用において、時刻T1から時刻T2までの時間における物理サーバ5の台数,仮想サーバの53の台数、及び仮想サーバ53に対する負荷とは同じであるため、空き物理サーバ5の電源オフ処理にかかる電力のみが増加量となる。したがって、図7の例では電源オフする物理サーバ台数は2台であるため、求める差分は物理サーバ2台分の総和となる。
Figure JPOXMLDOC01-appb-M000008

 
 この例では、電源オフ操作は仮想サーバ53が他の物理サーバ5に移動した後の状態で、常に100%の負荷がかかっている状態で電源オフ処理が実行されると仮定しているが、実際の電源オフ操作にかかる電力を計測し、計測した値を使用してもよい。さらに、電源オフの代わりに、ハードウェアやOSが提供する省電力モードへの移行によって、消費電力を削減する場合、移行操作にかかる電力を計測した結果を(8)式の値の代わりに使用すればよい。
 次に、時刻T2に電源オフ操作が終了すると、稼動しているサーバ台数が5台から3台となるため、省電力運用と通常運用とを比較すると、通常運用の方が、省電力運用において電源オフした物理サーバ5のベース電力の分だけ電力を多く消費する。
Figure JPOXMLDOC01-appb-M000009

 
 仮想サーバ53に対する負荷は同じであるため、削減した物理サーバ2台分のベース電力が削減量となる。
 管理サーバ2は、時刻T3に、負荷増加が予測される時刻T4から、ブート処理時間を引いた時刻になったことを検知し、構成を元に戻すための処理を開始する。その際、省電力運用と通常運用とを比較すると、省電力運用の方が電源オン操作に伴う電力を無駄に多く消費する。これは、電源オフ操作と同様の算出式で算出することができる。
Figure JPOXMLDOC01-appb-M000010

 
Figure JPOXMLDOC01-appb-M000011
 ここでは、負荷の増加が事前予測可能な場合について述べたが、予測が外れてしまった場合は、省電力運用と通常運用の仮想サーバ53が処理できる負荷量に差が発生する。その場合は、処理量の差分の電力をさらに引くことによって算出することができる。
 簡単のためにΣPreboot(n)を以下のように定義する。
Figure JPOXMLDOC01-appb-M000012
 省電力運用が通常運用よりも消費電力を削減するためには、物理サーバ5に対する電源操作による無駄な電力量よりも、削減する電力量が大きくなればよい。
Figure JPOXMLDOC01-appb-M000013
 図7の例において(13)式の両辺を数式化すると以下のようになる。
Figure JPOXMLDOC01-appb-M000014
 (14)式の、電源オフの時間をTOFF、電源オンの時間をTON、最低維持時間をTlowで表すと以下のようになる。
Figure JPOXMLDOC01-appb-M000015
 (15)式のリブート時間Trebootを用いて表すと以下のようになる。
Figure JPOXMLDOC01-appb-M000016
 (16)式の両辺をΣPrboot(n)で割ると以下のようになる。
Figure JPOXMLDOC01-appb-M000017
 このように,式変換することにより、電源操作による無駄な電力量よりも、削減する電力量を大きくするための最低維持時間Tlowの算出式を得る。
 管理サーバ2は、集約している時間Tlowが右式の値より大きい場合には、省電力運用を実行し、時間Tlowが右式の値より小さい場合は通常運用を実行するように制御するので、確実に電力削減効果を得ることができる。
 この例においては、2台の物理サーバ5を電源オフしたが、nc台の物理サーバ5を電源オフするとして、下式のように最低維持時間Tlowを定義できる。
Figure JPOXMLDOC01-appb-M000018

 
 この計算式が最低維持時間算出リスト2123の算出式21231に格納されている。
(4)各プログラムの処理
 稼動状況監視プログラム2111、パラメータ情報収集プログラム2112、省電力運用プログラム2113、構成変更可否決定プログラム2114及びサーバ配置プログラム2115の5つのプログラムは、並列処理で実行される。なお、以下においては各種処理の処理主体を管理サーバ2に実装された「プログラム」として説明するが、実際上は、そのプログラムに基づいて管理サーバ2のCPU22(図2)がその処理を実行することは言うまでもない。
(4-1)稼働状況監視プログラムの処理
 図8を参照して、管理サーバ2の稼動状況監視プログラム2111を詳細に説明する。管理サーバ2の電源が投入されると、稼働状況監視プログラム2111は、ユーザによる負荷予測モデルの設定操作、又は、構成変更可否決定プログラム2114からの更新イベントの通知があったか否かを判別する(SP101)。負荷予測モデルとは、将来の負荷の予測を行うためのサンプルの取り方や、予測値の算出式である。
 ステップ101の判断において否定結果を得た場合には、ステップ103に進む。
 ステップ101の判断において肯定結果を得た場合には、稼働状況監視プログラム2111は、検知した設定操作、または更新イベントにしたがって、負荷予測モデルを生成し(SP102)、ステップ103に進む。
 ステップ103において、稼働状況監視プログラム2111は、所定の性能情報収集の周期が来たか否かを判別する(SP103)。
 ステップ103の判断において否定結果を得た場合には、ステップ101に戻る。
 ステップ101の判断において肯定結果を得た場合には、稼働状況監視プログラム2111は、各物理サーバ5の性能情報を収集し(SP104)、性能履歴情報として管理サーバ2のメモリ21に格納・更新し(SP105)、ステップ101に戻る。
(4-2)パラメータ情報収集プログラムの処理
 図9を参照して、管理サーバ2のパラメータ情報収集プログラム2112を説明する。管理サーバ2の電源が投入されると、パラメータ情報収集プログラム2112は、物理サーバ5が新規登録されたか否かを判別する(SP201)。
 ステップ201の判断において否定結果を得ると、ステップ207に進む。
 ステップ201の判断において肯定結果を得ると、パラメータ情報収集プログラム2112は、新規登録された物理サーバ5をOS未搭載の状態で起動させて、安定した電力値を測定させ、測定させた電力値を物理サーバ5のベース電力として電力データ情報テーブル2122に登録する(SP202)。
 次に、パラメータ情報収集プログラム2112は、新規登録された物理サーバ5に負荷かけプログラムを送信して、インストールさせる(SP203)。
 パラメータ情報収集プログラム2112は、負荷かけプログラムを用いて、新規登録された物理サーバ5のCPU55、メモリ54に負荷が100%かかっている状態を生成し、その時の電力値を測定する。その結果を物理サーバ5のMAX電力として電力データ情報テーブル2122に登録する(SP204)。
 パラメータ情報収集プログラム2112は、新規登録された物理サーバ5を起動・停止させて、起動・停止に要する時間を測定し、測定した時間を物理サーバ5の起動・停止時間として電力データ情報テーブル2122に登録する(SP205)。
 パラメータ情報収集プログラム2112は、新規登録された物理サーバ5に負荷かけプログラムをアンインストールさせ(SP206)、ステップ207に進む。
 パラメータ情報収集プログラム2112は、仮想サーバ53が新規登録されたか否かを判別する(SP207)。
 ステップ207の判断において否定結果を得ると、ステップ201に戻る。
 ステップ207の判断において肯定結果を得ると、パラメータ情報収集プログラム2112は、仮想サーバ53が新規登録された物理サーバ5を仮想化手段52だけをインストールした状態で起動させて、安定した電力値を仮想化手段52のベース電力として電力データ情報テーブル2122に登録する(SP208)。
 パラメータ情報収集プログラム2112は、仮想化手段52を起動・停止させて、起動・停止に要した時間を仮想化手段52の起動・停止時間として電力データ情報テーブル2122に登録する(SP209)。
 パラメータ情報収集プログラム2112は、仮想化手段52上に仮想サーバ53を1つだけ生成した状態で起動させ、安定した電力とステップ202で測定した物理サーバ5のベース電力との差分を仮想サーバ53のベース電力として電力データ情報テーブル2122に登録し(SP210)、ステップ201に戻る。
(4-3)省電力運用プログラムの処理
 図10を参照して、管理サーバ2の省電力運用プログラム2113を詳細に説明する。管理サーバ2の電源が投入されると、省電力運用プログラム2113は、サーバシステムの負荷が所定の閾値以下になったか否かを判別する(SP301)。
 ステップ301の判断において否定結果を得ると、ステップ301に戻る。
 ステップ301の判断において肯定結果を得ると、省電力運用プログラム2113は、現在のサーバシステムの負荷情報を元に、仮想サーバの集約案を作成し、電源オフ可能な物理サーバ台数とどの物理サーバをオフするか決定し(SP302)、その結果を構成変更可否決定プログラム2114に通知し(SP303)、ステップ301に戻る。
(4-4)構成変更可否決定プログラムの処理
 図11を参照して、管理サーバ2の構成変更可否決定プログラム2114を詳細に説明する。まず、構成変更可否決定プログラム2114は、省電力運用プログラム2113より集約案を受信すると(SP401)、受信した集約案に基づく電源オフする各物理サーバ5に対して、電力データ情報テーブル2122の電力値と、最低維持時間算出リスト2123におけるリブート電力算出式及びリブート時間算出式とを用いて、リブート電力及びリブート時間を算出する(SP402)。
 次に、構成変更可否決定プログラム2114は、電源オフする各物理サーバ5に対して、電力データ情報テーブル2122の電力値と、ステップ402で算出したリブート電力及びリブート時間と、最低維持時間算出式リスト2123における最低維持時間算出式とを用い、最低維持時間を算出する(SP403)。
 その後、構成変更可否決定プログラム2114は、構成を元に戻すまでの時間の予測値、および負荷変動の履歴情報と負荷予測モデルから次の負荷上昇の予測時刻を算出する(SP404)。
 構成変更可否決定プログラム2114は、ステップ404において算出した負荷上昇予測時間と、電源オフする物理サーバ上で稼動している仮想サーバの構成情報テーブル2121における性能劣化許容時間との和が、ステップ403で算出した最低維持時間の値より大きいか否かを判別する(SP405)。
 性能劣化許容時間を考慮することにより,業務への影響を管理者の許容範囲に抑えた上で,物理サーバの電源をオフしている状態を長く保つことができるため,より多くの消費電力を削減することができる。
 ステップ405の判断において否定結果を得ると、処理を終了する。
 ステップ405の判断において肯定結果を得ると、構成変更可否決定プログラム2114は、サーバ配置プログラム2115に構成変更を要求し、物理サーバ5の電源オフすることによりシステムの消費電力を削減する(SP406)。
 次に、構成変更可否決定プログラム2114は、サーバ配置プログラム2115よりシステムの負荷上昇を検知し、構成を元に戻した旨の通知があったか否かを判別する(SP407)。
 ステップ407の判断において否定結果を得た場合には、構成変更可否決定プログラム2114は、ステップ407に戻り、サーバ配置プログラム2115より通知があるまで待機する。
 ステップ407の判断において肯定結果を得た場合には、構成変更可否決定プログラム2114は、サーバ配置プログラム2115に構成変更を要求してから最低維持時間が経過したか否かを判別する(SP408)。
 ステップ408の判断において肯定結果を得た場合には、処理を終了する。
 ステップ408の判断において否定結果を得た場合には、構成変更可否決定プログラム2114は、負荷予測モデルの更新イベントを生成する旨を稼動状況監視プログラム2111に要求し(SP409)、処理を終了する。例えば、ステップ408において最低維持時間を経過しなかった場合、すなわち負荷予測が外れたと判定された場合は、稼働状況監視プログラム2111は、移動平均法のサンプル数を1週間から1ヶ月に増やしたり、サンプルの値に重みをつけたりすることによって更新を実施する。
(4-5)サーバ配置プログラムの処理
 図12[9]を参照して、管理サーバ2のサーバ配置プログラム2115を詳細に説明する。まず、サーバ配置プログラム2115は、構成変更可否決定プログラム2114から集約案を受信すると(SP501)、受信した集約案に従って仮想サーバ53のマイグレーション及び物理サーバ5の電源オフを実施する(SP502)。
 次に、サーバ配置プログラム2115は、システムの負荷が所定の閾値以上になったか否かを判別する(SP503)。
 ステップ503の判断で否定結果を得た場合には、サーバ配置プログラム2115は、ステップ503に戻り、システムの負荷が上昇するまで待機する。
 ステップ503の判断で肯定結果を得た場合には、サーバ配置プログラム2115は、集約案に従って変更していたシステムの構成を集約前の状態に戻し(SP504)、その旨を構成変更可否決定プログラム2114に通知し(SP505)、処理を終了する。
(5)本実施の形態の効果
 計算機システム1は、物理サーバ5の電源をオフにしたことによって削減できる電力量が、物理サーバ5の電源オフにかかる電力量と物理サーバ5の起動にかかる電力量との和より大きい場合には、省電力運用を行い、小さい場合には、通常運用を行うことで、適切に電力を節約することができる。
 また、計算機システム1は、システム全体に対する負荷が低下している時間が最低維持時間より短い場合には、負荷が再上昇する時間を予測するモデルを更新するため、正確に負荷が再上昇する時間を予測できる。
(6)他の実施の形態
 なお、上述の実施の形態においては、仮想サーバ53を物理サーバ5に集約して、仮想サーバ53が稼働しない物理サーバ5の電源をオフすることの有効性を判定する場合について述べたが、本発明はこれに限らず、同じ業務を遂行している物理サーバ5の台数を減らす場合に、物理サーバ5の電源をオフすることの有効性を判定するようにしてもよい。
 また上述の実施の形態においては、管理サーバ2は、メモリ21に制御プログラム群211と管理テーブル群212とを格納する場合について述べたが、本発明はこれに限らず、ストレージ装置7を外部記憶装置として用いて、ボリューム71に制御プログラム群211と管理テーブル群212とを格納してもよい。
 さらに上述の実施の形態においては、仮想化手段52をソフトウエアにより実現する場合について述べたが、本発明はこれに限らず、高性能化の観点からソフトウエアとファームウエアとで機能分担して実現するようにしてもよい。
 さらに上述の実施の形態においては、各物理サーバ5は、ボリューム71Aから仮想化手段72を読み込むようにした場合について述べたが、本発明はこれに限らず、物理サーバ5毎に仮想化手段をストレージ装置7に格納し、各物理サーバ5が、専用の仮想化手段を読み込むようにしてもよい。
 さらに上述の実施の形態においては、管理サーバ2及びクライアント端末3と各物理サーバ5とをネットワークスイッチ4で接続するようにした場合について述べたが、本発明はこれに限らず、これら管理サーバ2及びクライアント端末3と各物理サーバ5とLAN(Local Area Network)等で接続するようにしてもよい。
 さらに上述の実施の形態においては、物理サーバ5又は仮想サーバ53のリソースとして、プロセッサ性能とメモリ容量を適用するようにした場合について述べたが、本発明はこれに限らず、それ以外にも、接続する入出力装置、記憶装置(ディスクボリューム)、又は、ネットワークと接続する通信インタフェースの個数や性能等を適用してもよい。
 さらに上述の実施の形態においては、負荷上昇予測時間を算出するために、移動平均法を用いるようにした場合について述べたが、本発明はこれに限らず、指数平滑法等の他の予測方法を用いてもよい。
 さらに上述の実施の形態においては、上記の条件を満たした場合に、計算機システム1の構成変更を行うようにした場合について述べたが、本発明はこれに限らず、上記の条件を満たした場合に、管理者の許可を得るようにし、さらに管理者の許可を得た場合に、計算機システム1の構成変更を行うようにしてもよい。
 図13に、この実施の形態における管理サーバ2の画面イメージの例を示す。管理サーバ2の管理画面は,構成情報ペイン1201、性能情報ペイン1202、構成変更案ペイン1203、及び構成変更実行確認ペイン1204を有する。構成情報ペイン1201は、図1のシステム構成に対応した情報を表示し,ユーザが構成を確認するためのペインである。性能情報ペイン1202は,現在時刻T1、稼動状況監視プログラム2111が蓄積した性能履歴情報、及び負荷予測モデルから算出した性能予測情報を表示し、ユーザが性能予測の結果を確認するためのペインである。構成変更ペイン1203は、省電力運用プログラム2113が算出した構成変更案、構成変更可否決定プログラム2114が算出した構成変更電力量、及び構成維持時間を表示し、ユーザが構成変更の効果を確認するためのペインである。ここで、構成維持時間とは、最低維持時間であり、構成変更電力量とは,ステップ402で算出するリブート電力と最低維持時間とを掛け合わせたものである。構成変更実行確認ペイン1204は、ステップ406におけるサーバ配置プログラム2115へ構成変更を要求する際、その前にユーザによる判断を求めるためのペインである。
 本発明は、それぞれ1又は複数の仮想サーバを稼働させる複数の物理サーバを備える計算機システムに広く適用することができる。
1……計算機システム
2……管理サーバ
3……クライアント端末
4……ネットワークスイッチ
5A~E……物理サーバ
6……ストレージスイッチ
7……ストレージ装置
52A~D……仮想化手段
53A~G……仮想サーバ
2111……稼働状況監視プログラム
2112……パラメータ情報収集プログラム
2113……省電力運用プログラム
2114……構成変更可否決定プログラム
2115……サーバ配置プログラム
2121……構成情報テーブル
2122……電力データ情報テーブル
2123……最低維持時間算出式リスト
 
 

Claims (8)

  1.  複数の物理サーバと、前記物理サーバとネットワークを介して接続される管理サーバとから構成される計算機システムにおいて、
     前記管理サーバは、
     1又は複数の前記物理サーバが省電力運用を指示されてから省電力運用が終了するまでに消費する消費電力量と当該省電力運用によって削減できる削減電力量とが等しくなる、当該省電力運用である間の時間を算出し、
     当該計算機システムに対する負荷が所定の閾値以下になった場合に、当該負荷が所定の閾値以下であると予測される時間を算出し、
     算出された前記省電力運用である間の時間と前記負荷が所定の閾値以下であると予測される時間とを比較し、
     比較した結果に基づいて前記1又は複数の前記物理サーバを省電力運用にするか否かを決定する
     ことを特徴とする計算機システム。
  2.  前記省電力運用は、前記物理サーバの電源をオフにする運用である
     ことを特徴とする請求項1に記載の計算機システム。
  3.  前記複数の物理サーバは、それぞれ1又は複数の仮想サーバを稼動させ、
     前記管理サーバは、
     当該計算機システムに対する負荷が所定の閾値以下になった場合に、前記仮想サーバが稼働しない前記物理サーバの台数が最も多くなるように、複数の前記仮想サーバを1又は複数の前記物理サーバに集約し、
     前記仮想サーバが稼働しない前記1又は複数の物理サーバを省電力運用にするか否かを決定する
     ことを特徴とする請求項1に記載の計算機システム。
  4.  前記管理サーバは、
     前記1又は複数の物理サーバを省電力運用にした後に、当該計算機システムに対する負荷が所定の閾値以上になった場合に、前記1又は複数の物理サーバの省電力運用を終了させる
     ことを特徴とする請求項1に記載の計算機システム。
  5.  前記管理サーバは、
     当該計算機システムに対する負荷変動の履歴情報を記憶し、
     前記履歴情報を移動平均法に適用して、前記負荷が所定の閾値以下であると予測される時間を算出する
     ことを特徴とする請求項1に記載の計算機システム。
  6.  前記管理サーバは、前記1又は複数の物理サーバを省電力運用にした後に、当該計算機システムに対する負荷が所定の閾値以下である時間が、前記算出された前記電源オフである間の時間より短い場合に、前記履歴情報における前記移動平均法に適用する期間を長くする
     ことを特徴とする請求項5に記載の計算機システム。
  7.  複数の物理サーバにネットワークを介して接続される管理サーバにおいて、
     1又は複数の前記物理サーバが省電力運用を指示されてから省電力運用が終了するまでに消費する消費電力量と当該省電力運用によって削減できる削減電力量とが等しくなる、当該省電力運用である間の時間を算出し、
     前記複数の物理サーバに対する負荷が所定の閾値以下になった場合に、当該負荷が所定の閾値以下であると予測される時間を算出し、
     算出された前記省電力運用である間の時間と前記負荷が所定の閾値以下であると予測される時間とを比較し、
     比較した結果に基づいて前記1又は複数の前記物理サーバを省電力運用にするか否かを決定する
     ことを特徴とする管理サーバ。
  8.  複数の物理サーバと、前記物理サーバとネットワークを介して接続される管理サーバとから構成される計算機システムの省電力方法において、
     前記管理サーバが、1又は複数の前記物理サーバが省電力運用を指示されてから省電力運用が終了するまでに消費する消費電力量と当該省電力運用によって削減できる削減電力量とが等しくなる、当該省電力運用である間の時間を算出する第1のステップと、
     前記管理サーバが、当該計算機システムに対する負荷が所定の閾値以下になった場合に、当該負荷が所定の閾値以下であると予測される時間を算出する第2のステップと、
     前記管理サーバが、算出された前記省電力運用である間の時間と前記負荷が所定の閾値以下であると予測される時間とを比較する第3のステップと、
     前記管理サーバが、比較した結果に基づいて前記1又は複数の前記物理サーバを省電力運用するか否かを決定する第4のステップと、
     を備えることを特徴とする省電力方法。
     
PCT/JP2010/001580 2009-11-18 2010-03-05 計算機システム、管理サーバ及び電力削減方法 WO2011061870A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009263304A JP2011108045A (ja) 2009-11-18 2009-11-18 計算機システム、管理サーバ及び電力削減方法
JP2009-263304 2009-11-18

Publications (1)

Publication Number Publication Date
WO2011061870A1 true WO2011061870A1 (ja) 2011-05-26

Family

ID=44059359

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/001580 WO2011061870A1 (ja) 2009-11-18 2010-03-05 計算機システム、管理サーバ及び電力削減方法

Country Status (2)

Country Link
JP (1) JP2011108045A (ja)
WO (1) WO2011061870A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016181189A (ja) * 2015-03-25 2016-10-13 日本電気株式会社 電源制御装置、電源制御システム、電源制御方法、およびプログラム
CN109116968A (zh) * 2018-08-06 2019-01-01 清华大学 写策略控制方法、系统及其适用的电子设备

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015022321A (ja) * 2013-07-16 2015-02-02 日本電気株式会社 仮想マシン管理装置、仮想マシン管理方法、及びプログラム
JP2015072588A (ja) * 2013-10-02 2015-04-16 日本電信電話株式会社 サーバの仮想制御方法
JP6354290B2 (ja) * 2014-04-24 2018-07-11 富士通株式会社 情報処理システム、情報処理システムの制御方法および情報処理システムの制御プログラム
JP6487359B2 (ja) * 2016-03-16 2019-03-20 Kddi株式会社 ネットワークサービス評価システム
JP7181464B2 (ja) 2019-02-25 2022-12-01 富士通株式会社 電力推定プログラム、電力推定装置及び電力推定方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000173152A (ja) * 1998-11-27 2000-06-23 Internatl Business Mach Corp <Ibm> 消費エネルギー低減方法
JP2006072991A (ja) * 2004-08-05 2006-03-16 Matsushita Electric Ind Co Ltd 省電力処理装置、省電力処理方法、及び省電力処理プログラム
JP2009169858A (ja) * 2008-01-18 2009-07-30 Nec Corp サーバシステム、及びサーバシステムの電力削減方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000173152A (ja) * 1998-11-27 2000-06-23 Internatl Business Mach Corp <Ibm> 消費エネルギー低減方法
JP2006072991A (ja) * 2004-08-05 2006-03-16 Matsushita Electric Ind Co Ltd 省電力処理装置、省電力処理方法、及び省電力処理プログラム
JP2009169858A (ja) * 2008-01-18 2009-07-30 Nec Corp サーバシステム、及びサーバシステムの電力削減方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016181189A (ja) * 2015-03-25 2016-10-13 日本電気株式会社 電源制御装置、電源制御システム、電源制御方法、およびプログラム
CN109116968A (zh) * 2018-08-06 2019-01-01 清华大学 写策略控制方法、系统及其适用的电子设备

Also Published As

Publication number Publication date
JP2011108045A (ja) 2011-06-02

Similar Documents

Publication Publication Date Title
US9910480B2 (en) Monitoring and real-time adjustment of power consumption settings
WO2011061870A1 (ja) 計算機システム、管理サーバ及び電力削減方法
US10824215B2 (en) Managing power budget of multiple computing node clusters in a computing rack system
Maheshwari et al. Dynamic energy efficient data placement and cluster reconfiguration algorithm for MapReduce framework
Do et al. ptop: A process-level power profiling tool
Rossi et al. E-eco: Performance-aware energy-efficient cloud data center orchestration
US8392736B2 (en) Managing memory power usage
TWI475369B (zh) 用於處理器中功率及性能權衡的設備、方法及系統
JP5885920B2 (ja) 仮想cpuベースの、周波数、及び電圧制御
US20160077571A1 (en) Heuristic Processor Power Management in Operating Systems
US20110106935A1 (en) Power management for idle system in clusters
US9513964B2 (en) Coordinating device and application break events for platform power saving
US9547353B1 (en) Processor energy monitoring and dynamic adjustment
JP2003295983A (ja) コンピュータ・サーバの電力消費を管理する方法およびプログラム
US20200019230A1 (en) Managing power consumptions of multiple computing nodes in a hyper-converged computing system
EP3649536B1 (en) Core frequency management using effective utilization for power-efficient performance
US8103884B2 (en) Managing power consumption of a computer
TW201205322A (en) Computer component power-consumption database
EP2972826B1 (en) Multi-core binary translation task processing
US20140245047A1 (en) Information processing apparatus, operation state control method, and computer program product
US20100205306A1 (en) Grid computing system, management apparatus, and method for managing a plurality of nodes
WO2017141363A1 (ja) データ処理システム及びデータ処理方法
WO2014092889A1 (en) System and methods for dimm-targeted power saving for hypervisor systems
US10929245B1 (en) Flexible scheduler for backups
JP6928263B2 (ja) 情報処理装置、計算機制御方法、および計算機制御プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10831270

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10831270

Country of ref document: EP

Kind code of ref document: A1