WO2007148371A1 - 仮想マシンのための性能管理システムと性能管理方法 - Google Patents

仮想マシンのための性能管理システムと性能管理方法 Download PDF

Info

Publication number
WO2007148371A1
WO2007148371A1 PCT/JP2006/312224 JP2006312224W WO2007148371A1 WO 2007148371 A1 WO2007148371 A1 WO 2007148371A1 JP 2006312224 W JP2006312224 W JP 2006312224W WO 2007148371 A1 WO2007148371 A1 WO 2007148371A1
Authority
WO
WIPO (PCT)
Prior art keywords
virtual machine
usage rate
management system
performance management
disk
Prior art date
Application number
PCT/JP2006/312224
Other languages
English (en)
French (fr)
Inventor
Yasuhiro Ajiro
Original Assignee
Nec Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nec Corporation filed Critical Nec Corporation
Priority to PCT/JP2006/312224 priority Critical patent/WO2007148371A1/ja
Publication of WO2007148371A1 publication Critical patent/WO2007148371A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual

Definitions

  • the present invention relates to a virtual machine performance management system and a virtual machine performance management method, and more particularly to a virtual machine performance management system capable of detecting performance degradation of a virtual machine running on virtualization software and identifying an affected range thereof. And background technology related to virtual machine performance management method
  • this conventional performance management system includes a usage rate acquisition unit, a comparison unit, and a call service execution determination unit in the processing device, and a threshold storage unit in the storage device.
  • the usage rate acquisition unit acquires the CPU usage rate of the communication device.
  • the comparison unit compares the acquired CPU usage rate with a threshold value related to the usage rate held by the threshold storage unit.
  • the call service execution determination unit discards the processing related to the call service when the acquired CPU usage rate exceeds the threshold. If not exceeded, call service processing is executed. With these operations, if the service quality deteriorates below the required level, an increase in unnecessary service wait time can be suppressed by immediately performing the call loss process, so that the call loss rate can be improved.
  • an automatic resource assignment method is disclosed in Japanese Patent Laid-Open No. 10-240699.
  • This conventional example includes a service provider unit including a service providing means, a resource management unit that supplies common resources, a CPU occupation rate monitoring unit that monitors a CPU occupation rate, and a resource usage rate monitoring unit that monitors a resource usage rate. And increase of common resources And an automatic resource calculation unit for calculating a configuration.
  • the service provider unit provides services using the common resource supplied by the resource management unit, and the resource management unit uses the common resource increase / reduction request from the resource automatic calculation unit. And provide common resources to the service provider department.
  • the automatic resource calculation unit reports the CPU occupancy rate transition report from the CPU occupancy rate monitoring unit within the specified resource calculation measurement time, the resource usage rate transition report of the resource usage rate monitoring unit, and the addition of common resources Based on a predetermined resource usage rate and a predetermined CPU occupancy rate that are determined in advance, the resource management unit is notified of a common resource expansion / removal request.
  • the CPU occupancy rate monitoring unit monitors the CPU occupancy rate by the service provider unit, and when the CPU occupancy rate changes, it notifies the automatic resource calculation unit of the CPU occupancy rate transition as a CPU occupancy rate transition report. To do.
  • the resource usage rate monitoring unit monitors the resource usage status by the resource management unit, and when the resource usage rate changes, notifies the resource automatic calculation unit of the transition of the resource usage rate as a resource usage rate transition report. .
  • a server multiplicity control method is disclosed in Japanese Patent Laid-Open No. 2001-160040.
  • the server CPU usage rate consumed by the server is measured.
  • CPU usage upper limit The CPU usage upper limit value specified in the CPU usage upper limit storage unit by the Z lower limit setting unit, and the CPU usage lower limit value specified in the CPU usage lower limit storage unit and the measured server CPU usage rate And the necessity of increase / decrease in server multiplicity is determined from the comparison result. If it is determined that the server CPU usage rate is higher than the above CPU usage upper limit value, the server multiplicity is increased, and the server CPU usage rate is determined to be lower than the above CPU usage lower limit value. In this case, the server multiplicity is reduced.
  • a computer system is disclosed in Japanese Patent Laid-Open No. 2001-331333.
  • a plurality of operating systems are operated in one computer, and computer resources such as a CPU, a main storage device, and an external input / output device are allocated to each of the plurality of operating systems.
  • Resources are managed and the allocation of computer resources to each operating system is changed and reconfigured.
  • Each operation The contents of the change and reconfiguration of computer resources are managed in relation to the operating status of the operating system, and the computer resources are changed or reconfigured based on the operating status of each operating system.
  • the setting unit accepts the setting of a required value related to storage performance for each storage area of the storage system.
  • the comparison unit compares the value related to the operating status of the storage system with the set request value. Based on the output of the comparison unit, the specifying unit specifies a storage area in which the value related to the operation status does not satisfy the required value.
  • the moving unit moves all or a part of the data stored in the storage area specified by the specifying unit to another storage area.
  • a website configuration determination support method is disclosed in Japanese Patent Laid-Open No. 2003-178040.
  • this conventional website configuration determination support method the configuration of each server group of a website composed of a web server group, an AP server group, and a DB server group is supported.
  • the processing time, CPU usage rate, and memory usage rate of the web server group, AP server group, and DB server group are detected, and the processing time or CPU usage rate or memory usage rate exceeds a predetermined threshold value more than a predetermined number of times.
  • the number of additional servers that do not exceed the threshold is calculated based on the number of connected users and the number of CPU clocks.
  • a memory check method is disclosed in Japanese Patent Application Laid-Open No. 2003-216510.
  • a memory check of a storage unit provided in the information processing apparatus is performed during operation of the information processing apparatus. Whether to start a memory check is determined according to the load status of the information processing device. After the memory check is started, the load status of the information processing device is acquired each time the memory check of each check unit area in the storage unit is completed, and the memory check of the next check unit area is continued according to the acquired load status. Is determined.
  • a management system is disclosed in Japanese Patent Application Laid-Open No. 2004-145536.
  • the operation information collected from the network camera as the monitoring target system is stored.
  • Operational conditions for each performance degradation event as a condition for performance degradation.
  • Performance degradation conditions that define the range of information values are also stored.
  • the performance degradation factor that defines the performance degradation factor corresponding to each performance degradation condition is also stored. By comparing the operation information and the performance degradation factor, the performance degradation condition is identified, and the corresponding performance degradation factor is identified from the performance degradation factor.
  • a virtual machine management device is disclosed in Japanese Patent Laid-Open No. 2005-115653.
  • measured data indicating the performance of each of a plurality of virtual machines at a predetermined time is read out from a database, and the performance of each read virtual machine at a predetermined time is measured.
  • the combination of the virtual machine and the server with the maximum total performance of each virtual machine at each time when each virtual machine is operated on any of a plurality of servers is calculated.
  • the file of each virtual machine is stored in the storage area of the server corresponding to the virtual machine.
  • a system usage rate management apparatus is disclosed in Japanese Patent Laid-Open No. 2006-92053.
  • the maximum performance of each of the plurality of computation nodes is set, and the resource utilization rate of each computation node is acquired.
  • the virtual usage rate of the entire node group is calculated from the set maximum performance and the acquired resource usage rate.
  • An object of the present invention is to provide a virtual machine performance management system capable of detecting performance degradation of a virtual machine.
  • Another object of the present invention is to provide a virtual machine performance management system capable of specifying the influence range when the performance of the virtual machine deteriorates.
  • the virtual machine performance management system acquires a usage rate for acquiring the CPU usage rate of each of a plurality of virtual machines running on virtualization software executed by at least one physical CPU.
  • a comparison unit that compares the total value with the number of physical CPUs, and outputs a warning when the total value is greater than the number of physical CPUs. And have.
  • the virtualization software recognizes a plurality of logical disks, and each of the plurality of virtual machines is assigned to one of the plurality of logical disks, and
  • the obtaining unit obtains the disk usage rate of each virtual machine in the disk mode, and the comparison unit compares the disk usage rate with a threshold value in the disk mode, and the disk usage rate is the threshold value.
  • a warning is output if it exceeds.
  • the disk usage rate exceeds the threshold value in the disk mode!
  • a search unit may be further provided that searches for the virtual machine assigned to the same logical disk as the virtual machine corresponding to the disk usage rate and outputs the searched virtual machine name. ,.
  • the virtual machine performance management system is executed by a usage rate acquisition unit that acquires the disk usage rate of each of a plurality of virtual machines, and at least one physical CPU.
  • a plurality of virtual machines operate on the virtualization software, the virtualization software recognizes a plurality of logical disks, and each of the plurality of virtual machines is assigned to one of the plurality of logical disks.
  • the disk usage rate is compared with a threshold value, and when the disk usage rate exceeds the threshold value, a comparison unit that outputs a warning, and when the disk usage rate exceeds the threshold value,
  • a search unit that searches for the virtual machine assigned to the same logical disk as the virtual machine for the disk usage rate, and outputs the searched virtual machine name.
  • the comparison unit may output the total value as time series data! /. In this case, when the number is larger than the number of physical CPUs, the total value may be displayed in a different color.
  • the number of virtual machines is preferably set regardless of the number of physical CPUs.
  • a guest OS operating system
  • the usage rate acquisition unit acquires the CPU usage rate or the disk usage rate using the guest OS.
  • Virtual machine performance management system power The virtual machine performance management system may be constructed on a system using a CPU different from the physical CPU, or the virtual machine performance management system may be one of the virtual machines.
  • the usage rate acquisition unit may acquire the CPU usage rate or the disk usage rate in real time, or the usage rate acquisition unit may log file power indicating a past operation result. Get the disk usage rate.
  • FIG. 1 is a block diagram showing a configuration of a conventional performance management system.
  • FIG. 2 is a block diagram showing a configuration of a performance management system according to the first exemplary embodiment of the present invention.
  • FIG. 3 is a flowchart showing an operation procedure of the first embodiment.
  • FIG. 4 is a block diagram showing a configuration of a performance management system according to a second example of the present invention.
  • FIG. 5 is a flowchart showing the operation procedure of the second embodiment.
  • Fig. 6 is a graph showing the relationship between the request arrival rate and the total CPU usage rate by the number of active virtual machines.
  • FIG. 2 is a block diagram showing the configuration of the virtual machine performance management system according to the first embodiment of the present invention.
  • the virtual machine performance management system of this embodiment is constructed on a physical server different from the physical server on which the virtual machine operates.
  • the performance management system according to this embodiment includes a processing device 100, a storage device 200, and an output device 300.
  • the processing device 100 includes a usage rate acquisition unit 2, a calculation unit 4, a comparison unit 6, and an output unit 8, and the storage device 200 includes a storage unit 12.
  • the usage rate acquisition unit 2 acquires the CPU usage rate of the virtual CPU in each of the plurality of virtual machines. The acquisition method will be described later.
  • the calculation unit 4 calculates the total value of the CPU usage rate of each acquired virtual machine.
  • the storage unit 12 holds the number of physical CPUs as a percentage.
  • the comparison unit 6 compares the calculated total value with the number of physical CPUs held by the storage unit 12. If the calculated total value is less than the number of physical CPUs, the process continues. If the calculated total value is greater than the number of physical CPUs, the comparison unit 6 outputs a warning, and the output unit 8 A warning is output to the output device 300.
  • the output device 300 is a display device such as a liquid crystal display, a printer, or the like.
  • the usage rate acquisition unit 2 acquires the CPU usage rate of the virtual CPU of each virtual machine (VM: Virtual Machine) (step Sl l).
  • VM Virtual Machine
  • Each virtual machine is a virtual server machine deployed on the same server.
  • Such server virtualization is realized by virtualization software, and physically allows one server to be used as multiple virtual machines.
  • M (M ⁇ l) physical servers can be virtualized to one server and used as N (N ⁇ 1) virtual machines.
  • VMware ESX Server, Xen, etc., as well as various OSs for mainframes perform the same virtualization.
  • Each virtual machine has a guest OS installed, and the application runs on the guest OS. The CPU usage of a virtual machine can be easily obtained using the functions provided by the guest OS.
  • the calculation unit 4 calculates the total value by summing the CPU usage rate acquired from the guest OS on each virtual machine over the entire virtual machine (step S12). Further, the comparison unit 6 compares the total CPU usage rate obtained for each virtual machine force with the number of physical CPUs held in the storage unit 12 (step S13). As a result of comparison, if the total value of CPU usage exceeds the number of physical CPUs, the performance of the virtual machine is likely to deteriorate, and this is given to the output unit. Finally, the output unit 8 outputs a performance degradation warning to the external output device 300 such as a display or a printer (step S14).
  • the performance degradation detection method using the total value of the CPU usage rate as a threshold is based on an experimental result using an actual Web system.
  • the number of physical CPUs used in the experiment is four.
  • measured data on the relationship between the total request arrival rate (number of requests processed per second) for each virtual machine and the total CPU usage rate Figure 6 shows a graph of.
  • the relationship between the request arrival rate and the CPU usage rate is linear for any number of virtual machines until the total value of the CPU usage rate reaches 00%. It will be powerful. This means that the performance is constant regardless of the request arrival rate when the performance of each virtual machine is considered as the request processing amount when the CPU usage rate is 100% (that is, when the CPU is used up). .
  • the slope increases and the performance deteriorates as the number of virtual machines increases. However, in the range where the total usage rate does not reach 400%, the deterioration is slight. Although the specific analysis results are omitted, the deterioration rate with respect to the number of virtual machines can be estimated.
  • ESX VMware ESX Server
  • ESX hyper-threading
  • Hyper-threading is a technology that makes it possible to execute another process by effectively using the free time of the CPU core. Physically, one core can be used as two cores.
  • ESX Virtualization software
  • each virtual machine has a virtual machine name for identifying each other and setting values related to resources such as a virtual CPU and virtual memory.
  • each virtual machine is assigned to a logical CPU for execution, but you can set which of the four logical CPUs to assign.
  • each virtual machine is set to be able to use an arbitrary logical CPU, and ES X decides which logical CPU is assigned to each virtual machine for execution.
  • the number of logical CPUs that can be used simultaneously can be set, but only one logical CPU can be used simultaneously.
  • Windows Server is installed as a guest OS, and various applications such as a Web server and a database are operating on it.
  • the usage rate acquisition unit 2 acquires the CPU usage rate from Windows Server on each virtual machine.
  • the performance monitor system monitor
  • the virtual machine can use two or more virtual CPUs at the same time, the usage rate is acquired for each virtual CPU.
  • the performance monitor if the CPU number is specified as an instance, the usage rate for each CPU can be obtained. Or, by specifying Total as the instance, the average usage rate of the CPU being used can be measured, so the same result can be obtained by multiplying this value by the number of CPUs.
  • the CPU usage rate may be obtained by calling an API provided independently. The CPU usage rate may be obtained in real time from a running virtual machine, but the log file that stores past measurement results may also be read.
  • the comparison unit 6 compares the calculated total CPU usage with this number of physical CPUs (200%). In this case, since the total value exceeds the number of physical CPUs and the possibility of performance degradation is high, the comparison unit 6 gives a warning about the performance degradation to the output unit 8 together with the total value. It is also possible to assign the virtual machine names of four virtual machines where performance degradation has occurred.
  • the output unit 8 outputs a total CPU usage rate and a performance degradation warning to the output device 300 such as a printer or display device. If time series data related to the total CPU usage rate is output in the form of a graph, the performance degradation will occur and the graph of this part can also be expressed with a red line or a thick line. In the case of a tabular format, print the data where the performance has deteriorated in red or bold.
  • the virtual machine performance management system operates on a server different from the physical server on which ESX operates. However, it can also be run on the guest OS being monitored or on virtualization software. In that case, the performance management system is also a target when acquiring the CPU usage rate as one of the virtual systems. However, if the CPU resource consumption by the performance management system is very small, it can be excluded from acquisition.
  • the following effects can be obtained by applying the comparison results to process control, physical server configuration changes, and billing systems.
  • the service quality of the system can be maintained by distributing the processing to other physical servers and adding CPUs so that each virtual machine does not cause performance degradation!
  • Another effect is that when operating a server system that collects usage charges for the time spent using the server, the user is given a discount or free of charge for the time when performance degradation occurs. I can be satisfied.
  • FIG. 4 is a block diagram showing the configuration of the virtual machine performance management system according to the second embodiment of the present invention.
  • the virtual machine performance management system includes a processing device 100, a storage device 200, and an output device 300.
  • the processing device 100 includes a usage rate acquisition unit 2, a comparison unit 6, a search unit 10, and an output unit 8.
  • the storage device 200 includes a storage unit 12 and a disk allocation information storage unit 14.
  • the usage rate acquisition unit 2 acquires the disk usage rate of each virtual machine in the disk mode.
  • the comparison unit 6 compares the obtained disk usage rate with the threshold value of the disk usage rate held by the storage unit 12 in the disk mode.
  • the search unit 10 searches all the virtual machines arranged on the same logical disk as the virtual machine.
  • the output unit 8 outputs a warning to the output device 300 that there is a possibility that the disk performance of the searched virtual machine is degraded.
  • the usage rate acquisition unit 2 acquires the disk usage rate of the virtual machine (step S21).
  • the disk usage rate is expressed as a percentage of the time spent using the hard disk per unit time and can be obtained using the guest OS function installed in the virtual machine. Multiple disks are connected to the virtual machine, and there is a possibility that it is possible to obtain the usage rate of the disk where the guest OS is installed.
  • the comparison unit 6 compares the disk usage rate acquired by the usage rate acquisition unit 2 with the threshold value stored in the storage unit 12 (step S22). If the disk usage rate exceeds the threshold as a result of the comparison, a warning that the disk performance of the virtual machine has deteriorated is sent to the search unit 10 together with the virtual machine identifier.
  • the search unit 10 refers to the correspondence table on the basis of the identifier of the virtual machine whose performance is recognized, and the disk or disk that is physically identical to the virtual machine is logically Search all virtual machines that use the same disk S23).
  • the correspondence table between the virtual machine that is the search source and the physical or logical disk is stored in the disk allocation information storage unit 14.
  • the search result is a set of virtual machine identifiers.
  • Virtual machines that have a guest OS installed on the same hard disk share a hard disk. Therefore, if a virtual machine uses a hard disk to the limit, it is highly likely that the disk performance of other virtual machines that use the same disk and the performance of the OS itself will be adversely affected. Search results show the extent of this performance degradation.
  • the output unit 8 outputs the set of virtual machine identifiers obtained as a result of the search to the output device 300 such as a display (step S24).
  • the physical server is equipped with 6 hard disks, and these are used in a RAID1 (mirroring) configuration.
  • RAID1 mirroring
  • the same data is written redundantly on two disks, and data loss can be prevented even if one of the disks is damaged.
  • the virtualization software recognizes that the physical server is equipped with 3 disks (logical volumes)! For convenience, these logical volumes are referred to as volumes X, ⁇ , and ⁇ .
  • ESX As virtualization software, it is assumed that ESX is installed, and five virtual machines, namely Guestl ⁇ 5, are running on ESX. In addition, ESX itself is installed in volume X, Guestl and 2 are created in volume Y, and Guest3 to 5 are created in volume Z. This correspondence table is preliminarily stored in the disk allocation information storage unit 14. As in the first example, Windows Server is installed on each virtual machine as a guest OS! /.
  • the usage rate acquisition unit 2 acquires the disk usage rate of each virtual machine as needed using the guest OS function.
  • the disk usage rate can be obtained by subtracting from 100 [%].
  • the disk usage rate can be obtained in real time from a running virtual machine, but the log file power can also be read.
  • the disk usage rates of Guest 1 to 5 are 30%, 25%, 18%, 92%, and 4%, respectively.
  • 80% is preset as a threshold for the disk usage rate in the storage unit 12.
  • the comparison unit 6 compares the disk usage rate of each virtual machine with the threshold value one by one in the disk mode. At this time, if the disk usage rate falls below the threshold, nothing is done. In this example, the disk usage rate of Guest4 is 92%, which exceeds the threshold of 80%. Therefore, a warning to that effect and the virtual machine identifier “Guest4” are given to the search unit 10. .
  • the search unit 10 refers to the correspondence table between the virtual machine and the disk (volume) stored in the disk allocation information storage unit 14 to obtain the volume power example in which Guest 4 is placed, and further to the volume Z. retrieves that Guest3 and 5 are assigned.
  • the output unit 8 indicates that the disk performance of Guest4 exceeds the threshold and the disk performance deteriorates, and that this effect affects Guest3 and 5, such as printers and display devices. Output to the output device 300.
  • the graph of the time zone in which performance degradation occurs can be expressed in a different color or bold line.
  • the numerical value of the time zone in which performance degradation has occurred may be printed in another color or bold.
  • the configurations shown in the first embodiment and the second embodiment are combined. Following the operation in Fig. 3, the disk mode is set and the operation in Fig. 5 is executed. In this way, virtual machines can be managed for both CPU usage and disk usage.
  • the present invention is suitable for an apparatus or system for managing the performance of a virtual machine in a virtual machine environment.
  • the virtual machine performance management system of the present invention is configured so that the performance degradation caused by the total value of the CPU usage rate of each virtual exceeding the number of physical CPUs can be detected. Even if the CPU usage rate of each virtual machine is not so high, it is possible to detect performance degradation caused by using and passing the CPU as a whole.

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

 仮想計算機環境において、各仮想マシンに問題がなくても全体として性能が劣化している場合や、ある仮想マシンが別の仮想マシンの性能に悪影響を与えている場合に、これらを検出する。仮想マシン性能管理システムは、各仮想マシンのCPU使用率を取得する使用率取得部と、CPU使用率の合計値を算出する使用率合計値算出部と、合計値と物理CPU数とを比較する比較部と、比較の結果、合計値が物理CPU数を超えている場合に、性能劣化を通知する出力部とを備える。

Description

明 細 書
仮想マシンのための性能管理システムと性能管理方法
技術分野
[0001] 本発明は仮想マシン性能管理システム、及び仮想マシン性能管理方法に関し、特 に仮想化ソフトウェア上で稼働する仮想マシンの性能劣化を検出し、その影響範囲 を特定できる仮想マシン性能管理システム、及び仮想マシン性能管理方法に関する 背景技術
[0002] 従来の性能管理システムの一例力 特開 2003— 324530号公報に記載されてい る。図 1に示されるように、この従来の性能管理システムは、処理装置に使用率取得 部、比較部および呼サービス実行判断部を備え、また、記憶装置に閾値記憶部を備 えている。
[0003] このような構成を有する従来の性能管理システムでは、使用率取得部は、通信装置 の CPU使用率を取得する。比較部は、取得された CPU使用率と、閾値記憶部により 保持された使用率に関する閾値とを比較する。呼サービス実行判断部は、取得され た CPU使用率が閾値を超えていた場合に、呼サービスに関する処理を廃棄する。超 えていなかった場合には、呼サービスの処理を実行する。これらの動作により、サー ビス品質が要求水準よりも劣化する場合に、ただちに呼損処理を行なうことによって 不要なサービス待ち時間の増加を抑えられるため、呼損率を改善することができる。
[0004] 仮想計算機環境においては、各仮想マシンの CPU使用率が閾値を下回っている 場合でも、物理サーバの計算資源が不足し、性能劣化が発生することがある。その 理由は、複数の仮想マシンが物理サーバの CPUやディスク等を共有して 、るためで ある。
[0005] 上記説明と関連して、自動リソースアサイン方式が特開平 10— 240699号公報に 開示されている。この従来例は、サービス提供手段を含むサービスプロバイダー部と 、共通リソースを供給するリソース管理部と、 CPU占有率を監視する CPU占有率監 視部と、リソース使用率を監視するリソース使用率監視部と、共通リソースの増設'減 設を算出するリソース自動算出部とを備えている。サービスプロバイダー部は、前記リ ソース管理部力 供給された共通リソースを使用してサービスを提供し、リソース管理 部は、前記リソース自動算出部からの共通リソースの増設'減設要求に基づき共通リ ソースの増設 ·減設を行なうと共に、前記サービスプロバイダー部に対して共通リソー スを提供する。リソース自動算出部は、所定のリソース算出測定時間内での CPU占 有率監視部からの CPU占有率遷移報告と、リソース使用率監視部力 のリソース使 用率遷移報告と、共通リソースの増設 ·減設を決定するための予め定められた所定 のリソース使用率と所定の CPU占有率とに基づき、共通リソースの増設'減設要求を 、リソース管理部に対して通知する。 CPU占有率監視部は、サービスプロバイダー部 による CPUの占有率を監視し、該 CPUの占有率が変化した場合、該 CPUの占有率 の遷移を、 CPU占有率遷移報告としてリソース自動算出部に通知する。リソース使用 率監視部は、リソース管理部によるリソースの使用状況を監視し、該リソース使用率が 変化した場合、該リソース使用率の遷移を、リソース使用率遷移報告として、リソース 自動算出部に通知する。
また、サーバ多重度制御方法が特開 2001— 160040号公報に開示されている。こ の従来例のサーバ多重度制御方法では、サーバが消費するサーバ CPU使用率が 測定される。あらかじめ CPU使用率上限 Z下限設定部により CPU使用率上限記憶 部に指定された CPU使用率上限値、および CPU使用率下限記憶部に指定された CPU使用率下限値と測定されたサーバ CPU使用率とが比較され、その比較結果か らサーバの多重度増減の必要性が判定される。サーバ CPU使用率が上記 CPU使 用率上限値よりも大きいと判定された場合にはサーバの多重度が増カロさせられ、サ ーバ CPU使用率が上記 CPU使用率下限値よりも小さいと判定された場合にはサー バの多重度が減少させられる。
また、計算機システムが特開 2001— 331333号公報に開示されている。この従来 例の計算機システムでは、複数のオペレーティングシステムが 1台の計算機内で稼 動させられ、 CPU,主記憶装置、外部入出力装置等の計算機資源が複数のォペレ 一ティングシステムのそれぞれに割り当てられる。資源が管理され、計算機資源の各 オペレーティングシステムへの割り当てが変更され、再構成される。また、各オペレー ティングシステムの稼動状態と関連して計算機資源の変更と再構成との内容が管理 され、各オペレーティングシステムの稼動状態に基づいて計算機資源が変更され、ま たは再構成される。
[0007] また、ストレージシステムが特開 2002— 182859号公報に開示されている。この従 来例のストレージシステムでは、設定部は、ストレージシステムの記憶領域ごとに、スト レージ性能に関する要求値の設定を受けつける。比較部は、ストレージシステムの稼 動状況に関する値と、設定した要求値とを比較する。特定部は、比較部の出力に基 づき、稼動状況に関する値が要求値を満足しない記憶領域を特定する。移動部は、 特定部により特定された記憶領域内に格納されているデータの全部または一部を、 他の記憶領域に移動する。
[0008] また、ウェブサイトの構成決定支援方法が特開 2003— 178040号公報に開示され ている。この従来例のウェブサイトの構成決定支援方法では、ウェブサーバ群、 APサ ーバ群及び DBサーバ群とから構成されるウェブサイトの各サーバ群の構成が支援さ れる。ウェブサーバ群、 APサーバ群及び DBサーバ群の処理時間と CPU使用率とメ モリ使用率とが検出され、処理時間又は CPU使用率又はメモリ使用率が所定の閾値 を所定回数以上越えた場合、閾値を越えたウェブサーバ群、 APサーバ群及び DB サーバ群に対し、接続ユーザ数及び CPUクロック数に基づ 、て閾値を越えな ヽサー バの追加数が演算される。
[0009] また、メモリチェック方法が特開 2003— 216510号公報に開示されている。この従 来例のメモリチェック方法では、情報処理装置の運用中に情報処理装置に備えられ た記憶部のメモリチェックが行なわれる。メモリチェック開始にあたり情報処理装置の 負荷状況に応じてメモリチェック開始の可否が決定される。また、メモリチェック開始 後は、記憶部の各チェック単位領域のメモリチェックが終了する度に情報処理装置の 負荷状況が取得され、取得された負荷状況に応じて次のチェック単位領域のメモリチ エック継続の可否が決定される。
[0010] また、管理システムが特開 2004— 145536号公報に開示されている。この従来例 の管理システムでは、監視対象システムとしてのネットワークカゝら収集された稼動情 報が格納される。性能劣化が生じる条件として夫々の性能劣化事象に対して稼動情 報の値の範囲を定義する性能劣化条件も格納されて 、る。各性能劣化条件に対応 した性能劣化要因を定義する性能劣化要因も格納されて 、る。稼動情報と性能劣化 要因とを比較することにより、性能劣化条件を特定し性能劣化要因から対応する性 能劣化要因を特定する。
[0011] また、仮想マシン管理装置が特開 2005— 115653号公報に開示されている。この 従来例の仮想マシン管理装置では、複数の仮想マシンの各々の所定時間ごとのパ フォーマンスを示す実測データがデータベース力 読み出され、読み出された各仮 想マシンの所定時間ごとのパフォーマンスを示す実測データを用いて各仮想マシン を複数のサーバのいずれかで稼動させた場合の各時間における各仮想マシンのパ フォーマンスの合計が最大となる仮想マシンとサーバの組み合わせが算出される。算 出された仮想マシンとサーバの組み合わせに従って、各仮想マシンのファイルが当 該仮想マシンに対応するサーバの記憶領域に格納される。
[0012] また、システム使用率管理装置が特開 2006— 92053号公報に開示されている。こ の従来例のシステム使用率管理装置では、複数の計算ノードの各々の最大性能が 設定され、各計算ノードのリソース使用率が取得される。設定された最大性能と取得 されたリソース使用率とからノード群全体の仮想的な使用率が算出される。
発明の開示
[0013] 本発明の目的は、仮想マシンの性能劣化を検出することができる仮想マシンの性 能管理システムを提供することである。
また、本発明の他の目的は、仮想マシンの性能劣化時にその影響範囲を特定でき る仮想マシンの性能管理システムを提供することにある。
[0014] 本発明の観点では、仮想マシン性能管理システムは、少なくとも 1つの物理 CPUに より実行される仮想化ソフトウェア上で稼動する複数の仮想マシンの各々の CPU使 用率を取得する使用率取得部と、前記 CPU使用率の合計値を算出する算出部と、 前記合計値と前記物理 CPUの数とを比較し、前記合計値が前記物理 CPUの数より 大き 、とき警告を出力する比較部とを備えて 、る。
[0015] 前記仮想化ソフトウェアは、複数の論理ディスクを認識し、前記複数の仮想マシン の各々は、前記複数の論理ディスクのいずれかに割当てられており、前記使用率取 得部は、ディスクモードにおいて、前記各仮想マシンのディスク使用率を取得し、前 記比較部は、前記ディスクモードにおいて、前記ディスク使用率と閾値とを比較し、前 記ディスク使用率が前記閾値を超えていた場合に、警告を出力する。また、仮想マシ ン性能管理システムは、前記ディスクモードにおいて、前記ディスク使用率が前記閾 値を超えて!/ヽた場合に、前記ディスク使用率に対する前記仮想マシンと同じ論理ディ スクに割当てられた前記仮想マシンを検索し、前記検索された仮想マシン名を出力 する検索部を更に備えて 、てもよ 、。
[0016] また、本発明の他の観点では、仮想マシン性能管理システムは、複数の仮想マシ ンの各々のディスク使用率を取得する使用率取得部と、少なくとも 1つの物理 CPUに より実行される仮想化ソフトウェア上で複数の仮想マシンが稼動し、前記仮想化ソフト ウェアは、複数の論理ディスクを認識し、前記複数の仮想マシンの各々は、前記複数 の論理ディスクのいずれかに割当てられており、前記ディスク使用率と、閾値とを比 較し、前記ディスク使用率が前記閾値を超えていた場合に、警告を出力する比較部 と、前記ディスク使用率が前記閾値を超えていた場合に、前記ディスク使用率に対す る前記仮想マシンと同じ論理ディスクに割当てられた前記仮想マシンを検索し、前記 検索された仮想マシン名を出力する検索部とを備える。
[0017] また、前記比較部は、前記合計値を時系列データとして出力してもよ!/、。この場合、 前記物理 CPUの数より大きいとき、合計値を異なる色で表示してもよい。また、前記 仮想マシンの数は、前記物理 CPUの数に関係なく設定されることが望ましい。ゲスト OS (オペレーティングシステム)は、前記各仮想マシン上で実行され、前記使用率取 得部は、前記ゲスト OSを用いて前記 CPU使用率または前記ディスク使用率を取得 する。仮想マシン性能管理システム力 前記物理 CPUとは別の CPUを使用するシス テム上に構築されていてもよいし、仮想マシン性能管理システムは、前記仮想マシン の 1つであってもよい。また、前記使用率取得部は、リアルタイムに前記 CPU使用率 または前記ディスク使用率を取得してもよいし、前記使用率取得部は、過去の動作 結果を示すログファイル力 前記 CPU使用率または前記ディスク使用率を取得して ちょい。
図面の簡単な説明 [0018] [図 1]図 1は、従来の性能管理システムの構成を示すブロック図である。
[図 2]図 2は、本発明の第 1実施例による性能管理システムの構成を示すブロック図で ある。
[図 3]図 3は、第 1実施例の動作手順を示すフローチャートである。
[図 4]図 4は、本発明の第 2実施例による性能管理システムの構成を示すブロック図で ある。
[図 5]図 5は、第 2実施例の動作手順を示すフローチャートである。
[図 6]図 6は、稼働仮想マシン数別の、リクエスト到着率と合計 CPU使用率との関係を 示すグラフである。
発明を実施するための最良の形態
[0019] 以下に添付図面を参照して、本発明の仮想マシンの性能管理システムについて詳 細に説明する。
[0020] [第 1実施例]
図 2は、本発明の第 1実施例による仮想マシンの性能管理システムの構成を示すブ ロック図である。本実施例の仮想マシンの性能管理システムは、仮想マシンが稼動す る物理サーバーとは異なる物理サーバー上に構築されている。本実施例による性能 管理システムは、処理装置 100と、記憶装置 200と、出力装置 300とを備えている。 処理装置 100は、使用率取得部 2と、算出部 4と、比較部 6と、出力部 8とを備え、記 憶装置 200は、記憶部 12を備えている。
[0021] 使用率取得部 2は、複数の仮想マシンの各々における仮想 CPUの CPU使用率を 取得する。取得方法は、後で説明する。算出部 4は、取得された各仮想マシンの CP U使用率の合計値を算出する。記憶部 12は物理 CPU数を百分率で保持して 、る。 比較部 6は、算出された合計値と、記憶部 12により保持されている物理 CPU数とを 比較する。算出された合計値が、物理 CPU数より少ないときはそのまま処理が続行 される力 算出された合計値が、物理 CPU数より多いときは、比較部 6は警告を出力 し、出力部 8はその警告を出力装置 300に出力する。出力装置 300は、液晶ディスプ レイのような表示装置、プリンタ等である。
[0022] 次に、図 3のフローチャートを参照して第 1実施例による仮想マシンの性能管理シス テムの動作について詳細に説明する。
まず、使用率取得部 2が、各仮想マシン(VM: Virtual Machine)の仮想 CPUの CPU使用率を取得する (ステップ Sl l)。各仮想マシンは、同一のサーバ上に配備さ れた仮想的なサーバマシンである。このようなサーバの仮想化は、仮想化ソフトウェア よって実現されており、物理的には 1台のサーバを複数台の仮想マシンとして利用す ることを可能にする。また、仮想化ソフトウェアによっては、 M台(M≥l)の物理サー バを 1台のサーバに仮想化した上で、 N台(N≥ 1)の仮想マシンとして利用することも 可能である。仮想化ソフトウェアとしては、 VMware ESX Server, Xenなどのほか 、メインフレーム用の各種 OSも同様の仮想化を行う。各仮想マシンにはそれぞれゲ スト OSがインストールされ、アプリケーションはゲスト OS上で動作する。仮想マシンの CPU使用率は、ゲスト OSの提供する機能を使って容易に取得できる。
次に、算出部 4は、各仮想マシン上のゲスト OSから取得された CPU使用率を仮想 マシンの全体に渡って合計して合計値を算出する (ステップ S 12)。さらに、比較部 6 は、各仮想マシン力も得られた CPU使用率の合計値と記憶部 12に保持される物理 CPUの数とを比較する (ステップ S 13)。比較の結果、 CPU使用率の合計値が物理 CPU数を超えて 、た場合は、仮想マシンの性能が劣化して 、る可能性が高 、ため、 その旨を出力部に付与する。最後に、出力部 8が、ディスプレイやプリンタのような外 部の出力装置 300に対して、性能劣化の警告を出力する (ステップ S14)。
[0023] このような CPU使用率の合計値を閾値とする性能劣化の検出手法は、実際の Web システムを用いた実験結果に基づいている。ここで、実験に用いたサーバの物理 CP U数は 4個である。 VMware ESX Server上で 1〜12個の仮想マシンが稼働する とき、各仮想マシンのリクエスト到着率 (毎秒のリクエスト処理数)の合計値と、 CPU使 用率の合計値との関係を実測したデータをグラフ化したものを図 6に示す。
[0024] 図 6から明らかなように、この例では CPU使用率の合計値力 00%に達するまでは 、どの仮想マシン数のときも、リクエスト到着率と CPU使用率との関係が線形であるこ とがわ力るであろう。これは、各仮想マシンの性能を、 CPU使用率が 100%の(つまり CPUを使いきつた)ときのリクエスト処理量と考えたとき、リクエスト到着率に関わらず 性能が一定であることを意味する。もちろん、仮想マシン数が増えると、仮想マシンの 制御に一定の処理が必要なために、仮想マシン数が多いほど傾きが大きくなり、性 能は劣化する。しかし、合計使用率が 400%に達しない範囲においては、劣化は軽 微である。また、具体的な分析結果は割愛するが、仮想マシン数に対する劣化率は 推定可能である。
[0025] これに対して、仮想マシン数が物理 CPU数よりも大きい 8や 12のとき、合計使用率 力 00%を超えると、リクエスト到着率と CPU使用率との関係が線形ではなくなり、性 能が大幅に劣化することがわかる。またこの実験結果は、合計値が 400%を超えた 状況においては、ある仮想マシンの CPU使用率の上昇力 他の仮想マシンの CPU 性能を大きく劣化させる可能性があることを示唆している。
[0026] 仮想マシンの数を物理 CPU数と同じ 4力、それ以下にした場合は、 CPU使用率の 合計値力 00%を超えないので、一般的には安全な運用が可能である。しかしなが ら、サーバや仮想化ソフトウェアの導入に大きなコストがかかるので、現実的には物理
CPU数以上の仮想マシンが動作する場合が多い。実験結果によれば、このような場 合でも、 CPU使用率の合計値が物理 CPU数を超えないように運用することで、仮想 マシンの性能劣化を予測の範囲内に抑えることが可能である。
[0027] 以下に第 1実施例の具体的な例について説明する。前提として、デュアルコア CP Uを 1個搭載した物理サーバに、仮想化ソフトウェアとして VMware ESX Server ( 以下、 ESX)がインストールされ、動作しているとする。物理 CPU数はコア数のことを 指すので、この場合における物理 CPU数は 2となる。仮に、デュアルコア CPUを 3個 搭載しているとすると、物理 CPU数は 2 X 3 = 6となる。また、各 CPUのコアは、ハイ パースレツデイング(HT:Hyper— Threading)が有効に設定されているとする。ハイ パースレツデイングは CPUコアの空き時間を有効利用して別の処理を実行できるよう にする技術であり、物理的には 1つのコアを 2つのコアとして使うことができる。ただし 、デュアルコアのような複数コア技術と違い、ハイパースレツデイングによって CPUの 性能が 2倍になるわけではな 、ので、ノ、ィパースレツデイングが有効に設定されたと きの CPU数を、仮想化ソフトウェア(ESX)は論理 CPU数として認識する。 2つのコア に対してハイパースレツデイングが有効に設定されて 、る場合には、論理 CPU数は 2 X 2=4となる。ハイパースレツデイングが無効に設定されているときには、論理 CPU 数は物理 CPU数と同じ値の 2になる。以下では、物理 CPU数は 2であるとして説明 する。
[0028] 仮想化ソフトウェアの ESX上では、 4つの仮想マシン (VM)が設定され、稼働して いるとする。各仮想マシンは、互いを識別するための仮想マシン名や、仮想 CPUや 仮想メモリ等の資源に関する設定値をもつ。 ESXの場合、各仮想マシンは論理 CPU に割り当てられて実行されるが、 4つのうちのどの論理 CPUに割り当てるかを設定す ることが可能である。しかし今回の例では、各仮想マシンが任意の論理 CPUを利用 できるように設定され、各仮想マシンをどの論理 CPUに割り当てて実行するかは、 E SXが決定するものとする。また、追加機能として、同時に利用できる論理 CPU数も 設定できるが、同時に利用できる論理 CPUは、 1つのみとする。
[0029] 各仮想マシン上には、ゲスト OSとして Windows Serverがインストールされ、その 上で Webサーバやデータベース等の各種アプリケーションが動作している。
まず、使用率取得部 2が各仮想マシン上の Windows Serverから CPU使用率を 取得する。 Windows Serverに標準添付されて!、るパフォーマンスモニタ(システム モニタ)を使い、カウンタとして Processor Timeと、インスタンスとして CPU番号とを 指定することにより、 CPU使用率を取得することができる。また、仮想マシンが同時に 利用できる仮想 CPU数が 1つの場合は、インスタンスとして Totalを指定しても同様 の結果が得られる。また、仮想マシンが 2つ以上の仮想 CPUを同時に利用できる場 合は、各仮想 CPUに対して使用率を取得する。パフォーマンスモニタの場合、インス タンスとして CPU番号を指定すれば、 CPUごとの使用率を取得できる。または、イン スタンスとして Totalを指定することで利用中の CPUの平均使用率が計測できるため 、この値を CPU数倍しても同様の結果が得られる。 Windows Serverの場合、独自 に提供されている APIを呼びだして、 CPU使用率を取得してもよい。また CPU使用 率は、稼働中の仮想マシンからリアルタイムに取得してもよいが、過去の計測結果を 保存したログファイル力も読み出してもよ 、。
[0030] ここでは、 4つの仮想マシンから取得された CPU使用率がそれぞれ 42%、 71%、 5 2%、 56%であったとする。算出部 4は、各仮想マシン力も取得した CPU使用率を積 算し、合計値である 42% + 71% + 52% + 56% = 221%を算出する。記憶部 12は 、物理 CPU数である 2 ( = 200%)を保持している。比較部 6は、算出された CPU使 用率の合計値とこの物理 CPU数(200%)とを比較する。今回の場合、合計値が物 理 CPU数を上回っており、性能劣化の可能性が高いので、比較部 6は性能劣化に 関する警告を合計値とともに出力部 8に付与する。また、性能劣化の起きている 4つ の仮想マシンの仮想マシン名を一緒に付与してもよい。最後に、出力部 8は、プリン タゃディスプレイ装置などである出力装置 300に CPU使用率の合計値と性能劣化の 警告を出力する。 CPU使用率の合計値に関する時系列データをグラフ形式で出力 する場合は、性能劣化が起きて 、る部分のグラフを赤線や太線で表現することもでき る。また、表形式の場合は、性能劣化の起きている部分のデータを赤字や太字で印 字してちょい。
[0031] ここで、上記のように、仮想マシンの性能管理システムは、 ESXの動作する物理サ 一バとは別のサーバで動作する。し力しながら、監視対象となっているゲスト OS上や 、仮想化ソフトウェア上で動作させることもできる。その場合には、性能管理システムも 仮想システムの 1つとして CPU使用率を取得するときの対象となる。但し、性能管理 システムによる CPU資源消費が非常に小さい場合は、取得の対象から除外すること ちでさる。
[0032] 以上説明したように、第 1実施例によれば、各仮想マシンの CPU使用率はそれほ ど高くなくても、全体として CPUを使い過ぎていることによって発生する性能劣化を 検出できる。
また、比較結果をプロセスの制御や物理サーバの構成変更、課金システムに応用 することによって、次のような効果が得られる。 1つには、各仮想マシンが性能劣化を 起こさな!/、ように他の物理サーバへ処理を分散したり、 CPUを追加したりすることによ つて、システムのサービス品質を維持できる。もう 1つの効果としては、サーバを利用 した時間の分だけ利用料を徴収するようなサーバシステムを運用するとき、性能劣化 が発生している時間の料金を割引あるいは無料にすることによって、ユーザの納得を 得ることができる。
[0033] [第 2実施例]
図 4は、本発明の第 2実施例による仮想マシンの性能管理システムの構成を示すブ ロック図である。本実施例の仮想マシン性能管理システムは、第 1実施例と同様に、 管理対象の物理サーバとは別の物理サーバに構築されている。仮想マシン性能管 理システムは、処理装置 100と、記憶装置 200と、出力装置 300とを備えている。処 理装置 100は、使用率取得部 2と、比較部 6と、検索部 10と、出力部 8とを備えている 。記憶装置 200は、記憶部 12と、ディスク割当て情報記憶部 14とを備えている。
[0034] 使用率取得部 2は、ディスクモードにお 、て、各仮想マシンのディスク使用率を取 得する。比較部 6は、ディスクモードにおいて、取得したディスク使用率と、記憶部 12 により保持されているディスク使用率の閾値とを比較する。検索部 10は、ディスクモ ードにおいて、仮想マシンのディスク使用率が閾値を超えていた場合に、その仮想マ シンと同じ論理ディスク上に配置されている仮想マシンをすベて検索する。出力部 8 は、ディスクモードにおいて、検索された仮想マシンに関し、ディスク性能が劣化して いる可能性がある旨の警告を出力装置 300に出力する。
[0035] 次に、図 5のフローチャートを参照して第 2実施例による仮想マシンの性能管理シス テムについて詳細に説明する。
まず、ディスクモードにおいて、使用率取得部 2が仮想マシンのディスク使用率を取 得する (ステップ S21)。ディスク使用率は、単位時間あたりにハードディスクを利用し て 、た時間の割合として表わされ、仮想マシンにインストールされたゲスト OSの機能 を使用して取得できる。仮想マシンには複数のディスクが接続されて 、る可能性があ る力 ゲスト OSがインストールされているディスクの使用率を取得する。
一方、記憶部 12は、ディスク使用率の閾値を保持しており、ディスク使用率がこの 閾値を超えるとディスク性能が許容範囲を超えて劣化することがすでにわ力つている ものとする。比較部 6は、ディスクモードにおいて、使用率取得部 2が取得したディスク 使用率と、記憶部 12により保持されている閾値の大小を比較する (ステップ S22)。比 較の結果、ディスク使用率が閾値を超えていた場合は、仮想マシンのディスク性能が 劣化している旨の警告を、仮想マシンの識別子とともに検索部 10に送付する。
[0036] 次に、検索部 10が、ディスクモードにおいて、性能劣化の認められる仮想マシンの 識別子に基づいて、対応テーブルを参照して、その仮想マシンと物理的に同一のデ イスク或 ヽは論理的に同一のディスクを使用する仮想マシンをすベて検索する (ステ ップ S23)。検索のもととなる仮想マシンと物理或いは論理ディスクの対応テーブルは 、ディスク割当て情報記憶部 14に格納されている。検索結果は、仮想マシンの識別 子の集合となる。
同一のハードディスク上にゲスト OSがインストールされている仮想マシン同士は、 ハードディスクを共有している関係にある。そのため、ある仮想マシンがハードデイス クを限界付近まで利用すると、同一ディスクを利用する他の仮想マシンのディスク性 能ならびに OS自身の性能に悪影響が及ぶ可能性が非常に高い。検索結果は、この 性能劣化の及ぶ範囲を示して 、る。
最後に、出力部 8が検索の結果得られた仮想マシンの識別子の集合を、ディスプレ ィゃプリンタのような出力装置 300に出力する (ステップ S24)。
[0037] 次に、第 2実施例の具体的な例について説明する。前提として、物理サーバは 6個 のハードディスクを搭載しており、これらを RAID1 (ミラーリング)構成で利用している とする。 RAID1では、 2台のディスクに同じ内容のデータが冗長に書き込まれ、片方 のディスクが破損してもデータの損失を防ぐことができる。この場合、仮想化ソフトゥェ ァは、物理サーバが 3台のディスク (論理ボリューム)を搭載して!/ヽるように認識する。 便宜上、これらの論理ボリュームをボリューム X、 Υ、 Ζと呼んで区別する。
仮想化ソフトウェアとしては、 ESXがインストールされ、 ESX上には 5個の仮想マシ ン、すなわち Guestl〜5が稼働しているものとする。また、ボリューム Xには ESX自 身がインストールされており、ボリューム Yには Guestlと 2、ボリューム Zには Guest3 〜5がそれぞれ作成されて ヽるものとする。この対応テーブルはディスク割当て情報 記憶部 14にあら力じめ格納されている。また、第 1実施例と同様、各仮想マシン上に はゲスト OSとして Windows Serverがインストールされて!/、るものとする。
[0038] まず、使用率取得部 2が各仮想マシンのディスク使用率をゲスト OSの機能を使って 随時取得する。 Windows Serverに標準添付のパフォーマンスモニタの場合、ディ スクを利用していない時間の割合に対応する Idle Timeのカウンタと、システムドライ ブである Cドライブを含むインスタンスを指定することで計測される値を 100 [%]から 減算することによってディスク使用率が取得できる。カウンタとして Disk Timeを指定 して直接ディスク使用率を取得することもできるが、このカウンタは高負荷時の誤差が 大きいという問題がある。また、ディスク使用率は稼働中の仮想マシンからリアルタイ ムに取得してもよ 、が、ログファイル力も読み出してもよ 、。
[0039] ここでは、 Guestl〜5のディスク使用率がそれぞれ 30%、 25%、 18%、 92%、 4 %であったとする。一方、記憶部 12には、ディスク使用率に対する閾値として 80%が あら力じめ設定されて 、るものとする。
次に、比較部 6は、ディスクモードにおいて、各仮想マシンのディスク使用率をひと つひとつ閾値と比較する。このとき、ディスク使用率が閾値を下回る場合は、特にな にも行なわない。今回の例では、 Guest4のディスク使用率が 92%であり、閾値の 80 %を上回って 、るので、その旨の警告と仮想マシンの識別子である「Guest4」が検 索部 10に付与される。
検索部 10は、ディスクモードにおいて、ディスク割当て情報記憶部 14に格納された 仮想マシンとディスク(ボリューム)の対応テーブルを参照して、 Guest4の置かれて いるボリューム力 ¾であり、さらにボリューム Zには Guest3と 5が割当てられていること を検索する。
最後に、出力部 8は、ディスクモードにおいて、 Guest4のディスク使用率が閾値を 上回っていることによってディスク性能が劣化し、この影響が Guest3と 5に及んでい ることをプリンタやディスプレイ装置等の出力装置 300に出力する。
各仮想マシンのディスク使用率に関する時系列データをグラフ形式で出力する場 合は、性能劣化の発生している時間帯のグラフを別の色や太線で表現できる。また、 表形式で出力する場合は、性能劣化の発生している時間帯の数値を別の色や太字 で印字してもよい。
[0040] 以上説明したように、第 2実施例によれば、ある仮想マシンのディスク性能の劣化を 検出すると同時に、この影響を受けて同様にディスク性能や OSの性能が劣化する可 能性のあるほかの仮想マシンを見つけることができる。これにより、たとえば管理者が Guest3や 5の利用者力 性能劣化に関する苦情を受けた場合でも、 Guest3や 5が 性能劣化の原因には無関係である可能性が高いと判断できる。
また、検索結果をもとに Guest4と Guest3、 5とを別の物理サーバや別のディスク上 に配置し直すことによって、再度同じ様な性能劣化が発生した場合に、その影響を 最小限に抑えることができる。
[0041] [第 3実施例]
本発明の第 3実施例による仮想マシンの性能管理システムでは、上記の第 1実施 形態と第 2実施形態で示された構成が結合されている。また、図 3の動作に続いて、 ディスクモードが設定され、図 5の動作が実行される。こうして、 CPUの使用率とディ スク使用率の両方について仮想マシンを管理することができる。
[0042] 本発明は、仮想計算機環境において、仮想マシンの性能を管理するための装置ま たはシステムに好適である。各仮想の CPU使用率の合計値が物理 CPU数を上回る ことによって発生する性能劣化を検出できるように、本発明の仮想マシン性能管理シ ステムが構成されている。各仮想マシンの CPU使用率はそれほど高くなくても、全体 として CPUを使 、過ぎて 、ることによって発生する性能劣化を検出できる。

Claims

請求の範囲
[1] 少なくとも 1つの物理 CPUにより実行される仮想化ソフトウェア上で稼動する複数の 仮想マシンの各々の CPU使用率を取得する使用率取得部と、
前記 CPU使用率の合計値を算出する算出部と、
前記合計値と前記物理 CPUの数とを比較し、前記合計値が前記物理 CPUの数よ り多いとき警告を出力する比較部と
を備える仮想マシン性能管理システム。
[2] 請求の範囲 1に記載の仮想マシン性能管理システムにお 、て、
前記仮想化ソフトウェアは、複数の論理ディスクを認識し、前記複数の仮想マシン の各々は、前記複数の論理ディスクのいずれかに割当てられており、
前記使用率取得部は、ディスクモードにおいて、前記各仮想マシンのディスク使用 率を取得し、
前記比較部は、前記ディスクモードにおいて、前記ディスク使用率と閾値とを比較し 、前記ディスク使用率が前記閾値を超えていた場合に、警告を出力する
仮想マシン性能管理システム。
[3] 請求の範囲 2に記載の仮想マシン性能管理システムにお 、て、
前記ディスクモードにぉ ヽて、前記ディスク使用率が前記閾値を超えてた場合に、 前記ディスク使用率に対する前記仮想マシンと同じ論理ディスクに割当てられた前記 仮想マシンを検索し、前記検索された仮想マシン名を出力する検索部
を更に備える仮想マシン性能管理システム。
[4] 複数の仮想マシンの各々のディスク使用率を取得する使用率取得部と、少なくとも 1つの物理 CPUにより実行される仮想化ソフトウェア上で複数の仮想マシンが稼動し 、前記仮想化ソフトウェアは、複数の論理ディスクを認識し、前記複数の仮想マシン の各々は、前記複数の論理ディスクのいずれかに割当てられており、前記各仮想マ シン上でゲスト OSが動作し、前記ディスク使用率は前記ゲスト OSが格納されるディ スクの使用率であり、
前記ディスク使用率と、閾値とを比較する比較部と、
前記ディスク使用率が前記閾値を超えて ヽた場合に、前記仮想マシンと同じ論理 ディスクに割当てられた前記仮想マシンをすベて検索する検索部と
を備える仮想マシン性能管理システム。
[5] 請求の範囲 1乃至 3のいずれかに記載の仮想マシン性能管理システムにおいて、 前記比較部は、前記合計値を時系列データとして出力する
仮想マシン性能管理システム。
[6] 請求の範囲 1乃至 4のいずれかに記載の仮想マシン性能管理システムにおいて、 前記仮想マシンの数は、前記物理 CPUの数に関係なく設定される
仮想マシン性能管理システム。
[7] 請求の範囲 1乃至 4のいずれかに記載の仮想マシン性能管理システムにおいて、 ゲスト OSは、前記各仮想マシン上で実行され、
前記使用率取得部は、前記ゲスト OSを用いて前記 CPU使用率または前記ディス ク使用率を取得する
仮想マシン性能管理システム。
[8] 請求の範囲 1乃至 4のいずれかに記載の仮想マシン性能管理システムにおいて、 仮想マシン性能管理システム力 前記物理 CPUとは別の CPUを使用するシステム 上に構築されている
仮想マシン性能管理システム。
[9] 請求の範囲 1乃至 4のいずれかに記載の仮想マシン性能管理システムにおいて、 仮想マシン性能管理システムは、前記仮想マシンの 1つである
仮想マシン性能管理システム。
[10] 請求の範囲 1乃至 4のいずれかに記載の仮想マシン性能管理システムにおいて、 前記使用率取得部は、リアルタイムに前記 CPU使用率または前記ディスク使用率 を取得する
仮想マシン性能管理システム。
[11] 請求の範囲 1乃至 4のいずれかに記載の仮想マシン性能管理システムにおいて、 前記使用率取得部は、過去の動作結果を示すログファイル力 前記 CPU使用率ま たは前記ディスク使用率を取得する
仮想マシン性能管理システム。
PCT/JP2006/312224 2006-06-19 2006-06-19 仮想マシンのための性能管理システムと性能管理方法 WO2007148371A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/312224 WO2007148371A1 (ja) 2006-06-19 2006-06-19 仮想マシンのための性能管理システムと性能管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/312224 WO2007148371A1 (ja) 2006-06-19 2006-06-19 仮想マシンのための性能管理システムと性能管理方法

Publications (1)

Publication Number Publication Date
WO2007148371A1 true WO2007148371A1 (ja) 2007-12-27

Family

ID=38833124

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2006/312224 WO2007148371A1 (ja) 2006-06-19 2006-06-19 仮想マシンのための性能管理システムと性能管理方法

Country Status (1)

Country Link
WO (1) WO2007148371A1 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009205208A (ja) * 2008-02-26 2009-09-10 Nec Corp 運用管理装置、運用管理方法ならびにプログラム
JP2010176413A (ja) * 2009-01-29 2010-08-12 Fujitsu Ltd 情報処理装置、情報処理方法及びコンピュータプログラム
JP2010191738A (ja) * 2009-02-19 2010-09-02 Hitachi Ltd 障害解析支援システム
JP2012027614A (ja) * 2010-07-21 2012-02-09 Fujitsu Ltd 情報提供装置、情報提供方法及びプログラム
JP2012215915A (ja) * 2011-03-31 2012-11-08 Toshiba Corp リソース利用率測定装置及びプログラム
JP2014095997A (ja) * 2012-11-08 2014-05-22 Fujitsu Ltd 情報処理装置、制御装置及び情報処理装置の制御方法
CN110888778A (zh) * 2019-11-14 2020-03-17 西安雷风电子科技有限公司 一种基于云桌面的日志文件监控系统及方法
CN112783441A (zh) * 2021-01-08 2021-05-11 中国银联股份有限公司 一种调整虚拟机磁盘读写限速的方法、装置及计算设备
CN113032231A (zh) * 2021-03-09 2021-06-25 中国人民解放军63660部队 一种虚拟化平台综合性能评估方法
WO2021218935A1 (zh) * 2020-04-27 2021-11-04 安谋科技(中国)有限公司 计算机设备上的虚拟机的管理方法、装置、介质和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03202923A (ja) * 1989-12-28 1991-09-04 Hitachi Ltd 仮想計算機システムにおけるシステム情報転送方式
JPH0484335A (ja) * 1990-07-27 1992-03-17 Fujitsu Ltd 仮想計算機制御方式
JPH11259316A (ja) * 1998-01-09 1999-09-24 Hitachi Ltd Cpu能力調整方法
JP2003157177A (ja) * 2001-11-22 2003-05-30 Hitachi Ltd 仮想計算機システム及びプログラム
JP2003208413A (ja) * 2002-01-17 2003-07-25 Fujitsu Ltd 資産情報の一元管理を行うコンピュータシステム
JP2006065430A (ja) * 2004-08-25 2006-03-09 Hitachi Ltd 仮想計算機性能変更方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03202923A (ja) * 1989-12-28 1991-09-04 Hitachi Ltd 仮想計算機システムにおけるシステム情報転送方式
JPH0484335A (ja) * 1990-07-27 1992-03-17 Fujitsu Ltd 仮想計算機制御方式
JPH11259316A (ja) * 1998-01-09 1999-09-24 Hitachi Ltd Cpu能力調整方法
JP2003157177A (ja) * 2001-11-22 2003-05-30 Hitachi Ltd 仮想計算機システム及びプログラム
JP2003208413A (ja) * 2002-01-17 2003-07-25 Fujitsu Ltd 資産情報の一元管理を行うコンピュータシステム
JP2006065430A (ja) * 2004-08-25 2006-03-09 Hitachi Ltd 仮想計算機性能変更方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KNIGHT N.: "MCSE Kyokasho Windows 2000 Server (Test number: 70-215)", vol. 1ST ED., 28 February 2001, KABUSHIKI KAISHA SHOEISHA, ISBN: 88135-986-X, pages: 112 - 115, XP003020860 *
WATANABE H.: "Product Review VMware ESX Server 2 LinuxWORLD", KABUSHIKI KAISHA IDG JAPAN, vol. 3, no. 5, 1 May 2004 (2004-05-01), pages 112 - 117, XP003020859 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009205208A (ja) * 2008-02-26 2009-09-10 Nec Corp 運用管理装置、運用管理方法ならびにプログラム
JP2010176413A (ja) * 2009-01-29 2010-08-12 Fujitsu Ltd 情報処理装置、情報処理方法及びコンピュータプログラム
JP2010191738A (ja) * 2009-02-19 2010-09-02 Hitachi Ltd 障害解析支援システム
US8756600B2 (en) 2010-07-21 2014-06-17 Fujitsu Limited Judging apparatus, method, and recording medium of program for estimating the effect of deployment of an application in a virtual machine environment
JP2012027614A (ja) * 2010-07-21 2012-02-09 Fujitsu Ltd 情報提供装置、情報提供方法及びプログラム
JP2012215915A (ja) * 2011-03-31 2012-11-08 Toshiba Corp リソース利用率測定装置及びプログラム
JP2014095997A (ja) * 2012-11-08 2014-05-22 Fujitsu Ltd 情報処理装置、制御装置及び情報処理装置の制御方法
CN110888778A (zh) * 2019-11-14 2020-03-17 西安雷风电子科技有限公司 一种基于云桌面的日志文件监控系统及方法
CN110888778B (zh) * 2019-11-14 2023-03-28 西安雷风电子科技有限公司 一种基于云桌面的日志文件监控系统及方法
WO2021218935A1 (zh) * 2020-04-27 2021-11-04 安谋科技(中国)有限公司 计算机设备上的虚拟机的管理方法、装置、介质和系统
CN112783441A (zh) * 2021-01-08 2021-05-11 中国银联股份有限公司 一种调整虚拟机磁盘读写限速的方法、装置及计算设备
CN112783441B (zh) * 2021-01-08 2023-08-01 中国银联股份有限公司 一种调整虚拟机磁盘读写限速的方法、装置及计算设备
CN113032231A (zh) * 2021-03-09 2021-06-25 中国人民解放军63660部队 一种虚拟化平台综合性能评估方法
CN113032231B (zh) * 2021-03-09 2024-03-15 中国人民解放军63660部队 一种虚拟化平台综合性能评估方法

Similar Documents

Publication Publication Date Title
WO2007148371A1 (ja) 仮想マシンのための性能管理システムと性能管理方法
US11182220B2 (en) Proactive high availability in a virtualized computer system
US10838803B2 (en) Resource provisioning and replacement according to a resource failure analysis in disaggregated data centers
US11050637B2 (en) Resource lifecycle optimization in disaggregated data centers
US8191069B2 (en) Method of monitoring performance of virtual computer and apparatus using the method
JP4920391B2 (ja) 計算機システムの管理方法、管理サーバ、計算機システム及びプログラム
US8346933B2 (en) Virtual machine location system, virtual machine location method, program, virtual machine manager, and server
US9485160B1 (en) System for optimization of input/output from a storage array
US9081621B2 (en) Efficient input/output-aware multi-processor virtual machine scheduling
KR20190070659A (ko) 컨테이너 기반의 자원 할당을 지원하는 클라우드 컴퓨팅 장치 및 방법
WO2011074284A1 (ja) 仮想計算機の移動方法、仮想計算機システム及びプログラムを格納した記憶媒体
US20070038885A1 (en) Method for operating an arrangement of a plurality of computers in the event of a computer failure
US10761915B2 (en) Preemptive deep diagnostics and health checking of resources in disaggregated data centers
US10846079B2 (en) System and method for the dynamic expansion of a cluster with co nodes before upgrade
US20200097348A1 (en) Health check diagnostics of resources by instantiating workloads in disaggregated data centers
US11188408B2 (en) Preemptive resource replacement according to failure pattern analysis in disaggregated data centers
US9852007B2 (en) System management method, management computer, and non-transitory computer-readable storage medium
JP2011248735A (ja) サーバ計算機の切替方法、管理計算機及びプログラム
US10831580B2 (en) Diagnostic health checking and replacement of resources in disaggregated data centers
KR20200080458A (ko) 클라우드 멀티-클러스터 장치
Talwar et al. An energy efficient agent aware proactive fault tolerance for preventing deterioration of virtual machines within cloud environment
US9910709B2 (en) Allocation control method and apparatus
JP2013206379A (ja) クラスタ監視装置、クラスタ監視方法、及びプログラム
JP2013117889A (ja) 広域分散構成変更システム
KR101070431B1 (ko) 가상화 기반 물리 시스템 및 그 자원 관리 방법

Legal Events

Date Code Title Description
DPE2 Request for preliminary examination filed before expiration of 19th month from priority date (pct application filed from 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 06766888

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 06766888

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP