WO2007148371A1

WO2007148371A1 - 仮想マシンのための性能管理システムと性能管理方法

Info

Publication number: WO2007148371A1
Application number: PCT/JP2006/312224
Authority: WO
Inventors: Yasuhiro Ajiro
Original assignee: Nec Corporation
Priority date: 2006-06-19
Filing date: 2006-06-19
Publication date: 2007-12-27

Abstract

　仮想計算機環境において、各仮想マシンに問題がなくても全体として性能が劣化している場合や、ある仮想マシンが別の仮想マシンの性能に悪影響を与えている場合に、これらを検出する。仮想マシン性能管理システムは、各仮想マシンのＣＰＵ使用率を取得する使用率取得部と、ＣＰＵ使用率の合計値を算出する使用率合計値算出部と、合計値と物理ＣＰＵ数とを比較する比較部と、比較の結果、合計値が物理ＣＰＵ数を超えている場合に、性能劣化を通知する出力部とを備える。

Description

明細書

仮想マシンのための性能管理システムと性能管理方法

技術分野

[0001] 本発明は仮想マシン性能管理システム、及び仮想マシン性能管理方法に関し、特に仮想化ソフトウェア上で稼働する仮想マシンの性能劣化を検出し、その影響範囲を特定できる仮想マシン性能管理システム、及び仮想マシン性能管理方法に関する背景技術

[0002] 従来の性能管理システムの一例力特開 2003— 324530号公報に記載されている。図 1に示されるように、この従来の性能管理システムは、処理装置に使用率取得部、比較部および呼サービス実行判断部を備え、また、記憶装置に閾値記憶部を備えている。

[0003] このような構成を有する従来の性能管理システムでは、使用率取得部は、通信装置の CPU使用率を取得する。比較部は、取得された CPU使用率と、閾値記憶部により保持された使用率に関する閾値とを比較する。呼サービス実行判断部は、取得された CPU使用率が閾値を超えていた場合に、呼サービスに関する処理を廃棄する。超えていなかった場合には、呼サービスの処理を実行する。これらの動作により、サービス品質が要求水準よりも劣化する場合に、ただちに呼損処理を行なうことによって不要なサービス待ち時間の増加を抑えられるため、呼損率を改善することができる。

[0004] 仮想計算機環境においては、各仮想マシンの CPU使用率が閾値を下回っている場合でも、物理サーバの計算資源が不足し、性能劣化が発生することがある。その理由は、複数の仮想マシンが物理サーバの CPUやディスク等を共有して、るためである。

[0005] 上記説明と関連して、自動リソースアサイン方式が特開平 10— 240699号公報に開示されている。この従来例は、サービス提供手段を含むサービスプロバイダー部と、共通リソースを供給するリソース管理部と、 CPU占有率を監視する CPU占有率監視部と、リソース使用率を監視するリソース使用率監視部と、共通リソースの増設'減設を算出するリソース自動算出部とを備えている。サービスプロバイダー部は、前記リソース管理部力供給された共通リソースを使用してサービスを提供し、リソース管理部は、前記リソース自動算出部からの共通リソースの増設'減設要求に基づき共通リソースの増設 ·減設を行なうと共に、前記サービスプロバイダー部に対して共通リソースを提供する。リソース自動算出部は、所定のリソース算出測定時間内での CPU占有率監視部からの CPU占有率遷移報告と、リソース使用率監視部力のリソース使用率遷移報告と、共通リソースの増設 ·減設を決定するための予め定められた所定のリソース使用率と所定の CPU占有率とに基づき、共通リソースの増設'減設要求を、リソース管理部に対して通知する。 CPU占有率監視部は、サービスプロバイダー部による CPUの占有率を監視し、該 CPUの占有率が変化した場合、該 CPUの占有率の遷移を、 CPU占有率遷移報告としてリソース自動算出部に通知する。リソース使用率監視部は、リソース管理部によるリソースの使用状況を監視し、該リソース使用率が変化した場合、該リソース使用率の遷移を、リソース使用率遷移報告として、リソース自動算出部に通知する。

また、サーバ多重度制御方法が特開 2001— 160040号公報に開示されている。この従来例のサーバ多重度制御方法では、サーバが消費するサーバ CPU使用率が測定される。あらかじめ CPU使用率上限 Z下限設定部により CPU使用率上限記憶部に指定された CPU使用率上限値、および CPU使用率下限記憶部に指定された CPU使用率下限値と測定されたサーバ CPU使用率とが比較され、その比較結果からサーバの多重度増減の必要性が判定される。サーバ CPU使用率が上記 CPU使用率上限値よりも大きいと判定された場合にはサーバの多重度が増カロさせられ、サーバ CPU使用率が上記 CPU使用率下限値よりも小さいと判定された場合にはサーバの多重度が減少させられる。

また、計算機システムが特開 2001— 331333号公報に開示されている。この従来例の計算機システムでは、複数のオペレーティングシステムが 1台の計算機内で稼動させられ、 CPU,主記憶装置、外部入出力装置等の計算機資源が複数のォペレ一ティングシステムのそれぞれに割り当てられる。資源が管理され、計算機資源の各オペレーティングシステムへの割り当てが変更され、再構成される。また、各オペレーティングシステムの稼動状態と関連して計算機資源の変更と再構成との内容が管理され、各オペレーティングシステムの稼動状態に基づいて計算機資源が変更され、または再構成される。

[0007] また、ストレージシステムが特開 2002— 182859号公報に開示されている。この従来例のストレージシステムでは、設定部は、ストレージシステムの記憶領域ごとに、ストレージ性能に関する要求値の設定を受けつける。比較部は、ストレージシステムの稼動状況に関する値と、設定した要求値とを比較する。特定部は、比較部の出力に基づき、稼動状況に関する値が要求値を満足しない記憶領域を特定する。移動部は、特定部により特定された記憶領域内に格納されているデータの全部または一部を、他の記憶領域に移動する。

[0008] また、ウェブサイトの構成決定支援方法が特開 2003— 178040号公報に開示されている。この従来例のウェブサイトの構成決定支援方法では、ウェブサーバ群、 APサーバ群及び DBサーバ群とから構成されるウェブサイトの各サーバ群の構成が支援される。ウェブサーバ群、 APサーバ群及び DBサーバ群の処理時間と CPU使用率とメモリ使用率とが検出され、処理時間又は CPU使用率又はメモリ使用率が所定の閾値を所定回数以上越えた場合、閾値を越えたウェブサーバ群、 APサーバ群及び DB サーバ群に対し、接続ユーザ数及び CPUクロック数に基づ、て閾値を越えなヽサーバの追加数が演算される。

[0009] また、メモリチェック方法が特開 2003— 216510号公報に開示されている。この従来例のメモリチェック方法では、情報処理装置の運用中に情報処理装置に備えられた記憶部のメモリチェックが行なわれる。メモリチェック開始にあたり情報処理装置の負荷状況に応じてメモリチェック開始の可否が決定される。また、メモリチェック開始後は、記憶部の各チェック単位領域のメモリチェックが終了する度に情報処理装置の負荷状況が取得され、取得された負荷状況に応じて次のチェック単位領域のメモリチエック継続の可否が決定される。

[0010] また、管理システムが特開 2004— 145536号公報に開示されている。この従来例の管理システムでは、監視対象システムとしてのネットワークカゝら収集された稼動情報が格納される。性能劣化が生じる条件として夫々の性能劣化事象に対して稼動情報の値の範囲を定義する性能劣化条件も格納されて、る。各性能劣化条件に対応した性能劣化要因を定義する性能劣化要因も格納されて、る。稼動情報と性能劣化要因とを比較することにより、性能劣化条件を特定し性能劣化要因から対応する性能劣化要因を特定する。

[0011] また、仮想マシン管理装置が特開 2005— 115653号公報に開示されている。この従来例の仮想マシン管理装置では、複数の仮想マシンの各々の所定時間ごとのパフォーマンスを示す実測データがデータベース力読み出され、読み出された各仮想マシンの所定時間ごとのパフォーマンスを示す実測データを用いて各仮想マシンを複数のサーバのいずれかで稼動させた場合の各時間における各仮想マシンのパフォーマンスの合計が最大となる仮想マシンとサーバの組み合わせが算出される。算出された仮想マシンとサーバの組み合わせに従って、各仮想マシンのファイルが当該仮想マシンに対応するサーバの記憶領域に格納される。

[0012] また、システム使用率管理装置が特開 2006— 92053号公報に開示されている。この従来例のシステム使用率管理装置では、複数の計算ノードの各々の最大性能が設定され、各計算ノードのリソース使用率が取得される。設定された最大性能と取得されたリソース使用率とからノード群全体の仮想的な使用率が算出される。

発明の開示

[0013] 本発明の目的は、仮想マシンの性能劣化を検出することができる仮想マシンの性能管理システムを提供することである。

また、本発明の他の目的は、仮想マシンの性能劣化時にその影響範囲を特定できる仮想マシンの性能管理システムを提供することにある。

[0014] 本発明の観点では、仮想マシン性能管理システムは、少なくとも 1つの物理 CPUにより実行される仮想化ソフトウェア上で稼動する複数の仮想マシンの各々の CPU使用率を取得する使用率取得部と、前記 CPU使用率の合計値を算出する算出部と、前記合計値と前記物理 CPUの数とを比較し、前記合計値が前記物理 CPUの数より大き、とき警告を出力する比較部とを備えて、る。

[0015] 前記仮想化ソフトウェアは、複数の論理ディスクを認識し、前記複数の仮想マシンの各々は、前記複数の論理ディスクのいずれかに割当てられており、前記使用率取得部は、ディスクモードにおいて、前記各仮想マシンのディスク使用率を取得し、前記比較部は、前記ディスクモードにおいて、前記ディスク使用率と閾値とを比較し、前記ディスク使用率が前記閾値を超えていた場合に、警告を出力する。また、仮想マシン性能管理システムは、前記ディスクモードにおいて、前記ディスク使用率が前記閾値を超えて！/ヽた場合に、前記ディスク使用率に対する前記仮想マシンと同じ論理ディスクに割当てられた前記仮想マシンを検索し、前記検索された仮想マシン名を出力する検索部を更に備えて、てもよ、。

[0016] また、本発明の他の観点では、仮想マシン性能管理システムは、複数の仮想マシンの各々のディスク使用率を取得する使用率取得部と、少なくとも 1つの物理 CPUにより実行される仮想化ソフトウェア上で複数の仮想マシンが稼動し、前記仮想化ソフトウェアは、複数の論理ディスクを認識し、前記複数の仮想マシンの各々は、前記複数の論理ディスクのいずれかに割当てられており、前記ディスク使用率と、閾値とを比較し、前記ディスク使用率が前記閾値を超えていた場合に、警告を出力する比較部と、前記ディスク使用率が前記閾値を超えていた場合に、前記ディスク使用率に対する前記仮想マシンと同じ論理ディスクに割当てられた前記仮想マシンを検索し、前記検索された仮想マシン名を出力する検索部とを備える。

[0017] また、前記比較部は、前記合計値を時系列データとして出力してもよ!/、。この場合、前記物理 CPUの数より大きいとき、合計値を異なる色で表示してもよい。また、前記仮想マシンの数は、前記物理 CPUの数に関係なく設定されることが望ましい。ゲスト OS (オペレーティングシステム）は、前記各仮想マシン上で実行され、前記使用率取得部は、前記ゲスト OSを用いて前記 CPU使用率または前記ディスク使用率を取得する。仮想マシン性能管理システム力前記物理 CPUとは別の CPUを使用するシステム上に構築されていてもよいし、仮想マシン性能管理システムは、前記仮想マシンの 1つであってもよい。また、前記使用率取得部は、リアルタイムに前記 CPU使用率または前記ディスク使用率を取得してもよいし、前記使用率取得部は、過去の動作結果を示すログファイル力前記 CPU使用率または前記ディスク使用率を取得してちょい。

図面の簡単な説明 [0018] [図 1]図 1は、従来の性能管理システムの構成を示すブロック図である。

[図 2]図 2は、本発明の第 1実施例による性能管理システムの構成を示すブロック図である。

[図 3]図 3は、第 1実施例の動作手順を示すフローチャートである。

[図 4]図 4は、本発明の第 2実施例による性能管理システムの構成を示すブロック図である。

[図 5]図 5は、第 2実施例の動作手順を示すフローチャートである。

[図 6]図 6は、稼働仮想マシン数別の、リクエスト到着率と合計 CPU使用率との関係を示すグラフである。

発明を実施するための最良の形態

[0019] 以下に添付図面を参照して、本発明の仮想マシンの性能管理システムについて詳細に説明する。

[0020] [第 1実施例]

図 2は、本発明の第 1実施例による仮想マシンの性能管理システムの構成を示すブロック図である。本実施例の仮想マシンの性能管理システムは、仮想マシンが稼動する物理サーバーとは異なる物理サーバー上に構築されている。本実施例による性能管理システムは、処理装置 100と、記憶装置 200と、出力装置 300とを備えている。処理装置 100は、使用率取得部 2と、算出部 4と、比較部 6と、出力部 8とを備え、記憶装置 200は、記憶部 12を備えている。

[0021] 使用率取得部 2は、複数の仮想マシンの各々における仮想 CPUの CPU使用率を取得する。取得方法は、後で説明する。算出部 4は、取得された各仮想マシンの CP U使用率の合計値を算出する。記憶部 12は物理 CPU数を百分率で保持して、る。比較部 6は、算出された合計値と、記憶部 12により保持されている物理 CPU数とを比較する。算出された合計値が、物理 CPU数より少ないときはそのまま処理が続行される力算出された合計値が、物理 CPU数より多いときは、比較部 6は警告を出力し、出力部 8はその警告を出力装置 300に出力する。出力装置 300は、液晶ディスプレイのような表示装置、プリンタ等である。

[0022] 次に、図 3のフローチャートを参照して第 1実施例による仮想マシンの性能管理システムの動作について詳細に説明する。

まず、使用率取得部 2が、各仮想マシン（VM： Virtual Machine)の仮想 CPUの CPU使用率を取得する (ステップ Sl l)。各仮想マシンは、同一のサーバ上に配備された仮想的なサーバマシンである。このようなサーバの仮想化は、仮想化ソフトウェアよって実現されており、物理的には 1台のサーバを複数台の仮想マシンとして利用することを可能にする。また、仮想化ソフトウェアによっては、 M台（M≥l)の物理サーバを 1台のサーバに仮想化した上で、 N台（N≥ 1)の仮想マシンとして利用することも可能である。仮想化ソフトウェアとしては、 VMware ESX Server, Xenなどのほか、メインフレーム用の各種 OSも同様の仮想化を行う。各仮想マシンにはそれぞれゲスト OSがインストールされ、アプリケーションはゲスト OS上で動作する。仮想マシンの CPU使用率は、ゲスト OSの提供する機能を使って容易に取得できる。

次に、算出部 4は、各仮想マシン上のゲスト OSから取得された CPU使用率を仮想マシンの全体に渡って合計して合計値を算出する (ステップ S 12)。さらに、比較部 6 は、各仮想マシン力も得られた CPU使用率の合計値と記憶部 12に保持される物理 CPUの数とを比較する (ステップ S 13)。比較の結果、 CPU使用率の合計値が物理 CPU数を超えて、た場合は、仮想マシンの性能が劣化して、る可能性が高、ため、その旨を出力部に付与する。最後に、出力部 8が、ディスプレイやプリンタのような外部の出力装置 300に対して、性能劣化の警告を出力する (ステップ S14)。

[0023] このような CPU使用率の合計値を閾値とする性能劣化の検出手法は、実際の Web システムを用いた実験結果に基づいている。ここで、実験に用いたサーバの物理 CP U数は 4個である。 VMware ESX Server上で 1〜12個の仮想マシンが稼働するとき、各仮想マシンのリクエスト到着率 (毎秒のリクエスト処理数)の合計値と、 CPU使用率の合計値との関係を実測したデータをグラフ化したものを図 6に示す。

[0024] 図 6から明らかなように、この例では CPU使用率の合計値力 00%に達するまでは、どの仮想マシン数のときも、リクエスト到着率と CPU使用率との関係が線形であることがわ力るであろう。これは、各仮想マシンの性能を、 CPU使用率が 100%の（つまり CPUを使いきつた）ときのリクエスト処理量と考えたとき、リクエスト到着率に関わらず性能が一定であることを意味する。もちろん、仮想マシン数が増えると、仮想マシンの制御に一定の処理が必要なために、仮想マシン数が多いほど傾きが大きくなり、性能は劣化する。しかし、合計使用率が 400%に達しない範囲においては、劣化は軽微である。また、具体的な分析結果は割愛するが、仮想マシン数に対する劣化率は推定可能である。

[0025] これに対して、仮想マシン数が物理 CPU数よりも大きい 8や 12のとき、合計使用率力 00%を超えると、リクエスト到着率と CPU使用率との関係が線形ではなくなり、性能が大幅に劣化することがわかる。またこの実験結果は、合計値が 400%を超えた状況においては、ある仮想マシンの CPU使用率の上昇力他の仮想マシンの CPU 性能を大きく劣化させる可能性があることを示唆している。

[0026] 仮想マシンの数を物理 CPU数と同じ 4力、それ以下にした場合は、 CPU使用率の合計値力 00%を超えないので、一般的には安全な運用が可能である。しかしながら、サーバや仮想化ソフトウェアの導入に大きなコストがかかるので、現実的には物理

CPU数以上の仮想マシンが動作する場合が多い。実験結果によれば、このような場合でも、 CPU使用率の合計値が物理 CPU数を超えないように運用することで、仮想マシンの性能劣化を予測の範囲内に抑えることが可能である。

[0027] 以下に第 1実施例の具体的な例について説明する。前提として、デュアルコア CP Uを 1個搭載した物理サーバに、仮想化ソフトウェアとして VMware ESX Server ( 以下、 ESX)がインストールされ、動作しているとする。物理 CPU数はコア数のことを指すので、この場合における物理 CPU数は 2となる。仮に、デュアルコア CPUを 3個搭載しているとすると、物理 CPU数は 2 X 3 = 6となる。また、各 CPUのコアは、ハイパースレツデイング（HT:Hyper— Threading)が有効に設定されているとする。ハイパースレツデイングは CPUコアの空き時間を有効利用して別の処理を実行できるようにする技術であり、物理的には 1つのコアを 2つのコアとして使うことができる。ただし、デュアルコアのような複数コア技術と違い、ハイパースレツデイングによって CPUの性能が 2倍になるわけではな、ので、ノ、ィパースレツデイングが有効に設定されたときの CPU数を、仮想化ソフトウェア（ESX)は論理 CPU数として認識する。 2つのコアに対してハイパースレツデイングが有効に設定されて、る場合には、論理 CPU数は 2 X 2=4となる。ハイパースレツデイングが無効に設定されているときには、論理 CPU 数は物理 CPU数と同じ値の 2になる。以下では、物理 CPU数は 2であるとして説明する。

[0028] 仮想化ソフトウェアの ESX上では、 4つの仮想マシン (VM)が設定され、稼働しているとする。各仮想マシンは、互いを識別するための仮想マシン名や、仮想 CPUや仮想メモリ等の資源に関する設定値をもつ。 ESXの場合、各仮想マシンは論理 CPU に割り当てられて実行されるが、 4つのうちのどの論理 CPUに割り当てるかを設定することが可能である。しかし今回の例では、各仮想マシンが任意の論理 CPUを利用できるように設定され、各仮想マシンをどの論理 CPUに割り当てて実行するかは、 E SXが決定するものとする。また、追加機能として、同時に利用できる論理 CPU数も設定できるが、同時に利用できる論理 CPUは、 1つのみとする。

[0029] 各仮想マシン上には、ゲスト OSとして Windows Serverがインストールされ、その上で Webサーバやデータベース等の各種アプリケーションが動作している。

まず、使用率取得部 2が各仮想マシン上の Windows Serverから CPU使用率を取得する。 Windows Serverに標準添付されて!、るパフォーマンスモニタ（システムモニタ）を使い、カウンタとして Processor Timeと、インスタンスとして CPU番号とを指定することにより、 CPU使用率を取得することができる。また、仮想マシンが同時に利用できる仮想 CPU数が 1つの場合は、インスタンスとして Totalを指定しても同様の結果が得られる。また、仮想マシンが 2つ以上の仮想 CPUを同時に利用できる場合は、各仮想 CPUに対して使用率を取得する。パフォーマンスモニタの場合、インスタンスとして CPU番号を指定すれば、 CPUごとの使用率を取得できる。または、インスタンスとして Totalを指定することで利用中の CPUの平均使用率が計測できるため、この値を CPU数倍しても同様の結果が得られる。 Windows Serverの場合、独自に提供されている APIを呼びだして、 CPU使用率を取得してもよい。また CPU使用率は、稼働中の仮想マシンからリアルタイムに取得してもよいが、過去の計測結果を保存したログファイル力も読み出してもよ、。

[0030] ここでは、 4つの仮想マシンから取得された CPU使用率がそれぞれ 42%、 71%、 5 2%、 56%であったとする。算出部 4は、各仮想マシン力も取得した CPU使用率を積算し、合計値である 42% + 71% + 52% + 56% = 221%を算出する。記憶部 12は、物理 CPU数である 2 ( = 200%)を保持している。比較部 6は、算出された CPU使用率の合計値とこの物理 CPU数（200%)とを比較する。今回の場合、合計値が物理 CPU数を上回っており、性能劣化の可能性が高いので、比較部 6は性能劣化に関する警告を合計値とともに出力部 8に付与する。また、性能劣化の起きている 4つの仮想マシンの仮想マシン名を一緒に付与してもよい。最後に、出力部 8は、プリンタゃディスプレイ装置などである出力装置 300に CPU使用率の合計値と性能劣化の警告を出力する。 CPU使用率の合計値に関する時系列データをグラフ形式で出力する場合は、性能劣化が起きて、る部分のグラフを赤線や太線で表現することもできる。また、表形式の場合は、性能劣化の起きている部分のデータを赤字や太字で印字してちょい。

[0031] ここで、上記のように、仮想マシンの性能管理システムは、 ESXの動作する物理サ一バとは別のサーバで動作する。し力しながら、監視対象となっているゲスト OS上や、仮想化ソフトウェア上で動作させることもできる。その場合には、性能管理システムも仮想システムの 1つとして CPU使用率を取得するときの対象となる。但し、性能管理システムによる CPU資源消費が非常に小さい場合は、取得の対象から除外することちでさる。

[0032] 以上説明したように、第 1実施例によれば、各仮想マシンの CPU使用率はそれほど高くなくても、全体として CPUを使い過ぎていることによって発生する性能劣化を検出できる。

また、比較結果をプロセスの制御や物理サーバの構成変更、課金システムに応用することによって、次のような効果が得られる。 1つには、各仮想マシンが性能劣化を起こさな!/、ように他の物理サーバへ処理を分散したり、 CPUを追加したりすることによつて、システムのサービス品質を維持できる。もう 1つの効果としては、サーバを利用した時間の分だけ利用料を徴収するようなサーバシステムを運用するとき、性能劣化が発生している時間の料金を割引あるいは無料にすることによって、ユーザの納得を得ることができる。

[0033] [第 2実施例]

図 4は、本発明の第 2実施例による仮想マシンの性能管理システムの構成を示すブロック図である。本実施例の仮想マシン性能管理システムは、第 1実施例と同様に、管理対象の物理サーバとは別の物理サーバに構築されている。仮想マシン性能管理システムは、処理装置 100と、記憶装置 200と、出力装置 300とを備えている。処理装置 100は、使用率取得部 2と、比較部 6と、検索部 10と、出力部 8とを備えている。記憶装置 200は、記憶部 12と、ディスク割当て情報記憶部 14とを備えている。

[0034] 使用率取得部 2は、ディスクモードにお、て、各仮想マシンのディスク使用率を取得する。比較部 6は、ディスクモードにおいて、取得したディスク使用率と、記憶部 12 により保持されているディスク使用率の閾値とを比較する。検索部 10は、ディスクモードにおいて、仮想マシンのディスク使用率が閾値を超えていた場合に、その仮想マシンと同じ論理ディスク上に配置されている仮想マシンをすベて検索する。出力部 8 は、ディスクモードにおいて、検索された仮想マシンに関し、ディスク性能が劣化している可能性がある旨の警告を出力装置 300に出力する。

[0035] 次に、図 5のフローチャートを参照して第 2実施例による仮想マシンの性能管理システムについて詳細に説明する。

まず、ディスクモードにおいて、使用率取得部 2が仮想マシンのディスク使用率を取得する (ステップ S21)。ディスク使用率は、単位時間あたりにハードディスクを利用して、た時間の割合として表わされ、仮想マシンにインストールされたゲスト OSの機能を使用して取得できる。仮想マシンには複数のディスクが接続されて、る可能性がある力ゲスト OSがインストールされているディスクの使用率を取得する。

一方、記憶部 12は、ディスク使用率の閾値を保持しており、ディスク使用率がこの閾値を超えるとディスク性能が許容範囲を超えて劣化することがすでにわ力つているものとする。比較部 6は、ディスクモードにおいて、使用率取得部 2が取得したディスク使用率と、記憶部 12により保持されている閾値の大小を比較する (ステップ S22)。比較の結果、ディスク使用率が閾値を超えていた場合は、仮想マシンのディスク性能が劣化している旨の警告を、仮想マシンの識別子とともに検索部 10に送付する。

[0036] 次に、検索部 10が、ディスクモードにおいて、性能劣化の認められる仮想マシンの識別子に基づいて、対応テーブルを参照して、その仮想マシンと物理的に同一のデイスク或ヽは論理的に同一のディスクを使用する仮想マシンをすベて検索する (ステップ S23)。検索のもととなる仮想マシンと物理或いは論理ディスクの対応テーブルは、ディスク割当て情報記憶部 14に格納されている。検索結果は、仮想マシンの識別子の集合となる。

同一のハードディスク上にゲスト OSがインストールされている仮想マシン同士は、ハードディスクを共有している関係にある。そのため、ある仮想マシンがハードデイスクを限界付近まで利用すると、同一ディスクを利用する他の仮想マシンのディスク性能ならびに OS自身の性能に悪影響が及ぶ可能性が非常に高い。検索結果は、この性能劣化の及ぶ範囲を示して、る。

最後に、出力部 8が検索の結果得られた仮想マシンの識別子の集合を、ディスプレィゃプリンタのような出力装置 300に出力する (ステップ S24)。

[0037] 次に、第 2実施例の具体的な例について説明する。前提として、物理サーバは 6個のハードディスクを搭載しており、これらを RAID1 (ミラーリング)構成で利用しているとする。 RAID1では、 2台のディスクに同じ内容のデータが冗長に書き込まれ、片方のディスクが破損してもデータの損失を防ぐことができる。この場合、仮想化ソフトゥェァは、物理サーバが 3台のディスク (論理ボリューム）を搭載して!/ヽるように認識する。便宜上、これらの論理ボリュームをボリューム X、 Υ、 Ζと呼んで区別する。

仮想化ソフトウェアとしては、 ESXがインストールされ、 ESX上には 5個の仮想マシン、すなわち Guestl〜5が稼働しているものとする。また、ボリューム Xには ESX自身がインストールされており、ボリューム Yには Guestlと 2、ボリューム Zには Guest3 〜5がそれぞれ作成されてヽるものとする。この対応テーブルはディスク割当て情報記憶部 14にあら力じめ格納されている。また、第 1実施例と同様、各仮想マシン上にはゲスト OSとして Windows Serverがインストールされて!/、るものとする。

[0038] まず、使用率取得部 2が各仮想マシンのディスク使用率をゲスト OSの機能を使って随時取得する。 Windows Serverに標準添付のパフォーマンスモニタの場合、ディスクを利用していない時間の割合に対応する Idle Timeのカウンタと、システムドライブである Cドライブを含むインスタンスを指定することで計測される値を 100 [%]から減算することによってディスク使用率が取得できる。カウンタとして Disk Timeを指定して直接ディスク使用率を取得することもできるが、このカウンタは高負荷時の誤差が大きいという問題がある。また、ディスク使用率は稼働中の仮想マシンからリアルタイムに取得してもよ、が、ログファイル力も読み出してもよ、。

[0039] ここでは、 Guestl〜5のディスク使用率がそれぞれ 30%、 25%、 18%、 92%、 4 %であったとする。一方、記憶部 12には、ディスク使用率に対する閾値として 80%があら力じめ設定されて、るものとする。

次に、比較部 6は、ディスクモードにおいて、各仮想マシンのディスク使用率をひとつひとつ閾値と比較する。このとき、ディスク使用率が閾値を下回る場合は、特になにも行なわない。今回の例では、 Guest4のディスク使用率が 92%であり、閾値の 80 %を上回って、るので、その旨の警告と仮想マシンの識別子である「Guest4」が検索部 10に付与される。

検索部 10は、ディスクモードにおいて、ディスク割当て情報記憶部 14に格納された仮想マシンとディスク（ボリューム）の対応テーブルを参照して、 Guest4の置かれているボリューム力 ¾であり、さらにボリューム Zには Guest3と 5が割当てられていることを検索する。

最後に、出力部 8は、ディスクモードにおいて、 Guest4のディスク使用率が閾値を上回っていることによってディスク性能が劣化し、この影響が Guest3と 5に及んでいることをプリンタやディスプレイ装置等の出力装置 300に出力する。

各仮想マシンのディスク使用率に関する時系列データをグラフ形式で出力する場合は、性能劣化の発生している時間帯のグラフを別の色や太線で表現できる。また、表形式で出力する場合は、性能劣化の発生している時間帯の数値を別の色や太字で印字してもよい。

[0040] 以上説明したように、第 2実施例によれば、ある仮想マシンのディスク性能の劣化を検出すると同時に、この影響を受けて同様にディスク性能や OSの性能が劣化する可能性のあるほかの仮想マシンを見つけることができる。これにより、たとえば管理者が Guest3や 5の利用者力性能劣化に関する苦情を受けた場合でも、 Guest3や 5が性能劣化の原因には無関係である可能性が高いと判断できる。

また、検索結果をもとに Guest4と Guest3、 5とを別の物理サーバや別のディスク上に配置し直すことによって、再度同じ様な性能劣化が発生した場合に、その影響を最小限に抑えることができる。

[0041] [第 3実施例]

本発明の第 3実施例による仮想マシンの性能管理システムでは、上記の第 1実施形態と第 2実施形態で示された構成が結合されている。また、図 3の動作に続いて、ディスクモードが設定され、図 5の動作が実行される。こうして、 CPUの使用率とディスク使用率の両方について仮想マシンを管理することができる。

[0042] 本発明は、仮想計算機環境において、仮想マシンの性能を管理するための装置またはシステムに好適である。各仮想の CPU使用率の合計値が物理 CPU数を上回ることによって発生する性能劣化を検出できるように、本発明の仮想マシン性能管理システムが構成されている。各仮想マシンの CPU使用率はそれほど高くなくても、全体として CPUを使、過ぎて、ることによって発生する性能劣化を検出できる。

Claims

請求の範囲

[1] 少なくとも 1つの物理 CPUにより実行される仮想化ソフトウェア上で稼動する複数の仮想マシンの各々の CPU使用率を取得する使用率取得部と、

前記 CPU使用率の合計値を算出する算出部と、

前記合計値と前記物理 CPUの数とを比較し、前記合計値が前記物理 CPUの数より多いとき警告を出力する比較部と

を備える仮想マシン性能管理システム。

[2] 請求の範囲 1に記載の仮想マシン性能管理システムにお、て、

前記仮想化ソフトウェアは、複数の論理ディスクを認識し、前記複数の仮想マシンの各々は、前記複数の論理ディスクのいずれかに割当てられており、

前記使用率取得部は、ディスクモードにおいて、前記各仮想マシンのディスク使用率を取得し、

前記比較部は、前記ディスクモードにおいて、前記ディスク使用率と閾値とを比較し、前記ディスク使用率が前記閾値を超えていた場合に、警告を出力する

仮想マシン性能管理システム。

[3] 請求の範囲 2に記載の仮想マシン性能管理システムにお、て、

前記ディスクモードにぉヽて、前記ディスク使用率が前記閾値を超えてた場合に、前記ディスク使用率に対する前記仮想マシンと同じ論理ディスクに割当てられた前記仮想マシンを検索し、前記検索された仮想マシン名を出力する検索部

を更に備える仮想マシン性能管理システム。

[4] 複数の仮想マシンの各々のディスク使用率を取得する使用率取得部と、少なくとも 1つの物理 CPUにより実行される仮想化ソフトウェア上で複数の仮想マシンが稼動し、前記仮想化ソフトウェアは、複数の論理ディスクを認識し、前記複数の仮想マシンの各々は、前記複数の論理ディスクのいずれかに割当てられており、前記各仮想マシン上でゲスト OSが動作し、前記ディスク使用率は前記ゲスト OSが格納されるディスクの使用率であり、

前記ディスク使用率と、閾値とを比較する比較部と、

前記ディスク使用率が前記閾値を超えてヽた場合に、前記仮想マシンと同じ論理ディスクに割当てられた前記仮想マシンをすベて検索する検索部と

を備える仮想マシン性能管理システム。

[5] 請求の範囲 1乃至 3のいずれかに記載の仮想マシン性能管理システムにおいて、前記比較部は、前記合計値を時系列データとして出力する

仮想マシン性能管理システム。

[6] 請求の範囲 1乃至 4のいずれかに記載の仮想マシン性能管理システムにおいて、前記仮想マシンの数は、前記物理 CPUの数に関係なく設定される

仮想マシン性能管理システム。

[7] 請求の範囲 1乃至 4のいずれかに記載の仮想マシン性能管理システムにおいて、ゲスト OSは、前記各仮想マシン上で実行され、

前記使用率取得部は、前記ゲスト OSを用いて前記 CPU使用率または前記ディスク使用率を取得する

仮想マシン性能管理システム。

[8] 請求の範囲 1乃至 4のいずれかに記載の仮想マシン性能管理システムにおいて、仮想マシン性能管理システム力前記物理 CPUとは別の CPUを使用するシステム上に構築されている

仮想マシン性能管理システム。

[9] 請求の範囲 1乃至 4のいずれかに記載の仮想マシン性能管理システムにおいて、仮想マシン性能管理システムは、前記仮想マシンの 1つである

仮想マシン性能管理システム。

[10] 請求の範囲 1乃至 4のいずれかに記載の仮想マシン性能管理システムにおいて、前記使用率取得部は、リアルタイムに前記 CPU使用率または前記ディスク使用率を取得する

仮想マシン性能管理システム。

[11] 請求の範囲 1乃至 4のいずれかに記載の仮想マシン性能管理システムにおいて、前記使用率取得部は、過去の動作結果を示すログファイル力前記 CPU使用率または前記ディスク使用率を取得する

仮想マシン性能管理システム。