JP5737789B2 - 仮想マシン運用監視システム - Google Patents
仮想マシン運用監視システム Download PDFInfo
- Publication number
- JP5737789B2 JP5737789B2 JP2012064749A JP2012064749A JP5737789B2 JP 5737789 B2 JP5737789 B2 JP 5737789B2 JP 2012064749 A JP2012064749 A JP 2012064749A JP 2012064749 A JP2012064749 A JP 2012064749A JP 5737789 B2 JP5737789 B2 JP 5737789B2
- Authority
- JP
- Japan
- Prior art keywords
- physical server
- virtual machine
- information
- performance
- candidate list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Description
前述の仮想メモリー容量不足に対処するために、仮想マシンのメモリー運用方法がいくつか用意されており、その1つに、メモリーバルーニングという手法が知られている。
メモリーバルーニングは、各々の仮想マシンに割り当てていたメモリーのうち、仮想マシンが使用していないメモリーを回収する手法である。
回収されたメモリーは、メモリー管理制御部やセンターにより、メモリーが不足し処理に遅れが出始めた仮想マシンに再分配が予定されることになる。
このようなメモリーの再分配手法を使用して、回収されたメモリーを柔軟に運用し、物理サーバ上で仮想マシンを安定して稼働させることができるようになったことが知られている。
仮想マシンでの処理の状況によるメモリーの利用状況次第ではあるが、物理サーバのメモリーを超えない範囲であれば、何度かのメモリーバルーニングの発生を許容できるし、メモリー状況を監視することで、予兆を検知することも可能である。
ところが、メモリーバルーニングのように動的なメモリーの運用を行うと、回収予定の使われていないメモリーまで使用しているため、仮想マシンでメモリー不足が発生したときには、同じ物理サーバ上にある仮想マシンの多くがメモリー不足となる可能性が高く、顧客に提供しているサービスへの影響が拡大している。
前述のような対処を行う場合、どの仮想マシンをどの物理サーバに移動させるべきかを運用管理者が判断しなければならないが、仮想マシンの数が多いと適切に判断するのが難しい。
(1)運用管理者は、運用監視部から、仮想マシンでメモリー不足が発生した通知を受け取る。
(2)運用管理者は、運用監視部を使用して、メモリー不足の発生した仮想マシンで監視しているリソース情報を、表示装置に出力させる。
(3)運用管理者は、運用監視部を使用して、各物理サーバのリソース情報を、表示装置に出力させる。
(4)運用管理者は、表示装置に出力された仮想マシンと各物理サーバの各リソースの値を比較して、仮想マシンが「稼働可能な物理サーバの一覧」を作成する。
(5)運用管理者は、仮想マシン管理部を使用して、仮想マシンの稼働している物理サーバを、運用管理者の判断で、「稼働可能な物理サーバの一覧」のいずれかの物理サーバに変更する。
問題が発生した場合に、仮想マシンと物理サーバの状況を確認して、運用管理者がどの仮想マシンの稼働している物理サーバをどの物理サーバへ変更するべきかを判断することになる。しかし、従来の運用監視システムでは、仮想マシンおよび物理サーバのリソースの使用状況しか把握できないため、運用管理者が行うべき対処について試行錯誤が必要になる。対処を誤ると、別の仮想マシンで問題が発生したりして、サービス品質が低下することがある。
物理サーバ上で稼動している仮想マシンの稼動状態を示す仮想マシン稼動情報と、前記物理サーバの稼動状態を示す物理サーバ稼動情報とを格納する仮想環境監視データベースと、
前記物理サーバに含まれるパーツの性能を示すパーツ性能情報を格納するパーツ性能情報データベースと、
前記仮想マシンにリソース不足が発生したことを示す警告を表示する警告表示手段と、
前記警告表示手段によって表示された警告を見た運用管理者によって入力された仮想マシンと当該仮想マシンが稼動している物理サーバとを指定する指示を受け付ける指示受付手段と、
前記指示受付手段によって受け付けられた指示によって指定された仮想マシンの仮想マシン稼動情報を前記仮想環境監視データベースから取得する仮想マシン稼動情報取得手段と、
前記指示受付手段によって受け付けられた指示によって指定された物理サーバの物理サーバ稼動情報を前記仮想環境監視データベースから取得する稼動中物理サーバ稼動情報取得手段と、
前記指示受付手段によって受け付けられた指示によって指定された物理サーバを除くチェック対象の物理サーバの物理サーバ稼動情報を前記仮想環境監視データベースから取得するチェック対象物理サーバ稼動情報取得手段と、
前記パーツ性能情報データベースに格納されているパーツ性能情報を考慮して、前記仮想マシン稼動情報取得手段によって取得された仮想マシン稼動情報と、前記稼動中物理サーバ稼動情報取得手段によって取得された物理サーバ稼動情報と、前記チェック対象物理サーバ稼動情報取得手段によって取得された物理サーバ稼動情報とに基づいて、前記指示受付手段によって受け付けられた指示によって指定された仮想マシンが前記チェック対象の物理サーバで稼動可能か否かを判別し、稼動可能と判別された場合に、当該稼動可能と判別されたチェック対象の物理サーバについて前記指示受付手段によって受け付けられた指示によって指定された仮想マシンが稼動した場合のリソースの余裕を示す不足リソース余力情報を求め、当該稼動可能と判別されたチェック対象の物理サーバの名前と当該不足リソース余力情報とを含む移動先物理サーバ情報を有する前記仮想マシンの移動先物理サーバ候補一覧を作成する移動先物理サーバ候補一覧作成手段と、
前記移動先物理サーバ候補一覧作成手段によって作成された移動先物理サーバ候補一覧に含まれる物理サーバを表示する表示手段と、
物理サーバのハードウェアとソフトウェアの構成および物理サーバの設置状況に基づいて定められ、当該物理サーバが安定的に稼動することができるか否かの評価を示す物理サーバ安全度情報を格納する物理サーバ安全度データベースと、
物理サーバのハードウェアの性能を示す物理サーバ性能情報を格納する物理サーバ性能データベースと、
仮想マシンで稼動しているサービスの重要度を示す仮想マシン重要度情報を格納する仮想マシン重要度データベースと、
前記移動先物理サーバ候補一覧作成手段によって作成された前記移動先物理サーバ候補一覧に含まれる各移動先物理サーバ情報によって指定される物理サーバについて、前記物理サーバ性能データベースに格納されている物理サーバ性能情報に基づいて、前記指示受付手段によって受け付けられた指示によって指定された物理サーバに対するリソース毎の性能の変化を示すリソース性能変化情報を求めるリソース性能変化情報算出手段と、
前記物理サーバ安全度データベースに格納されている物理サーバ安全度情報と前記仮想マシン重要度データベースに格納されている仮想マシン重要度情報とに基づいて、前記指示受付手段によって受け付けられた指示によって指定された仮想マシンの要求する安全対策と、前記移動先物理サーバ候補一覧作成手段によって作成された前記移動先物理サーバ候補一覧に含まれる各移動先物理サーバ情報によって指定される物理サーバの備える安全対策とが一致する割合を示す安全度合致率情報を求める安全度合致率情報算出手段と、
前記安全度合致率情報と前記リソース性能変化情報とを前記移動先物理サーバ候補一覧に含まれる移動先物理サーバ情報に追加する移動先物理サーバ情報追加手段と、
を備え、
前記表示手段が、前記移動先物理サーバ情報追加手段によって前記安全度合致率情報と前記リソース性能変化情報とが追加された移動先物理サーバ候補一覧に含まれる各移動先物理サーバ情報によって指定される物理サーバを前記不足リソース余力情報と前記安全度合致率情報と前記リソース性能変化情報とに基づいて定められる順番で表示する、
ことを特徴とする。
本発明の実施形態に係る仮想マシン運用監視システムは、複数の物理サーバ10と、運用監視ホスト11とで構成される。複数の物理サーバ10と、運用監視ホスト11とは、ネットワーク・回線12に接続されており、相互に通信することができる。
物理サーバ10は、コンピュータであって、図2に示すように、CPU(Central Processing Unit)201と、RAM(Random Access Memory)等で構成されるメモリー202と、ネットワークI/F(インターフェース)203と、ハードディスク等で構成される記憶装置204とを有する。
物理サーバ10のメモリー202には、仮想マシン管理プログラム101が記憶されている。物理サーバ10のCPU201が、仮想マシン管理プログラム101を実行することにより、以下に示す仮想マシン管理機能が実現される。
・ネットワーク・回線12でデータ通信する機能
・仮想マシン205を作成し、削除し、その構成を変更する機能
・仮想マシン205を起動・停止する機能
・仮想マシン205の稼働サービスの処理を中断することなく、稼働している物理サーバ10を変更する機能
仮想マシン205は、図2に示すように、仮想CPU206と、仮想メモリー207と、仮想ネットワーク208と、仮想ディスク209とを有する。
運用監視ホスト11のメモリー302には、運用監視プログラム121が記憶されている。
運用監視ホスト11の記憶装置304には、仮想環境監視データDB(データベース)113と、物理サーバ安全度DB114と、物理サーバ性能DB115と、仮想マシン重要度DB116と、パーツ性能情報DB117とが格納されている。
運用監視ホスト11のCPU301が、運用監視プログラム121を実行することにより、以下に示す運用監視機能が実現される。
・ネットワーク・回線12でデータ通信するデータ通信機能
・表示装置111に、データを表示するデータ表示機能
・入力装置112から、データを受け取るデータ受付機能
・物理サーバ10から、CPU使用量、メモリーの未使用サイズ等物理サーバ10のハードウェアの稼動状況を示す物理サーバ稼動情報を定期的に取得する物理サーバ稼動情報取得機能
・物理サーバ10から、仮想マシンの稼動状況を示す仮想マシン稼動情報を定期的に取得する仮想マシン稼動情報取得機能
・仮想環境監視データDB113において、物理サーバ稼動情報と仮想マシン稼動情報を作成・更新・検索・削除する稼動情報管理機能
・物理サーバ安全度DB114において、物理サーバ安全度情報を作成・更新・検索・削除する物理サーバ安全度情報管理機能
・物理サーバ性能DB115において、物理サーバ性能情報を作成・更新・検索・削除する物理サーバ性能情報管理機能
・仮想マシン重要度DB116において、仮想マシン重要度情報を作成・更新・検索・削除する仮想マシン重要度情報管理機能
・パーツ性能情報DB117において、パーツ性能情報を作成・更新・検索・削除するパーツ性能情報管理機能
物理サーバ稼動情報は、運用監視ホスト11によって定期的に送信される指示に応じて物理サーバ10のCPU201が収集し、運用監視ホスト11に送信する。運用監視ホスト11のCPU301は、受信した物理サーバ稼動情報を仮想環境監視データDB113に格納する。
物理サーバ稼動情報は、収集日時401と、物理サーバ名402と、CPU使用量403と、メモリーの未使用サイズ404と、ディスクの未使用サイズ405と、単位時間辺りの最大ネットワーク送信可能データ量406と、単位時間辺りの最大ネットワーク受信可能データ量407と、単位時間辺りのネットワーク送信データ量408と、単位時間辺りのネットワーク受信データ量409とを含む。
収集日時401は、物理サーバ10から物理サーバ稼動情報を収集した収集日時を示す。
物理サーバ名402は、物理サーバ10の名前を示す。
CPU使用量403は、CPU201のコアクロック周波数のどれだけが使用されているかを示す。CPU使用量の単位はMHzである。
メモリーの未使用サイズ404は、物理サーバ10のメモリー202で使用されていない空メモリーのサイズを示す。空メモリーサイズの単位はMbyteである。
ディスクの未使用サイズ405は、物理サーバ10の記憶装置204で使用されていない空きディスクサイズを示す。空きディスクサイズの単位はMbyteである。
単位時間辺りの最大ネットワーク送信可能データ量406は、物理サーバ10の単位時間辺りの最大ネットワーク送信可能データ量を示す。最大ネットワーク送信可能データ量の単位は、Mbit/secである。
単位時間辺りの最大ネットワーク受信可能データ量407は、物理サーバ10の単位時間辺りの最大ネットワーク受信可能データ量を示す。最大ネットワーク受信可能データ量の単位は、Mbit/secである。
単位時間辺りのネットワーク送信データ量408は、物理サーバ10の単位時間辺りのネットワーク送信データ量を示す。ネットワーク送信データ量の単位は、Mbit/secである。この値は、pingコマンド等で取得された通信速度の実測値である。
単位時間辺りのネットワーク受信データ量409は、物理サーバ10の単位時間辺りのネットワーク受信データ量を示す。ネットワーク受信データ量の単位は、Mbit/secである。この値は、pingコマンド等で取得された通信速度の実測値である。
仮想マシン稼動情報は、運用監視ホスト11によって定期的に送信される指示に応じて物理サーバ10のCPU201が収集し、運用監視ホスト11に送信する。運用監視ホスト11のCPU301は、受信した仮想マシン稼動情報を仮想環境監視データDB113に格納する。
仮想マシン稼動情報は、収集日時501と、仮想マシン名502と、稼動物理サーバ名503と、CPU使用量504と、メモリーサイズ505と、ディスクサイズ506と、最大の単位時間辺りのネットワーク送信データ量507と、最大の単位時間辺りのネットワーク受信データ量508とを含む。
収集日時501は、物理サーバ10から仮想マシン205の仮想マシン稼動情報を収集した収集日時を示す。
仮想マシン名502は、仮想マシン205の名前を示す。
稼動物理サーバ名503は、仮想マシンの稼働している物理サーバ10の名前を示す。
CPU使用量504は、仮想CPU206のクロック周波数のどれだけが使用されているかを示す。CPU使用量の単位はMHzである。
メモリーサイズ505は、仮想メモリー207のメモリーサイズを示す。メモリーサイズの単位はMbyteである。
ディスクサイズ506は、仮想ディスク209のディスクサイズを示す。ディスクサイズの単位はMbyteである。
最大の単位時間辺りのネットワーク送信データ量507は、仮想ネットワーク208から送信される、仮想マシン205が稼働してから現在に至る期間で最大の単位時間辺りのネットワーク送信データ量を示す。ネットワーク送信データ量の単位は、Mbit/secである。
最大の単位時間辺りのネットワーク受信データ量508は、仮想ネットワーク208で受信される、仮想マシン205が稼働してから現在に至る期間で最大の単位時間辺りのネットワーク受信データ量を示す。ネットワーク送信データ量の単位は、Mbit/secである。
物理サーバ安全度情報は、物理サーバ名601と、安全対策分類602と、安全対策項目603とを含む。
物理サーバ名601は、物理サーバ10の名前である。
安全対策分類602は、安全対策項目603を管理するために定義される。安全対策分類602は以下の値を持つ。
・CPU
・メモリー
・ディスク
・ネットワーク
・電源
・所在地
・[CPU]物理サーバ10のCPUのソケット数(予備のCPUの有無)
・[メモリー]物理サーバ10のメモリーのチェック有無
・[ディスク]物理サーバ10のクラスタの構成状態
・[ディスク]物理サーバ10のディスク二重化(raid構成)状態
・[ネットワーク]物理サーバ10のネットワークの二重化状態
・[電源]物理サーバ10の電源の二重化状態
・[電源]物理サーバ10のUPS(無停電電源装置)設置状態
・[所在地]物理サーバ10の所在地を評価した値(ハザードマップでの危険度評価結果)
物理サーバ性能情報は、物理サーバ10のハードウェアの性能を示す。物理サーバ性能情報は、物理サーバ名701と、性能分類702と、性能項目703と、性能値704とを含む。
物理サーバ名701は、物理サーバ10の名前である。
性能分類702は、性能項目703を管理するために定義される。性能分類702は以下の値を持つ。
・CPU
・メモリー
・ディスク
・ネットワーク
性能項目703として、以下のものが挙げられる。([]内は、性能分類702を示す。)
・[CPU]CPU201の最大周波数
・[メモリー]メモリー202の最大転送速度
・[ディスク]記憶装置204を構成するハードディスク等の最大書込速度
・[ディスク]記憶装置204を構成するハードディスク等の最大読込速度
・[ディスク]記憶装置204を構成するハードディスク等の最大ディスク容量
・[ネットワーク]ネットワークI/F203の単位時間辺りの最大ネットワーク送信可能データ量
・[ネットワーク]ネットワークI/F203の単位時間辺りの最大ネットワーク受信可能データ量
仮想マシン重要度情報は、仮想マシン名801と、稼働サービス名802と、要求安全対策分類803と、要求安全対策項目804とを含む。仮想マシン重要度情報は、仮想マシンで稼働しているサービスの重要度を示す。
仮想マシン名801は、仮想マシン205の名前である。稼働サービス名802は、仮想マシン205で動作するサービスの名前である。
要求安全対策分類803は、物理サーバ安全度DB114の安全対策分類602と同じ分類とする。また、要求安全対策項目804は、物理サーバ安全度DB114の安全対策項目603と同じ項目とする。
仮想マシン205の移動先候補の物理サーバ10に、仮想マシン205で稼働しているサービスが要求している安全対策が施されていない場合、移動先候補の物理サーバ10を他の仮想マシン205の稼働する物理サーバ10に変更するか否かを判断する必要がある。ここでは、提供中のサービスの稼働先を選択するための基準として、「仮想マシン重要度」という尺度を導入する。仮想マシン重要度は、仮想マシン205で稼働しているサービスが要求している所定の安全対策に基づいて定められる。すなわち、仮想マシン205で稼働させることができる各サービスが要求する所定の安全対策毎に、仮想マシン名801と、稼働サービス名802と、要求安全対策分類803と、要求安全対策項目804とが仮想マシン重要度DB116に登録される。物理サーバ10にその安全対策が施されている場合に、その物理サーバ10で仮想マシン205を安全に稼動させることができる。このため、仮想マシン重要度によって、仮想マシン205が提供するサービスを稼働させるのに充分な対策が物理サーバ10に施されているか否かを評価することができる。なお、物理サーバ10にどのような安全対策が施されているかは、物理サーバ安全度DB114を参照することにより知ることができる。
パーツ性能情報は、パーツ性能分類901と、パーツ性能項目A902と、パーツ性能項目B903と、重み付け係数904とを含む。パーツ性能情報は、物理サーバ10に使用されているパーツの性能に関する情報を示す。
複数台の物理サーバ10が全く同じ構成(CPU・ネットワークカード・メモリー・ハードディスク等)であることはほとんどない。そのため、正確に物理サーバ10の性能を比較するために、物理サーバ10を構成するパーツに関する情報が必要になる。また、性能の比較のために、CPUの場合だと、CPUのベンチマークのテスト結果を元にした重み付けの係数904を格納し、比較時に係数として使用する。また、パーツ性能項目A902を管理するためにパーツ性能分類901を定義する。パーツ性能分類901は以下の値を持つ。
・CPU
パーツ性能項目A902として、以下のものが挙げられる。([]内は、パーツ性能分類901を示す。)
・[CPU]ブランド(より具体的には、「intel(R) Xeon(R) プロセッサー」など、CPUの種別を表す値)
また、パーツ性能項目B903として、以下のものが挙げられる。([]内は、パーツ性能分類901を示す。)
・[CPU]ナンバー(より具体的には、プロセッサーに含まれる機能を示す型番)
CPUとしては、一般的に上記のような項目で、CPUの最大周波数やキャッシュサイズなどの比較ができる。
運用管理者が、入力装置112を使用して、仮想マシン205と、その仮想マシン205が稼動している物理サーバ10とを指定すると、運用監視ホスト11のCPU301は、図10の移動可能な物理サーバ10の一覧を求める(詳細については後で図11を参照して説明する。)。
稼働可能な物理サーバの一覧は、物理サーバ名1001と、安全度合致率1002と、不足リソース余力1003と、リソース性能変化1004とを含む。
物理サーバ名1001は、物理サーバ10の名前である。
安全度合致率1002は、仮想マシン205の要求する安全対策と、物理サーバ10の備える安全対策とが一致する割合を示す。具体的には、安全度合致率1002は、(安全対策分類602に存在する要求安全対策分類803の数)÷(要求安全対策分類803の数)を求め、その結果を100%換算したものと定義する。
例えば、図8において、マシンaの要求安全対策分類803にはメモリーとCPUの2つが含まれている。一方、図6において、サーバAの安全対策分類602にもメモリーとCPUの2つが含まれている。この場合、(安全対策分類602に存在する要求安全対策分類803の数)=2、(要求安全対策分類803の数)=2であるため、サーバAの安全度合致率1002=100%となる。
不足リソース余力1003は、仮想マシン205が稼動した場合のリソースの余裕を示す。例えば、仮想マシン205で発生した現象がメモリー不足の場合、不足リソース余力1003は、(物理サーバ10のメモリーの未使用サイズ404)−(仮想マシン205のメモリーサイズ505)の計算結果と定義する。また、例えば、仮想マシン205で発生した現象がハードディスクサイズ不足の場合、不足リソース余力1003は、(物理サーバ10のディスクの未使用サイズ405)−(仮想マシン205のディスクサイズ506)の計算結果と定義する。物理サーバ10の不足リソース余力1003が正の値であるとき、仮想マシン205をその物理サーバ10で稼動させることができる。
なお、図10は、メモリー不足が発生した場合に作成される稼働可能な物理サーバ10の一覧の例である。
03の性能値704の比較結果を3段階(向上/同等/劣化)で評価したものである。評価は、([変更先物理サーバ10の性能値704]−[変更前物理サーバ10の性能値704])÷[変更前物理サーバ10の性能値704]を求め、例えば、この値が10%より大きいとき向上、−10%以上10%以下のとき同等、−10%より小さいとき劣化と判定する。
警告画面1101は、発生問題一覧1102と、ガイダンス欄1103と、操作入力欄1104とを含む。
発生問題一覧1102には、発生した問題毎に、発生日時と、物理サーバ名と、仮想マシン名と、発生アラーム名と、通知設定と、通知済とが表示される。
ガイダンス欄1103には、操作入力欄1104に入力される数によって指定される操作の内容を示す情報が表示される。
発生問題一覧1102においてマウス等でクリックして発生問題を選択し、操作欄1104に「1」を入力すると、図12に示すように、仮想マシン205の移動先候補の一覧を表示させることができる。
図12の仮想マシンの移動先物理サーバ候補一覧表示画面1201は、仮想マシン205の移動先候補一覧1202と、移動先物理サーバ詳細1203と、仮想マシンサービス要求1204とを含む。
仮想マシン205の移動先候補一覧1202には、運用監視ホスト11の仮想マシン管理機能によって作成される仮想マシン205の移動先候補一覧(図10)が表示される。
移動先物理サーバ詳細1203には、仮想マシン205の移動先候補一覧1202においてマウス等でクリックして選択された物理サーバ10について、物理サーバ性能DB115に格納されている物理サーバ性能情報(図7)と、物理サーバ安全度DB114に格納される物理サーバ安全度情報(図6)とから抽出された情報が表示される。例えば、図12の移動先物理サーバ詳細1203には、仮想マシン205の移動先候補一覧1202上でサーバAが選択された場合における物理サーバ性能情報と物理サーバ安全度情報とが表示されている。
仮想マシンサービス要求1204には、図11の発生問題一覧1102において選択された仮想マシンについて、仮想マシン重要度DB116に格納されている仮想マシン重要度情報(図8)から抽出された情報が表示される。
仮想マシン205の仮想メモリー207が不足すると、運用監視ホスト11のCPU301は、図11の発生問題一覧1102に、仮想マシン205でメモリー不足が発生したことを示す警告を表示する(S101)。
その警告を見た運用管理者は、入力装置112を使用して、図11の発生問題一覧1102で発生問題を選択し、操作入力欄1104に、仮想メモリー207が不足した仮想マシン205の移動先一覧を表示させる操作を指定する「1」を入力する。
CPU301は、操作入力欄1104に「1」が入力されると、図10の仮想マシン205の移動先物理サーバ候補一覧の作成を要求されたと判別し(S102:Yes)、ステップS103に進む。
そして、CPU301は、図10の仮想マシン205の移動先物理サーバ候補一覧を作成する(S103)。なお、ステップS103の詳細については後で図14を参照して詳細に説明する。
CPU301は、図12の仮想マシン205の移動先物理サーバ候補一覧(図10)に情報(安全度合致率1002とリソース性能変化1004)を追加する。なお、ステップS104の詳細については後で図15を参照して詳細に説明する。
CPU301は、移動先物理サーバ候補一覧(図10)に含まれる物理サーバ10を、安全度合致率1002と不足リソース余力1003とリソース性能変化1004とに基づいて評価して、仮想マシンの移動先物理サーバ候補一覧表示画面1201を表示装置111に表示する(S105)。なお、ステップS105の詳細については後で図15を参照して詳細に説明する。
運用管理者は、仮想マシンの移動先物理サーバ候補一覧表示画面1201を参照し、物理サーバ10の仮想マシン管理機能を使用して、仮想マシン205の稼働している物理サーバ10を、状況に応じた適切な物理サーバ10に変更する。
CPU301は、仮想環境監視データDB113から、メモリー不足が生じた仮想マシン205の仮想マシン稼動情報(図5)を取得する(S201)。
次に、CPU301は、パーツ性能情報DB117から、メモリー不足が生じた仮想マシン205の稼働している物理サーバ10のパーツ性能情報(図9)を取得する(S202)。
CPU301は、メモリー不足が生じた仮想マシン205の稼働している物理サーバ10を除く物理サーバ10のうち、まだ移動先物理サーバ候補一覧に含まれていない物理サーバ10(以下、チェック対象の物理サーバ10という。)の物理サーバ稼動情報(図4)を仮想環境監視データDB113から取得する(S203)。
CPU301は、チェック対象の物理サーバ10の、パーツ性能情報(図9)を、パーツ性能情報DB117から取得する(S204)。
CPU301は、チェック対象の物理サーバ10の、物理サーバ性能情報(図7)を、物理サーバ性能DB115から取得する(S205)。
CPU301は、チェック対象の物理サーバ10の現在のCPU使用量403(図4)と、仮想マシン205のCPU使用量504(図5)を、CPUコア種別による重み付け係数904(図9)で補正した後加算すると、チェック対象の物理サーバ10のCPUの最大周波数を超える場合(S206:No)、ステップS212に進む。一方、超えない場合(S206:Yes)、次のステップS207に進む。
CPU301は、チェック対象の物理サーバ10の現在のディスクの未使用サイズ405(図4)を、仮想マシン205のディスクサイズ506(図5)が超える場合(S208:No)、ステップS212に進む。一方、超えない場合(S208:Yes)、次のステップS209に進む。
CPU301は、チェック対象の物理サーバ10の現在の単位時間辺りのネットワーク送信データ量408(図4)に、仮想マシン205が稼働してから現在に至る期間で最大の単位時間辺りのネットワーク送信データ量507(図5)を加算すると、チェック対象の物理サーバ10の単位時間辺りの最大ネットワーク送信可能データ量406(図4)を超える場合(S209:No)、ステップS212に進む。一方、超えない場合(S209:Yes)、次のステップS210に進む。
CPU301は、不足リソース余力を求め、移動先物理サーバ候補一覧(図10)の情報として、チェック対象の物理サーバ10の物理サーバ名1001と不足リソース余力1003のレコードを追加して、次のステップS212に進む(S211)。
CPU301は、監視しているすべての物理サーバ10のチェックを終了したか否かを判別する(S212)。チェックしていない物理サーバ10が存在している場合(S212:No)、ステップS203に戻る。存在していない場合(S212:Yes)、移動先物理サーバ候補一覧(図10)の作成処理を終了する。
CPU301は、仮想マシン205が稼働中の物理サーバ10の安全度データ(安全対策分類602・安全対策項目603)を物理サーバ安全度DB114から取得する(S301)。
次に、CPU301は、仮想マシン205が稼働中の物理サーバ10の性能データ(性能分類702・性能項目703・性能値704)を物理サーバ性能DB115から取得する(S302)。
CPU301は、移動先物理サーバ候補一覧(図10)からまだ情報(安全度合致率1002とリソース性能変化1004)を追加していない物理サーバ10(以下、情報追加中の物理サーバ10という。)の安全度データ(安全対策分類802・安全対策項目803)を物理サーバ安全度DB114から取得する(S303)。
CPU301は、情報追加中の物理サーバ10の性能データ(性能分類702・性能項目703・性能値704)を物理サーバ性能DB115から取得する(S304)。
CPU301は、仮想マシン205が稼働中の物理サーバ10と、情報追加中の物理サーバ10の、同じ性能分類702の同じ性能項目703である性能値704から、「リソース性能変化」を求め、結果を図10の仮想マシン205の移動先物理サーバ候補一覧のリソース性能変化1004に設定する(S305〜S308)。
CPU301は、仮想マシン205の要求安全対策分類803が、情報追加中の物理サーバ10の、安全対策分類602に存在するか否かを確認して、「安全度合致率」を求め、結果を図10の仮想マシン205の移動先物理サーバ候補一覧(図10)の安全度合致率1002に設定する(S310、S311)。
CPU301は、移動先物理サーバ候補一覧(図10)にまだ情報を追加していない物理サーバ10が含まれていれば(S312:Yes)、ステップS303に戻る。含まれていなければ(S312:No)、次のステップS313に進む。
CPU301は、移動先物理サーバ候補一覧(図10)を安全度合致率1002が100%より低い物理サーバのうち、不足リソース余力1003の余裕が大きいもの順に、不足リソース余力1003の余裕が同じものは、リソース性能変化1004の向上する数が多い順に、リソース性能変化1004の評価が同じであれば、移動先物理サーバ候補一覧(図10)に登録された順に、ステップS313における出力結果の下に、表示装置111に出力する(S314)。
この場合、図12の移動先候補一覧1202の表示のように、安全度合致率1002が小さいものが、移動先候補のより上位に出力されることになるが、これにより、安全度の合致率と、リソースの増加状況を見て余裕と、その他のリソースの性能変化の、どれを重視するかを意識させることができる。
これにより仮想マシンで稼動しているアプリケーションの特徴に応じた仮想マシンの運用を行うことができ、エンドユーザに対して、サービスを安定して持続的に提供することを可能とし、その際の労力を減少させることができる。
11 運用監視ホスト
12 ネットワーク・回線
101 仮想マシン管理プログラム
111 表示装置
112 入力装置
113 仮想環境監視データDB
114 物理サーバ安全度DB
115 物理サーバ性能DB
116 仮想マシン重要度DB
117 パーツ性能情報DB
121 運用監視プログラム
201 物理サーバ10のCPU
202 物理サーバ10のメモリー
203 物理サーバ10のネットワークインターフェース
204 物理サーバ10の記憶装置
205 仮想マシン
206 仮想CPU
207 仮想メモリー
208 仮想ネットワーク
209 仮想ディスク
301 運用監視ホスト11のCPU
302 運用監視ホスト11のメモリー
303 運用監視ホスト11のネットワークインターフェース
304 運用監視ホスト11の記憶装置
Claims (1)
- 物理サーバ上で稼動している仮想マシンの稼動状態を示す仮想マシン稼動情報と、前記物理サーバの稼動状態を示す物理サーバ稼動情報とを格納する仮想環境監視データベースと、
前記物理サーバに含まれるパーツの性能を示すパーツ性能情報を格納するパーツ性能情報データベースと、
前記仮想マシンにリソース不足が発生したことを示す警告を表示する警告表示手段と、
前記警告表示手段によって表示された警告を見た運用管理者によって入力された仮想マシンと当該仮想マシンが稼動している物理サーバとを指定する指示を受け付ける指示受付手段と、
前記指示受付手段によって受け付けられた指示によって指定された仮想マシンの仮想マシン稼動情報を前記仮想環境監視データベースから取得する仮想マシン稼動情報取得手段と、
前記指示受付手段によって受け付けられた指示によって指定された物理サーバの物理サーバ稼動情報を前記仮想環境監視データベースから取得する稼動中物理サーバ稼動情報取得手段と、
前記指示受付手段によって受け付けられた指示によって指定された物理サーバを除くチェック対象の物理サーバの物理サーバ稼動情報を前記仮想環境監視データベースから取得するチェック対象物理サーバ稼動情報取得手段と、
前記パーツ性能情報データベースに格納されているパーツ性能情報を考慮して、前記仮想マシン稼動情報取得手段によって取得された仮想マシン稼動情報と、前記稼動中物理サーバ稼動情報取得手段によって取得された物理サーバ稼動情報と、前記チェック対象物理サーバ稼動情報取得手段によって取得された物理サーバ稼動情報とに基づいて、前記指示受付手段によって受け付けられた指示によって指定された仮想マシンが前記チェック対象の物理サーバで稼動可能か否かを判別し、稼動可能と判別された場合に、当該稼動可能と判別されたチェック対象の物理サーバについて前記指示受付手段によって受け付けられた指示によって指定された仮想マシンが稼動した場合のリソースの余裕を示す不足リソース余力情報を求め、当該稼動可能と判別されたチェック対象の物理サーバの名前と当該不足リソース余力情報とを含む移動先物理サーバ情報を有する前記仮想マシンの移動先物理サーバ候補一覧を作成する移動先物理サーバ候補一覧作成手段と、
前記移動先物理サーバ候補一覧作成手段によって作成された移動先物理サーバ候補一覧に含まれる物理サーバを表示する表示手段と、
物理サーバのハードウェアとソフトウェアの構成および物理サーバの設置状況に基づいて定められ、当該物理サーバが安定的に稼動することができるか否かの評価を示す物理サーバ安全度情報を格納する物理サーバ安全度データベースと、
物理サーバのハードウェアの性能を示す物理サーバ性能情報を格納する物理サーバ性能データベースと、
仮想マシンで稼動しているサービスの重要度を示す仮想マシン重要度情報を格納する仮想マシン重要度データベースと、
前記移動先物理サーバ候補一覧作成手段によって作成された前記移動先物理サーバ候補一覧に含まれる各移動先物理サーバ情報によって指定される物理サーバについて、前記物理サーバ性能データベースに格納されている物理サーバ性能情報に基づいて、前記指示受付手段によって受け付けられた指示によって指定された物理サーバに対するリソース毎の性能の変化を示すリソース性能変化情報を求めるリソース性能変化情報算出手段と、
前記物理サーバ安全度データベースに格納されている物理サーバ安全度情報と前記仮想マシン重要度データベースに格納されている仮想マシン重要度情報とに基づいて、前記指示受付手段によって受け付けられた指示によって指定された仮想マシンの要求する安全対策と、前記移動先物理サーバ候補一覧作成手段によって作成された前記移動先物理サーバ候補一覧に含まれる各移動先物理サーバ情報によって指定される物理サーバの備える安全対策とが一致する割合を示す安全度合致率情報を求める安全度合致率情報算出手段と、
前記安全度合致率情報と前記リソース性能変化情報とを前記移動先物理サーバ候補一覧に含まれる移動先物理サーバ情報に追加する移動先物理サーバ情報追加手段と、
を備え、
前記表示手段が、前記移動先物理サーバ情報追加手段によって前記安全度合致率情報と前記リソース性能変化情報とが追加された移動先物理サーバ候補一覧に含まれる各移動先物理サーバ情報によって指定される物理サーバを前記不足リソース余力情報と前記安全度合致率情報と前記リソース性能変化情報とに基づいて定められる順番で表示する、
ことを特徴とする仮想マシン運用監視システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012064749A JP5737789B2 (ja) | 2012-03-22 | 2012-03-22 | 仮想マシン運用監視システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012064749A JP5737789B2 (ja) | 2012-03-22 | 2012-03-22 | 仮想マシン運用監視システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013196538A JP2013196538A (ja) | 2013-09-30 |
JP5737789B2 true JP5737789B2 (ja) | 2015-06-17 |
Family
ID=49395355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012064749A Expired - Fee Related JP5737789B2 (ja) | 2012-03-22 | 2012-03-22 | 仮想マシン運用監視システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5737789B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102349584B1 (ko) * | 2018-12-14 | 2022-01-11 | 한국전자기술연구원 | 통합선박항해지원시스템에서 가상화 기반 다중 디스플레이 전환 방법 |
JP2021015403A (ja) | 2019-07-11 | 2021-02-12 | 富士通株式会社 | 情報処理装置、情報処理システム、プログラムおよび情報処理方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070271560A1 (en) * | 2006-05-18 | 2007-11-22 | Microsoft Corporation | Deploying virtual machine to host based on workload characterizations |
JP2008276320A (ja) * | 2007-04-25 | 2008-11-13 | Nec Corp | 仮想システム制御方法およびコンピュータシステム |
JP2009087213A (ja) * | 2007-10-02 | 2009-04-23 | Nec Corp | 計算機余力算出装置、計算機余力算出方法 |
JP5589218B2 (ja) * | 2010-04-27 | 2014-09-17 | 株式会社日立製作所 | 計算機システム及び管理計算機 |
-
2012
- 2012-03-22 JP JP2012064749A patent/JP5737789B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013196538A (ja) | 2013-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5423904B2 (ja) | 情報処理装置、メッセージ抽出方法およびメッセージ抽出プログラム | |
EP2523115B1 (en) | Operation management device, operation management method, and program storage medium | |
US9910707B2 (en) | Interface for orchestration and analysis of a computer environment | |
CN105357038B (zh) | 监控虚拟机集群的方法和系统 | |
US7007144B2 (en) | Method, apparatus, and computer readable medium for managing back-up | |
CN104272266A (zh) | 对具有多个监视对象器件的计算机系统进行管理的管理系统 | |
EP2157506A2 (en) | A storage management apparatus, a storage management method and a storage management program | |
JP5422342B2 (ja) | インシデント管理方法および運用管理サーバ | |
JP2005327261A (ja) | 性能監視装置、性能監視方法及びプログラム | |
US20120284278A1 (en) | Monitoring status display device, monitoring status display method and monitoring status display program | |
WO2014013603A1 (ja) | 監視システム及び監視プログラム | |
JP2011198056A (ja) | 情報処理装置、サーバ装置、周辺装置管理方法およびプログラム | |
JP2006260056A (ja) | 統合運用管理サーバ、統合的な運用管理のためのメッセージの抽出方法、及び、プログラム | |
EP4102782A1 (en) | Communication device, surveillance server, and log collection method | |
JP5740338B2 (ja) | 仮想環境運用支援システム | |
JP2012118841A (ja) | 仮想マシン管理装置、移行先決定方法および移行先決定プログラム | |
JP5737789B2 (ja) | 仮想マシン運用監視システム | |
JP6015755B2 (ja) | 仮想ディスクのマイグレーションに関する情報処理方法及び装置 | |
US10169138B2 (en) | System and method for self-healing a database server in a cluster | |
JP5955405B2 (ja) | 管理対象システムを管理するシステム及びプログラム | |
US10162597B1 (en) | Identifying IO access pattern in unique database structures | |
US12028223B2 (en) | Capacity aware cloud environment node recovery system | |
EP2828761A1 (en) | A method and system for distributed computing of jobs | |
US20140165058A1 (en) | System resource management method for virtual system | |
US11301286B2 (en) | System and method for supporting optimization of usage efficiency of resources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140725 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150210 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150324 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20150401 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150417 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5737789 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150413 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150617 |
|
LAPS | Cancellation because of no payment of annual fees |