JP2010134557A - 仮想マシン運用管理システム、その運用管理方法、及びプログラム - Google Patents

仮想マシン運用管理システム、その運用管理方法、及びプログラム Download PDF

Info

Publication number
JP2010134557A
JP2010134557A JP2008307869A JP2008307869A JP2010134557A JP 2010134557 A JP2010134557 A JP 2010134557A JP 2008307869 A JP2008307869 A JP 2008307869A JP 2008307869 A JP2008307869 A JP 2008307869A JP 2010134557 A JP2010134557 A JP 2010134557A
Authority
JP
Japan
Prior art keywords
virtual machine
monitoring
virtual
operation management
monitoring information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008307869A
Other languages
English (en)
Inventor
Yasushi Kobayashi
靖司 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008307869A priority Critical patent/JP2010134557A/ja
Publication of JP2010134557A publication Critical patent/JP2010134557A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】本発明は、仮想マシンにおける性能低下を防止し通信ネットワークに障害が発生しても仮想マシンの運用管理が可能な仮想マシン運用管理システムを提供する。
【解決手段】 仮想マシン運用管理システム1は、ホスト計算機3上で稼働する1以上の仮想マシン20を運用管理する。仮想マシン20が当該仮想マシン20内で実行されている各プロセス30の状態などを監視情報として監視する第1の監視手段6を備える。ホスト計算機3が第1の監視手段6と連携して動作し第1の監視手段6の監視情報を分析する第2の監視手段7を備える。
【選択図】図1

Description

本発明は、仮想マシン運用管理システム、仮想マシンの運用管理方法、及び仮想マシン管理運用プログラムに関する。
ホスト計算機上でエミュレーションされる仮想マシンによる仮想サーバ環境では、物理サーバか仮想サーバかを意識することなく、仮想サーバを論理サーバとして扱うことを基本方針としている。すなわち、仮想サーバを用いたシステムでは、仮想サーバの動作、監視においても他の物理サーバと同等に扱うことが基本方針とされている。
そのため、仮想サーバを運用管理する場合においても、仮想サーバを構成するゲストOS上に特定の運用管理ソフトウエアもしくは監視ソフトウエアをイントールするなど特定の運用管理製品または監視製品を導入する必要があった。
ここで、OSは、オペレーティングシステム(Operating System)の略で基本ソフトウエアを意味する(以下、同じ)。
又、統合的に監視するためには統合監視用の他の物理サーバを別に用意し、当該統合監視用物理サーバ(運用管理サーバともいう)を通信ネットワークを介して仮想サーバ群と通信接続し、当該仮想サーバ群を監視する必要があった。
さらに、ゲストOSのリソースを管理する技術として例えば特許文献1が挙げられる。この特許文献1では、ハイパバイザが、ハイパバイザに割り当てられているリソースを管理するリソース管理テーブルと、各論理区画に対するリソースの割り当て/回収を行う割り当て/回収手段とを備える。各論理区画には、論理区画に割り当てられているリソース量の内の使用中のリソース量を監視するゲストリソース監視手段と、その監視結果に基づき割り当て/回収手段にリソースの追加/切離しを要求する追加/切離手段を有する。割り当て/回収手段は、追加/切離手段からの要求に従いリソース管理テーブルを調べ、割り当て要求の場合には予備リソースがあるときリソースを論理区画に割り当て、回収要求の場合にはリソース管理テーブルにリソースを予備リソースとして回収する。
特開2002−41304号公報
このような上記関連技術の運用管理手法には様々な課題がある。
先ず、特定の運用管理製品のマネージャー(管理側主管理部)に通知するため、仮想サーバに運用管理製品のエージェント(被管理側の管理処理実行部)を必ず導入しなければならなかった。
このため、エージェントを導入することにより、仮想サーバは業務以外にエージェントのためのCPU、メモリなどのリソースを余分に使用しなければならず、仮想マシンの性能が低下するという課題があった。
更に、マネージャーとエージェントと間で通信ネットワークを介したシステム構成となるため、通信ネットワークに何らかの障害が発生した場合、運用管理サーバは仮想サーバ群の状態を把握することができない状態が発生し、これがため、仮想マシンの監視が行えないという不都合があった。
又更に、例えば複数の分散構成を形態とするWebサーバを仮想サーバで実装した場合、サーバの可用性を高めるために負荷分散装置等の監視製品(運用監視装置の一例である運用監視サーバなど)から定期的にWebサーバの死活監視を行わなければならない。
つまり、仮想サーバ環境においてクラスタ、負荷分散、シングルサーバ等サーバの構成形態に関わらず、仮想サーバの可用性及び信頼性を高くするためには必ず特定の監視製品を購入し、または特定の仕組みを必ず組み込まなければならない。
このように、仮想マシン外にも専用のソフトを実装し、さらに仮想マシン内にエージェントを実装していた(ゲストOS上に運用管理専用アプリケーションを実装する)ため仮想マシンの性能が低下するという課題があった。
加えて、特許文献1では、仮想マシン上のリソースを監視することはできるが、仮想マシン上で動作しているプロセスなどについては何ら考慮されておらず、仮想マシンの運用管理を行うことができないという課題があった。
本発明の目的は、上述の関連技術の課題を解決することにあり、仮想マシンにおける性能低下を防止し通信ネットワークに障害が発生しても、仮想マシンの運用管理を可能ならしめる仮想マシン運用管理システム、仮想マシンの運用管理方法、及び仮想マシン管理プログラムを提供することにある。
上記目的を達成するため、本発明の仮想マシン運用管理システムは、ホスト計算機上で稼動する1以上の仮想マシンをホスト計算機側から運用管理する仮想マシン運用管理システムであって、前記仮想マシンが、当該仮想マシン内で実行されている各プロセスの状態を監視し監視情報として収集する第1の監視手段を備え、前記ホスト計算機が、前記第1の監視手段と連携して作動し当該第1の監視手段が収集した監視情報を分析し異常の有無を判定する第2の監視手段を備えていることを特徴としている。
本発明の仮想マシンの運用管理方法は、ホスト計算機上で稼動する1以上の仮想マシンをホスト計算機側から運用管理する仮想マシン運用管理方法であって、前記仮想マシン内に設定された第1の監視手段が備えている仮想主制御部が前記仮想マシン内で実行されている各プロセスの状態を監視すると共にこれを監視情報として収集し、次に、ホスト計算機内に設定された第2の監視手段が、前記第1の監視手段と連携して作動し当該第1の監視手段が収集した監視情報を取得し、続いて、この取得した前記監視情報を前記第2の監視手段が分析すると共に前記仮想マシンの異常の有無を判定することを特徴としている。
本発明の仮想マシン運用管理プログラムは、ホスト計算機上で稼動する1以上の仮想マシンをホスト計算機側から運用管理する仮想マシン運用管理システムにあって、前記仮想マシン全体のプロセスの状態を監視し当該監視情報を収集する監視情報収集機能、この監視情報収集機能が稼動して収集された監視情報を仮想マシン側のプロセス管理テーブルに記憶処理する情報記憶処理機能、このプロセス管理テーブルに記憶された前記プロセスの監視情報を前記仮想マシンが備えている仮想ライブラリを介して前記ホスト計算機へ送り出す監視情報出力制御機能、を前記仮想マシンの仮想主制御部として機能するコンピュータに実行させることを特徴としている。
本発明の仮想マシン運用管理プログラムは、ホスト計算機上で稼動する1以上の仮想マシンをホスト計算機側から運用管理する仮想マシン運用管理システムにあって、前記仮想マシン側からホスト計算機側に向けて前記仮想マシンのプロセスにかかる監視情報が送り込まれた場合にこれを取り込んで仮想マシン状態通知テーブルに記憶する監視情報格納処理機能、この仮想マシン状態通知テーブルに記憶された前記監視情報を定期的に確認し且つ分析して当該仮想マシンの動作状態の異常の有無を判定する異常状態判定機能、前記仮想マシンの動作が異常と判定された場合に稼動し前記仮想マシンの停止制御の可否及び停止制御後の再起動の可否を決定する仮想マシン用動作可否判定機能、を前記ホスト計算機が備えているコンピュータに実行させることを特徴とした仮想マシン運用管理プログラム。
本発明の仮想マシン運用管理プログラムは、ホスト計算機上で稼動する1以上の仮想マシンをホスト計算機側から運用管理する仮想マシン運用管理システムにあって、前記仮想マシンから当該仮想マシンのプロセスにかかる監視情報が送り込まれた場合にこれを前記ホスト計算機側の仮想マシン状態通知テーブルに記憶すると共にそれ以前に記憶されている格納内容を更新するテーブル更新処理機能、前記仮想マシン状態通知テーブルの更新内容を定期的に確認する更新内容確認機能、この仮想マシン状態通知テーブルの更新がなされていない場合に前記仮想マシンの動作を異常と判定する異常状態判定機能、前記仮想マシンの動作が異常と判定された場合に稼動し前記仮想マシンの停止制御の可否及び停止制御後の再起動の可否を決定する仮想マシン用動作可否判定機能、を前記ホスト計算機が備えているコンピュータに実行させることを特徴としている。
本発明によれば、仮想マシンを提供する環境のホスト側に仮想マシンを直接監視する仕組みを実装することで、仮想マシンにおける性能低下を防止し通信ネットワークに障害が発生しても、仮想マシンで動作するプロセスなどをも監視することができ、仮想マシン全体の可用性及び信頼性、監視機構の耐障害性を高めることができるという、関連技術にない優れた仮想マシン運用管理システム、仮想マシンの運用管理方法、及び仮想マシン運用管理プログラムを提供することができる。
〔第1の実施の形態〕
以下、本発明の第1の実施の形態を図1乃至図4に基づいて説明する。
〔仮想マシン運用管理システムの基本的構成〕
先ず、仮想マシン運用管理システムの基本的構成について説明する。図1に示すように、本第1実施形態の仮想マシン運用管理システム1は、ホスト計算機3上で稼働する1以上の仮想マシン20、21、22をホスト計算機3側から運用管理し、仮想マシン上のプロセス30などの状態を直接監視できるものである。
この仮想マシン運用管理システム1では、少なくとも1つの仮想マシン20が、当該仮想マシン内で実行されている各プロセスの状態を監視し監視情報として収集する第1の監視手段6を備える。
又、前記ホスト計算機3が、前記第1の監視手段6と連携して作動し当該第1の監視手段6が収集した監視情報を分析し異常の有無を判定する第2の監視手段7を備えている。
このような仮想マシン運用管理システム1では、ホスト計算機3側の状態通知領域に仮想マシン20自身が自ら状態を通知し、仮想マシン20の稼動状況をホスト計算機3側が確認する場合、又は、仮想マシン20の異常状態をホスト計算器3側が判断し制御する場合のいずれであってもよい。
又、このような仮想マシン運用管理システム1では、仮想マシン20、21、22が動作する仮想サーバ環境が、仮想マシン20、21、22上で動作するプロセスの状態、及び仮想マシン20、21、22のCPU、メモリ、リソースの使用率等サーバの状態を監視する仕組みを仮想環境内だけで実現し、仮想環境を構成するサーバシステムの可用性及び信頼性の向上、監視機構の耐障害性を高める仕組みを特徴とする。
又、仮想マシン運用管理システム1では、仮想マシン20、21、22上のプロセスの状態や仮想マシン20、21、22のCPU、メモリ、ディスク等リソースの使用率などを仮想マシンの実行環境であるホスト側で直接監視及び管理、制御することにより、仮想サーバ環境全体の可用性、信頼性及び監視機構の耐障害性の向上を図ることができる。
仮想マシンを管理するホスト側に直接監視する仕組みを実装することにより、運用管理製品のマネージャー、エージェントを利用した監視の上記課題を解決することができる。
すなわち、仮想マシンを提供する環境のホスト側に仮想マシンを直接監視する仕組みを実装することで、仮想マシンにおける性能低下を防止し通信ネットワークに障害が発生しても、仮想マシンで動作するプロセスなどをも監視することができ、仮想マシン全体の可用性及び信頼性、監視機構の耐障害性を高めることができる。
(仮想マシン運用管理システムの全体構成)
次に、本実施形態の仮想マシン運用管理システムの具体的構成について、全体構成から説明し、続いて各部の詳細構成について説明する。
図1に示すように、本実施の形態の仮想マシン運用管理システム1は、ホスト計算機3と、このホスト計算機3と通信ネットワークNWを介して通信接続された運用管理装置2とを含む構成としている。
ホスト計算機3は、仮想マシン20、21、22などの仮想サーバ環境を構成可能なエミュレータ機能(仮想マシン生成機能)を備える。この仮想マシン生成機能は例えばホストOS10などにより構成してよい。
又、仮想マシン運用管理システム1は、ホスト計算機3上で稼動する仮想マシン20、21、22を備える。これらの各仮想マシン20、21、22はそれぞれ例えばゲストOS20A、ゲストOS21A、ゲストOS22Aに基づいて設定される。
運用管理装置2は、仮想マシン20、21、22を監視することもでき、例えば運用管理サーバなどにて構成される。運用管理装置2は、仮想マシン20、21、及び22と通信ネットワークNWを介して通信接続されている。
仮想マシン20は、当該仮想マシン20内で実行されている各プロセス30の状態を監視し監視情報として収集する第1の監視手段6を備える。又、仮想マシン20は、ホスト計算機3上で仮想マシン環境(仮想サーバ環境)が実現された仮想マシン群の一部を構成するものである。このため、他の仮想マシン21、22も同様の構成を有する。
一方、ホスト計算機3の計算機本体4は、前記第1の監視手段6と連携して作動し当該第1の監視手段6が収集した監視情報を分析し異常の有無を判定する第2の監視手段7を備えている。
第1の監視手段6は、仮想マシン20のプロセス30の状態を監視し収集する仮想主制御部31と、この仮想主制御部31で収集された監視情報を記憶するプロセス管理テーブル33(プロセス管理記憶領域)と、前記仮想主制御部31に併設された仮想ライブラリ32とを備える。
仮想主制御部31は、例えばゲストOS20Aにおけるプログラム本体であるゲストOSカーネルなどにより構成してもよい。この場合、仮想マシン20上で動作するプロセス30をゲストOSカーネルがプロセス管理テーブル33を用いて管理する。
仮想ライブラリ32は、仮想主制御部31で管理しているプロセス管理テーブル33に状態を確認する機能を有する。
仮想主制御部31は、プロセス30の状態を確認し、プロセスの状態をプロセス管理テーブル33に状態を保存する機能を有する。
第2の監視手段7は、システム全体の動作制御を管理する中核管理制御部11と、この中核管理制御部11に併設され仮想ライブラリ32を介して前記第1の監視手段6から送り込まれる前記仮想マシン20のプロセスの状態を記憶する仮想マシン状態通知テーブル12(仮想マシン状態通知記憶領域)とを備えている。
中核管理制御部11は、例えばホストOS10本体を実行するプログラム本体であるホストOSカーネルによりその制御機能が実行されるように構成されている。
仮想マシン状態通知テーブル12は、仮想マシン20、仮想マシン21、仮想マシン22の状態を確認するために使用する。
中核管理制御部11は、本実施形態にあっては二つの機能を有する。中核管理制御部11の一つ目の機能は、仮想ライブラリ32に仮想マシン上のプロセス情報を確認する機能である。中核管理制御部11の二つ目の機能は、仮想マシン状態通知テーブル12を確認する機能である。
又、ホスト計算機3の計算機本体4は、ホスト計算機3に搭載されて仮想マシン環境を構成する機能を備え、種々の情報等を表示するための表示部(スクリーン)、この表示部の表示画面上(の各種入力欄等)にデータを操作入力するための操作入力部(例えばキーボード・マウス・各種ボタン・表示操作部<画面上のボタン>・タッチパネル等)、各種信号・データを送受信するための送受信部ないしは通信部(モデムなど)、各種プログラム・各種データを記憶しておく記憶部(例えばメモリ、ハードディスク等)、これらの制御を司る制御部(例えばCPU、MPU、DSP等)などを備えている。この制御部が前記中核管理制御部や仮想マシン生成機能を備えたものとなっている。又、記憶部の一部により前記各テーブルを構成してもよい。
ここで、本実施の形態の仮想主制御部31と仮想ライブラリ32とプロセス管理テーブル33とからなる構成は、「第1の監視手段6」の一例である。
又、本実施の形態の中核管理制御部11と仮想マシン状態通知テーブル12とからなる構成は、「第2の監視手段7」の一例である。
さらに、プロセス管理テーブル33は、プロセス管理記憶領域の一部に構成される。また、仮想マシン状態通知テーブル12は、仮想マシン状態通知記憶領域の一部に構成される。
(仮想主制御部の詳細構成)
第1の監視手段6における仮想主制御部31は、図3に示すように、前記仮想マシン全体のプロセスの状態を監視し当該監視情報を収集する監視情報収集機能31aを備える。
又、仮想主制御部31は、この監視情報収集機能31aが稼動して収集された監視情報を仮想マシン側のプロセス管理テーブル33に記憶処理する情報記憶処理機能31bを備える。
更に、仮想主制御部31は、このプロセス管理テーブル33に記憶された前記プロセスの監視情報を前記仮想マシン20が備えている仮想ライブラリ32を介して前記ホスト計算機3の第2の監視手段7へ送り出す監視情報出力制御機能31cを備える。
すなわち、監視情報出力制御機能31cは、前記プロセス管理テーブル33に記憶された前記プロセス30などに関する監視情報を前記仮想主制御部31に併設された仮想ライブラリ32を介して前記ホスト側(ホスト計算機3の計算機本体4の第2の監視手段7側)へ送り出す。
前記監視情報収集機能31aにあっては、前記仮想マシン20のプロセスの状態を定期的に監視し収集するように設定してもよい。
前記監視情報出力制御機能31cにあっては、前記ホスト計算機3の第2の監視手段7側から前記仮想ライブラリ32を介して前記仮想マシン20の運用状態の確認要請があった場合にその出力処理を実行する構成としてもよい。
又、仮想主制御部31は、前記仮想マシン20のプロセスの状態を定期的に監視し収集する定期的状態監視機能31dを備えてよい。
更に、仮想主制御部31は、前記ホスト計算機3の計算機本体4(ホストOS10)側の第2の監視手段7から前記仮想ライブラリ32を介して前記仮想マシン20の運用状態の確認要請があった場合に前記監視情報出力制御機能31cを稼動させる構成としてもよい。
(中核管理制御部の詳細構成)
第2の監視手段7における中核管理制御部11は、図3に示すように、前記ホスト計算機3の計算機本体4上で稼動する仮想マシン20の前記プロセス30などの状態を前記第1の監視手段6の仮想ライブラリ32を介して前記第1の監視手段6に要求する監視情報要求制御機能11bを備えている。
すなわち、この監視情報要求制御機能11bでは、仮想マシン20からの監視情報の受信に先立って前記仮想マシン20側の仮想ライブラリ32を介して前記仮想マシン20側に前記プロセス30の状態の監視情報を要求する。
又、前記第2の監視手段7は、前記中核管理制御部11が監視情報要求制御機能11bを実行する構成とすると共に、この監視情報要求により前記仮想マシン20から送られてくる前記プロセス30の状態を前記仮想マシン状態通知テーブル12が記憶する構成としてもよい。
更に、中核管理制御部11は、前記第1の監視手段6から送り込まれる前記仮想マシン20のプロセス情報を確認し且つ分析して当該仮想マシン20の動作状態の異常の有無を判定する異常状態判定機能11cを備える。
この異常状態判定機能11cでは、前記プロセス30の状態を前記仮想マシン状態通知テーブル12が記憶する構成とした場合、この仮想マシン状態通知テーブル12に記憶された前記監視情報を定期的に確認し且つ分析して当該仮想マシンの動作状態の異常の有無を判定してもよい。
又更に、中核管理制御部11は、仮想マシン20の動作が異常と判定された場合に稼動し前記仮想マシン20の停止制御の可否及び停止制御後の再起動の可否を決定する仮想マシン用動作可否判定機能11dを備えている。
又、中核管理制御部11は、前記仮想マシン20側からホスト側(ホスト計算機3の計算機本体4の第2の監視手段7側)に向けて前記仮想マシン20のプロセスにかかる監視情報が送り込まれた場合にこれを取り込んで仮想マシン状態通知テーブル12に記憶する監視情報格納処理機能11aを備えてよい。
(動作処理手順について)
(全体の概略動作)
次に、上述のような構成を有する仮想マシン管理システムにおける全体の動作処理手順について、図2及び図4を参照しつつ説明する。
本第1実施形態に係る仮想マシンの運用管理における動作処理手順は、ホスト計算機3上で稼働する(エミュレーションされる)1以上の仮想マシン20、21、22をホスト計算機側から運用管理する仮想マシン運用管理システムにあって、前記ホスト計算機3が備えたコンピュータが行うものを対象とする。
本第1実施形態に係る仮想マシン20、21、22の運用管理における全体の動作処理手順は、基本的手順として、先ず、前記仮想マシン20(21、22についても同じ)内に設定された第1の監視手段6が備えている仮想主制御部31が、前記仮想マシン20内で実行されている各プロセスの状態を監視すると共にこれを監視情報として収集する(図4に示すステップS1:監視情報収集ステップないしは機能)。
次に、ホスト計算機3内に設定された第2の監視手段7が、前記第1の監視手段6と連携して作動し当該第1の監視手段6が収集した監視情報を取得する(図4に示すステップS2:監視情報取得ステップないしは機能)。
続いて、この取得した前記監視情報を前記第2の監視手段7が分析すると共に前記仮想マシン20の異常の有無を判定する(図4に示すステップS3:異常状態判定ステップないしは機能)。
さらに、この仮想マシン20の運用管理における動作処理手順では、前記監視情報の収集に際しては、前記第1の監視手段6が備えている仮想主制御部31が、前記仮想マシン20のプロセスの状態を監視し収集する。
次に、この収集された監視情報を前記仮想主制御部31が、前記第1の監視手段6が備えているプロセス管理テーブル33に格納制御する(図2に示すステップS12:情報記憶処理ステップないしは機能)。
しかる後、前記プロセス管理テーブル33に記憶された前記プロセスの監視情報を、前記仮想主制御部31に併設された仮想ライブラリ32が前記第2の監視手段7へ送り出す(図2に示すステップS14、S15、S16からなるステップ:監視情報出力制御ステップないしは機能)。
これにより前記第2の監視手段7が前記監視情報を取得する。
又、この仮想マシンの運用管理における動作処理手順では、前記仮想マシン20のプロセスの状態の監視および監視情報の収集は、前記仮想主制御部31により定期的に実行される(図2に示すステップS11:定期的状態監視ステップないしは機能)。
更に、この仮想マシン20の運用管理における動作処理手順では、前記仮想主制御部31による前記仮想マシン20の運用状態の監視および監視情報の収集動作は、事前に、前記ホスト計算機3側の第2の監視手段7から前記仮想ライブラリ32を介して前記仮想マシン20の運用状態の確認要請があった場合に実行する。
又更に、この仮想マシン20の運用管理における動作処理手順では、前記仮想ライブラリ32を介して前記第1の監視手段6から前記第2の監視手段7に送り込まれる監視情報を前記中核管理制御部11が分析して前記仮想マシン20の動作状態の異常有無を判定してもよい(異常状態判定ステップないしは機能)。
そして、この判定結果に従って前記中核管理制御部11が前記仮想マシン20の停止制御の可否及び停止制御後の再起動の可否を決定する(仮想マシン用動作可否判定ステップないしは機能)。
(詳細動作)
以下、これを更に詳述する。
まず、仮想マシン20で動作するプロセス30を監視する動作について説明する。
仮想マシン20で動作する本体部である仮想主制御部31(ゲストOSカーネル等)は、プロセス30を定期的に監視し(図2に示すステップS11:定期的状態監視ステップないしは機能)、その状況を示す監視情報をプロセス管理テーブル33に定期的に保存する(図2に示すステップS12:情報記憶処理ステップないしは機能)。これにより、プロセス管理テーブル33には各プロセスのリソースの使用状況または仮想マシン20の負荷状況の状態が保存される。
一方、ホスト側で動作する本体部である中核管理制御部11(ホストOSカーネル等)は、仮想マシン20のプロセス情報及び仮想マシン20の負荷状況を確認するために、仮想マシン20の仮想ライブラリ32にプロセス情報及び負荷状況の確認依頼を行う(図2に示すステップS13)。
仮想ライブラリ32は、中核管理制御部11からの確認依頼を受け、仮想主制御部31にプロセス情報及び負荷状況の確認を行う(図2に示すステップS14)。
仮想主制御部31は、プロセス情報及び負荷状況の確認を行うために、プロセス管理テーブル33の情報を確認し、仮想ライブラリ32にその情報を通知する(図2に示すステップS15)。
仮想ライブラリ32は、仮想主制御部31から得たプロセス情報及び負荷状況などの監視情報を中核管理制御部11に情報を通知する(図2に示すステップS16)。
中核管理制御部11は、その情報を分析し、プロセスに異常が発生しもしくは仮想マシン20に動作異常が発生したか否かを判断する(異常状態判定ステップないしは機能)。
そして、中核管理制御部11は、この判定により仮想マシン20を強制的に停止もしくは、再起動させた方が良いかを判断することが可能で、該行為を実行する(仮想マシン用動作可否判定ステップないしは機能)。
更に、この仮想マシン20の運用管理における動作処理手順では、前記仮想ライブラリ32を介して前記第1の監視手段6から前記第2の監視手段7に送り込まれる監視情報を、当該第2の監視手段7が有する中核管理制御部11が当該中核管理制御部11に併設された仮想マシン状態通知テーブル12に格納してもよい(監視情報格納処理ステップないしは機能)。
この場合、この格納された監視情報を前記中核管理制御部11が分析して前記仮想マシン20の動作状態の異常有無を判定する(異常状態判定ステップないしは機能)。
そして、この判定結果に従って前記中核管理制御部11が前記仮想マシン20の停止制御の可否及び停止制御後の再起動の可否を決定する(仮想マシン用動作可否判定ステップないしは機能)。
(効果の説明)
以上のように本実施の形態によれば、以下の効果を奏することができる。
第1の効果は、本システムを用いることにより仮想マシン上のプロセスの監視及び仮想マシン自身の監視の仕組みを仮想サーバ環境だけで実装できる。
その理由は、仮想マシンの監視を仮想環境のホスト側で直接監視することにより、特定の運用管理製品もしくは監視製品などの専用ソフトウエアを仮想マシンに導入する必要が無いためである。そのため、不要な運用製品のマネージャーのための物理管理サーバ、仮想マシンに導入するエージェントの必要性が無くなる。結果運用管理設備に対するコストを削減できる。
第2の効果は、第1の効果により、仮想マシンの負荷を軽減できる。
その理由は、仮想マシンに特定の運用管理システムのエージェントを導入する必要性が無くなるのでCPU、メモリ、ディスクリソースの使用率を軽減できるためである。
第3の効果は、統合監視を目的とした運用管理システムに比べて本システムを利用することにより仮想マシンの監視の仕組みを強化できる。その理由は、統合監視ではマネージャー、エージェントを用いたネットワークを介した構成が一般的である。そのため、通信ネットワークに障害が発生した場合仮想マシンの監視を行うことができない。しかし、仮想マシンと直接やり取りができるホストOSは通信ネットワーク障害の有無に関係無く仮想マシンの監視を行うことができるためである。
第4の効果は、仮想マシンのストール状態、異常状態を正確に検出でき確実に停止、再起動の処理を実行できる。その理由は、本システムにより仮想マシンは自分の状態を定期的にホスト側に通知するため、ホスト側は瞬時に仮想マシンの異常状態を検出できるためである。また、仮想マシンはホスト側で管理されているため直接仮想マシンに対し確実に停止、再起動の処理を実行できるためである。
ここで、図1に示すブロック図における一部の各ブロックは、コンピュータにより実行可能なプログラムにより機能化された状態を示すソフトウエアモジュール構成であってもよい。
すなわち、物理的構成は例えば一又は複数のCPU(或いは一又は複数のCPUと一又は複数のメモリ)等ではあるが、各部(回路・手段)によるソフトウエア構成は、プログラムの制御によってCPUが発揮する複数の機能を、それぞれ複数の部(手段)による構成要素として表現したものである。
CPUがプログラムによって実行されている動的状態(プログラムを構成する各手順を実行している状態)を機能表現した場合、CPU内に各部(手段)が構成されることになる。プログラムが実行されていない静的状態にあっては、各手段の構成を実現するプログラム全体(或いは各手段の構成に含まれるプログラム各部)は、メモリなどの記憶領域に記憶されている。
以上に示した各部(手段)は、プログラムにより機能化されたコンピュータをプログラムの機能と共に実現し得るように構成しても、また、固有のハードウエアにより恒久的に機能化された複数の電子回路ブロックからなる装置で構成してもよい。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現でき、いずれかに限定されるものではない。
[第2の実施の形態]
次に、本発明にかかる第2の実施の形態について、図5乃至図6に基づいて説明する。以下には、前記第1の実施の形態の実質的に同様の構成に関しては説明を省略し、異なる部分についてのみ述べる。
本実施の形態では、図5に示すように、第2の監視手段7は、中核管理制御部11と仮想マシン状態通知記憶領域としての仮想マシン状態通知テーブル12とを備える。
そして、第1の監視手段6が、前記各プロセスの状態などの監視情報を前記仮想マシン状態通知記憶領域に定期的に書き込み更新する機能を備える。
又、中核管理制御部11が、この更新がなされないことを確認した場合、前記仮想マシンを強制停止もしくは再起動させるかどうかを判断する機能を備える。
(詳細構成)
より詳細には、前記第1の監視手段6の仮想主制御部31は、図6に示すように、前記仮想マシン20のプロセスにかかる監視情報を前記第2の監視手段7側の仮想マシン状態通知テーブル12に定期的に送り込んでその格納内容を更新するテーブル更新機能31eを備える。
前記第2の監視手段7の中核管理制御部11は、図6に示すように、前記仮想マシン状態通知テーブル12の更新内容を定期的に確認する更新内容確認機能11eを備える。
又、中核管理制御部11は、当該仮想マシン状態通知テーブル12の更新がなされていない場合に前記仮想マシン20の動作を異常と判定する異常状態判定機能11cを備えてよい。
更に、中核管理制御部11は、前記仮想マシン20の動作が異常と判定された場合に稼動し前記仮想マシン20の停止制御の可否及び停止制御後の再起動の可否を決定する仮想マシン用動作可否判定機能11dを備えてよい。
中核管理制御部11は、前記仮想マシンから当該仮想マシンのプロセスにかかる監視情報が送り込まれた場合にこれを前記ホスト計算機側の仮想マシン状態通知テーブル12に記憶すると共にそれ以前に記憶されている格納内容を更新するテーブル更新処理機能11fを備えてよい。
その他の構成は、前述した第1実施形態の場合と同一となっている。
(動作処理手順)
次に、動作を図5に基づいて説明する。本第2実施の形態に係る仮想マシン20の運用管理における動作処理手順では、前記プロセス管理テーブル33に記憶された監視情報を前記第2の監視手段7に送り込むに際しては、前記仮想主制御部31が前記仮想ライブラリ32を介して前記第2の監視手段7側の仮想マシン状態通知テーブル12に定期的に送り込んでその格納内容を更新し(図5に示すステップS21、S22からなるステップ:テーブル更新ステップないしは機能)。
次に、前記第2の監視手段7の中核管理制御部11が前記仮想マシン状態通知テーブル12の更新内容を定期的に確認する(図5に示すステップS23:更新内容確認ステップないしは機能)と共に当該仮想マシン状態通知テーブル12の更新がなされていない場合に前記仮想マシン20の動作を異常と判定する(異常状態判定ステップないしは機能)。
その後、この判定結果に基づいて前記中核管理制御部11が機能して前記仮想マシン20の停止制御の可否及び停止制御後の再起動の可否を決定する(仮想マシン用動作可否判定ステップないしは機能)。
(詳細動作)
以下、この仮想マシン20の動作状況を確認する動作について図5を参照して詳述する。
仮想主制御部31は、仮想マシン20が動作している間、仮想ライブラリ32に要求を出力し(図5に示すステップS21)、仮想ライブラリ32は、ホスト側の仮想マシン状態通知テーブル12に現在の状態及び時間を書き込む(図5に示すステップS22)。この書き込む動作は短い間隔(例えばmsなど)で定期的に行う。
一方、ホスト側の中核管理制御部11は、仮想マシン20が動作開始した時点から仮想マシン状態通知テーブル12の状態及び時間情報を定期的に確認する(図5に示すステップS23:更新内容確認ステップないしは機能)。
仮想マシン状態通知テーブル12の情報が仮想ライブラリ32に定期的に更新されない場合には、中核管理制御部11は仮想マシン20の異常を検知する(異常状態判定ステップないしは機能)。
この結果、中核管理制御部11は、仮想マシン20を強制的に停止もしくは、再起動させた方が良いかを判断し、該行為を実行する(仮想マシン用動作可否判定ステップないしは機能)。
ここで、第1の監視手段が、図5に示すステップS21、S22からなるステップにより、テーブル更新ステップを実行する。
以上で説明したように、本第2の実施の形態によると、仮想マシン20側が定期的にホスト側に監視情報を供給することにより、前述した第1の実施の形態と同様の作用効果を奏することができる。
その他の構成およびその他のステップないしは機能並びにその作用効果については、前述した第1実施形態の場合と同一となっている。また、上記の説明において、上述した各ステップの動作内容及び各部の構成要素並びにそれらによる各機能をプログラム化(ソフトウエアプログラム)し、コンピュータに実行させてもよい。
[その他の各種変形例]
また、本発明にかかる装置及び方法は、そのいくつかの特定の実施の形態に従って説明してきたが、本発明の主旨および範囲から逸脱することなく本発明の本文に記述した実施の形態に対して種々の変形が可能である。
又、上記構成部材の数、位置、形状等は上記実施の形態に限定されず、本発明を実施する上で好適な数、位置、形状等にすることができる。すなわち、上記実施の形態では、仮想マシンが3台、ホスト計算機やホストOSが1個、の場合を示したが、本発明は、これらの個数を制限するものではない。
更に、ゲストOSは、同一の種類のOS、異なる種類のOSを問わない。又、ゲストOSに実装されるアプリケーション、Webサーバ、SMTPサーバなどサーバの種類は問わない。
又、ホストOSにエミュレータ機能が内蔵されているもの、ホストOSが仮想マシンモニタなどのハイパバイザで構成されるもの(半仮想化型)、ホストOS上にエミュレータ(仮想化ソフトウエア)を搭載するタイプ(完全仮想化型)のいずれのシステムであってもよい。
更に又、前記実施の形態においてプロセスとは、情報処理においてプログラムの動作中のインスタンスを意味し、全ての変数やその他の状態を含む。プロセスは、ゲストOSから記憶領域やディスク資源を割り当てられて、処理を実行する。
プロセスは、システムプロセス、ユーザープロセスを含んでよい。又、プロセスは、親プロセス、子プロセス、ゾンビプロセスなどを含む。プロセス識別子により識別してよい。
又、プロセスの状態情報は、プロセスの種類毎に監視できる。プロセスの状態情報は、プロセス毎のプロセス関連情報を含む。
プロセス関連情報は、一例として以下のリソースを含む。プロセスに割り当てられたリソースの記述子(ファイル記述子やファイルハンドルなど)、セキュリティ属性(プロセスの所有者やプロセスに関わるパーミッションなど)。プログラムに対応する実行命令コードのイメージ、プロセッサ状態(レジスタの内容、物理メモリのアドレシングなど)。実行コードとプロセス固有データを格納しているメモリ(仮想メモリ領域と実メモリ領域)関連情報。
各監視手段は、プロセスを管理対象とするが、カーネルがスレッドを直接制御する場合には、スレッドも管理対象としてもよい。又、OSがプロセスをグループ化してリソースを割り当てる機能を持つ場合、監視手段は、プロセスグループをも監視する機能を備えてよい。又、プロセスの優先度、プロセスへの記憶領域の割り当て等や、親プロセスと子プロセスの関係情報なども監視する機能を備えてよい。又、監視手段は、プロセスの実行状態、実行可能状態、待ち状態などの状態を監視する機能を備えてよい。
第1、第2の各監視手段は、仮想マシンで動作する各プロセスの状態を監視する機能、これらの各プロセス毎に仮想マシンのCPU、メモリ、ディスク等リソースの使用率を監視する機能、仮想マシン仮想サーバの負荷状況を監視する機能を備えてよい。
又、本発明の一実施形態における仮想マシン管理システムでは、仮想計算機システムにおいて、仮想計算機の資源(CPUやメモリ等)の使用率やプロセスの状態等の監視情報を収集する機能をホストOSとゲストOSに組み込んで搭載してよい。これにより、仮想計算機の性能を向上させる。この場合、ゲストOSは監視情報を決められた領域(状態通知テーブル)に書き込み、ホストOSがそれを収集することができる。又、ゲストOSは監視情報を決められた領域(状態通知テーブル)に書き込み、ホストOSがそれを収集することができる。
又、明細書中の記載において広義な用語(監視情報等)として引用された用語(プロセスの状態情報、仮想マシンの資源(CPUやメモリ等)の使用率等)は、明細書中の他の記載においても広義な用語に置き換えることができる。更に、明細書中の記載において、各ステップが各々処理する各動作内容は、各ステップの動作説明に記載されていないが、前記記憶媒体における各々の特定の記憶領域に各々書き込む処理を各々実行することを含むものである。
以上説明した方法は、コンピュータがプログラムを記録媒体から読み込んで実行することによっても実現することが出来る。すなわち、上述のプログラムを、情報記録媒体に記録した構成であってもよい。
さらに、このようなシステムは、単独で存在する場合もあるし、ある機器(例えば電子機器など)に組み込まれた状態で利用されることもあるなど、発明の思想としてはこれに限らず、各種の態様を含むものである。
さらにまた、一部がソフトウェアであって、一部がハードウェアで実現されている場合であってもよく、一部を記憶媒体上に記憶しておいて必要に応じて適宜読み込まれるような形態のものとしてあってもよい。
更に、本発明の一実施形態にかかる仮想マシン運用管理システムは、ホスト計算機上で稼動する1以上の仮想マシンをホスト計算機側から運用管理する仮想マシン運用管理システムにあって、前記仮想マシンの仮想主制御部が、前記仮想マシン全体のプロセスの状態を監視し当該監視情報を収集する監視情報収集機能と、この監視情報収集機能が稼動して収集された監視情報を仮想マシン側のプロセス管理テーブルに記憶処理する情報記憶処理機能と、このプロセス管理テーブルに記憶された前記プロセスの監視情報を前記仮想マシンが備えている仮想ライブラリを介して前記ホスト計算機へ送り出す監視情報出力制御機能のみを備えた構成としてもよい。
又更に、本発明の一実施形態にかかる仮想マシン運用管理システムは、ホスト計算機上で稼動する1以上の仮想マシンをホスト計算機側から運用管理する仮想マシン運用管理システムにあって、前記ホスト計算機が、前記仮想マシン側からホスト計算機側に向けて前記仮想マシンのプロセスにかかる監視情報が送り込まれた場合にこれを取り込んで前記監視情報を確認し且つ分析して当該仮想マシンの動作状態の異常の有無を判定する異常状態判定機能と、前記仮想マシンの動作が異常と判定された場合に稼動し前記仮想マシンの停止制御の可否及び停止制御後の再起動の可否を決定する仮想マシン用動作可否判定機能のみを備えた構成としてもよい。
又、本発明の一実施形態にかかる仮想マシン運用管理システムは、ホスト計算機上で稼動する1以上の仮想マシンをホスト計算機側から運用管理する仮想マシン運用管理システムにあって、前記ホスト計算機が、前記仮想マシンから当該仮想マシンのプロセスにかかる監視情報が送り込まれた場合にこれを前記ホスト計算機側の仮想マシン状態通知テーブルに記憶すると共にそれ以前に記憶されている格納内容を更新するテーブル更新処理機能と、前記仮想マシン状態通知テーブルの更新内容を定期的に確認する更新内容確認機能と、この仮想マシン状態通知テーブルの更新がなされていない場合に前記仮想マシンの動作を異常と判定する異常状態判定機能と、前記仮想マシンの動作が異常と判定された場合に稼動し前記仮想マシンの停止制御の可否及び停止制御後の再起動の可否を決定する仮想マシン用動作可否判定機能のみを備えた構成としてもよい。
又更に、本発明の一実施形態にかかる仮想マシン運用管理システムは、ホスト計算機上で稼動する1以上の仮想マシンをホスト計算機側から運用管理する仮想マシン運用管理システムにあって、前記ホスト計算機が、前記仮想マシン側からホスト計算機側に向けて前記仮想マシンのプロセスにかかる監視情報が送り込まれた場合にこれを取り込んで仮想マシン状態通知テーブルに記憶する監視情報格納処理機能と、この仮想マシン状態通知テーブルに記憶された前記監視情報を定期的に確認し且つ分析して当該仮想マシンの動作状態の異常の有無を判定する異常状態判定機能と、前記仮想マシンの動作が異常と判定された場合に稼動し前記仮想マシンの停止制御の可否及び停止制御後の再起動の可否を決定する仮想マシン用動作可否判定機能のみを備えた構成としてもよい。
更に、本発明の一実施形態にかかる仮想マシン運用管理システムは、ホスト計算機上で稼働する1以上の仮想マシンを運用管理する仮想マシン運用管理システムであって、前記仮想マシンのゲストOSが、当該仮想マシン内で実行されている各プロセスの状態などを監視情報として監視する第1の監視手段を備え、前記ホスト計算機のホストOSが、前記第1の監視手段と連携して動作し前記第1の監視手段の監視情報を分析する第2の監視手段を備えてもよい。
このような仮想マシン運用管理システムでは、ホストOS上の状態通知領域に仮想マシン自身が自ら状態を通知し、仮想マシンの稼動状況をホストOSが確認する場合、仮想マシンの異常状態をホストOSが判断し制御する場合のいずれであってもよい。
仮想マシンを提供する環境のホスト側に仮想マシンを直接監視する仕組みを実装することで、仮想マシンにおける性能低下を防止し通信ネットワークに障害が発生しても、ゲストOS上のプロセスなどをも監視することができ、仮想マシン全体の可用性及び信頼性、監視機構の耐障害性を高めることができる。
又、前記第2の監視手段は、前記各プロセスの状態などの監視情報の分析結果に応じて前記ゲストOSを強制停止もしくは再起動させるかどうかを判断する判断機能を備える。
より詳細には、第2の監視手段は、ホストOSカーネルを備える。又、前記第1の監視手段は、ゲストOSカーネルと前記各プロセスの状態などの監視情報を蓄積するプロセス管理記憶領域としてのプロセス管理テーブル33を備える。
そして、ホストOSカーネルが、前記第1の監視手段に対し監視情報の確認要求を送出する機能を備える。又、前記ゲストOSカーネルが、当該要求を受けると前記プロセス管理記憶領域の前記監視情報を前記ホストOSカーネルに通知する機能を備える。
この仮想マシンの運用管理における動作処理手順では、前記仮想マシンのゲストOSにおける第1の監視手段として機能する前記ホスト計算機が備えたコンピュータが、前記仮想マシン内で実行されている各プロセスの状態などを監視情報として監視し(図2に示すステップS11、S12、S14、S15からなるステップ:第1の監視制御ステップ)、続いて、前記ホスト計算機のホストOSにおける第2の監視手段として機能する前記ホスト計算機が備えたコンピュータが、前記第1の監視手段と連携して動作し前記第1の監視手段の監視情報を分析する(図2に示すステップS13、S16及び図示しない判断ステップからなるステップ:第2の監視制御ステップ)ことを実行する。
さらに、この仮想マシンの運用管理における動作処理手順では、前記第2の監視手段が前記監視情報を分析するに際しては、前記監視情報の分析結果に応じて前記ゲストOSを強制停止もしくは再起動させるかどうかを判断することを実行する。
又、第1の監視手段が、図5に示すステップS21、S22からなるステップにより、第1の監視制御ステップを実行してもよい。又、第2の監視手段が、図5に示すステップS23及び図示しない判断ステップからなるステップにより、第2の監視制御ステップを実行してもよい。
本発明は、エミュレータにより仮想マシンを実行させる際にクラスタシステム(フェイルオーバー型、負荷分散型)のサーバ、シングルサーバ等、サーバの構成に関わらず、全ての仮想サーバ環境のシステムの信頼性向上を目的とした用途に利用できる。
本発明の第1の実施の形態による仮想マシン運用管理システムの全体構成の一例を示すブロック図である。 図1の仮想サーバ環境における仮想マシン及びプロセス監視の動作を概念的に説明するための一例を示す説明図である。 図1の仮想マシン運用管理システムにおける仮想主制御部及び中核管理制御部の詳細構成の一例を示すブロック図である。 本発明の第1の実施の形態による仮想マシン運用管理システムにおける動作処理手順の一例を示すフローチャートである。 本発明の第2の実施の形態による仮想マシン管理システムの仮想サーバ環境における仮想マシン及びプロセス監視の動作を概念的に説明するための一例を示す説明図である。 本発明の第2の実施の形態による仮想マシン運用管理システムにおける仮想主制御部及び中核管理制御部の詳細構成の一例を示すブロック図である。
符号の説明
1 仮想マシン運用管理システム
2 運用管理装置
3 ホスト計算機
6 第1の監視手段
7 第2の監視手段
10 ホストOS
11 中核管理制御部
11b 監視情報要求制御機能
11c 異常状態判定機能
11d 仮想マシン用動作可否判定機能
11e 更新内容確認機能
11f テーブル更新処理機能
12 仮想マシン状態通知テーブル(仮想マシン状態通知記憶領域)
20、21、22 仮想マシン
20A、21A、22A ゲストOS
30 プロセス
31 仮想主制御部
31a 監視情報収集機能
31b 情報記憶処理機能
31c 監視情報出力制御機能
31d 定期的状態監視機能
31e テーブル更新機能
32 仮想ライブラリ
33 プロセス管理テーブル(プロセス管理記憶領域)
NW 通信ネットワーク

Claims (21)

  1. ホスト計算機上で稼動する1以上の仮想マシンをホスト計算機側から運用管理する仮想マシン運用管理システムであって、
    前記仮想マシンが、当該仮想マシン内で実行されている各プロセスの状態を監視し監視情報として収集する第1の監視手段を備え、
    前記ホスト計算機が、前記第1の監視手段と連携して作動し当該第1の監視手段が収集した監視情報を分析し異常の有無を判定する第2の監視手段を備えていることを特徴とした仮想マシン運用管理システム。
  2. 請求項1に記載の仮想マシン運用管理システムにおいて、
    前記第1の監視手段は、前記仮想マシンのプロセスの状態を監視し収集する仮想主制御部と、この仮想主制御部で収集された監視情報を記憶するプロセス管理テーブルとを備え、
    前記仮想主制御部は、前記プロセス管理テーブルに記憶された前記プロセスの監視情報を前記仮想主制御部に併設された仮想ライブラリを介して前記ホスト計算機へ送り出す監視情報出力制御機能を備えていることを特徴とした仮想マシン運用管理システム。
  3. 請求項2に記載の仮想マシン運用管理システムにおいて、
    前記第2の監視手段は、システム全体の動作制御を管理する中核管理制御部と、この中核管理制御部に併設され前記仮想ライブラリを介して前記第1の監視手段から送り込まれる前記仮想マシンのプロセスの状態を記憶する仮想マシン状態通知テーブルとを備えて構成されていることを特徴とした仮想マシン運用管理システム。
  4. 請求項3に記載の仮想マシン運用管理システムにおいて、
    前記第1の監視手段の仮想主制御部は、前記仮想マシンのプロセスの状態を定期的に監視し収集する定期的状態監視機能を備えていることを特徴とした仮想マシン運用管理システム。
  5. 請求項3に記載の仮想マシン運用管理システムにおいて、
    前記第1の監視手段の仮想主制御部は、前記ホスト計算機側の第2の監視手段から前記仮想ライブラリを介して前記仮想マシンの運用状態の確認要請があった場合に前記監視情報出力制御機能を稼動させる構成としたことを特徴とする仮想マシン運用管理システム。
  6. 請求項5に記載の仮想マシン運用管理システムにおいて、
    前記第2の監視手段は、前記ホスト計算機上で稼動する仮想マシンの前記プロセスの状態を前記第1の監視手段の仮想ライブラリを介して前記第1の監視手段に要求する監視情報要求制御機能を備えていることを特徴とする仮想マシン運用管理システム。
  7. 請求項6に記載の仮想マシン運用管理システムにおいて、
    前記第2の監視手段は、前記中核管理制御部が監視情報要求制御機能を実行する構成とすると共に、この監視情報要求により前記仮想マシンから送られてくる前記プロセスの状態を前記仮想マシン状態通知テーブルが記憶する構成としたことを特徴とする仮想マシン運用管理システム。
  8. 請求項3乃至請求項6のうちいずれか一項に記載の仮想マシン運用管理システムにおいて、
    前記第2の監視手段の中核管理制御部は、
    前記第1の監視手段から送り込まれる前記仮想マシンのプロセス情報を確認し且つ分析して当該仮想マシンの動作状態の異常の有無を判定する異常状態判定機能と、前記仮想マシンの動作が異常と判定された場合に稼動し前記仮想マシンの停止制御の可否及び停止制御後の再起動の可否を決定する仮想マシン用動作可否判定機能とを備えていることを特徴とした仮想マシン運用管理システム。
  9. 請求項3乃至請求項6のうちいずれか一項に記載の仮想マシン運用管理システムにおいて、
    前記第1の監視手段の仮想主制御部は、
    前記仮想マシンのプロセスにかかる監視情報を前記第2の監視手段側の仮想マシン状態通知テーブルに定期的に送り込んでその格納内容を更新するテーブル更新機能を有し、
    前記第2の監視手段の中核管理制御部は、
    前記仮想マシン状態通知テーブルの更新内容を定期的に確認する更新内容確認機能と、当該仮想マシン状態通知テーブルの更新がなされていない場合に前記仮想マシンの動作を異常と判定する異常状態判定機能と、前記仮想マシンの動作が異常と判定された場合に稼動し前記仮想マシンの停止制御の可否及び停止制御後の再起動の可否を決定する仮想マシン用動作可否判定機能とを備えていることを特徴とした仮想マシン運用管理システム。
  10. ホスト計算機上で稼動する1以上の仮想マシンをホスト計算機側から運用管理する仮想マシン運用管理方法であって、
    前記仮想マシン内に設定された第1の監視手段が備えている仮想主制御部が前記仮想マシン内で実行されている各プロセスの状態を監視すると共にこれを監視情報として収集し、
    次に、ホスト計算機内に設定された第2の監視手段が、前記第1の監視手段と連携して作動し当該第1の監視手段が収集した監視情報を取得し、
    続いて、この取得した前記監視情報を前記第2の監視手段が分析すると共に前記仮想マシンの異常の有無を判定することを特徴とした仮想マシン運用管理方法。
  11. 請求項10に記載の仮想マシン運用管理方法において、
    前記監視情報の収集に際しては、前記第1の監視手段が備えている仮想主制御部が前記仮想マシンのプロセスの状態を監視し収集する構成とし、
    次に、この収集された監視情報を前記仮想主制御部が前記第1の監視手段が備えているプロセス管理テーブルに格納制御し、
    しかる後、前記プロセス管理テーブルに記憶された前記プロセスの監視情報を、前記仮想主制御部に併設された仮想ライブラリが前記第2の監視手段へ送り出す構成とし、
    これにより前記第2の監視手段が前記監視情報を取得するようにしたことを特徴とした仮想マシン運用管理方法。
  12. 請求項11に記載の仮想マシン運用管理方法において、
    前記仮想マシンのプロセスの状態の監視および監視情報の収集は、前記仮想主制御部により定期的に実行されることを特徴とした仮想マシン運用管理方法。
  13. 請求項11に記載の仮想マシン運用管理方法において、
    前記仮想主制御部による前記仮想マシンの運用状態の監視および監視情報の収集動作は、事前に、前記ホスト計算機側の第2の監視手段から前記仮想ライブラリを介して前記仮想マシンの運用状態の確認要請があった場合に実行する構成としたことを特徴とする仮想マシン運用管理方法。
  14. 請求項11乃至請求項13のうちいずれか一項に記載の仮想マシン運用管理方法において、
    前記仮想ライブラリを介して前記第1の監視手段から前記第2の監視手段に送り込まれる監視情報を前記中核管理制御部が分析して前記仮想マシンの動作状態の異常有無を判定し、
    この判定結果に従って前記中核管理制御部が前記仮想マシンの停止制御の可否及び停止制御後の再起動の可否を決定することを特徴とした仮想マシン運用管理方法。
  15. 請求項11又は請求項12に記載の仮想マシン運用管理方法において、
    前記プロセス管理テーブルに記憶された監視情報を前記第2の監視手段に送り込むに際しては、前記仮想主制御部が前記仮想ライブラリを介して前記第2の監視手段側の仮想マシン状態通知テーブルに定期的に送り込んでその格納内容を更新し、
    次に、前記第2の監視手段の中核管理制御部が前記仮想マシン状態通知テーブルの更新内容を定期的に確認すると共に当該仮想マシン状態通知テーブルの更新がなされていない場合に前記仮想マシンの動作を異常と判定し、
    その後、この判定結果に基づいて前記中核管理制御部が機能して前記仮想マシンの停止制御の可否及び停止制御後の再起動の可否を決定することを特徴とした仮想マシン運用管理方法。
  16. ホスト計算機上で稼動する1以上の仮想マシンをホスト計算機側から運用管理する仮想マシン運用管理システムにあって、
    前記仮想マシン全体のプロセスの状態を監視し当該監視情報を収集する監視情報収集機能、
    この監視情報収集機能が稼動して収集された監視情報を仮想マシン側のプロセス管理テーブルに記憶処理する情報記憶処理機能、
    このプロセス管理テーブルに記憶された前記プロセスの監視情報を前記仮想マシンが備えている仮想ライブラリを介して前記ホスト計算機へ送り出す監視情報出力制御機能、
    を前記仮想マシンの仮想主制御部として機能するコンピュータに実行させることを特徴とした仮想マシン運用管理プログラム。
  17. 請求項16に記載の仮想マシン運用管理プログラムにおいて、
    前記監視情報収集機能にあっては、
    前記仮想マシンのプロセスの状態を定期的に監視し収集するように設定したことを特徴とする仮想マシン運用管理プログラム。
  18. 請求項16に記載の仮想マシン運用管理プログラムにおいて、
    前記監視情報出力制御機能にあっては、
    前記ホスト計算機側から前記仮想ライブラリを介して前記仮想マシンの運用状態の確認要請があった場合にその出力処理を実行する構成としたことを特徴とする仮想マシン運用管理プログラム。
  19. ホスト計算機上で稼動する1以上の仮想マシンをホスト計算機側から運用管理する仮想マシン運用管理システムにあって、
    前記仮想マシン側からホスト計算機側に向けて前記仮想マシンのプロセスにかかる監視情報が送り込まれた場合にこれを取り込んで前記監視情報を確認し且つ分析して当該仮想マシンの動作状態の異常の有無を判定する異常状態判定機能、
    前記仮想マシンの動作が異常と判定された場合に稼動し前記仮想マシンの停止制御の可否及び停止制御後の再起動の可否を決定する仮想マシン用動作可否判定機能、
    を前記ホスト計算機が備えているコンピュータに実行させることを特徴とした仮想マシン運用管理プログラム。
  20. 請求項19に記載の仮想マシン運用管理プログラムにおいて、
    前記仮想マシンからの監視情報の受信に先立って前記仮想マシン側の仮想ライブラリを介して前記仮想マシン側に前記プロセスの状態の監視情報を要求する監視情報要求制御機能を前記ホスト計算機が備えているコンピュータに実行させることを特徴とした仮想マシン運用管理プログラム。
  21. ホスト計算機上で稼動する1以上の仮想マシンをホスト計算機側から運用管理する仮想マシン運用管理システムにあって、
    前記仮想マシンから当該仮想マシンのプロセスにかかる監視情報が送り込まれた場合にこれを前記ホスト計算機側の仮想マシン状態通知テーブルに記憶すると共にそれ以前に記憶されている格納内容を更新するテーブル更新処理機能、
    前記仮想マシン状態通知テーブルの更新内容を定期的に確認する更新内容確認機能、
    この仮想マシン状態通知テーブルの更新がなされていない場合に前記仮想マシンの動作を異常と判定する異常状態判定機能、
    前記仮想マシンの動作が異常と判定された場合に稼動し前記仮想マシンの停止制御の可否及び停止制御後の再起動の可否を決定する仮想マシン用動作可否判定機能、
    を前記ホスト計算機が備えているコンピュータに実行させることを特徴とした仮想マシン運用管理プログラム。










JP2008307869A 2008-12-02 2008-12-02 仮想マシン運用管理システム、その運用管理方法、及びプログラム Pending JP2010134557A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008307869A JP2010134557A (ja) 2008-12-02 2008-12-02 仮想マシン運用管理システム、その運用管理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008307869A JP2010134557A (ja) 2008-12-02 2008-12-02 仮想マシン運用管理システム、その運用管理方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2010134557A true JP2010134557A (ja) 2010-06-17

Family

ID=42345821

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008307869A Pending JP2010134557A (ja) 2008-12-02 2008-12-02 仮想マシン運用管理システム、その運用管理方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP2010134557A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011034403A (ja) * 2009-08-03 2011-02-17 Ntt Data Corp サービス実行装置、サービス実行方法
JP2013533556A (ja) * 2010-07-08 2013-08-22 シマンテック コーポレーション ゲスト仮想機械とやり取りするための技法
JP2013535745A (ja) * 2010-07-30 2013-09-12 シマンテック コーポレーション 高可用性仮想機械環境におけるアプリケーションの高可用性の提供
KR20150111609A (ko) * 2014-03-26 2015-10-06 에스케이텔레콤 주식회사 가상화 환경에서의 장애 처리 방법
JP2016151852A (ja) * 2015-02-17 2016-08-22 富士通株式会社 実行情報通知プログラム、情報処理装置および情報処理システム
US10733009B2 (en) 2017-05-16 2020-08-04 Fujitsu Limited Information processing apparatus and information processing method
CN117032881A (zh) * 2023-07-31 2023-11-10 广东保伦电子股份有限公司 一种虚拟机异常检测和恢复的方法、装置及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04257035A (ja) * 1991-02-12 1992-09-11 Fujitsu Ltd 仮想計算機システム配下における障害情報処理方式
JP2001229032A (ja) * 2000-02-15 2001-08-24 Matsushita Electric Ind Co Ltd アプリケーション自動復旧システム、アプリケーション自動復旧方法及びその記録媒体
JP2002082816A (ja) * 2000-09-07 2002-03-22 Hitachi Ltd 障害監視システム
JP2002259141A (ja) * 2001-03-01 2002-09-13 Nec Commun Syst Ltd Unix(登録商標)システムにおける自動プロセスリカバリ方式
JP2006171995A (ja) * 2004-12-14 2006-06-29 Mitsubishi Electric Corp 制御用計算機
JP2008186173A (ja) * 2007-01-29 2008-08-14 Toyota Motor Corp 障害監視システム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04257035A (ja) * 1991-02-12 1992-09-11 Fujitsu Ltd 仮想計算機システム配下における障害情報処理方式
JP2001229032A (ja) * 2000-02-15 2001-08-24 Matsushita Electric Ind Co Ltd アプリケーション自動復旧システム、アプリケーション自動復旧方法及びその記録媒体
JP2002082816A (ja) * 2000-09-07 2002-03-22 Hitachi Ltd 障害監視システム
JP2002259141A (ja) * 2001-03-01 2002-09-13 Nec Commun Syst Ltd Unix(登録商標)システムにおける自動プロセスリカバリ方式
JP2006171995A (ja) * 2004-12-14 2006-06-29 Mitsubishi Electric Corp 制御用計算機
JP2008186173A (ja) * 2007-01-29 2008-08-14 Toyota Motor Corp 障害監視システム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011034403A (ja) * 2009-08-03 2011-02-17 Ntt Data Corp サービス実行装置、サービス実行方法
JP2013533556A (ja) * 2010-07-08 2013-08-22 シマンテック コーポレーション ゲスト仮想機械とやり取りするための技法
JP2013535745A (ja) * 2010-07-30 2013-09-12 シマンテック コーポレーション 高可用性仮想機械環境におけるアプリケーションの高可用性の提供
KR20150111609A (ko) * 2014-03-26 2015-10-06 에스케이텔레콤 주식회사 가상화 환경에서의 장애 처리 방법
KR102174692B1 (ko) * 2014-03-26 2020-11-05 에스케이텔레콤 주식회사 가상화 환경에서의 장애 처리 방법
JP2016151852A (ja) * 2015-02-17 2016-08-22 富士通株式会社 実行情報通知プログラム、情報処理装置および情報処理システム
US10733009B2 (en) 2017-05-16 2020-08-04 Fujitsu Limited Information processing apparatus and information processing method
CN117032881A (zh) * 2023-07-31 2023-11-10 广东保伦电子股份有限公司 一种虚拟机异常检测和恢复的方法、装置及存储介质

Similar Documents

Publication Publication Date Title
JP4980792B2 (ja) 仮想計算機の性能監視方法及びその方法を用いた装置
US10133619B1 (en) Cluster-wide virtual machine health monitoring
US8402462B2 (en) Detection and management of dynamic migration of virtual environments
Araujo et al. Software aging in the eucalyptus cloud computing infrastructure: characterization and rejuvenation
US11140029B1 (en) Server side filtering in hybrid cloud environments
JP2010134557A (ja) 仮想マシン運用管理システム、その運用管理方法、及びプログラム
US20110004791A1 (en) Server apparatus, fault detection method of server apparatus, and fault detection program of server apparatus
US20140012721A1 (en) Managing use of lease resources allocated on fallover in a high availability computing environment
JP2008269194A (ja) 仮想計算機システム
JP2010086181A (ja) 仮想計算機システム及びその管理方法、プログラム並びに記録媒体
JP4811830B1 (ja) コンピュータリソース制御システム
CN105204977A (zh) 一种系统异常的捕获方法、主系统、影子系统及智能设备
JP2009075877A (ja) 情報処理システム、および監視方法
JP2013206379A (ja) クラスタ監視装置、クラスタ監視方法、及びプログラム
JP2012208752A (ja) ライセンス管理装置、ライセンス管理方法、及びプログラム
JP5597293B2 (ja) 計算機システム及びプログラム
JP2011243012A (ja) 仮想計算機システムのメモリダンプ取得方法
JP6828558B2 (ja) 管理装置、管理方法及び管理プログラム
US11700178B2 (en) System and method for managing clusters in an edge network
Volk et al. Towards intelligent management of very large computing systems
JP4495248B2 (ja) 情報処理装置、障害処理方法
JP5342660B2 (ja) 管理システム及びシステム管理方法及びプログラム
JP2009217709A (ja) 仮想マシン管理システムおよび計算機、並びに、プログラム
JP5832408B2 (ja) 仮想計算機システム及びその制御方法
JP5390651B2 (ja) 計算機システム及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111020

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130430

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130619

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140107

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140306

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140701