JP6111209B2 - 仮想マシン管理システム、仮想マシン管理方法、環境管理サーバ及びプログラム - Google Patents

仮想マシン管理システム、仮想マシン管理方法、環境管理サーバ及びプログラム Download PDF

Info

Publication number
JP6111209B2
JP6111209B2 JP2014019735A JP2014019735A JP6111209B2 JP 6111209 B2 JP6111209 B2 JP 6111209B2 JP 2014019735 A JP2014019735 A JP 2014019735A JP 2014019735 A JP2014019735 A JP 2014019735A JP 6111209 B2 JP6111209 B2 JP 6111209B2
Authority
JP
Japan
Prior art keywords
virtual machine
status
unit
monitoring
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014019735A
Other languages
English (en)
Other versions
JP2015148843A (ja
Inventor
健吾 河嶋
健吾 河嶋
裕子 猪川
裕子 猪川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone West Corp
Original Assignee
Nippon Telegraph and Telephone West Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone West Corp filed Critical Nippon Telegraph and Telephone West Corp
Priority to JP2014019735A priority Critical patent/JP6111209B2/ja
Publication of JP2015148843A publication Critical patent/JP2015148843A/ja
Application granted granted Critical
Publication of JP6111209B2 publication Critical patent/JP6111209B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、物理マシンによってエミュレートされる仮想マシンを管理する仮想マシン管理システム、仮想マシン管理方法、環境管理サーバ及びプログラムに関する。
複数のサーバによってサービスを実現するクラウドサービスにおいては、各サーバが正常に動作しているか否かを監視することが重要となっている。このようなクラウドサービスが、複数の物理マシンを1つの基盤として振る舞わせる仮想化基盤システムによって構築されている場合、各サーバは、物理マシンによってエミュレートされる仮想マシンによって実現される。
仮想化基盤システムにおいては、個々の物理マシンの余剰リソースを極力なくし、リソースを最適化することが求められており、仮想マシンの追加、構成変更、削除がなされる頻度が高い。このような仮想化基盤システムに構築されるクラウドサービスにおいて、各サーバの動作を監視するためには、仮想マシンの追加、構成変更、削除がなされる度に、オペレータによって監視を行う監視サーバの設定を変更する必要がある。
特許文献1には、被監視サーバのそれぞれが、当該被監視サーバの動作状態を監視サーバに通知する監視エージェントを備え、監視サーバが当該監視エージェントからの通知に基づいて各被監視サーバの監視を行う技術が開示されている。
特開2012−234336号公報
しかしながら、仮想化基盤システムに特許文献1に記載の技術を適用すると、仮想マシンに異常が発生した場合のみならず、オペレータが仮想マシンを意図的に削除しまたは停止した場合にも、当該仮想マシンからの通知が無いため監視サーバは被監視サーバに異常が発生したと判定することとなる。つまり、監視エージェントからの通知が無い場合に、仮想マシンに異常が発生しているのか、仮想マシンが意図的に削除されまたは停止されたのかを判定することができない。
監視サーバが、仮想マシンが意図的に削除されたにも関わらず、当該仮想マシンに異常が発生していると判定した場合、当該仮想マシンとの疎通不可に係るアラームを通知し続ける可能性がある。この場合、監視サーバからの通信が常時発生することとなるため、通信回線を逼迫する可能性がある。
第1の態様は、仮想マシンをエミュレートする物理マシンから、監視対象となる仮想マシンを稼働させているか否かを示す稼働状況を受信する状況受信部と、前記状況受信部が受信した稼働状況に基づいて、監視対象となる仮想マシンの識別情報を格納する監視設定情報を更新する設定更新部と、前記監視設定情報に格納された識別情報が示す仮想マシンに対し、当該仮想マシンの状態を示す状態情報の送信要求を送信する送信要求部と、前記仮想マシンから前記送信要求に応じて送信された状態情報を受信する状態受信部とを備える仮想マシン管理システムである。
また、第2の態様は、第1の態様において、前記送信要求部が送信要求を送信した仮想マシンのうち、前記状態受信部が状態情報を受信できない仮想マシンがある場合に、当該仮想マシンに異常が発生していると判定する異常判定部を備える仮想マシン管理システムである。
また、第3の態様は、第2の態様において、前記異常判定部が、前記仮想マシンに異常が発生していると判定した場合に、当該判定の正誤を判定する正誤判定部を備える仮想マシン管理システムである。
また、第4の態様は、第3の態様において、前記正誤判定部は、前記異常判定部が前記仮想マシンに異常が発生していると判定した場合に、前記状況受信部が受信した稼働状況に基づいて当該判定の正誤を判定する仮想マシン管理システムである。
また、第5の態様は、第3の態様において、前記正誤判定部は、前記異常判定部が前記仮想マシンに異常が発生していると判定した場合に、当該仮想マシンによる他のシステムの運用管理情報に基づいて当該判定の正誤を判定する仮想マシン管理システムである。
また、第6の態様は、第3から第5の何れかの態様において、前記設定更新部は、前記正誤判定部によって前記判定が誤っていると判定された場合に、前記監視設定情報を更新する仮想マシン管理システムである。
また、第7の態様は、仮想マシンをエミュレートする物理マシンから、監視対象となる仮想マシンを稼働させているか否かを示す稼働状況を受信するステップと、前記受信した稼働状況に基づいて、監視対象となる仮想マシンの識別情報を格納する監視設定情報を更新するステップと、前記監視設定情報に格納された識別情報が示す仮想マシンに対し、当該仮想マシンの状態を示す状態情報の送信要求を送信するステップと、前記仮想マシンから前記送信要求に応じて送信された状態情報を受信するステップとを含む仮想マシン管理方法である。
また、第8の態様は、仮想マシンをエミュレートする物理マシンから、監視対象となる仮想マシンを稼働させているか否かを示す稼働状況を受信する状況受信部と、前記状況受信部が受信した稼働状況に応じて、監視対象となる仮想マシンの識別情報を格納する監視設定情報に基づいて前記仮想マシンの監視を行う監視サーバに対し、当該監視設定情報の更新を指示する更新指示部とを備える環境管理サーバである。
また、第9の態様は、第8の態様において、前記監視サーバが、前記仮想マシンに異常が発生していると判定した場合に、当該判定の正誤を判定する正誤判定部を備える環境管理サーバである。
また、第10の態様は、コンピュータを、仮想マシンをエミュレートする物理マシンから、監視対象となる仮想マシンを稼働させているか否かを示す稼働状況を受信する状況受信部、前記状況受信部が受信した稼働状況に応じて、監視対象となる仮想マシンの識別情報を格納する監視設定情報に基づいて前記仮想マシンの監視を行う監視サーバに対し、当該監視設定情報の更新を指示する更新指示部として機能させるためのプログラムである。
上記態様のうち少なくとも1つの態様によれば、仮想マシンに搭載される監視エージェントではなく、仮想マシンをエミュレートする物理マシンから、監視対象となる仮想マシンの稼働状況を受信する。これにより、仮想マシンが意図的に削除されまたは停止されたものであるか否かを判定することができる。
第1の実施形態による仮想マシン管理システムの構成を示す概略図である。 第1の実施形態による仮想マシン管理システムのソフトウェア構成を示す概略ブロック図である。 監視設定情報及び稼働状況情報の例を示す図である。 第1の実施形態に係る仮想マシン管理システムによる仮想マシンの監視動作を示すフローチャートである。 第1の実施形態に係る仮想マシン管理システムによる監視設定情報の更新動作を示すフローチャートである。 第2の実施形態に係る仮想マシン管理システムのソフトウェア構成を示す概略ブロック図である。 判定テーブルの例を示す図である。 第2の実施形態に係る仮想マシン管理システムにおいて、監視サーバがアラームを発した時の動作を示すフローチャートである。 少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
《第1の実施形態》
以下、図面を参照しながら実施形態について詳しく説明する。
図1は、第1の実施形態による仮想マシン管理システム1の構成を示す概略図である。
仮想マシン管理システム1は、複数の物理マシン100と、監視サーバ200と、環境管理サーバ300とを備える。
各物理マシン100は、仮想マシンプログラムを実行することで、1つまたは複数の仮想マシン110をエミュレートする。また、各物理マシン100は、同一の仮想化基盤プログラムを実行することで、1つの仮想化基盤を構成する。これにより、仮想マシン管理システム1は、複数の物理マシン100間で仮想マシン110を移転させることができる。なお、図1は、仮想マシン管理システム1が2つの物理マシン100を備える例を示すが、これに限られない。例えば、仮想マシン管理システム1が備える物理マシン100の数は、3つ以上であっても良いし、1つであっても良い。
物理マシン100がエミュレートする各仮想マシン110は、監視エージェントプログラムを実行することで、当該仮想マシン110の状態を示す状態情報を監視サーバ200に送信する。仮想マシン110の状態情報とは、例えば、当該仮想マシン110のプロセスの死活、ログの監視、CPUやメモリなどのリソースの使用率、補助記憶装置の容量などが挙げられる。
監視サーバ200は、監視対象となる仮想マシン110に状態情報の送信要求を送信し、当該送信要求に応じて送信された状態情報に基づいて、各仮想マシン110の監視を行う。監視サーバ200は監視対象となる仮想マシン110の識別情報を格納する監視設定情報に基づいて、監視対象となる仮想マシン110を特定する。
環境管理サーバ300は、物理マシン100から、当該物理マシン100がエミュレートする仮想マシン110の稼働状況を確認する。仮想マシン110の稼働状況とは、当該仮想マシン110を稼働させているか、停止させているか、削除したかを示す情報である。また、環境管理サーバ300は、当該稼働状況に基づいて、監視サーバ200に対し、監視設定情報の更新を指示する。
図2は、第1の実施形態による仮想マシン管理システム1のソフトウェア構成を示す概略ブロック図である。
各物理マシン100は、仮想化基盤プログラムを実行することで、仮想マシン記憶部101と、仮想マシン制御部102と、稼働状況通知部103とを備える。
仮想マシン記憶部101は、仮想マシン110をエミュレートするための仮想マシンプログラムを記憶する。
仮想マシン制御部102は、仮想マシン記憶部101が記憶する仮想マシンプログラムを実行することで、仮想マシン110を起動(エミュレートを開始)する。
稼働状況通知部103は、仮想マシン制御部102がエミュレートする仮想マシン110の稼働状況を取得し、当該稼働状況を監視サーバ200に通知する。
監視サーバ200は、設定記憶部201と、送信要求部202と、状態受信部203と、異常判定部204と、設定更新部205とを備える。
設定記憶部201は、監視対象となる仮想マシン110の情報を格納する監視設定情報を記憶する。監視設定情報は、監視対象となる仮想マシン110の識別情報と、当該仮想マシン110をエミュレートする物理マシン100の識別情報と、当該仮想マシン110の稼働状況と、当該仮想マシン110の異常の有無と、当該仮想マシン110の状態情報とを格納する。
送信要求部202は、設定記憶部201が記憶する監視設定情報に基づいて、監視対象となる仮想マシン110に対し、状態情報の送信要求を送信する。具体的には、送信要求部202は、監視設定情報に格納される各識別情報が示す仮想マシン110に対し、状態情報の送信要求を送信する。
状態受信部203は、仮想マシン110から、送信要求に応じて送信された状態情報を受信する。
異常判定部204は、状態受信部203が受信した状態情報と設定記憶部201が記憶する監視設定情報とに基づいて、仮想マシン110の異常の有無を判定する。
設定更新部205は、環境管理サーバ300からの設定情報の更新指示に従って、設定記憶部201が記憶する監視設定情報を更新する。
環境管理サーバ300は、状況記憶部301、状況受信部302、更新指示部303を備える。
状況記憶部301は、物理マシン100がエミュレートする仮想マシン110の稼働状況を示す稼働状況情報を記憶する。稼働状況情報は、物理マシン100の識別情報と、当該物理マシン100がエミュレートする仮想マシン110の識別情報と、当該仮想マシン110の稼働状況とを格納する。
状況受信部302は、物理マシン100から当該物理マシン100がエミュレートする仮想マシン110の稼働状況を受信する。状況受信部302は、受信した稼働状況に基づいて状況記憶部301が記憶する稼働状況情報を更新する。
更新指示部303は、状況記憶部301が記憶する稼働状況情報が更新された場合に、監視設定情報の更新指示を監視サーバ200に出力する。
図3は、監視設定情報及び稼働状況情報の例を示す図である。
監視設定情報は、図3(A)に示すように、物理マシン名と仮想マシン名と稼働状況フラグと異常検出フラグとCPU使用率とメモリ使用率とを関連付けて格納する。なお、物理マシン名は、物理マシン100の識別情報の一例である。仮想マシン名は、仮想マシン110の識別情報の一例である。稼働状況フラグとは、仮想マシン110が稼働しているか否かを示すフラグである。つまり、稼働状況フラグが「1」を示す場合、物理マシン100上で仮想マシン110が稼働していることを示し、稼働状況フラグが「0」を示す場合、物理マシン100上で仮想マシン110が停止していることを示す。異常検出フラグとは、仮想マシン110に異常が検出されたか否かを示すフラグである。つまり、異常検出フラグが「1」を示す場合、仮想マシン110に異常が検出されたことを示し、異常検出フラグが「0」を示す場合、仮想マシン110に異常が検出されていないことを示す。CPU使用率とメモリ使用率は、仮想マシン110の状態情報の一例である。
稼働状況情報は、図3(B)に示すように、物理マシン名と仮想マシン名と稼働状況フラグとを関連付けて格納する。
なお、監視設定情報及び稼働状況情報にレコードが存在する仮想マシン110は、稼働の有無に関わらず物理マシン100に存在している。他方、監視設定情報及び稼働状況情報にレコードが存在しない仮想マシン110は、移転や削除などにより、物理マシン100に存在していない。
次に、本実施形態に係る仮想マシン管理システム1の動作について説明する。
図4は、第1の実施形態に係る仮想マシン管理システム1による仮想マシン110の監視動作を示すフローチャートである。
監視サーバ200は、定期的に仮想マシン110の状態情報を取得し、当該状態情報に基づいて仮想サーバの監視を行う。まず、監視サーバ200の送信要求部202は、設定記憶部201が記憶する監視設定情報に基づいて監視対象となる仮想マシン110を特定する(ステップS1)。具体的には、送信要求部202は、監視設定情報のレコードに含まれるそれぞれの仮想マシン110のうち、稼働状況フラグが「1」を示すものを、監視対象の仮想マシン110として特定する。
次に、送信要求部202は、特定した仮想マシン110のそれぞれに対し、状態情報の送信要求を送信する(ステップS2)。仮想マシン制御部102でエミュレートされる仮想マシン110が当該送信要求を受信すると、当該仮想マシン110が備える監視エージェントが当該仮想マシン110の状態を示す状態情報を生成し、監視サーバ200へ送信する。これにより、監視サーバ200の状態受信部203は、物理マシン100でエミュレートされる仮想マシン110から、状態情報を受信する(ステップS3)。次に、異常判定部204は、監視対象のすべての仮想マシン110から状態情報を受信したか否かを判定する(ステップS4)。
異常判定部204は、すべての仮想マシン110から状態情報を受信したと判定した場合(ステップS4:YES)、監視対象の仮想マシン110が全て稼働していると判定する(ステップS5)。他方、異常判定部204は、少なくとも1つの仮想マシン110から状態情報を受信していないと判定した場合(ステップS4:NO)、状態情報の受信が無い当該仮想マシン110に異常が発生していることを示すアラームを発する(ステップS6)。また、このとき異常判定部204は、設定記憶部201が記憶する監視設定情報のうち、状態情報の受信が無い仮想マシン110に関連付けられた異常検出フラグを「1」に書き換える。
上記処理により、監視サーバ200は、監視対象の仮想マシン110の監視を行う。
図5は、第1の実施形態に係る仮想マシン管理システム1による監視設定情報の更新動作を示すフローチャートである。
物理マシン100の稼働状況通知部103は、定期的に、仮想マシン制御部102がエミュレートする仮想マシン110の稼働状況を取得する(ステップS21)。これにより、稼働状況通知部103は、仮想マシン制御部102によってエミュレートされるすべての仮想マシン110について、稼働しているか停止しているかを特定することができる。また、オペレータによって意図的に削除された仮想マシン110は、仮想マシン制御部102によってエミュレートされないため、稼働状況通知部103が取得する稼働状況には、当該削除された仮想マシン110の稼働状況は含まれない。次に、稼働状況通知部103は、取得した稼働状況を環境管理サーバ300へ送信する(ステップS22)。
環境管理サーバ300の状況受信部302は、物理マシン100から稼働状況を受信すると、当該稼働状況に基づいて状況記憶部301が記憶する稼働状況情報を更新する(ステップS23)。具体的には、状況受信部302は、稼働状況情報が示す仮想マシン110のうち、状況受信部302が受信した稼働状況があるものについて、当該稼働状況に基づいて稼働状況フラグを更新する。他方、状況受信部302は、稼働状況情報が示す仮想マシン110のうち、状況受信部302が受信した稼働状況がないものについて、当該仮想マシン110を示すレコードを削除する。
更新指示部303は、状況記憶部301が記憶する稼働状況情報が更新されると、当該更新された稼働状況情報に基づいて、監視サーバ200に対し、当該監視サーバ200が記憶する監視設定情報の更新指示を送信する(ステップS24)。監視サーバ200の設定更新部205は、環境管理サーバ300から更新指示を受信すると、当該更新指示に従って設定記憶部201が記憶する監視設定情報を更新する(ステップS25)。つまり、オペレータによって意図的に削除された仮想マシン110のレコードは監視設定情報から削除され、稼働を停止している仮想マシン110の稼働状況フラグは「0」に書き換えられる。
上記ステップS1において、送信要求部202は、監視設定情報のレコードに含まれるそれぞれの仮想マシン110のうち、稼働状況フラグが「1」を示すものを、監視対象の仮想マシン110として特定するため、オペレータによって意図的に削除された仮想マシン110及び稼働を停止している仮想マシン110は、監視対象から外れる。したがって、存在が確認されている仮想マシン110に対してのみ送信要求が行われるため、上記ステップS6において仮想マシン110の削除に起因するアラームは発生しない。
このように、本実施形態によれば、環境管理サーバ300は、仮想マシン110に搭載される監視エージェントではなく、仮想マシン110をエミュレートする物理マシン100から、監視対象となる仮想マシン110の稼働状況を受信し、当該稼働状況に基づいて監視サーバ200に監視設定情報の更新を指示する。これにより、監視サーバ200は、状態情報を受信できなかった仮想マシン110が意図的に削除されまたは停止されたものであるか否かを判定することができる。これにより、仮想化基盤システムの提供者は、監視サービスの運用負荷を軽減し、監視サービスの品質を向上させることができる。また、仮想化基盤システムを用いたサービスの提供者は、サービスの変更に応じてタイムリーに監視設定情報の更新がなされるため、実サービスの運用状況に則した監視サービスを受けることができる。
また、監視設定情報の変更を自動的に行うことができるため、例えば節電を目的とした夜間のシステム縮退運用時には、人手を介すことなく仮想マシン110の縮退運用に追従した監視の設定変更が可能となる。
《第2の実施形態》
次に、第2の実施形態について説明する。第1の実施形態では、定期的に実行される監視設定情報の更新により、監視対象となる仮想マシン110の情報を最新の状態に保つ場合について説明した。第1の実施形態では、環境管理サーバ300によって稼働状況の確認を行う前に、異常判定部204が異常の判定を行った場合、アラームを発する可能性がある。そこで、第2の実施形態では、監視サーバ200がアラームを発した場合に、環境管理サーバ300が当該アラームの正誤を確認することで、誤ったアラームが継続して発せられることを防ぐ例について説明する。
図6は、第2の実施形態に係る仮想マシン管理システム1のソフトウェア構成を示す概略ブロック図である。
第2の実施形態に係る仮想マシン管理システム1は、第1の実施形態の構成に加え、環境管理サーバ300が正誤判定部304を備える。
正誤判定部304は、異常判定部204がアラームを発生た場合に、異常判定部204による判定の正誤を判定する。具体的には、正誤判定部304は、状況記憶部301が記憶する稼働状況を確認し、さらに当該仮想マシン110が利用する他のシステムの運用管理情報を確認することで、監視サーバ200による判定の正誤を判定する。正誤判定部304は、稼働状況の確認結果と他のシステムの運用管理情報の確認結果とを示す判定テーブルに基づいて、監視サーバ200による判定の正誤を判定する。
図7は、判定テーブルの例を示す図である。
判定テーブルは、故障判定依頼IDと、アラームを発した監視サーバ200の名称と、障害があると判定された仮想マシン110の名称と、当該仮想マシン110をエミュレートする物理マシン100の名称と、稼働状況確認結果フラグと、他システム確認結果フラグと、正誤判定フラグとを格納する。
稼働状況確認結果フラグとは、状況記憶部301が記憶する稼働状況情報が仮想マシン110が稼働していることを示すか否かを示すフラグである。つまり、稼働状況確認結果フラグが「0」を示す場合、稼働状況情報に基づいて仮想マシン110が稼働していることが確認されており、稼働状況確認結果フラグが「1」を示す場合、稼働状況情報に基づいて仮想マシン110が稼働していないことが確認されていることを示す。
他システム確認結果フラグとは、仮想マシン110が利用する他のシステムの運用管理情報が仮想マシン110が稼働していることを示すか否かを示すフラグである。つまり、他システム確認結果フラグが「0」を示す場合、他のシステムにおいて仮想マシン110が稼働していることが確認されており、他システム確認結果フラグが「1」を示す場合、他のシステムにおいて仮想マシン110が稼働していないことが確認されていることを示す。
正誤判定フラグとは、監視サーバ200が発したアラームの正誤を示すフラグである。つまり、正誤判定フラグが「0」を示す場合、監視サーバ200が発したアラームに誤りが無いことを示し、正誤判定フラグが「1」を示す場合、監視サーバ200が発したアラームが誤っていることを示す。
次に、第2の実施形態に係る仮想マシン管理システム1の動作について説明する。なお、定期的になされる仮想マシン110の監視動作及び監視設定情報の更新動作は、第1の実施形態と同様の手順で行う。
図8は、第2の実施形態に係る仮想マシン管理システム1において、監視サーバ200がアラームを発した時の動作を示すフローチャートである。
監視サーバ200の異常判定部204は、アラームを発すると、当該アラームの正誤判定指示を環境管理サーバ300に送信する(ステップS41)。環境管理サーバ300の正誤判定部304が正誤判定指示を受信すると、状況受信部302は、稼働状況の送信指示を物理マシン100に送信する(ステップS42)。
物理マシン100の稼働状況通知部103は、環境管理サーバ300から稼働状況の送信指示を受信すると、仮想マシン制御部102がエミュレートする仮想マシン110の稼働状況を取得し、当該稼働状況を環境管理サーバ300に送信する(ステップS43)。環境管理サーバ300の状況受信部302は、受信した稼働状況に基づいて状況記憶部301が記憶する稼働状況情報を更新する(ステップS44)。そして、正誤判定部304は、更新された稼働状況情報に基づいて、判定テーブルの稼働状況確認結果フラグを書き換える(ステップS45)。
また、正誤判定部304は、仮想マシン110が利用する他のシステムの運用管理機能に、当該仮想マシン110の稼働状況の送信指示を送信する(ステップS46)。他のシステムの運用管理機能は、当該送信指示に従って当該仮想マシン110の稼働状況を環境管理サーバ300に送信する。正誤判定部304は、他のシステムから仮想マシン110の稼働状況を受信すると(ステップS47)、当該稼働状況に基づいて、判定テーブルの他システム確認結果フラグを書き換える(ステップS48)。
そして、正誤判定部304は、判定テーブルの稼働状況確認結果フラグ及び他システム確認結果フラグの値に基づいて、監視サーバ200による異常の判定の正誤を判定する(ステップS49)。例えば、正誤判定部304は、判定テーブルの稼働状況確認結果フラグ及び他システム確認結果フラグの値の少なくとも一方が「1」を示す場合、正誤判定フラグを「1」に書き換え、両方が「0」を示す場合に正誤判定フラグを「0」に書き換えても良い。また例えば、正誤判定部304は、判定テーブルの稼働状況確認結果フラグ及び他システム確認結果フラグの値の両方「1」を示す場合、正誤判定フラグを「1」に書き換え、少なくとも一方が「0」を示す場合に正誤判定フラグを「0」に書き換えても良い。これは、仮想マシン管理システム1のオペレータによって適宜設定されることができる。これにより、オペレータの操作ログと連携させることなどにより、稼働状況確認結果フラグ及び他システム確認結果フラグと正誤判定との関係を適切に設定することで、判定の確実性を向上させることができる。
正誤判定部304は、監視サーバ200による異常の判定が誤っていないと判定した場合(ステップS49:正)、異常の判定が誤っていないことを示す判定結果を監視サーバ200に通知する(ステップS50)。これにより、監視サーバ200は、アラームの発信を継続する。
他方、正誤判定部304は、監視サーバ200による異常の判定が誤っていると判定した場合(ステップS49:誤)、異常の判定が誤っていることを示す判定結果を監視サーバ200に通知する(ステップS51)。また、この場合、ステップS44において状況記憶部301が記憶する稼働状況情報が書き換えられているため、監視サーバ200に対し、当該監視サーバ200が記憶する監視設定情報の更新指示を送信する(ステップS52)。これにより、監視サーバ200は、アラームの発信を停止させ、環境管理サーバ300から受信した更新指示に従って設定記憶部201が記憶する監視設定情報を更新する(ステップS53)。つまり、設定更新部205は、正誤判定部304によって判定が誤っていると判定された場合に、監視設定情報を最新の状態に更新することができる。
このように、本実施形態によれば、監視サーバ200がアラームを発した場合に、環境管理サーバ300が当該アラームの正誤を確認することで、誤ったアラームが継続して発せられることを防ぐことができる。
以上、図面を参照して一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、様々な設計変更等をすることが可能である。
例えば、上述した実施形態では、監視サーバ200と環境管理サーバ300とを別個に設ける場合について説明したが、これに限られず、例えば監視サーバ200と環境管理サーバ300とは同一のコンピュータに設けられていても良い。
また、上述した実施形態では、仮想マシン110が物理マシン100から削除された場合に、監視設定情報及び稼働状況情報のレコードを削除する例について説明したが、これに限られず、例えば監視設定情報及び稼働状況情報に、仮想マシン110が削除されたことを示すフラグを付すことで、仮想マシン110が物理マシン100から削除されたことを表しても良い。
また、上述した実施形態では、物理マシン100の稼働状況通知部103が定期的に稼働状況を環境管理サーバ300に送信する場合について説明したが、これに限られず、例えば環境管理サーバ300の状況受信部302が物理マシン100に定期的にポーリングを行い、稼働状況通知部103がこれに対する応答として稼働状況の通知を行っても良い。
図9は、少なくとも1つの実施形態に係るコンピュータ900の構成を示す概略ブロック図である。
コンピュータ900は、CPU901、主記憶装置902、補助記憶装置903、インタフェース904を備える。
上述の物理マシン100、監視サーバ200及び環境管理サーバ300は、コンピュータ900に実装される。そして、上述した各処理部の動作は、プログラムの形式で補助記憶装置903に記憶されている。CPU901は、プログラムを補助記憶装置903から読み出して主記憶装置902に展開し、当該プログラムに従って上記処理を実行する。また、CPU901は、プログラムに従って、上述した各記憶部に対応する記憶領域を主記憶装置902に確保する。
なお、少なくとも1つの実施形態において、補助記憶装置903は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例としては、インタフェースを介して接続される磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ900に配信される場合、配信を受けたコンピュータ900が当該プログラムを主記憶装置902に展開し、上記処理を実行しても良い。
また、当該プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、当該プログラムは、前述した機能を補助記憶装置903に既に記憶されている他のプログラムとの組み合わせで実現するもの、いわゆる差分ファイル(差分プログラム)であっても良い。
1…仮想マシン管理システム 100…物理マシン 200…監視サーバ 300…環境管理サーバ 101…仮想マシン記憶部 102…仮想マシン制御部 103…稼働状況通知部 110…仮想マシン 201…設定記憶部 202…送信要求部 203…状態受信部 204…異常判定部 205…設定更新部 301…状況記憶部 302…状況受信部 303…更新指示部 304…正誤判定部

Claims (10)

  1. 仮想マシンをエミュレートする物理マシンから、監視対象となる仮想マシンを稼働させているか否かを示す稼働状況を受信する状況受信部と、
    前記状況受信部が受信した稼働状況に基づいて、監視対象となる仮想マシンの識別情報を格納する監視設定情報を更新する設定更新部と、
    前記監視設定情報に格納された識別情報が示す仮想マシンに対し、当該仮想マシンの状態を示す状態情報の送信要求を送信する送信要求部と、
    前記仮想マシンから前記送信要求に応じて送信された状態情報を受信する状態受信部と
    を備える仮想マシン管理システム。
  2. 前記送信要求部が送信要求を送信した仮想マシンのうち、前記状態受信部が状態情報を受信できない仮想マシンがある場合に、当該仮想マシンに異常が発生していると判定する異常判定部
    を備える請求項1に記載の仮想マシン管理システム。
  3. 前記異常判定部が、前記仮想マシンに異常が発生していると判定した場合に、当該判定の正誤を判定する正誤判定部
    を備える請求項2に記載の仮想マシン管理システム。
  4. 前記正誤判定部は、前記異常判定部が前記仮想マシンに異常が発生していると判定した場合に、前記状況受信部が受信した稼働状況に基づいて当該判定の正誤を判定する
    請求項3に記載の仮想マシン管理システム。
  5. 前記正誤判定部は、前記異常判定部が前記仮想マシンに異常が発生していると判定した場合に、当該仮想マシンによる他のシステムの運用管理情報に基づいて当該判定の正誤を判定する
    請求項3に記載の仮想マシン管理システム。
  6. 前記設定更新部は、前記正誤判定部によって前記判定が誤っていると判定された場合に、前記監視設定情報を更新する
    請求項3から請求項5の何れか1項に記載の仮想マシン管理システム。
  7. 仮想マシンをエミュレートする物理マシンから、監視対象となる仮想マシンを稼働させているか否かを示す稼働状況を受信するステップと、
    前記受信した稼働状況に基づいて、監視対象となる仮想マシンの識別情報を格納する監視設定情報を更新するステップと、
    前記監視設定情報に格納された識別情報が示す仮想マシンに対し、当該仮想マシンの状態を示す状態情報の送信要求を送信するステップと、
    前記仮想マシンから前記送信要求に応じて送信された状態情報を受信するステップと
    を含む仮想マシン管理方法。
  8. 仮想マシンをエミュレートする物理マシンから、監視対象となる仮想マシンを稼働させているか否かを示す稼働状況を受信する状況受信部と、
    前記状況受信部が受信した稼働状況に応じて、監視対象となる仮想マシンの識別情報を格納する監視設定情報に基づいて前記仮想マシンの監視を行う監視サーバに対し、当該監視設定情報の更新を指示する更新指示部と
    を備える環境管理サーバ。
  9. 前記監視サーバが前記仮想マシンに異常が発生していると判定した場合に、当該判定の正誤を判定する正誤判定部
    を備える請求項8に記載の環境管理サーバ。
  10. コンピュータを、
    仮想マシンをエミュレートする物理マシンから、監視対象となる仮想マシンを稼働させているか否かを示す稼働状況を受信する状況受信部、
    前記状況受信部が受信した稼働状況に応じて、監視対象となる仮想マシンの識別情報を格納する監視設定情報に基づいて前記仮想マシンの監視を行う監視サーバに対し、当該監視設定情報の更新を指示する更新指示部
    として機能させるためのプログラム。
JP2014019735A 2014-02-04 2014-02-04 仮想マシン管理システム、仮想マシン管理方法、環境管理サーバ及びプログラム Active JP6111209B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014019735A JP6111209B2 (ja) 2014-02-04 2014-02-04 仮想マシン管理システム、仮想マシン管理方法、環境管理サーバ及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014019735A JP6111209B2 (ja) 2014-02-04 2014-02-04 仮想マシン管理システム、仮想マシン管理方法、環境管理サーバ及びプログラム

Publications (2)

Publication Number Publication Date
JP2015148843A JP2015148843A (ja) 2015-08-20
JP6111209B2 true JP6111209B2 (ja) 2017-04-05

Family

ID=53892178

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014019735A Active JP6111209B2 (ja) 2014-02-04 2014-02-04 仮想マシン管理システム、仮想マシン管理方法、環境管理サーバ及びプログラム

Country Status (1)

Country Link
JP (1) JP6111209B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105357038B (zh) * 2015-10-26 2019-05-07 北京百度网讯科技有限公司 监控虚拟机集群的方法和系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5425720B2 (ja) * 2010-06-21 2014-02-26 株式会社日立システムズ 仮想化環境監視装置とその監視方法およびプログラム
JP5360000B2 (ja) * 2010-06-22 2013-12-04 日本電気株式会社 仮想サーバ管理システムおよびその方法ならびに管理サーバ装置
JP5568776B2 (ja) * 2010-11-05 2014-08-13 株式会社日立製作所 計算機のモニタリングシステム及びモニタリング方法
JP5416156B2 (ja) * 2011-03-29 2014-02-12 株式会社日立システムズ 統合監視システム及び統合監視プログラム
JP5501278B2 (ja) * 2011-03-30 2014-05-21 株式会社エヌ・ティ・ティ・データ フィルタリング装置、フィルタリング方法、フィルタリングプログラム
JP5579650B2 (ja) * 2011-04-28 2014-08-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 監視対象プロセスを実行する装置及び方法

Also Published As

Publication number Publication date
JP2015148843A (ja) 2015-08-20

Similar Documents

Publication Publication Date Title
US10007586B2 (en) Deferred server recovery in computing systems
US11093353B2 (en) Virtual network system, VIM, virtual network control method and recording medium
CN104850416A (zh) 一种升级系统、方法、装置及云计算节点
CN108632106A (zh) 监控服务设备的系统
CN112764956A (zh) 数据库的异常处理系统、数据库的异常处理方法及装置
JP2010072951A (ja) サービス処理装置、システム、プログラム及び記録媒体
EP3301576A1 (en) Method and apparatus for monitoring logs of multi-tenant systems
JP2010128597A (ja) 情報処理装置及び情報処理装置の運用方法
JP6111209B2 (ja) 仮想マシン管理システム、仮想マシン管理方法、環境管理サーバ及びプログラム
US9317355B2 (en) Dynamically determining an external systems management application to report system errors
US9444698B2 (en) Computer-readable recording medium storing process for monitoring computer, its method and apparatus
WO2014147699A1 (ja) 管理装置、方法及びプログラム
JP6196505B2 (ja) クラウド制御システム、及びその制御プログラムの実行方法
JP2016009413A (ja) 網監視システムおよび網監視方法
US9880855B2 (en) Start-up control program, device, and method
JP5670935B2 (ja) 分散データ管理システムおよびその動作方法
JP7395908B2 (ja) 情報処理システム
JP5392367B2 (ja) 管理装置
CN110221869B (zh) 用于配置数据中心运行环境的方法及装置
JP2018060420A (ja) 情報処理システム、情報処理装置およびプログラム
JP6322332B2 (ja) エネルギー管理システムおよび業務アプリケーションの実行方法
JP6369255B2 (ja) 情報処理システム、情報処理装置、情報処理方法、及び、プログラム
JP5546883B2 (ja) 監視制御システム
JP2021006961A (ja) 情報処理システム及び影響範囲特定プログラム
JP2020008970A (ja) 情報処理装置、情報処理システム及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160317

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170313

R150 Certificate of patent or registration of utility model

Ref document number: 6111209

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250