JP2010009411A - 仮想化環境運用支援システム及び仮想環境運用支援プログラム - Google Patents

仮想化環境運用支援システム及び仮想環境運用支援プログラム Download PDF

Info

Publication number
JP2010009411A
JP2010009411A JP2008169336A JP2008169336A JP2010009411A JP 2010009411 A JP2010009411 A JP 2010009411A JP 2008169336 A JP2008169336 A JP 2008169336A JP 2008169336 A JP2008169336 A JP 2008169336A JP 2010009411 A JP2010009411 A JP 2010009411A
Authority
JP
Japan
Prior art keywords
virtual
failure
information
affected
configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008169336A
Other languages
English (en)
Other versions
JP4918668B2 (ja
Inventor
Ryosuke Sadakane
諒介 貞兼
Yukio Okuya
行央 奥谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Information Systems Ltd
Original Assignee
Hitachi Information Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Information Systems Ltd filed Critical Hitachi Information Systems Ltd
Priority to JP2008169336A priority Critical patent/JP4918668B2/ja
Publication of JP2010009411A publication Critical patent/JP2010009411A/ja
Application granted granted Critical
Publication of JP4918668B2 publication Critical patent/JP4918668B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】仮想化環境における仮想マシン影響範囲の特定。
【解決手段】障害が発生した物理デバイス47と論理デバイス48と仮想デバイス49と仮想マシン50との障害が発生した部位が他の部位に影響を及ぼす範囲を格納した影響範囲特定テーブル部100とを備え、仮想コンピュータシステム200から障害イベントが通知されたとき、該障害イベントにより通知された障害部位(物理デバイス,論理デバイス又は仮想デバイス)を基に前記影響範囲特定テーブル部100を参照して障害により影響がある仮想デバイスと論理デバイスと物理デバイスとの関係を抽出することによって、障害により影響が及ぼす可能性のある仮想マシンを特定する仮想化環境運用支援システム5。
【選択図】図5

Description

本発明は、複数の顧客に各種業務運用処理サービスを仮想化環境下で提供する仮想化コンピュータシステムにおける障害発生時に影響を及ぼす仮想マシンを容易に特定することができる仮想化環境運用支援システム及び仮想環境運用支援プログラムに関する。
一般に近年の業務処理コンピュータシステムは、ユーザニーズの多様化に伴う高付加価値サービスの提供並びにビジネスのグローバル化による顧客数の増加等を背景として、大規模化及び複雑化を招いている。これらの業務処理コンピュータシステムを運用するITアウトソーシングベンダーでは、大規模化、複雑化するコンピュータシステムを効率的かつ高品質に運用するため、統合監視システムやITIL(ITインフラストラクチャ・ライブラリ)をフレームワークとした運用支援システムの導入が進められている。
このような状況の中、障害発生時の監視運用業務を効率化するために、例えば下記特許文献1記載の技術が提案されており、この特許文献1には、監視対象機器と連絡先を一元管理し、障害内容と発生元から通知先、手段を確定し管理担当者に自動通知することによって、障害対応を迅速化し、高効率運用を実現する方法が記載されている。また下記特許文献2には、管理者がそれぞれ業務、機器、ネットワークの依存関係を予め定義し、その情報を合わせて構成情報リポジトリとして保持することにより、その障害によって受ける影響範囲の特定を自動で行うことを特徴とした方法が記載されている。これらの技術によって、従来の業務処理コンピュータシステムの監視運用業務では、従来必要であった人手による作業を極力削減することができ、高効率運用を実現している。
しかしながら、これらの従来技術を利用した運用では、監視対象機器の構成変更が頻繁に実施される業務処理コンピュータシステムでは、構成変更の都度、連絡先特定のためのルールや構成情報リポジトリの更新が必須となるため、通報の自動化や影響範囲の特定のための事前作業、具体的には構成変更に伴うルール定義の見直しや構成情報リポジトリの再構築を人手で実施する必要があり、効率化を図れないという不具合があった。特に、1台のサーバコンピュータ上で複数の仮想マシンを稼動させる仮想化技術を利用した業務処理コンピュータシステムにおいては、仮想マシンが動的に変化するため、障害により影響が及ぼされる仮想マシンの特定が困難であった。
これらの不具合は、仮想化技術を採用した業務処理コンピュータシステムの運用業務で顕在化し、監視運用業務の効率化および高品質運用の実現を阻害する要因となっている。
特開2005−275656号公報 特開2005−258501号公報
前述した仮想化技術を利用した業務処理コンピュータシステムは、リソースの有効活用や、システムの集約によるコスト削減、システム導入・構成変更の簡易化というメリットがあるものの、動的に構成が変化しうる仮想化環境内の構成を正確に把握することが困難なるため、障害が発生した場合の影響範囲の特定に時間がかかるという不具合がある。
即ち、構成が秒単位で動的に変化しうる仮想化環境を利用した従来の業務処理コンピュータシステムは、構成が変化するたびに実マシンへの依存関係を再定義しなければならず、障害発生時の影響範囲を人手にて確認する必要があること、更に影響範囲確認時点の構成と最新の構成に差異が生じる可能性があるため、管理者は障害発生時の構成と最新の構成を比較して差異を確認する必要があると言う不具合があった。
本発明の目的は、人手介入なしに構成情報の収集と表示および障害発生時の影響範囲の特定を行い、監視運用業務の効率化・高品質化を実現することができる仮想化環境運用支援システム及び仮想環境運用支援プログラムを提供することである。
前記目的を達成するために本発明は、複数の物理デバイス上で論理デバイスを用いて仮想デバイスを設定し、該仮想デバイスにより仮想マシンを動作させる仮想コンピュータシステムで発生した障害が及ぼす仮想マシンを特定する仮想化環境運用支援システムであって、
障害が発生した物理デバイスと該物理デバイスが影響を及ぼす論理デバイスを特定した第1関連情報と、障害が発生した論理デバイスと該論理デバイスが影響を及ぼす仮想デバイスを特定した第2関連情報と、障害が発生した仮想デバイスと該仮想デバイスが影響を及ぼす仮想マシンを特定した第3関連情報とを格納する影響範囲特定テーブル部と、
前記仮想コンピュータシステムから障害が発生した物理デバイス,論理デバイス又は仮想デバイスを特定する障害発生部位情報を受信し、該障害発生部位情報を基に前記影響範囲特定テーブル部を参照して前記障害が及ぼす仮想マシンを特定する制御部とを備え、
該制御部が、前記障害発生部位情報が仮想デバイスのとき、該仮想デバイスが影響を及ぼす仮想マシンを前記第3関連情報を参照して特定する工程を実行することを第1の特徴とする。
また本発明は、前記第1の特徴の仮想化環境運用支援システムにおいて、前記制御部が、前記障害発生部位情報が論理デバイスのとき、該論理デバイスが影響を及ぼす仮想デバイスを前記第2関連情報を参照して特定する工程と、該工程により特定した仮想デバイスが影響を及ぼす仮想マシンを前記第3関連情報を参照して特定する工程とを実行することを第2の特徴とする。
また本発明は、前記第2の特徴の仮想化環境運用支援システムにおいて、前記制御部が、前記障害発生部位情報が物理デバイスのとき、該物理デバイスが影響を及ぼす論理デバイスを前記第1関連情報を参照して特定する工程と、該工程により特定した論理デバイスが影響を及ぼす仮想デバイスを前記第2関連情報を参照して特定する工程と、該工程により特定した仮想デバイスが影響を及ぼす仮想マシンを前記第3関連情報を参照して特定する工程とを実行することを第3の特徴とする。
また本発明は、前記第3の特徴の仮想化環境運用支援システムにおいて、前記仮想コンピュータシステムが複数の仮想マシンを動作させるホストサーバを備え、前記仮想化環境運用支援システムが、該ホストサーバが複数の仮想マシンを動作させるための仮想デバイスと論理デバイスと物理デバイスの構成を表す構成情報を格納する構成情報管理データベースを備え、
前記制御部が、前記ホストサーバの複数の仮想マシンを動作させるための仮想デバイスと論理デバイスと物理デバイスの構成が変更されたとき、該変更された変更情報を検出する構成情報検出部と、該構成情報検出部により検出した変更情報と構成情報管理データベースに格納した構成情報とを比較し、該構成の差異を構成情報として構成情報管理データベースに格納することを第4の特徴とする。
また本発明は、前記第3又は4の特徴の仮想化環境運用支援システムにおいて、前記仮想コンピュータシステムが、制御部により表示内容が制御される表示部を備え、該制御部が、前記障害発生部位により影響が及ぼされることを特定した仮想デバイスと論理デバイスと物理デバイスとを前記表示部に表示することを第5の特徴とする。
更に本発明は、複数の物理デバイス上で論理デバイスを用いて仮想デバイスを設定し、該仮想デバイスにより仮想マシンを動作させる仮想コンピュータシステムの障害が影響を及ぼす仮想マシンを特定する仮想化環境運用支援システムのプログラムであって、
該仮想化環境運用支援システムが、障害が発生した物理デバイスと該物理デバイスが影響を及ぼす論理デバイスを特定した第1関連情報と、障害が発生した論理デバイスと該論理デバイスが影響を及ぼす仮想デバイスを特定した第2関連情報と、障害が発生した仮想デバイスと該仮想デバイスが影響を及ぼす仮想マシンを特定した第3関連情報とを格納する影響範囲特定テーブル部と、障害が発生した物理デバイス,論理デバイス又は仮想デバイスを特定する障害発生部位情報を基に前記影響範囲特定テーブル部を参照して前記障害が及ぼす仮想マシンを特定する制御部とを備え、
前記制御部に、前記障害発生部位情報が仮想デバイスのとき、該仮想デバイスが影響を及ぼす仮想マシンを前記第3関連情報を参照して特定する工程を実行させることを第6の特徴とする。
また本発明は、前記第6の特徴の仮想環境運用支援プログラムにおいて、前記制御部に、前記障害発生部位情報が論理デバイスのとき、該論理デバイスが影響を及ぼす仮想デバイスを前記第2関連情報を参照して特定する工程と、該工程により特定した仮想デバイスが影響を及ぼす仮想マシンを前記第3関連情報を参照して特定する工程とを実行させることを第7の特徴とする。
また本発明は、前記第7の特徴の仮想環境運用支援プログラムであって、前記制御部に、前記障害発生部位情報が物理デバイスのとき、該物理デバイスが影響を及ぼす論理デバイスを前記第1関連情報を参照して特定する工程と、該工程により特定した論理デバイスが影響を及ぼす仮想デバイスを前記第2関連情報を参照して特定する工程と、該工程により特定した仮想デバイスが影響を及ぼす仮想マシンを前記第3関連情報を参照して特定する工程とを実行させることを第8の特徴とする。
また本発明は、前記第8の特徴の仮想環境運用プログラムにおいて、前記仮想コンピュータシステムが複数の仮想マシンを動作させるホストサーバを備え、前記仮想化環境運用支援システムが、該ホストサーバが複数の仮想マシンを動作させるための仮想デバイスと論理デバイスと物理デバイスの構成を表す構成情報を格納する構成情報管理データベースを備え、
前記制御部に、前記ホストサーバの複数の仮想マシンを動作させるための仮想デバイスと論理デバイスと物理デバイスの構成が変更されたとき、該変更された変更情報を検出する構成情報検出部と、該構成情報検出部により検出した変更情報と構成情報管理データベースに格納した構成情報とを比較し、該構成の差異を構成情報として構成情報管理データベースに格納させることを第9の特徴とする。
また本発明は、前記第8又は9の特徴の仮想環境運用支援プログラムにおいて、前記仮想コンピュータシステムが、制御部により表示内容が制御される表示部を備え、該制御部に、前記障害発生部位により影響が及ぼされることを特定した仮想デバイスと論理デバイスと物理デバイスとを前記表示部に表示させることを第10の特徴とする。
本発明によれば、障害が発生した物理デバイスと該物理デバイスが影響を及ぼす論理デバイスを特定した第1関連情報と、障害が発生した論理デバイスと該論理デバイスが影響を及ぼす仮想デバイスを特定した第2関連情報と、障害が発生した仮想デバイスと該仮想デバイスが影響を及ぼす仮想マシンを特定した第3関連情報とを格納する影響範囲特定テーブル部を用意し、障害が発生した障害部位を基に前記影響範囲特定テーブル部を参照して障害により影響がある仮想デバイスと論理デバイスと物理デバイスとの関係を抽出することによって、障害により影響が及ぼされる仮想マシンを特定することができる。
以下、本発明による仮想環境運用支援プログラムを実行する仮想化環境運用支援システムの一実施形態を図面を参照して詳細に説明する。図1は本実施形態による仮想化環境運用支援システムが適用されるコンピュータシステムの全体構成図、図2は本実施形態による仮想化環境運用支援システムの基本構成を説明するための図、図3は仮想環境下のコンピュータシステムでイベントが発生した際のデータフローを示す図、図4は本実施形態による仮想環境運用支援プログラムが障害の影響範囲を特定するときのモデル図、図5は同障害の影響範囲を特定するときのフローを説明するための図、図6は本実施形態による格納部101〜105を説明するための図、図7は本実施形態による格納部106〜109を説明するための図、図8は本実施形態格納部101〜104のデータ例を示す図、図9は本実施形態による格納部105のデータ例を示す図、図10は本実施形態による格納部106〜109のデータ例を示す図である。
[構成]
本発明による仮想化環境運用支援システムが適用されるコンピュータシステムは、図1に示す如く、複数の仮想マシン2〜4を実行する実マシンであるホストサーバ1を備える仮想化環境の仮想化コンピュータ200と、該仮想化コンピュータ200の構成情報や障害情報の通知を受信する本実施形態の特徴である仮想化環境運用支援システム5と、該仮想化環境運用支援システム5と接続され、仮想化コンピュータ200の運用管理を行う運用管理サーバ6と、前記仮想化環境運用支援システム5及び運用管理サーバ6による障害情報や構成情報を表示するための管理コンソール(コンピュータ)8とから構成され、ホストサーバ1の数およびホストサーバ上で稼動する仮想マシンの数は運用業務の形態により増減するものとする。
このように構成されたコンピュータシステムにおいて、仮想化コンピュータ200内で障害が発生した場合、発生したその障害イベントが、ホストサーバ1から仮想化環境運用支援システム5に通知され、該仮想化環境運用支援システム5が、通知された障害イベント内容を基に、後述する構成管理データベース100を参照して仮想マシンの障害影響範囲を特定する。
この影響範囲を特定後、さらに仮想化環境運用支援システム5は、その特定した情報から影響範囲となる仮想マシンを対象とした障害イベントを新たに生成し、最初に通知された障害イベントと共に運用管理サーバ6へ通知する。この通知を受けた運用管理サーバ6の障害情報(イベント)を管理コンソール8が検知し、それぞれの障害イベントに対して、その内容と、影響範囲にあたる構成情報を管理コンソール8の表示部に表示する。
この表示を確認した運用管理者7は、その確認内容を基に障害が影響すると思われる顧客9〜10へ障害イベント発生の連絡並びに回避策・解決策を提供する。その後、実際に障害に対する問題が解決した段階で、一連の運用業務フローが終了となる。
このように本実施形態による仮想化環境運用支援システム5は、仮想化コンピュータ200からの障害イベント発生の通知を受け、この障害イベント内容に応じて障害が影響する可能性がある仮想マシンを特定し、この仮想マシンを使用している顧客に対する通知を運用管理者7に促すものであって、次に本実施形態による仮想化環境運用支援システム5の詳細を説明する。
本実施形態による仮想化環境運用支援システム5は、図2に示す如く、仮想化コンピュータ200におけるホストサーバ1/該ホストサーバ1の物理デバイス(例えばハードディスク装置,メモリ等の物理的機器)/該物理デバイスに割り当てられた論理デバイス(例えば、複数のハードディスク装置に論理的に割り当てられた論理的機器)/該論理デバイス上で動作する仮想マシン(例えば、顧客9の特定の業務アプリケーション)との関係を構成情報として管理する構成情報管理サーバ12と、これら構成情報の変化の推移を管理する構成情報管理サーバ13と、障害イベントの発生箇所に応じて該障害イベントが影響する範囲を分析する障害影響範囲分析サーバ14と、該障害影響範囲分析サーバ14により分析した影響範囲や構成情報を管理者7に表示するための影響範囲/構成差異情報表示サーバ15とから構成される。
[構成情報管理サーバ12]
前記構成情報管理サーバ12は、障害イベントの内容に応じて影響範囲を推定するための各種構成情報を格納する構成管理データベース100と、構成管理データベース100に登録されたホストサーバ/物理デバイス/論理デバイス/仮想マシン等の監視対象を検出する監視対象構成情報検出部16と、該監視対象構成情報検出部16からの監視対象(構成情報)を基に構成管理データベース100における監視対象の登録削除を指示する監視対象登録削除部17と、該監視対象登録削除部17からの指示を基に構成管理データベース100上の構成情報の登録削除を行う構成情報登録削除部18と、該構成情報登録削除部18による構成情報の推移を登録する構成情報変更履歴登録部20と、構成情報管理サーバ13からの通知を受けて構成情報の変化を構成管理データベース100に反映する構成変更反映部19とから構成される。
前記構成管理データベース100は、図6(a)に示す如き監視対象の仮想マシンが稼動するホストサーバ(上位機器)の識別子/ホスト名/IPアドレス/URL/ユーザ名/パスワード等の情報を格納する監視対象仮想マシンアクセス情報格納部101と、図6(b)に示す如きホストサーバ(上位機器)の識別子と該ホストサーバ上で稼動する仮想マシンの識別子との対応を格納する構成アイテム基本依存情報格納部102と、図6(c)に示す如き仮想マシン識別子に割り当てられたデバイス識別子/ストレージ識別子/ネットワーク識別子との対応による依存関係の情報(例えば、仮想マシン2〜3はサーバ1上で稼動するためにサーバ1に依存する、デバイス何々/ストレージ何々は仮想マシンが使用するため仮想マシンに依存する等の依存関係情報)を格納する物理/仮想依存情報格納部103と、図6(d)に示す如き物理デバイト又は論理デバイスかの識別子に割り当てられた該識別子に対するホスト名/IPアドレス/仮想マシン識別子/パス/OS等の各種情報を格納する物理/仮想マシン構成情報格納部104と、図6(e)に示す如きホストサーバ(上位機器)識別子に対応した仮想マシン識別子に障害が発生した際の送信先IPアドレスを格納する物理/仮想マシン設定情報格納部105とを備える。
更に構成管理データベース100は、図7(f)に示す如き論理/物理デバイス識別子に対応したデバイス名称/デバイス識別子/パスを格納する物理/仮想マシンデバイス情報格納部106と、図7(g)に示す如きストレージ(HDD)識別子に対応した名称/種別/ファイルシステム等の情報を格納する物理/仮想ストレージ構成情報格納部107と、図7(h)に示す如き仮想ネットワーク識別子に対応したネットワーク名称/スイッチ名称等の情報を格納する物理/仮想ネットワーク構成情報格納部108と、図7(i)に示す如き変更履歴管理用の識別子に対応した変更した構成アイテム名称/変更内容/変更前後の値等の情報を格納する変更履歴格納部109とから構成され、前記格納部101〜109に格納される具体的情報は、例えば図8〜図10に示す通りである。
前記監視対象構成情報検出部16は、監視対象とする仮想化環境内のホストサーバを構成情報管理データベースに登録するため、監視対象ホストサーバを含め、そのホストサーバ上で稼動する仮想マシンの情報を自動的に検出する機能を有する。
監視対象の登録/削除部17は、前記監視対象構成情報検出部16により取得した構成情報と構成管理データベース100に格納している構成情報とを比較し、前記取得した構成情報を構成管理データベース100に格納するため、そのホストサーバ1と該ホストサーバ1上で稼動する仮想マシン2〜4を監視対象として構成管理データベースに登録する機能と、ホストサーバ1を監視対象から除外するため、既存の構成情報を削除する機能と、前記両機能を管理者7が監視対象のマシンと監視対象外のマシンを任意に指定できる機能とを有する。
前記構成情報登録/削除部18は、監視対象となったホストサーバとそのホストサーバ上で稼動する仮想マシンの詳細な構成情報を登録する機能と、既に登録されている構成情報と照らし合わせ、共有するリソース/ネットワーク/ストレージを検索し、依存関係として登録する機能とを有する。
前記構成変更反映部19は、構成情報管理サーバ13から構成変更の通知があった場合、構成情報を取得するためホストサーバ1を参照し、そのときの構成情報と、既にデータベース100に登録されている構成情報とを照らし合わせ、構成変更が確認された場合はその情報を更新する機能を有する。
前記構成情報変更履歴登録部20は、前記構成変更反映部19により構成情報を反映(更新)した際に、前の構成情報を履歴として保存する機能を有する。
尚、本明細書における機能は、ソフトウェアにより当該機能を達成しても良いし、ハードウェアにより当該機能を達成しても良い。
[構成情報管理サーバ13]
前記構成情報管理サーバ13は、図2に示す如く、仮想マシンが稼動するホストサーバを監視し、ホストサーバ上で行われた仮想マシンに対する操作を検出する構成変更検出部21と、該構成変更検出部21が検出した操作内容を構成情報管理サーバ12及び運用管理サーバ6へ通知する構成変更通知部22とから成る。
[障害影響範囲分析サーバ14]
前記障害影響範囲分析サーバ14は、図2に示す如く、ホストサーバ1からの受信した障害イベントの検出及び転送を行う障害イベント検出転送部23と、当該障害イベント通知元の自動識別を行う障害イベント通知元自動識別部24と、障害発生部位(ホストサーバ/物理デバイス/論理デバイス/仮想デバイス/仮想マシン)の自動推定を行う障害発生部位自動特定部25と、障害イベントの発生によって影響を受けると推定される障害影響範囲(ホストサーバ/物理デバイス/論理デバイス/仮想デバイス/仮想マシン)の自動特定を行う障害影響範囲自動特定部26と、障害イベントの発生による障害影響範囲(同前)への自動通知を行う障害影響範囲自動通知部27と、前記部位24〜27の命令に応じて構成管理データベース100から構成情報を取得する構成情報取得部28と、前記部位24〜27の命令に応じて、構成間の依存関係情報(前述の物理/仮想依存情報格納部103に格納した依存関係情報)を取得する依存関係取得部29とから構成される。
前記障害イベント検出/転送部23は、ホストサーバ1から通知された障害イベントを検出し、それが監視対象の障害イベントであるか、監視対象外の障害イベントであるかを判別する機能と、監視対象外の障害イベントが通知されてきたとき、そのイベントを破棄するのではなく、そのまま運用管理サーバ6へ転送する機能と、対象とする障害イベントと対象外とする障害イベントが運用業務の種別によって異なるため、運用管理者が対象とする障害イベントを任意に指定できる機能とを有する。
また障害イベント通知元自動識別部24は、通知された障害イベントの内容を基に、その通知元がホストサーバであるか、もしくはホストサーバ上の仮想マシンのいずれかであるかを識別する機能とを有する。この機能の理由は、動的に変化する仮想化環境の構成において、通知された障害イベントからその通知元を確認するには、管理者の人手による作業では非常に煩雑な作業であり、当該作業が仮想化環境の規模が大きくなるに比例して作業も煩雑となることから、障害イベントの内容を基に、通知元を自動的に識別して、影響範囲分析および影響範囲への通知の判断要素とする機能が必要なためである。
前記障害発生部位自動特定部25は、障害イベント通知元自動識別部24と同様に、管理者の人手による作業を無くすために、通知された障害イベント内容から、障害内容を判断するキーとなる発生部位を特定する機能を有する。
前記障害影響範囲の自動特定部26は、障害イベント通知元自動識別部24により特定した障害イベント通知元と、障害発生部位自動特定部25により特定した障害発生部位を基に、予め定義されている検索パターンに当てはめて、影響範囲を自動的に特定する機能を有する。前記検索パターンは、障害発生部位自動特定部25により特定したキーに対して一意であり、影響範囲のマシンに対して障害イベントを送信するために必要な情報を生成するために設定されている。
前記障害影響範囲自動通知部27は、前記障害イベント通知元自動識別部24と障害発生部位自動特定部25と障害影響範囲自動特定部26に関し、障害イベントの通知元と障害発生部位と影響範囲の特定を行うため、構成管理データベース100から、構成情報取得部28と依存関係取得部29を用いることにより、各々の特定を実現することができる。
[影響範囲構成差異情報表示サーバ15]
前記影響範囲構成差異情報表示サーバ15は、図2に示す如く、前述した運用管理者7が顧客へ連絡する際に、仮想化環境内の障害における影響範囲を正確に把握するため、並びに障害発生時の構成情報と現在最新の構成情報に差異がないかを確認するために、構成管理データベース100からの情報を取得する構成情報取得部32及び依存関係取得部33と、構成差異を表示する構成差異表示部30と、影響範囲を表示する影響範囲表示部31とから構成される。
[動作]
前述の様に構成された本実施形態による仮想化環境運用支援システム5は、前述した様に、仮想化コンピュータ200内で障害イベントが発生した場合、当該障害イベントにより影響が及ぶと推定される仮想マシンの障害影響範囲を特定し、管理コンソール8に表示するものであって、この詳細動作を次に説明する。
本実施形態による仮想化環境運用支援システム5の障害イベント発生時の全体動作フローは、図3に示す如く、イベントの通知34が仮想化環境運用支援システム5に通知されたとき、仮想化環境運用支援システム5は、当該イベントが障害イベントか構成変更のイベントかを判定する工程と、該判定により障害イベントと判定されたとき、障害影響範囲分析サーバ3が影響範囲を特定して運用管理サーバ6へ通知する工程と、前記判定において構成変更のイベントとして判定されたとき、構成管理サーバ4が構成変更の内容を検出する工程と、この構成変更の内容を運用管理サーバ6へ通知する工程と、運用管理サーバ6が当該構成変更及び障害イベントの内容をログとして記録する工程とを実行する様に動作する。
前記運用管理サーバ6の仮想マシンに対する操作の例としては、例えば、仮想マシンの電源オン/仮想マシンの電源オフ/仮想マシンの追加(作成)/削除/他のホストサーバへの仮想マシンの移動/仮想ネットワークの追加/削除/仮想ディスクの追加/削除/仮想マシンの使用リソース(CPU、メモリ)の変更が挙げられ、上記のような構成の変更に対する操作を構成情報管理サーバ13が全て検出し、構成情報管理サーバ12へ通知し、この通知を受けた構成情報管理サーバ13は、その通知された情報を基に、構成が変更されたホストサーバ1の構成情報を参照し、保持している構成管理データベース100の内容を更新する。
[影響範囲特定手法]
特に本実施形態においては、ホストサーバ1から通知される障害発生イベントを基に当該障害による影響を受ける部位(ホストサーバ/物理デバイス/論理デバイス/仮想デバイス/仮想マシン)を特定するものであって、この障害影響範囲の特定動作の詳細を次に説明する。
まず、仮想化環境では前述した図3のようなモデルが想定され、それらの依存関係から、図4のように物理レイヤから仮想レイヤに向けて影響範囲を探索していく方法が考えられる。
例えば、図4に示す如く、物理デバイス42が障害の発生部位であるとイベントの通知がされたとき、該物理デバイス42に依存(符号h)しているホストサーバ41の特定並びに該物理デバイス42を経由(符号d)し且つ前記特定したホストサーバ41が動作(符号e)させている論理デバイス43を特定し、該論理デバイス43を経由(符号c)している仮想デバイス44を特定し、該仮想デバイス44が依存(符号b)している仮想マシン45とを特定することにより、障害の原因に対する影響範囲を特定していく様に動作する。
尚、図4における仮想デバイス44とは、例えば仮想ディスク/仮想NIC(Network Interface Card)/仮想CD−ROMであり、論理デバイス(パーティション)とは、例えば論理ボリューム/論理スイッチ/論理ネットワーク等であり、物理デバイス42とは、例えばストレージ(HDD)/物理NIC/CD−ROM等であり、リソース40とは、例えばメモリ/CPUであり、リソースループ39とはクラスタコンピュータリソース/コンピュータリソースである。
前記各構成部位の依存関係による影響を及ぼす関係は、図5(a)に示す如く、論理デバイス47の障害が論理デバイス48及びホストサーバ46に影響を及ぼし、論理デバイス48の障害が仮想デバイス49に影響を及ぼし、前記ホストサーバ46の障害が仮想マシン50に影響を及ぼすとの依存関係がある。
この障害発生部位と影響が及ぶ具体的な関係は、図5(b)に示す如く、障害発生箇所がホストサーバ自体の場合、該ホストサーバ上で稼動する全ての仮想マシンに影響を及ぼすことが推定され(ケース1)、ホストサーバの特定の物理デバイスに障害が発生した場合、該物理デバイス上で動作している論理デバイス→該論理デバイス上で動作している仮想デバイス→該仮想デバイス上で動作している仮想マシンに影響を及ぼすことが推定され(ケース1)、仮想マシンのホストサーバに障害が発生した場合、該ホストサーバ上で動作している仮想マシンに影響を及ぼすことが推定され(ケース2)、物理デバイスに障害が発生した場合、該物理デバイス上で動作している論理デバイス→ケース1と同様に論理デバイス→同仮想デバイス→仮想マシンに影響を及ぼすことが推定され(ケース5)であり、他のケースも図に表した通りである。
このように本実施形態による障害影響範囲分析サーバ14の障害影響範囲自動特定部26は、図5に示した影響範囲特定テーブルによって障害発生部位に応じて影響を及ぼすことが推定される部位を特定する様に動作するものである。
また本実施形態による障害影響範囲自動特定部26により特定した障害範囲(部位)を障害影響範囲自動通知部27が、影響範囲内のマシンの数だけ障害イベントを生成し、その障害イベントを運用管理サーバ6に自動的に通知する。
前記影響範囲/構成差異情報表示サーバ15は、構成情報取得部32及び依存関係取得部33により前記障害イベントが及ぼす影響範囲情報を取得し、運用管理者7が顧客9〜10へ障害発生連絡する際に、仮想化環境内の障害における影響範囲を正確に把握するため、さらに障害発生時の構成情報と、現在最新の構成情報に差異がないかを確認するために、構成差異表示部30に障害発生時の構成情報を表示し、影響範囲表示部31に影響を及ぼす範囲を表示するように動作する。
従って本実施形態による仮想化環境運用支援システム5は、仮想環境下におけるコンピュータシステムの障害発生部位と該障害発生部位の障害が影響を及ぼす範囲を推定するための推定テーブルを基に、障害により影響が及ぼされると推定される部位を特定することができる。
本発明の一実施形態による仮想化環境運用支援システムが適用されるコンピュータシステムの全体構成図。 本実施形態による仮想化環境運用支援システムの基本構成を説明するための図。 本実施形態による仮想環境下のコンピュータシステムでイベントが発生した際のデータフローを示す図。 本実施形態による仮想環境運用支援プログラムが障害の影響範囲を特定するときのモデル図。 本実施形態による仮想環境運用支援プログラムが障害の影響範囲を特定する影響範囲特定テーブルを説明するための図。 本実施形態による格納部101〜105を説明するための図。 本実施形態による格納部106〜109を説明するための図。 本実施形態格納部101〜104のデータ例を説明するための図。 本実施形態による格納部105のデータ例を説明するための図。 本実施形態による格納部106〜109のデータ例を説明するための図。
符号の説明
1:ホストサーバ、3:障害影響範囲分析サーバ、4:構成変更管理サーバ、5:仮想化環境運用支援システム、6:運用管理サーバ、7:運用管理者、8:管理コンソール、12:構成情報管理サーバ、13:構成変更管理サーバ、14:障害影響範囲分析サーバ、15:影響範囲構成差異表示サーバ、16:監視対象構成情報検出部、17:監視対象登録削除部、18:構成情報登録削除部、19:構成変更反映部、20:構成情報変更履歴登録部、21:構成変更検出部、22:構成変更通知部、23:障害イベント検出転送部、24:障害イベント通知元自動識別部、25:障害発生部位自動特定部、26:障害影響範囲自動特定部、27:障害影響範囲自動通知部、28:構成情報取得部、29:依存関係取得部、30:構成差異表示部、31:影響範囲表示部、32:構成情報取得部、33:依存関係取得部、41:ホストサーバ、42:物理デバイス、43:論理デバイス、44:仮想デバイス、45:仮想マシン、46:ホストサーバ、47:物理デバイス、48:論理デバイス、49:仮想デバイス、50:仮想マシン、100:構成管理データベース、101:監視対象仮想マシンアクセス情報格納部、102:構成アイテム基本依存情報格納部、103:仮想依存情報格納部、104:仮想マシン構成情報格納部、105:仮想マシン設定情報格納部、106:仮想マシンデバイス情報格納部、107:仮想ストレージ構成情報格納部、108:仮想ネットワーク構成情報格納部、109:変更履歴格納部、200:仮想化コンピュータ。

Claims (10)

  1. 複数の物理デバイス上で論理デバイスを用いて仮想デバイスを設定し、該仮想デバイスにより仮想マシンを動作させる仮想コンピュータシステムで発生した障害が及ぼす仮想マシンを特定する仮想化環境運用支援システムであって、
    障害が発生した物理デバイスと該物理デバイスが影響を及ぼす論理デバイスを特定した第1関連情報と、障害が発生した論理デバイスと該論理デバイスが影響を及ぼす仮想デバイスを特定した第2関連情報と、障害が発生した仮想デバイスと該仮想デバイスが影響を及ぼす仮想マシンを特定した第3関連情報とを格納する影響範囲特定テーブル部と、
    前記仮想コンピュータシステムから障害が発生した物理デバイス,論理デバイス又は仮想デバイスを特定する障害発生部位情報を受信し、該障害発生部位情報を基に前記影響範囲特定テーブル部を参照して前記障害が及ぼす仮想マシンを特定する制御部とを備え、
    該制御部が、前記障害発生部位情報が仮想デバイスのとき、該仮想デバイスが影響を及ぼす仮想マシンを前記第3関連情報を参照して特定する工程を実行する仮想化環境運用支援システム。
  2. 前記制御部が、前記障害発生部位情報が論理デバイスのとき、該論理デバイスが影響を及ぼす仮想デバイスを前記第2関連情報を参照して特定する工程と、該工程により特定した仮想デバイスが影響を及ぼす仮想マシンを前記第3関連情報を参照して特定する工程とを実行する請求項1記載の仮想化環境運用支援システム。
  3. 前記制御部が、前記障害発生部位情報が物理デバイスのとき、該物理デバイスが影響を及ぼす論理デバイスを前記第1関連情報を参照して特定する工程と、該工程により特定した論理デバイスが影響を及ぼす仮想デバイスを前記第2関連情報を参照して特定する工程と、該工程により特定した仮想デバイスが影響を及ぼす仮想マシンを前記第3関連情報を参照して特定する工程とを実行する請求項2記載の仮想化環境運用支援システム。
  4. 前記仮想コンピュータシステムが複数の仮想マシンを動作させるホストサーバを備え、前記仮想化環境運用支援システムが、該ホストサーバが複数の仮想マシンを動作させるための仮想デバイスと論理デバイスと物理デバイスの構成を表す構成情報を格納する構成情報管理データベースを備え、
    前記制御部が、前記ホストサーバの複数の仮想マシンを動作させるための仮想デバイスと論理デバイスと物理デバイスの構成が変更されたとき、該変更された変更情報を検出する構成情報検出部と、該構成情報検出部により検出した変更情報と構成情報管理データベースに格納した構成情報とを比較し、該構成の差異を構成情報として構成情報管理データベースに格納する請求項1から3何れかに記載の仮想化環境運用支援システム。
  5. 前記仮想コンピュータシステムが、制御部により表示内容が制御される表示部を備え、該制御部が、前記障害発生部位により影響が及ぼされることを特定した仮想デバイスと論理デバイスと物理デバイスとを前記表示部に表示する請求項3又は4何れかに記載の仮想化環境運用支援システム。
  6. 複数の物理デバイス上で論理デバイスを用いて仮想デバイスを設定し、該仮想デバイスにより仮想マシンを動作させる仮想コンピュータシステムの障害が影響を及ぼす仮想マシンを特定する仮想化環境運用支援システムのプログラムであって、
    該仮想化環境運用支援システムが、
    障害が発生した物理デバイスと該物理デバイスが影響を及ぼす論理デバイスを特定した第1関連情報と障害が発生した論理デバイスと、該論理デバイスが影響を及ぼす仮想デバイスを特定した第2関連情報と障害が発生した仮想デバイスと、該仮想デバイスが影響を及ぼす仮想マシンを特定した第3関連情報とを格納する影響範囲特定テーブル部と、
    障害が発生した物理デバイス,論理デバイス又は仮想デバイスを特定する障害発生部位情報を基に前記影響範囲特定テーブル部を参照して前記障害が及ぼす仮想マシンを特定する制御部とを備え、
    前記制御部に、前記障害発生部位情報が仮想デバイスのとき、該仮想デバイスが影響を及ぼす仮想マシンを前記第3関連情報を参照して特定する工程を実行させる仮想環境運用支援プログラム。
  7. 前記制御部に、前記障害発生部位情報が論理デバイスのとき、該論理デバイスが影響を及ぼす仮想デバイスを前記第2関連情報を参照して特定する工程と、該工程により特定した仮想デバイスが影響を及ぼす仮想マシンを前記第3関連情報を参照して特定する工程とを実行させる請求項6記載の仮想環境運用支援プログラム。
  8. 前記制御部に、前記障害発生部位情報が物理デバイスのとき、該物理デバイスが影響を及ぼす論理デバイスを前記第1関連情報を参照して特定する工程と、該工程により特定した論理デバイスが影響を及ぼす仮想デバイスを前記第2関連情報を参照して特定する工程と、該工程により特定した仮想デバイスが影響を及ぼす仮想マシンを前記第3関連情報を参照して特定する工程とを実行させる請求項7記載の仮想環境運用プログラム。
  9. 前記仮想コンピュータシステムが複数の仮想マシンを動作させるホストサーバを備え、前記仮想化環境運用支援システムが、該ホストサーバが複数の仮想マシンを動作させるための仮想デバイスと論理デバイスと物理デバイスの構成を表す構成情報を格納する構成情報管理データベースを備え、
    前記制御部に、前記ホストサーバの複数の仮想マシンを動作させるための仮想デバイスと論理デバイスと物理デバイスの構成が変更されたとき、該変更された変更情報を検出する構成情報検出部と、該構成情報検出部により検出した変更情報と構成情報管理データベースに格納した構成情報とを比較し、該構成の差異を構成情報として構成情報管理データベースに格納させる請求項6から8何れかに記載の仮想環境運用支援プログラム。
  10. 前記仮想コンピュータシステムが、制御部により表示内容が制御される表示部を備え、該制御部に、前記障害発生部位により影響が及ばされることを特定した仮想デバイスと論理デバイスと物理デバイスとを前記表示部に表示させる請求項8又は9記載の仮想環境運用支援プログラム。
JP2008169336A 2008-06-27 2008-06-27 仮想化環境運用支援システム及び仮想化環境運用支援プログラム Expired - Fee Related JP4918668B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008169336A JP4918668B2 (ja) 2008-06-27 2008-06-27 仮想化環境運用支援システム及び仮想化環境運用支援プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008169336A JP4918668B2 (ja) 2008-06-27 2008-06-27 仮想化環境運用支援システム及び仮想化環境運用支援プログラム

Publications (2)

Publication Number Publication Date
JP2010009411A true JP2010009411A (ja) 2010-01-14
JP4918668B2 JP4918668B2 (ja) 2012-04-18

Family

ID=41589804

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008169336A Expired - Fee Related JP4918668B2 (ja) 2008-06-27 2008-06-27 仮想化環境運用支援システム及び仮想化環境運用支援プログラム

Country Status (1)

Country Link
JP (1) JP4918668B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011101887A1 (ja) * 2010-02-16 2011-08-25 株式会社日立製作所 管理システム及び管理システムの制御方法
JP2011188422A (ja) * 2010-03-11 2011-09-22 Kddi Corp 影響サービスを特定する監視システムおよびその方法
JP2014026353A (ja) * 2012-07-25 2014-02-06 Nec Engineering Ltd サーバ管理システム、負荷分散装置及びサーバ管理方法
JPWO2015072004A1 (ja) * 2013-11-15 2017-03-09 株式会社日立製作所 計算機、計算機制御方法、および計算機制御プログラム
US9660883B2 (en) 2011-12-28 2017-05-23 Fujitsu Limited Computer product, monitoring method, and monitoring apparatus
WO2018135254A1 (ja) * 2017-01-18 2018-07-26 富士通株式会社 影響範囲特定プログラム、影響範囲特定方法、および影響範囲特定装置
JP2021026432A (ja) * 2019-08-02 2021-02-22 富士通株式会社 システム管理方法、システム管理プログラム、およびシステム管理装置
WO2021220434A1 (ja) * 2020-04-28 2021-11-04 株式会社日立製作所 事業影響範囲判定装置および方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002229806A (ja) * 2001-02-02 2002-08-16 Hitachi Ltd 計算機システム
JP2004295811A (ja) * 2003-03-28 2004-10-21 Hitachi Ltd ジョブ管理機能を有するストレージ系障害管理方法及び装置
JP2006085543A (ja) * 2004-09-17 2006-03-30 Hitachi Ltd 仮想計算機システム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002229806A (ja) * 2001-02-02 2002-08-16 Hitachi Ltd 計算機システム
JP2004295811A (ja) * 2003-03-28 2004-10-21 Hitachi Ltd ジョブ管理機能を有するストレージ系障害管理方法及び装置
JP2006085543A (ja) * 2004-09-17 2006-03-30 Hitachi Ltd 仮想計算機システム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011101887A1 (ja) * 2010-02-16 2011-08-25 株式会社日立製作所 管理システム及び管理システムの制御方法
US8555189B2 (en) 2010-02-16 2013-10-08 Hitachi, Ltd. Management system and management system control method
JP2011188422A (ja) * 2010-03-11 2011-09-22 Kddi Corp 影響サービスを特定する監視システムおよびその方法
US9660883B2 (en) 2011-12-28 2017-05-23 Fujitsu Limited Computer product, monitoring method, and monitoring apparatus
JP2014026353A (ja) * 2012-07-25 2014-02-06 Nec Engineering Ltd サーバ管理システム、負荷分散装置及びサーバ管理方法
JPWO2015072004A1 (ja) * 2013-11-15 2017-03-09 株式会社日立製作所 計算機、計算機制御方法、および計算機制御プログラム
WO2018135254A1 (ja) * 2017-01-18 2018-07-26 富士通株式会社 影響範囲特定プログラム、影響範囲特定方法、および影響範囲特定装置
JP2018116444A (ja) * 2017-01-18 2018-07-26 富士通株式会社 影響範囲特定プログラム、影響範囲特定方法、および影響範囲特定装置
US10977108B2 (en) 2017-01-18 2021-04-13 Fujitsu Limited Influence range specifying method, influence range specifying apparatus, and storage medium
JP2021026432A (ja) * 2019-08-02 2021-02-22 富士通株式会社 システム管理方法、システム管理プログラム、およびシステム管理装置
WO2021220434A1 (ja) * 2020-04-28 2021-11-04 株式会社日立製作所 事業影響範囲判定装置および方法

Also Published As

Publication number Publication date
JP4918668B2 (ja) 2012-04-18

Similar Documents

Publication Publication Date Title
US11048688B2 (en) Deleting configuration items in a configuration management database
JP4918668B2 (ja) 仮想化環境運用支援システム及び仮想化環境運用支援プログラム
US8799709B2 (en) Snapshot management method, snapshot management apparatus, and computer-readable, non-transitory medium
US9740546B2 (en) Coordinating fault recovery in a distributed system
TWI548987B (zh) 用於藉由提供預先建立環境之即時有效性來部署用於測試之環境的方法、系統、及電腦可讀取儲存裝置
JP2021089745A (ja) 処理環境の統合監視および制御
JP5719974B2 (ja) 複数の監視対象デバイスを有する計算機システムの管理を行う管理システム
US7698545B1 (en) Computer configuration chronology generator
US8006134B2 (en) Method for analyzing fault caused in virtualized environment, and management server
US9189224B2 (en) Forming an upgrade recommendation in a cloud computing environment
US9495234B1 (en) Detecting anomalous behavior by determining correlations
JP2010009552A (ja) ソフトウェア構成要素をバックアップするためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム
JP6009089B2 (ja) 計算機システムを管理する管理システム及びその管理方法
EP3304450A1 (en) Automated network control
US20100318859A1 (en) Production control for service level agreements
JP5740338B2 (ja) 仮想環境運用支援システム
US20130311646A1 (en) Management method and management system
Chen et al. Survivability modeling and analysis of cloud service in distributed data centers
JP2005258501A (ja) 障害影響範囲解析システム及び障害影響範囲解析方法及びプログラム
US20230088318A1 (en) Remotely healing crashed processes
JP2019140496A (ja) オペレーション装置およびオペレーション方法
JP2007164494A (ja) 情報出力方法、システム及びプログラム
WO2016120989A1 (ja) 管理計算機及びルールの試験方法
CN102841842B (zh) 用于下一代测试系统的自动化控制器
US11159358B2 (en) Sentry for information technology system blueprints

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20091205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110201

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111019

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111129

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20111227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111228

R150 Certificate of patent or registration of utility model

Ref document number: 4918668

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150210

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees