JP2009151509A

JP2009151509A - 計算機装置

Info

Publication number: JP2009151509A
Application number: JP2007328215A
Authority: JP
Inventors: Takeshi Higuchi; 毅樋口
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2007-12-20
Filing date: 2007-12-20
Publication date: 2009-07-09
Anticipated expiration: 2027-12-20
Also published as: JP4999670B2

Abstract

【課題】仮想計算機環境において、ホストＯＳにてゲストＯＳからの障害発生の情報を集約する。
【解決手段】ホストＯＳ２２上のホスト障害監視制御エージェント２２１のＩＰ通知部２２１１が、ホストＯＳ２２のＩＰアドレスの情報をゲスト障害監視制御エージェント２３１に送信し、ゲスト２３ＯＳ上のゲスト障害監視制御エージェント２３１のＩＰ受信部２３１１がホストＯＳ２２のＩＰアドレス情報を受信し、また、障害報告部２３１４が、障害を検出した際に検出した障害を通知する障害情報を生成し、ホストＯＳ２２のＩＰアドレスに基づき、生成した障害情報をホスト障害監視制御エージェント２２１に対して送信するため、各ゲスト障害監視制御エージェント２３１による障害情報の送信先をホスト障害監視制御エージェント２２１に集約することができる。
【選択図】図１

Description

本発明は、計算機における障害監視技術に関し、特に仮想計算機における障害監視技術に関する。

計算機における障害監視システムは、物理計算機とＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）が１対１に対応しているため、各ＯＳ上に配備されている障害監視用のエージェントが障害監視ツールに対して通知を行うことができる。
一方、仮想計算機環境においては、仮想計算機上に配備されているゲストＯＳからそれぞれ障害通知が行われると、物理計算機のハードウェアの障害が各ゲストＯＳから通知されるなどの問題が発生する。
このため、特許文献１では、特定の統合管理エージェントにて集約を行うことにより、１台の物理計算機からの通知を集約できる技術が開示されている。
また、計算機におけるハードウェアの障害や予期せぬ動作に対する試験は、特許文献２にあるように実際のハードウェアの応答を、装置やソフトウェアによって変更することにより、ハードウェアの障害を擬似的に発生させ、その結果を基に業務プログラムに通知し、障害発生運用への切り替えの動作を確認可能とするものであった。
特開２００２−２２９８０６号公報特開２００２−３５１７５５号公報

仮想計算機環境は、複数のＯＳを独立して仮想的に動作させる環境であるため、これまで複数の拠点に配備されていた物理計算機環境を１台の物理計算機上に配備することが可能となる。このため、仮想計算機環境上に配備されたそれぞれのゲストＯＳは、個別のネットワークに接続される形態となることがある。
このため、必ずしも同じ物理計算機上に配備されているゲストＯＳ間やゲストＯＳとホストＯＳの間の通信が行われるとは限らないため、ネットワーク上の通信経路が物理的にも仮想的にも存在していない可能性がある。

また、ゲストＯＳは追加が行われる可能性があり、追加されるたびに障害情報を集約するためのホストＯＳへの通信のための情報の設定を実施する必要があるという課題がある。

さらに、従来のコンピュータシステムの試験方法を仮想計算機上で実行した場合、それぞれの障害発生の指示や障害検知結果の収集はそれぞれのネットワーク上で実施する必要があった。
しかし、仮想計算機環境では、ハードウェアからの障害を受信したホストＯＳは、そのデータをホストＯＳ上で処理する場合やエミュレートしてゲストＯＳに通知することで、ゲストＯＳ上で障害が検出される場合があり、実際にどこで障害がどのような手段にて検知されるかわからないという課題がある。
ハードウェアの障害が発生した場合、エラーの種類や発生箇所により、ホストＯＳ上では検知されず、ゲストＯＳからのリクエストに対するエラーとして通知されることで障害と判断できるものやホストＯＳ上で検知され、障害と判断できるものがあるため、どのような手段で障害が検知されるかがわからない。例えば、ディスク故障が発生した場合、完全に停止してしまうとゲストＯＳが停止してしまうため、ホストで検知される。他方、一部のエリアに障害が発生し、そのエリアにアクセスした場合に、そのアクセスの結果エラーと認識できる場合は、ゲストＯＳで検知される。このように、ハードウェア障害がホストＯＳで検知される場合とゲストＯＳで検知される場合の両方がある。
このことは、試験による擬似的な障害の検知に限らず、実際の障害の検知においても同様である。

また、どのようなＩ／Ｏ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）がホストＯＳ上で処理され、どのようなＩ／Ｏがエミュレートされるかは仮想化実装方式によって異なるため、個別に対応することは困難である。
また、ゲストＯＳを識別する情報は仮想計算機管理機構が独自に持つ情報（例えば、ドメインＩＤ（ＩｄｅｎｔｉｆｉｃａｔｉｏｎＤａｔａ））であることから、ホスト名やＩＰ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ）アドレスといった識別情報では、ゲストＯＳを特定させることが出来ないという課題もある。

この発明は上記のような課題を解決することを主な目的の一つとし、ホストＯＳにてゲストＯＳからの障害発生の情報を集約する障害管理方式を提供することを目的の一つとする。

また、ユーザの指示に基づいて、仮想的な障害を特定のゲストＯＳに対して発生させることを可能とした試験システムを提供することを目的の一つとする。

本発明に係る計算機装置は、
仮想計算機を実現する仮想計算機管理機構を搭載し、前記仮想計算機管理機構上でホストＯＳと一つ以上のゲストＯＳとが動作し、各ゲストＯＳに割当てられる記憶領域を有する計算機装置であって、
前記ホストＯＳの通信アドレスが設定され、各ゲストＯＳで検出された障害を通知する障害情報の宛先アドレスとして前記ホストＯＳの通信アドレスを通知する通信アドレス情報を送信し、各ゲストＯＳで検知された障害を通知する障害情報を受信する第一の障害監視制御部と、
第一の障害監視制御部から通信アドレス情報を受信し、受信した通信アドレス情報に示される前記ホストＯＳの通信アドレスを、対応するゲストＯＳに割当てられている記憶領域に格納し、対応するゲストＯＳにおいて障害が検出された際に検出された障害を通知する障害情報を生成し、記憶領域に格納されている前記ホストＯＳの通信アドレスを宛先アドレスとし、生成した障害情報を前記第一の障害監視制御部に対して送信する一つ以上の第二の障害監視制御部とを有することを特徴とする。

本発明によれば、第一の障害監視制御部がホストＯＳの通信アドレスの情報を各ゲストＯＳに対応する第二の障害監視制御部に送信し、各ゲストＯＳに対応する第二の障害監視制御部が、障害を通知する障害情報を生成し、ホストＯＳの通信アドレスに基づき、生成した障害情報を第一の障害監視制御部に対して送信するため、障害情報の送信先を第一の障害監視制御部に集約することができる。

実施の形態１．
本実施の形態では、ホストＯＳにてゲストＯＳからの障害発生の情報を集約できるよう、ネットワーク構成の確認や通知先であるホストＯＳの情報をゲストＯＳに通知可能とすることにより、障害発生の情報を集約し、ホストＯＳ、ゲストＯＳのいずれにおいて検出されるような障害であっても、どこでどのような手段にて検知したかを把握可能とする障害管理方式を説明する。

図１は、本実施の形態に係る仮想計算機環境における障害管理方式を説明する構成図である。
図に示すように、本実施の形態では、障害監視装置１、物理計算機２−１〜２−ｎを備えている。障害監視装置１、物理計算機２−１〜２−ｎのホストＯＳは通信回線３を介して接続され、ゲストＯＳは通信回線４を介して接続されている仮想計算機システムを前提にして説明する。
物理計算機２−１〜２−ｎは、計算機装置の例である。

障害監視装置１は、各システムに導入されている市販されているものやシステムにて自製された障害監視ツールが導入された端末装置である。

物理計算機２−１〜２−ｎは、仮想計算機管理機構２０が搭載された計算機であり、仮想計算機管理機構２０上でホストＯＳ２２と１つ以上のゲストＯＳが動作する。
ホストＯＳ２２は、各ゲストＯＳのＩ／Ｏのエミュレート等を実施する。
ゲストＯＳ２３は、アプリケーションプログラムの実行等を行う。
ホストＯＳ２２、ゲストＯＳ２３は、仮想ネットワーク２１で接続される。
また、仮想計算機管理機構２０は、仮想マシンモニタとも呼ばれる。

通信回線３、４は、例えばイントラネット、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）等のネットワークであり、互いに独立したネットワークで、相互通信を行うことは出来ない。

ホストＯＳ２２上には、障害が発生したことにより発生する事象を監視し、情報を取得するホスト障害監視制御エージェント２２１が搭載されている。
ゲストＯＳ２３上には障害が発生したことにより発生する事象を監視し、情報を取得するゲスト障害監視制御エージェント２３１が搭載されている。

ホスト障害監視制御エージェント２２１には、ホストＯＳ２２のＩＰアドレス（通信アドレス）が設定されている。
ホスト障害監視制御エージェント２２１は、同じ仮想計算機管理機構２０上で動作する各ゲストＯＳ２３に対して、各ゲストＯＳで検出された障害を通知する障害情報の宛先アドレスとしてホストＯＳ２２のＩＰアドレスの情報を送信し、同じ仮想計算機管理機構２０上で動作する各ゲストＯＳ２３から障害情報を受信する。
ホスト障害監視制御エージェント２２１は、第一の障害監視制御部の例である。

ゲスト障害監視制御エージェント２３１は、ホスト障害監視制御エージェント２２１からホストＯＳ２２のＩＰアドレスの情報を受信し、障害を検出した際に検出した障害を通知する障害情報を生成し、ホストＯＳ２２のＩＰアドレスを宛先アドレスとして、生成した障害情報をホスト障害監視制御エージェント２２１に対して送信する。
また、物理計算機２には、ゲストＯＳに割当てられるメモリの物理的な記憶領域（不図示）があり、ゲスト障害監視制御エージェント２３１は、ホストＯＳのＩＰアドレスの情報を受信した際に、ホストＯＳ２２のＩＰアドレスを、自身（ゲストＯＳ）に割当てられるメモリの記憶領域に格納する。ゲスト障害監視制御エージェント２３１は、エミュレートされた仮想メモリ（ファイル）を自身の物理メモリとして認識しており、ゲスト障害監視制御エージェント２３１は、自身に割当てられている仮想メモリの記憶領域にホストＯＳのＩＰアドレスを格納する処理を行うことで、ホストＯＳ２２、仮想計算機管理機構２０を介して、自身に割当てられている物理メモリの記憶領域にホストＯＳ２２のＩＰアドレスを格納することができる。
また、障害情報を送信する際も、自身に割当てられている仮想メモリの記憶領域からホストＯＳのＩＰアドレスを読み込む処理を行うことで、ホストＯＳ２２、仮想計算機管理機構２０を介して、自身の物理メモリの記憶領域からホストＯＳ２２のＩＰアドレスを読み込むことができる。
ゲスト障害監視制御エージェント２３１は、第二の障害監視制御部の例である。

このような機構により、各物理計算機２では、各ゲスト障害監視制御エージェント２３１による障害情報の送信先をホスト障害監視制御エージェント２２１に集約している。
また、ホスト障害監視制御エージェント２２１は、各ゲスト障害監視制御エージェント２３１から受信した障害情報にホストＯＳ２２の識別情報を付加し、ホストＯＳ２２の識別情報が付加された障害情報を障害監視装置１に対して送信する。

ホスト障害監視制御エージェント２２１において、２２１１は、ゲストＯＳ２３のＩＰアドレスの検索を行い、ホストＯＳ２２のＩＰアドレス情報をゲストＯＳ２３に通知するＩＰ通知部である。
２２１２は、障害検知部２２１３あるいはゲスト障害監視制御エージェント２３１からの障害発生情報を受信する情報受信部である。
２２１３は、ホストＯＳ２２やゲストＯＳ２３で発生した障害に基づき発生する動作を監視し、障害発生の検知を行う障害検知部である。
２２１４は、情報受信部２２１２からのゲストＯＳの障害情報や障害検知部２２１３からのホストＯＳの障害情報を障害監視装置１が解析可能な情報に変換し、通知を行う障害報告部である。

ゲスト障害監視制御エージェント２３１において、２３１１は、ホストＯＳ２２のＩＰアドレス情報を受信し、その情報を基に障害情報の報告をホストＯＳ２２に対して実施可能とするＩＰ受信部である。
２３１２は、障害検知部２３１３からの障害発生情報を受信する情報受信部である。
２３１３は、ホストＯＳ２２やゲストＯＳ２３で発生した障害に基づき発生する動作を監視し、障害発生の検知を行う障害検知部である。
２３１４は、障害検知部２３１３にて収集した障害情報をホスト障害監視制御エージェント２２１に通知する障害報告部である。

図２、図３は、実施の形態１の仮想計算機環境における障害管理方式の処理動作を示すフローチャートである。
まず、図２を用いてホストＯＳ２２上のホスト障害監視制御エージェント２２１の動作について説明する。

ホスト障害監視制御エージェント２２１が起動すると、ＩＰ通知部２２１１は、仮想計算機管理機構２０が提供するゲストＯＳ２３の情報からゲストＯＳ２３のＭＡＣ（ＭｅｄｉａＡｃｃｅｓｓＣｏｎｔｒｏｌ）アドレスを取得し、ａｒｐ（ＡｄｄｒｅｓｓＲｅｓｏｌｕｔｉｏｎＰｒｏｔｏｃｏｌ）コマンド等やホストＯＳ２２が持つネットワークＩ／Ｆ（Ｉｎｔｅｒｆａｃｅ）にて取りうるアドレスリストを生成し、ｐｉｎｇ等のＩＣＭＰ（ＩｎｔｅｒｎｅｔＣｏｎｔｒｏｌＭｅｓｓａｇｅＰｒｏｔｏｃｏｌ）のコマンドを用いてネットワークアクセスを行い、ノードの到達を確認してＭＡＣアドレスとＩＰアドレスの対応情報を取得する（ＳＴ１０１）。
つまり、ホスト障害監視制御エージェント２２１は、仮想計算機管理機構２０から提供される各ゲストＯＳ２３のドメインＩＤと各ゲストＯＳ２３のＭＡＣアドレスとの対応づけ情報に基づき、各ゲストＯＳ２３のＩＰアドレスを取得し、取得した各ゲストＯＳ２３のＩＰアドレスを用いて、各ゲストＯＳ２３にホストＯＳ２２のＩＰアドレスの情報を送信する。
例えば、仮想計算機管理機構２０がＸｅｎ（登録商標）に従って構成されている場合は、ＩＰ通知部２２１１は、Ｘｅｎに用意されているｘｍコマンドの結果として得られるＭＡＣアドレスの情報と、ＩＰアドレスとＭＡＣアドレスの対応情報（ａｒｐコマンドの出力）を基に対応を調べて導出する。
Ｘｅｎの場合、仮想計算機管理機構２０は、ドメインという概念でホストＯＳやゲストＯＳを管理しており、特定のゲストＯＳを識別するためにはドメイン名やドメインＩＤといった識別情報を利用する必要がある。この情報は仮想計算機管理機構２０の内部で管理されているものである。
図１６（ａ）はｘｍコマンドの出力例を示し、図１６（ｂ）はａｒｐコマンドの出力例を示す。
図１６（ａ）の例では、ドメインＩＤ：１（ｄｏｍｉｄ１）のゲストＯＳのＭＡＣアドレスとして「ｍａｃ００：１６：３ｅ：３１：４ｃ：２ｆ」が示され、図１６（ｂ）の例では、３行目にＭＡＣアドレス「００：１６：３Ｅ：３１：４Ｃ：２Ｆ」とＩＰアドレス「１９２．１６８．１．１００」が示され、これらより、ＩＰ通知部２２１１は、ドメインＩＤ：１のゲストＯＳのＩＰアドレスが「１９２．１６８．１．１００」であることを検出する。

次に、ＩＰ通知部２２１１は、ＭＡＣアドレスとＩＰアドレスの対応情報と仮想計算機管理機構２０が提供するゲストＯＳのＭＡＣアドレスの情報から該当するＩＰアドレスの取得が出来たかどうかを判断する（ＳＴ１０２）。
該当するＩＰアドレスの取得が出来た場合は、ＳＴ１０３へ処理を移す。取得できなかった場合は、ＳＴ１０７へ処理を移す。

該当するＩＰアドレスの取得が出来た場合（ＳＴ１０２でＹＥＳ）は、ＩＰ通知部２２１１はホストＯＳ２２のＩＰアドレスを、取得したＩＰアドレス情報を利用してゲストＯＳ２３に通知する（ＳＴ１０３）。
つまり、ＩＰ通知部２２１１は、取得したゲストＯＳ２３のＩＰアドレスが宛先として付加され、ホストＯＳ２２のＩＰアドレスを通知するパケットをゲストＯＳ２３に送信する。

次に、情報受信部２２１２は、ゲスト障害監視制御エージェント２３１の障害報告部２３１４からの障害情報、あるいは障害検知部２２１３からの障害情報の受信を待つ（ＳＴ１０４）。
情報を受信すると、障害報告部２２１４は、障害監視装置１の障害監視ツールが解析可能な情報に変換する（ＳＴ１０５）。
情報の変換が完了すると、障害報告部２２１４は、障害情報を障害監視装置１の障害監視ツールに送信し、障害通知を待つＳＴ１０４へ（ＳＴ１０６）。

該当するＩＰアドレスの取得が出来なかった場合（ＳＴ１０２でＮＯ）は、ホストＯＳ２２とゲストＯＳ２３の間の通信が可能なネットワークが存在しないと判断し、障害報告部２２１４が障害監視装置１のオペレータに通知し（当該ゲストＯＳ２３とホストＯＳ２２との間のネットワークが設定されていないことを通知するメッセージを出力し）、終了する（ＳＴ１０７）。

次に、図３を用いてゲストＯＳ２３上のゲスト障害監視制御エージェント２３１の動作について説明する。

ゲスト障害監視制御エージェント２３１が起動すると、ＩＰ受信部２３１１は、ホスト障害監視制御エージェント２２１からのホストＯＳ２２のＩＰアドレス情報の受信を待ち、受信すると障害報告部２３１４にホストＯＳ２２のＩＰアドレスの情報を通知する（ＳＴ２０１）。
障害報告部２３１４は、自身（ゲストＯＳ２３）に割当てられている仮想メモリの記憶領域に格納する処理を行うことにより、仮想計算機管理機構２０及びホストＯＳ２２の仲介により、ホストＯＳ２２のＩＰアドレスを自身に割当てられている物理メモリの記憶領域に格納する。

情報受信部２３１２は、障害検知部２３１３によって取得された障害情報を受信する（ＳＴ２０２）。
障害情報を受信すると、障害報告部２３１４はホスト障害監視制御エージェント２２１に障害情報を通知する（ＳＴ２０３）。
このときの障害情報には、ホスト障害監視制御エージェント２２１から受信したホストＯＳ２２のＩＰアドレスが宛先アドレスとして付加され、障害報告部２３１４はホスト障害監視制御エージェント２２１に対して障害情報を送信する。
障害報告部２３１４は、自身（ゲストＯＳ２３）に割当てられている仮想メモリの記憶領域からホストＯＳ２２のＩＰアドレスを読み出す処理を行うことにより、仮想計算機管理機構２０及びホストＯＳ２２の仲介により、ホストＯＳ２２のＩＰアドレスを自身に割当てられている物理メモリの記憶領域から読み出して、障害情報にホストＯＳ２２のＩＰアドレスを付加する。

例えば、図１７に示すように、元々別の拠点にあった各種サーバを集約した場合を想定する。
図１７は、元々は、拠点１にサーバＡとサーバＢが存在し、また、拠点２にサーバＡとサーバＢが存在していたが、これらを仮想計算機で再構築し、物理計算機１に拠点１のサーバＡと同等のゲストＯＳと、拠点２のサーバＡと同等のゲストＯＳを配置し、物理計算機２に拠点１のサーバＢと同等のゲストＯＳと、拠点２のサーバＢと同等のゲストＯＳを配置した状態を示している。
物理計算機１上のホストＯＳとゲストＯＳ（拠点１サーバＡ）は仮想ネットワークで接続されている。また、物理計算機１上のホストＯＳとゲストＯＳ（拠点２サーバＡ）は仮想ネットワークで接続されている。しかし、物理計算機１上のゲストＯＳ（拠点１サーバＡ）とゲストＯＳ（拠点２サーバＡ）は、別の拠点にあったものであるため、同一物理計算機上に存在するものの、これらゲストＯＳは相互に接続されていない。
物理計算機２でも同様である。
一方、物理計算機１上のゲストＯＳ（拠点１サーバＡ）と物理計算機２上のゲストＯＳ（拠点１サーバＢ）は、元々同じ拠点にあったので仮想ネットワークで接続される。同様に、物理計算機２上のゲストＯＳ（拠点２サーバＡ）と物理計算機２上のゲストＯＳ（拠点２サーバＢ）は、元々同じ拠点にあったので仮想ネットワークで接続される。

このような構成において、本実施の形態では、物理計算機１のホストＯＳは、同じ物理計算機１上のゲストＯＳ（拠点１サーバＡ）及びゲストＯＳ（拠点２サーバＡ）にＩＰアドレスを通知し、ゲストＯＳ（拠点１サーバＡ）及びゲストＯＳ（拠点２サーバＡ）から障害情報を受信し、障害情報を集約して、障害監視装置１に障害情報を通知する。
また、同様に、物理計算機２のホストＯＳは、同じ物理計算機２上のゲストＯＳ（拠点１サーバＢ）及びゲストＯＳ（拠点２サーバＢ）にＩＰアドレスを通知し、ゲストＯＳ（拠点１サーバＢ）及びゲストＯＳ（拠点２サーバＢ）から障害情報を受信し、障害情報を集約して、障害監視装置１に障害情報を通知する。
このため、障害監視装置１は、物理計算機の構成、ＯＳ間の仮想ネットワークの構成に関わらず、全てのゲストＯＳの障害情報を収集することができる。

以上のように、実施の形態１によれば、起動時にゲストＯＳの構成に対応し、自動的に通信のためのＩＰアドレスの情報を受け渡しする構成としたことにより、ゲストＯＳの追加が発生した場合であっても、自動的に情報の送受信を行うことが可能となる。
また、ゲストＯＳのＩＰアドレス情報をホストＯＳ上で取得できなかった場合には、直接接続可能なネットワーク構成が行われていないことが事前に判断可能となったことにより、オペレータの操作によりネットワーク構成の再構築を行った上で障害の監視を実施することが可能となる。
また、障害情報をホストＯＳ上で集約可能としたことにより、ホストＯＳとゲストＯＳ、あるいはゲストＯＳ同士が独立した別セグメントのネットワークに接続されていた場合であっても、障害発生の指示や障害情報の収集を一つの障害監視ツールにて管理することが可能となる。
また、ホストＯＳ、ゲストＯＳにて障害の発生や監視を行うこととしたことにより、仮想計算機管理機構の実装方式に依存せずに障害の監視を行うことが可能となる。

本実施の形態では、仮想計算機環境を搭載した物理計算機にて、
ホストＯＳ上にホスト障害監視制御エージェント、ゲストＯＳ上にゲスト障害監視制御エージェントを備え、
前記ホスト障害監視制御エージェントは、
前記ゲストＯＳのドメインＩＤの情報から得られるＭＡＣアドレスの情報を基にＩＰアドレスを取得し、取得したＩＰアドレスを用いて通信を行い、前記ホストＯＳのＩＰアドレスを通知するＩＰ通知部と、
前記ゲスト障害監視制御エージェントからの障害発生情報を受信する情報受信部と、
前記ホストＯＳ、あるいはハードウェアの動作を監視し、障害発生の検知を行う障害検知部と、
前記障害検知部や前記情報受信部にて取得した検知した障害情報を障害監視ツール等に通知する障害報告部とを備え、
前記ゲスト障害監視制御エージェントは、
前記ホストＯＳのＩＰアドレス情報を取得し、障害情報の通知に利用できるようにするＩＰ受信部と、
前記ゲストＯＳの動作を監視し、障害発生の検知を行う障害検知部と、
前記障害検知部にて取得した障害情報を前記ホスト障害制御エージェントに通知する障害報告部とを備え、
仮想計算機環境下においてゲスト障害監視制御エージェントの障害通知先を自動的にホストＯＳに設定し、通知できるようにしたことにより、ホストＯＳ障害監視制御エージェントのみが障害監視ツール等に通知することが可能となり、物理計算機単位で障害情報の通知を行う仮想計算機環境における障害管理方式を説明した。

また、本実施の形態では、ホスト障害監視制御エージェントに、前記ゲストＯＳのドメインＩＤの情報から得られるＭＡＣアドレスの情報を基にＩＰアドレスを取得し、取得したＩＰアドレスを用いて通信を行い、前記ホストＯＳのＩＰアドレスを通知するＩＰ通知部を備え、
前記ゲスト障害監視制御エージェントに前記ホストＯＳのＩＰアドレス情報を取得し、障害情報の通知に利用できるようにするＩＰ受信部を備え、
ゲストＯＳの追加時の自動設定とネットワーク設定の不備を検知することを可能とした仮想計算機環境における障害試験システムについて説明した。

実施の形態２．
実施の形態２では、障害情報にホストＯＳ情報を付与する形態について示す。
図４、図５、図６を用いて、障害情報がゲスト障害監視制御エージェント２３１から送付されてきた場合に、障害情報にホストＯＳ情報を付与する動作について説明する。
図４は、本実施の形態に係るホストＯＳの動作フローである。
図５は、ゲストＯＳ２３にて障害を検知した際の障害情報の例である。
図６は、ホストＯＳ２２から障害監視制御マネージャ５へ通知する障害情報の例である。

図４において、ＳＴ１０１〜ＳＴ１０４及びＳＴ１０７は実施の形態１で説明したものと同様である。
ゲスト障害監視制御エージェント２３１は、図５の例のような障害を検出したメッセージをホストＯＳ２２に送信する。この時点の障害情報は、ゲストＯＳ２３上で取得できる情報のみが記載され、ホストＯＳ２２に関する情報は記載されていない状態である。
ホストＯＳ２２の情報受信部２２１２は、情報を受信すると障害検知部２２１３からの障害情報かゲストＯＳ２３からの障害情報かを判断する（ＳＴ３０１）。
障害検知部２２１３からの障害情報の場合は、ＳＴ１０５へ処理を移す。ゲストＯＳからの障害情報の場合は、ＳＴ３０２へ処理を移す。

ゲストＯＳから来た障害情報の場合は、情報受信部２２１２が図６の例のようにホストＯＳ識別情報（この例の場合はホスト名）を付与する（ＳＴ３０２）。
以降のＳＴ１０５及びＳＴ１０６は、実施の形態１で説明したものと同様である。

以上のように、実施の形態２によれば、障害を検知したＯＳの識別情報とホストＯＳの識別情報を障害情報の中にセットするようにしたことにより、試験結果がどの物理計算機の情報であるか、また、その情報は物理計算機上のどのＯＳ上で検出されたかの把握が可能となり、障害発生時の挙動の把握を容易に行うことが可能となる。
また、ホストＯＳの識別情報をホストＯＳ上でセットするようにしたことにより、ゲストＯＳは、ホストＯＳの情報を知ることなく、障害情報にホストＯＳの識別情報をセットすることが可能となり、ゲストＯＳ上のゲスト障害監視制御エージェントは独立して動作することが可能となる。

以上、本実施の形態によれば、ホストＯＳ上の情報受信部にて受信した情報がゲストＯＳ障害監視制御エージェントからの障害情報であった場合には、受信した障害情報にホストＯＳ識別情報を付与する仮想計算機における障害管理方式について説明した。

実施の形態３．
実施の形態３では、障害検知の形態について示す。
図７、図８は、実施の形態３の仮想計算機環境における障害管理方式の処理動作を示すフローチャートである。
まず、図７を用いてホストＯＳ２２上の障害検知部２２１３の動作について説明する。

障害検知部２２１３は、自身が稼動していることを障害監視装置１に対して通知する（ＳＴ４０１）。
つまり、ホスト障害監視制御エージェント２２１の障害検知部２２１３は、ホストＯＳ２２が稼動していることを通知する稼動通知（ハートビート）を一定周期ごとに障害監視装置に対して送信する。

また、障害検知部２２１３は、ログの監視を行い、監視対象のログファイルの前回チェック部分以降に発生したログの内容をチェックし、指定されたキーワード（例えば、ＥＲＲＯＲという文字列など）のログの発生有無をチェックする（ＳＴ４０２）。
指定されたキーワードのログが発生していなければ、ＳＴ４０３へ処理を移す。発生していた場合は、ＳＴ４０６へ処理を移す。
ホストＯＳにおけるログ監視は、ホストＯＳが出力するログ、仮想計算機管理機構が出力するログを監視することにより、ホストＯＳの障害や仮想計算機管理機構の障害、ホストＯＳが検知したハードウェア障害を検知することを目的とする。

次に、障害検知部２２１３は、プロセスの監視を行い、監視対象のプロセスの有無をｐｓコマンドなどによりチェックする（ＳＴ４０３）。
監視対象のプロセスがすべて稼動していればＳＴ４０４へ処理を移す。監視対象のプロセスが一つでも稼動していなければＳＴ４０７へ処理を移す。

次に、障害検知部２２１３は、監視対象のＨＷ（物理ハードウェア）へのアクセスやＩＰＭＩ（ＩｎｔｅｌｌｉｇｅｎｔＰｌａｔｆｏｒｍＭａｎａｇｅｍｅｎｔＩｎｔｅｒｆａｃｅ）などのＨＷ自体が監視している稼動情報へのアクセスなどによるＨＷの稼動状態のチェックを行う（ＳＴ４０４）。
ＨＷが正常に稼動していればＳＴ４０５へ処理を移す。正常に稼動していなければＳＴ４０８へ処理を移す。

次に、障害検知部２２１３は、ゲストＯＳ２３からの稼動通知を受け取り、すべてのゲストＯＳ２３から稼動通知が来ているか否かをチェックする（ＳＴ４０５）。
稼動通知がすべて来ていれば、ＳＴ４０１へ処理を移す。稼動通知が送信されてきていないゲストＯＳ２３が存在する場合には、ＳＴ４０９へ処理を移す。

ＳＴ４０２において、ログファイル中に指定されたキーワードのログが存在する場合（ＳＴ４０２でＹＥＳ）には、障害検知部２２１３は、障害情報の通知元識別情報にホストＯＳの情報をセットし、通知元ホスト識別情報にもホストＯＳ情報をセットし、日時情報として検知した時間をセットし、監視対象識別情報としてログ監視をセットし、監視対象個別情報として検知したログファイル名をセットし、問題と判断したログの内容をメッセージにセットした障害情報を生成し、障害受信部に通知する。複数存在する場合には、それぞれ一つずつ障害情報を生成し、障害受信部に通知する（ＳＴ４０６）。

ＳＴ４０３において、監視対象のプロセスが稼動していない場合（ＳＴ４０３でＹＥＳ）には、障害検知部２２１３は、障害情報の通知元識別情報にホストＯＳの情報をセットし、通知元ホスト識別情報にもホストＯＳ情報をセットし、日時情報として検知した時間をセットし、監視対象識別情報としてプロセス監視をセットし、監視対象個別情報には何もセットせず、稼動していないプロセス名をメッセージにセットした障害情報を生成し、障害受信部に通知する。複数存在する場合には、それぞれ一つずつ障害情報を生成し、障害受信部に通知する（ＳＴ４０７）。

ＳＴ４０４において、ＨＷに問題がある場合（ＳＴ４０５でＹＥＳ）には、障害検知部２２１３は、障害情報の通知元識別情報にホストＯＳの情報をセットし、通知元ホスト識別情報にもホストＯＳ情報をセットし、日時情報として検知した時間をセットし、監視対象識別情報としてＨＷ監視をセットし、監視対象個別情報には、問題のあったハードウェアの識別情報をセットし、問題の内容をメッセージにセットした障害情報を生成し、障害受信部に通知する。複数存在する場合には、それぞれ一つずつ障害情報を生成し、障害受信部に通知する（ＳＴ４０８）。

ＳＴ４０５において、ゲストＯＳからの定期的な稼動通知が送信されてきていなかった場合（ＳＴ４０５でＹＥＳ）には、障害検知部２２１３は、障害情報の通知元識別情報にホストＯＳの情報をセットし、通知元ホスト識別情報にもホストＯＳ情報をセットし、日時情報として検知した時間をセットし、監視対象識別情報としてハートビート監視をセットし、監視対象個別情報には何もセットせず、通知が送信されてこなかったゲストＯＳ情報をメッセージにセットした障害情報を生成し、障害受信部に通知する。複数存在する場合には、それぞれ一つずつ障害情報を生成し、障害受信部に通知する（ＳＴ４０９）。

障害検知部２２１３は、上記の処理を定期的に繰り返して、ホストＯＳ２２が出力するログ、仮想計算機管理機構２０が出力するログ、ホストＯＳ２２におけるプロセスの稼動状況、各ゲストＯＳ２３の稼動状況、物理ハードウェアの動作状況の少なくともいずれかを一定周期ごとに監視し、いずれかにおいて障害を検出した場合に、検出した障害を通知する障害情報を生成し、生成した障害情報にホストＯＳの識別情報を付加し、ホストＯＳの識別情報が付加された障害情報を障害監視装置１に対して送信する。

次に、図８を用いてゲストＯＳ２３上の障害検知部２３１３の動作について説明する。

障害検知部２３１３は、自身が稼動していることをホスト障害監視制御エージェント２２１に対して通知する（ＳＴ５０１）。
具体的には、障害検知部２３１３は、ゲストＯＳ２３が稼動していることを通知する稼動通知（ハートビート）を一定周期ごとに、ホスト障害監視制御エージェント２２１に対して送信する。

次に、障害検知部２３１３は、ログの監視を行い、監視対象のログファイルの前回チェック部分以降に発生したログの内容をチェックし、指定されたキーワード（例えば、ＥＲＲＯＲという文字列など）のログの発生有無をチェックする（ＳＴ５０２）。
指定されたキーワードのログが発生していなければ、ＳＴ５０３へ処理を移す。発生していた場合は、ＳＴ５０４へ処理を移す。
ゲストＯＳ２３におけるログ監視は、ゲストＯＳ２３上で動作するアプリケーションプログラムが出力したログを監視することにより、アプリケーションプログラムの障害を検知することを目的とし、また、ゲストＯＳ２３が出力するログを監視することにより、ゲストＯＳ２３の障害やゲストＯＳが検知したハードウェアの障害を検知することを目的としている。

次に、障害検知部２３１３は、ゲストＯＳ上のプロセス及びゲストＯＳ上で動作しているアプリケーションプログラムのプロセスの監視を行い、監視対象のプロセスの有無をｐｓコマンドなどによりチェックする（ＳＴ５０３）。
監視対象のプロセスがすべて稼動していればＳＴ４０１へ処理を移す。監視対象のプロセスが一つでも稼動していなければＳＴ５０５へ処理を移す。

また、ＳＴ５０２において、ログファイル中に指定されたキーワードのログが存在する場合（ＳＴ５０２でＹＥＳ）には、障害検知部２３１３は、障害情報の通知元識別情報にゲストＯＳ（自身）の情報をセットし、通知元ホスト識別情報には何もセットせず、日時情報として検知した時間をセットし、監視対象識別情報としてログ監視をセットし、監視対象個別情報として検知したログファイル名をセットし、問題と判断したログの内容をメッセージにセットした障害情報を生成し、障害受信部に通知する。複数存在する場合には、それぞれ一つずつ障害情報を生成し、障害受信部に通知する（ＳＴ５０４）。

また、ＳＴ５０３において、監視対象のプロセスが稼動していない場合には、障害検知部２３１３は、障害情報の通知元識別情報にゲストＯＳ（自身）の情報をセットし、通知元ホスト識別情報には何もセットせず、日時情報として検知した時間をセットし、監視対象識別情報としてプロセス監視をセットし、監視対象個別情報には何もセットせず、稼動していないプロセス名をメッセージにセットした障害情報を生成し、障害受信部に通知する。複数存在する場合には、それぞれ一つずつ障害情報を生成し、障害受信部に通知する（ＳＴ５０５）。

障害検知部２３１３は、上記の処理を定期的に繰り返して、対応するゲストＯＳが出力するログ、対応するゲストＯＳ上で動作するアプリケーションプログラムが出力するログ、対応するゲストＯＳにおけるプロセスの稼動状況、対応するゲストＯＳ上で動作するアプリケーションプログラムにおけるプロセスの稼動状況の少なくともいずれかを一定周期ごとに監視し、いずれかにおいて障害を検出した場合に、検出した障害を通知する障害情報を生成し、生成した障害情報をホスト障害監視制御エージェント２２１に対して送信する。

以上のように、本実施の形態では、障害検知をログ監視、プロセス監視、ＨＷ監視、ハートビート監視によって実施するようにしたことにより、ゲストＯＳ上で稼動しているアプリケーションの障害は、プロセス監視やログ監視により検知可能となり、ゲストＯＳそのものの障害は、ログ監視やハートビート監視により検知可能となり、ゲスト障害監視制御エージェントの障害は、ハートビート監視により検知可能となり、仮想計算機管理機構の障害はハートビート監視により検知可能となり、ＨＷの障害は、ＨＷ監視やハートビート監視により検知可能となることで、物理計算機を構成する各要素すべての障害の検知が可能となる。

本実施の形態では、ホストＯＳ上の障害検知部にて定期的に稼動していることを障害監視ツール等に通知することでホストＯＳが稼動していることを把握可能とする仮想計算機における障害管理方式について説明した。

また、本実施の形態では、ゲストＯＳ上の障害検知部にて定期的に稼動していることをホストＯＳ上の障害検知部に通知することでゲストＯＳが稼動していることを把握可能とする仮想計算機における障害管理方式について説明した。

また、本実施の形態では、ホストＯＳ上の前記障害検知部にて定期的にＯＳや仮想計算機管理機構が出力するログを監視することで前記ホストＯＳならびに仮想計算機管理機構の稼動状況を把握可能とする仮想計算機における障害管理方式について説明した。

また、本実施の形態では、ゲストＯＳ上の前記障害検知部にて定期的にＯＳやアプリケーションが出力するログを監視することで前記ゲストＯＳならびにアプリケーションの稼動状況を把握可能とする仮想計算機における障害管理方式について説明した。

また、本実施の形態では、ホストＯＳ上の前記障害検知部にてプロセスの稼動、非稼動を監視することで前記ホストＯＳの稼動状況を把握可能とする仮想計算機における障害管理方式について説明した。

また、本実施の形態では、ゲストＯＳ上の前記障害検知部にてプロセスの稼動、非稼動を監視することで前記ゲストＯＳの稼動状況を把握可能とする仮想計算機における障害管理方式について説明した。

また、本実施の形態では、前記障害検知部にて定期的にハードウェアへのアクセスを行うことでハードウェアの稼動状況を把握可能とする仮想計算機における障害管理方式について説明した。

実施の形態４．
本実施の形態では、ユーザが認識するホスト名やＩＰアドレスの情報を仮想計算機管理機構がゲストＯＳを認識するドメインＩＤ等の識別情報に自動的に変換することにより、仮想的な障害を特定のゲストＯＳに対して発生させることを可能とした試験システムについて説明する。
また、ホストＯＳにて障害発生の設定指示や結果を集約し、擬似的に発生させた障害による障害検出をホストＯＳ、ゲストＯＳのいずれにおいて検出されるような障害であっても検出し、どこでどのような手段にて検知したかを把握可能とすることにより、ゲストＯＳのネットワーク環境や仮想化実装方式による障害発生箇所に依存せず、障害発生や確認の管理を可能とした試験システムを説明する。

図９は、本実施の形態に係る仮想計算機環境における試験システムの構成図である。
図に示すように、仮想計算機環境の試験システムは、障害監視制御マネージャ５を含む障害監視装置１、物理計算機２−１〜２−ｎを備えている。障害監視制御マネージャ５、物理計算機２−１〜２−ｎのホストＯＳは通信回線３を介して接続され、ゲストＯＳは通信回線４を介して接続されている。

障害監視制御マネージャ５は、ブラウザなどの画面表示要求や物理計算機２−１〜２−ｎからの障害情報、稼動情報を受信する情報受信部５１、画面表示要求に伴い、表示用の情報を生成する表示部５２、物理計算機２−１〜２−ｎに対して障害発生の指示の実施を行う擬似障害発生制御部５３、物理計算機２−１〜２−ｎから収集した障害情報や稼動情報の蓄積を実施する稼動情報蓄積部５４から構成される。
つまり、障害監視装置１は、擬似障害の発生を要求する擬似障害発生要求を物理計算機２−１〜２−ｎに送信し、また、物理計算機２−１〜２−ｎにおける擬似障害の検知状況を監視する。

物理計算機２−１〜２−ｎは、仮想計算機管理機構２０が搭載された計算機であり、各ゲストＯＳのＩ／Ｏのエミュレート等を実施するホストＯＳ２２、ゲストＯＳ２３が搭載され、ホストＯＳ２２、ゲストＯＳ２３が接続される仮想ネットワーク２１から構成される。
通信回線３、４は、例えばイントラネット、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）等のネットワークであり、互いに独立したネットワークで、相互通信を行うことは出来ない。

ホストＯＳ２２上には、擬似的に障害を発生させるモジュールや機器に対する障害発生指示や障害を発生させたことにより発生する事象を監視し情報を取得するホスト障害監視制御エージェント２２１と、ホストＯＳ上で発生可能な擬似的な障害を発生させる障害発生モジュール２２２が搭載されている。

ゲストＯＳ２３上には、擬似的に障害を発生させるモジュールや機器に対する障害発生指示や障害を発生させたことにより発生する事象を監視し情報を取得するゲスト障害監視制御エージェント２３１と、ゲストＯＳ上で発生可能な擬似的な障害を発生させる障害発生モジュール２３２が搭載されている。

ホスト障害監視制御エージェント２２１は、障害監視装置１から送信された擬似障害発生要求を受信し、受信した擬似障害発生要求の内容を解析し、解析結果に基づき、いずれかのＯＳの障害発生モジュールに対して擬似障害発生要求で要求されている擬似障害を発生させるよう通知する。
つまり、本実施の形態では、障害監視装置１からの擬似障害発生要求の受信をホスト障害監視制御エージェント２２１に集約している。

また、ホスト障害監視制御エージェント２２１は、擬似障害の対象となる擬似障害対象ゲストＯＳの通信アドレスが含まれる擬似障害発生要求であって、ホストＯＳの障害発生モジュールと仮想計算機管理機構２０とが協働して発生させる擬似障害の発生を要求する擬似障害発生要求を受信した場合に、擬似障害対象ゲストＯＳの通信アドレスから擬似障害対象ゲストＯＳのドメインＩＤを取得し、取得した擬似障害対象ゲストＯＳのドメインＩＤを仮想計算機管理機構２０に通知する。

更には、ホスト障害監視制御エージェント２２１は、擬似障害対象ゲストＯＳのＩＰアドレスが含まれる擬似障害発生要求であって、擬似障害対象ゲストＯＳに割当てられている物理ハードウェアの擬似障害の発生を要求する擬似障害発生要求を受信した場合に、擬似障害対象ゲストＯＳのＩＰアドレスから擬似障害対象ゲストＯＳのドメインＩＤを取得し、取得した擬似障害対象ゲストＯＳのドメインＩＤを仮想計算機管理機構２０に通知する。

また、ホストＯＳ２２の障害発生モジュール２２２は、ホストＯＳの擬似障害、仮想計算機管理機構２０の擬似障害、いずれのゲストＯＳ２３にも割当てられていない物理ハードウェアの擬似障害の少なくともいずれかを発生させる。

また、ホスト障害監視制御エージェント２２１は、ホストＯＳ２２の障害発生モジュール２２２が発生させた擬似障害を検出した場合に、検出した擬似障害を通知する障害情報を生成し、生成した障害情報にホストＯＳ２２の識別情報を付加し、ホストＯＳ２２の識別情報が付加された障害情報を障害監視装置１に対して送信する。

各ゲストＯＳ２３の障害発生モジュール２３２は、対応するゲストＯＳ２３の擬似障害、対応するゲストＯＳ２３上で動作するアプリケーションプログラムの擬似障害の少なくともいずれかを発生させる。

また、各ゲスト障害監視制御エージェント２３１は、各ゲストＯＳ２３の障害発生モジュール２３２が発生させた擬似障害を検出した場合に、検出した擬似障害を通知する障害情報を生成し、生成した障害情報をホスト障害監視制御エージェント２２１に対して送信し、ホスト障害監視制御エージェント２２１は、各ゲスト障害監視制御エージェント２３１から受信した障害情報にホストＯＳ２２の識別情報を付加し、ホストＯＳ２２の識別情報が付加された障害情報を障害監視装置１に対して送信する。

ホスト障害監視制御エージェント２２１において、２２１１は、ゲストＯＳ２３のＩＰアドレスの検索を行い、ホストＯＳ２２のＩＰアドレス情報をゲストＯＳ２３に通知するＩＰ通知部である。
２２１２は、障害検知部２２１３あるいはゲスト障害監視制御エージェント２３１からの障害発生情報あるいは障害監視制御マネージャ５からの擬似障害発生要求を受信する情報受信部である。
２２１３は、ホストＯＳ２２やゲストＯＳ２３で発生した障害に基づき発生する動作を監視し、障害発生の検知を行う障害検知部である。
２２１４は、情報受信部２２１２からのゲストＯＳの障害情報や障害検知部２２１３からのホストＯＳの障害情報を障害監視制御マネージャ５に通知を行う障害報告部である。
２２８１は、ゲストＯＳ２３に対する擬似障害発生指示であった場合に、障害監視制御マネージャ５がゲストＯＳ２３を識別するホスト名やＩＰアドレスの情報を仮想計算機管理機構２０が識別できるドメインＩＤに変換するドメインＩＤ変換部である。
２２８２は、障害監視制御マネージャ５からの障害発生指示がホストＯＳ２２上の障害発生モジュール２２２で発生させる障害であった場合には、障害発生モジュール２２２に障害発生指示を行い、ゲストＯＳ２３上の障害発生モジュール２３２で発生させる障害であった場合には、ゲスト障害監視制御エージェント２３１に障害発生指示を行う擬似障害制御部である。

ゲスト障害監視制御エージェント２３１において、２３１１は、ホストＯＳのＩＰアドレス情報を受信し、その情報を基に障害情報の報告をホストＯＳ２２に対して実施可能とするＩＰ受信部である。
２３１２は、障害検知部２３１３からの障害発生情報あるいはホスト障害監視制御エージェント２２１からの擬似障害発生要求を受信する情報受信部である。
２３１３は、ホストＯＳ２２やゲストＯＳ２３で発生した障害に基づき発生する動作を監視し、障害発生の検知を行う障害検知部である。
２３１４は、障害検知部２３１３にて収集した障害情報をホスト障害監視制御エージェント２２１に通知する障害報告部である。
２３８１は、障害発生モジュール２３２に障害発生指示を行う擬似障害制御部である。

図１０、図１１は、実施の形態４の仮想計算機環境における試験システムの処理動作を示すフローチャートである。
まず、図１０を用いてホストＯＳ２２上のホスト障害監視制御エージェント２２１の動作について説明する。

ホスト障害監視制御エージェント２２１が起動すると、ＩＰ通知部２２１１は、仮想計算機管理機構２０が提供するゲストＯＳの情報からゲストＯＳのＭＡＣアドレスを取得し、ａｒｐコマンド等やホストＯＳ２２が持つネットワークＩ／Ｆにて取りうるアドレスリストを生成し、ｐｉｎｇ等でネットワークアクセスを行い、ＭＡＣアドレスとＩＰアドレスの対応情報を取得する（ＳＴ１０１）。
次に、ＩＰ通知部２２１１は、ＭＡＣアドレスとＩＰアドレスの対応情報と仮想計算機管理機構２０が提供するゲストＯＳのＭＡＣアドレスの情報から該当するＩＰアドレスの取得が出来たかどうかを判断する（ＳＴ１０２）。該当するＩＰアドレスの取得が出来た場合は、ＳＴ１０３へ処理を移す。取得できなかった場合は、ＳＴ１０７へ処理を移す。
該当するＩＰアドレスの取得が出来た場合（ＳＴ１０２でＹＥＳ）は、ＩＰ通知部２２１１は、ホストＯＳ２２のＩＰアドレスを取得したＩＰアドレス情報を利用してゲストＯＳ２３に通知する（ＳＴ１０３）。

次に、情報受信部２２１２は、ゲスト障害監視制御エージェント２３１の障害報告部２３１３からの障害情報、あるいは障害検知部２２１４からの障害情報あるいは障害監視制御マネージャ５からの擬似障害発生要求の受信を待つ（ＳＴ１０４）。
情報受信部２２１２は、情報を受信すると障害情報か障害監視制御マネージャからの擬似障害発生要求かを判断する（ＳＴ６０１）。
障害情報の場合はＳＴ３０１へ処理を移す。擬似障害発生要求の場合はＳＴ６０２へ処理を移す。

受信した情報が擬似障害発生要求の場合（ＳＴ６０１でＹＥＳ）、擬似障害制御部２２８２は、ホストＯＳ２２上の障害発生モジュール２２２に対して設定するものか、ゲストＯＳ２３上の障害発生モジュール２３２に対して設定するものかを判断する（ＳＴ６０２）。
ホストＯＳ２２上の障害発生モジュール２２２に対して設定するものであれば（ＳＴ６０２でＹＥＳ）、ＳＴ６０３へ処理を移す。ゲストＯＳ２３上の障害発生モジュール２３２に対して設定するものであれば（ＳＴ６０２でＮＯ）、ＳＴ６０６へ処理を移す。

次に、擬似障害制御部２２８２は、ホストＯＳ２２上の障害発生モジュール２２２に対して設定する擬似障害発生要求の場合（ＳＴ６０２でＹＥＳ）、特定のゲストＯＳ２３（擬似障害対象ゲストＯＳ）に割当てられたディスク等のハードウェア障害に関するものか、ファンや電源等のようにリソースの割当が行われていないハードウェアに対する障害に関するものかを判断する（ＳＴ６０３）。特定のゲストＯＳ２３（擬似障害対象ゲストＯＳ）に割当てられたディスク等のハードウェアの擬似障害は、ホストＯＳ２２の障害発生モジュール２２２と仮想計算機管理機構２０とが協働して発生させる擬似障害である。
特定のゲストＯＳ２３に割当てられているハードウェアに対する障害に関するものであれば、ＳＴ６０４へ処理を移す。リソースの割当が行われていないハードウェアに対する障害に関するものであれば、ＳＴ６０５へ処理を移す。

ドメインＩＤ変換部２２８１は、擬似障害発生要求において指定されたゲストＯＳ２３（擬似障害対象ゲストＯＳ）を指定するホスト名やＩＰアドレス情報を基にａｒｐコマンド等により、ＭＡＣアドレス情報を取得し、仮想計算機管理機構２０が提供しているゲストＯＳ２３の情報からＭＡＣアドレスに該当するドメインＩＤの取得を行う（ＳＴ６０４）。
例えば、ドメインＩＤ変換部２２８１は、実施の形態１で示したｘｍコマンド出力及びａｒｐコマンド出力を用いて、実施の形態１で説明した手順とは逆の手順にて、擬似障害対象ゲストＯＳのドメインＩＤを取得する。

そして、擬似障害制御部２２８２は、障害発生モジュール２２２に対して擬似障害の発生を指示する（ＳＴ６０５）。

また、ゲストＯＳ２３上の障害発生モジュール２３２に対して設定するものであれば（ＳＴ６０２でＮＯ）、擬似障害制御部２２８２は、擬似障害対象ゲストＯＳ２３のゲスト障害監視制御エージェント２３１に対して障害発生指示を送信する（ＳＴ６０６）。

また、ＳＴ６０１において、情報受信部２２１２は、情報を受信すると（ＳＴ６０１でＮＯ）、障害検知部２２１３からの障害情報かゲストＯＳ２３からの障害情報かを判断する（ＳＴ３０１）。
障害検知部２２１３からの障害情報の場合は、ＳＴ６０７へ処理を移す。ゲストＯＳからの障害情報の場合は、ＳＴ３０２へ処理を移す。

ゲストＯＳから来た障害情報の場合（ＳＴ３０１でＮＯ）は、情報受信部２２１２が図６の例のようにホストＯＳ識別情報（この例の場合はホスト名）を付与する（ＳＴ３０２）。
受信した情報が障害検知部２２１３からの障害情報、あるいはゲスト障害監視制御エージェント２３１からの障害情報である場合は、障害報告部２２１４が障害監視制御マネージャ５に受信した障害情報を送信する（ＳＴ６０７）。

また、ＳＴ１０２において、該当するＩＰアドレスの取得が出来なかった場合（ＳＴ１０２でＮＯ）は、ホストＯＳ２２とゲストＯＳ２３の間の通信が可能なネットワークが存在しないと判断し、障害報告部２２１４が障害監視制御マネージャ５のオペレータに通知し（当該ゲストＯＳ２３とホストＯＳ２２との間のネットワークが設定されていないことを通知するメッセージを出力し）、終了する（ＳＴ１０７）。

次に、図１１を用いてゲストＯＳ２３上のゲスト障害監視制御エージェント２３１の動作について説明する。

ゲスト障害監視制御エージェント２３１が起動すると、ＩＰ受信部２３１１は、ホスト障害監視制御エージェント２２１からのホストＯＳ２２のＩＰアドレス情報の受信を待ち、受信すると障害報告部２３１４にホストＯＳ２２のＩＰアドレスの情報を通知する（ＳＴ２０１）。

情報受信部２３１２は、障害検知部２３１３によって取得された障害発生情報かホスト障害監視制御エージェントからの擬似障害発生指示を受信する（ＳＴ２０２）。
情報受信部２３１２は、情報を受信すると、その情報が擬似障害発生要求か障害情報の受信かを判断する（ＳＴ６０１）。
擬似障害発生要求の場合にはＳＴ６０２へ処理を移す。障害情報の受信の場合にはＳＴ２０３へ処理を移す。

受信した情報が擬似障害発生要求の場合（ＳＴ６０１でＹＥＳ）、擬似障害制御部２３８１が、障害発生モジュール２３２に対して指定された障害発生の設定を実施する（ＳＴ６０２）。
一方、障害情報を受信すると（ＳＴ６０１でＮＯ）、障害報告部２３１４はホスト障害監視制御エージェント２２１に障害情報を通知する（ＳＴ２０３）。

なお、障害発生モジュール２２２又は障害発生モジュール２３２が擬似障害を発生させた場合は、障害検知部２２１３又は障害検知部２３１３は、実施の形態３において説明した手順（図７又は図８に示した手順）にて擬似障害を検知し、障害報告部２２１４又は障害報告部２３１４が検知した擬似障害を報告する障害情報を生成する。

以上のように、実施の形態４によれば、擬似障害の発生指示や障害情報をホストＯＳ上で集約可能としたことにより、ホストＯＳとゲストＯＳ、あるいはゲストＯＳ同士が独立した別セグメントのネットワークに接続されていた場合であっても、障害発生の指示や障害情報の収集を一つの障害監視制御マネージャにて管理することが可能となる。
また、ホストＯＳ、ゲストＯＳにて障害の発生や監視を行うこととしたことにより、仮想計算機管理機構の実装方式に依存せずに試験の実施、確認を行うことが可能となる。
また、ホストＯＳ上で指定されたゲストＯＳのホスト名やＩＰアドレスを基に仮想計算機管理機構が認識可能なドメインＩＤに変換する構成としたことにより、ホストＯＳ上でゲストＯＳに対する擬似障害の発生を行うことが可能となる。
また、擬似障害を発生させることで、ハードウェア障害の試験を実施できるようにしたことにより、物理計算機では検証が困難であったハードウェア障害の試験を物理計算機上で動作しているシステムを仮想計算機環境上に搭載することで、実施することが可能となる。

以上、本実施の形態では、仮想計算機環境を搭載した物理計算機上で障害を擬似的に発生させ、障害発生時の動作検証を実施する障害試験システムにおいて、
障害監視制御マネージャとホストＯＳ上にホスト障害監視制御エージェント、ゲストＯＳ上にゲスト障害監視制御エージェントを備え、
前記ホスト障害監視制御エージェントは、
前記障害監視制御マネージャからの障害発生指示の受信ならびに前記ゲスト障害監視制御エージェントからの障害発生情報を受信する情報受信部と、
前記情報受信部が取得した情報がゲストＯＳに対する擬似ハードウェア障害発生指示であった場合に、ゲストＯＳを識別するホスト名やＩＰアドレス情報を仮想計算機管理機構が認識可能なゲストＯＳ識別情報に変換するドメインＩＤ変換部と、
前記ドメインＩＤ変換部にて取得したドメインＩＤを基に擬似ハードウェア障害を発生させる障害発生モジュールに対して障害発生の指示を行う擬似障害制御部と、
前記擬似障害制御部にてセットされた障害に基づき発生する動作を監視し、障害発生の検知を行う障害検知部と、
前記障害検知部や前記情報受信部にて取得した検知した障害情報を前記障害監視制御マネージャに通知する障害報告部とを備え、
前記ゲスト障害監視制御エージェントは、
前記ホスト障害監視制御エージェントからの障害発生指示を受信する情報受信部と、
前記情報受信部にて取得した情報を基に擬似障害を発生させる障害発生モジュールに対して障害発生の指示を行う擬似障害制御部と、
前記擬似障害制御部あるいは前記ホスト障害監視制御エージェントの前記擬似障害制御部にてセットされた擬似障害に基づき発生する動作を監視し、障害発生の検知を行う障害検知部と、
前記障害検知部にて取得した障害情報を前記ホスト障害制御エージェントに通知する障害報告部とを備え、
ゲストＯＳを識別するＩＰアドレスから仮想化管理機能が識別するドメインＩＤの情報に変換し、擬似障害をセット可能としたことにより、ゲストＯＳからのハードウェアアクセスがあった場合に擬似障害を発生させることを可能とした仮想計算機環境における障害試験システムについて説明した。

また、本実施の形態では、ホストＯＳ上の前記擬似障害制御部にて擬似ホストＯＳ障害の設定の実施を可能とする仮想計算機環境における障害試験システムについて説明した。

また、本実施の形態では、ホストＯＳ上の前記擬似障害制御部にて擬似仮想計算機管理機構障害の設定の実施を可能とする仮想計算機環境における障害試験システムについて説明した。

また、本実施の形態では、ゲストＯＳ上の前記擬似障害制御部にて擬似ゲストＯＳ障害の設定の実施を可能とする仮想計算機環境における障害試験システムについて説明した。

また、本実施の形態では、ゲストＯＳ上の前記擬似障害制御部にて擬似アプリケーション障害の設定の実施を可能とする仮想計算機環境における障害試験システムについて説明した。

実施の形態５．
実施の形態５では、障害監視制御マネージャ１の動作について示す。
図１２は、ホスト一覧を表示した画面の例である。
図１３は、擬似障害発生要求を実施する画面の例である。
図１４は、各ホスト上で発生している障害情報を表示する画面の例である。
図１５は、障害監視制御マネージャ１の動作フローを示した図である。

情報受信部５１は、ブラウザなどによるユーザからの表示要求、擬似障害発生要求あるいは物理計算機２−１〜２−ｎからの障害情報あるいは稼動情報の受信を待つ（ＳＴ８０１）。
情報を受信した場合は、その情報がユーザからの表示要求か擬似障害発生要求か物理計算機２−１〜２−ｎからの障害情報あるいは稼動情報であるかを判断する（ＳＴ８０２）。
表示要求の場合は、ＳＴ８０３へ処理を移す。それ以外の場合はＳＴ８０５へ処理を移す。

ユーザからの表示要求であった場合（ＳＴ８０２でＹＥＳ）は、表示部５２がＤＢ（ＤａｔａＢａｓｅ）に格納されている構成情報や障害情報を基に表示用のデータの生成を行う。
ホスト一覧表示要求の場合には、表示部５２は、図１２に示した画面を表示するためのデータを生成する。
また、擬似障害発生要求を行う画面の表示要求の場合には、表示部５２は、図１３に示した画面を表示するためのデータを生成する。
また、障害発生状況の表示要求の場合には、表示部５２は、図１４に示した画面を表示するためのデータを生成する（ＳＴ８０３）。
そして、表示部１２は生成された表示データを要求元のブラウザ等に返す（ＳＴ８０４）。

また、ＳＴ８０２において表示要求でなかった場合（ＳＴ８０２でＮＯ）は、情報受信部１１は、受信した情報が擬似障害発生要求か障害情報あるいは稼動情報であるかを判断する（ＳＴ８０５）。擬似障害発生要求の場合はＳＴ８０６へ処理を移す。それ以外の場合はＳＴ８０７へ処理を移す。

オペレータから擬似障害発生要求を受信した場合（ＳＴ８０５でＹＥＳ）は、擬似障害発生制御部１３が指示されたホストＯＳ２２のホスト障害監視制御エージェント２２１に対して障害発生指示を通知する（ＳＴ８０６）。
一方、物理計算機２のホストＯＳ２２から障害情報あるいは稼動情報を受信した場合（ＳＴ８０５でＮＯ）は、稼動情報蓄積部１４が受信データをＤＢに格納し、障害発生状況の表示要求を受け付けた際に内容を表示可能とする（ＳＴ８０７）。

以上のように障害監視制御マネージャにて擬似障害発生指示、障害発生状況の確認を集中管理する構成としたことにより、障害発生時の各物理計算機上のホストＯＳ、ゲストＯＳの挙動を確認することが可能となり、試験を円滑に進めることが可能となる。

なお、仮想計算機環境における障害管理方式を説明する上で、ホストＯＳ、ゲストＯＳと記載しているが、Ｘｅｎなどのように明示的にホストＯＳを用いない仮想計算機管理機構を用いた場合であった場合、各ドメインの管理を行うＤｏｍａｉｎ−０をホストＯＳとみなし、他のＤｏｍａｉｎ−ＵをゲストＯＳとみなして構成することにより、本明細書に記載の障害管理方式は実現可能である。
また、特別なＤｏｍａｉｎ−０やホストＯＳといったＯＳが存在しない環境においても、代表の仮想ＯＳを定義することにより、本明細書に記載の障害管理方式は実現可能である。

このように、本実施の形態では、仮想計算機環境を搭載した物理計算機上で障害を擬似的に発生させ、障害発生時の動作検証を実施する障害試験システムにおいて、
障害監視制御マネージャが、
ホスト障害監視制御エージェントに対して擬似障害の発生の指示を行う擬似障害発生制御部と、
前記ホスト障害監視制御エージェントからの稼動情報を収集し、結果を表示する稼動情報収集部とを備えていることを説明した。

最後に、実施の形態１〜５に示した障害監視装置１及び物理計算機２のハードウェア構成例について説明する。
図１８は、実施の形態１〜５に示す障害監視装置１及び物理計算機２のハードウェア資源の一例を示す図である。
なお、図１８の構成は、あくまでも障害監視装置１及び物理計算機２のハードウェア構成の一例を示すものであり、障害監視装置１及び物理計算機２のハードウェア構成は図１８に記載の構成に限らず、他の構成であってもよい。

図１８において、障害監視装置１及び物理計算機２は、プログラムを実行するＣＰＵ９１１（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう）を備えている。
ＣＰＵ９１１は、バス９１２を介して、例えば、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）９１３、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）９１４、通信ボード９１５、表示装置９０１、キーボード９０２、マウス９０３、磁気ディスク装置９２０と接続され、これらのハードウェアデバイスを制御する。
更に、ＣＰＵ９１１は、ＦＤＤ９０４（ＦｌｅｘｉｂｌｅＤｉｓｋＤｒｉｖｅ）、コンパクトディスク装置９０５（ＣＤＤ）、プリンタ装置９０６、スキャナ装置９０７と接続していてもよい。また、磁気ディスク装置９２０の代わりに、光ディスク装置、メモリカード（登録商標）読み書き装置などの記憶装置でもよい。
ＲＡＭ９１４は、揮発性メモリの一例である。ＲＯＭ９１３、ＦＤＤ９０４、ＣＤＤ９０５、磁気ディスク装置９２０の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置の一例である。
通信ボード９１５、キーボード９０２、マウス９０３、スキャナ装置９０７、ＦＤＤ９０４などは、入力装置の一例である。
また、通信ボード９１５、表示装置９０１、プリンタ装置９０６などは、出力装置の一例である。

通信ボード９１５は、図１等に示すように、ネットワークに接続されている。例えば、通信ボード９１５は、ＬＡＮ（ローカルエリアネットワーク）、インターネット、ＷＡＮ（ワイドエリアネットワーク）などに接続されていても構わない。

図１８では、磁気ディスク装置９２０の内容は物理計算機２を実現するためのプログラムの例が示されている。
図１８の磁気ディスク装置９２０では、仮想計算機管理機構９２１（仮想マシンモニタ）、ホストＯＳ９２２、プログラム群９２３、ファイル群９２４が記憶されている。
プログラム群９２３のプログラムは、ＣＰＵ９１１、仮想計算機管理機構９２１、ホストＯＳ９２２により実行される。
また、仮想計算機管理機構９２１自身がホストＯＳ９２２の機能を含む場合や、ホストＯＳ９２２内に仮想計算機管理機構９２１が存在する場合もある。
障害監視装置１の磁気ディスク装置９２０では、例えば、仮想計算機管理機構９２１、ホストＯＳ９２２の代わりに、通常のＯＳやウィンドウシステムが記憶される。

ＲＯＭ９１３には、ＢＩＯＳ（ＢａｓｉｃＩｎｐｕｔＯｕｔｐｕｔＳｙｓｔｅｍ）プログラムが格納され、磁気ディスク装置９２０にはブートプログラムが格納されている。
物理計算機２の起動時には、ＲＯＭ９１３のＢＩＯＳプログラム及び磁気ディスク装置９２０のブートプログラムが実行され、ＢＩＯＳプログラム及びブートプログラムにより仮想計算機管理機構９２１、ホストＯＳ９２２（障害監視装置１では、ＯＳ）が起動される。

プログラム群９２３には、物理計算機２の場合、実施の形態１〜５に示されるゲストＯＳ及びこれらの内部要素を実現するプログラムが含まれる。具体的には、プログラム群９２３には、実施の形態１〜５の説明において「〜部」として説明している機能を実行するプログラムが記憶されている。
また、ゲストＯＳで実施されるアプリケーションプログラムも記憶されている。
また、障害監視装置１では、プログラム群９２３には、障害監視制御マネージャ等のアプリケーションプログラムが格納されている。
プログラムは、ＣＰＵ９１１により読み出され実行される。

また、ファイル群９２４には、物理計算機２の場合は、例えば、ハードウェアをエミュレートするための各種ファイルが含まれる。
更には、ファイル群９２４には、実施の形態１〜５の説明において、「〜の判断」、「〜の計算」、「〜の比較」、「〜の変換」、「〜の取得」、「〜の設定」、「〜の登録」、「〜の選択」等として説明している処理の結果を示す情報やデータや信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」の各項目として記憶されている。
「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリなどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してＣＰＵ９１１によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示などのＣＰＵの動作に用いられる。
抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示のＣＰＵの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリ、レジスタ、キャッシュメモリ、バッファメモリ等に一時的に記憶される。
また、実施の形態１〜５で説明しているフローチャートの矢印の部分は主としてデータや信号の入出力を示し、データや信号値は、ＲＡＭ９１４のメモリ、ＦＤＤ９０４のフレキシブルディスク、ＣＤＤ９０５のコンパクトディスク、磁気ディスク装置９２０の磁気ディスク、その他光ディスク、ミニディスク、ＤＶＤ等の記録媒体に記録される。また、データや信号は、バス９１２や信号線やケーブルその他の伝送媒体によりオンライン伝送される。

また、実施の形態１〜５の説明において「〜部」として説明しているものは、「〜回路」、「〜装置」、「〜機器」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち、「〜部」として説明しているものは、ＲＯＭ９１３に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、ＤＶＤ等の記録媒体に記憶される。プログラムはＣＰＵ９１１により読み出され、ＣＰＵ９１１により実行される。すなわち、プログラムは、実施の形態１〜５の「〜部」としてコンピュータを機能させるものである。あるいは、実施の形態１〜５の「〜部」の手順や方法をコンピュータに実行させるものである。

このように、実施の形態１〜５に示す障害監視装置１及び物理計算機２は、処理装置たるＣＰＵ、記憶装置たるメモリ、磁気ディスク等、入力装置たるキーボード、マウス、通信ボード等、出力装置たる表示装置、通信ボード等を備えるコンピュータであり、上記したように「〜部」として示された機能をこれら処理装置、記憶装置、入力装置、出力装置を用いて実現するものである。

実施の形態１に係るシステム構成例を示す図。実施の形態１に係るホストＯＳの動作例を示すフローチャート図。実施の形態１に係るゲストＯＳの動作例を示すフローチャート図。実施の形態２に係るホストＯＳの動作例を示すフローチャート図。実施の形態２に係るゲストＯＳからホストＯＳに送信される障害情報の例を示す図。実施の形態２に係るホストＯＳから障害監視装置に送信される障害情報の例を示す図。実施の形態３に係るホストＯＳの動作例を示すフローチャート図。実施の形態３に係るゲストＯＳの動作例を示すフローチャート図。実施の形態４に係るシステム構成例を示す図。実施の形態４に係るホストＯＳの動作例を示すフローチャート図。実施の形態４に係るゲストＯＳの動作例を示すフローチャート図。実施の形態５に係るホスト一覧を表示した画面の例を示す図。実施の形態５に係る擬似障害発生要求を実施する画面の例を示す図。実施の形態５に係る障害情報を表示した画面の例を示す図。実施の形態５に係る障害監視制御マネージャの動作例を示すフローチャート図。実施の形態１に係るｘｍコマンドの出力例及びａｒｐコマンドの出力例を示す図。実施の形態１に係る仮想計算機によるサーバの統合の例を示す図。実施の形態１〜５に係る障害監視装置及び物理計算機のハードウェア構成例を示す図。

符号の説明

１障害監視装置、２物理計算機、３通信回線、４通信回線、５障害監視制御マネージャ、２０仮想計算機管理機構、２１仮想ネットワーク、２２ホストＯＳ、２３ゲストＯＳ、５１情報受信部、５２表示部、５３擬似障害発生制御部、５４稼動情報蓄積部、２２１ホスト障害監視制御エージェント、２２２障害発生モジュール、２３１ゲスト障害監視制御エージェント、２３２障害発生モジュール、２２１１ＩＰ通知部、２２１２情報受信部、２２１３障害検知部、２２１４障害報告部、２２８１ドメインＩＤ変換部、２２８２擬似障害制御部、２３１１ＩＰ受信部、２３１２情報受信部、２３１３障害検知部、２３１４障害報告部、２３８１擬似障害制御部。

Claims

仮想計算機を実現する仮想計算機管理機構を搭載し、前記仮想計算機管理機構上でホストＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）と一つ以上のゲストＯＳとが動作し、各ゲストＯＳに割当てられる記憶領域を有する計算機装置であって、
前記ホストＯＳの通信アドレスが設定され、各ゲストＯＳで検出された障害を通知する障害情報の宛先アドレスとして前記ホストＯＳの通信アドレスを通知する通信アドレス情報を送信し、各ゲストＯＳで検知された障害を通知する障害情報を受信する第一の障害監視制御部と、
第一の障害監視制御部から通信アドレス情報を受信し、受信した通信アドレス情報に示される前記ホストＯＳの通信アドレスを、対応するゲストＯＳに割当てられている記憶領域に格納し、対応するゲストＯＳにおいて障害が検出された際に検出された障害を通知する障害情報を生成し、記憶領域に格納されている前記ホストＯＳの通信アドレスを宛先アドレスとし、生成した障害情報を前記第一の障害監視制御部に対して送信する一つ以上の第二の障害監視制御部とを有することを特徴とする計算機装置。
前記計算機装置は、
第二の障害監視制御部による障害情報の送信先を第一の障害監視制御部に集約していることを特徴とする請求項１に記載の計算機装置。
前記計算機装置は、
障害の監視を行う障害監視装置に接続され、
第一の障害監視制御部は、
第二の障害監視制御部から受信した障害情報に前記ホストＯＳの識別情報を付加し、前記ホストＯＳの識別情報が付加された障害情報を前記障害監視装置に対して送信することを特徴とする請求項１又は２に記載の計算機装置。
第一の障害監視制御部は、
前記ホストＯＳが出力するログ、前記仮想計算機管理機構が出力するログ、前記ホストＯＳにおけるプロセスの稼動状況、各ゲストＯＳの稼動状況、物理ハードウェアの動作状況の少なくともいずれかを一定周期ごとに監視し、いずれかにおける障害を通知する障害情報を生成し、生成した障害情報に前記ホストＯＳの識別情報を付加し、前記ホストＯＳの識別情報が付加された障害情報を前記障害監視装置に対して送信することを特徴とする請求項３に記載の計算機装置。
第一の障害監視制御部は、
前記ホストＯＳが稼動していることを通知する稼動通知を一定周期ごとに前記障害監視装置に対して送信することを特徴とする請求項３又は４に記載の計算機装置。
第二の障害監視制御部は、
対応するゲストＯＳが出力するログ、対応するゲストＯＳ上で動作するアプリケーションプログラムが出力するログ、対応するゲストＯＳにおけるプロセスの稼動状況、対応するゲストＯＳ上で動作するアプリケーションプログラムにおけるプロセスの稼動状況の少なくともいずれかを一定周期ごとに監視し、いずれかにおける障害を通知する障害情報を生成し、生成した障害情報を第一の障害監視制御部に対して送信することを特徴とする請求項１〜５のいずれかに記載の計算機装置。
第二の障害監視制御部は、
前記ゲストＯＳが稼動していることを通知する稼動通知を一定周期ごとに、第一の障害監視制御部に対して送信することを特徴とする請求項１〜６のいずれかに記載の計算機装置。
第一の障害監視制御部は、
前記仮想計算機管理機構から提供される各ゲストＯＳのドメインＩＤ（ＩｄｅｎｔｉｆｉｃａｔｉｏｎＤａｔａ）と各ゲストＯＳのＭＡＣ（ＭｅｄｉａＡｃｃｅｓｓＣｏｎｔｒｏｌ）アドレスとの対応づけ情報に基づき、各ゲストＯＳのＩＰ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ）アドレスを取得し、取得した各ゲストＯＳのＩＰアドレスを用いて、各ゲストＯＳに対応する第二の障害監視制御部に前記ホストＯＳのＩＰアドレスを通知する通信アドレス情報を送信することを特徴とする請求項１〜７のいずれかに記載の計算機装置。
第一の障害監視制御部は、
いずれかのゲストＯＳのＩＰアドレスが取得できない場合に、当該ゲストＯＳと前記ホストＯＳとの間のネットワークが設定されていないことを通知するメッセージを出力することを特徴とする請求項８に記載の計算機装置。
前記計算機装置は、
擬似障害の発生を要求する擬似障害発生要求を送信する障害監視装置に接続され、
前記ホストＯＳにおける擬似障害を発生させるホストＯＳの障害発生モジュールと、
各ゲストＯＳにおける擬似障害を発生させるゲストＯＳの障害発生モジュールとを有し、
第一の障害監視制御部は、
前記障害監視装置から送信された擬似障害発生要求を受信し、受信した擬似障害発生要求の内容を解析し、解析結果に基づき、いずれかのＯＳの障害発生モジュールに対して擬似障害発生要求で要求されている擬似障害を発生させるよう通知することを特徴とする請求項１〜９のいずれかに記載の計算機装置。
前記計算機装置は、
前記障害監視装置からの擬似障害発生要求の受信を第一の障害監視制御部に集約していることを特徴とする請求項１０に記載の計算機装置。
第一の障害監視制御部は、
擬似障害の対象となる擬似障害対象ゲストＯＳの通信アドレスが含まれる擬似障害発生要求であって、前記ホストＯＳの障害発生モジュールと前記仮想計算機管理機構とが協働して発生させる擬似障害の発生を要求する擬似障害発生要求を受信した場合に、前記擬似障害対象ゲストＯＳの通信アドレスから前記擬似障害対象ゲストＯＳのドメインＩＤを取得し、取得した前記擬似障害対象ゲストＯＳのドメインＩＤを前記仮想計算機管理機構に通知することを特徴とする請求項１０又は１１に記載の計算機装置。
第一の障害監視制御部は、
前記擬似障害対象ゲストＯＳのＩＰアドレスが含まれる擬似障害発生要求であって、前記擬似障害対象ゲストＯＳに割当てられている物理ハードウェアの擬似障害の発生を要求する擬似障害発生要求を受信した場合に、前記擬似障害対象ゲストＯＳのＩＰアドレスから前記擬似障害対象ゲストＯＳのドメインＩＤを取得し、取得した前記擬似障害対象ゲストＯＳのドメインＩＤを前記仮想計算機管理機構に通知することを特徴とする請求項１２に記載の計算機装置。
前記ホストＯＳの障害発生モジュールは、
前記ホストＯＳの擬似障害、前記仮想計算機管理機構の擬似障害、いずれのゲストＯＳにも割当てられていない物理ハードウェアの擬似障害の少なくともいずれかを発生させることを特徴とする請求項１０〜１３のいずれかに記載の計算機装置。
第一の障害監視制御部は、
前記ホストＯＳの障害発生モジュールが発生させた擬似障害が検出された場合に、検出された擬似障害を通知する障害情報を生成し、生成した障害情報に前記ホストＯＳの識別情報を付加し、前記ホストＯＳの識別情報が付加された障害情報を前記障害監視装置に対して送信することを特徴とする請求項１４に記載の計算機装置。
各ゲストＯＳの障害発生モジュールは、
対応するゲストＯＳの擬似障害、対応するゲストＯＳ上で動作するアプリケーションプログラムの擬似障害の少なくともいずれかを発生させることを特徴とする請求項１０〜１５のいずれかに記載の計算機装置。
第二の障害監視制御部は、
対応するゲストＯＳの障害発生モジュールが発生させた擬似障害が検出された場合に、検出された擬似障害を通知する障害情報を生成し、生成した障害情報を第一の障害監視制御部に対して送信し、
第一の障害監視制御部は、
第二の障害監視制御部から受信した障害情報に前記ホストＯＳの識別情報を付加し、前記ホストＯＳの識別情報が付加された障害情報を前記障害監視装置に対して送信することを特徴とする請求項１６に記載の計算機装置。