WO2011101887A1

WO2011101887A1 - 管理システム及び管理システムの制御方法

Info

Publication number: WO2011101887A1
Application number: PCT/JP2010/000960
Authority: WO
Inventors: 阿多恵美子; 黒田沢希
Original assignee: 株式会社日立製作所
Priority date: 2010-02-16
Filing date: 2010-02-16
Publication date: 2011-08-25
Also published as: US8555189B2; US20120005609A1

Abstract

　本発明は、複数の監視対象オブジェクト毎に監視方法を設定できる。　サーバ等のノードと、ノードに含まれるコンポーネントとは、監視対象オブジェクトである。情報取得部１４０は、各監視対象オブジェクトから情報を取得する。制御部１３０は、ユーザにより各監視対象オブジェクト毎に設定される監視方法に基づいて、各監視対象オブジェクトの状態を監視し、障害を検出した場合は警報を出力する。互いに関連する監視対象オブジェクト間では、監視状態が連動するようになっている。

Description

管理システム及び管理システムの制御方法

　本発明は、管理システム及び管理システムの制御方法に関する。

　運用監視サーバが映像配信サーバの稼働状況を一定時間毎に監視し、障害の発生を検知した場合には、警告を発するようにしたシステムは知られている（特許文献１）。さらに、管理サーバがシステム内の通信ポートを監視し、ある通信ポートに障害が発生した場合には、代替通信ポートを選択するようにした技術も知られている（特許文献２）。

特開２００９－１８７２３０号公報特開２００７－０８７２６６号公報

　従来技術では、システム内の各ノードをそれぞれ個別に監視しており、各ノードの監視状態が連動していない。例えば、一方のノードと他方のノードとが互いに関係する場合でも、一方のノードの監視状態と他方のノードの監視状態とが連携していない。従って、ユーザは、一方のノードの監視状態を変更した場合には、他方のノードの監視状態を手動で変更する必要がある。このため、従来技術は、ユーザの使い勝手が悪い。

　さらに、従来技術では、各ノードを一律に画一的に監視しており、監視方法を個別に設定するのが難しい。従って、例えば、保守作業のために装置からケーブルを引き抜いた場合でも、リンクダウンの発生であるとして警告が出力される場合がある。従来技術では、ユーザが明確に認識している事象までもが障害として検出されるため、ユーザの使い勝手が低い。さらに、例えば、比較的広範囲の保守作業のために、ユーザの認識している障害が多数発生した場合、本当の障害がその中に埋もれてしまい、ユーザの発見が遅れる可能性もある。

　そこで、本発明の目的は、ユーザの使い勝手を向上できるようにした管理システム及び管理システムの制御方法を提供することにある。本発明の他の目的は、監視対象オブジェクト毎に監視方法を設定することができ、かつ、関連する監視対象オブジェクト間の監視方法を連動させることができるようにした管理システム及び管理システムの制御方法を提供することにある。本発明の更なる目的は、後述する実施形態の記載から明らかになるであろう。

　上記課題を解決すべく、本発明の第１観点に従う管理システムは、コンピュータシステムの状態を監視するための管理システムであって、コンピュータシステムは、監視対象となる監視対象オブジェクトを複数含む。管理システムは、マイクロプロセッサと、マイクロプロセッサにより読み出されて実行されるプログラムを記憶するためのメモリと、マイクロプロセッサが各監視対象オブジェクトと通信するための通信インターフェースと、マイクロプロセッサがユーザとの間で情報を交換するためのユーザインターフェースと、を含む。マイクロプロセッサは、プログラムを読み込んで実行することにより、各監視対象オブジェクト毎に監視方法を設定する監視方法設定部と、通信インターフェースを介して各監視対象オブジェクトから情報を取得する情報取得部と、各監視方法と各監視対象オブジェクトから取得される情報とに基づいて、各監視対象オブジェクトを監視し、それら監視結果をユーザインターフェースを介して出力させる監視部と、各監視対象オブジェクトに含まれる第１監視対象オブジェクトに設定された監視方法が変更される場合には、各監視対象オブジェクトに含まれる、第１監視対象オブジェクトに関連する第２監視対象オブジェクトに設定された監視方法を、変更に追従して変更させるための、監視方法変更部と、をそれぞれ実現させる。

　第２観点では、第１観点において、監視方法には、監視対象オブジェクトから取得される情報に基づいて所定の通知を出力するか否かを判定するための通知設定が含まれており、監視方法変更部は、第１監視対象オブジェクトについての通知設定が変更された場合、第２監視対象オブジェクトについての通知設定を、第１監視対象オブジェクトについての通知設定に一致させる。

　第３観点では、第２観点において、監視方法変更部は、各監視対象オブジェクトの中から第１監視対象オブジェクトに関連する監視対象オブジェクトを第２監視対象オブジェクトの候補として検索し、検索された候補の中からユーザにより選択される監視対象オブジェクトを、第２監視対象オブジェクトとする。

　第４観点では、第３観点において、監視方法変更部は、各監視対象オブジェクトのうち第１監視対象オブジェクトに直接関連する監視対象オブジェクトを候補として検索するか、あるいは、各監視対象オブジェクトのうち第１監視対象オブジェクトに直接関連する監視対象オブジェクト及び当該監視対象オブジェクトに直接関連する監視対象オブジェクトの両方を候補として検索するようになっている。

　第５観点では、第２観点において、複数の監視対象オブジェクトには、ホストマシンと、ホストマシン上で作動する仮想化機構により生成される仮想マシンとが含まれており、第１監視対象オブジェクトはホストマシンであり、第２監視対象オブジェクトは仮想マシンであり、監視方法変更部は、ホストマシンについての第１通知設定が所定の通知を出力しない設定に変更された場合、仮想マシンについての第２通知設定を所定の通知を出力しない設定に変更させる。

　第６観点では、第２観点において、複数の監視対象オブジェクトには、ホストマシンと、ホストマシン上で作動し、仮想マシンを生成するための仮想化機構とが含まれており、第１監視対象オブジェクトは仮想マシンであり、第２監視対象オブジェクトは仮想化機構であり、監視方法変更部は、仮想マシンについての第１通知設定が所定の通知を出力しない設定に変更された場合、仮想化機構についての第２通知設定を所定の通知を出力しない設定に変更させる。

　第７観点では、第２観点において、複数の監視対象オブジェクトには、通信ポートを有するスイッチ装置が含まれており、第１監視対象オブジェクトはスイッチ装置であり、第２監視対象オブジェクトは通信ポートであり、監視方法変更部は、スイッチ装置についての第１通知設定が所定の通知を出力しない設定に変更された場合、通信ポートについての第２通知設定を所定の通知を出力しない設定に変更させる。

　第８観点では、第２観点において、複数の監視対象オブジェクトには、通信ポートを有するスイッチ装置と、通信ポートに接続される他の通信ポートを有する他の装置とが含まれており、第１監視対象オブジェクトは通信ポートであり、第２監視対象オブジェクトは他の通信ポートであり、監視方法変更部は、通信ポートについての第１通知設定が所定の通知を出力しない設定に変更された場合、他の通信ポートについての第２通知設定を所定の通知を出力しない設定に変更させる。

　第９観点では、第２観点において、監視方法には、監視対象オブジェクトの状態を、情報取得部により取得される情報を介して監視し、障害が検出された場合は所定の通知を出力させる第１モードと、監視対象オブジェクトの状態を監視しない第２モードと、監視対象オブジェクトの現在の状態が正常であるか否かを問わずに、正常であると判定する第３モードとが含まれている。

　第１０観点では、第９観点において、第３モードは、監視対象オブジェクトの状態が変更された場合には、第１モードに移行するようになっている。

　第１１観点では、第２観点において、複数の監視対象オブジェクトには、複数のノード装置と、各ノード装置の一部を構成するコンポーネント装置とが含まれており、監視方法では、各コンポーネント装置の有する複数の属性のうち所定の属性の状態に関する情報を情報取得部を介して取得するか否かと、所定の属性の状態に関する情報と所定の閾値とを比較することにより、所定の属性の状態を判定するか否かと、を各コンポーネント装置毎に設定することができる。

　第１２観点に従う管理システムの制御方法は、監視対象となる監視対象オブジェクトを監視する管理システムを制御するための方法であって、コンピュータシステムは、監視対象オブジェクトを複数含み、各監視対象オブジェクト毎に監視方法を設定し、各監視対象オブジェクトから情報を取得し、各監視方法と各監視対象オブジェクトから取得される情報とに基づいて、各監視対象オブジェクトを監視し、監視結果をユーザインターフェースを介して出力させ、各監視対象オブジェクトに含まれる第１監視対象オブジェクトに設定された監視方法が変更されたか否かを判定し、第１監視対象オブジェクトの監視方法が変更された場合には、各監視対象オブジェクトの中から、第１監視対象オブジェクトに関連する第２監視対象オブジェクトを検出し、第２監視対象オブジェクトに設定された監視方法を、第１監視対象オブジェクトの監視方法に一致させる。

　第１３観点に従う管理システムの制御方法は、コンピュータシステムの状態を監視する管理システムを制御する方法であって、コンピュータシステムは、監視対象となる監視対象オブジェクトを複数含み、各監視対象オブジェクトを監視するための監視方法は、監視対象オブジェクトに障害が検出された場合は所定の通知を出力させる第１モードと、監視対象オブジェクトの状態を監視しない第２モードと、監視対象オブジェクトの現在の状態が正常であるか否かを問わずに、正常であると判定する第３モードとが含まれており、各監視対象オブジェクト毎に、監視方法の有する複数のモードの中からいずれか一つのモードを設定し、各監視対象オブジェクトから情報を取得し、設定されたモードと各監視対象オブジェクトから取得される情報とに基づいて、各監視対象オブジェクトを監視し、監視結果を出力させる。

　第１４観点では、第１３観点において、第３モードは、監視対象オブジェクトの状態が変更された場合に、第１モードに移行するようになっている。

　第１５観点では、第１４観点において、複数の監視対象オブジェクトには、複数のノード装置と、各ノード装置の一部を構成するコンポーネント装置とが含まれており、監視方法では、各コンポーネント装置の有する複数の属性のうち所定の属性の状態に関する情報を取得するか否かと、所定の属性の状態に関する情報と所定の閾値とを比較することにより、所定の属性の状態を判定するか否かと、を各コンポーネント装置毎に設定することができる。

　なお、上記観点の組合せ以外の他の組合せも本発明の範囲に含まれる。さらに、本発明の全部または一部をコンピュータシステムとして構成し、記録媒体または通信媒体を介して流通させることもできる。

図１は、実施形態の概要を示す図である。図２は、管理システムを含む全体構成図である。図３は、監視装置のブロック図である。図４は、データベースの構成を示す図である。図５は、ノードとコンポーネントとメトリックの関係を示す図である。図６は、監視モードと非監視モードとメンテナンスモードとの関係を示す図である。図７は、監視の全体の流れを示すフローチャートである。図８は、ノードテーブルの構成例である。図９は、コンポーネントテーブルの構成例である。図１０は、メトリック共通設定テーブルの構成例である。図１１は、性能情報テーブルの構成例である。図１２は、スイッチポートテーブルの構成例である。図１３は、ＬＡＮポートテーブルの構成例である。図１４は、仮想マシンテーブルの構成例である。図１５は、コンポーネントの監視状態の変更方法を示す図である。図１６は、障害検知処理のフローチャートである。図１７は、メトリックを監視するための制御方法の組合せを示す説明図である。図１８は、メトリックを共通の設定で監視するための画面例を示す。図１９は、共通設定が適用される様子を示す図である。図２０は、メトリックの監視を個別設定する様子を示す図である。図２１は、性能情報を更新する処理を示すフローチャートである。図２２は、イベント一覧画面の例を示す。図２３は、グラフ表示処理のフローチャートである。図２４は、メトリックをグラフ表示する画面例である。図２５は、コンポーネントの監視制御とメトリックの監視制御との組合せパターンを説明する図である。図２６は、コンポーネントの有する複数メトリックのうち一部のメトリックを監視しない様子を示す図である。図２７は、ユーザがノードから一部のコンポーネントを意図的に切り離す様子を模式的に示す図。図２８は、ユーザがメンテナンス作業を行う様子を模式的に示す図。図２９は、ゲストＯＳの停止に連動させて仮想化機構の監視を停止させる様子を示す図。図３０は、監視状態を変更させる処理のフローチャート。図３１は、図３０中のＳ６６の詳細を示すフローチャート。図３２は、監視状態を変更させる関連ノードを選択する画面例。図３３は、第２実施例に係り、監視状態の連動方法を選択するための画面の例。図３４は、各連動方法によりノードが抽出される範囲を示す説明図。図３５は、全階層の関連ノードの中から選択する場合の画面例。図３６は、システム内の全ノードの中から選択する場合の画面例。図３７は、第３実施例に係り、スイッチの監視状態とスイッチポートの監視状態とを連動させる処理のフローチャート。図３８は、ノードテーブルの変化に応じてコンポーネントテーブルが変化する様子を示す図。図３９は、第４実施例に係り、一方の通信ポートの監視状態と、一方の通信ポートに接続される他方の通信ポートの監視状態とを連動させるための処理を示すフローチャート。図４０は、コンポーネントテーブルとスイッチポートテーブル及びＬＡＮポートテーブルが連動して更新される様子を示す図。

　以下、図面に基づいて、本発明の実施の形態を説明する。本発明は、後述のように、各監視対象オブジェクト（ノード及びコンポーネント）毎に監視方法を設定する。さらに、本発明では、互いに関連する監視対象オブジェクトのうち一方の監視対象オブジェクトの監視方法が変更された場合には、他方の監視対象オブジェクトの監視方法も連動して変更させる。さらに、本発明では、メンテナンス作業中に不要な警報が出力されるのを防止するために特別なモードを備えている。なお、後述の実施例では、監視対象オブジェクトのことを「ＩＴリソース」と呼ぶことがある。

　図１は、本実施形態の全体概要を示す説明図である。図１は、本発明の理解及び実施に必要な程度で記載されている。本発明の範囲は、図１に記載の構成に限定されない。図１に記載されていない特徴は、後述の実施例で明らかにされる。

　管理システム１は、コンピュータシステムに含まれる監視対象オブジェクト２Ａ，２Ｂ，２Ｃ等の状態を監視し、必要な場合には警報を出力する。管理システム１を説明する前に、先に監視対象オブジェクトとしてのノード及びコンポーネントを説明する。

　監視対象オブジェクトには、ノードと、ノードを構成する一つまたは複数のコンポーネントとが含まれる。ノードとは、通信ネットワークを構成する要素であり、例えば、サーバ２Ａ、スイッチ２Ｂ、ストレージ２Ｃ等を挙げることができる。特に区別する必要が無い場合、全体として「ノード２」と呼ぶ。

　サーバ２Ａは、例えば、通信ポート２Ａ１と、仮想化機構２Ａ２と、仮想マシン２Ａ３とを備える。通信ポート２Ａ１は、スイッチ２Ｂ等の他のノードと通信するためのコンポーネントである。仮想化機構２Ａ２は、サーバ２ＡのＯＳ（オペレーティングシステム）上に、仮想マシン２Ａ３を構築するためのコンポーネントである。仮想マシン２Ａ３は、サーバ２Ａに仮想的に設けられるサーバである。仮想マシン２Ａ３は、サーバ２Ａとは別のノードとして扱われる。なお、後述の実施例に示すように、サーバ２Ａは、例えば、マイクロプロセッサ、メモリ、ファイルシステム等の他のコンポーネントを備えることもできる。

　スイッチ２Ｂは、複数のスイッチポート２Ｂ１，２Ｂ２を備える。各スイッチポート２Ｂ１，２Ｂ２は、コンピュータシステム内の他のノードと通信するためのコンポーネントである。なお、スイッチ２Ｂは、例えば、マイクロプロセッサ、メモリ等の他のコンポーネントを備えることもできる。

　ストレージ２Ｃは、例えば、通信ポート２Ｃ１と、マイクロプロセッサ２Ｃ２と、ハードディスクドライブ２Ｃ３とを備える。通信ポート２Ｃ１は、スイッチ２Ｂ等の他のノードと通信するためのコンポーネントである。マイクロプロセッサ２Ｃ２は、ストレージ２Ｃの動作を制御するコンポーネントである。ハードディスクドライブ２Ｃ３は、データを記憶するためのコンポーネントである。

　管理システム１の構成を説明する。管理システム１は、例えば、マイクロプロセッサ３と、メモリ４と、通信インターフェース５と、ユーザインターフェース６とを備える。管理システム１は、一つのコンピュータから構成することもできるし、複数のコンピュータを連携させて構成することもできる。

　通信インターフェース５は、各ノード２Ａ－２Ｃと通信ネットワークＣＮを介して通信するための装置である。

　ユーザインターフェース６は、ユーザと情報を交換するための装置である。ユーザインターフェース６は、ユーザに情報を提供するための情報出力装置と、ユーザが情報を入力するための情報入力装置とを備える。情報出力装置としては、ディスプレイ装置またはプリンタ等を挙げることができる。情報入力装置としては、キーボード、ポインティングデバイス、タッチパネル、マイクロフォン等を挙げることができる。

　マイクロプロセッサ３は、メモリ４に記憶された各種コンピュータプログラムを読み込んで実行することにより、所定の機能３Ａ，３Ｂ，３Ｃ，３Ｄを実現させる。監視方法設定部３Ａは、各ノード及び各コンポーネント毎に監視方法を個別に設定するための機能である。

　監視方法は、例えば３つのモードを含む。第１モードは、各ノードまたは各コンポーネントの状態を監視するモードである。第１モードは監視モードと呼ぶことができる。第１モードでは、障害を検知した場合または性能情報が閾値を超えた場合に、「所定の通知」としての警報を出力する。第２モードは、各ノードまたは各コンポーネントの状態を監視しないモードである。第２モードは、非監視モードと呼ぶことができる。

　第３モードは、監視対象であるノードまたはコンポーネントの現在の状態が正常であるか否かを問わずに、正常であると判定するモードである。第３モードは、後述のようにメンテナンス作業において好適に用いることができるため、メンテナンスモードと呼ぶことができる。第３モードは、ノードまたはコンポーネントの状態がさらに変化した場合に、第１モードに移行する。第１モードに移行した場合に、状態の変化したノードまたはコンポーネントに異常が生じているならば、警報が出力される。

　情報取得部３Ｂは、各ノード及び各コンポーネントから情報を収集する機能である。収集された情報は、メモリ４または図示せぬハードディスクドライブ内に記憶させることができる。

　監視部３Ｃは、監視方法設定部３Ａにより設定される監視方法と情報取得部３Ｂにより収集される情報とに基づいて、各ノード及び各コンポーネントをそれぞれ監視するための機能である。さらに、監視部３Ｃは、監視結果をユーザインターフェース６を介して出力させる。

　監視方法変更部３Ｄは、各ノードまたは各コンポーネントのうち互いに関連するノードまたはコンポーネント間で、監視状態を連動させるための機能である。一つのノードと他の一つのノードとが関連する場合、一つのノードの監視方法が変更されると、それに合わせて他の一つのノードの監視方法も変更される。一つのノードの監視方法と一致するようにして、他の一つのノードの監視方法が変更される。

　例えば、一つのノードの監視方法が第１モードから第２モードに切り替えられた場合、他の一つのノードの監視方法も第２モードに切り替えられる。つまり、監視方法変更部３Ｄは、関連するノードまたはコンポーネント間において、一方の監視方法に追従させて他方の監視方法を変更させる。なお、後述のように、ノード間で監視状態を連動させるだけでなく、ノードとコンポーネントの間、コンポーネント同士の間で、それぞれ監視状態を連動させることもできる。

　本実施形態では、ユーザは、各ノード及び各コンポーネントについて、それぞれ個別に監視方法を設定する。監視部３Ｃは、各ノードまたは各コンポーネントからの情報に基づいて、障害または性能低下等が生じたか否かを判定する。監視部３Ｃは、障害等の発生が検出されると、ユーザインターフェース６を介してユーザに通知する。

　ユーザは、例えば、メンテナンス作業のために、一部のノードまたは一部のコンポーネントをシステムから取り外すことがある。そのメンテナンス作業の際に、ユーザは、取り外し対象のノードまたはコンポーネントの監視状態を、あらかじめ第２モード（非監視モード）または第３モード（メンテナンスモード）のいずれかに変更する。

　監視方法変更部３Ｄは、監視状態の変更されたノードまたはコンポーネントに関連する、他のノードまたはコンポーネントを、コンピュータシステム内から抽出する。抽出されたノードまたはコンポーネントは、ユーザインターフェース６を介して、ユーザに提示される。ユーザは、提示されたノードまたはコンポーネントの中から、監視状態を変更させるノードまたはコンポーネントを選択する。ユーザにより選択されたノードの監視状態またはコンポーネントの監視状態は、メンテナンス作業等のために最初に監視状態の変更されたノードの監視状態またはコンポーネントの監視状態に合わせて変更される。

　このように構成される本実施形態では、各ノードまたは各コンポーネント毎に監視方法を設定することができるため、ユーザの使い勝手が向上する。例えば、使用する予定の無いノードを監視しないモードに設定したり、ノードの有する複数コンポーネントのうち一部のコンポーネントについて、監視しないモードに設定することができる。従って、不要な警報が出力されるのを未然に防止でき、本当の障害発生が不要な警報の中に埋もれてしまうのを防止できる。

　さらに、本実施形態では、関連するノード間またはコンポーネント間で、監視状態を連動させることができる。従って、ユーザは、関連するノードまたはコンポーネントの監視状態を手動で変更する必要がなく、ユーザの使い勝手が向上する。

　さらに、本実施形態では、監視方法の中に、ノードまたはコンポーネントを監視する第１モードと、ノードまたはコンポーネントを監視しない第２モードと、ノードまたはコンポーネントの現在の状態を問わずに正常であると判断する（または、異常ではないと判断する）第３モードとの３つのモードを用意している。従って、ユーザは、各ノード及び各コンポーネントにそれぞれ適切なモードを設定することができ、ユーザの使い勝手が向上する。

　さらに、第３モードは、ノードまたはコンポーネントの状態がさらに変化した場合に第１モードに移行するため、メンテナンス作業時に好適に用いることができる。例えば、ユーザは、メンテナンス作業の開始前に、メンテナンス作業の対象となっているノードまたはコンポーネントの監視状態を第３モードに設定する。メンテナンス作業が終了した場合、ユーザは、第３モードに設定されたノードまたはコンポーネントの監視状態を第１モードに手動で変更する必要はない。ユーザは、メンテナンス作業の対象となったノードまたはコンポーネントの監視状態を第３モードにしたままで放置することができる。もしも、メンテナンス作業の対象となったノードまたはコンポーネントの状態が変化して異常が生じた場合、第３モードから第１モードに自動的に切り替り、警報が出力される。従って、ユーザの使い勝手が向上する。以下、本実施形態を詳細に説明する。

　図２は、本実施例におけるシステムの全体概要を示す。先に図１との対応関係を説明すると、監視装置１０は管理システム１に、サーバ２１Ａ，２１Ｂはノード２Ａに、スイッチ２２はノード２Ｂに、ストレージ２３はノード２Ｃに、通信ネットワークＣＮ１は通信ネットワークＣＮに、それぞれ対応する。

　さらに、図３に示す制御部１３０とユーザインターフェース部１１０とデータベース処理部１２０が協働することにより、監視方法設定部３Ａと監視部３Ｃと監視方法変更部３Ｄとが実現される。図３に示す情報取得部１４０は、情報取得部３Ｂに対応する。図３に示すユーザインターフェース部１１０は、ユーザインターフェース６に対応する。

　図２には、ノードとしてのサーバが複数示されている。一つのサーバ２１Ａは、仮想サーバ（２１４Ａ）を生成する。サーバ２１Ａは、通信ポート２１０Ａと、マイクロプロセッサ２１１Ａと、ホストＯＳ２１２Ａと、複数の仮想化機構２１３Ａと、複数のゲストＯＳ２１４Ａとを備える。

　仮想化機構２１３Ａは、ホストＯＳ２１２Ａの有するコンポーネントである。仮想化機構２１３Ａは、ホストＯＳ上にゲストＯＳ２１４Ａを生成するソフトウェアである。ホストＯＳ２１２Ａは一つのノードである。ゲストＯＳ２１４Ａは、ホストＯＳ２１２Ａとは別の一つのノードである。なお、通信ポート２１０Ａ及びマイクロプロセッサ２１１Ａは、サーバ２１Ａを構成するコンポーネントである。ゲストＯＳ２１４Ａは、仮想的に生成される仮想サーバ、または、仮想マシンと呼ぶこともできる。

　他の一つのサーバ２１Ｂは、通信ポート２１０Ｂと、マイクロプロセッサ２１１Ｂと、ハードディスクドライブ２１５Ｂとを備える。それら通信ポート２１０Ｂ、マイクロプロセッサ２１１Ｂ及びハードディスクドライブ２１５Ｂは、サーバ２１Ｂを構成するコンポーネントである。

　以下の説明では、サーバ２１Ａとサーバ２１Ｂとを区別する必要が無い場合、「サーバ２１」と呼ぶ。同様に、「マイクロプロセッサ２１１」、「通信ポート２１０」と呼ぶことがある。

　スイッチ２２は、コンピュータシステム内の複数のサーバ２１と複数のストレージ２３とを通信可能に接続するノードである。スイッチ２２は、コンポーネントとして、複数の通信ポート２２０（スイッチポート２２０）を有する。

　ストレージ２３は、サーバ２１により使用されるデータを記憶するノードである。ストレージ２３は、コンポーネントとして、通信ポート２３０と、マイクロプロセッサ２３１と、ハードディスクドライブ２３２とを有する。

　監視装置１０は、第１通信ネットワークＣＮ１を介して、各サーバ２１とスイッチ２２とストレージ２３とに通信可能に接続されている。サーバ２１とスイッチ２２とストレージ２３とは、通信ネットワークＣＮ２を介して接続される。第１通信ネットワークＣＮ１は、管理用の通信ネットワークであり、例えば、ＬＡＮ（Local Area Network）のように構成される。第２通信ネットワークＣＮ２は、Ｉ／Ｏ（Input/Output）用の通信ネットワークであり、例えば、ＦＣ＿ＳＡＮ（Fibre Channel_Storage Area Network）またはＩＰ＿ＳＡＮ（Internet Protocol_SAN）のように構成される。なお、単一の通信ネットワークを用いる構成でもよい。

　図３は、監視装置１０の構成を示すブロック図である。「管理システム」としての監視装置１０は、図１で述べたように、マイクロプロセッサ、メモリ及び通信インターフェース等を備えるコンピュータ装置として構成される。

　監視装置１０は、例えば、ユーザインターフェース部１１０と、データベース処理部１２０と、制御部１３０と、情報取得部１４０と、データベース１５０とを備える。

　ユーザインターフェース部１１０は、ユーザと情報を交換するための機能である。ユーザインターフェース部１１０は、データベース処理部１２０と、制御部１３０とにそれぞれ接続されている。ユーザから入力された条件等は、ユーザインターフェース部１１０を介して、データベース処理部１２０または制御部１３０に伝達される。データベース処理部１２０または制御部１３０での処理結果等は、ユーザインターフェース部１１０を介して、ユーザに通知される。なお、電子メール等を用いて、ユーザに情報を提供する構成でもよい。

　データベース処理部１２０は、データベース１５０を制御するための機能である。データベース処理部１２０は、ユーザインターフェース部１１０から要求されたデータをデータベース１５０から取得して、ユーザインターフェース部１１０に返す。さらに、データベース処理部１２０は、制御部１３０からの要求に応じて、データベース１５０を更新等させる。

　制御部１３０は、監視装置１０の動作を制御する機能である。制御部１３０は、ユーザインターフェース部１１０または情報取得部１４０から入力される情報を処理する。制御部１３０は、データベース処理部１２０を介してデータベース１５０を更新させたり、または、ユーザインターフェース部１１０を介してユーザに情報を提供する。

　情報取得部１４０は、コンピュータシステム２０内のノード及びコンポーネントから情報を取得するための機能である。なお、コンピュータシステム２０内のノード及びコンポーネントを、ＩＴ（Information Technology ）リソースと総称することができる。

　なお、監視装置１０は、ユーザインターフェース部１１０を直接有する必要はない。例えば、監視装置１０を操作するための操作端末を監視装置１０に接続し、その操作端末を介してユーザからの操作を受け入れたり、ユーザに通知する構成としてもよい。なお、表示用端末と操作用端末とを監視装置１０に接続する構成、表示用端末のみを監視装置１０に接続し、操作は監視装置１０の入力装置を使用する構成でもよい。さらに、監視装置１０は、単一のコンピュータ装置として構成される必要はなく、複数のコンピュータ装置から一つの監視装置１０を構成してもよい。

　図４は、データベース１５０の構成を示す。データベース１５０には、例えば、ノードテーブル１５１と、コンポーネントテーブル１５２と、メトリック共通設定テーブル１５３と、性能情報テーブル１５４と、スイッチポートテーブル１５５と、ＬＡＮポートテーブル１５６と、仮想マシンテーブル１５７と、が記憶される。各テーブル１５１－１５７の構成は、後述する。なお、データベース１５０の構成及び各テーブル１５１－１５７の構成は、図示の例に限定されない。例えば、一つのテーブルを複数のテーブルから構成したり、または、複数のテーブルを一つのテーブルにまとめたりすることもできる。

　なお、以下、本実施例で使用される情報の構成を説明するために、「テーブル」、「リスト」、「キュー」等の用語を用いるが、情報の構成はそれらの形式に限定されない。つまり、本実施例で使用される各情報は、テーブル、リスト、キュー以外のデータ構造であってもよい。さらに、各情報の内容を説明するために、「識別情報」、「識別子」、「ＩＤ」、「名称」という表現を使用するが、それらの表現は互いに置換可能である。

　図５は、ノードとコンポーネント及びメトリックの関係を模式的に示す。コンピュータシステムの構成要素であるノードは、一つ以上のコンポーネントを含む。コンポーネントは、一つまたは複数のメトリックを備える場合がある。

　ノードとしては、例えば、サーバ２１、スイッチ２２、ストレージ２３等を挙げることができる。コンポーネントとしては、例えば、マイクロプロセッサ、通信ポート（スイッチポート、ＬＡＮポート）、メモリ、ハードディスクドライブ、仮想化機構等を挙げることができる。

　メトリックとは、測定のための基準、または、判断指標である。例えば、コンポーネントがマイクロプロセッサである場合、メトリックとして、ＣＰＵ稼働率等を挙げることができる。コンポーネントがハードディスクドライブの場合、メトリックとして、読み出し負荷、書込み負荷、ディスク転送時間（平均値。以下同様。）等を挙げることができる。コンポーネントが通信ポートである場合、メトリックとして、パケット受信量（平均値。以下同様。）、バケット送信量（平均値。以下同様。）等を挙げることができる。監視装置１０は、各コンポーネントのメトリックを監視することにより、各コンポーネントに異常が生じたか否かを判定する。

　図６は、監視装置１０によるコンポーネントの監視方法を模式的に示す。コンポーネントの監視方法は、以下の３つの状態（モード）を含む。第１の状態は、「第１モード」としての監視状態である。第２の状態は、「第２モード」としての非監視状態である。第３の状態は、「第３モード」としてのメンテナンス状態である。

　コンポーネントが監視状態に設定されると、監視装置１０は、そのコンポーネントから収集される情報に基づいて監視する。監視装置１０は、メトリックの値が所定の閾値を超えた場合、または、所定の閾値を下回った場合に、警報を出力する。

　コンポーネントが非監視状態に設定されると、監視装置１０は、そのコンポーネントを監視しない。監視装置１０は、そのコンポーネントから収集される情報を無視し、メトリックの値と閾値とを比較せず、警報も出力しない。

　コンポーネントがメンテナンス状態に設定されると、監視装置１０は、そのコンポーネントを正常であるとして取り扱う。つまり、そのコンポーネントからリンクダウン等の障害信号が検出された場合でも、監視装置１０は、そのコンポーネントは正常であるとして扱う。メンテナンス状態にあるコンポーネントの状態がさらに変更すると、メンテナンス状態から監視状態に移行する。そのコンポーネントに障害が発生している場合、監視装置１０は、警報を出力する。

　監視状態と非監視状態との間で双方向の移行が可能である。監視状態からメンテナンス状態への移行、及び、メンテナンス状態から監視状態への移行も可能である。上述の通り、メンテナンス状態から監視状態への移行は、コンポーネント状態の変化を契機として自動的に行うことができる。メンテナンス状態から非監視状態への移行は可能である。非監視状態からメンテナンス状態に移行することはできない。非監視状態からは監視状態にのみ移行できる。なお、上述の監視方法の状態遷移は、例示であって、本発明は図６に示す例に限定されない。

　図７は、監視方法の全体の流れを示すフローチャートである。以下に述べる各処理は、メモリに記憶された各プログラムをマイクロプロセッサが読み込んで実行することにより実現される。従って、以下の各処理の主語は、プログラムであってもよいし、マイクロプロセッサであってもよい。あるいは、以下の各処理の主語を監視装置、コントローラまたはサーバ等として、説明することもできる。

　なお、各プログラムの全部または一部を専用ハードウェア回路として実現する構成でもよい。各プログラムは、プログラムを配布するためのプログラム配布サーバを介して、ファイルサーバにインストールさせることができる。さらに、記録媒体に固定された各プログラムを、ファイルサーバに読み込ませてインストールさせてもよい。

　図７に示すように、まず、ユーザは、各ＩＴリソース（各ノード及び各コンポーネント）毎に、監視方法を設定する（Ｓ１０）。監視方法の種類としては、監視状態（監視モード）、非監視状態（非監視モード）、メンテナンス状態（メンテナンスモード）の３つが予め用意されている。

　ユーザは、状況に応じて適切な監視方法を設定することができる。例えば、通常の監視を希望する場合、ユーザは、そのＩＴリソースを監視状態に設定する。例えば、使用されていないＩＴリソースをコンピュータシステム２０から取り除く場合、ユーザは、そのＩＴリソースを非監視状態に設定する。これにより、その未使用ＩＴリソースをコンピュータシステム２０から切り離した場合でも、監視装置１０から警報は出力されない。

　さらに例えば、メンテナンス作業の場合、ユーザは、メンテナンス作業の対象であるＩＴリソースをメンテナンス状態に設定する。メンテナンス作業中は、メンテナンス作業対象であるＩＴリソースの実際の状態は「異常」である。しかし、監視装置１０は、メンテナンス状態に設定されたＩＴリソースを正常なものとして取り扱うため、警報は出力されない。このように、ユーザが部品交換等のメンテナンス作業をした場合でも、メンテナンス状態に設定されたＩＴリソースについての警報は出力されない。

　メンテナンス作業が終了すると、そのＩＴリソースの実際の状態は「異常」から「正常」に自動的に移行する。従って、メンテナンス作業後に、ユーザが手動操作で、メンテナンス対象のＩＴリソースを監視状態に戻す必要はない。メンテナンス作業後に、そのＩＴリソースに障害が発生した場合、監視装置１０は、警報を出力する。

　続いて、ユーザは、各コンポーネントについてメトリックの監視方法を設定することができる（Ｓ１１）。メトリックの監視方法には、例えば、グラフ表示を行うか否か、イベント通知を行うか否か、の設定が含まれる。監視装置１０は、コンポーネントから収集した性能情報（メトリック用の情報）の時間変化をグラフ表示させることができる。さらに、監視装置１０は、コンポーネントから収集される性能情報と所定の閾値とを比較し、イベントの発生を通知することができる。グラフ表示及びイベント通知は、ユーザインターフェース部１１０を介してユーザに提供される。

　監視装置１０は、情報取得部１４０を介してコンピュータシステム２０内の各ＩＴリソースから情報を取得し、記憶する（Ｓ１２）。監視装置１０は、Ｓ１１で設定された内容に従って、性能情報の変化を示すグラフを表示する（Ｓ１３）。監視装置１０は、ＩＴリソースの状態に基づいて、イベントを通知したり、警報を出力する（Ｓ１４）。

　図８は、ノードテーブル１５１を示す。ノードテーブル１５１は、各ノードを管理するためのテーブルである。ノードテーブル１５１は、例えば、ノードＩＤ１５１０と、ノード名１５１１と、種別１５１２と、状態１５１３と、監視状態１５１４と、共通設定１５１５と、仮想サーバホストＩＤ１５１６とを含む。

　ノードＩＤ１５１０は、各ノードをコンピュータシステム内で一意に識別する情報である。ノード名１５１１は、ノードの名称である。種別１５１２は、ノードの種別を示す。ノード種別としては、例えば、サーバ、スイッチ、ストレージ等がある。状態１５１３は、ノードの状態を示す。状態１５１３としては、例えば、「正常」、「異常」がある。監視状態１５１４は、ノードに設定された監視方法を示す。監視状態１５１４に設定可能な値としては、上述の通り、「監視」、「非監視」、「メンテナンス」がある。共通設定１５１５は、後述の「メトリック共通設定」を適用するか否かを示す。仮想サーバホストＩＤ１５１６は、仮想サーバの設けられているホストを特定するための情報である。ノードが仮想的に構築されたサーバ（仮想サーバ、または、仮想ＯＳとも呼ぶ）である場合、その仮想サーバが設けられているノードを特定する。

　図９は、コンポーネントテーブル１５２を示す。コンポーネントテーブル１５２は、各コンポーネントを管理するためのテーブルである。コンポーネントテーブル１５２は、例えば、コンポーネントＩＤ１５２０と、コンポーネント名１５２１と、種別１５２２と、ノードＩＤ１５２３と、状態１５２４と、監視状態１５２５と、共通設定１５２５とを、含む。

　コンポーネントＩＤ１５２０は、コンポーネントをコンピュータシステム内で一意に識別する情報である。コンポーネント名１５２１は、コンポーネントの名称である。種別１５２２は、コンポーネントの種別を示す。コンポーネント種別としては、例えば、マイクロプロセッサ、ハードディスクドライブ、仮想化機構（図中、ＶＭ）等がある。ノードＩＤ１５２３は、コンポーネントが所属するノードを特定する情報である。状態１５２４は、コンポーネントの状態を示す。コンポーネント状態には、正常と異常がある。監視状態１５２５は、コンポーネントの監視方法を示す。コンポーネントの監視方法としては、「監視」、「非監視」、「メンテナンス」の３種類を挙げることができる。共通設定１５２６は、メトリック共通設定を適用するか否かを示す情報である。

　図１０は、メトリック共通設定テーブル１５３を示す。メトリック共通設定テーブル１５３は、各メトリックのタイプ毎に、設定値を管理する。メトリック共通設定テーブル１５３は、例えば、メトリックタイプ１５３０と、グラフ表示１５３１と、イベント通知１５３２と、警告閾値１５３３と、異常閾値１５３４とを含む。

　メトリックタイプ１５３０は、メトリックのタイプを示す情報である。メトリックのタイプとしては、例えば、「ＣＰＵ稼働率」、「パケット受信量」、「パケット送信量」、「ディスク書込み負荷」、「ディスク読み出し負荷」等がある。グラフ表示１５３１は、メトリックに関する情報（性能情報）をグラフ表示するか否かを示すフラグである。グラフ表示する場合は「ｔｒｕｅ」が設定され、グラフ表示しない場合は「ｆａｌｓｅ」が設定される。

　イベント通知１５３３は、イベント発生時に通知するか否かを示すフラグである。イベント通知する場合は「ｔｒｕｅ」が設定され、イベント通知しない場合は「ｆａｌｓｅ」が設定される。

　警告閾値１５３３は、イベントとしての警告を出力するための閾値を示す。メトリックの値が警告閾値を超えた場合、または、下回った場合、警告が出力される。例えば、メトリックタイプがマイクロプロセッサ稼働率である場合、マイクロプロセッサ稼働率が８０％を超えると、警告が出力される。さらに例えば、メトリックタイプがメモリ残量の場合、メモリ残量が１０００ＭＢを下回った場合に、警告が出力される。

　異常閾値１５３４は、他のイベントとしての異常警告を出力するための閾値を示す。異常警告は、通常の警告よりも緊急性が高い。メトリックの値が異常閾値を超えた場合、または、異常閾値を下回った婆、異常警告が出力される。上記の例では、マイクロプロセッサ稼働率が９０％を超えると、異常警告が出力される。メモリ残量が５００ＭＢを下回った場合、異常警告が出力される。イベント通知１５３２が「ｆａｌｓｅ」に設定されている場合、警告閾値１５３３と異常閾値１５３４には値を設定できない。

　図１１は、性能情報テーブル１５４を示す。性能情報テーブル１５４は、ノード及びコンポーネント（ＩＴリソース）から収集された性能情報の管理方法を示す。性能情報テーブル１５４は、例えば、コンポーネントＩＤ１５４０と、メトリックＩＤ１５４１と、メトリックタイプ１５４２と、状態１５４３と、グラフ表示１５４４と、イベント通知１５４５とを含む。

　コンポーネントＩＤ１５４０は、性能情報の取得されたコンポーネントを特定する情報である。メトリックＩＤ１５４１は、コンポーネントから取得された性能情報を識別するための情報である。メトリックタイプ１５４２は、性能情報の種別を示す。状態１５４３は、性能情報が正常であるか異常であるかを示す。グラフ表示１５４４は、性能情報をグラフ表示するか否かを示す。イベント通知１５４５は、性能情報についてのイベントを通知するか否かを示す。

　図１２は、スイッチポートテーブル１５５を示す。スイッチポートテーブル１５５は、スイッチ２２の有する各通信ポート（スイッチポート）を管理するテーブルである。

　スイッチポートテーブル１５５は、例えば、ポートＩＤ１５５０と、コンポーネントＩＤ１５５１と、ＭＡＣアドレス１５５２とを含む。ポートＩＤ１５５０は、各スイッチポートを識別するための情報である。コンポーネントＩＤ１５５１は、スイッチポートを有するコンポーネント（つまり、スイッチ２２）を特定する情報である。ＭＡＣアドレス１５５２は、スイッチポートに割り当てられているＭＡＣ（Media Access Control）アドレスを示す。

　図１３は、ＬＡＮポートテーブル１５６を示す。ＬＡＮポートテーブル１５６は、サーバ２１またはストレージ２３の有する通信ポート（ＬＡＮポート）を管理するためのテーブルである。なお、本実施例では、ＬＡＮポートと呼ぶが、通信ネットワークの構成はＬＡＮ以外であってもよい。

　ＬＡＮポートテーブル１５６は、例えば、ポートＩＤ１５６０と、コンポーネントＩＤ１５６１と、ＭＡＣアドレス１５６２と、接続先のスイッチポートのＭＡＣアドレス１５６３とを含む。ポートＩＤ１５６０は、ＬＡＮポートを識別するための情報である。コンポーネントＩＤ１５６１は、ＬＡＮポートを有する装置（サーバまたはストレージ）を特定するための情報である。ＭＡＣアドレス１５６２は、ＬＡＮポートに割り当てられているＭＡＣアドレスを示す。接続先スイッチポートのＭＡＣアドレス１５６３は、ＬＡＮポートの接続されるスイッチポートの有するＭＡＣアドレスである。なお、スイッチポートテーブル１５５に、スイッチポートが接続されているＬＡＮポートのＭＡＣアドレスを管理するための欄を設ける構成でもよい。その構成の場合は、ＬＡＮポートテーブル１５６から、接続先スイッチポートのＭＡＣアドレス欄１５６３を取り除くことができる。

　図１４は、仮想マシンテーブル１５７を示す。仮想マシンテーブル１５７は、仮想化機構２１３Ａを管理するテーブルである。仮想マシンテーブル１５７は、例えば、仮想マシンＩＤ１５７０と、コンポーネントＩＤ１５７１と、仮想サーバ名１５７２と、ホストノードＩＤ１５７３とを含む。

　仮想マシンＩＤ１５７０は、各仮想マシン（つまり、仮想化機構）を識別するための情報である。コンポーネントＩＤ１５７１は、仮想マシンに割り当てられているコンポーネントＩＤを示す。仮想サーバ名１５７２は、仮想マシン上に設けられている仮想サーバを特定するための名称である。ホストノードＩＤ１５７３は、仮想マシンが設けられているホストを特定するための情報である。

　図１５は、各コンポーネント毎に監視方法を設定でき、かつ、設定内容を後から変更することができる様子を示す。図１５の上側に示すコンポーネント一覧画面Ｇ１０（１）は、設定変更前の様子を示す。図１５の下側に示す他のコンポーネント一覧画面Ｇ１０（２）は、設定変更後の様子を示す。コンポーネント一覧画面Ｇ１０（１），Ｇ１０（２）は、ユーザインターフェース部１１０を介してユーザに提示される。コンポーネント一覧画面Ｇ１０は、コンピュータシステム内の各コンポーネントの名称及び状態を一覧表示させるための画面である。

　画面Ｇ１０（１）に示す例では、ユーザは、「コンポーネント１」の監視方法を変更すべく、「コンポーネント１」の状態を示す欄を右クリックし、メニューＭ１０を表示させる。そのメニューＭ１０には、監視方法として選択可能な３つの状態が表示される。なお、現在の監視方法は選択不能に表示させることができる。ここでは、「コンポーネント１」の現在の監視方法として「監視」が設定されており、ユーザは、監視方法を「監視」から「非監視」に変更する場合を説明する。以下の説明では、各テーブルのうち説明に関係する部分を抜き出して表示することがある。

　ユーザが監視方法を選択するためのメニューＭ１０から「非監視」を選択すると、監視装置１０は、コンポーネントテーブル１５２の監視状態１５２５を「非監視」に書き換えさせる。これにより、コンポーネント一覧画面Ｇ１０（２）は、「コンポーネント１」の状態を「非監視」にして表示させる。

　図１６は、障害を検知するための処理を示すフローチャートである。監視装置１０は、各ＩＴリソースの情報を情報取得部１４０を介して取得する（Ｓ２０）。図中では、コンポーネント及びノードと示すが、ここでは、ＩＴリソースと呼ぶ場合がある。監視装置１０は、取得した情報と所定の閾値とを比較することにより、そのＩＴリソースに障害が発生しているか否かを判定する（Ｓ２１）。障害が発生していない場合（Ｓ２１：ＮＯ）、本処理は終了する。

　障害が発生している場合（Ｓ２１：ＹＥＳ）、監視装置１０は、障害発生の検出されたＩＴリソースに非監視モードが設定されているか否かを判定する（Ｓ２２）。非監視モードが設定されている場合（Ｓ２２：ＹＥＳ）、本処理は終了する。

　障害の発生しているＩＴリソースに非監視モードが設定されていない場合（Ｓ２２：ＮＯ）、監視装置１０は、そのＩＴリソースにメンテナンスモードが設定されているか否かを判定する（Ｓ２３）。メンテナンスモードが設定されていない場合（Ｓ２３：ＮＯ）、そのＩＴリソースには監視モードが設定されているため、監視装置１０は、障害の種類及び程度に応じたイベントをユーザに通知する（Ｓ２４）。

　障害の検出されたＩＴリソースにメンテナンスモードが設定されている場合（Ｓ２３：ＹＥＳ）、監視装置１０は、そのＩＴリソースの状態が前回の状態から変化したか否かを判定する（Ｓ２５）。メンテナンスモードに設定されているＩＴリソースの状態が変更されていない場合（Ｓ２５：ＮＯ）、本処理を終了する。

　メンテナンスモードに設定されている場合（Ｓ２５：ＹＥＳ）、監視装置１０は、メンテナンスモードを監視モードに切り替えさせて、本処理を終了する（Ｓ２６）。なお、メンテナンス終了後に自動的にメンテナンスモードから監視モードに移行させる構成の場合、Ｓ２５及びＳ２６は不要となる。

　いずれにせよ、ＩＴリソースがメンテナンスモードに設定されている場合、そのＩＴリソースで検出される障害は、ユーザの予期している障害である。従って、監視装置１０はイベントを通知しない。これにより、不要なイベントの通知が抑制され、ユーザの把握すべき重要なイベントにユーザの注意を集めることができる。

　図１７は、メトリックの監視制御を示す。図１７のテーブルは、メトリック監視制御の構成を示すための説明用テーブルであり、実際には存在せず、監視装置１０内に記憶されていない。

　メトリックを監視するための方法は、性能情報を取得するか否かＣ１００と、メトリック状態の判定を行うか否かＣ１０１との組合せによって異なる。その結果、ユーザへの通知内容Ｃ１０２も相違する。

　性能情報を取得する場合、メトリック状態を判定する、または、メトリック状態を判定しない、のいずれか一つを選択できる。メトリック状態を判定する場合、取得した性能情報と所定の閾値とを比較してメトリック状態が判定される。性能情報を取得してメトリック状態を判定する場合、監視装置１０は、性能情報のグラフを表示し、さらに、イベントの発生をユーザに通知する。

　性能情報を取得するが、メトリック状態の判定を行わない場合、監視装置１０は、性能情報のグラフを表示するが、イベントは通知しない。

　性能情報を取得しない場合、メトリック状態の判定を行うことはできない。監視装置１０は、グラフ表示もイベント通知のいずれも行わない。性能情報を取得していないため、グラフを作成することも閾値と比較することもできないためである。

　図１８は、メトリック共通設定画面Ｇ２０を示す。この画面Ｇ２０は、図１７に示したメトリックの監視方法を複数のメトリックに適用するための画面である。

　メトリック共通設定画面Ｇ２０は、例えば、グラフ表示欄ＧＰ２０と、イベント通知欄ＧＰ２１と、メトリックタイプ欄ＧＰ２２と、警告閾値欄ＧＰ２３と、異常閾値欄ＧＰ２４とを含む。

　グラフ表示欄ＧＰ２０がチェックされた場合は、グラフ表示を行うことを意味する。同様に、イベント通知欄ＧＰ２１がチェックされた場合は、イベント通知が行われることを意味する。メトリックタイプ欄ＧＰ２２は、メトリックのタイプを表示する。警告閾値欄ＧＰ２３は、そのメトリックについて警告を発するための閾値を表示する。異常閾値欄ＧＰ２４は、そのメトリックが異常である旨を発するための閾値を表示する。

　図１８に示す例では、メトリックタイプ「タイプ１」の場合、グラフ表示及びイベント通知が行われる。さらも、「タイプ１」の場合、メトリックタイプに関する性能情報の値が８０％を超えると警告が発せられ、９０％を超えると異常警報が発せられる。

　メトリックタイプ「タイプ２」の場合、グラフ表示は行われるが、イベントは通知されない。なお、イベントは通知されないため、警告閾値欄ＧＰ２３及び異常閾値欄ＧＰ２４は空欄であってもよい。図１８では、参考のために閾値を表示している。

　メトリックタイプ「タイプ３」の場合、グラフも表示されないし、イベントも通知されない。前記同様に、警告閾値欄ＧＰ２３及び異常閾値欄ＧＰ２４は空欄にすることができるが、便宜上、閾値の例を表示させている。

　メトリックタイプ１は、例えば、マイクロプロセッサ稼働率である。メトリックタイプ２は、例えば、メモリ残量である。メトリックタイプ３は、例えば、バケット受信量またはバケット送信量である。図１８に示すように、本実施例では、メトリックの監視方法をメトリックタイプ毎に類型化しておき、ユーザによる設定の手間を軽減する。

　図１９は、あるノードの全体にメトリック共通設定を適用する様子を示す。図１９の下側には、監視ノード一覧画面Ｇ３０が示されている。監視ノード一覧画面Ｇ３０は、監視されている各ノードの状態等を一覧表示する画面である。監視ノード一覧画面Ｇ３０は、例えば、ノード名欄ＧＰ３０と、ノード種別欄ＧＰ３１と、状態欄ＧＰ３２と、性能欄ＧＰ３３とを含む。

　ノード名欄ＧＰ３０は、ノードの名称を表示する。ノード種別欄ＧＰ３１は、ノードの種別を表示する。状態欄ＧＰ３２は、ノードの状態が正常であるか異常であるかを表示する。性能欄ＧＰ３３は、そのノードに関するメトリックの状態が正常であるか異常であるかを表示する。

　ユーザは、所望のノード（例えば、ノードＩＤ００１のノード）を選択して右クリックする。これにより、メトリック共通設定を適用させるためのメニューＭ２０が画面に表示される。ユーザがメトリック共通設定の適用を指示すると、メトリック共通設定テーブル１５３で定義されている設定内容（メトリックの監視制御の内容）が、選択されたノードの全体に適用される。ノードテーブル１５１では、ユーザにより選択されたノードの共通設定１５１５に「適用」と設定される。

　図２０は、図１９でメトリック共通設定がノード全体に適用された場合の、メトリック一覧画面Ｇ４０を示す。図１９の例では、ノードＩＤ００１のノード全体に、メトリック共通設定が適用された。そのため、そのノードに含まれる複数のメトリックは、そのタイプ別に共通の値が設定される。

　メトリック一覧画面Ｇ４０は、例えば、グラフ表示欄ＧＰ４０と、イベント通知欄ＧＰ４１と、メトリック名欄ＧＰ４２と、状態欄ＧＰ４３とを含む。グラフ表示欄ＧＰ４０は、グラフ表示するか否かを示す。チェックマークが設定されている場合は、グラフ表示することを示す。イベント通知欄ＧＰ４１は、イベントを通知するか否かを示す。チェックマークが設定されている場合、イベントを通知することを示す。メトリック名欄ＧＰ４２は、メトリックの名称とメトリックタイプを示す。状態欄ＧＰ４３は、メトリックが正常であるか否かを示す。

　図１８にも示すように、メトリックタイプ１では、グラフ表示及びイベント通知を行い、メトリックタイプ２ではグラフ表示のみを行い、メトリックタイプ３ではグラフ表示もイベント通知も行わない。メトリック共通設定がノード全体に適用された場合、図２０の画面Ｇ４０に示すように、メトリックタイプ１のメトリック１及びメトリック４では、グラフ表示及びイベント通知が行われる。メトリックタイプ２のメトリック２及びメトリック５では、グラフ表示のみが行われる。メトリックタイプ３のメトリック３では、グラフ表示もイベント通知も行われない。

　このように、ユーザは、複数のメトリックを含むノードの全体について、一括して監視方法を設定することができ、使い勝手が向上する。さらに、ユーザは、メトリック共通設定の一部を手動で変更することもできる。

　例えば、メトリック５のグラフ表示を止めさせたい場合、ユーザは、メトリック５のグラフ表示欄ＧＰ４０のチェックマークを外す（Ｓ３０）。監視装置１０は、性能情報テーブル１５４のうち、ユーザによりチェックマークの外されたメトリックＩＤに対応するグラフ表示１５４４の値を「ｆａｌｓｅ」に変更させる（Ｓ３１）。

　このように、本実施例では、同一タイプの複数メトリックに、予め用意された共通の監視設定を一括して適用することができ、さらに、共通に設定された値の一部を、ユーザの好みに応じて変更させることができる。これにより、ユーザの使い勝手が向上する。

　図２１は、性能情報の更新処理を示すフローチャートである。監視装置１０は、性能情報テーブル１５４から、各メトリック毎のグラフ表示１５４４の設定値及びイベント通知１５４５の設定値を、それぞれ取得する（Ｓ４０）。

　監視装置１０は、各メトリックについてグラフ表示が設定されているか否かを判定する（Ｓ４１）。監視装置１０は、グラフの表示が設定されているメトリックについて（Ｓ４１：ＹＥＳ）、その最新の性能情報を記憶させる（Ｓ４２）。

　監視装置１０は、イベントの通知が設定されているか否かを判定する（Ｓ４３）。イベントを通知することが設定されている場合（Ｓ４３：ＹＥＳ）、性能情報と閾値とを比較してメトリック状態を判定する（Ｓ４４）。メトリック状態が正常の場合（Ｓ４５：ＹＥＳ）、本処理を終了する。メトリック状態が異常の場合（Ｓ４５：ＮＯ）、監視装置１０は、イベントを通知させる（Ｓ４６）。

　図２２は、イベント発生をユーザに通知するための画面Ｇ５０を示す。イベント一覧画面Ｇ５０は、コンピュータシステム内で発生した一つまたは複数のイベントを、一覧形式で表示する。イベント一覧画面Ｇ５０は、例えば、状態欄ＧＰ５０と、イベント欄ＧＰ５１と、リソース欄ＧＰ５２とを含む。

　状態欄ＧＰ５０は、メトリックが正常であるか異常であるかを示す。イベント欄ＧＰ５１は、イベントの内容を示す。リソース欄ＧＰ５２は、イベントの発生したリソース（ノード、コンポーネント）を示す。

　ユーザは、イベント一覧画面Ｇ５０を見ることにより、コンピュータシステム内のどこでどのようなイベントが生じているのかを容易に確認することができる。上述の通り、リソースの監視方法が非監視モードまたはメンテナンスモードのいずれかに設定されている場合、そのリソースで障害が発見された場合でも、イベント一覧画面Ｇ５０には表示されない。非監視モードまたはメンテナンスモードに設定されているＩＴリソースで生じる障害は、予定された障害であり、ユーザはその障害発生を明確に認識しているためである。従って、イベント一覧画面Ｇ５０には、ユーザが明確に認識していないイベントのみが表示される。

　図２３は、グラフ表示処理を示すフローチャートである。監視装置１０は、性能情報テーブル１５４からグラフ表示１５４４の設定値及びイベント通知の設定値をそれぞれ取得する（Ｓ５０）。

　イベントの通知が設定されている場合（Ｓ５１：ＹＥＳ）、監視装置１０は、閾値を示す線をグラフに表示させる（Ｓ５２）。イベントを通知しない場合（Ｓ５１：ＮＯ）、または、閾値を示す線をグラフに表示させた場合（Ｓ５２）、監視装置１０は、グラフ表示が設定されているか否かを判定する（Ｓ５３）。グラフの表示が設定されている場合（Ｓ５３：ＹＥＳ）、監視装置１０は、性能情報の時間変化を示すグラフを作成し、ユーザインターフェース部１１０から出力させる（Ｓ５４）。

　図２４は、性能情報のグラフ表示を示す。図２４では、メトリック１からメトリック５までの５種類のメトリックの状態を表示可能な場合を示している。メトリック１，４は、イベント通知及びグラフ表示の両方が指定されている。従って、それらメトリック１，４のグラフＧＰ６０，ＧＰ６３では、閾値Ｔｈを示す線と、性能情報の時間変化を示す線とが同時に表示される。メトリック２では、グラフ表示のみが指定されているため、メトリック２のグラフＧＰ６１では、性能情報の時間変化を示す線のみが表示され、閾値を示す線は表示されない。

　これに対し、メトリック３，５では、グラフ表示もイベント通知も行われない設定になっている。従って、メトリック３，５に対応するグラフＧＰ６２，ＧＰ６４では、閾値Ｔｈを示す線も性能情報の時間変化を示す線もいずれも表示されない。

　このように、本実施例では、複数の監視対象のメトリックが設定されている場合、グラフ表示の設定がされているメトリックのみグラフ化される。さらに、イベント通知が設定されているメトリックのグラフにのみ、閾値を示す線が重ねて表示される。ユーザは、メトリック別のグラフ表示画面Ｇ６０を見ることにより、監視対象のメトリックが何であるか、それら各メトリックの状態がどうなっているか、閾値はどのように設定されているか等を比較的簡単に把握することができる。

　図２５は、コンポーネントの監視制御とメトリックの監視制御との組合せ方法を示す説明図である。図２５に示すテーブルは、監視制御の組合せを説明するために用いられるもので、監視装置１０が実際に備えているテーブルではない。

　コンポーネントの監視制御方法には、上述の通り、監視モード、非監視モード、メンテナンスモードの３種類がある。メンテナンスモードは、一時的に正常であると見せかけるモードであり、その動作は監視モードと同一であるため、図２５では、監視モードの中にメンテナンスモードを含めている。

　メトリックの監視制御方法では、図１７で述べたように、グラフ表示するか否か（つまり、性能情報を取得するか否か）と、イベントを通知するか否かとを選択できる。その結果、メトリックを監視する方法としては、（グラフ表示する、イベントを通知する）、（グラフ表示する、イベント通知しない）、（グラフ表示しない、イベント通知しない）の３つがある。上述の通り、（グラフ表示しない、イベント通知する）という組合せは存在しない。イベントが発生したか否かを判断するための性能情報が取得できないため、その組合せは存在しない。

　（グラフ表示する、イベントを通知する）の場合、監視モード及びメンテナンスモードでは、グラフが表示され、かつ、イベントが通知される。正確にはメンテナンスモードの場合はイベント通知されないが、メンテナンス作業の終了によって監視モードに移行すると、グラフが表示され、かつ、イベントが通知される。

　（グラフ表示する、イベントを通知する）の場合、非監視モードでは、グラフは表示されるが、イベントは通知されない。つまり、メトリック状態の変化は計測されるが、警報は出力されない。

　（グラフ表示する、イベント通知しない）の場合、監視モード及びメンテナンスモードでは、グラフは表示されるがイベントは通知されない。

　（グラフ表示する、イベント通知しない）の場合、非監視モードでも同様に、グラフは表示されるがイベントは通知されない。

　（グラフ表示しない、イベント通知しない）の場合、監視モード、メンテナンスモード及び非監視モードのいずれでも、グラフは表示されず、イベントも通知されない。

　図２６は、コンポーネント全体の監視方法とそのコンポーネントに含まれる複数メトリックの監視方法との関係を示す。図２６（ａ）に示すように、あるコンポーネントの監視方法を監視モードに設定する。図２５で示したように、監視モードの場合、グラフ表示され、かつ、イベント通知されることになる。従って、そのコンポーネントに含まれる各メトリックには、コンポーネントの監視方法に応じて、（グラフ表示する、イベント通知する）という値に設定される。

　図２６（ｂ）に示すように、ユーザは、一部のメトリックについての監視方法をコンポーネントの監視方法と異ならせることができる。図２０で述べたように、ユーザは、メトリック一覧画面Ｇ４０において、所望のメトリックのグラフ表示欄ＧＰ４０またはイベント通知欄ＧＰ４１のチェックマークを付けたり、あるいは、外したりするだけで、所望の監視方法に変更することができる。

　本実施例は上述のように構成されるため、以下の効果を奏する。本実施例では、各ＩＴリソース毎に監視方法を設定できるため、状況に応じた監視方法を設定することができ、これにより、ユーザの使い勝手が向上する。

　図２７は、意図的な作業における障害検知の様子を示す。図２７では、未使用のコンポーネントをノードから取り外す場合を説明する。図２７（ａ）に示すように、あるノードにコンポーネント１，コンポーネント２が含まれており、いずれのコンポーネント１，２も監視されているものとする。一つのコンポーネント２は使用されていないため、ユーザは、その未使用コンポーネント２の意図的な切り離しを試みるものとする。もしも、ノードと２つのコンポーネントの全てについて一つの監視方法のみを適用可能な構成である場合、コンポーネント２の意図的な切り離しは、障害の発生として検出される。

　これに対し、図２７（ｂ）に示すように、ユーザは、切り離し予定のコンポーネント２の監視方法を非監視モードに事前に変更しておくことにより、そのコンポーネント２の監視を停止させることができる。従って、未使用のコンポーネント２をノードから切り離した場合でも、障害として検出されない。

　図２８は、メンテナンス作業の場合を示す。図２８（ａ）に示すように、ノードと２つのコンポーネント１，２が監視されている場合において、ユーザが、コンポーネント２のメンテナンス作業を行うと、障害発生として検出される場合がある。例えば、ユーザがコンポーネント２をノードから取り外したり、コンポーネント２への通電を停止したりするような場合である。

　図２８（ｂ）に示すように、ユーザは、メンテナンス対象のコンポーネント２の監視方法を、メンテナンス作業の開始前にメンテナンスモードに変更できる。メンテナンスモードの場合、強制的に正常であると見なされるため、障害として検出されない。メンテナンス作業が終了すると、コンポーネント２の状態が変化する。従って、コンポーネント２の監視方法は、メンテナンスモードから監視モードに自動的に切り替わる。

　図２８（ｃ）に示すように、コンポーネント２のメンテナンス後に障害が発生した場合、その障害は検出されてユーザに通知される。

　このように本実施例では、ユーザの予め認識している障害が検出されるのを防止して、ユーザの認識していない真の障害のみをユーザに通知することができ、監視の信頼性及びユーザの使い勝手が向上する。

　さらに、本実施例では、メンテナンス作業用のメンテナンスモードを用意しており、かつ、メンテナンス作業の終了後にはメンテナンスモードから監視モードに自動的に切り替わるように構成している。従って、メンテナンス作業中に、無駄な警報が出力されるのを防止でき、メンテナンス作業の効率を高めることができる。さらに、メンテナンス作業後に、メンテナンスモードから監視モードに手動で切り替える必要がなく、ユーザの使い勝手が向上する。さらに、メンテナンス作業後に発生する障害を検出できるため、監視装置の信頼性が向上する。

　図２９－図３６を参照して第２実施例を説明する。本実施例は、第１実施例の変形例に該当する。従って、第１実施例との相違点を中心に説明する。本実施例では、互いに関連するＩＴリソース間において、一方のＩＴリソースの監視方法が変更された場合には、それに追従させて、他方のＩＴリソースの監視方法を変更させる。本実施例では、互いに関連するＩＴリソースとして、ゲストＯＳと仮想化機構の組合せ、および、ホストＯＳとゲストＯＳの組合せを例に挙げて説明する。

　図２９（ａ）に示すように、ノードであるホストＯＳ２１２には、コンポーネントとしての仮想化機構２１３が設けられている。仮想化機構２１３には、他のノードとしてのゲストＯＳ２１４が設けられる。

　図２９（ｂ）に示すように、ゲストＯＳ２１４を非監視モードにした後で停止させた場合、ゲストＯＳ２１４が設けられている仮想化機構２１３の状態も変化する。仮想化機構２１３が監視モードに設定されている場合、ゲストＯＳ２１４の停止によって、ホストＯＳ２１２のコンポーネントである仮想化機構２１３に障害が発生したと判断される。

　図２９（ｃ）に示すように、本実施例では、ゲストＯＳ２１４を非監視モードに切り替えた場合に、ゲストＯＳ２１４に関連する仮想化機構２１３も自動的に非監視モードに切り替えさせる。これにより、本実施例では、ゲストＯＳ２１４を停止させる場合に、仮想化機構２１３について障害が検出されるのを防止できる。

　図３０は、監視状態（監視方法）を変更させる処理のフローチャートである。本処理では、ノードの監視状態の変更にコンポーネントの監視状態を追従させる場合を例に挙げて説明する。

　ユーザがノードの監視状態を変更すると、監視装置１０は、変更対象ノードの監視状態を、ノードテーブル１５１において更新させる（Ｓ６０）。以下、監視状態の変更されたノードを対象ノードと略記する場合がある。対象ノードは、「第１監視対象オブジェクト」に相当する。

　監視装置１０は、対象ノードがホストＯＳ２１２であるか否かを判定する（Ｓ６１）。対象ノードがホストＯＳ２１２ではない場合（Ｓ６１：ＮＯ）、監視装置１０は、対象ノードに対応するレコードが仮想マシンテーブル１５７内に存在するか否かを判定する（Ｓ６２）。ここでは、ゲストＯＳ２１４が対象ノードである場合を説明しているので、Ｓ６２ではＹＥＳと判定される。

　監視装置１０は、仮想マシンテーブル１５７から、対象ノードに関連するコンポーネントＩＤ１５７１を取得する（Ｓ６２）。対象ノードに関連するコンポーネント（ここでは、ゲストＯＳ）は、「第２監視対象オブジェクト」に該当する。監視装置１０は、取得したコンポーネントＩＤがコンポーネントテーブル１５２に登録されているか否かを判断する（Ｓ６３）。

　仮想マシンテーブル１５７から取得されたコンポーネントＩＤがコンポーネントテーブル１５２に登録されている場合（Ｓ６３：ＹＥＳ）、監視装置１０は、コンポーネントテーブル１５２において、そのコンポーネントＩＤ１５２０に設定されている監視状態１５２５を、Ｓ６０で変更された対象ノード（ゲストＯＳ２１４）の監視状態に一致させる（Ｓ６５）。

　なお、対象ノードに対応するレコードが仮想マシンテーブル１５７内に存在しない場合（Ｓ６２：ＮＯ）、または、仮想マシンテーブル１５７から取得されるコンポーネントＩＤがコンポーネントテーブル１５２に登録されていない場合（Ｓ６４：ＮＯ）、のいずれかである場合、本処理は終了する。

　対象ノードがホストＯＳ２１２である場合（Ｓ６１：ＹＥＳ）、「ノード間で監視状態を連動させる処理」に移行する（Ｓ６６）。Ｓ６６の処理の詳細は後述する。

　図３１は、図３０中のＳ６６の詳細を示すフローチャートである。ホストＯＳ２１２の監視状態が変更される場合に、図３１の処理が行われる。監視装置１０は、ノードテーブル１５１を参照することにより、監視状態の変更されるホストＯＳ２１２上に設けられているゲストＯＳ２１４を特定する（Ｓ６６０）。

　監視装置１０は、特定されたゲストＯＳ２１４を「対象ノードに関連するノード」として、ユーザインターフェース部１１０に出力させる（Ｓ６６１）。ユーザは、ユーザインターフェース部１１０に表示されたゲストＯＳ２１４の中から、ホストＯＳ２１２の監視状態の変更に追従させる、ゲストＯＳ２１４を選択する。

　監視装置１０は、ユーザによってゲストＯＳ２１４が選択されると（Ｓ６６２：ＹＥＳ）、選択されたゲストＯＳ２１４の監視状態をホストＯＳ２１２の監視状態に一致させる（Ｓ６６３）。

　図３２は、対象ノードに関連するノード（以下、関連ノード）を選択するための画面Ｇ７０を示す。画面Ｇ７０の上側には、変更対象のノードを表示するための対象ノード欄ＧＰ７０が設けられている。

　対象ノード欄ＧＰ７０の下側には、対象ノードに関連する関連ノードを表示するための関連ノード表示欄ＧＰ７１，ＧＰ７２が設けられている。ユーザは、所望の関連ノードを選択してチェックマークを設定することにより、対象ノードの監視状態の変更に追従させる関連ノードを選択することができる。ユーザがＯＫボタンを押すと、監視装置１０は、選択された関連ノード（ゲストＯＳ）の監視状態を、対象ノード（ホストＯＳ）の監視状態に一致させる（Ｓ６６３）。

　このように構成される本実施例も、各ＩＴリソース毎に監視状態を個別に設定することができるため、第１実施例と同様の作用効果を奏する。さらに、本実施例では、関連するＩＴリソース間において、一方のＩＴリソースの監視状態が変更される場合、他方のＩＴリソースの監視状態を一方のＩＴリソースの監視状態に一致させる。従って、本実施例では、不要な警報が出力されるのをより一層低減することができ、ユーザの使い勝手が向上する。ユーザは、関連するＩＴリソースを手動で検出して、その監視状態を手作業で変更する必要がないため、ユーザの使い勝手がさらに向上する。

　なお、関連ノードの探索方法として複数方法がある。そこで、図３３－図３６を参照して、本実施例の変形例を説明する。

　図３３は、関連ノードを探索する方法を選択するための画面Ｇ８０を示す。探索方法選択画面Ｇ８０には、複数の探索方法ＧＰ８０－ＧＰ８３が表示される。ユーザは、いずれか一つの探索方法を選択してＯＫボタンを操作する。

　第１の探索方法ＧＰ８０は、対象ノードの直下に位置する他のノードを検索する方法である。探索方法は、例えば、監視状態を連動させるための候補を抽出するための抽出方法と呼ぶこともできる。

　第２の探索方法ＧＰ８１は、対象ノードの直下に位置する他のノードだけでなく、対象ノードに繋がる全ての階層の他ノードを探索する方法である。

　第３の探索方法ＧＰ８２は、コンピュータシステム内の全ての他ノードを探索する方法である。

　第４の探索方法ＧＰ８３は、対象ノードの監視状態と他ノードの監視状態とを連動させない方法である。第３の探索方法及び第４の探索方法は、正確には、関連ノードを探索する方法ではないが、便宜上、関連ノードを探索するための方法の一種として扱う。

　図３４は、上述の各探索方法による探索範囲の相違を模式的に示す。対象ノードは、「ホストＯＳ１」であるとする。第１探索方法では、ホストＯＳ１の直下に位置する、各仮想化機構ＶＭ１，ＶＭ２と、各ゲストＯＳ１，ゲストＯＳ２とが抽出される。ユーザは、ＶＭ１，ＶＭ２，ゲストＯＳ１，ゲストＯＳ２の中から選択し、監視状態をホストＯＳ１に連動させる。

　第２探索方法では、ホストＯＳ１に直接関連するノード以外に、直下の関連ノードが関連するノードも抽出される。図３４の場合は、一方のゲストＯＳ１に接続されている一方の関連ノード１と、他方のゲストＯＳ２に接続されている他方の関連ノード２とが、抽出される。関連ノードの具体例としては、スイッチ２２またはストレージ２３等を挙げることができる。

　第３探索方法では、コンピュータシステム内の全てのノードが探索される。図示の例では、他のホストＯＳ２，仮想化機構ＶＭ３，ＶＭ４，ゲストＯＳ３，ゲストＯＳ４，スイッチ２２，ストレージ２３も抽出される。

　第４探索方法では、対象ノードの監視状態の変更に連動させるノードを設定しないため、一つも抽出されない。

　図３５は、第２探索方法による選択画面Ｇ９０を示す。なお、第１探索方法による選択画面は、図３２に示す通りである。第２探索方法を実現するための選択画面Ｇ９０では、対象ノードを示す対象ノード欄ＧＰ９０の下側に、対象ノードの直下に位置する各関連ノードを表示するための関連ノード表示欄ＧＰ９１，ＧＰ９３が設けられている。

　さらに、各関連ノード表示欄ＧＰ９１，ＧＰ９３の下側には、関連ノードに関連する他の関連ノードを表示するための、他の関連ノード表示欄ＧＰ９２，ＧＰ９４が設けられている。

　図３６は、第３探索方法による選択画面Ｇ１００を示す。この選択画面Ｇ１００では、対象ノードに関連する一つのノード群と、対象ノードと全く関係しない他のノード群とが全て表示される。

　対象ノードに着目すると、選択画面Ｇ１００には、対象ノード表示欄ＧＰ１００と、対象ノードの直下に位置する関連ノードを示す欄ＧＰ１０１，ＧＰ１０３と、それら関連ノードに関連する他の関連ノードを示す欄ＧＰ１０２，ＧＰ１０４とが設けられる。

　対象ノードに関係ない他のノードに着目すると、選択画面Ｇ１００には、他のノードＧＰ１０５－ＧＰ１０９も設けられる。初期設定では、画面Ｇ１００に表示される全てのノードにチェックマークが設定されている。ユーザは、例えば、不要と考えるノードのチェックマークを外すこともできる。

　図３７，図３８を参照して第３実施例を説明する。本実施例では、スイッチとスイッチポートとの間で、監視状態を連動させる場合を説明する。図３７は、監視状態を変更させる処理を示すフローチャートである。図３８は、スイッチの監視状態を非監視モードに変更した場合に、そのスイッチの有する各スイッチポートの監視状態も非監視モードに変更される様子を示す。

　図３７のフローチャートを説明する。監視装置１０は、ユーザによって対象ノードの監視状態が変更されると、ノードテーブル１５１に登録されている、対象ノードの監視状態１５１４を、ユーザ操作に応じて更新させる（Ｓ７０）。

　監視装置１０は、監視状態の変更対象であるノードの種別がスイッチであるか否かを判定する（Ｓ７１）。ここでは、対象ノードがスイッチである場合を説明しているので、Ｓ７１ではＹＥＳと判定される。

　監視装置１０は、図３８に示すように、コンポーネントテーブル１５２を参照し（Ｓ７２）、スイッチが備えているスイッチポートを全て特定する（Ｓ７３）。監視装置１０は、Ｓ７３で特定された全てのスイッチポートの監視状態を、スイッチの監視状態に一致させる（Ｓ７４）。このように構成される本実施例も、前記第２実施例と同様の作用効果を奏する。

　図３９，図４０を参照して第４実施例を説明する。本実施例では、互いに接続された通信ポート間において、監視状態を連動させる場合を説明する。図３９は、監視状態を変更させる処理のフローチャートを示す。図４０は、一方の通信ポートの監視状態が非監視状態に変更された場合に、一方の通信ポートに接続されている他方の通信ポートの監視状態も非監視状態に変更される様子を示す。

　図３９のフローチャートを説明する。監視装置１０は、ユーザにより対象コンポーネントの監視状態が変更されると、コンポーネントテーブル１５２において、対象コンポーネントの監視状態１５２５を非監視モードに変更する（Ｓ８０）。

　監視装置１０は、対象コンポーネントがスイッチポートであるか否かを判定する（Ｓ８１）。ここでは、スイッチポートとＬＡＮポートの間で監視状態を連動させる場合を説明しているため、Ｓ８１ではＹＥＳと判定される。

　監視装置１０は、図４０に示すように、スイッチポートテーブル１５５から、対象コンポーネントであるスイッチポートのＭＡＣアドレスを取得する（Ｓ８２）。監視装置１０は、ＬＡＮポートテーブル１５６を参照し、スイッチポートのＭＡＣアドレスに対応するＭＡＣアドレスを有するＬＡＮポートのコンポーネントＩＤを取得する（Ｓ８３）。

　監視装置１０は、相手方のコンポーネント（ここでは、ＬＡＮポートである）の監視状態を、対象コンポーネント（ここでは、スイッチポートである）の監視状態に一致させる（Ｓ８４）。このように構成される本実施例も、第２実施例と同様の効果を奏する。

　なお、本発明は、上述した実施形態に限定されない。当業者であれば、本発明の範囲内で、種々の追加や変更等を行うことができる。ストレージとストレージを構成するコンポーネントの間で監視状態を変更することができる。

　１：管理システム、２Ａ：サーバ、２Ｂ：スイッチ、２Ｃ：ストレージ、３：マイクロプロセッサ、３Ａ：監視方法設定部、３Ｂ：情報取得部、３Ｃ：監視部、３Ｄ：監視方法変更部３Ｄ、２Ａ１，２Ｂ１，２Ｂ２，２Ｃ１：通信ポート、２Ａ２：仮想化機構（ＶＭ）、２Ａ３：仮想マシン、２Ｃ２：マイクロプロセッサ、２Ｃ３：ハードディスクドライブ、４：メモリ、５：通信インターフェース、６：ユーザインターフェース、１０：監視装置、２１Ａ，２１Ｂ：サーバ、２２：スイッチ、２３：ストレージ、１１０：ユーザインターフェース部、１２０：データベース処理部、１３０：制御部、１４０：情報取得部、１５０：データベース、２１０Ａ，２１０Ｂ：通信ポート、２１１Ａ，２１１Ｂ：マイクロプロセッサ、２１２，２１２Ａ：ホストＯＳ、２１３，２１３Ａ：仮想化機構、２１４，２１４Ａ：ゲストＯＳ、２１５Ｂ：ハードディスクドライブ、２２０：スイッチポート、２３０：通信ポート、２３１：マイクロプロセッサ、２３２：ハードディスクドライブ。

Claims

　マイクロプロセッサと、
　前記マイクロプロセッサにより読み出されて実行されるプログラムを記憶するためのメモリと、
　前記マイクロプロセッサが各監視対象オブジェクトと通信するための通信インターフェースと、
　前記マイクロプロセッサがユーザとの間で情報を交換するためのユーザインターフェースと、
で構成する管理システムであって、
　前記マイクロプロセッサは、前記プログラムを読み込んで実行することにより、
　　　前記各監視対象オブジェクト毎に監視方法を設定する監視方法設定部と、
　　　前記通信インターフェースを介して前記各監視対象オブジェクトから情報を取得する情報取得部と、
　　　前記各監視方法と前記各監視対象オブジェクトから取得される情報とに基づいて、前記各監視対象オブジェクトを監視し、それら監視結果を前記ユーザインターフェースを介して出力させる監視部と、
　　　前記各監視対象オブジェクトに含まれる第１監視対象オブジェクトに設定された監視方法が変更される場合には、前記各監視対象オブジェクトに含まれる、前記第１監視対象オブジェクトに関連する第２監視対象オブジェクトに設定された監視方法を、前記変更に追従して変更させるための、監視方法変更部と、
をそれぞれ実現させる、
ことを特徴とした管理システム。
　前記監視方法には、前記監視対象オブジェクトから取得される前記情報に基づいて所定の通知を出力するか否かを判定するための通知設定が含まれており、
　前記監視方法変更部は、前記第１監視対象オブジェクトについての通知設定が変更された場合、前記第２監視対象オブジェクトについての通知設定を、前記第１監視対象オブジェクトについての前記通知設定に一致させる、
請求項１に記載の管理システム。
　前記監視方法変更部は、前記各監視対象オブジェクトの中から前記第１監視対象オブジェクトに関連する監視対象オブジェクトを前記第２監視対象オブジェクトの候補として検索し、検索された前記候補の中からユーザにより選択される監視対象オブジェクトを、前記第２監視対象オブジェクトとする、
請求項２に記載の管理システム。
　前記監視方法変更部は、
　　前記各監視対象オブジェクトのうち前記第１監視対象オブジェクトに直接関連する監視対象オブジェクトを前記候補として検索するか、あるいは、
　　前記各監視対象オブジェクトのうち前記第１監視対象オブジェクトに直接関連する監視対象オブジェクト及び当該監視対象オブジェクトに直接関連する監視対象オブジェクトの両方を前記候補として検索するようになっている、
請求項３に記載の管理システム。
　前記複数の監視対象オブジェクトには、ホストマシンと、前記ホストマシン上で作動する仮想化機構により生成される仮想マシンとが含まれており、
　前記第１監視対象オブジェクトは前記ホストマシンであり、
　前記第２監視対象オブジェクトは前記仮想マシンであり、
　前記監視方法変更部は、前記ホストマシンについての前記第１通知設定が前記所定の通知を出力しない設定に変更された場合、前記仮想マシンについての前記第２通知設定を前記所定の通知を出力しない設定に変更させる、
請求項２に記載の管理システム。
　前記複数の監視対象オブジェクトには、ホストマシンと、前記ホストマシン上で作動し、仮想マシンを生成するための仮想化機構とが含まれており、
　前記第１監視対象オブジェクトは前記仮想マシンであり、
　前記第２監視対象オブジェクトは前記仮想化機構であり、
　前記監視方法変更部は、前記仮想マシンについての前記第１通知設定が前記所定の通知を出力しない設定に変更された場合、前記仮想化機構についての前記第２通知設定を前記所定の通知を出力しない設定に変更させる、
請求項２に記載の管理システム。
　前記複数の監視対象オブジェクトには、通信ポートを有するスイッチ装置が含まれており、
　前記第１監視対象オブジェクトは前記スイッチ装置であり、
　前記第２監視対象オブジェクトは前記通信ポートであり、
　前記監視方法変更部は、前記スイッチ装置についての前記第１通知設定が前記所定の通知を出力しない設定に変更された場合、前記通信ポートについての前記第２通知設定を前記所定の通知を出力しない設定に変更させる、
請求項２に記載の管理システム。
　前記複数の監視対象オブジェクトには、通信ポートを有するスイッチ装置と、前記通信ポートに接続される他の通信ポートを有する他の装置とが含まれており、
　前記第１監視対象オブジェクトは前記通信ポートであり、
　前記第２監視対象オブジェクトは前記他の通信ポートであり、
　前記監視方法変更部は、前記通信ポートについての前記第１通知設定が前記所定の通知を出力しない設定に変更された場合、前記他の通信ポートについての前記第２通知設定を前記所定の通知を出力しない設定に変更させる、
請求項２に記載の管理システム。
　前記監視方法には、
　　前記監視対象オブジェクトの状態を、前記情報取得部により取得される情報を介して監視し、障害が検出された場合は前記所定の通知を出力させる第１モードと、
　　前記監視対象オブジェクトの状態を監視しない第２モードと、
　　前記監視対象オブジェクトの現在の状態が正常であるか否かを問わずに、正常であると判定する第３モードとが含まれている、
請求項２に記載の管理システム。
　前記第３モードは、前記監視対象オブジェクトの状態が変更された場合には、前記第１モードに移行するようになっている、
請求項９に記載の管理システム。
　前記複数の監視対象オブジェクトには、複数のノード装置と、前記各ノード装置の一部を構成するコンポーネント装置とが含まれており、
　前記監視方法では、
　　前記各コンポーネント装置の有する複数の属性のうち所定の属性の状態に関する情報を前記情報取得部を介して取得するか否かと、
　　前記所定の属性の状態に関する情報と所定の閾値とを比較することにより、前記所定の属性の状態を判定するか否かと、
を前記各コンポーネント装置毎に設定することができる、
請求項２に記載の管理システム。
　監視対象となる監視対象オブジェクトを監視する管理システムを制御するための方法であって、
　前記コンピュータシステムは、前記監視対象オブジェクトを複数含み、
　前記各監視対象オブジェクト毎に監視方法を設定し、
　前記各監視対象オブジェクトから情報を取得し、
　前記各監視方法と前記各監視対象オブジェクトから取得される情報とに基づいて、前記各監視対象オブジェクトを監視し、
　監視結果を前記ユーザインターフェースを介して出力させ、
　前記各監視対象オブジェクトに含まれる第１監視対象オブジェクトに設定された監視方法が変更されたか否かを判定し、
　前記第１監視対象オブジェクトの監視方法が変更された場合には、前記各監視対象オブジェクトの中から、前記第１監視対象オブジェクトに関連する第２監視対象オブジェクトを検出し、
　前記第２監視対象オブジェクトに設定された監視方法を、前記第１監視対象オブジェクトの監視方法に一致させる、
管理システムの制御方法。
　コンピュータシステムの状態を監視する管理システムを制御する方法であって、
　前記コンピュータシステムは、監視対象となる監視対象オブジェクトを複数含み、
　前記各監視対象オブジェクトを監視するための監視方法は、前記監視対象オブジェクトに障害が検出された場合は所定の通知を出力させる第１モードと、前記監視対象オブジェクトの状態を監視しない第２モードと、前記監視対象オブジェクトの現在の状態が正常であるか否かを問わずに、正常であると判定する第３モードとが含まれており、
　前記各監視対象オブジェクト毎に、前記監視方法の有する複数のモードの中からいずれか一つのモードを設定し、
　前記各監視対象オブジェクトから情報を取得し、
　前記設定されたモードと前記各監視対象オブジェクトから取得される情報とに基づいて、前記各監視対象オブジェクトを監視し、
　監視結果を出力させる、
管理システムの制御方法。
　前記第３モードは、前記監視対象オブジェクトの状態が変更された場合に、前記第１モードに移行するようになっている、
請求項１３に記載の管理システムの制御方法。
　前記複数の監視対象オブジェクトには、複数のノード装置と、前記各ノード装置の一部を構成するコンポーネント装置とが含まれており、
　前記監視方法では、
　　前記各コンポーネント装置の有する複数の属性のうち所定の属性の状態に関する情報を取得するか否かと、
　　前記所定の属性の状態に関する情報と所定の閾値とを比較することにより、前記所定の属性の状態を判定するか否かと、
を前記各コンポーネント装置毎に設定することができる、
請求項１４に記載の管理システムの制御方法。