JP6002856B2

JP6002856B2 - 監視システム、及び、監視方法

Info

Publication number: JP6002856B2
Application number: JP2015546237A
Authority: JP
Inventors: 中島　勝己; 勝己中島
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2013-11-08
Filing date: 2013-11-08
Publication date: 2016-10-05
Anticipated expiration: 2033-11-08
Also published as: WO2015068275A1; JPWO2015068275A1; US9697067B2; US20150370625A1

Description

本発明は、監視システムに関する。

企業によるビジネスを支えるシステムが大規模化及び複雑化するに伴い、システムの安定稼働を支えるため、システムの稼働情報及び性能情報などを管理する運用管理システムのニーズが高まっている。多くの運用管理製品は、ユーザーに、イベントの発生時期及び発生順序を把握させるため、イベントを時系列に一覧で表示するイベントコンソールを提供する。

また、多くの運用管理製品は、視覚的に障害の発生状況を把握させるために、システムが備える被監視装置の位置を示すマップを監視画面に表示し、被監視装置の障害発生時に警告色を表示することによって、障害を効率的に検知させる。

従来、ネットワークに散在する各サイト及び各サイトに設置された機器のいずれかに障害が発生した場合、その障害内容に応じた情報が収集され、モニター画面の該当する図形の表示色を変更する技術が提案されている（例えば、特許文献１参照）。さらに、特許文献１の技術は、ユーザーが、警告を受ける必要のない軽度のエラーの種類を適宜に指定でき、システムの構成に応じて警告又は非警告の組み合わせを柔軟に設定することができる技術である。

特開２００４−０７８３６９号公報

特許文献１の技術を用いるシステムにおいて、大規模システムにおいて障害イベントが多数発生し、障害への対処が追いつかない場合、モニター画面は、常に被監視装置の障害を示す警告色を表示する。このため、ユーザーは、モニター画面から、障害が発生した被監視装置の位置を把握できるが、複数の障害イベントの発生時期、発生順序及び発生件数、並びに、障害イベントへの対処の緊急度等の障害の発生状況を正確に把握できない。

また、障害イベントを列挙して表示する従来のイベントコンソールを用いて監視した場合、ユーザーは、イベントの発生時期及び発生順序を把握できるが、各被監視装置の位置を、視覚を通じて把握することができない。

本発明の目的は、被監視装置の位置情報と、障害の発生状況とを適切に表示する監視システムの提供である。

本発明の代表的な一形態によると、監視システムであって、計算機に接続するネットワークインタフェースと、指定期間の終了時刻を受け付ける入力インタフェースと、前記計算機において発生した障害を画面に表示する位置を示す位置情報と、前記計算機において発生した障害と、当該障害が発生した時刻と、当該障害への対処状況とを示すイベント情報と、前記終了時刻までに発生し、かつ、現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成する画面生成部と、前記生成された画面を表示する表示部と、を有する。

本発明の一実施形態によると、被監視装置の位置情報と、障害の発生状況とを適切に表示できる。

上記した以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。

本実施例１の計算機システムの構成を示すブロック図である。本実施例１の監視装置の構成を示すブロック図である。本実施例１の指定期間における任意の時刻の障害の発生状況を表示した画面を示す説明図である。本実施例１のイベント情報を示す説明図である。本実施例１の被監視装置の表示用情報を示す説明図である。本実施例１の表示画面情報を示す説明図である。本実施例１のイベントマッピング情報を示す説明図である。本実施例１の画面生成サブプログラムによる処理の前半を示すフローチャートである。本実施例１の画面生成サブプログラムによる処理の後半を示すフローチャートである。本実施例１の表示用サブプログラムの処理を示すフローチャートである。本実施例２の監視装置の構成を示すブロック図である。本実施例２の任意の指定期間における障害の発生状況を表示した画面を示す説明図である。本実施例２の被監視装置の障害レベルを示す図形を示す説明図である。本実施例２の障害レベルルール情報を示す説明図である。本実施例２の対処時間レベルを示す説明図である。本実施例２の最終対処日レベルを示す説明図である。本実施例２のルール更新サブプログラムの処理を示すフローチャートである。本実施例２の画面生成サブプログラムの処理を示すフローチャートである。本実施例３の指定期間における障害の発生状況を表示する画面を示す説明図である。本実施例３の画面生成サブプログラムの処理の前半を示すフローチャートである。本実施例３の画面生成サブプログラムの処理の後半を示すフローチャートである。

以下、本発明の実施形態について図面を参照して詳細に説明する。

実施例１の計算機システムは、指定された期間（以下、指定期間）において発生した障害を画面に表示する。そして、実施例１の計算機システムは、指定期間の終了時刻（時刻２）までに被監視装置において発生した障害の発生状況を、指定期間における時系列に、連続して表示する。

以下に具体的な内容について図を用いて説明する。

図１は、本実施例１の計算機システムの構成を示すブロック図である。

本実施例の計算機システムは、監視装置１０、表示装置２０、少なくとも一つの被監視装置３０、ネットワーク４０及びネットワーク５０を有する。監視装置１０は、ネットワーク５０を介して被監視装置３０と接続され、被監視装置３０において発生する障害イベントを収集する。

表示装置２０は、ネットワーク４０を介して監視装置１０と接続され、監視装置１０によって検知された障害の発生状況（実施例１において、特に、発生を示す情報）を画面に表示する。実施例１の表示装置２０は、監視装置１０の物理的な位置又は役割を、ユーザーが視覚的に認識できるような画面を表示する。

監視装置１０は、ネットワークアダプタ１１、ＣＰＵ１２、記憶デバイス１３及びネットワークアダプタ１４を有する。ネットワークアダプタ１１は、ネットワーク４０と通信するためのネットワークインタフェースであり、ネットワークアダプタ１４は、ネットワーク５０と通信するためのネットワークインタフェースである。

ＣＰＵ１２は、演算装置である。記憶デバイス１３は、メモリを含む。また、記憶デバイス１３は、必要に応じてハードディスク等の補助記憶デバイスを含む。ＣＰＵ１２は、記憶デバイス１３を用いてプログラムを実行する。

なお、監視装置１０は、入出力デバイスを有してもよい。監視装置１０が有する入出力デバイスは、例えば、ディスプレイ、キーボード、又は、ポインタデバイス等である。また、監視装置１０は、シリアルインタフェース、又は、イーサーネットインタフェースを、入出力デバイスと接続するためのインタフェースとして有してもよい。

このような監視装置１０のインタフェースは、ディスプレイ、キーボード又はポインタデバイスを有する表示用計算機と接続されてもよい。そして、監視装置１０は、インタフェース及び表示用計算機を介してユーザーからの指示を受け付けてもよいし、ユーザーへの出力結果を表示用計算機に表示させてもよい。

表示装置２０は、ネットワークアダプタ２１、ＣＰＵ２２、記憶デバイス２３及び入出力デバイス２４を有する。ネットワークアダプタ２１は、ネットワーク４０と接続するためのネットワークインタフェースである。

ＣＰＵ２２は、演算装置である。記憶デバイス２３は、メモリを含む。また、記憶デバイス２３は、必要に応じてハードディスク等の補助記憶デバイスを含む。ＣＰＵ２２は、記憶デバイス２３を用いてプログラムを実行する。

入出力デバイス２４は、ユーザーからの指示を受け付ける入力デバイスと、ユーザーに障害の状況を表示する出力デバイスとを含む。入出力デバイス２４は、例えば、キーボード、ポインタデバイス、及び、ディスプレイ等である。

被監視装置３０は、例えば、負荷分散装置、Ｗｅｂサーバ、ＡＰサーバ、及び、ＤＢサーバ等である。被監視装置３０は、ネットワークアダプタ３１、ＣＰＵ３２及び記憶デバイス３３を有する。ネットワークアダプタ３１は、ネットワーク５０と接続するためのネットワークインタフェースである。

ＣＰＵ３２は、演算装置である。記憶デバイス３３は、メモリを含む。また、記憶デバイス３３は、必要に応じてハードディスク等の補助記憶デバイスを含む。ＣＰＵ３２は、記憶デバイス３３を用いてプログラムを実行する。

以後、被監視装置３０を監視し、本実施例の画面を表示する一つ以上の計算機の集合を監視システムと呼ぶ。監視装置１０が、自らが有する入出力デバイスに画面を表示する場合、監視装置１０が管理システムである。また、監視装置１０と表示装置２０との組み合わせも監視システムである。また、監視処理の高速化又は高信頼化のために複数の計算機によって、監視装置１０を実装してもよく、この場合、当該複数の計算機（表示装置２０が本実施例の画面を表示する場合、表示装置２０も含め）が監視システムである。

図２は、本実施例１の監視装置１０の構成を示すブロック図である。

監視装置１０の記憶デバイス１３は、イベント取得サブプログラム１０１、イベント更新サブプログラム１０２、画面生成サブプログラム１０３、表示用サブプログラム１０４及び構成情報サブプログラム１０５を、プログラムとして含む。また、記憶デバイス１３は、イベント情報１０６、構成情報１０７、表示用情報１０８、表示画面情報１０９、及び、イベントマッピング情報１１０を、データとして含む。

イベント取得サブプログラム１０１は、被監視装置３０において発生した障害イベントを検知し、ネットワークアダプタ１４を介して障害イベントの情報を収集する。そして、イベント取得サブプログラム１０１は、収集された障害イベントを、イベント情報１０６に格納する。

イベント更新サブプログラム１０２は、ユーザーが障害イベントに対処した際に、障害イベントが対処済みであることを示す情報を、イベント情報１０６に格納する。

画面生成サブプログラム１０３は、障害イベントをユーザーに表示するための画面を生成する。表示用サブプログラム１０４は、画面生成サブプログラム１０３によって生成された画面を、表示装置２０の入出力デバイス２４に表示させる。

構成情報１０７は、少なくとも被監視装置３０のホスト名及びＩＰアドレスを保持する。構成情報サブプログラム１０５は、少なくとも検知した障害イベントに含まれるＩＰアドレスをホスト名に変換するため、構成情報１０７からホスト名及びＩＰアドレスを取得する。記憶デバイス１３が有するプログラムは、構成情報サブプログラム１０５を用いて被監視装置３０のホスト名とＩＰアドレスとを変換することができる。

イベント情報１０６は、被監視装置３０において発生する障害を示す障害イベントを保持する。イベント取得サブプログラム１０１は、発生した障害を示す障害イベントを被監視装置３０から収集するために、構成情報１０７を用いる。

表示用情報１０８は、障害を表示する画面を生成するために必要な情報を保持する。表示画面情報１０９は、画面に表示する内容を保持する。イベントマッピング情報１１０は、障害イベントと被監視装置３０とに従って定められる、画面の停止時間を示す。

図３は、本実施例１の指定期間における任意の時刻の障害の発生状況を表示した画面３００を示す説明図である。

画面３００ａ〜画面３００ｃは、負荷分散装置、Ｗｅｂサーバ、ＡＰサーバ、及び、ＤＢサーバの障害の発生状況を表示する。しかし、本実施例の画面は、これらの装置以外のいかなる被監視装置３０の障害の発生状況を表示してもよい。

また、表示用サブプログラム１０４は、画面３００ａ〜画面３００ｃにおけるレイアウト、及び、被監視装置３０が表示される位置を、ユーザーの指示に従って変更してもよい。

さらに、画面３００ａ〜画面３００ｃは、表示する障害の発生状況に関する時間を入力するためのスクロールバー３０１を表示する。スクロールバー３０１は、時間軸を示す。ユーザーは、スクロールバー３０１を操作することによって、表示する障害の発生状況に関する情報を、監視装置１０に入力する。

具体的には、ユーザーがスクロールバー３０１において、Ｒｅｐｌａｙｓｔａｒｔｔｉｍｅ（時刻１）及びＲｅｐｌａｙｅｎｄｔｉｍｅ（時刻２）を指定し、ＲｅｐｌａｙＢｕｔｔｏｎを押すことによって、ユーザーは、障害の発生状況を確認するためのアニメーションの再生を指示する。そして、表示用サブプログラム１０４は、指示に従って、画面３００ａ、画面３００ｂ及び画面３００ｃを連続して順に表示する。

スクロールバー３０１において時刻１及び時刻２を指定することによって、局所的な期間も含め、任意の期間における障害の発生及び対処状況を表示できる。

画面３００ａ〜画面３００ｃは、時刻１から時刻２までの任意の時刻（Ｐｏｉｎｔｉｎｔｉｍｅ：時刻３）における、障害の発生状況を表示する。図３の画面３００ａ〜画面３００ｃは、障害イベントが発生した場合、被監視装置３０を示す図形の周囲の一定の範囲に、障害イベントが発生したことを示す情報として、警告色を表示する。障害イベントが発生したことを示す情報は、ユーザーの注意をひくことができる方法であれば、円等の図形、文字、記号、模様又は色彩のいかなる方法によって表示されてもよい。

また、画面３００ａ〜画面３００ｃは、時刻３までに被監視装置３０において発生した障害であり、かつ、現在時刻までに対処が済んでいない障害を示す情報（例えば、記号３０２Ｈ及び記号３０２Ｉ）を表示する。図３に示す画面３００ａ〜画面３００ｃは、時間が経過するにつれて、発生した障害が増えていく様子を表示する。

このため、表示用サブプログラム１０４が、時刻１から時刻２までの複数の時刻３における複数の画面３００を、連続して順に表示することにより、ユーザーは、時刻１から時刻２までの障害の発生状況をアニメーションによって認識することができる。

このとき、画面３００の再生中において、時刻３を示す情報（図３において黒い三角形）は、時刻１から時刻２までの間を移動する。

また、画面３００は、緊急度の高い障害イベントの発生を示す場合、一定時間同じ画面を表示し続ける。すなわち、表示用サブプログラム１０４は、アニメーションを一時的に停止する。ユーザーは、アニメーションを停止させる時間を任意に指定する。なお、一時的にアニメーションを停止した場合、表示用サブプログラム１０４は、緊急度の高い障害を示す被監視装置の記号又は図形等を、強調して表示してもよい。

実施例１において、表示用サブプログラム１０４が、任意の時刻１から時刻２までの被監視装置３０の障害の発生状況を画面に連続して表示させるため、被監視装置３０において障害が発生したタイミングを容易に把握することができる。また、複数の被監視装置３０において障害が発生した順序もユーザーは把握でき、根本的な原因を特定する際にも役立つ。

これは、例えば、ユーザーが実施例１の画面によって、障害が最初に発生した被監視装置３０を特定し、さらに、最初の障害の影響によって他の被監視装置３０において発生した障害を特定できるため、ユーザーは、障害の根本的な原因を特定できる。

さらに、実施例１の表示用サブプログラム１０４は、緊急度が高いイベントが発生した際、画面を一時的に停止させ、一つの画面を継続して表示させため、優先すべき被監視装置３０の障害イベントを即時に把握させることができる。

図４は、本実施例１のイベント情報１０６を示す説明図である。

イベント情報１０６は、被監視装置３０から収集された障害イベントを格納する。イベント情報１０６は、イベントＩＤ１６１、発生日時１６２、ホスト名１６３、対処状況１６４、及び、対処時間１６５を、少なくとも含む。

イベントＩＤ１６１は、発生した障害イベントが示す事象及び内容に従って予め定められた識別子である。発生日時１６２は、障害が発生した日時を示す。ホスト名１６３は、障害が発生した被監視装置３０を示す。

対処状況１６４は、障害イベントが示す障害がユーザーによって対処済みであるか未対処であるかを示す。本実施例における未対処とは、対処が終了しておらず、障害が解決していないことである。また、本実施例における対処済みとは、対処が終了し、障害が解決したことを示す。

対処時間１６５は、障害イベントが発生してから障害イベントが示す障害の対処が終了するまでの時間を示す。

イベント取得サブプログラム１０１は、収集した障害イベントに基づいて、イベントＩＤ１６１、発生日時１６２、及び、ホスト名１６３を更新する。また、イベント更新サブプログラム１０２は、ユーザーからの入力に従って、対処状況１６４及び対処時間１６５を更新する。

図５は、本実施例１の被監視装置３０の表示用情報１０８を示す説明図である。

表示用情報１０８は、表示装置２０が出力する画面における、被監視装置３０の位置を示す座標を格納する。表示用情報１０８は、ホスト名１８１、座標１８２及び更新日時１８３を含む。

ホスト名１８１は、被監視装置３０を示し、イベント情報１０６のホスト名１６３に対応する。

座標１８２は、被監視装置３０を示す情報が表示される、画面上の位置を示す。座標１８２は、ユーザーによって指定される。なお、表示装置２０が有するプログラムは、複数の被監視装置３０を一つの位置に表示しないように、ユーザーが座標を入力する際に入出力デバイス２４に警告を出力してもよい。

更新日時１８３は、ユーザーが座標１８２を設定した日時を示す。

被監視装置３０が削除された場合、又は、ユーザーが被監視装置３０を画面３００から除外する指示を監視装置１０に入力した場合、監視装置１０のプログラムは、図５に示す表示用情報１０８における、削除された又は除外される被監視装置３０を示すエントリを削除する。

なお、被監視装置３０を表示する位置が移動した場合、表示用情報１０８は、移動前と移動後の座標を保持してもよい。このため、表示用情報１０８は、一つの被監視装置３０に対応づけられた複数の座標を示すエントリを含んでもよい。

図６は、本実施例１の表示画面情報１０９を示す説明図である。

表示画面情報１０９は、指定期間における任意の時刻における画面を表示するために必要な情報を格納する。画面生成サブプログラム１０３は、指定期間を受け付けた場合、表示画面情報１０９を生成する。表示画面情報１０９は、表示時刻１９１、表示情報１９２及び停止時間１９３を含む。

表示時刻１９１は、画面３００に表示する障害の発生状況が実際に起こっている時刻を示す。実施例１の表示時刻１９１は、表示時刻１９１は、図３における時刻３に該当する。

表示情報１９２は、表示時刻１９１が示す時刻の画面に表示される内容を示す。具体的には、表示情報１９２は、被監視装置３０に対応する情報が表示される位置と、被監視装置３０において障害が発生した場合に障害を示す情報を表示するか否かとを示す。

なお、以下の説明において、被監視装置３０が表示される位置と、当該被監視装置３０において発生した障害が表示される位置とは、同じ場所である。障害が表示される位置が被監視装置３０が表示される位置とは異なる場合、表示情報１９２は、被監視装置３０が表示される位置を基準に、障害が表示される位置を求める方法を保持してもよい。

停止時間１９３は、画面を連続して表示する際に、表示時刻１９１が示す時刻の画面を表示し続けることによって、アニメーションを一時的に停止させる時間を示す。図６に示す停止時間１９３は、秒の単位で時間を示す。

なお、図６に示す停止時間１９３は、アニメーションを再生するために表示されることが必要な１画面あたりの最低限の時間に加算する時間を示す。このため、停止時間１９３は、「０秒」を示してもよい。

図７は、本実施例１のイベントマッピング情報１１０を示す説明図である。

イベントマッピング情報１１０は、アニメーションを停止させる必要がある障害イベントの条件と、アニメーションを停止させる時間とを示す。イベントマッピング情報１１０は、ユーザーによって設定される。イベントマッピング情報１１０は、イベントＩＤ１１１、ホスト名１１２及び停止時間１１３を含む。

イベントＩＤ１１１は、発生した障害イベントの事象及び内容に従って予め定められた識別子であり、イベント情報１０６のイベントＩＤ１６１に対応する。

ホスト名１１２は、被監視装置３０を示す。ホスト名１１２は、イベント情報１０６のホスト名１６３及び表示用情報１０８のホスト名１８１に対応する。

停止時間１１３は、アニメーションを停止させる時間を示す。図７に示す停止時間１１３は、秒の単位で時間を示す。

図７に示すイベントマッピング情報１１０において、イベントＩＤ１１１とホスト名１１２に従って停止時間が定められるが、本実施例の停止時間は、これら以外によって定められてもよい。

図８Ａは、本実施例１の画面生成サブプログラム１０３による処理の前半を示すフローチャートである。

ユーザーが表示装置２０の入出力デバイス２４を用いてＲｅｐｌａｙＳｔａｒｔｔｉｍｅ及びＲｅｐｌａｙＥｎｄｔｉｍｅを指定した場合、画面生成サブプログラム１０３は、ＲｅｐｌａｙＳｔａｒｔｔｉｍｅから時刻１を取得し、ＲｅｐｌａｙＥｎｄｔｉｍｅから時刻２を取得する（２０１）。

Ｓ２０１の後、画面生成サブプログラム１０３は、ユーザーが入出力デバイス２４を用いて指定したサンプリング間隔を取得する（２０２）。ここで、本実施例のサンプリング間隔とは、指定期間において、画面を生成する時刻の間隔を示す。

サンプリング間隔が短い場合、指定期間における単位時間当たりに表示される画面３００の数が多くなり、障害の発生状況の表示の精度が向上する。しかし、この場合、アニメーションを再生する際に必要な画面３００の数が増えるため、画面３００を生成するために必要な時間が増大する。

一方で、サンプリング間隔が長い場合、指定期間における単位時間当たりに表示される画面３００の数は減少し、障害の発生状況の表示の精度は下がる。しかし、この場合、アニメーションを再生する際に必要な画面３００の数が減少するため、画面３００を生成するために必要な時間は減少する。

Ｓ２０２の後、画面生成サブプログラム１０３は、ループ処理Ａを実行する。画面生成サブプログラム１０３は、ループ処理Ａにおいて、サンプリング間隔ごとに、ループ処理Ｂ及びステップ２１２を実行する。

ループ処理Ａの開始時において、画面生成サブプログラム１０３は、時刻１及びサンプリング間隔に基づいて時刻３を算出する（２０３）。時刻３は、初期値が時刻１である。画面生成サブプログラム１０３は、ループ処理Ａを繰返し実行するごとに、時刻３にサンプリング間隔を加算する。

そして、画面生成サブプログラム１０３は、時刻３における画面３００を、ループＢ及びステップ２１２によって生成する。そして、算出された時刻３が時刻２を超えた場合、画面生成サブプログラム１０３は、ループ処理Ａを終了する。

ステップ２０３の後、画面生成サブプログラム１０３は、ループ処理Ｂにおいて、時刻３における画面に表示される被監視装置３０の数を算出し、算出された被監視装置３０の数分、ステップ２０５〜ステップ２１１の処理を繰り返す。

ループ処理Ｂの開始時に、画面生成サブプログラム１０３は、表示用情報１０８のエントリを、ホスト名１８１が示す被監視装置３０の数を算出する。そして、画面生成サブプログラム１０３は、算出された数を、時刻３において画面に表示される被監視装置３０の数として取得する（２０４）。

また、画面生成サブプログラム１０３は、ステップ２０４において、表示用情報１０８のホスト名１８１が示す被監視装置３０のうち、ステップ２０５以降の処理が実行されていない一つの被監視装置３０を、被監視装置Ｃとして選択する。

ステップ２０４の後、画面生成サブプログラム１０３は、時刻３における被監視装置Ｃの座標１７２を取得する（２０５）。すなわち、画面生成サブプログラム１０３は、被監視装置Ｃが時刻３において表示される位置の位置情報を取得する。

図８Ｂは、本実施例１の画面生成サブプログラム１０３による処理の後半を示すフローチャートである。

ステップ２０５の後、画面生成サブプログラム１０３は、イベント情報１０６の発生日時１６２及びホスト名１６３を参照し、時刻３までに被監視装置Ｃにおいて発生したすべての障害イベントを示すエントリを、イベント情報１０６から取得する（２０６）。

ステップ２０６の後、画面生成サブプログラム１０３は、ステップ２０６において取得したエントリのイベントＩＤ１６１とホスト名１６３とに一致する、イベントマッピング情報１１０のすべてのエントリを取得する（２０７）。

ステップ２０７の後、画面生成サブプログラム１０３は、ステップ２０６において取得した障害イベントのエントリのうち、対処状況１６４が未対処を示すエントリがあるか否かを判定する（２０８）。

対処状況１６４が未対処を示すエントリがある場合、画面生成サブプログラム１０３は、被監視装置Ｃに障害を示す警告色等の図形を表示するフラグを生成し、被監視装置Ｃに対応させて生成したフラグを保持する（２０９）。

ステップ２０９の後、画面生成サブプログラム１０３は、ステップ２０７において取得したイベントマッピング情報１１０のエントリから、未対処である障害イベントに該当するエントリを特定できるか否かを判定する（２１０）。

具体的には、画面生成サブプログラム１０３は、ステップ２０７において取得したイベントマッピング情報１１０のイベントＩＤ１１１及びホスト名１１２と、対処状況１６４が未対処を示すイベント情報１０６のエントリのイベントＩＤ１６１及びホスト名１６３とが一致する、イベントマッピング情報１１０のエントリを特定できるか否かを判定する。

ここで、画面生成サブプログラム１０３は、イベントＩＤ及びホスト名の少なくとも一つが一致しているエントリを特定してもよい。

そして、ステップ２０７において取得したイベントマッピング情報１１０のエントリから、未対処である障害イベントに該当するエントリを特定できた場合、画面生成サブプログラム１０３は、特定したイベントマッピング情報１１０のエントリの停止時間１１３を、時刻３における画面の被監視装置Ｃの停止時間として取得する（２１１）。

ステップ２１１において取得した停止時間１１３が複数である場合、画面生成サブプログラム１０３は、最も長い停止時間１１３を時刻３における画面の被監視装置Ｃの停止時間として取得する。

なお、停止時間１１３は０秒であってもよい。例えば、全ての未対処の障害イベントが、イベントマッピング情報１１０のイベントＩＤ１１１及びホスト名１１２が示す条件と一致しない場合、画面生成サブプログラム１０３は、停止時間を０秒に定めてもよい。

ステップ２０８において、ステップ２０６において取得した障害イベントのエントリのうち、対処状況１６４が未対処を示すエントリがないと判定された場合、ステップ２１０において、ステップ２０７において取得したイベントマッピング情報１１０のエントリから、未対処である障害イベントに該当するエントリを特定できない場合、又は、ステップ２１１の後、画面生成サブプログラム１０３は、ループ処理Ｂによって、ステップ２０４に戻る。

ループ処理Ｂによって、時刻３におけるすべての被監視装置３０に、ステップ２０５〜ステップ２１１の処理を実行した後、画面生成サブプログラム１０３は、時刻３において表示する画面の情報を、表示画面情報１０９に格納する（２１２）。

具体的には、画面生成サブプログラム１０３は、表示時刻１９１に時刻３を格納する。また、画面生成サブプログラム１０３は、ステップ２０５において取得した被監視装置３０の位置情報、及び、ステップ２０９において生成したフラグを、表示情報１９２に格納する。

また、画面生成サブプログラム１０３は、ステップ２１１において取得した、時刻３における画面の被監視装置Ｃの停止時間によって、停止時間１９３を更新する。しかし、画面生成サブプログラム１０３は、停止時間１９３に、既に被監視装置Ｃの停止時間よりも長い時間が格納されている場合、被監視装置Ｃの停止時間を停止時間１９３に格納しなくてもよい。

ステップ２１１の後、画面生成サブプログラム１０３は、ステップ２０３に戻る。そして、画面生成サブプログラム１０３は、ループ処理Ａによって、指定期間に含まれるすべての時刻３に、ステップ２０４〜ステップ２１１の処理を実行する。ループ処理Ａが終了した場合、画面生成サブプログラム１０３は、図８Ａ及び図８Ｂに示す処理を終了する。

図８Ａ及び図８Ｂに示す処理によって、指定期間において表示される画面を示す情報が表示画面情報１０９に格納される。

図９は、本実施例１の表示用サブプログラム１０４の処理を示すフローチャートである。

表示用サブプログラム１０４は、図８Ａ及び図８Ｂに示す処理の後、図９に示す処理を実行する。また、表示用サブプログラム１０４は、図９に示す処理を、ユーザーの指示に従って、又は、定期的に実行してもよい。

表示用サブプログラム１０４は、まず、ユーザーによってあらかじめ指定された再生速度を、記憶デバイス１３から取得する（２２１）。

ステップ２２１の後、表示用サブプログラム１０４は、取得した再生速度に従って、ループ処理Ｄを実行する。なお、ループ処理Ｄの開始時において、表示用サブプログラム１０４は、表示時刻１９１が早い順に表示画面情報１０９のエントリを選択する（２２２）。ここで選択されたエントリをエントリＤと記載する。

表示用サブプログラム１０４は、表示画面情報１０９のエントリＤを取得する（２２３）。ステップ２２３の後、表示用サブプログラム１０４は、エントリＤの表示情報１９２に従って、エントリＤの表示時刻１９１における画面を表示するための画面データを生成する。そして、表示用サブプログラム１０４は、生成された画面データを表示装置２０に表示させる（２２４）。

表示装置２０は、監視装置１０から画面データが送信された場合、送信された画面データと、入出力デバイス２４とを用いて、画面３００を表示する。表示装置２０は、送信された画面データを、送信された順に連続して表示することによって、アニメーションを再生する。なお、表示装置２０は、画面３００を切り替えることによって連続して画面データを表示してもよいし、画面３００を並べて表示することによって、時間の経過による障害の発生状況の変化をユーザーに表示してもよい。

また、表示装置２０は、送信された画面データに含まれるフラグの情報に基づいて、画面３００の被監視装置３０の位置に、障害を示す警告色等を表示する。

ステップ２２４の後、表示用サブプログラム１０４は、エントリＤの停止時間１９３に従って、表示装置２０に画面を表示させ続ける。すなわち、表示用サブプログラム１０４は、表示装置２０において、停止時間１９３間、画面を停止させる（２２５）。

ステップ２２５の後、表示用サブプログラム１０４は、再生速度に従ってループ処理Ｄを繰り返すことによって、指定期間における画面をアニメーションによって表示する。

なお、図９に示す処理は、表示用サブプログラム１０４が生成した画面を、再生速度に従って表示装置２０に随時表示させる処理であるが、表示用サブプログラム１０４は、指定期間におけるすべての画面を生成した後、表示装置２０に画面を表示させてもよい。

具体的には、表示用サブプログラム１０４は、生成された画面データをキャッシュに格納し、表示画面情報１０９のすべてのエントリに対応する画面データを生成した後、キャッシュに格納された画面データと停止時間１９３とを表示装置２０に送ってもよい。そして、表示用サブプログラム１０４は、再生速度と停止時間１９３とに従って、表示装置２０に複数の画面を表示させてもよい。

実施例１によれば、監視装置１０が、時刻２までに発生した障害イベントのうち、現在時刻において未対処の障害イベントを、アニメーションによって表示する。これによって、ユーザーは、未対処の障害イベントの発生時刻を、視覚的に速やかに把握することができる。

また、本実施例の監視装置１０は、位置情報に基づいて被監視装置３０を表示するため、ユーザーは、障害イベントが発生した被監視装置３０の位置等を視覚的に速やかに把握できる。

また、実施例１の表示用サブプログラム１０４は、障害イベントの内容に従って、表示するアニメーションを停止させる。このため、ユーザーは、重要で注意すべき障害イベントが発生したことを速やかに把握することができる。また、実施例１の表示用サブプログラム１０４は、時刻１から時刻２までの画面を順次表示する。このため、ユーザーは、複数の被監視装置３０において発生した障害の発生順序を、視覚的に容易に認識できる。

実施例２の監視装置１０は、時刻１から時刻２までの指定期間において発生した障害イベントのみを画面に表示させる。そして、実施例２の監視装置１０は、指定期間において発生した障害イベントの発生時期、及び、障害イベントの重要度等に従って、被監視装置３０において発生した障害イベントを示す表示を変更する。

実施例２における計算機システム及び監視システムの構成は、図１に示す計算機システム及び監視システムの構成と同じである。

図１０は、本実施例２の監視装置１０の構成を示すブロック図である。

実施例２の記憶デバイス１３は、イベント取得サブプログラム１０１、イベント更新サブプログラム１０２、画面生成サブプログラム１０３、表示用サブプログラム１０４、構成情報サブプログラム１０５及びルール更新サブプログラム２３０を、プログラムとして含む。また、記憶デバイス１３は、イベント情報１０６、構成情報１０７、表示用情報１０８、表示画面情報１０９、及び、障害レベルルール情報２３１を、データとして含む。

実施例２のイベント取得サブプログラム１０１、イベント更新サブプログラム１０２、及び構成情報サブプログラム１０５は、実施例１の同符号のプログラムと同じである。実施例２のイベント情報１０６、及び構成情報１０７は、実施例１の同符号のデータと同じである。

実施例２の表示画面情報１０９は、実施例１の表示時刻１９１及び表示情報１９２を含む。しかし、実施例２の表示時刻１９１は、一つのカラムが指定期間の開始時刻と終了時刻とを示し、実施例２の表示情報１９２は、被監視装置３０の障害レベルを示す図形の特徴を示す値を含む。

図１１は、本実施例２の任意の指定期間における障害の発生状況を表示した画面３１０を示す説明図である。

実施例２において、ユーザーが、時刻１（Ｓｔａｒｔｔｉｍｅ）及び時刻２（Ｅｎｄｔｉｍｅ）を指定することによって、実施例２の指定期間が定まる。画面３１０は、指定期間において発生した障害イベントの障害レベルを表示する。実施例２における障害レベルとは、障害イベントの発生時期、及び、障害イベントの重大度等に基づいて算出された値であり、ユーザーが対処する緊急度を示す。

画面３１０は、障害レベルの値に従って、被監視装置３０の表示に付加する警告色、図形又は記号の領域を変化させる。具体的には、画面３１０は、直前に表示していた障害レベルから次に表示する障害レベルが変化した場合、ユーザーの注意をひくような図形、文字、記号、模様又は色彩等を表示することによって、変化の程度を表示する。

図１１において、第１の指定期間、第２の指定期間及び第３の指定期間の順に指定された場合の画面３１０の遷移を示す。

第１の指定期間は、第２の指定期間よりも短く、かつ、第３の指定期間よりも長い。ユーザーは、スクロールバー３１１を用いて、第１の指定期間、第２の指定期間、及び、第３の指定期間の順に指定する。

ユーザーが第１の指定期間をスクロールバー３１１を用いて入力した場合、入出力デバイス２４は、画面３１０ａを表示する。画面３１０ａは、被監視装置３０であるＨｏｓｔＩの表示部分に、第１の指定期間において発生し、現在時刻において未対処である障害の障害レベルとして、障害レベル３１２を表示する。

また、ユーザーが第２の指定期間をスクロールバー３１１を用いて入力した場合、入出力デバイス２４は、画面３１０ｂを表示する。

画面３１０ｂは、ＨｏｓｔＩの表示部分に、第２の指定期間において発生し、現在時刻において未対処である障害の障害レベルとして、障害レベル３１３を表示する。さらに、画面３１０ｂは、障害レベル３１２と障害レベル３１３との変化の程度を示すため、障害レベル３１２の外周と障害レベル３１３の外周との間に特徴的な色彩を表示する。

また、ユーザーが第３の指定期間をスクロールバー３１１を用いて入力した場合、入出力デバイス２４は、画面３１０ｃを表示する。

画面３１０ｃは、ＨｏｓｔＩの表示部分に、第３の指定期間において発生し、現在時刻において未対処である障害の障害レベルとして、障害レベル３１４を表示する。さらに、画面３１０ｃは、障害レベル３１３と障害レベル３１４との変化の程度を示すため、障害レベル３１３と障害レベル３１４との間に特徴的な色彩を表示する。

画面３１０は、障害レベルを円の図形によって表示したが、これには限られず、障害レベルは、ユーザーの注意をひくことができる表示であれば、いかなる図形、記号、模様若又は色彩等の方法によって表示されてもよい。また、画面３１０は、変化の程度も、いかなる方法によって表示してもよい。

また、表示装置２０は、入出力デバイス２４としてスピーカーを有してもよく、障害レベルが増加した場合、入出力デバイス２４は、画面３１０を表示し、さらに、増加したことを示す特徴的な音声をスピーカーから出力してもよい。

画面３１０が、障害レベルと障害レベルの変化の程度とを表示することによって、ユーザーは、指定期間において発生した障害イベントの障害の発生状況を視覚的に一目で把握でき、対処の緊急度の高い障害イベントを早期に発見できる。

また、画面３１０が障害レベルの変化の程度を表示するため、ユーザーは、障害レベルの高さを視覚的に把握し易くなり、障害レベルの高い被監視装置３０で発生した障害イベントに優先的に対処できる。

図１２は、本実施例２の被監視装置３０の障害レベルを示す図形を示す説明図である。

図１２に示す画面３１０は、障害レベルとして円の図形２３９を表示する。画面生成サブプログラム１０３は、図形２３９の直径ｒを定めることによって、障害レベルを示す円の図形２３９を生成し、表示する画面３１０を生成する。

画面生成サブプログラム１０３は、障害レベルが変化したことを、円の色彩又は模様等の変化によって表現してもよい。また、ユーザーは、円の最大直径及び最小直径をあらかじめ監視装置１０に入力してもよい。最大直径及び最小直径が入力された場合、画面生成サブプログラム１０３は、最大直径及び最小直径を用いて、直径ｒと障害レベルとの対応関係を、あらかじめ定めてもよい。

例えば、画面生成サブプログラム１０３は、指定された最大直径及び最小直径、並びに、最大の障害レベル（あらかじめ定められる）に基づいて、障害レベルが１増加する度に増加する直径の値を定めてもよい。具体的には、画面生成サブプログラム１０３は、（（最大直径−最小直径）／最大の障害レベルの合計値）によって算出された結果の、小数第２位以下を切り捨ててもよい。そして、この結果を、直径の増分（Δｒ）として保持してもよい。

画面３１０が円以外の表示方法によって、障害レベルを表示する場合、画面生成サブプログラム１０３は、前述の直径ｒを用いて図形の大きさを定めてもよいし、直径ｒに比例した音量の警告音を定めてもよい。

ユーザーが、障害レベルを示す円の最大の大きさ等を指定することによって、実施例２の画面生成サブプログラム１０３は、例えば、円が大きくなりすぎて、ユーザーがかえって障害レベルを認識しづらくなることを回避することができる。

図１３は、本実施例２の障害レベルルール情報２３１を示す説明図である。

障害レベルルール情報２３１は、画面３１０に表示される障害レベルを算出する際に用いられる。障害レベルルール情報２３１は、イベントＩＤ２３２、平均対処時間２３３、重要度２３４、及び、最後に対処した日時２３５を含む。ルール更新サブプログラム２３０は、後述の処理によってイベント情報１０６に基づいて障害レベルルール情報２３１を生成する。

イベントＩＤ２３２は、障害イベントの識別子を示し、イベント情報１０６のイベントＩＤ１６１に対応する。

平均対処時間２３３は、イベントＩＤ２３２が示す障害イベントが発生してから、当該障害イベントの原因が解消されるまでの平均時間を示す。平均対処時間が長い場合、障害イベントは、一般に困難な障害を示すため、障害に対処する緊急度が高くなる。

重要度２３４は、ユーザーによって任意に定められる値である。重要度２３４は、イベントＩＤ２３２が示す障害イベントの重要性を示す。

図１３に示す重要度２３４は、「緊急」、「エラー」及び「警告」などのメッセージを示すが、各々のメッセージには、障害レベルが対応付けられる。例えば、「緊急」には、障害レベルとして「５」が割り当てられ、「エラー」には、「２」が割り当てられる。

最後に対処した日時２３５は、イベントＩＤ２３２が示す障害イベントが、最後に解消された日時を示す。

平均対処時間２３３、重要度２３４及び最後に対処した日時２３５に基づいて、障害レベルが定められ、画面３１０に表示される図形の大きさが定まる。

なお、迅速に対処すべき障害イベントには、障害レベルが高く定められる。また、障害レベルルール情報２３１は、前述の平均対処時間２３３及び重要度２３４等以外にも、いかなる指標値を保持してもよく、例えば、障害イベントの発生件数を含んでもよい。

図１４は、本実施例２の対処時間レベル２４１を示す説明図である。

対処時間レベル２４１は、平均対処時間と障害への対処が終了していない時間との差と、障害レベルとの対応づけを保持する。対処時間レベル２４１は、経過時間２４２及び障害レベル２４３を含む。

経過時間２４２は、平均対処時間と障害への対処が終了していない時間との差である。具体的には、経過時間２４２は、障害の発生日時（イベント情報１０６の発生日時１６２に相当する）から現在時刻までの時間から、障害レベルルール情報２３１の平均対処時間２３３を減算した値に相当する。障害レベル２４３は、経過時間に割り当てられた障害レベルを示す。

発生した障害への対処が終了しておらず、かつ、障害の発生日時から現在時刻までの時間が平均対処時間よりも長い場合、監視装置１０は、発生した障害への対処の緊急度が高いことを強調して表示する必要がある。このため、図１４において、経過時間２４２が示す時間が長いほど、障害レベル２４３の値が大きい。ただし、ユーザーは、割り当てる障害レベルを任意に選択してよい。

例えば、ユーザーは、障害の発生日時から現在時刻までの時間が、平均対処時間よりも６０分以上１２０分未満多い場合、障害レベルとして２を割り当ててもよい。また、ここでユーザーは、障害の発生日時から現在時刻までの時間が、平均対処時間よりも１２０分以上１８０分未満多い場合、障害レベルとして、２より大きい障害レベルを割り当ててもよい。

図１５は、本実施例２の最終対処日レベル２５１を示す説明図である。

最終対処日レベル２５１は、最後に対処をした日時からの経過日数と、障害レベルとを保持する。経過日数２５２は、障害レベルルール情報２３１の最後に対処した日時２３５から現在時刻までの日数を示す。障害レベル２５３は、経過日数に割り当てられた障害レベルを示す。

一般的に、経過日数が長い場合、障害への対処方法が古くなったり、紛失したりするなどによって、障害に適切に対処できないことが多い。このため、図１５において、経過日数２５２が示す日数が大きいほど、障害レベル２５３の値が大きい。

図１６は、本実施例２のルール更新サブプログラム２３０の処理を示すフローチャートである。

図１６に示す処理は、定期的、又は、ユーザーによる指示によって実行される。また、図１６に示す処理は、監視装置１０が障害イベントを受信した場合に実行されてもよい。

ルール更新サブプログラム２３０は、イベント情報１０６を取得する（２６１）。ステップ２６１の後、ルール更新サブプログラム２３０は、イベント情報１０６のイベントＩＤ１６１を取得する。そして、ルール更新サブプログラム２３０は、取得したイベントＩＤ１６１から重複するイベントＩＤを排除することによって、イベントＩＤ一覧を生成する。そして、ルール更新サブプログラム２３０は、イベントＩＤ一覧のイベントＩＤの数を算出する（２６２）。

ステップ２６２の後、ルール更新サブプログラム２３０は、算出されたイベントＩＤの数、ステップ２６４〜ステップ２５７の処理を繰り返す。具体的には、ルール更新サブプログラム２３０は、イベントＩＤ一覧から、ステップ２６４〜２６７の処理を実行していないイベントＩＤを一つ選択する（２６３）。

ステップ２６３の後、ルール更新サブプログラム２３０は、選択されたイベントＩＤを示すイベントＩＤ１６１のエントリをイベント情報１０６からすべて取得する（２６４）。なお、ルール更新サブプログラム２３０は、イベントＩＤ一覧から、対処状況１６４が「未対処」を示すエントリを除いてもよい。

ステップ２６４の後、ルール更新サブプログラム２３０は、取得したすべてのエントリの対処状況１６４及び対処時間１６５に基づいて、平均対処時間を算出する（２６５）。

ステップ２６５の後、ルール更新サブプログラム２３０は、取得したすべてのエントリの発生日時１６２、対処状況１６４及び対処時間１６５に基づいて、最後に対処した日時を算出する。具体的には、ルール更新サブプログラム２３０は、対処状況１６４が「対処済み」を示すエントリの、発生日時１６２に対処時間１６５を加算することによって、最後に対処した日時を算出する（２６６）。

なお、障害レベルルール情報２３１が、障害レベルの指標として障害イベントの発生件数を有する場合、ルール更新サブプログラム２３０は、取得したすべてのエントリの数を算出し、障害レベルルール情報２３１に格納する。

ステップ２６６の後、ルール更新サブプログラム２３０は、障害レベルルール情報２３１の新たなエントリにおいて、選択されたＩＤをイベントＩＤ２３２に格納し、ステップ２６５において算出された平均対処時間を平均対処時間２３３に格納し、ステップ２６６において算出された日時を、最後に対処した日時２３５に格納する（２６７）。

また、ルール更新サブプログラム２３０は、ステップ２６７において、選択されたイベントＩＤに重要度を割り当てるための画面を、表示装置２０に出力させ、選択されたイベントＩＤに割り当てられた重要度を、ユーザーから受け付けてもよい。そして、ルール更新サブプログラム２３０は、受け付けた重要度を、新たなエントリの重要度２３４に格納してもよい。

ステップ２６７の後、ルール更新サブプログラム２３０は、ステップ２６３に戻り、新たなイベントＩＤを選択する。

図１６に示す処理によって、障害レベルルール情報２３１が生成される。そして、障害レベルルール情報２３１が生成されることにより、実施例２の監視装置１０は、ユーザーが指定した指標によって障害レベルを算出することができる。

図１７は、本実施例２の画面生成サブプログラム１０３の処理を示すフローチャートである。

まず、画面生成サブプログラム１０３は、画面３１０のスクロールバー３１１において指定されたＳｔａｒｔｔｉｍｅ及びＥｎｄｔｉｍｅを、時刻１及び時刻２として取得する。これによって、画面生成サブプログラム１０３は、時刻１と時刻２との間の期間である指定期間を取得する（２７１）。

ステップ２７１の後、画面生成サブプログラム１０３は、指定期間内に存在する被監視装置３０にステップ２７３〜ステップ２８１の処理を実行する。

ステップ２７１の後、まず、画面生成サブプログラム１０３は、指定期間内に存在する被監視装置３０の画面３１０における位置情報を、表示用情報１０８から取得する。具体的には、画面生成サブプログラム１０３は、時刻２の後に新たに追加されていないすべての被監視装置３０を、表示用情報１０８から取得する。

そして、画面生成サブプログラム１０３は、取得した被監視装置３０から、ステップ２７３以降の処理を実行していない被監視装置３０（以下、被監視装置Ｅと記載）を選択する（２７２）。

ステップ２７２の後、画面生成サブプログラム１０３は、被監視装置Ｅを示す表示用情報１０８のエントリから、座標１８２を取得する（２７３）。

ステップ２７３の後、画面生成サブプログラム１０３は、指定期間の被監視装置Ｅにおいて発生した障害イベントであり、かつ、現在時刻において未対処であるイベント情報１０６のエントリをすべて取得する（２７４）。なお、ステップ２７４において障害イベントを取得できない場合、画面生成サブプログラム１０３は、ステップ２７２に戻り、新たな被監視装置３０を選択する。

ステップ２７４の後、画面生成サブプログラム１０３は、ステップ２７４において取得したエントリのイベントＩＤ１６１と、障害レベルルール情報２３１のイベントＩＤ２３２とが一致する障害レベルルール情報２３１のエントリをすべて取得する（２７５）。

ステップ２７５の後、画面生成サブプログラム１０３は、ステップ２７７及びステップ２７８の処理を、ステップ２７４において取得したイベント情報１０６のエントリの各々に実行する。具体的には、画面生成サブプログラム１０３は、ステップ２７４において取得したエントリから、ステップ２７７以降の処理を実行していないエントリ（以下、イベントＦと記載）を一つ選択する（２７６）。

ステップ２７６の後、画面生成サブプログラム１０３は、イベントＦに基づいて障害レベルを算出する（２７７）。

具体的には、画面生成サブプログラム１０３は、イベントＦの発生日時１６２から現在時刻までの時間を算出する。そして、画面生成サブプログラム１０３は、算出した時間から、イベントＦのイベントＩＤ１６１に対応する平均対処時間２３３を減算することによって、経過時間を算出する。そして、画面生成サブプログラム１０３は、算出した経過時間（経過時間２４２に対応）に割り当てられた障害レベルを、対処時間レベル２４１の障害レベル２４３から取得する。

また、画面生成サブプログラム１０３は、ステップ２７７において、重要度２３４及び最後に対処した日時２３５の各々に割り当てられた障害レベルを取得する。具体的には、画面生成サブプログラム１０３は、イベントＦのイベントＩＤ１６１に対応する最後に対処した日時２３５に割り当てられた障害レベルを、最終対処日レベル２５１の障害レベル２５３から取得する。また、画面生成サブプログラム１０３は、重要度２３４に割り当てられた障害レベルを、あらかじめ保持した障害レベルから取得する。

そして、ステップ２７７において、画面生成サブプログラム１０３は、取得した各障害レベルの合計値を算出する。

ステップ２７７の後、画面生成サブプログラム１０３は、算出された障害レベルの合計値を、表示用障害レベルに加算する（２７８）。ここで、表示用障害レベルとは、被監視装置Ｅの障害レベルを示す円の直径ｒを算出するために用いられる障害レベルであり、指標が複数であり、障害イベントが複数である場合、障害レベルの合計値である。表示用障害レベルは、記憶デバイス１３に保持される。

ステップ２７８の後、画面生成サブプログラム１０３は、ステップ２７６に戻り、新たなエントリを選択する。

ステップ２７６〜ステップ２７８を実行することにより、画面生成サブプログラム１０３は、指定期間において被監視装置Ｅにおいて発生し、現在時刻まで未対処の障害イベントすべての障害レベルを表示する図形の大きさ等を定めることができる。

ステップ２７６〜ステップ２７８が終了した後、画面生成サブプログラム１０３は、算出された表示用障害レベルの値に従って、被監視装置Ｅの円の直径ｒを定める（２７９）。画面生成サブプログラム１０３は、前述した直径ｒと障害レベルとの対応関係と、表示用障害レベルの値とに基づいて、被監視装置Ｅの円の直径ｒを定める。

ステップ２７９の後、画面生成サブプログラム１０３は、表示装置２０において現在表示されている画面３１０がある場合、現在表示されている画面３１０に対応する表示画面情報１０９のエントリを複製し、複製した表示画面情報１０９のエントリ（以下、既存画面情報）を記憶デバイス１３に格納する（２８０）。既存画面情報には、現在表示されている被監視装置Ｅの障害レベルを示す円の直径ｒ１が含まれる。

ステップ２８０の後、画面生成サブプログラム１０３は、次に表示する画面のための表示画面情報１０９を生成する（２８１）。具体的には、画面生成サブプログラム１０３は、表示画面情報１０９の表示時刻１９１がステップ２７１において取得した指定期間を示すエントリの表示情報１９２に、ステップ２７３において取得した被監視装置Ｅの位置情報と、ステップ２７９において決定された障害レベルを示す円の直径ｒとを、格納する。

なお、ステップ２８１において、表示時刻１９１が指定期間を示すエントリが表示画面情報１０９にない場合、画面生成サブプログラム１０３は、新たなエントリを生成する。

ステップ２８１の後、画面生成サブプログラム１０３は、ステップ２８０において取得した既存画面情報に含まれる直径ｒ１と、ステップ２７９において決定された直径ｒとを比較し、比較の結果に従って定められた差分の表示方法を、差分画面情報に格納する（２８２）。差分画面情報とは、記憶デバイス１３に保持される値である。

例えば、直径ｒ１よりも直径ｒが大きい場合、画面生成サブプログラム１０３は、比較の結果に従って定められた表示方法として、障害レベルが増大したことを示す色彩を、被監視装置Ｅの障害レベルの円（直径ｒ１）の外周と円（直径ｒ）の外周との間に付加することを差分画面情報に格納する。

ステップ２８２の後、画面生成サブプログラム１０３は、ステップ２７２に戻り、新たな被監視装置Ｅを選択する。

図１７に示す処理を実行することによって、実施例２の表示画面情報１０９に、指定期間において表示する被監視装置３０の位置情報と、当該被監視装置３０の障害レベルを示す円の直径とが格納される。

そして、表示用サブプログラム１０４は、表示画面情報１０９と差分画面情報とを参照し、例えば、画面３１０ｂを表示装置２０に表示させる。障害レベル３１２の直径は、前述の例における直径ｒ１であり、障害レベル３１３の直径は、前述の例における直径ｒである。そして、表示用サブプログラム１０４は、障害レベル３１２の円と障害レベル３１３の円との色彩を、差分画面情報が示す比較の結果に従って定められた表示方法を用いて表示する。

時刻１以前に発生した障害イベントであり、現在時刻において未対処の障害イベントであり、時刻１から時刻２までの間に同じ被監視装置３０において同じ障害イベントが発生した場合、実施例１の表示用サブプログラム１０４は、正確に障害イベントの発生時刻を、画面に表示できない。

一方、実施例２によれば、表示用サブプログラム１０４は、時刻１から時刻２までに発生した障害イベントのみを画面３１０に表示するため、時刻１前のイベントが対処であるか又は未対処であるかにかかわらず、時刻１から時刻２までに発生した障害イベントを表示する。

また、実施例２の監視装置１０は、障害への対処状況、及び障害の重要度等の指標によって算出された障害レベルを用い、障害の緊急度を示す図形等を、障害の発生状況として画面に表示する。このため、ユーザーは、実施例２による画面を見ることによって、指定期間において発生し、かつ、未対処である障害イベントに対処する緊急度を適切に把握することができる。

実施例３の監視システムは、実施例１におけるアニメーションによる画面表示と実施例２における障害レベルの表示とを行う。実施例３における計算機システムは、図１に示す実施例１及び実施例２の計算機システムと同じ構成である。

また、実施例３における記憶デバイス１３が有するプログラム及びデータは、図１０に示す実施例２のプログラム及びデータと同じである。しかし、プログラムの処理及びデータの内容が、実施例３と実施例２とにおいて異なる。

図１８は、本実施例３の時刻１から時刻２までの障害の発生状況を連続して表示する画面３２０を示す説明図である。

ユーザーは、表示装置２０の入出力デバイス２４に表示された画面３２０のスクロールバー３２１を介して、時刻１（Ｒｅｐｌａｙｓｔａｒｔｔｉｍｅ）、時刻２（ＲｅｐｌａｙＥｎｄｔｉｍｅ）及び時刻３（Ｐｏｉｎｔｉｎｔｉｍｅ）を入力する。

実施例３の画面３２０は、時刻１（Ｒｅｐｌａｙｓｔａｒｔｔｉｍｅ）及び時刻２（ＲｅｐｌａｙＥｎｄｔｉｍｅ）の間に発生した障害イベントを、発生した時刻の順にアニメーションによって表示する。また、画面３２０は、発生した障害イベントの時刻３（Ｐｏｉｎｔｉｎｔｉｍｅ）における障害レベルを表示する。

以下における画面生成サブプログラム１０３は、実施例１と同じく障害の発生状況をアニメーションによって表示し、実施例２と同じく障害レベルを表示する。しかし、以下に示す画面生成サブプログラム１０３は、実施例１と異なり、表示画面情報の停止時間１９３に従ってアニメーションを停止し、同じ画面３２０を表示し続けない。また、以下に示す画面生成サブプログラム１０３は、実施例２と異なり、表示されていた障害レベルと表示する障害レベルとの差分を、強調して表示しない。

図１９Ａは、本実施例３の画面生成サブプログラム１０３の処理の前半を示すフローチャートである。

ステップ３５１〜ステップ３５５は、図８Ａに示すステップ２０１〜ステップ２０５と同じである。

ステップ３５５の後、画面生成サブプログラム１０３は、イベント情報１０６の発生日時１６２及びホスト名１６３を参照し、時刻１から時刻３までに被監視装置Ｃにおいて発生したすべての障害イベントを示すエントリを、イベント情報１０６から取得する（３５６）。

ステップ３５６の後、画面生成サブプログラム１０３は、ステップ３５６において取得したエントリのイベントＩＤ１６１と、障害レベルルール情報２３１のイベントＩＤ２３２とが一致する障害レベルルール情報２３１のエントリをすべて取得する（３５７）。

図１９Ｂは、本実施例３の画面生成サブプログラム１０３の処理の後半を示すフローチャートである。

ステップ３５８〜ステップ３６１は、図１７に示すステップ２７６〜ステップ２７９と同じである。

ステップ３５４〜ステップ３６１の処理が終了した後、画面生成サブプログラム１０３は、時刻３における表示画面情報１０９を生成する。具体的には、画面生成サブプログラム１０３は、表示時刻１９１に時刻３を格納し、表示情報１９２にステップ３５５において取得した位置情報と、ステップ３６１において決定された円の直径ｒと、を表示情報１９２に格納する（３６２）。

ステップ３６２の後、画面生成サブプログラム１０３は、ステップ３５３に戻る。そして、時刻３が時刻２を超えた場合、画面生成サブプログラム１０３は、図１９Ａ及び図１９Ｂに示す処理を終了する。

図１９Ａ及び図１９Ｂに示す処理が終了した後、図９に示す処理が実行され、表示用サブプログラム１０４は、被監視装置３０において障害が発生した時刻において、障害レベルを示す図形を画面３２０に表示する。

なお、実施例３の画面生成サブプログラム１０３は、実施例１と同じく表示画面情報の停止時間１９３に従ってアニメーションを停止させてもよい。この場合、図８Ｂに示すステップ２０８〜ステップ２１１を、図１９Ａに示すステップ３５６において実行してもよい。

また、実施例３における画面生成サブプログラム１０３は、実施例２の差分画面情報を用いて、表示されていた障害レベルと表示する障害レベルとの差分を、色彩等によって強調してもよい。この場合、画面生成サブプログラム１０３は、ステップ２８０〜ステップ２８２を、ステップ３６１の後に実行し、サンプリング間隔ごとの障害レベルの差分を強調して表示してもよい。

実施例３によれば、ユーザーが指定した指定期間において発生した障害イベントに対する障害の発生状況を、画面３２０にアニメーションによって表示し、さらに、障害レベルの程度を視覚的に表示する。このため、ユーザーは、指定期間中の障害レベルの変化を、視覚的に把握することができ、さらに、障害の発生時刻及び発生順序を把握することができる。

なお、前述において、本実施例のプログラムを実行するために必要なデータを「ａａａ情報」と記載したが、これらはいかなるデータ構造によって記憶デバイス２３に保持されてもよい。例えば、イベント情報１０６は、リストの構造によって保持された「イベントリスト」であってもよく、また、データベースによって保持された「イベントＤＢ」であってもよい。

さらに、各情報の内容を説明する際に、「識別子」、「名」、「ＩＤ」と表現したが、これらについては互いに置換が可能である。

また、前述の説明では「プログラム」が処理を実行したが、プログラムはＣＰＵ１２又はＣＰＵ２２によって実行されることで、あらかじめ定められた処理を記憶デバイス１３、記憶デバイス２３及びネットワークアダプタ（通信制御デバイス）を用いながら行うため、ＣＰＵ１２又はＣＰＵ２２を主語とした説明としてもよい。また、プログラムを主語として記載した処理は、監視装置１０等の計算機が行う処理として表現してもよい。また、プログラムの一部又は全ては専用ハードウェアによって実現されてもよい。

また、各種プログラムはプログラム配布サーバ、計算機が読み取り可能な記憶メディアによって各計算機にインストールされてもよい。この場合、プログラム配布サーバはＣＰＵと記憶資源を含み、記憶資源はさらに配布プログラムと配布対象であるプログラムを記憶している。そして、配布プログラムをＣＰＵが実行することで、プログラム配布サーバのＣＰＵは配布対象のプログラムを他の計算機に配布してもよい。

また、本発明は前述した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、前述した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。

また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加、削除又は置換をすることが可能である。

また、前述の各構成、機能、処理部及び処理方法等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実装してもよい。また、前述の各構成及び機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。

各機能を実現するプログラム、テーブル又はファイル等の情報は、メモリ、ハードディスク若しくはＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）等の記録装置、又は、ＩＣカード、ＳＤカード若しくはＤＶＤ等の記録媒体に置くことができる。

また、図における制御線及び情報線は、説明上必要と考えられるものが示されており、製品上必ずしも全ての制御線及び情報線が示されているとは限らない。実際には、ほとんどすべての構成が相互に接続されていると考えてよい。

複数の計算機を有するシステムを監視する監視システムに適用できる。

Claims

監視システムであって、
計算機に接続するネットワークインタフェースと、
指定期間の終了時刻を受け付ける入力インタフェースと、
前記計算機において発生した障害を画面に表示する位置を示す位置情報と、
前記計算機において発生した障害と、当該障害が発生した時刻と、当該障害への対処状況とを示すイベント情報と、を有し、
前記監視システムは、
前記終了時刻までに発生し、かつ、現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成し、
前記生成された画面の画面データを出力し、
前記指定期間は、複数の表示時刻を含み、
前記監視システムは、
前記複数の表示時刻のうちの一つの表示時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成することによって、前記複数の表示時刻の複数の画面を生成し、
前記生成された複数の画面を、前記複数の表示時刻の時系列に連続して表示する画面データを出力し、
前記障害が発生した場合、一つの画面を表示し続ける時間を示す停止時間情報を有し、
前記複数の画面が示す障害と、前記停止時間情報とに基づいて、前記複数の画面の各々を表示する時間を決定し、
前記決定された時間に従って、前記生成された複数の画面を、前記複数の表示時刻の時系列に連続して表示する画面データを出力することを特徴とする監視システム。
監視システムであって、
計算機に接続するネットワークインタフェースと、
指定期間の終了時刻を受け付ける入力インタフェースと、
前記計算機において発生した障害を画面に表示する位置を示す位置情報と、
前記計算機において発生した障害と、当該障害が発生した時刻と、当該障害への対処状況とを示すイベント情報と、を有し、
前記監視システムは、
前記終了時刻までに発生し、かつ、現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成し、
前記生成された画面の画面データを出力し、
前記入力インタフェースは、前記指定期間の開始時刻を受け付け、
前記監視システムは、
前記開始時刻から前記終了時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示すイベント情報に基づいて、前記障害に対処する緊急度を算出し、
前記算出された緊急度によって異なる態様で、前記障害を示す画面を生成し、
前記イベント情報に基づいて、前記障害が過去に複数回発生した場合に前記障害の対処が終了するまでに必要だった時間の平均時間と、前記障害の対処が最後に終了した日から前記現在時刻までの経過日数とを算出し、
前記開始時刻から前記終了時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示すイベント情報に基づいて、前記対処が終了していない障害が発生した時刻から前記現在時刻までの時間から、前記算出された平均時間を減算した値を、経過時間として算出し、
前記算出された経過時間及び経過日数に基づいて、前記緊急度を算出することを特徴とする監視システム。
監視システムであって、
計算機に接続するネットワークインタフェースと、
指定期間の終了時刻を受け付ける入力インタフェースと、
前記計算機において発生した障害を画面に表示する位置を示す位置情報と、
前記計算機において発生した障害と、当該障害が発生した時刻と、当該障害への対処状況とを示すイベント情報と、を有し、
前記監視システムは、
前記終了時刻までに発生し、かつ、現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成し、
前記生成された画面の画面データを出力し、
前記入力インタフェースは、前記指定期間の開始時刻を受け付け、
前記監視システムは、
前記開始時刻から前記終了時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示すイベント情報に基づいて、前記障害に対処する緊急度を算出し、
前記算出された緊急度によって異なる態様で、前記障害を示す画面を生成し、
前記入力インタフェースは、第１の指定期間の第１の開始時刻及び第１の終了時刻を受け付けた後、第２の指定期間の第２の開始時刻及び第２の終了時刻を受け付け、
前記監視システムは、
前記第１の開始時刻から前記第１の終了時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示すイベント情報に基づいて、第１の緊急度を算出し、
前記第２の開始時刻から前記第２の終了時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示すイベント情報に基づいて、第２の緊急度を算出し、
前記算出された第１の緊急度と第２の緊急度との差を表示する画面を生成することを特徴とする監視システム。
監視システムによる監視方法であって、
前記監視システムは、
プロセッサと、
計算機に接続するネットワークインタフェースと、
指定期間の終了時刻を受け付ける入力インタフェースと、
前記計算機において発生した障害を画面に表示する位置を示す位置情報と、
前記計算機において発生した障害と、当該障害が発生した時刻と、当該障害への対処状況とを示すイベント情報と、を有し、
前記方法は、
前記プロセッサが、前記終了時刻までに発生し、かつ、現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成する手順と、
前記生成された画面の画面データを出力する手順と、を含み、
前記指定期間は、複数の表示時刻を含み、
前記方法は、
前記プロセッサが、前記複数の表示時刻のうちの一つの表示時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成することによって、前記複数の表示時刻の複数の画面を生成する手順と、
前記プロセッサが、前記生成された複数の画面を、前記複数の表示時刻の時系列に連続して表示する画面データを出力する手順と、を含み、
前記監視システムは、前記障害が発生した場合、一つの画面を表示し続ける時間を示す停止時間情報を有し、
前記方法は、
前記プロセッサが、前記複数の画面が示す障害と、前記停止時間情報とに基づいて、前記複数の画面の各々を表示する時間を決定する手順と、
前記プロセッサが、前記決定された時間に従って、前記生成された複数の画面を、前記複数の表示時刻の時系列に連続して表示する画面データを出力する手順と、を含むことを特徴とする監視方法。
監視システムによる監視方法であって、
前記監視システムは、
プロセッサと、
計算機に接続するネットワークインタフェースと、
指定期間の終了時刻を受け付ける入力インタフェースと、
前記計算機において発生した障害を画面に表示する位置を示す位置情報と、
前記計算機において発生した障害と、当該障害が発生した時刻と、当該障害への対処状況とを示すイベント情報と、を有し、
前記方法は、
前記プロセッサが、前記終了時刻までに発生し、かつ、現在時刻において対処が終了していない障害を示す画面を、前記位置情報及び前記イベント情報に基づいて生成する手順と、
前記生成された画面の画面データを出力する手順と、を含み、
前記入力インタフェースは、前記指定期間の開始時刻を受け付け、
前記方法は、
前記プロセッサが、前記開始時刻から前記終了時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示すイベント情報に基づいて、前記障害に対処する緊急度を算出する手順と、
前記プロセッサが、前記算出された緊急度によって異なる態様で、前記障害を示す画面を生成する手順と、
前記プロセッサが、前記イベント情報に基づいて、前記障害が過去に複数回発生した場合に前記障害の対処が終了するまでに必要だった時間の平均時間と、前記障害の対処が最後に終了した日から前記現在時刻までの経過日数とを算出する手順と、
前記プロセッサが、前記開始時刻から前記終了時刻までに発生し、かつ、前記現在時刻において対処が終了していない障害を示すイベント情報に基づいて、前記対処が終了していない障害が発生した時刻から前記現在時刻までの時間から、前記算出された平均時間を減算した値を、経過時間として算出する手順と、
前記プロセッサが、前記算出された経過時間及び経過日数に基づいて、前記緊急度を算出する手順と、を含むことを特徴とする監視方法。