WO2013035264A1

WO2013035264A1 - 監視装置、監視方法およびプログラム

Info

Publication number: WO2013035264A1
Application number: PCT/JP2012/005355
Authority: WO
Inventors: 悠吉田
Original assignee: 日本電気株式会社
Priority date: 2011-09-05
Filing date: 2012-08-27
Publication date: 2013-03-14
Also published as: JPWO2013035264A1

Abstract

複数の監視対象各々に対して実施される複数の検査項目の検査結果を取得する検査結果取得部（１０）と、監視対象各々の前記検査項目各々の状況を同じスケールで示す変換値を、検査結果を利用して算出するための変換ルールを保持する変換ルール保持部（２０）と、検査結果取得部（１０）が取得した検査結果、及び、変換ルールを利用して変換値を算出する変換部（３０）と、監視対象毎に、複数の検査項目を複数のグループに分類し、グループ毎に、各々のグループに分類される検査項目の変換値を利用して、評価値を算出するグループ毎評価部（４０）と、監視対象各々に関連付けて評価値を出力する出力部（５０）と、を有する監視装置（１）。

Description

監視装置、監視方法およびプログラム

　本発明は、監視装置、監視方法およびプログラムに関する。

　近年、サーバやストレージ、ネットワーク機器といったＩＴ機器や、これらを用いて実現される様々なサービス（以下、「ＩＴサービス」）の状態（稼動状態等）を監視するための様々な方法が提供されている。

　例えば、監視用のシステム（以下、「監視システム」）が、監視対象（ＩＴサービス、ＩＴ機器等）の状態を示す情報（監視メッセージ等）をリアルタイムに取得し、ディスプレイ等を介して出力する。そして、監視オペレータが、当該情報をモニタする方法などがある。なお、監視対象の状態を示す情報の中には、監視対象に障害が発生したことを示す情報や、監視対象の稼動状態を確認するために所定時間おきに実施される様々な検査項目（応答時間、ＣＰＵ使用率等）の検査結果などが含まれる。

　特許文献１には、映像モニタリングシステムにおいて所定の事象が発生した場合に、当該事象の発生を通知するためのメッセージを配信する機器監視システムであって、異なる複数の使用者によって使用される複数の監視端末装置と、前記映像モニタリングシステムにおいてある事象が発生した場合に、当該事象の通知レベルに応じて、前記複数の監視端末装置のうちいずれの監視端末装置に当該事象の発生を通知するためのメッセージを配信するかを決定する監視装置とを有する機器監視システムが開示されている。

　特許文献２には、装置毎に異なる識別子が割り当てられた複数のデータ転送装置とネットワークを介して接続される情報処理装置であって、前記複数のデータ転送装置の接続関係を示すネットワーク構成情報が格納された記憶部と、前記識別子、障害発生日時および障害の種類の情報を含む障害メッセージを前記複数のデータ転送装置から受信すると、これらのメッセージを前記記憶部に格納し、該複数の障害メッセージのうち２つの障害メッセージの前記障害発生日時が所定の時間内であれば、該２つの障害メッセージに所定の点数を付与し、前記ネットワーク構成情報を参照して該２つの障害メッセージの送信元となる２つの装置間のホップ数を調べ、該ホップ数が少ないほど大きい点数を前記２つの障害メッセージの得点に加算し、点数の合計値が大きいほど前記２つの障害メッセージの関連性が高いと判定し、前記所定の時間内に前記２つの障害メッセージのそれぞれが示す種類の障害が該２つの障害メッセージの障害発生順序で発生すると順序が後の方のメッセージを削除する旨のルールを生成するか否かを決定する制御部と、を有する情報処理装置が開示されている。

特開２００９－０８９２２９号公報特開２００９－２５３３５８号公報

　本発明者は、監視オペレータへの情報提供手段において、以下のような課題を見出した。

　監視オペレータは、複数の監視対象を並行して監視する場合がある。かかる場合、膨大な量の情報が、監視オペレータに提供されることとなる。

　当然、監視オペレータは、システムに障害が発生していることを示す情報や検査結果が良くないことを示す情報（不具合情報）は見落とさず確認し、必要に応じて適切な対応を取らなければならない。しかし、提供される情報量が多い場合、監視オペレータは不具合情報を見落としてしまう恐れがある。

　また、複数の検査項目の中には、複数の監視対象に対して実行されるものがある。そして、このような検査項目の中には、複数の監視対象各々の要求性能が異なるものがある。例えば、第１の監視対象に要求される応答時間と、第２の監視対象に要求される応答時間が異なる場合がある。このため、検査結果が全く同じ値であっても、一方の監視対象にとっては不具合情報であるが、他方の監視対象にとっては不具合情報でない場合があり得る。すなわち、監視オペレータは、複数の監視対象各々の要求性能を適切に把握したうえで、監視対象毎の検査結果を確認する必要がある。

　しかし、監視対象及び検査項目が多数ある場合、監視ユーザが把握すべき情報は膨大な量となり、確認作業は面倒なものとなる。また、このような作業に気を取られているうちに、他の不具合情報を見落としてしまうなどの不都合が発生し得る。

　そこで、本発明では、複数の監視対象を並行して監視する監視オペレータが、不具合情報を見落とす不都合を軽減する情報提供手段を提供することを課題とする。

　本発明によれば、複数の監視対象各々に対して実施される複数の検査項目の検査結果を取得する検査結果取得手段と、前記監視対象各々の前記検査項目各々の状況を同じスケールで示す変換値を、前記検査結果を利用して算出するための変換ルールを保持する変換ルール保持手段と、前記検査結果取得手段が取得した前記検査結果、及び、前記変換ルールを利用して前記変換値を算出する変換手段と、前記監視対象毎に、前記複数の検査項目を複数のグループに分類し、前記グループ毎に、各々のグループに分類される前記検査項目の前記変換値を利用して、評価値を算出するグループ毎評価手段と、前記監視対象各々に関連付けて前記評価値を出力する出力手段と、を有し、前記複数の検査項目の中には、複数の前記監視対象に対して実施される共通検査項目が少なくとも１つ存在し、前記変換ルール保持手段は、前記共通検査項目の中の少なくとも１つの前記変換ルールを複数保持する監視装置が提供される。

　また、本発明によれば、コンピュータを、複数の監視対象各々に対して実施される複数の検査項目の検査結果を取得する検査結果取得手段、前記監視対象各々の前記検査項目各々の状況を同じスケールで示す変換値を、前記検査結果を利用して算出するための変換ルールを保持する変換ルール保持手段、前記検査結果取得手段が取得した前記検査結果、及び、前記変換ルールを利用して前記変換値を算出する変換手段、前記監視対象毎に、前記複数の検査項目を複数のグループに分類し、前記グループ毎に、各々のグループに分類される前記検査項目の前記変換値を利用して、評価値を算出するグループ毎評価手段、前記監視対象各々に関連付けて前記評価値を出力する出力手段、として機能させるとともに、前記複数の検査項目の中には、複数の前記監視対象に対して実施される共通検査項目が少なくとも１つ存在し、前記変換ルール保持手段に、前記共通検査項目の中の少なくとも１つの前記変換ルールを複数保持させることができるプログラムが提供される。

　また、本発明によれば、複数の監視対象各々に対して実施される複数の検査項目の検査結果を取得する検査結果取得ステップと、前記監視対象各々の前記検査項目各々の状況を同じスケールで示す変換値を、前記検査結果を利用して算出するための変換ルール、及び、前記検査結果取得ステップで取得した前記検査結果を利用して前記変換値を算出する変換ステップと、前記監視対象毎に、前記複数の検査項目を複数のグループに分類し、前記グループ毎に、各々のグループに分類される前記検査項目の前記変換値を利用して、評価値を算出するグループ毎評価ステップと、前記監視対象各々に関連付けて前記評価値を出力する出力ステップと、をコンピュータが実行し、前記複数の検査項目の中には、複数の前記監視対象に対して実施される共通検査項目が少なくとも１つ存在し、前記共通検査項目の中の少なくとも１つの前記変換ルールは複数存在する監視方法が提供される。

　本発明によれば、複数の監視対象を並行して監視する監視オペレータが不具合情報を見落とす不都合を軽減することができる。

　上述した目的、および、その他の目的、特徴および利点は、以下に述べる好適な実施の形態、および、それに付随する以下の図面によって、さらに明らかになる。
本実施形態の監視装置の機能ブロック図の一例である。本実施形態の監視装置が出力する内容の一例である。本実施形態の監視方法の処理の流れの一例を示すフローチャートである。本実施形態の変換ルールの一例を説明するための図である。本実施形態の監視装置が保持するデータの一例である。本実施形態の監視装置が保持するデータの一例である。本実施形態の監視装置が保持するデータの一例である。本実施形態の監視装置が保持するデータの一例である。本実施形態の監視装置が保持するデータの一例である。

　以下、本発明の実施の形態について図面を用いて説明する。

　なお、本実施形態の装置は、任意のコンピュータのＣＰＵ、メモリ、メモリにロードされたプログラム（あらかじめ装置を出荷する段階からメモリ内に格納されているプログラムのほか、ＣＤ等の記憶媒体やインターネット上のサーバ等からダウンロードされたプログラムも含む）、そのプログラムを格納するハードディスク等の記憶ユニット、ネットワーク接続用インタフェースを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。

　また、本実施形態の説明において利用する機能ブロック図は、ハードウエア単位の構成ではなく、機能単位のブロックを示している。これらの図においては、各装置は１つの機器により実現されるよう記載されているが、その実現手段はこれに限定されない。すなわち、物理的に分かれた構成であっても、論理的に分かれた構成であっても構わない。

　まず、本実施形態の概要について説明する。

　本実施形態の監視装置は、複数の監視対象各々に対して実施される複数の検査項目（応答時間、ＣＰＵ使用率、サービス死活等）の検査結果を取得する。そして、監視装置は、取得した検査結果を利用して、各監視対象の各検査項目の現状を、同じスケールの値で表現する。

　例えば、応答時間の検査結果は「秒」で示される。また、ＣＰＵ使用率は「％」で示される。さらに、サービスの死活は「生又は死」の２値で示される。監視装置は、このような様々な単位で示される複数の検査項目の検査結果を利用して、各監視対象の各検査項目の現状を、同じスケール、例えば５０点満点の値（変換値）で表現する。

　なお、「同じスケールで示す」とは、複数の検査項目各々の所定のレベルが、同じ変換値（以下、「目安値」）になることも意味する。

　例えば、第１の監視対象の応答時間が１秒を超えるとアラートを発生させる必要がある場合、監視装置は、応答時間「１秒」から目安値（例：４０点）を算出する。また、第１の監視対象のＣＰＵ使用率が５０％を超えるとアラートを発生させる必要がある場合、監視装置は、ＣＰＵ使用率「５０％」から目安値（例：４０点）を算出する。この例の場合、各検査項目のアラートを発生させるか否かの目安となるレベル（以下、「アラートレベル」）が、目安値に変換されている。

　なお、同じ検査項目であっても、監視対象毎にアラートレベルが異なる場合がある。例えば、第１の監視対象は応答時間が１秒を超えるとアラートを発生させる必要があるが、第２の監視対象は応答時間が１．５秒を超えるとアラートを発生させる必要があるような場合がある。このため、監視装置は、第１の監視対象の応答時間（検査結果）を変換値に変換する変換ルールと、第２の監視対象の応答時間（検査結果）を変換値に変換する変換ルールを別々に保持しておき、各々の変換ルールに従い、各々の検査結果を変換値に変換することができる。

　そして、監視装置は、各検査項目の検査結果をそのまま監視オペレータに提供するのでなく、上述のようにして算出した変換値を利用して、以下のような処理を行う。

　まず、監視装置は、監視対象毎に、複数の検査項目を複数のグループに分類する。そして、監視装置は、各グループに分類される検査項目の変換値の中の最低値を特定する。次いで、監視装置は、特定した最低値を、当該グループの評価値として決定する。そして、監視装置は、監視対象毎に、各グループの評価値を監視オペレータに提供する。

　以下、このような本実施形態の監視装置の詳細な構成について説明する。図１は、本実施形態の監視装置１の機能ブロック図の一例である。

　図１に示すように、本実施形態の監視装置１は、検査結果取得部１０と、変換ルール保持部２０と、変換部３０と、グループ毎評価部４０と、出力部５０とを有する。なお、監視装置１は、さらに、総合評価部６０を有してもよい。

　検査結果取得部１０は、複数の監視対象各々に対して実施される複数の検査項目の検査結果を取得する。「監視対象」は、サーバやストレージ、ネットワーク機器といったＩＴ機器類や、このようなＩＴ機器を用いて実現される様々なＩＴサービスなどが該当する。なお、並行して監視する監視対象の数は設計的事項である。

　「検査項目」は、監視対象の稼動状態を監視するためのあらゆる項目が該当し、例えば、サービス応答時間、ＣＰＵ使用率、冗長構成の状態を検査する冗長構成保障、各ＩＴ機器の死活を検査する個別機器死活、各サービスの死活を検査するサービス死活、サービスにアクセスするためのネットワーク性能を検査するネットワーク帯域容量、サービスを構成するインフラストラクチャの正常性や障害リスクを検査する相関破壊度、サービス品質を維持するためのインフラ容量を検査するリソース容量などであってもよい。監視対象各々に対してどのような検査項目の検査を行うかは、設計的事項である。

　なお、複数の検査項目の検査は、定期的又は間欠的に実施される。そして、検査結果取得部１０は、上記検査項目の検査が実行されると、その検査結果をリアルタイムに取得することができる。

　このような検査結果取得部１０の構成は従来技術に準じて実現できるので、ここでの説明は省略する。

　変換ルール保持部２０は、複数の検査項目各々の検査結果を、同じスケールで示す変換値に変換する変換ルールを保持する。変換値のスケールは特段制限されず、例えば５０点満点、１００点満点などであってもよいし、Ａ乃至Ｅの５段階評価であってもよい。以下は、検査結果を５０点満点のスケールに変換するものとする。

　なお、「同じスケールで示す」とは、複数の検査項目各々の所定のレベル（アラートレベル）が、同じ変換値（目安値）になることも意味する。なお、上記「所定のレベル」は、アラートレベルと異なるレベルであってもよい。例えば、上記所定のレベルは、監視オペレータが所定のユーザ（監督者）に各検査項目の検査結果を報告する必要があるレベルであってもよい。以下では、上記所定のレベルは、アラートレベルであるものとする。

　例えば、第１の監視対象の応答時間が１秒を超えるとアラートを発生させる必要がある場合、監視装置は、応答時間「１秒」から目安値（例：４０点）が算出される変換ルールを保持しておく。また、第１の監視対象の冗長構成が「ｎ重化（現用系）」を下回るとアラートを発生させる必要がある場合、監視装置は、冗長構成「ｎ重化（現用系）」から目安値（例：４０点）が算出される変換ルールを保持しておく。

　なお、複数の検査項目の中には、複数の監視対象に対して実施される共通検査項目が少なくとも１つ存在する。変換ルール保持部２０は、このような共通検査項目の中の少なくとも１つの変換ルールを、複数保持することができる。例えば、検査項目「応答時間」が、第１及び第２の監視対象何れに対しても実施される共通検査項目であるとする。かかる場合、変換ルール保持部２０は、応答時間を変換値に変換する変換ルールを、第１及び第２の監視対象毎に保持することができる。当然、各々の変換ルールの内容は、異なるものであってよい。このように構成した場合、第１及び第２の監視対象各々のアラートレベルが異なる場合であっても、変換ルール保持部２０は、各々に応じた複数の変換ルールを保持しておくことができる。

　ここで、図５に、変換ルール保持部２０が保持する変換ルールの一例を示す。図５に示すデータでは、各検査項目に対応付けて、変換ルールＩＤ及び変換ルールが記載されている。なお、共通検査項目である応答時間には、複数の変換ルールが対応付けて記載されている。

　なお、変換ルール保持部２０は、このように共通検査項目の検査結果を変換する変換ルールを複数保持する場合、その共通検査項目の検査を実行される監視対象各々に、いずれか１つの変換ルールを対応付けた情報（変換ルール－監視対象対応情報）を保持しておく。図６に、変換ルール－監視対象対応情報の一例を示す。図６に示す変換ルール－監視対象対応情報によれば、監視対象ＩＤ「０００００１」から取得した応答時間の検査結果は、変換ルールＩＤ［００００Ａ］の変換ルールに従い、変換値に変換されることが示されている。

　ここで、変換ルールの詳細は設計的事項であり、特段制限されない。例えば、変換ルールは、検査結果を代入されると変換値を算出する関数であってもよい。なお、変換ルールは、最新の検査結果のみを用いて変換値を算出するルールであってもよいし、または、最新の検査結果のみならず、過去の検査結果をも反映させて変換値を算出するルールであってもよい。以下、変換ルールの一例を説明する。

　当該例においては、図４に示すような、ファイアウォール（ＦＷ）、ロードバランサ（ＬＢ）、５つのウェブサーバ（Ｗｅｂ０１乃至０５）、及び、データベース（ＤＢ）で構成されているシステムが監視対象であるとする。なお、Ｗｅｂ０１乃至０５は冗長構成となっている。また、Ｗｅｂ０１乃至０５は、システムに障害が発生した場合、自動復旧する機能（自動復旧機能）が備わっているとする。

　例えば、当該システムにおいて、Ｗｅｂ０１が停止したとする。かかる場合、検査項目「個別機器（Ｗｅｂ０１）死活」の検査結果は「死（停止）」となる。なお、Ｗｅｂ０１は冗長構成の１つであり、また、自動復旧の機能が備わっているため、Ｗｅｂ０１の停止が、直接、システムの稼働に大きな影響を及ぼすことはない。このため、Ｗｅｂ０１の停止により直ちにアラートを発生させる必要はない。しかし、Ｗｅｂ０１が停止及び自動復旧を繰り返す場合、検査が必要であると考えられるので、アラートを発生させた方がよい。

　このような場合の変換ルールは、Ｗｅｂ０１の検査結果が「死（停止）」になると、満点（ここでは「５０点」）から所定の値（ここでは「５点」）を減点した変換値（４５点）を算出するように定められていてもよい。そして、その後Ｗｅｂ０１が自動復旧しても変換値（４５点）はそのまま変更せず、再び検査結果が「死（停止）」になると、そこから所定の値（５点）を減点した変換値（４０点）を算出するようにしてもよい。このような変換ルールによれば、Ｗｅｂ０１が「停止－自動復旧」を所定回数繰り返した時点で、「４０点（目安値）」が算出されることとなる。

　また、Ｗｅｂ０１が停止すると、検査項目「冗長構成保障」の検査結果は「４重化（現用系）」となる。ここで、当該システムは、４重化（現用系）の冗長構成が保たれていれば問題なく、３重化（現用系）まで悪化すると、アラートを発生させる必要があるものとする。

　このような場合の変換ルールは、冗長構成が５重化（現用系）の場合の変換値は満点（ここでは「５０点」とする）であり、４重化（現用系）の場合は「４０点（目安値）」、３重化（現用系）の場合は「３０点」、２重化（現用系）の場合は「２０点」、稼動しているウェブサーバが１つの場合は「１０点」、すべてのウェブサーバが停止した場合は「０点」が算出されるようなものであってもよい。

　図１に戻り、変換部３０は、検査結果取得部１０が取得した検査結果を、変換ルールを利用して変換値に変換する。なお、検査結果取得部１０が共通検査項目の検査結果を取得した場合であって、変換ルール保持部２０が当該共通検査項目の検査結果を変換する変換ルールを複数保持している場合、変換部３０は、検査結果がどの監視対象に対して実施されたものかを識別した後、上記変換ルール－監視対象対応情報（図６参照）を利用して、識別した監視対象に対応付けられている変換ルールを特定し、その後、特定した変換ルールを利用して検査結果を変換値に変換する。

　グループ毎評価部４０は、複数の検査項目を複数のグループに分類する。そして、グループ毎評価部４０は、監視対象毎に、各グループに分類される検査項目の変換値を利用して、各グループの評価値を算出する。

　まず、グループ毎評価部４０が複数の検査項目を複数のグループに分類する構成について説明する。

　例えば、グループ毎評価部４０は、複数の検査項目を、当該検査項目の検査結果が所定の条件を満たさない場合（例：障害が発生している場合）、監視対象を利用するユーザに直ちに影響を及ぼすグループ（即時影響Ｇ）と、直ちには影響しないが将来的に影響を及ぼす可能性があるグループ（将来影響Ｇ）とに分類してもよい。所定の条件は設計的事項である。

　例えば、サービス応答時間が所定のレベルを下回ったり（サービス応答時間）、サービスが停止したり（サービス死活）、サービスにアクセスするためのネットワークの品質が低下したり（ネットワーク性能）すると、当該サービスを利用するユーザに直ちに影響を及ぼすと考えられる。このため、検査項目「サービス応答時間」、「サービス死活」、「ネットワーク性能」などは、即時影響Ｇに分類されてもよい。

　また、冗長構成となっている複数のＩＴ機器の中の１つが停止したり（各機器死活）、冗長構成の多重度が低下しても一定のレベルを維持していたり（冗長構成保障）、インフラストラクチャの性能指標値の一部の挙動が通常とは異なっていたり（相関破壊度）、リソースの利用量が許容量をひっ迫していても（リソース容量）、当該サービスを利用するユーザに直ちには影響しないと考えられる。しかし、当該状態が継続されると、状況がさらに悪化し、将来的にユーザに影響を及ぼす可能性がある。このため、検査項目「冗長構成の機器各々の死活」、「冗長構成保障」、「相関破壊度」、「リソース容量」などは、将来影響Ｇに分類されてもよい。

　グループ毎評価部４０は、予め、複数のグループ各々に分類される検査項目を識別する情報（図７参照）を保持しておき、当該情報を利用して、複数の検査項目を各グループに分類してもよい。なお、上記グループ分類の例はあくまで一例であり、その他の属性のグループに分類することもできる。また、分類するグループの数は設計的事項であり、その他の数のグループに分類することもできる。以下では、グループ毎評価部４０は、複数の検査項目を、即時影響Ｇと将来影響Ｇとに分類するものとする。

　次に、グループ毎評価部４０が、監視対象毎に、各グループに分類される検査項目の変換値を利用して、各グループの評価値を算出する構成について説明する。

　グループ毎評価部４０は、監視対象毎に、各グループに分類される検査項目の変換値の中の最低値を特定し、当該最低値を、当該グループの評価値として算出する。すなわち、グループ毎評価部４０は、各グループに分類される検査項目の中の検査結果が最も悪い項目の変換値を、当該グループの評価値（以下、「グループ評価値」）とする。

　例えば、グループ毎評価部４０は、図８に示すようなデータを保持しておく。図８に示すデータにおいて、「変換値」の欄には、各監視対象の各検査項目の最新の検査結果に基づいて算出された変換値が記録されている。また、「グループ」の欄には、各検査項目に対応付けて、各検査項目が分類されるグループの名称が記録されている。そして、「最低値」の欄にマークが付されている変換値は、各監視対象の各グループの中の最低値であることを意味している。図８に示す例の場合、監視対象ＩＤ「０００００１」の将来影響Ｇに分類される複数の検査項目の内、冗長構成保障の変換値が最低値であることを示している。かかる場合、グループ毎評価部４０は、監視対象ＩＤ「０００００１」の将来影響Ｇの評価値を、「４１点」と決定する。

　グループ毎評価部４０は、検査結果取得部１０が検査結果を取得し、変換部３０がその検査結果を変換値に変換すると、その変換値を取得し、図８に示すデータを更新することができる。そして、更新後の内容に従い、グループ評価値を算出し直す。このような処理は、リアルタイムに行うことができる。

　なお、グループ毎評価部４０は、各監視対象の各検査項目の最新の検査結果に基づいて算出された変換値のみならず、過去の変換値も記憶しておくこともできる。

　総合評価部６０は、監視対象毎に、各監視対象のグループ評価値を利用して、総合評価値を算出する。具体的には、総合評価部６０は、各監視対象のグループ評価値の中の最低値を、その監視対象の総合評価値として算出する。すなわち、総合評価部６０は、各監視対象のグループ評価値の中の最も評価が悪いグループの評価値を、当該監視対象の総合評価値とする。

　例えば、総合評価部６０は、グループ毎評価部４０から各監視対象の各グループのグループ評価値を受取り、図９に示すようなデータを作成して保持しておく。そして、総合評価部６０は、当該データを利用して、各監視対象の総合評価値を算出することができる。なお、総合評価部６０は、グループ毎評価部４０からある監視対象のあるグループの新たな評価値を取得すると、図９に示すデータの所定箇所の内容を更新する。そして、総合評価部６０は更新後のデータを利用して、総合評価値を算出し直す。

　出力部５０は、監視対象毎に、グループ各々の評価値を出力する。すなわち、出力部５０は、グループ毎評価部４０から各監視対象の各グループのグループ評価値を取得すると、各監視対象に対応付けて、取得したグループ評価値を出力する。なお、出力部５０は、複数の監視対象のグループ評価値を同時に出力することができる。

　また、出力部５０は、グループ各々の評価値に加えて、又は、代えて、監視対象毎に総合評価値を出力することができる。すなわち、出力部５０は、総合評価部６０から各監視対象の総合評価値を取得すると、各監視対象に対応付けて、その総合評価値を出力することができる。なお、出力部５０は、複数の監視対象の総合評価値を同時に出力することができる。

　出力部５０による出力手段は特段制限されず、ディスプレイ、印刷装置、メーラ、ＦＡＸ等のあらゆる出力装置を利用して実現することができる。

　ここで、図２に、出力部５０による出力内容の一例を示す。図２に示す例では、監視対象の欄に監視対象の名称が記載されている。そして、各監視対象に対応付けて、総合評価の欄に各監視対象の総合評価値が記載され、即時影響Ｇ及び将来影響Ｇ各々の欄に各監視対象の各グループのグループ評価値が記載されている。出力部５０は、図２に示す情報をディスプレイに出力中に、総合評価値及びグループ評価値の中のいずれかが更新されると、当該更新に従い、ディスプレイにおける表示内容をリアルタイムに変更することができる。なお、図２に示す複数の監視対象は、総合評価の結果が良い順に配列されているが、当該配列順を、即時影響Ｇの結果が良い順や、将来影響Ｇの結果が良い順に配列し直すことができてもよい。また、出力部５０は、グラフ、図形等、その他の手法を活用して、これらの情報を表示できてもよい。

　本実施形態の監視装置は、例えば、以下のプログラムをコンピュータにインストールすることで実現することができる。

　コンピュータを、
　複数の監視対象各々に対して実施される複数の検査項目の検査結果を取得する検査結果取得手段、
　前記監視対象各々の前記検査項目各々の状況を同じスケールで示す変換値を、前記検査結果を利用して算出するための変換ルールを保持する変換ルール保持手段、
　前記検査結果取得手段が取得した前記検査結果、及び、前記変換ルールを利用して前記変換値を算出する変換手段、
　前記監視対象毎に、前記複数の検査項目を複数のグループに分類し、前記グループ毎に各々のグループに分類される前記検査項目の前記変換値を利用して、評価値を算出するグループ毎評価手段、
　前記監視対象各々に関連付けて前記評価値を出力する出力手段、
として機能させるとともに、
　前記複数の検査項目の中には、複数の前記監視対象に対して実施される共通検査項目が少なくとも１つ存在し、
　前記変換ルール保持手段に、前記共通検査項目の中の少なくとも１つの前記変換ルールを複数保持させることができるプログラム。

　次に、本実施形態の監視方法について説明する。図３は、本実施形態の監視方法の処理の流れの一例を示すフローチャートである。

　まず、本実施形態の監視装置１を起動すると、出力部５０は、図２に示すような、複数の監視対象各々の総合評価値、即時影響Ｇ及び将来影響Ｇのグループ評価値を表示するインタフェースをディスプレイに出力する。なお、当該時点において、総合評価値及びグループ評価値の中の一部または全部の値が算出されていない場合、その欄はブランクにしたり、または、「未評価」等の情報を表示しておいてもよい。

　その後、検査結果取得部１０は、複数の監視対象各々に対して実施される複数の検査項目の検査結果を取得する（Ｓ１０）。なお、検査結果取得部１０は、検査が実行されると、その検査結果をリアルタイムに取得することができる。

　ここでは、検査結果取得部１０は、第１の監視対象（監視対象ＩＤ「０００００１」）の応答時間の検査結果を取得したとする。なお、検索項目「サービス応答時間」は複数の監視対象に対して実行される共通検査項目であり、変換ルール保持部２０は、当該共通検査項目の検査結果を変換する変換ルールを複数保持するとともに（図５参照）、上記変換ルール－監視対象対応情報（図６参照）を保持しているものとする。

　Ｓ１０の後、変換部３０は、Ｓ１０で取得された検査結果、及び、変換ルール保持部２０が保持する変換ルールを利用して、変換値を算出する（Ｓ２０）。

　変換部３０は、まず、上記サービス応答時間の検査結果がどの監視対象に対して実施されたものかを特定する。ここでは、変換部３０は、第１の監視対象（監視対象ＩＤ「０００００１」）に対して実施されたことを特定する。その後、変換部３０は、変換ルール保持部２０が保持する変換ルール－監視対象対応情報（図６参照）を利用して、第１の監視対象（監視対象ＩＤ「０００００１」）に対応付けられている当該共通検査項目（サービス応答時間）の変換ルールを特定する。ここでは、変換部３０は、変換ルールＩＤ「００００Ａ」の変換ルールを特定する。その後、変換部３０は、変換ルールＩＤ「００００Ａ」の変換ルールを取り出し（図５参照）、当該変換ルール、及び、Ｓ１０で取得された上記サービス応答時間の検査結果を利用して、変換値を算出する。

　その後、グループ毎評価部４０は、監視対象毎に、複数の検査項目を複数のグループに分類し、グループ毎に各々のグループに分類される検査項目の変換値を利用して評価値を算出する（Ｓ３０）。

　まず、グループ毎評価部４０は、監視対象毎に、複数の検査項目各々の最新の検査結果（検査結果一覧）を記録したデータ（図８参照）を保持している。そして、Ｓ２０で新たな変換値が算出されると、グループ毎評価部４０はその変換値を取得し、図８に示すデータの中の所定の情報を、当該新たな変換値に更新する。ここでは、グループ毎評価部４０は、監視対象ＩＤ「０００００１」に対応付けられている検査項目「サービス応答時間」の変換値を、新たな変換値に更新する。そして、更新された監視対象のグループの評価値を算出し直す。ここでは、グループ毎評価部４０は、監視対象ＩＤ「０００００１」の即時影響Ｇの評価値を算出し直す。

　なお、その後、総合評価部６０が、図９に示すデータを必要に応じて更新し、総合評価値を算出し直してもよい。ここでは、Ｓ３０において、監視対象ＩＤ「０００００１」の即時影響Ｇの評価値が変更された場合、総合評価部６０は、図９に示すデータの該当箇所の値を更新する。そして、総合評価部６０は、更新後の内容に従い、監視対象ＩＤ「０００００１」の総合評価値を算出し直す。

　その後、出力部５０は、ディスプレイの表示（図２参照）を、更新された新たな値に変更する（Ｓ４０）。

　次に、本実施形態の作用効果について説明する。

　本実施形態の監視装置は、複数の監視対象の複数の検査項目各々の検査結果を監視オペレータに提供するのでなく、これらを複数のグループに分類して各グループの評価値を算出し、当該評価値を監視オペレータに提供する。このため、監視オペレータに提供する情報の量を軽減することができる。

　また、各グループの評価は、各グループに分類される検査項目の検査結果に基づいて行われる。具体的には、全ての検査項目を同じスケールで示す変換値に変換した後、各グループに分類される検査項目の変換値の中の最低値を、当該グループの評価値として算出する。このような本実施形態によれば、ある検査項目の検査結果が所定のレベル（例：アラートレベル）に達しているという重要な情報を、監視オペレータが見落とすという不都合を抑制することができる。

　さらに、各監視対象の総合評価を算出し（総合評価部６０）、監視オペレータに提供することで、監視オペレータが確認すべき情報の量を、さらに軽減することができる。

　この出願は、２０１１年９月５日に出願された日本特許出願特願２０１１－１９２６４３号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims

　複数の監視対象各々に対して実施される複数の検査項目の検査結果を取得する検査結果取得手段と、
　前記監視対象各々の前記検査項目各々の状況を同じスケールで示す変換値を、前記検査結果を利用して算出するための変換ルールを保持する変換ルール保持手段と、
　前記検査結果取得手段が取得した前記検査結果、及び、前記変換ルールを利用して前記変換値を算出する変換手段と、
　前記監視対象毎に、前記複数の検査項目を複数のグループに分類し、前記グループ毎に、各々のグループに分類される前記検査項目の前記変換値を利用して、評価値を算出するグループ毎評価手段と、
　前記監視対象各々に関連付けて前記評価値を出力する出力手段と、を有し、
　前記複数の検査項目の中には、複数の前記監視対象に対して実施される共通検査項目が少なくとも１つ存在し、
　前記変換ルール保持手段は、前記共通検査項目の中の少なくとも１つの前記変換ルールを複数保持する監視装置。
　請求項１に記載の監視装置において、
　前記グループ毎評価手段は、各グループに分類される前記検査項目の前記変換値の中の最低値を、前記評価値として算出する監視装置。
　請求項１または２に記載の監視装置において、
　前記監視対象毎に、前記グループ各々の前記評価値を利用して、総合評価値を算出する総合評価手段をさらに有し、
　前記出力手段は、前記グループ各々の前記評価値に加えて又は代えて、前記監視対象毎に前記総合評価値を出力する監視装置。
　請求項３に記載の監視装置において、
　前記総合評価手段は、各監視対象の前記評価値の中の最低値を、前記総合評価値として算出する監視装置。
　請求項１から４のいずれか１項に記載の監視装置において、
　前記グループ毎評価手段は、前記複数の検査項目を、当該検査項目の前記検査結果が所定の条件を満たさない場合、前記監視対象を利用するユーザに直ちに影響を及ぼすグループと、直ちには影響しないが将来的に影響を及ぼす可能性があるグループとに分類する監視装置。
　コンピュータを、
　複数の監視対象各々に対して実施される複数の検査項目の検査結果を取得する検査結果取得手段、
　前記監視対象各々の前記検査項目各々の状況を同じスケールで示す変換値を、前記検査結果を利用して算出するための変換ルールを保持する変換ルール保持手段、
　前記検査結果取得手段が取得した前記検査結果、及び、前記変換ルールを利用して前記変換値を算出する変換手段、
　前記監視対象毎に、前記複数の検査項目を複数のグループに分類し、前記グループ毎に、各々のグループに分類される前記検査項目の前記変換値を利用して、評価値を算出するグループ毎評価手段、
　前記監視対象各々に関連付けて前記評価値を出力する出力手段、
として機能させるとともに、
　前記複数の検査項目の中には、複数の前記監視対象に対して実施される共通検査項目が少なくとも１つ存在し、
　前記変換ルール保持手段に、前記共通検査項目の中の少なくとも１つの前記変換ルールを複数保持させることができるプログラム。
　複数の監視対象各々に対して実施される複数の検査項目の検査結果を取得する検査結果取得ステップと、
　前記監視対象各々の前記検査項目各々の状況を同じスケールで示す変換値を、前記検査結果を利用して算出するための変換ルール、及び、前記検査結果取得ステップで取得した前記検査結果を利用して前記変換値を算出する変換ステップと、
　前記監視対象毎に、前記複数の検査項目を複数のグループに分類し、前記グループ毎に、各々のグループに分類される前記検査項目の前記変換値を利用して、評価値を算出するグループ毎評価ステップと、
　前記監視対象各々に関連付けて前記評価値を出力する出力ステップと、
をコンピュータが実行し、
　前記複数の検査項目の中には、複数の前記監視対象に対して実施される共通検査項目が少なくとも１つ存在し、前記共通検査項目の中の少なくとも１つの前記変換ルールは複数存在する監視方法。