[第1の実施の形態]
図1は,本実施の形態の情報処理システムSYSを説明するシステム構成図の一例である。なお,以下の説明において,同様の構成には同一の符号を付し,同様の構成の説明を適宜省略する。
情報処理システムSYSは,ネットワークNに接続された,第1の監視装置W1〜第mの監視装置Wm(小文字mは3以上の整数)と,第1の監視対象装置M1〜第nの監視対象装置Mn(小文字nは3以上の整数)と,第1の監視装置W1〜第mの監視装置Wmを操作するクライアント端末C1とを有する。なお,監視装置の数,監視対象装置の数は例示である。
第1の監視対象装置M1〜第nの監視対象装置Mnは,情報処理を実行するコンピュータ(例えば,サーバ)である。サーバは,例えば,仮想マシンを構築する物理サーバや,データベース機能を有するデータベースサーバや,WEBサーバや,アプリケーションサーバである。ここで,サーバは,物理サーバだけでなく,仮想サーバであってもよい。
なお,監視装置が監視対象とするのは,物理的な装置(ハードウェア)だけでなく,ハードウェア上で動作するソフトウェアであってもよい。
第1の監視装置W1〜第mの監視装置Wmは,第1の監視対象装置M1〜第nの監視対象装置Mnの状態を示す状態情報や,第1の監視対象装置M1〜第nの監視対象装置Mnで発生した事象(イベントとも呼ぶ)を示す事象情報を取得し,これらを管理する。そして,第1の監視装置W1〜第mの監視装置Wmは,クライアント端末C1からの送信要求に応答して,送信要求を満たす状態情報や事象情報を,クライアント端末C1に送信する。
図1に示したように,複数の監視装置を設けるのは,情報処理システムSYSにおいて監視対象装置が多数(例えば,1万台)のため,1台の監視装置では,多数の監視対象装置を監視できないからである。そのため,複数の監視装置が,グループ化された監視対象装置をそれぞれ分散的に監視(分散監視とも呼ぶ)する。例えば,前記例では,10000の監視対象装置に対して,10の監視装置がそれぞれ1000(10000/10)の監視対象装置を分散監視する。
(監視装置のブロック図)
図2は,図1の第1の監視装置W1のハードウェア構成を説明するブロック図の一例である。なお,他の監視装置(例えば,第2の監視装置W2,第mの監視装置Wm)も,第1の監視装置W1と同様の構成を有する。
第1の監視装置W1は,バスBに接続された,CPU(処理部)11と,ストレージ装置(記憶部)12と,RAM13と,外部記憶媒体読み取り装置14と,ネットワークインターフェイス装置15とを有する。なお,CPUは"Central Processing Unit"の略語,RAMは"Random Access Memory"の略語である。以下,CPU(処理部)11をCPU11,ストレージ装置(記憶部)12をストレージ12,ネットワークインターフェイス装置15を,ネットワークインターフェイス15と適宜記す。
CPU11は,第1の監視装置W1の全体を制御する中央演算処理装置である。ストレージ12は,例えばハードディスクドライブ(HDD:Hard Disk Drive)や,ソリッドステートドライブ(SSD:Solid State Drive)などの大容量記憶装置である。
ストレージ12は,構成情報T1,状態情報T2,事象情報T3,事象保持装置情報T4を記憶する。なお,事象保持装置情報は,保持装置情報とも呼ばれる。なお,ストレージ12が記憶する各情報の内容については後記する。さらに,ストレージ12は,監視プログラムPGの実行ファイルを記憶する。
RAM13は,CPU11が実行する処理や,監視プログラムPGが実行する各ステップにおいて生成(算出)されたデータなどを一時的に記憶する。RAM13は,例えばDRAM(Dynamic Random Access Memory)などの半導体メモリである。
CPU11は,第1の監視装置W1の起動時に,ストレージ12から監視プログラムPGの実行ファイルを読み出し,RAM13に展開し,監視処理,および,監視処理に関連する各種処理を実行する。なお,この実行ファイルを外部記憶媒体MDに記憶してもよい。
外部記憶媒体読み取り装置14は,外部記憶媒体MDに記憶されたデータを読み取る装置である。外部記憶媒体MDは,例えば,CD-ROM(Compact Disc Read Only Memory),DVD(Digital Versatile Disc)などの可搬型記憶媒体や,USBメモリなどの可搬型の不揮発性メモリである。
ネットワークインターフェイス15は,例えばNIC(Network Interface Card)を有し,ネットワークNに対するインターフェイス機能を提供する。
図1,図2で説明したように,情報処理システムSYSは,監視対象となる複数の装置(M1〜Mn)と,複数の装置の中から割り当てられた装置をそれぞれが監視する複数の監視装置(W1〜Wm)とを有する。
図3は,図2の第1の監視装置W1,第2の監視装置W2のソフトウェア構成を説明するブロック図の一例である。なお,第1の監視装置W1,第2の監視装置W2以外の他の監視装置(例えば,第mの監視装置Wm)も,第1の監視装置W1,第2の監視装置W2と同様のソフトウェア構成を有する。
第1の監視装置W1,第2の監視装置W2の監視プログラムPGは,情報制御部101と,構成情報管理部102と,状態情報管理部103と,事象保持装置情報管理部104と,事象情報管理部105と,同期制御部106と,端末インターフェイス部107とを有する。
情報制御部は情報制御モジュール,構成情報管理部は構成情報管理モジュール,状態情報管理部は状態情報管理モジュールとも呼ばれる。そして,事象保持装置情報管理部は事象保持装置情報管理モジュール,事象情報管理部は事象情報管理モジュール,同期制御部は同期制御モジュール,端末インターフェイス部は端末インターフェイスモジュールとも呼ばれる。
情報制御部101は,監視装置の制御処理を行うと共に,構成情報管理部102と,状態情報管理部103と,事象保持装置情報管理部104と,事象情報管理部105と,同期制御部106と,端末インターフェイス部107とを制御する。さらに,情報制御部101は,自装置以外の他の監視装置の情報制御部101,同期制御部106との通信を実行する。
情報制御部101は,構成情報管理部102に構成情報の登録(記憶とも呼ぶ)や削除を指示する。情報制御部101は,状態情報管理部103に状態情報の登録や削除を指示する。
情報制御部101は,事象保持装置情報管理部104に事象保持装置情報の登録や削除を指示する。情報制御部101は,事象情報管理部105に事象情報の登録や削除を指示する。情報制御部101は,同期制御部106に各種情報の同期を指示する。
構成情報管理部102は,構成情報を管理する。状態情報管理部103は,状態情報を管理する。事象保持装置情報管理部104は,事象保持装置情報を管理する。事象情報管理部105は,事象情報を管理する。同期制御部106は,自装置が記憶する構成情報,状態情報,事象情報と,他の監視装置が記憶する構成情報,状態情報,事象情報とを同期する。他にも,同期制御部106は,事象情報管理部105を介して,同期対象の事象情報を参照する処理や,検索する処理を実行する。
端末インターフェイス部107は,クライアント端末C1との通信処理に関する各種処理を実行する。以上の各部(101〜107)の動作は,図7以下で詳細に説明する。
図3の下側に示した監視対象装置(M1〜M6)は,それぞれ監視エージェント(E1〜E6)を有し,監視エージェントは自装置を監視している監視装置に監視情報(例えば,事象情報)を通知する。図3の例では,監視対象装置(M1〜M3)の監視エージェント(E1〜E3)は,監視情報を第1の監視装置W1に通知する。監視対象装置(M3〜M6)の監視エージェント(E3〜E6)は,監視情報を第2の監視装置W2に通知する。第1の監視装置W1,第2の監視装置W2は,監視情報(例えば,事象情報)を互いに送信する。
第1の監視装置W1〜第mの監視装置Wm(図1参照)は,監視対象装置に関する情報を3つの情報に分類して管理する。この3つの情報は,図2のストレージ12が記憶する構成情報,状態情報,事象情報である。
(構成情報)
構成情報は,監視対象装置の構成を示す情報であり,監視対象装置の属性と,監視対象装置間の依存関係を示す情報と,構成情報の同期待ち状況とを情報を有する。図4は,構成情報をテーブル形式で示した図の一例である。
監視対象装置の属性は,監視対象装置の識別子,監視対象装置のホスト名,監視対象装置に設定されているIPアドレス,監視対象装置で動作するOS(Operating System)の種別を示す。
監視対象装置間の依存関係を示す情報(以下,監視対象装置間の依存関係と適宜記す)は,第1の監視対象装置と,第2の監視対象装置とにおいて,第1の監視対象装置が第2の監視対象装置に依存することを示す。この依存は,例えば,第1の監視対象装置が動作するために,第2の監視対象装置の動作が必要なことを示す。
この依存について具体的に説明する。第1の監視対象装置M1が,仮想マシンで,第2の監視対象装置M2が,この仮想マシンを起動する物理サーバの場合,第1の監視対象装置M1(仮想マシン)が動作するために,第2の監視対象装置M2(物理マシン)の動作が必要である。そのため,第1の監視対象装置M1(仮想マシン)と,第2の監視対象装置M2(物理マシン)との間に,依存関係が存在する。
また,第1の監視対象装置M1が,アプリケーションの場合を想定する。なお,図1で説明したように,監視対象は,アプリケーションでもよく,前記想定において,説明の便宜のため,監視対象のアプリケーションを装置と記載している。そして,第2の監視対象装置M2が,このアプリケーションを起動するサーバの場合を想定する。
アプリケーション(第1の監視対象装置M1)が動作するために,第2の監視対象装置M2(サーバ)の動作が必要である。そのため,第1の監視対象装置M1(アプリケーション)と,第2の監視対象装置M2(サーバ)との間には,依存関係が存在する。
なお,ユーザアプリケーション間(銀行の口座管理アプリと,他の銀号の送金アプリとの間)でも,前記した依存関係が存在することがある。
構成情報の同期待ち状況を示す情報は,監視装置(同期元の監視装置)が,他の監視装置(同期先の監視装置)との間で,構成情報を同期する場合における,この同期の進捗状況を示す情報である。
図4の構成情報T1は,監視対象装置の属性欄と,監視対象装置間の依存関係欄と,構成情報の同期待ち状況欄とを有する。
監視装置の構成情報管理部102は,構成情報T1に示すように,1行に,1つの監視対象装置についての構成情報を記憶(登録)する。具体的には,構成情報管理部102は,監視対象装置の属性と,監視対象装置間の依存関係と,構成情報の同期待ち状況とを対応付けて記憶する。1つの監視対象装置についての構成情報(1行分の構成情報)が,1つの構成情報レコードである。
監視対象装置の属性欄は,識別子欄と,ホスト名欄と,IPアドレス欄と, OS種別欄とを有する。識別子欄は,監視対象装置の識別子を記憶する。ホスト名欄は,監視対象装置のホスト名を記憶する。IPアドレス欄は,監視対象装置に設定されているIPアドレスを記憶する。OS種別欄は,監視対象装置で動作するOSの種別を記憶する。
監視対象装置間の依存関係欄は,依存元欄と,依存先欄とを有する。前記した,第1の監視対象装置と,第2の監視対象装置とにおいて,第1の監視対象装置が動作するために,第2の監視対象装置の動作が必要である場合を想定する。この想定において,第1の監視対象装置が依存元の監視対象装置であり,第2の監視対象装置が依存先の監視対象装置である。依存元欄は,第1の監視対象装置のホスト名を記憶し,依存先欄は,第2の監視対象装置のホスト名を記憶する。
構成情報の同期待ち状況欄は,監視装置が,他の監視装置との間で,構成情報を同期する場合における,この同期の進捗状況を記憶する。同期待ちの場合,"待ち"が記憶され,同期待ち以外の場合,"-"(ハイホン)が記憶される。
図4の例では,監視装置の構成情報管理部102は,識別子X0002で識別される監視対象装置のホスト名"host-c"と,この監視対象装置のIPアドレス"192.168.1.102"と,この監視対象装置のOSの種別"OS2"とを構成情報T1の一行に記憶する。そして,この監視装置は,この監視対象装置の依存元"host-b"と,この監視装置の依存先"host-d"と,構成情報の同期待ち状況"-"(同期待ち以外)とを,前記した構成情報T1の一行に記憶する。
(状態情報)
状態情報は,監視対象装置の状態を示す情報である。状態情報は,監視対象装置の識別子(例えば,ホスト名や,内部識別番号など)と,監視対象装置の状態(例えば,稼働中,停止中,異常など)と,状態情報の同期待ち状況とを有する。図5は,状態情報をテーブル形式で示した図の一例である。
監視装置の状態情報管理部103は,例えばICMP(Internet Control Message Protocol)による応答,いわゆるping応答が監視対象装置からない場合,監視対象装置の状態が停止中と判断し,その旨を記憶する。他にも,監視装置の状態情報管理部103は,監視対象装置が出力する事象情報に含まれる異常メッセージに基づき,この監視対象装置に異常が発生したと判断し,その旨を記憶する。
状態情報の同期待ち状況を示す情報は,他の監視装置(同期先の)との間で,状態情報を同期する場合における,この同期の進捗状況を示す情報である。
図5の状態情報T2は,監視対象装置の識別子欄と,状態欄と,状態情報の同期待ち状況欄とを有する。
監視装置の状態情報管理部103は,状態情報T2に示すように,1行に,1つの監視対象装置についての状態情報を記憶(登録)する。具体的には,状態情報管理部103は,1つの監視対象装置の識別子と,1つの監視対象装置の状態と,状態情報の同期待ち状況とを対応付けて記憶する。1つの監視対象装置についての状態情報(1行分の状態情報)が,1つの状態情報レコードである。
監視対象装置の識別子欄は,監視対象装置の識別子を記憶する。状態欄は,監視対象装置の状態を記憶する。状態情報の同期待ち状況欄は,監視装置が,他の監視装置との間で,状態情報を同期する場合における,この同期の進捗状況を記憶する。同期待ちの場合,"待ち"が記憶され,同期待ち以外の場合,"-"(ハイホン)が記憶される。
図5の例では,監視装置の状態情報管理部103は,識別子X0002で識別される監視対象装置の状態"異常"と,状態情報の同期待ち状況"-"(同期待ち以外)とを,前記した状態情報T2の一行に記憶する。
(事象情報)
事象情報は,監視対象装置において発生した事象を示す情報である。監視対象装置上で動作している監視エージェント(図2参照)は,予め定められた監視装置に,この事象情報を送信する。
事象情報は,事象の識別子(内部識別番号など)と,この事象が発生した監視対象装置の識別子(ホスト名,内部識別番号など)と,事象発生日時と,事象の種別と,事象の内容とを有する。図6は,事象情報をテーブル形式で示した図の一例である。
事象情報において事象の識別子以外,すなわち,監視対象装置の識別子,事象発生日時,事象の種別(事象種別と適宜記す),事象の内容は,例えば,監視対象装置の監視エージェントが監視装置に通知したメッセージである。事象の内容は,例えば監視対象装置で動作するOSやアプリケーションが出力したログである。事象の種別は,事象の内容を特徴付ける情報であり,例えばエラー(換言すれば,異常)や,警告や,エラーおよび警告以外の情報がある。
図6の事象情報T31は,事象の識別子欄と,監視対象装置の識別子欄と,事象発生日時欄と,事象種別欄と,事象の内容欄とを有する。
監視装置の事象情報管理部105は,事象情報T31に示すように,1行に,1つの事象情報を記憶(登録)する。具体的には,事象情報管理部105は,事象の識別子と,監視対象装置の識別子と,事象発生日時と,事象種別と,事象の内容と対応付けて記憶する。1つの事象についての事象情報(1行分の事象情報)が,1つの事象情報レコードである。
事象の識別子欄は,事象の識別子を記憶する。監視対象装置の識別子は,この事象が発生した監視対象装置の識別子を記憶する。事象発生日時欄は,この事象が発生した年月日時分秒を記憶する。事象種別欄は,この事象の種別を記憶する。事象の内容欄は,この事象の内容を記憶する。
図6の例では,監視装置の事象情報管理部105は,識別子"0000"で識別される事象が,識別子"X0000"で識別される監視対象装置で,"2013/03/01 01:23:22"に発生し,この事象の種別が"エラー"であることを,前記した事象情報T31の一行に記憶する。さらに,監視装置の事象情報管理部105は,この事象の内容が"ABC処理においてログファイルへの書き込みに失敗しました"という内容を前記した事象情報T31の一行に記憶する。
利用者は,監視装置が記憶する事象情報を参照することにより,監視対象装置で発生した事象,及び,この事象の内容を知り,監視対象装置の状態を把握できる。利用者は,例えば,情報処理システムSYSの管理者である。
(事象保持装置情報)
監視装置は,事象保持装置情報を有する。事象保持装置情報は,事象情報が記憶(保持とも呼ぶ)されている監視装置を示す情報である。監視装置は,事象保持装置情報に基づき,事象情報を記憶している監視装置を特定する。
事象保持装置情報は,監視対象の装置を識別する識別子(ホスト名,内部識別番号など)と,この装置を監視する監視装置を識別する識別子(ホスト名,内部識別番号など)とを有する。なお,この装置を監視する監視装置は,この装置の事象情報を記憶している監視装置である。
図7は,事象保持装置情報をテーブル形式で示した図の一例である。事象保持装置情報T4は,監視対象装置の識別子欄と,監視装置の識別子欄とを有する。監視装置の識別子欄は,監視対象装置の識別子を記憶する。監視装置の識別子欄は,この監視対象装置の事象情報を記憶する監視装置の識別子を記憶する。
監視装置の事象保持装置情報管理部104は,事象保持装置情報T4に示すように,1行に,1つの事象保持装置情報を記憶(登録)する。具体的には,事象保持装置情報管理部104は,監視対象装置の識別子と,この監視対象装置の事象情報を記憶する監視装置の識別子とを対応付けて記憶する。換言すれば,事象保持装置情報管理部104は,監視装置の識別子と,この監視装置により監視される監視対象装置の識別子とを対応付けて記憶する。1つの監視対象装置についての事象保持装置情報(1行分の事象保持装置情報)が,1つの事象保持装置情報レコードである。
図7の例では,監視装置の事象保持装置情報管理部104は,監視対象装置の識別子"X0000"と,この監視対象装置の事象情報を記憶する監視装置の識別子"W1"とを,前記した事象保持装置情報T4の一行に記憶する。なお,監視装置の識別子は,図1の監視装置の符号(例えば,"W1","W2"など)と同一である。
情報処理システムSYSは,図1で説明したように,多数の監視対象装置を監視するため,複数の監視装置を利用する。ここで,第1の監視装置W1〜第mの監視装置Wmは,全ての監視対象装置の状態情報を記憶する。この記憶により,利用者は,どの監視装置を利用しても,全ての監視対象装置の状態を判断することができる。
一方,事象情報については,情報量が多いので,複数の監視装置は,監視対象装置の事象情報を分散して記憶する。例えば,情報処理システムSYSにおいて,10000の監視対象装置に対して,10台の監視装置が設けられている場合,1台の監視装置は,1000の監視対象装置の事象情報を記憶する。
第1の監視装置W1〜第mの監視装置Wmは,この監視対象装置の事象情報がどの監視装置に記憶されているかを示す情報を,事象保持装置情報として記憶する。
(状態情報と事象情報との参照,情報の同期)
図8は,利用者による監視対象装置の状態情報と事象情報とを参照する処理,および,情報の同期を模式的に説明する図である。第1の監視装置W1は,第1の監視対象装置M1,第2の監視対象装置M2を監視し,第2の監視装置W2は,第3の監視対象装置M3,第4の監視対象装置M4を監視する。換言すれば,第1の監視対象装置M1,第2の監視対象装置M2は,第1の監視装置W1に事象情報を通知し,第3の監視対象装置M3,第4の監視対象装置M4は,第2の監視装置W2に事象情報を通知する。
第1の監視装置W1は,構成情報T1,状態情報T2,事象保持装置情報T4,事象情報T31を有する。構成情報T1は,第1の監視対象装置M1〜第4の監視対象装置M4の構成情報を含む。状態情報T2は,第1の監視対象装置M1〜第4の監視対象装置M4の状態情報を含む。
事象保持装置情報T4は,第1,第2の監視対象装置M1,M2の事象情報を記憶する監視装置が第1の監視装置W1であり,第3,第4の監視対象装置M3,M4の事象情報を記憶する監視装置が第2の監視装置W2であることを示す情報である。事象情報T31は,第1の監視対象装置M1,第2の監視対象装置M2の事象情報を含む情報(事象情報(M1,M2)参照)である。
第2の監視装置W2は,構成情報T1,状態情報T2,事象保持装置情報T4,事象情報T32とを有する。事象情報T32は,第3の監視対象装置M3,第4の監視対象装置M4の事象情報を含む情報(事象情報(M3,M4)参照)である。
(状態情報の参照)
状態情報は,図5で説明したように,情報量が少ない。そのため,情報処理システムSYSにおける全監視装置(第1の監視装置W1〜第mの監視装置Wm)が,それぞれ,全監視対象装置(第1の監視対象装置M1〜第nの監視対象装置Mn)の状態情報を記憶しても,監視装置内の記憶容量を圧迫する恐れが少ない。
そこで,監視装置が,他の監視装置にアクセスして,この他の監視装置の監視下にある装置の状態情報を取得する処理を削減するため,全監視装置(第1の監視装置W1〜第mの監視装置Wm)が,それぞれ,全監視対象装置(第1の監視対象装置M1〜第nの監視対象装置Mn)の状態情報を記憶している。
以下,状態情報の参照について説明する。例えば第1の監視対象装置M1の状態を把握したい利用者は,クライアント端末C1を操作して,例えば第2の監視装置W2にアクセスする(図8の点線参照)。そして,利用者は,クライアント端末C1を操作して,第2の監視装置W2の端末インターフェイス部107を介して情報制御部101に,第1の監視対象装置M1の識別子(例えば,"X0000")を含む第1の監視対象装置M1の状態情報取得コマンドを送信する。なお,コマンドは,信号とも呼ばれる。
情報制御部101は,このコマンドを受信し,自装置が記憶する状態情報T2の中から,第1の監視対象装置M1の識別子を含む状態情報を特定する。
第2の監視装置W2の情報制御部101は,受信した第1の監視対象装置M1の状態情報を,端末インターフェイス部107を介してクライアント端末C1に送信する。クライアント端末C1は,受信した第1の監視対象装置M1の状態情報を表示装置(図示しない)を介して利用者に表示する。
以上説明したように,利用者は,第1の監視対象装置M1が第1の監視装置W1の監視下にあることを意識することなく,第1の監視対象装置M1以外の監視装置(例えば,第2の監視装置W2)にアクセスすれば,第1の監視対象装置M1の状態情報を取得することができる。
(事象情報の参照)
ここで,第1の監視対象装置M1に異常が発生したことを利用者が把握すると,利用者は,クライアント端末C1を操作して,例えば第2の監視装置W2にアクセスする(図8の点線参照)。そして,利用者は,クライアント端末C1を操作して,第2の監視装置W2の端末インターフェイス部107を介して情報制御部101に,第1の監視対象装置M1の識別子(例えば,"X0000")を含む第1の監視対象装置M1の事象情報取得コマンドを送信する。情報制御部101は,このコマンドを受信し,事象保持装置情報T4に基づき,第1の監視対象装置M1の事象情報を記憶する監視装置,すなわち,第1の監視対象装置M1の識別子に対応する監視装置の識別子(例えば,W1)を特定する。
第2の監視装置W2の情報制御部101は,この識別子が,自監視装置の識別子でない場合,第1の監視装置W1の情報制御部101に,第1の監視対象装置M1の識別子(例えば,"X0000")を含む第1の監視対象装置M1の事象情報取得コマンドを送信する。第1の監視装置W1の情報制御部101は,このコマンドを受信し,事象保持装置情報T4に基づき,第1の監視対象装置M1の識別子に対応する監視装置の識別子(例えば,W1)を特定する。
情報制御部101は,この識別子が,自監視装置の識別子の場合,自装置が記憶する事象情報T31の中から,第1の監視対象装置M1の識別子"X0000"を含む,第1の監視対象装置M1の事象情報を特定する。第1の監視装置W1の情報制御部101は,特定した事象情報を第2の監視装置W2の情報制御部101に送信する。
第2の監視装置W2の情報制御部101は,受信した第1の監視対象装置M1の事象情報を,端末インターフェイス部107を介してクライアント端末C1に送信する。クライアント端末C1は,受信した第1の監視対象装置M1の事象情報を表示装置(図示しない)を介して利用者に表示する。
以上説明したように,利用者は,第1の監視対象装置M1が第1の監視装置W1の監視下にあることを意識することなく,第1の監視対象装置M1以外の監視装置(例えば,第2の監視装置W2)にアクセスすれば,第1の監視対象装置M1の事象情報を取得することができる。そして,利用者は,取得した事象情報を参照し,第1の監視対象装置M1の異常について詳細に調査することができる。
(情報の同期)
上記状態情報の参照で説明したように,全監視装置(第1の監視装置W1〜第mの監視装置Wm)が,それぞれ,全監視対象装置(第1の監視対象装置M1〜第nの監視対象装置Mn)の状態情報について同一の内容を保持するために,以下の同期処理が実行される。
すなわち,ある監視装置(例えば,第2の監視装置W2)が記憶する状態情報が,利用者による手動または自動的に更新された場合,ある監視装置は,この更新内容を他の監視装置が記憶する状態情報に反映する。換言すれば,ある監視装置は,この更新内容に,他の監視装置が記憶する状態情報を同期する。
状態情報が自動的に更新される場合について説明する。監視装置の状態情報管理部103は,監視対象装置から通知された事象情報に基づき,監視対象装置の情報を更新(状態遷移とも呼ぶ)する。
例えば,監視装置の状態情報管理部103は,事象種別"エラー"を含む1つの事象情報レコードが監視対象装置から通知された場合,自装置が記憶する状態情報における,この監視対象装置の状態レコードに含まれる状態を"異常"に変更する。この監視装置は,この状態情報の更新内容を他の監視装置に送信し,他の監視装置との間で,更新内容について状態情報の同期をとる。
例えば,図8の第1の監視対象装置M1に異常が発生する(図8の第1の監視対象装置M1の下側"異常発生"参照)。第1の監視対象装置M1は,事象種別"エラー"を含む事象情報レコードを第1の監視装置W1に通知する。第1の監視装置W1の情報制御部101は,事象情報レコードを受信し,状態情報管理部103,事象情報管理部105に送信する。事象情報管理部105は,この事象情報レコードに事象情報レコードの識別子を追加して,追加後の事象情報レコードを自装置が記憶する事象情報T31に含める。状態情報管理部103は,状態情報T2における,この事象情報レコードに含まれる監視対象装置の識別子(例えば"X0000")に対応する状態を"異常"に変更する。
第1の監視装置W1の情報制御部101は,情報処理システムSYS内の他の監視装置に対して,第1の監視対象装置M1の識別子(例えば,"X0000")の状態レコード(状態"異常")を含む第1の監視対象装置M1の状態同期コマンドを送信する。
情報処理システムSYS内の他の監視装置の一例として,図8の第2の監視装置W2を例示する。第2の監視装置W2の情報制御部101は,この状態同期コマンドを受信すると,状態情報管理部103に,この状態同期コマンドを送信する。状態情報管理部103は,この状態同期コマンドを受信し,自装置が記憶する状態情報T2における,第1の監視対象装置M1の識別子に対応する同期待ち状況を"-"から"待ち"に変更する。さらに,状態情報管理部103は,自装置が記憶する状態情報T2における,第1の監視対象装置M1の識別子に対応する状態を"正常"から"異常"に変更する(状態情報の同期)。この状態の変更後,状態情報管理部103は,自装置が記憶する状態情報T2における,第1の監視対象装置M1の識別子に対応する状態情報の同期待ち状況を"待ち"から"-"に変更する。
次に,状態情報が手動で更新される場合について説明する。図8の第1の監視対象装置M1に異常が発生した後,利用者がこの異常に対して修理などにより,トラブル復旧が完了した場合を想定する。利用者は,クライアント端末C1を操作して,第2の監視装置W2の端末インターフェイス部107を介して情報制御部101に,トラブル復旧が完了した第1の監視対象装置M1の識別子(例えば,"X0000")と状態"正常"とを含む第1の監視対象装置M1の状態変更コマンドを送信する。
第2の監視装置W2の情報制御部101は,状態情報管理部103に,この状態変更コマンドを送信する。状態情報管理部103は,この状態変更コマンドを受信し,状態情報管理部103は,状態情報T2における,第1の監視対象装置M1の識別子に対応する同期待ち状況を"-"から"待ち"に変更する。さらに,状態情報管理部103は,自装置が記憶する状態情報T2における,第1の監視対象装置M1の識別子に対応する状態を"異常"から"正常"に変更する。この状態の変更後,状態情報管理部103は,自装置が記憶する状態情報T2における,第1の監視対象装置M1の識別子に対応する状態情報の同期待ち状況を"待ち"から"-"に変更する。
第2の監視装置W2の情報制御部101は,情報処理システムSYS内の他の監視装置に対して,状態を変更した第1の監視対象装置M1を識別する識別子(例えば,"X0000")の状態レコード(状態"正常")を含む第1の監視対象装置M1の状態同期コマンドを送信する。
情報処理システムSYS内の他の監視装置の一例として,図8の第1の監視装置W1を例示する。第1の監視装置W1の情報制御部101は,この状態同期コマンドを受信すると,状態情報管理部103に,この状態同期コマンドを送信する。状態情報管理部103は,この状態同期コマンドを受信し,自装置が記憶する状態情報T2における,第1の監視対象装置M1の識別子に対応する同期待ち状況を"-"から"待ち"に変更する。さらに,状態情報管理部103は,自装置が記憶する状態情報T2における,第1の監視対象装置M1の識別子に対応する状態を"異常"から"正常"に変更する(状態情報の同期)。この状態の変更後,状態情報管理部103は,自装置が記憶する状態情報T2における第1の監視対象装置M1の識別子に対応する状態情報の同期待ち状況を"待ち"から"-"に変更する。
以上説明したように,状態情報の同期により,1つの監視装置の状態情報が更新された場合,この状態情報の更新が,他の監視装置にリアルタイムに反映される。その結果,全監視装置で,同内容の状態情報を保持することができる。
(同期と,監視装置の冗長性の確保)
図8において,1台の監視装置(例えば,第1の監視装置W1)が,監視対象装置(例えば,第1の監視対象装置M1)の事象情報を記憶し,他の監視装置(例えば,第2の監視装置W2)が,この監視対象装置の事象情報を記憶していない場合を想定する。すると,第1の監視装置W1が,故障や定期点検のため停止した場合,利用者は,この監視対象装置の事象情報にアクセスすることができない。そこで,監視対象装置の事象情報を複数の監視装置で記憶することで,監視装置(例えば,事象情報)の冗長性を確保する。
特に,大規模な情報処理システムSYSにおける多数の監視対象装置は,24時間365日運用を行うような重要業務を処理するアプリケーションを動作させていることがある。そのため,かかる装置の監視を継続して行うため,監視装置の冗長性を確保することが必須となる。
図9は,監視装置の冗長性を確保する処理を模式的に説明する図である。第1の監視装置W1は,第1の監視対象装置M1,第2の監視対象装置M2を監視し,第2の監視装置W2は,第1の監視対象装置M1,第3の監視対象装置M3を監視し,第3の監視装置W3は,第2の監視対象装置M2,第3の監視対象装置M3を監視する。第1の監視対象装置M1,第2の監視対象装置M2は第1の監視装置W1に事象情報を通知する。そして,第1の監視対象装置M1,第3の監視対象装置M3は第2の監視装置W2に事象情報を通知し,第2の監視対象装置M2,第3の監視対象装置M3は第3の監視装置W3に事象情報を通知する。
第1の監視装置W1は,構成情報T1と,状態情報T2と,事象保持装置情報T4と,事象情報T31とを有する。第2の監視装置W2は,構成情報T1と,状態情報T2と,事象保持装置情報T4と,事象情報T32とを有する。第3の監視装置W3は,構成情報T1と,状態情報T2と,事象保持装置情報T4と,事象情報T33とを有する。
構成情報T1は,第1の監視対象装置M1〜第3の監視対象装置M3の構成情報である。図4の例では,第1の監視装置W1,第2の監視装置W2,第3の監視装置W3のストレージ12は, 第1の監視対象装置M1〜第3の監視対象装置M3の構成情報をテーブル形式で記憶する。
状態情報T2は,第1の監視対象装置M1〜第3の監視対象装置M3の状態情報である。図5の例では,第1の監視装置W1,第2の監視装置W2,第3の監視装置W3のストレージ12は, 第1の監視対象装置M1〜第3の監視対象装置M3の状態情報をテーブル形式で記憶する。
状態情報T2は,例えば,第1の監視対象装置M1〜第3の監視対象装置M3の識別子と状態と状態情報の同期待ち状況とが,ぞれぞれ対応付けられた状態情報レコードを含む。
事象保持装置情報T4は,第1の監視対象装置M1〜第3の監視対象装置M3の事象保持装置情報である。図7の例では,第1の監視装置W1,第2の監視装置W2,第3の監視装置W3のストレージ12は,第1の監視対象装置M1〜第3の監視対象装置M3の事象保持装置情報をテーブル形式で記憶する。
第1の監視対象装置M1の事象保持装置情報レコードは,例えば,第1の監視対象装置M1の識別子と,第1の監視対象装置M1の事象情報を記憶する第1の監視装置W1,第2の監視装置W2の識別子とが対応付けられたレコードである。第2の監視対象装置M2の事象保持装置情報レコードは,例えば,第2の監視対象装置M2の識別子と,第2の監視対象装置M2の事象情報を記憶する第1の監視装置W1,第3の監視装置W3の識別子とが対応付けられたレコードである。第3の監視対象装置M3の事象保持装置情報レコードは,例えば,第3の監視対象装置M3の識別子と,第3の監視対象装置M3の事象情報を記憶する第2の監視装置W2,第3の監視装置W3の識別子とが対応付けられたレコードである。
事象保持装置情報T4は,前記した第1の監視対象装置M1,第2の監視対象装置M2,第3の監視対象装置M3の事象保持装置情報レコードを含む。
事象情報T31は,第1の監視対象装置M1,第2の監視対象装置M2の事象情報を含む情報(事象情報(M1,M2)参照)である。事象情報T32は,第1の監視対象装置M1,第3の監視対象装置M3の事象情報を含む情報(事象情報(M1,M3)参照)である。事象情報T33は,第2の監視対象装置M2,第3の監視対象装置M3の事象情報を含む情報(事象情報(M2,M3)参照)である。
以上説明したように,1つの監視対象装置(例えば,第1の監視対象装置M1)の事象情報を複数の監視装置(例えば,第1の監視装置W1,第2の監視装置W2)が記憶することで監視装置の冗長性を確保する。
図9の構成によれば,第2の監視装置W2がトラブルにより停止した場合でも,他の監視装置は,自装置に記憶されている事象保持装置情報に基づき,第2の監視装置W2が記憶している事象情報と同じ事象情報を記憶している監視装置を検索し,この事象情報を参照できる。
状態情報に加えて,事象情報を同期する場合がある。例えば,第2の監視対象装置M2の監視の重要度が高い場合を想定する。第1の監視装置W1,第3の監視装置W3だけでなく,第2の監視装置W2も第2の監視対象装置M2の状態情報,事象情報を記憶する。この記憶によれば,第1の監視装置W1,第3の監視装置W3が停止しても,利用者は,第2の監視装置W2を利用して,第2の監視対象装置M2の状態情報,事象情報を取得することができる。すなわち,監視装置の冗長性がより高まる。
第2の監視装置W2が,第2の監視対象装置M2から事象情報の通知を受けて事象情報を記憶する前に,既に,第1の監視装置W1,第3の監視装置W3は第2の監視対象装置M2の事象情報(過去の事象情報)を記憶している。そこで,第2の監視装置W2は,第2の監視対象装置M2の事象情報を記憶する前に既に第1の監視装置W1,第3の監視装置W3が記憶していた第2の監視対象装置M2の事象情報を第1の監視装置W1または第3の監視装置W3から取得する。この事象情報の取得,および記憶が,例えば事象情報の同期である。
ここで,監視装置間で状態情報,事象情報を同期することを想定する。通常,監視装置が記憶する,状態情報の情報量は,事象情報の情報量に比べて少ない。そのため,2つの監視装置間(例えば,第1の監視対象装置M1と第2の監視対象装置M2)との間で,状態情報の同期が完了するまでの時間は,事象情報の同期が完了するまでの時間に比べて短い。さらに,利用者は,監視対象装置の状態を確認した後に,この監視対象装置の事象情報を確認する傾向がある。
そこで,監視装置間で状態情報,事象情報を同期する場合,状態情報を事象情報よりも優先的に同期する。
図10は,本実施の形態における監視情報の同期処理を説明するフロー図の一例である。
ステップS1:第1の監視装置W1〜第mの監視装置Wmのそれぞれの事象情報管理部105は,割り当てられた監視対象装置から監視情報を取得し,取得した監視情報をストレージ12に記憶する。この監視情報は,例えば事象情報を含む情報である。
ステップS2:第1の監視装置W1〜第mの監視装置Wmのそれぞれの情報制御部101は,監視情報の種別から,監視情報の送信時における優先度を判別する。
ステップS3:第1の監視装置W1〜第mの監視装置Wmのそれぞれの同期制御部106は,ストレージ12が記憶する監視情報における,優先度の高い監視情報を他の監視情報よりも優先して他の監視装置に送信する。換言すれば,第1の監視装置W1〜第mの監視装置Wmの同期制御部106は,ストレージ12に記憶された監視情報を他の監視装置に送信する際に,この監視情報の種別に基づき特定(判別,判定とも呼ぶ)される優先監視情報(例えば,優先度の高い監視情報)が他の監視情報よりも優先して送信されるように制御する。
ステップS4:他の監視装置の情報制御部101は,送信された監視情報を自装置のストレージ12に記憶する。そして,他の監視装置の同期制御部106は,監視情報を送信した監視装置が記憶する監視情報に,自装置が記憶する監視情報の一部または全部を同期する。
ここで,監視情報は,複数の監視対象装置それぞれの状態を示す状態情報(図5参照)と,監視対象装置において発生した事象を示す事象情報(図6参照)とを含む。同期制御部106は,状態情報が事象情報よりも優先して他の監視装置に送信されるように制御する。
さらに,事象情報は,装置で発生した事象の種別(例えば,エラー,警告,情報)を含む。第1の監視装置W1〜第mの監視装置Wmのそれぞれの同期制御部106は,事象の種別に基づき,第1の優先度で送信する第1の事象情報と,第1の優先度よりも低い第2の優先度で送信する第2の事象情報とを判別する。第1の監視装置W1〜第mの監視装置Wmのそれぞれの同期制御部106は,第1の事象情報が第2の事象情報よりも優先して他の監視装置に送信されるように制御する。
なお,状態情報,事象情報の送信,同期についての具体的な処理は,図11以下で詳細に説明する。
本実施の形態によれば,監視装置を統合して管理する統合監視装置が不要なので,システム構成が複雑になることがない。なお,統合監視装置が,管理下にある全監視装置が取得した全監視情報を記憶した場合,利用者は,統合監視装置を操作すれば,異常が発生した情報処理装置の監視情報を取得できる。しかし,全監視装置が取得した膨大な監視情報を記憶すると,統合監視装置に設けられた,限りある記憶リソースを圧迫する。従って,統合監視装置が,全監視装置が取得した全監視情報を記憶することは現実的ではない。
一方,監視対象の情報処理装置から取得した情報を,複数の監視装置で分散して記憶し,かつ,どの監視装置からでも情報処理装置の監視情報を参照できるようにする場合,それぞれの監視装置において,監視情報をリアルタイムで同期する必要がある。しかし,監視情報が多くなると,監視情報の同期処理の負荷が増大し,監視情報の同期遅延が発生し,この同期遅延の影響により,監視効率が低下する。
しかし,本実施の形態によれば,利用者にリアルタイムに見せる情報(例えば,状態情報)の送信を,トラブル調査のために一定の操作が利用者により行われた場合に利用者に見せる情報(例えば,事象情報)の送信よりも優先している。すなわち,状態情報を監視装置間でリアルタイムに同期している。そのため,利用者は,閲覧頻度が高い状態情報を最新の状態で閲覧することができる。その結果,監視情報の同期遅延の影響を低減し,さらに,監視効率の低下を抑制できる。
また,本実施の形態によれば,利用者は,装置にトラブルが発生しても,どの監視装置がどの装置を監視しているかを示す情報(監視構成情報)を知らなくても,トラブルが発生している装置の事象情報を閲覧できる。特に,複数の監視対象装置にトラブルが発生している場合に,利用者は,監視構成情報を知らなくても,この複数の監視対象装置の事象情報を閲覧し,トラブルの原因を調査できる。
[第2の実施の形態]
(監視対象装置の追加処理)
利用者が,監視対象装置を情報処理システムSYSに追加する場合を考える。追加する監視対象装置は,例えば仮想マシンや物理マシンである。監視対象装置を情報処理システムSYSに追加すると,情報処理システムSYSにおける既設(既存とも呼ぶ)の監視装置が,この監視対象装置を監視する。このとき,情報処理システムSYSにおける全監視装置は,追加された監視対象装置の構成情報,状態情報,事象保持装置情報を記憶する。さらに,監視対象装置を監視する監視装置は,この監視装置から通知される事象情報を記憶する。
ここで,監視対象装置が追加された場合,事象保持装置情報に基づき,全監視装置の中からこの監視対象装置を監視する監視装置が決定される。この監視対象装置は,決定された監視装置に事象情報を通知する。監視装置は,主に,3つの点に基づき決定される。
第1の点は,情報処理システムSYSにおける各監視装置の処理負荷を均等にするため,それぞれの監視装置で監視する監視対象装置の数を均等にする点である。例えば,情報処理システムSYSにおいて,第1の監視装置W1の監視対象装置がN1(N1は整数),第2の監視装置W2の監視対象装置がN2(N2はN1よりも小さい整数),第3の監視装置W3の監視対象装置の数がN3(N3はN2よりも小さい整数)の場合を想定する。そして,この情報処理システムSYSに1つの監視対象装置を追加することを想定する。この想定では,第3の監視装置W3の監視対象の数が最も少ないので,第3の監視装置W3が,この1つの監視対象装置を監視する。換言すれば,第3の監視装置W3が,この1つの監視対象装置の事象情報を記憶する監視装置の一つとなる。
第2の点は,監視装置の冗長性を確保する点である。換言すれば,少なくとも2つの監視装置が,新たに追加した監視対象装置の事象情報を記憶する。
第3の点は,新たに追加した監視対象装置が,既設の監視対象装置と依存関係にある場合,この既設の監視対象装置を監視する監視装置が,新たに追加した監視対象装置を監視する点である。すなわち,既設の監視対象装置を監視する監視装置が,この既設の監視対象装置の事象情報と,新たに追加した監視対象装置の事象情報とを記憶する。
なお,依存関係については,図4で詳細に説明した。この第3の点は,利用者によるトラブル調査における効率性を考慮して定めたものである。
例えば,新たに追加した第4の監視対象装置M4が仮想マシンで,第1の監視対象装置M1がこの仮想マシンを起動する物理サーバであるとする。第1の監視対象装置M1と第4の監視対象装置M4との間には依存関係があり,依存先の監視対象装置が第1の監視対象装置M1(物理サーバ)で,依存元の監視対象装置が第4の監視対象装置M4(仮想マシン)である。
第4の監視対象装置M4に異常が発生して停止した場合,この異常の原因が,依存先である第1の監視対象装置M1(物理サーバ)にある可能性がある。このとき,同一の監視装置が,依存元の監視対象装置および依存先の監視対象装置を監視していれば,利用者は,この同一の監視装置にアクセスして,依存元の監視対象装置および依存先の監視対象装置の事象情報を一括して取得できる。その結果,トラブル調査における効率性が向上する。
(監視対象装置の追加処理のフロー図,シーケンス図)
図11は,監視対象装置の追加処理を説明するフロー図の一例である。図12は,図11のフロー図における追加処理の一連のシーケンスを説明する図である。
ステップS11:情報処理システムSYSにおける何れかの監視装置(以下,監視装置RNDと適宜記す)の情報制御部101は,新たに追加された監視対象装置(以下,監視対象装置ADDと適宜記す)と情報処理システムSYSにおける既設の監視対象装置との間に依存関係があるか判定する。監視装置RNDは,例えば第2の監視装置W2であり,監視対象装置ADDは,例えば第4の監視対象装置M4である。
依存関係がある場合(S11/YES),ステップS12に移る。
ステップS12: 監視装置RNDの情報制御部101は,監視対象装置ADDと依存関係がある監視対象装置を監視する監視装置を決定する。以後,ステップS12において決定された監視装置が,監視対象装置ADDの事象情報を記憶する。
ステップS13:ステップS12において決定された監視装置(以下,監視装置DCDと記す)の情報制御部101は,構成情報管理部102に構成情報の追加を指示する。構成情報管理部102は,この追加指示に応答して,監視対象装置ADDの構成情報を自装置が記憶する構成情報に追加する。情報制御部101は,同期制御部106に構成情報の同期を指示する。同期制御部106は,この同期指示に応答して,追加後の構成情報に他の監視装置が記憶する構成情報を同期(換言すれば,反映)する。
ステップS14:監視装置DCDの情報制御部101は,状態情報管理部103に状態情報の追加を指示する。状態情報管理部103は,この追加指示に応答して,監視対象装置ADDの状態情報を自装置が記憶する状態情報に追加する。情報制御部101は,同期制御部106に状態情報の同期を指示する。同期制御部106は,この同期指示に応答して,追加後の状態情報に他の監視装置が記憶する状態情報を同期する。
ステップS15: 監視装置DCDの情報制御部101は,事象保持装置情報管理部104に事象保持装置情報の追加を指示する。事象保持装置情報管理部104は,この追加指示に応答して,監視対象装置ADDの識別子と,自装置の識別子とが対応付けられた情報を自装置が記憶する事象保持装置情報に追加して事象保持装置情報を更新する。情報制御部101は,同期制御部106に状態情報の同期を指示する。同期制御部106は,この同期指示に応答して,追加後の事象保持装置情報に他の監視装置が記憶する事象保持装置情報を同期する。
ステップS16: 監視装置DCDの情報制御部101は,事象情報管理部105に監視対象装置ADDの事象情報の取得を指示する。事象情報管理部105は,この取得指示に応答して,監視対象装置ADDの事象情報を取得する。このとき,監視装置DCDの情報制御部101は,監視対象装置ADDに自装置に事象情報を送信するように指示するコマンドを送信する。このコマンドは,監視装置DCDをネットワークで一意に識別する識別子(例えば,IPアドレス)を含む。監視対象装置ADDは,このコマンドに応答して,事象情報を監視装置DCDに送信する。
ステップS17:監視装置DCDの情報制御部101は,監視対象装置の均一化を実行する。なお,S17の詳細については,図16で説明する。
ステップS11において依存関係がないと判定されると(S11/NO),ステップS18に移る。
ステップS18:監視装置RNDの情報制御部101は,自装置が記憶する事象保持装置情報に基づき,監視対象装置が最も少ない監視装置を決定する。ステップS18で決定された決定された監視装置が監視装置DCDである。
(監視対象装置の追加処理の具体例)
図13は,図9において,情報処理システムSYSに第4の監視対象装置M4を追加する処理を模式的に説明する図である。利用者は,クライアント端末C1を操作して,情報処理システムSYSにおける何れかの監視装置(監視装置RND)にアクセスする。監視装置RNDは,例えば第2の監視装置W2である。監視対象装置ADDは,図13の第4の監視対象装置M4である。
まず,図11のS11について具体的に説明する。利用者は,クライアント端末C1を操作して,第2の監視装置W2の端末インターフェイス部107を介して情報制御部101に,監視対象装置ADDの属性を含む追加指示コマンドを送信する。ここで,第4の監視対象装置M4に依存関係がある場合,利用者は,この追加指示コマンドに依存先の監視対象装置を識別する識別記号(例えば,識別子や,ホスト名)を含ませる。
第2の監視装置W2の情報制御部101は,追加指示コマンドに依存先の監視対象装置を識別する識別記号が含まれる場合,自装置が記憶する構成情報T1における監視対象装置の依存関係(例えば,図4参照)に,依存先の監視対象装置の識別記号が含まれるか判定する(S11)。依存先の監視対象装置を識別する識別記号が"host-c"の場合,図4の構成情報T1における"依存先欄"に" host-c "が含まれるので,第2の監視装置W2の情報制御部101は,S11でYESと判定し,S12に移る。
次に,S12について具体的に説明する。第2の監視装置W2の情報制御部101は,依存先の監視対象装置の識別子を特定する。前記の例では,情報制御部101は,構成情報T1に基づき,依存先の監視対象装置のホスト名" host-c "に対応する監視対象装置の識別子"X0001"を特定する。
第2の監視装置W2の情報制御部101は,自装置が記憶する事象保持装置情報T4(例えば,図7参照)に基づき,特定した識別子"X0001"で識別される監視対象装置(第4の監視対象装置M4と依存関係がある監視対象装置)を監視する第1の監視装置W1を特定する。すなわち,第2の監視装置W2の情報制御部101は,事象保持装置情報T4において,識別子"X0001"と同じ行に記憶されている監視装置識別子"W1"(図7参照)により識別される監視装置を決定する。この決定された監視装置が監視装置DCDであり,図7の例では,第1の監視装置W1である。
監視装置RNDの情報制御部101は,監視装置DCDの情報制御部101に,監視対象装置ADDの属性を含む追加指示コマンドを送信する。なお,監視装置RNDと監視装置DCDとが同じ場合,この追加指示コマンドの送信処理は実行しない。この同じ場合,以下の説明では,監視装置RNDと監視装置DCDとは同じであるとみなしている。次いで,S13に移る。
次に,S13について具体的に説明する。監視装置DCDである第1の監視装置W1の情報制御部101は,追加指示コマンドを,構成情報管理部102に送信する。
第1の監視装置W1の構成情報管理部102は,追加指示コマンドを受信すると,追加指示コマンドに含まれる監視対象装置の属性を自装置が記憶する構成情報T1に追加する。なお,追加指示コマンドに依存先の監視対象装置のホスト名が含まれている場合,構成情報管理部102は,依存先のホスト名と依存元(監視対象装置ADD)のホスト名とを自装置が記憶する構成情報T1に追加する。
ここで,追加された第4の監視対象装置M4(監視対象装置ADD)の識別子を"X0004"とする。なお,この識別子は,追加指示コマンドに含まれている。
構成情報管理部102は,前記追加処理の開始時点に,構成情報T1の識別子"X0004"に対応する構成情報の同期待ち状況を"-"から"待ち"に変更する。そして,構成情報管理部102は,前記追加処理の終了時点に,"待ち"から"-"に変更する。
第1の監視装置W1の同期制御部106は,構成情報の同期待ち状況が"-"から"待ち"に変更した後,以下の処理を実行する。すなわち,同期制御部106は,変更後の構成情報T1に,自装置が記憶する事象保持装置情報(図7参照)に含まれる,自装置以外の監視装置の識別子により識別される監視装置(以下,他の監視装置と記す)が記憶する構成情報を同期する。換言すれば,第1の監視装置W1の同期制御部106は,他の監視装置が記憶する構成情報に,変更後の構成情報T1を反映する。
例えば,他の監視装置を第2の監視装置W2,第3の監視装置W3とする。第1の監視装置W1の同期制御部106は,変更後の構成情報T1を含む同期指示コマンドを第2の監視装置W2,第3の監視装置W3の情報制御部101に送信する。
第2の監視装置W2の情報制御部101は,同期指示コマンドを受信すると,変更後の構成情報T1を含む同期指示コマンドを構成情報管理部102に転送する。第2の監視装置W2の構成情報管理部102は,同期指示コマンドを受信すると,同期指示コマンドに含まれる変更後の構成情報T1を自装置が記憶する構成情報T1に上書きする。この上書きにより,他の監視装置は,変更後の構成情報T1と同じ構成情報を記憶する。第3の監視装置W3も,第2の監視装置W2と同様に同期指示コマンドに含まれる変更後の構成情報T1を自装置が記憶する構成情報T1に上書きする。
なお,第1の監視装置W1の同期制御部106は追加した第4の監視対象装置M4の構成情報レコードを含む同期指示コマンドを第2の監視装置W2,第3の監視装置W3に送信してもよい。第2の監視装置W2,第3の監視装置W3の構成情報管理部102は,この追加した第4の監視対象装置M4の構成情報レコードを自装置が記憶する構成情報T1に追加する(構成情報の同期)。
次に,S14について具体的に説明する。監視装置DCDである第1の監視装置W1の情報制御部101は,追加指示コマンドを,状態情報管理部103に送信する。
第1の監視装置W1の状態情報管理部103は,追加指示コマンドを受信すると,追加指示コマンドに含まれる監視対象装置の属性の識別子"X0004"と,状態"初期状態"とを自装置が記憶する状態情報T2に追加する。
第1の監視装置W1の状態情報管理部103は,前記追加処理の開始時点に,状態情報T2の識別子"X0004"に対応する状態情報の同期待ち状況を"-"から"待ち"に変更する。そして,状態情報管理部103は,前記追加処理の終了時点に,"待ち"から"-"に変更する。
第1の監視装置W1の同期制御部106は,状態情報の同期待ち状況が"-"から"待ち"に変更した後,以下の処理を実行する。すなわち,同期制御部106は,変更後の状態情報T2に,他の監視装置が記憶する状態情報を同期する。換言すれば,第1の監視装置W1の同期制御部106は,他の監視装置が記憶する状態情報に,変更後の状態情報T2を反映する。
例えば,他の監視装置を第2の監視装置W2,第3の監視装置W3とする。第1の監視装置W1の同期制御部106は,変更後の状態情報T2を含む同期指示コマンドを第2の監視装置W2,第3の監視装置W3の情報制御部101に送信する。
第2の監視装置W2の情報制御部101は,同期指示コマンドを受信すると,変更後の状態情報T2を含む同期指示コマンドを状態情報管理部103に転送する。第2の監視装置W2の状態情報管理部103は,同期指示コマンドを受信すると,同期指示コマンドに含まれる変更後の状態情報T2を自装置が記憶する状態情報T2に上書きする。この上書きにより,他の監視装置は,変更後の状態情報T2と同じ状態情報を記憶する。第3の監視装置W3も,第2の監視装置W2と同様に同期指示コマンドに含まれる変更後の状態情報T2を自装置が記憶する状態情報T2に上書きする。
なお,第1の監視装置W1の同期制御部106は,追加した第4の監視対象装置M4の状態情報レコードを含む同期指示コマンドを第2の監視装置W2,第3の監視装置W3に送信してもよい。第2の監視装置W2,第3の監視装置W3の状態情報管理部103は,この追加した状態情報レコードを自装置が記憶する状態情報T2に追加する。
次に,S15について具体的に説明する。監視装置DCDである第1の監視装置W1の情報制御部101は,追加指示コマンドを,事象保持装置情報管理部104に送信する。
第1の監視装置W1の事象保持装置情報管理部104は,追加指示コマンドを受信すると,追加指示コマンドに含まれる監視対象装置の属性の識別子"X0004"と,自装置の識別子"W1"とが対応付けられた情報を自装置が記憶する事象保持装置情報T4に追加する。
次いで,第1の監視装置W1の同期制御部106は,変更後の事象保持装置情報T4に,他の監視装置が記憶する事象情報を同期する。換言すれば,第1の監視装置W1の同期制御部106は,他の監視装置が記憶する事象保持装置情報に,変更後の事象保持装置情報T4を反映する。
例えば,他の監視装置を第2の監視装置W2,第3の監視装置W3とする。第1の監視装置W1の同期制御部106は,変更後の事象保持装置情報T4を含む同期指示コマンドを第2の監視装置W2,第3の監視装置W3の情報制御部101に送信する。
第2の監視装置W2の情報制御部101は,同期指示コマンドを受信すると,変更後の事象保持装置情報T4を含む同期指示コマンドを事象保持装置情報管理部104に転送する。第2の監視装置W2の事象保持装置情報管理部104は,同期指示コマンドを受信すると,同期指示コマンドに含まれる変更後の事象保持装置情報T4を自装置が記憶する事象保持装置情報T4に上書きする。この上書きにより,他の監視装置は,変更後の構成情報T1と同じ事象保持装置情報を記憶する。第3の監視装置W3も,第2の監視装置W2と同様に同期指示コマンドに含まれる変更後の事象保持装置情報T4を自装置が記憶する事象保持装置情報T4に上書きする。
なお,第1の監視装置W1の同期制御部106は,追加した第4の監視対象装置M4の事象保持装置情報レコードを含む同期指示コマンドを第2の監視装置W2,第3の監視装置W3に送信してもよい。なお,追加した第4の監視対象装置M4の事象保持装置情報レコードは,第4の監視対象装置M4の識別子"X0004"と,第1の監視装置W1の識別子"W1"とが対応付けられた情報である。第2の監視装置W2,第3の監視装置W3の事象保持装置情報管理部104は,この追加した事象保持装置情報レコードを自装置が記憶する事象保持装置情報T4に追加する。
そして,第1の監視装置W1(監視装置DCD)の事象情報管理部105は,第4の監視対象装置M4(監視対象装置ADD)に自装置に事象情報を通知するように指示する。そして,事象情報管理部105は,この指示に応答して第4の監視対象装置M4が通知した事象情報を取得し,取得した事象情報を事象情報T31として記憶する(事象情報(M1,M2,M4参照))。
次に,S18について具体的に説明する。
利用者の操作対象となった第2の監視装置W2の情報制御部101は,追加指示コマンドに依存先の監視対象装置を識別する識別記号が含まれない場合(S11/NO),S18に移る。または,第2の監視装置W2の情報制御部101は,自装置が記憶する構成情報T1における監視対象装置の依存関係に,依存先の監視対象装置の識別記号が含まれない場合(S11/NO),S18に移る。
第2の監視装置W2の情報制御部101は,自装置が記憶する事象保持装置情報T4に基づき,監視対象装置が最も少ない監視装置を決定する。なお,監視対象装置が最も少ない監視装置が複数ある場合,第2の監視装置W2の情報制御部101は,この複数の監視装置の何れか1を任意に決定する。第2の監視装置W2の情報制御部101が決定した監視装置が,監視装置DCDである。
例えば,事象保持装置情報T4は,以下の3種類の情報を含む場合を想定する。1つ目の種類の情報は,第1の監視装置W1の識別子と,第1の監視対象装置M1,第2の監視対象装置M2の識別子とが対応付けた情報である。2つ目の種類の情報は,第2の監視装置W2の識別子と,第1の監視対象装置M1,第3の監視対象装置M3の識別子とが対応付けた情報である。3つ目の種類の情報は,第3の監視装置W3の識別子と,第2の監視対象装置M2,第3の監視対象装置M3の識別子とが対応付けた情報である。
この想定では,監視対象装置が最も少ない監視装置(第1の監視装置W1,第2の監視装置W2,第3の監視装置W3)が3つあるので,第2の監視装置W2の情報制御部101は,例えば,第2の監視装置W2を決定する(S18)。なお,S18の終了後,前記したS13に移る。
図13で説明したように,監視対象装置の追加により,監視対象装置のシステム構成が変更されても,監視対象装置は,情報処理システムにおける何れかの監視装置に自動的に監視される。その結果,利用者による操作が不要になり,利用者の負担が少なくなるだけでなく,監視精度が向上する。
(監視対象装置の削除処理)
監視対象装置を情報処理システムSYSから削除する場合を想定する。例えば,監視対象装置が仮想マシンの場合,この仮想マシンの起動が終了すると,情報処理システムSYSは,この仮想マシンを監視対象から削除する。また,監視対象装置が物理マシンの場合,この物理マシンの耐用年数が経過したことにより,この物理マシンを廃棄する場合,情報処理システムSYSは,この物理マシンを監視対象装置から削除する。
(監視対象装置の削除処理のフロー図,シーケンス図)
図14は,監視対象装置の削除処理を説明するフロー図の一例である。図15は,図14のフロー図における削除処理の一連のシーケンスを説明する図である。図14の説明では,以下の処理が事前に行われているとする。すなわち,利用者は,クライアント端末C1を操作して,情報処理システムSYSにおける何れかの監視装置(監視装置RND)にアクセスする。
利用者は,クライアント端末C1を操作して,監視装置RNDの端末インターフェイス部107を介して情報制御部101に,削除した監視対象装置を一意に識別する識別記号を含む削除指示コマンドを送信する。監視装置RNDの情報制御部101は,自装置が記憶する事象保持装置情報T4に基づき,削除した監視対象装置の事象情報を記憶している監視装置を1つ特定する。
なお,冗長性を確保するため,2以上の監視装置が,同一の監視対象装置の事象情報を記憶している。そのため,監視装置RNDの情報制御部101は,同一の監視対象装置の事象情報を記憶している2以上の監視装置の中から何れか1つの監視装置を特定する。
監視装置RNDの情報制御部101は,特定した監視装置(以下,特定監視装置と記す)に,削除した監視対象装置の識別子を含む削除指示コマンドを送信する。
ステップS21:特定監視装置の情報制御部101は,削除指示コマンドを受信し,削除した監視対象装置の事象情報レコードの削除指示を事象情報管理部105に行う。事象情報管理部105は,自装置が記憶する事象情報の中から,削除指示コマンドに含まれる監視対象装置の識別子を有する事象情報レコードを削除する。
ステップS22:特定監視装置の情報制御部101は,自装置が記憶する事象保持装置情報T4に基づき,削除した監視対象装置の事象情報を記憶している他の監視装置を決定する。
ステップS23:特定監視装置の情報制御部101は,削除した監視対象装置の状態情報の削除指示を状態情報管理部103に行う。状態情報管理部103は,この指示に応答して,自装置が記憶する状態情報の中から,削除した監視対象装置の識別子を有する状態情報レコードを削除する。
情報制御部101は,同期制御部106に状態情報の同期を指示する。同期制御部106は,この同期指示に応答して,削除後の状態情報に他の監視装置が記憶する状態情報を同期(換言すれば,反映)する。この他の監視装置は,事象保持装置情報T4に含まれる,特定監視装置の識別子以外の監視装置識別子で識別される監視装置である。
具体的には,情報制御部101は,他の監視装置に,削除した監視対象装置の識別子を含む状態情報の削除指示コマンドを送信する。ここで,他の監視装置が複数ある場合,情報制御部101は,この複数の他の監視装置に状態情報の削除指示コマンドを送信する。
他の監視装置の情報制御部101は,状態情報の削除指示コマンドを受信すると,構成情報管理部102に転送する。構成情報管理部102は,自装置が記憶する状態情報の中から,削除した監視対象装置の識別子を有する状態情報レコードを削除する。
ステップS24:特定監視装置の情報制御部101は,削除した監視対象装置の構成情報の削除指示を構成情報管理部102に行う。構成情報管理部102は,この指示に応答して,自装置が記憶する構成情報の中から,削除した監視対象装置の識別子を有する構成情報レコードを削除する。
情報制御部101は,同期制御部106に構成情報の同期を指示する。同期制御部106は,この同期指示に応答して,削除後の構成情報に他の監視装置が記憶する構成情報を同期(換言すれば,反映)する。
具体的には,情報制御部101は,他の監視装置に,削除した監視対象装置の識別子を含む構成情報の削除指示コマンドを送信する。ここで,他の監視装置が複数ある場合,情報制御部101は,この複数の他の監視装置に構成情報の削除指示コマンドを送信する。
他の監視装置の情報制御部101は,構成情報の削除指示コマンドを受信すると,構成情報管理部102に転送する。構成情報管理部102は,自装置が記憶する構成情報の中から,削除した監視対象装置の識別子を有する構成情報レコードを削除する。
ステップS25:特定監視装置の情報制御部101は,削除した監視対象装置の事象保持装置情報の削除指示を事象保持装置情報管理部104に行う。事象保持装置情報管理部104は,この指示に応答して,自装置が記憶する事象保持装置情報の中から,削除した監視対象装置の識別子を有する事象保持装置情報レコードを削除する。
情報制御部101は,同期制御部106に事象保持装置情報の同期を指示する。同期制御部106は,この同期指示に応答して,削除後の事象保持装置情報に他の監視装置が記憶する事象保持装置情報を同期(換言すれば,反映)する。
具体的には,情報制御部101は,他の監視装置に,削除した監視対象装置の識別子を含む事象保持装置情報の削除指示コマンドを送信する。ここで,他の監視装置が複数ある場合,情報制御部101は,この複数の他の監視装置に事象保持装置情報の削除指示コマンドを送信する。
他の監視装置の情報制御部101は,事象保持装置情報の削除指示コマンドを受信すると,事象保持装置情報管理部104に転送する。事象保持装置情報管理部104は,自装置が記憶する事象保持装置情報の中から,削除した監視対象装置の識別子を有する事象保持装置情報レコードを削除する。
ステップS26:特定監視装置の情報制御部101は,同期制御部106に削除指示を行う。この削除指示は,ステップS22において決定された,削除した監視対象装置の事象情報を記憶している他の監視装置に,事象情報の削除指示コマンドを送信する指示である。
同期制御部106は,この指示に応答して,削除した監視対象装置の識別記号を含む削除指示コマンドを他の監視装置に送信する。他の監視装置の情報制御部101は,削除指示コマンドを事象情報管理部105に転送する。他の監視装置の事象情報管理部105は,自装置が記憶する事象情報の中から,前記識別記号を含む事象情報を削除する。なお,同期制御部106は,前記他の監視装置が複数の場合,この複数の他の監視装置に削除指示コマンドを送信する。
ステップS27は,ステップS17と同じ処理なので,その説明を省略する。
図14,図15で説明した処理によれば,各監視装置間で,監視対象装置の削除に対応した,最新の構成情報,状態情報,事象保持装置情報が共有して記憶される。さらに,削除した監視対象装置の事象情報も削除できる。この情報の削除により,監視装置の記憶容量を増やすことができる。
(監視装置の均一化)
監視対象装置を追加した場合,監視装置の冗長性を確保するため,複数の監視装置が,監視対象装置の事象情報を記憶する必要がある。例えば,追加した監視対象装置の事象情報を2つの監視装置で保持(二重に保持)する場合,この2つの監視装置が,追加した監視対象装置の事象情報を記憶する。
また,依存関係がある監視対象装置同士を同じ監視装置が監視している(図11のS1参照)。このステップS1の処理により,監視装置間で,監視対象の装置の数に隔たりがある(均一でない)状態が発生する。さらに,監視対象装置の削除により,監視対象の装置の数に隔たりがある状態が発生する。
通常,監視装置間において,各監視対象装置の数が均一であれば,特定の監視装置における監視負荷の増大を抑制できる。そこで,監視装置は,冗長性を確保し,監視対象装置の数を均一化する(以下,監視装置の均一化と適宜記す)。
図16は,監視対象の均一化(図11のステップS7,図14のステップS27参照)の処理を説明するフロー図の一例である。以下の説明で示す監視装置DCDは,監視対象装置の追加処理(図11参照)を実行した場合における監視対象の均一化処理の場合,図11のステップS12,S18で決定された,追加された監視対象装置ADDの事象情報を記憶する監視装置を示している。
また,以下の説明で示す監視装置DCDは,監視対象装置の削除処理(図14参照)を実行した場合における監視対象の均一化処理の場合,削除した監視対象装置の事象情報を記憶している監視装置(図14で説明した特定監視装置)を示している。
ステップS71:監視装置DCDの情報制御部101は,自装置が記憶する事象保持装置情報に基づき,冗長性が不足する監視対象装置があるか判定する。例えば,情報処理システムSYSにおいて,冗長性を確保するため,事象情報をN重に記憶する場合を想定する。すなわち,N個の監視装置が,1つの監視対象装置を分散して監視している場合を想定する。この想定において,監視装置DCDの情報制御部101は,(N-1)個以下の監視装置が,前記した1つの監視対象装置を監視している場合,冗長性が不足する監視対象装置があると判定する。
なお,事象保持装置情報は,図7で説明したように,監視装置の識別子と,この監視装置が監視する監視対象装置の識別子とが対応付けられた情報である。そのため,監視装置DCDの情報制御部101は,自装置が記憶する事象保持装置情報を参照すれば,監視装置が,監視する監視対象の個数を決定できる。
冗長性が不足する監視対象装置がある場合(S71/YES),S72に移る。冗長性が不足する監視対象装置がない場合(S71/NO),S75に移る。
ステップS72:監視装置DCDの情報制御部101は,自装置が記憶する事象保持装置情報に基づき,冗長性が不足する監視対象装置の事象情報を既に記憶している監視装置以外の監視装置の中から,冗長性が不足する監視対象装置の事象情報を記憶する監視装置を決定する。
ステップS73:監視装置DCDの情報制御部101は,同期制御部106に事象情報の同期を指示する。同期制御部106は,この同期指示に応答して,自装置に記憶された事象情報に,ステップS72で決定された監視装置が記憶する事象情報の一部を同期する。ここでは,監視装置DCDの同期制御部106は,自装置が記憶する監視対象装置ADDの事象情報に,ステップS72で決定された監視装置が記憶する事象情報の一部を同期している。なお,ステップS73の同期については,図17で説明する。
ステップS74:監視装置DCDの同期制御部106は,監視対象装置ADDの識別子と,ステップS72で決定された監視装置の識別子とが対応付けられた情報を自装置が記憶する事象保持装置情報に追加する。そして,監視装置DCDの同期制御部106は,追加後の事象保持装置情報に他の監視装置が記憶する事象保持装置情報を同期する。なお,ステップS74の同期は,図11におけるステップS15で説明した同期と同じであるので,その説明を省略する。
ステップS75:監視装置DCDの情報制御部101は,監視装置間における監視対象の装置の数に隔たりがあるか判定する。隔たりがない場合(S75/NO),処理を終了する。隔たりがある場合(S75/YES),ステップS76に移る。この判定方法の一例を説明する。
監視装置DCDの情報制御部101は,自装置が記憶する事象保持装置情報に基づき,各監視装置が監視している監視対象装置の数を決定する。そして,監視装置DCDの情報制御部101は,監視対象の装置数が最も多い監視装置と,監視対象の装置数が最も少ない監視装置とを決定する。監視対象の装置数が最も多い監視装置が,同期元の監視装置SRCである。監視対象の装置数が最も少ない監視装置が,同期先の監視装置DSTである。
監視装置DCDの情報制御部101は,監視装置SRCが監視する監視対象装置の数と,監視装置DSTが監視する監視対象装置の数との差が,所定の数以上の場合に,監視装置間における監視対象の装置の数に隔たりがあると判定する。
ここで,監視装置間における監視対象の装置の数に隔たりがある場合,監視装置SRCが監視する装置を,監視装置DSTの監視対象とする(装置の移動とも呼ぶ)。
ステップS76:監視装置DCDの情報制御部101は,移動対象の監視対象装置を決定する。移動対象の監視対象装置は,監視元の監視装置が変更(監視装置SRCから監視装置DSTに変更)される監視対象装置である。
具体的には,監視装置DCDの情報制御部101は,自装置が記憶する事象保持装置情報に基づき,監視装置SRCが監視する監視対象装置の中から,監視装置DSTが監視する監視対象装置以外の監視対象装置を1つ決定する。この決定された1つの監視対象装置を,移動対象の監視対象装置と適宜記す。
ここで,第1の監視装置W1は,第1の監視対象装置M1を監視し,第2の監視装置W2は,第1,第2,第3,第4の監視対象装置M1,M2,M3,M4を監視し,監視装置W3は,第2,第3,第4の監視対象装置M2,M3,M4を監視している場合を想定する。この想定では,監視装置SRCは例えば第2の監視装置W2であり,監視装置DSTは例えば第1の監視装置W1)である。この想定では,監視装置DCDの情報制御部101は,監視装置SRCが監視する監視対象装置(M1〜M4)の中から,監視装置DSTが管理する以外の監視対象装置として,例えば,第2の監視対象装置M2を決定する。
ステップS77:監視装置DCDの情報制御部101は,監視装置DSTに,移動対象の監視対象装置を監視するように指示する指示コマンドを送信する。この指示コマンドは,移動対象の監視対象装置の識別子を含む。監視装置DSTの情報制御部101は,この指示コマンドを受信すると,事象情報管理部105に送信する。
監視装置DSTの情報制御部101は,移動対象の監視対象装置に,自装置に事象情報を送信するように指示するコマンドを送信する。このコマンドは,この監視対象装置をネットワークで一意に識別する識別子(例えば,IPアドレス)を含む。この監視対象装置は,このコマンドに応答して,事象情報を監視装置DSTに送信する。監視装置DSTの事象情報管理部105は,移動対象の監視対象装置の事象情報を取得する。
ステップS78:監視装置DCDの情報制御部101は,監視装置SRCに事象情報の同期を指示する。監視装置SRCの同期制御部106は,この同期指示に応答して,自装置に記憶された移動対象の監視対象装置の事象情報に,監視装置DSTの事象情報の一部を同期する。なお,ステップS78の同期については,図17で説明する。
ステップS79:監視装置DCDの情報制御部101は,監視装置SRCに,移動対象の監視対象装置の監視を停止するように指示する指示コマンドを送信する。この指示コマンドは,移動対象の監視対象装置の識別子を含む。監視装置SRCの情報制御部101は,この指示コマンドを受信すると,事象情報管理部105に送信する。監視装置SRCの事象情報管理部105は,移動対象の監視対象装置の事象情報の取得を停止する。
さらに,事象情報管理部105は,この指示コマンドに応答して,自装置が記憶する事象情報の中から,移動対象の監視対象装置の識別子を有する事象情報レコードを削除する。
さらに,監視装置SRCの情報制御部101は,移動対象の監視対象装置に,自装置に事象情報を送信しないように指示するコマンドを送信する。このコマンドは,この移動対象の監視対象装置をネットワークで一意に識別する識別子(例えば,IPアドレス)を含む。この移動対象の監視対象装置は,このコマンドに応答して,事象情報を監視装置SRCに送信しない。
ステップS80:監視装置DCDの情報制御部101は,移動対象の監視対象装置を監視する監視装置を変更したことにより,自装置が記憶する事象保持装置情報T4を更新し,この更新後の事象保持装置情報T4に,他の監視装置が記憶する事象保持装置情報T4を同期する。
具体的には,監視装置DCDの情報制御部101は,事象保持装置情報管理部104に事象保持装置情報T4の更新を指示する。事象保持装置情報管理部104は,この更新指示に応答して,自装置が記憶する事象保持装置情報T4の中から,監視装置SRCの識別記号と移動対象の監視対象装置の識別子とが対応付けられた情報を削除する。さらに,事象保持装置情報管理部104は,この更新指示に応答して,監視装置DSTの識別記号と,移動対象の監視対象装置の識別子とが対応付けられた情報を自装置が記憶する事象保持装置情報T4に追加する。
次いで,監視装置DCDの同期制御部106は,他の監視装置に,変更後の事象保持装置情報T4を同期する。換言すれば,第2の監視装置W2の同期制御部106は,他の監視装置が記憶する事象保持装置情報に,変更後の事象保持装置情報T4を反映する。事象保持装置情報T4の同期については,図11のステップS15で詳細に説明したので,その説明を省略する。
なお,ステップS76において,監視装置DCDの情報制御部101は,監視装置SRCが監視する監視対象装置の中から,状態情報が"停止","異常"以外の監視対象装置(状態が"稼働中")を決定する。これは,移動対象の監視対象装置(決定した監視対象装置)が,事象情報の通知先を監視装置SRCから監視装置DSTに変更する必要があるからである。移動対象の監視対象装置の状態が"停止"または"異常"の場合,この移動対象の監視対象装置は,事象情報の通知先を変更できない。そのため,監視装置DCDの情報制御部101は,ステップS76において,状態情報が"停止"または"異常"の監視対象装置を決定しない。
なお,監視装置DCDは,ステップS80の終了後,ステップS75の処理に戻り,監視装置間における監視対象の装置の数に隔たりがなくなるまで(S75/NO),ステップS76〜ステップS80の処理を繰り返してもよい。
以上説明した,監視対象の均一化処理によれば,監視対象装置の追加,削除により,監視対象装置のシステム構成が変更されても,監視装置より監視される監視対象の装置の数を均一化することができる。その結果,特定の監視装置における処理負荷が増大することがない。
(事象情報の同期処理)
図16のステップS73,S78で説明した事象情報の同期処理について説明する。事象情報の情報量は多いので,事象情報の同期には時間がかかる。そこで,事象情報の内容,時間に応じて,優先して同期する事象情報レコードを決定する。この優先して同期する事象情報レコードは,以下の第1,第2の点から決定する。
第1の点は,利用者は,異常発生時に,この異常に関連する事象情報を参照することが多い点である。第2の点は,利用者は,異常発生時に事象情報を参照する場合,現在の異常状況を把握するため,現時点の事象情報を参照することが多い点である。
以上,第1の点から,同期対象の事象情報の中で,事象種別としてエラーを含む事象情報レコードを1番目の優先度(最優先)で送信し,次に,事象種別として警告を含む事象情報レコードを2番目の優先度で送信し,次に,事象種別として情報を含む事象情報レコードを3番目の優先度で送信する。
また,第1,第2の点から,利用者が異常解析を効率的に行うため,事象種別がエラーの事象情報レコードに含まれる時間を基準にして,所定の時間帯内(例えば,3分)の時間を含む事象情報レコードを1番目の優先度で送信する。
また,第3の点から,同じ事象種別であれば,新しい時間(換言すれば,現在の時間に近い時間)を含む事象情報レコードを優先的に送信する。
図17は,図16のステップS73,S78で説明した事象情報の同期のシーケンスを説明する図である。
図16のステップS73における事象情報の同期を図17で説明する場合,図17の同期元の監視装置SRCが決定監視装置DCDであり,図17の同期先の監視装置DSTが図16のステップS72で決定された監視装置である。
また,図16のステップS78における事象同期の同期を図17で説明する場合,図17の監視対象装置ADDが図16のステップS76で決定された移動対象の監視対象装置である。
ステップS731:同期元の監視装置SRCの同期制御部106は,自装置に記憶された事象情報T31の中から,監視対象装置ADD(図11のS11参照)の事象情報を取得するように事象情報管理部105に指示する。
ステップS732:同期元の監視装置SRCの事象情報管理部105は,この指示に応答して,監視対象装置ADDの事象情報を取得し,同期制御部106に送信する。同期制御部106は,取得された事象情報の事象情報レコードの中で,第1の事象情報と,第1の優先度よりも低い第2の優先度で送信する第2の事象情報とを判別する。そして,同期制御部106は,第1の事象情報である1番目の優先度(すなわち,優先度高)の事象情報レコードをRAM13のキュー(優先度高)Q1に追加する。
ステップS733:同期元の監視装置SRCの同期制御部106は,第2の事象情報である1番目以下の優先度(すなわち,優先度低)の事象情報レコードをRAM13のキュー(優先度低)Q2に追加する。
監視対象装置ADDが複数の場合,同期元の監視装置SRCの同期制御部106は,ステップS731の処理を,この複数の監視対象装置ADDについて実行する。
ステップS734:同期元の監視装置SRCの同期制御部106は,RAM13のキュー(優先度高)Q1に追加された事象情報レコードを,同期先の監視装置DSTに送信する。
ステップS735:同期先の監視装置DSTの情報制御部101は,同期元の監視装置SRCから送信された事象情報レコードを受信し,事象情報管理部105に転送する。事象情報管理部105は,この事象情報レコードを事象情報として自装置に記憶する。
ステップS736:同期元の監視装置SRCの同期制御部106は,RAM13のキュー(優先度低)Q2に追加された事象情報レコードを,同期先の監視装置DSTに送信する。
ステップS737:同期先の監視装置DSTの情報制御部101は,同期元の監視装置SRCから送信された事象情報レコードを受信し,事象情報管理部105に転送する。事象情報管理部105は,この事象情報レコードを事象情報として自装置に記憶する。
図16,図17で説明したように,本実施の形態における,任意の監視装置(例えば,何れかの監視装置RND)の情報制御部101は,事象保持装置情報T4に基づき,少なくとも2つの監視装置が同一の監視対象装置の事象情報を記憶しているか判定する。情報制御部101は,少なくとも2つの監視装置が同一の監視対象装置の事象情報を記憶していない場合,監視装置RND以外の監視装置に同一の監視対象装置の事象情報を取得するように指示する。
同一の監視対象装置の事象情報を既に記憶している監視装置の同期制御部106は,既に記憶していた同一の監視対象装置の事象情報の中から,前記した第1,第2の事象情報を判別する。そして,同期制御部106は,第1の事象情報を第2の事象情報よりも優先して同一の監視対象装置の事象情報を既に記憶している監視装置以外の監視装置に送信する。
図17で説明した事象情報の同期によれば,事象情報の中でも,トラブル調査の際に頻繁に参照される事象情報レコード(種別が"異常")を優先的に同期させ,同期遅延による影響を抑制している。そのため,利用者は,トラブル調査に必要な事象情報レコードを迅速に閲覧できる。
さらに,本実施の形態によれば,情報処理システムSYSに監視対象装置を追加,情報処理システムSYSから監視対象装置を削除しても,冗長性を確保しつつ,監視装置は,監視対象の監視対象装置の割当てを動的に変更することができる。そして,監視装置は,変更後の監視対象装置の監視を継続することができる。
監視対象の装置の割当てを動的に変更することにより,以下の2点が可能になる。1点目は,サーバ集約環境における物理マシンの追加,削除や,クラウド環境における仮想マシンの動的な追加,削除(すなわち,動的なコンピュータの割当て)がなされても,監視装置は,冗長性や監視能力を確保しつつ監視を継続できる点である。
2点目は,人手で,監視構成の再設計および再構築を行わなくてもよい点である。この2点目により,利用者による情報システムの監視工数を削減できる。
また,本実施の形態によれば,監視対象装置を削除,追加した場合に,監視装置間において監視対象の装置の数に隔たりが生じても,冗長性を確保しながら,特定の監視装置に監視負荷が集中しないように,監視対象の最適化を実現できる。
[第3の実施の形態]
(監視装置の追加)
監視装置の冗長性を高めるため,情報処理システムSYSに監視装置を追加することがある。以下,情報処理システムSYSに追加する監視装置を追加監視装置と適宜記す。この監視装置が情報処理システムSYSに追加されると,既設の監視装置と追加監視装置とは,構成情報,状態情報,事象保持装置情報,事象情報を同期する。
図18は,監視装置の追加を模式的に説明する図である。図18において,追加監視装置は,例えば第4の監視装置W4である。図18において,監視装置の冗長性を確保するため,追加監視装置は,他の監視装置が監視する監視対象装置の事象情報を記憶する。
第1の監視対象装置群M1’は,第1の監視装置W1,第2の監視装置W2が監視する複数の監視対象装置を示す。第2の監視対象装置群M2’は,第1の監視装置W1,第3の監視装置W3が監視する複数の監視対象装置を示す。第3の監視対象装置群M3’は,第2の監視装置W2,第3の監視装置W3が監視する複数の監視対象装置を示す。
図19は,監視装置の追加における一連のシーケンスを説明する図である。図19の説明の前に,利用者は,クライアント端末C1を操作して,情報処理システムSYSにおける何れかの監視装置RNDの端末インターフェイス部107を介して情報制御部101に,追加監視装置の識別子を含む追加指示コマンドを送信する。
ステップS91:監視装置RNDの情報制御部101は,移動対象の監視対象装置を決定する。監視装置RNDは,例えば第2の監視装置W2である。
具体的には,監視装置RNDの情報制御部101は,自装置が記憶する事象保持装置情報に基づき,監視対象の装置数が最も多い監視装置SRCを決定する(S75参照)。監視装置RNDの情報制御部101は,自装置が記憶する事象保持装置情報に基づき,監視装置SRCが監視する監視対象装置の中から,監視対象装置を1つ決定する(S76参照)。監視対象装置の決定において,監視装置RNDの情報制御部101は,自装置が記憶する構成情報に基づき,依存関係のない監視対象装置を決定する。
ステップS92:監視装置RNDの情報制御部101は,追加監視装置W4に,移動対象の監視対象装置を監視するように指示する指示コマンドを送信する。この指示コマンドは,移動対象の監視対象装置の識別子を含む。追加監視装置W4の情報制御部101は,この指示コマンドを受信すると,事象情報管理部105に転送する。
追加監視装置W4の情報制御部101は,移動対象の監視対象装置に,自装置に事象情報を送信するように指示するコマンドを送信する。このコマンドは,この監視対象装置をネットワークで一意に識別する識別子(例えば,IPアドレス)を含む。この監視対象装置は,このコマンドに応答して,事象情報を追加監視装置追加監視装置W4に送信する。
追加監視装置W4の事象情報管理部105は,移動対象の監視対象装置の事象情報を取得する。
ステップS93:監視装置RNDの情報制御部101は,移動対象の監視対象装置を監視する監視装置を変更したことにより,自装置が記憶する状態情報を更新し,この更新後の状態情報に,他の監視装置が記憶する状態情報を同期する。なお,この他の監視装置は,追加監視装置を含む。
具体的には,監視装置RNDの情報制御部101は,状態情報管理部103に状態情報の更新を指示する。状態情報管理部103は,この更新指示に応答して,自装置が記憶する状態情報の中から,移動対象の監視対象装置の識別記号を含む状態情報レコードを削除する。
さらに,状態情報管理部103は,この更新指示に応答して,追加監視装置の識別記号と,状態"初期状態"とを自装置が記憶する状態情報T2に追加する。
次いで,監視装置RNDの同期制御部106は,変更後の状態情報T2に他の監視装置が記憶する状態情報を同期する。
状態情報T2の同期については,図11のステップS14で詳細に説明したので,その説明を省略する。
ステップS94:監視装置RNDの情報制御部101は,移動対象の監視対象装置を監視する監視装置を変更したことにより,自装置が記憶する事象保持装置情報T4を更新し,この更新後の事象保持装置情報T4に,他の監視装置が記憶する事象保持装置情報T4を同期する。なお,この他の監視装置は,追加監視装置を含む。
具体的には,監視装置RNDの情報制御部101は,事象保持装置情報管理部104に事象保持装置情報T4の更新を指示する。事象保持装置情報管理部104は,この更新指示に応答して,自装置が記憶する事象保持装置情報T4の中から,監視装置SRCの識別記号と移動対象の監視対象装置の識別記号とを含む事象保持装置情報レコードを削除する。
さらに,事象保持装置情報管理部104は,この更新指示に応答して,追加監視装置W4の識別記号と,移動対象の監視対象装置の識別子とが対応付けられた情報を自装置が記憶する事象保持装置情報T4に追加する。
次いで,監視装置RNDの同期制御部106は,変更後の事象保持装置情報T4に他の監視装置が記憶する事象保持装置情報を同期する。事象保持装置情報T4の同期については,図11のステップS15で詳細に説明したので,その説明を省略する。
ステップS95:監視装置RNDの情報制御部101は,監視装置SRCに事象情報の同期を指示する。監視装置SRCの同期制御部106は,この同期指示に応答して,自装置に記憶された移動対象の監視対象装置の事象情報に,追加監視装置W4が記憶する事象情報を同期する。なお,ステップS95の同期については,図17を参照のこと。
ステップS96:監視装置RNDの情報制御部101は,監視装置SRCに,移動対象の監視対象装置の監視を停止するように指示する指示コマンドを送信する。なお,監視装置SRCが,この指示コマンドを受信後に実行する処理は,ステップS79で説明した。
なお,監視装置RNDの情報制御部101は,図19の終了後,監視装置間における監視対象の装置の数に隔たりが無くなるまで(図16のS75参照),図16のステップS75以下の処理を実行してもよい。この場合,図16の監視装置DCDを監視装置RNDに置き換えて,ステップS75以下の処理が実行される。
図19で説明した監視装置の追加処理によれば,利用者は,監視装置の追加を監視装置RNDに指示すれば,情報処理システムSYSは,監視装置の冗長性を確保しつつ,自動的に追加監視装置W4による監視対象装置の監視を実現できる。
(監視装置の削除)
監視装置の故障や定期点検により,情報処理システムSYSから監視装置を削除することがある。すなわち,情報処理システムSYSから1以上の監視装置を切り離すことがある。以下,情報処理システムSYSから削除した監視装置を削除監視装置と適宜記す。この監視装置が情報処理システムSYSから削除されると,既設の監視装置と削除監視装置とは,構成情報,状態情報,事象保持装置情報,事象情報を同期する。
図20は,監視装置の削除を模式的に説明する図である。図20は,図9で示した監視装置,監視対象装置の状態から,1つの監視装置を削除した状態を模式的に示している。図20において,削除監視装置は,例えば第3の監視装置W3である。
図21は,監視装置の削除における一連のシーケンスを説明する図である。図21の説明の前に,利用者は,クライアント端末C1を操作して,監視装置RNDの端末インターフェイス部107を介して情報制御部101に,削除監視装置の識別子を含む削除指示コマンドを送信する。
ステップS101:監視装置RNDの情報制御部101は,自装置が記憶する事象保持装置情報に基づき,削除監視装置が監視している監視対象装置を決定する。図20の例では,監視装置RNDの情報制御部101は,削除監視装置W3が監視する監視対象装置として第2の監視対象装置M2,第3の監視対象装置M3を決定する。
ステップS102:監視装置RNDの情報制御部101は,自装置が記憶する事象保持装置情報に基づき,冗長性が不足する監視対象装置があるか判定する。この判定の具体例については,ステップS71で説明したので,その説明を省略する。図20の例では,冗長性が不足する監視対象装置は,第2の監視対象装置M2,第3の監視対象装置M3である。
ステップS103:監視装置RNDの情報制御部101は,自装置が記憶する事象保持装置情報に基づき,冗長性が不足する監視対象装置の事象情報を既に記憶している監視装置を決定する。
図20の例では,第2の監視装置W2は,冗長性が不足する第3の監視対象装置M3の事象情報を記憶している。そして,第1の監視装置W1は,冗長性が不足する第2の監視対象装置M2の事象情報を記憶している。
従って,監視装置RNDの情報制御部101は,第2の監視対象装置M2の事象情報を記憶する監視装置を第1の監視装置W1と決定する。そして,監視装置RNDの情報制御部101は,第3の監視対象装置M3の事象情報を記憶する監視装置を第2の監視装置W2と決定する。
以下,ステップS103で決定された監視装置を,図16のステップS71で説明した監視装置DCD(図11のステップS12,S18参照)として説明する。
ステップS104:監視装置RNDの情報制御部101は,監視装置DCDに事象情報の同期を指示する。
具体的には,監視装置RNDの情報制御部101は,監視装置DCDに事象情報の同期指示コマンドを送信する。
監視装置DCDの情報制御部101は,自装置が記憶する事象保持装置情報に基づき,冗長性が不足する装置の事象情報を既に記憶している監視装置以外の監視装置の中から,冗長性が不足する装置の事象情報を記憶する監視装置を決定する。以下,決定された監視装置を同期先の監視装置と適宜記す。
監視装置DCDの情報制御部101は,同期制御部106に事象情報の同期を指示する。同期制御部106は,この同期指示に応答して,自装置に記憶されている,削除監視装置W3が監視する装置の事象情報に,同期先の監視装置が記憶する事象情報の一部を同期する。
図20の例では,監視装置DCDは第1の監視装置W1,第2の監視装置W2である。
監視装置RNDの情報制御部101は,監視装置DCD(例えば,第1の監視装置W1)に事象情報の同期指示コマンドを送信する。
第1の監視装置W1の情報制御部101は,自装置が記憶する事象保持装置情報に基づき,冗長性が不足する第2の監視対象装置M2の事象情報を記憶する同期先の監視装置(例えば,第2の監視装置W2)を決定する。
第1の監視装置W1の情報制御部101は,同期制御部106に事象情報の同期を指示する。同期制御部106は,この同期指示に応答して,自装置に記憶されている,削除監視装置W3が監視する第2の監視対象装置M2の事象情報に,同期先の監視装置(例えば,第2の監視装置W2)の事象情報の一部を同期する。なお,この同期の詳細については,図16のステップS74で説明した。
図20の例では,監視装置RNDと監視装置DCDが同じ場合,監視装置RNDが,監視装置DCDと同じ処理を実行する。図20の例では,監視装置RNDと監視装置DCDは,同じ第2の監視装置W2となる。
第2の監視装置W2の情報制御部101は,自装置が記憶する事象保持装置情報に基づき,冗長性が不足する第3の監視対象装置M3の事象情報を記憶する同期先の監視装置(例えば,第1の監視装置W1)を決定する。
第2の監視装置W2の情報制御部101は,同期制御部106に事象情報の同期を指示する。同期制御部106は,この同期指示に応答して,自装置に記憶されている,削除監視装置W3が監視する第3の監視対象装置M3の事象情報に,同期先の監視装置(例えば,第1の監視装置W1)の事象情報を同期する。なお,この同期の詳細については,図16のステップS74で説明した。
ステップS105:監視装置RNDの情報制御部101は,ステップS101で決定した監視対象装置の事象保持装置情報の削除指示を事象保持装置情報管理部104に行う。事象保持装置情報管理部104は,この指示に応答して,自装置が記憶する事象保持装置情報の中から,削除した監視対象装置の識別子を有する事象保持装置情報レコードを削除して事象情報を更新する。
情報制御部101は,同期制御部106に事象保持装置情報の同期を指示する。同期制御部106は,この同期指示に応答して,削除後の事象保持装置情報に他の監視装置が記憶する事象保持装置情報を同期する。監視装置RNDの情報制御部101が行う同期指示,同期制御部106が行う同期の具体例については,ステップS25で説明したので,その説明を省略する。
図20の例では,第1の監視装置W1,第2の監視装置W2の事象保持装置情報管理部104は,事象保持装置情報T4の中から,第3の監視装置W3の識別子と第2の監視対象装置M2の識別子とが対応付けられた事象保持装置情報レコードと,第3の監視装置W3の識別子と第3の監視対象装置M3の識別子とが対応付けられた事象保持装置情報レコードとを削除する。
なお,監視装置RNDの情報制御部101は,図21の終了後,監視装置間における監視対象の装置の数に隔たりが無くなるまで(図16のS75参照),図16のステップS75以下の処理を実行してもよい。この場合,図16の監視装置DCDを監視装置RNDに置き換えて,ステップS75以下の処理が実行される。
図21で説明した監視装置の削除処理によれば,利用者は,監視装置の削除を監視装置RNDに指示すれば,情報処理システムSYSは,監視装置の冗長性を確保しつつ,自動的に既設の監視装置による監視対象装置の監視を実現できる。その結果,人手で,監視構成の再設計および再構築を行わなくてもよくなり,利用者による情報システムの監視工数を削減できる。
以上,本実施の形態によれば,情報処理システムSYSに監視装置を追加,情報処理システムSYSから監視装置を削除しても,冗長性を確保しつつ,監視装置は,監視対象の装置の割当てを動的に変更することができる。その結果,監視装置は,冗長性や監視能力を確保しつつ監視を継続できる。
以上の実施の形態をまとめると,次の付記のとおりである。
(付記1)
監視対象となる複数の装置と,前記複数の装置の中から割り当てられた装置をそれぞれが監視する複数の監視装置とを有する情報処理システムであって,
前記複数の監視装置のそれぞれは,
記憶部と,
処理部と,を有し,
前記処理部は,
割り当てられた前記装置から監視情報を取得して,取得した前記監視情報を前記記憶部に記憶し,
前記記憶部に記憶された前記監視情報を他の前記監視装置に送信する際に,前記監視情報の種別に基づき特定される優先監視情報が他の監視情報よりも優先して送信されるように制御する
ことを特徴とする情報処理システム。
(付記2)
付記1において,
前記他の監視装置の前記処理部は,送信された前記監視情報を当該他の監視装置の前記記憶部に記憶し,監視情報を送信した前記監視装置が記憶する前記監視情報に,前記他の監視装置が記憶する監視情報を同期する
ことを特徴とする情報処理システム。
(付記3)
付記1において,
前記監視情報は,前記複数の装置それぞれの状態を示す状態情報と,前記装置において発生した事象を示す事象情報とを含み,
前記処理部は,前記状態情報が前記事象情報よりも優先して前記他の前記監視装置に送信されるように制御する
ことを特徴とする情報処理システム。
(付記4)
付記3において,
前記事象情報は,装置で発生した事象の種別を含み,
前記処理部は,前記事象の種別に基づき,第1の優先度で送信する第1の事象情報と,前記第1の優先度よりも低い第2の優先度で送信する第2の事象情報とを判別し,前記第1の事象情報が前記第2の事象情報よりも優先して前記他の監視装置に送信されるように制御する
ことを特徴とする情報処理システム。
(付記5)
付記4において,
前記複数の監視装置のそれぞれは,監視対象の前記装置を識別する識別子と,前記装置の事象情報を記憶する監視装置を識別する識別子とが対応付けられた保持装置情報を記憶部に記憶し,
任意の前記監視装置の前記処理部は,
前記保持装置情報に基づき,少なくとも2つの監視装置が同一の前記装置の事象情報を記憶しているか判定し,少なくとも2つの監視装置が前記同一の装置の事象情報を記憶していない場合,前記任意の前記監視装置以外の監視装置に前記同一の装置の事象情報を取得するように指示し,
前記同一の装置の事象情報を既に記憶している前記監視装置の前記処理部は,既に記憶していた前記同一の装置の事象情報の中から,前記第1,第2の事象情報を判別し,前記第1の事象情報が前記第2の事象情報よりも優先して前記同一の装置の事象情報を既に記憶している前記監視装置以外の監視装置に送信されるように制御する
ことを特徴とする情報処理システム。
(付記6)
付記5において,
前記情報処理システムに監視対象となる装置が新たに追加された場合,追加された追加装置の事象情報を既に記憶している前記監視装置の前記処理部は,既に記憶していた前記追加装置の事象情報の中から,前記第1,第2の事象情報を判別し,前記第1の事象情報が前記第2の事象情報よりも優先して前記同一の装置の事象情報を既に記憶している前記監視装置以外の監視装置に送信されるように制御する
ことを特徴とする情報処理システム。
(付記7)
付記6において,
前記任意の監視装置の前記処理部は,前記情報処理システムに監視対象となる装置が新たに追加された場合,追加された追加装置の識別子と,前記追加装置の事象情報を記憶する監視装置の識別子とをさらに含む前記保持装置情報を前記記憶部に記憶し,
前記追加装置の状態情報をさらに含む前記状態情報を前記記憶部に記憶し,
前記追加装置の状態情報,および,前記追加装置の識別子と,前記追加装置の事象情報を記憶する監視装置の識別子とを含む前記保持装置情報が前記任意の監視装置以外の監視装置に送信されるように制御する
ことを特徴とする情報処理システム。
(付記8)
付記5において,
前記任意の監視装置の前記処理部は,前記情報処理システムから監視対象となる装置が削除されると,
削除された削除装置の状態情報および保持装置情報の削除指示信号を前記前記任意の監視装置以外の監視装置に送信し,
前記削除装置の事象情報の削除指示信号を前記追加装置の事象情報を既に記憶している監視装置に送信する,
ことを特徴とする情報処理システム。
(付記9)
付記5において,
前記任意の監視装置の前記処理部は,前記情報処理システムに新たに監視装置が追加されると,既に記憶されている状態情報が追加された追加監視装置に送信されるように制御し,
前記保持装置情報に基づき,前記追加監視装置に監視させる監視対象の装置を決定し,前記決定された決定装置の識別子と,前記追加監視装置の識別子とを含む前記保持装置情報が前記任意の監視装置以外の監視装置に送信されるように制御し,
前記決定装置の事象情報を既に記憶している監視装置は,既に記憶していた前記決定装置の事象情報の中から前記第1,第2の事象情報を判別し,前記第1の事象情報が前記第2の事象情報よりも優先して前記追加監視装置に送信されるように制御する
ことを特徴とする情報処理システム。
(付記10)
付記5において,
前記情報処理システムから前記監視装置が削除されると,削除された削除監視装置が記憶する事象情報を既に記憶している監視装置は,自装置に記憶された,前記削除監視装置が既に記憶していた事象情報の中から前記第1,第2の事象情報を判別し,前記第1の事象情報が前記第2の事象情報よりも優先して,前記削除監視装置が記憶する事象情報を既に記憶している監視装置以外の監視装置に送信されるように制御する
ことを特徴とする情報処理システム。
(付記11)
監視対象となる複数の装置と,前記複数の装置の中から割り当てられた装置をそれぞれが監視する複数の監視装置とを有する情報処理システムにおける監視装置であって,
記憶部と,
処理部と,を有し,
前記処理部は,
割り当てられた前記装置から監視情報を取得して,取得した前記監視情報を前記記憶部に記憶し,
前記記憶部に記憶された前記監視情報を他の前記監視装置に送信する際に,前記監視情報の種別に基づき特定される優先監視情報が他の監視情報よりも優先して送信されるように制御する
ことを特徴とする監視装置。
(付記12)
監視対象となる複数の装置と,前記複数の装置の中から割り当てられた装置をそれぞれが監視する複数の監視装置とを有する情報処理システムにおける監視方法であって,
前記監視装置は,
割り当てられた前記装置から監視情報を取得して,取得した前記監視情報を前記記憶部に記憶し,
前記記憶部に記憶された前記監視情報を他の前記監視装置に送信する際に,前記監視情報の種別に基づき特定される優先監視情報が他の監視情報よりも優先して送信されるように制御する
ことを特徴とする監視方法。
(付記13)
コンピュータに,
割り当てられた装置から監視情報を取得して,取得した前記監視情報を前記記憶部に記憶し,
前記記憶部に記憶された前記監視情報を他の前記監視装置に送信する際に,前記監視情報の種別に基づき特定される優先監視情報が他の監視情報よりも優先して送信されるように制御させる
ことを特徴とする監視プログラム。