JP2005141391A - エージェント駆動型監視システム及び方法 - Google Patents

エージェント駆動型監視システム及び方法 Download PDF

Info

Publication number
JP2005141391A
JP2005141391A JP2003375867A JP2003375867A JP2005141391A JP 2005141391 A JP2005141391 A JP 2005141391A JP 2003375867 A JP2003375867 A JP 2003375867A JP 2003375867 A JP2003375867 A JP 2003375867A JP 2005141391 A JP2005141391 A JP 2005141391A
Authority
JP
Japan
Prior art keywords
monitoring
agent
notification
target device
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003375867A
Other languages
English (en)
Inventor
Yukio Ogawa
祐紀雄 小川
Eiji Ohira
栄二 大平
Akira Sasaki
朗 佐々木
Tetsuya Ito
哲也 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Electronics Services Co Ltd
Original Assignee
Hitachi Ltd
Hitachi Electronics Services Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Electronics Services Co Ltd filed Critical Hitachi Ltd
Priority to JP2003375867A priority Critical patent/JP2005141391A/ja
Publication of JP2005141391A publication Critical patent/JP2005141391A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

【課題】監視装置と監視対象装置の間での処理の時刻同期を実現しつつ、ファイアウォールの設定変更を必要とせずに、インターネット経由で監視装置と監視対象装置の双方向の情報通信を可能にすること。
【解決手段】監視対象装置とネットワークを通して接続された監視装置とを備えたエージェント駆動型監視システムであって、監視エージェントは、監視対象装置における正常動作確認309又は異常発生時のアラート311のリクエストメッセージを定期的又は不定期的に監視装置に通報し、監視装置は、リクエストメッセージに対応してレスポンスメッセージ310,312を監視エージェントにファイアウォールを通して通報し、レスポンスメッセージに、監視対象装置のログ又は性能情報の取得命令、あるいは監視エージェントの設定変更命令を埋め込むことにより、監視装置は監視エージェントに指示を通知314すること。
【選択図】図3

Description

本発明は、監視対象装置である機器の遠隔監視に関し、さらに詳しくは、インターネット等のオープンなネットワークを経由して遠隔から機器の監視、情報収集、障害分析を行うシステム及び方法に関する。
遠隔から監視対象装置の監視、情報収集、障害分析を行うには、以下の二つの方法が広く用いられている。ISDN回線などの専用回線を経由して、監視装置から監視対象装置に対してログ等の情報収集を行って障害分析を行う方法と、インターネット等のオープンなネットワークを経由して、監視対象装置から監視装置に対して電子メール(SMTP(Simple Mail Transfer Protocol))によりアラートや、予め設定されたログ情報等を通知する方法である。
ただし、前者については、監視装置と監視対象装置との間で双方向の情報のやりとりが可能であるが、監視専用の回線が必要となり、コストが高くなるという課題があった。また、後者については、監視専用の回線が必要でないためコストは低く抑えられるが、監視対象装置側のファイアウォールが存在するため監視装置から監視対象装置への通信ができず、監視対象装置から監視装置への片方向の情報通知しかできないという課題があった。この場合、監視装置から監視対象装置への通信を行うためには、監視対象装置側のファイアウォールの設定変更を必要とした。
従来の遠隔機器監視システムは、これらの課題に鑑みて、監視対象装置側のファイアウォールの設定変更無しに、インターネット経由での監視装置と監視対象装置との双方向の情報のやりとりを実現している(例えば、特許文献1を参照)。この特許文献1によれば、監視装置と監視対象装置の間の通信にSMTP(電子メール)やFTP(File Transfer Protocol)を利用している。SMTPやFTPは、ファイアウォールにおいてはセキュリティを確保されつつ通信を許可されている。従って、監視装置と監視対象装置の間で、相互に、電子メールで情報を通知したり、FTPによって情報を送信したりすることにより、ファイアウォールの設定変更無しに、インターネット経由で監視装置と監視対象装置の双方向の情報通信が可能になる。
特開2000−163283号公報(第5頁、図1)
しかしながら、上述の特許文献1に示されているような従来技術においては、アプリケーションレベルでは、監視対象装置と監視装置の間において双方向通信(リクエストとレスポンスとのセットで1つのシーケンスを完了する通信)ではなく、相互の片方向通信を行っているといえる。従って、相互の情報通知のみであり、通知に対するレスポンスを送れないため、監視装置と監視対象装置の間での処理の時刻同期が難しい(両装置間での処理について、タイムラグを少なくして時間的関連付けをもたせることが困難である)。そのため、監視装置は、必要な時に監視対象装置から情報を得られないといったことが起こり得る。
本発明の目的は、監視装置と監視対象装置の間での処理の時刻同期を実現しつつ、ファイアウォールの設定変更を必要とせずに、インターネット経由で監視装置と監視対象装置の双方向の情報通信を可能にする遠隔監視システムを提供することにある。
前記課題を解決するために、本発明は主として次のような構成を採用する。
1つ以上の監視対象装置とネットワークを通して接続された監視装置と、前記監視対象装置自体の監視と前記監視装置との通信を行う監視エージェントを内部配置した監視対象装置と、前記監視対象装置側に設けられたファイアウォールと、を備えたエージェント駆動型監視システムであって、
前記監視エージェントは、前記監視対象装置における正常動作確認又は異常発生時のアラートのリクエストメッセージを定期的又は不定期的に前記監視装置に通報し、
前記監視装置は、前記リクエストメッセージに対応してレスポンスメッセージを前記ファイアウォールを通して前記監視エージェントに通報し、
前記レスポンスメッセージに、前記監視対象装置のログ、性能情報又は管理情報の取得命令、前記監視装置内の更新ファイルの取得要求命令、あるいは、前記監視エージェントの設定変更命令を埋め込むことにより、前記監視装置は前記監視エージェントに指示を通知する構成とする。
また、1つ以上の監視対象装置とネットワークを通して接続された監視装置と、前記監視対象装置自体の監視と前記監視装置との通信を行う監視エージェントを内部配置した監視対象装置と、前記監視対象装置側に設けられたファイアウォールと、を備えたエージェント駆動型監視システムであって、
前記監視エージェントは、前記監視対象装置における正常動作確認又は異常発生時のアラートのリクエストメッセージを定期的又は不定期的に前記監視装置に通報し、
前記監視装置は、前記リクエストメッセージに対応してレスポンスメッセージを前記ファイアウォールを通して前記監視エージェントに通報し、
前記レスポンスメッセージに、前記監視対象装置のログ、性能情報又は管理情報の取得命令、前記監視装置内の更新ファイルの取得要求命令、あるいは、前記監視エージェントの設定変更命令を埋め込むことにより、前記監視装置は前記監視エージェントに指示を通知し、
前記監視エージェントへの指示通知に応じて、前記監視エージェントは、前記ログ、性能情報又は管理情報を取得してこの取得した情報を前記監視装置にアップロードし、前記更新ファイルを前記監視装置に要求し、あるいは、前記監視エージェントの設定変更を行う構成とする。
本発明によれば、監視装置と監視対象装置の間での処理の時刻同期を実現しつつ、ファイアウォールの設定変更を必要とせずに、インターネット経由で監視装置と監視対象装置の双方向の通信を行うことが可能になり、監視対象装置の遠隔監視を行うことが可能になる。
本発明の実施形態に係るエージェント駆動型監視システムについて、図面を参照しながら以下詳細に説明する。以下に示す実施形態では、各装置間でHTTP(HyperText Transfer Protocol)を利用して通信を行っている場合を例として説明しているが、HTTPと同様のリクエストおよびレスポンス機能を有するプロトコルであれば、どのようなプロトコルでもよく、装置間の通信プロトコルはHTTPに限定されない。
図1は、本発明の実施形態に係るエージェント駆動型監視システムにおける全体構成を示す図である。監視対象装置側における全体構成は、ファイアウォール105と監視対象装置106が設置されている場合と、ファイアウォール107と管理装置108と監視対象装置109が設置されている場合がある。また、監視装置側における全体構成は、優先制御装置101と、監視装置102と、操作端末103とが設置されている。
監視装置102は、通常のパーソナルコンピュータやサーバであり、CPU110、メモリ111、ハードディスク112、キーボード113、ディスプレイ114、通信インタフェース115等から構成される。監視装置102において、オペレーティングシステムがハードディスク112からプログラムを呼び出しメモリ111上に展開して実行する。また、優先制御装置101、操作端末103、監視対象装置106,109、管理装置108もパーソナルコンピュータ機能を備えていて、監視装置102と同様の構成を有している。具体的には、監視装置102は高性能なPCサーバで、監視対象装置106,109はPCサーバやパソコンであっても良く、この際、操作端末103や優先制御装置101や管理装置108はパソコン機能をも有しているものであって良い。
監視対象装置106は、ファイアウォール105、インターネット104、優先制御装置101を介して監視装置102と通信し、監視装置102による監視を直接的に受ける。また、複数の監視対象装置109の管理を一括して行う管理装置108を新たに設置し、管理装置108が、ファイアウォール107、インターネット104、優先制御装置101を介して監視装置102と通信することにより、監視対象装置109が間接的に監視装置102による監視を受ける構成でもよい。
ファイアウォール105は、監視対象装置106に対する外部からの攻撃を防ぐ機能を有している。ファイアウォール107も同様の機能を有する。また、優先制御装置101は、監視対象装置106や管理装置108から監視装置102への通知の優先制御を行う。
監視装置102は、監視対象装置106からの通知を受け、監視対象装置106の監視を行う。また、監視対象装置109に関する通知を管理装置108から受け、監視対象装置109の監視を行う。さらに、監視対象装置106,109の情報をオペレータの操作端末103に転送する。
操作端末103は、監視装置102から監視対象装置106に関する情報を受けてオペレータに情報を伝達し、オペレータの指示により、監視装置102に監視対象装置106に対する操作指示を伝える。また、監視装置102から監視対象装置109に関する情報を受けてオペレータに情報を伝達し、オペレータの指示により監視装置102に管理装置108に対する操作指示を伝える。
図2は、本発明の実施形態に係るエージェント駆動型監視システムの論理的な機能構成を示す図である。図2における監視対象装置235、優先制御装置224、監視装置222、操作端末201は、それぞれ図1の監視対象装置106、優先制御装置101、監視装置102、操作端末103と同一である。各装置又は端末内の各処理部は、各装置又は端末のハードディスクに格納されたプログラムである。
監視対象装置235は、装置管理処理部234と監視エージェント233を少なくとも備え、監視対象装置235は、自身の構成、性能の管理を行う装置管理処理部234を備えている。装置管理処理部234は、監視対象装置235内部に組み込まれた監視エージェント(監視対象装置内部への監視と、ファイアウォールを通した監視装置への通信と、を行うプログラム又はソフトウェア)233と、あるいは、外部の管理装置に組み込まれた監視エージェント233と通信を行う。ただし、両者の場合の通信内容は異ならない。なお、図2には不図示であるが、監視エージェント233の外部には優先制御装置との間にファイアウォールが介在していて、監視エージェントからのメッセージは監視装置に送り出すことができるが、監視装置からの指示命令に対しては侵入を阻止するシステムとなっている。
装置管理処理部234は、監視対象装置235のCPUやメモリ、ドライブ等の構成、性能等、監視対象装置235に関する全ての情報を管理する。監視対象装置235の構成や性能等の情報は、MIF(Management Information Format)やMIB(Management Information Base)に定義されている。装置管理処理部234は、監視エージェント233内のヘルスチェック処理部227の呼び出しに応じて監視対象装置235のヘルスチェック(正常動作の確認)を行い、その結果を返す。また、監視対象装置235についての構成や性能値が設定された閾値を超えた場合にアラート(警告)を監視エージェント233のアラート処理部229に通知する。また、監視エージェント231の装置情報取得処理部230の要求に応じて、監視対象装置235の構成、性能情報を取得し、取得情報を返す。取得情報を返す際には、値として返す場合と、値を格納したファイルを返す場合がある。ファイル形式はテキスト形式とバイナリ形式のどちらの形式でもよい。
監視エージェント233は、監視対象装置235の監視を行い、必要な通信を監視装置222と行うプログラムである。監視エージェント233は、監視対象装置235内に組み込まれ、組み込まれた監視対象装置235のみの監視を受け持つ場合と、監視対象装置235とは独立した管理装置に組み込まれ、複数の監視対象装置235の監視を受け持つ場合の、二通りの構成がある。ただし、両者の機能構成は同じである。
監視エージェント233は、ヘルスチェック処理部227、スリープ処理部228、アラート処理部229、装置情報取得処理部230、更新情報要求処理部231、設定変更処理部232、メッセージング処理部225、メール送信処理部226を備えている。
ヘルスチェック処理部227は、定期的に監視対象装置235の装置監視処理部234にヘルスチェックに関する問い合わせを行い、メッセージング処理部225を通じて生存通知(keep alive通知)を監視装置222内のヘルスチェック受信処理部216に送信する。なお、ヘルスチェックについては、監視エージェント233が監視対象装置235に組み込まれている場合は、監視対象装置235のヘルスチェックを行うが、監視エージェント233が管理装置に組み込まれている構成においては、監視エージェント233は、管理装置のヘルスチェックを行う。
スリープ処理部228は、スリープ処理(後述する図3に示す定期的通報の時間間隔を生成する処理)を行う。また、アラート処理部229は、監視対象装置235の装置管理処理部234から、監視対象装置234のシステム異常等のアラートを受け取り、メッセージング処理部225を通じてアラート通知を監視装置222内のアラート受信処理部218に送信する。また、装置情報取得処理部230は、監視対象装置235の装置管理処理部234に問い合わせを行い、監視対象装置235の構成情報、性能情報、ログ情報(動作履歴又はそれをファイル化したもの)等を取得し、メッセージング処理部225を通じて監視装置222の装置情報受信処理部219に送信する。
更新情報要求処理部231は、監視対象装置235や監視エージェント233のファームウェア等の更新ファイルを、メッセージング処理部225を通じて監視装置222内の更新情報転送処理部220に要求し、取得する。また、設定変更処理部232は、監視装置222の指示に従い、スリープ処理時間等に関する監視エージェント233の設定変更を行う。
メッセージング処理部225は、HTTP(HyperText Transfer Protocol)等に則って、ヘルスチェック処理部227、アラート処理部229、装置情報取得処理部230、更新情報要求処理部231の通知メッセージを、監視装置222のヘルスチェック受信処理部216、ヘルスチェック再受信処理部217、アラート受信処理部218、装置情報受信処理部219、更新情報転送処理部220にそれぞれ送信し、それらからレスポンスメッセージを受信する。また、メール送信処理部226は、ヘルスチェック処理部227、アラート処理部229、装置情報取得処理部230、更新情報要求処理部231の通知を、SMTP(Simple Mail Transfer Protocol)に則って、監視装置222に送信する。
優先制御装置224は、通知の優先制御を行う優先制御処理部223を備えている。
監視装置222は、ヘルスチェック受信処理部216、ヘルスチェック再受信処理部217、アラート受信処理部218、装置情報受信処理部219、更新情報転送処理部220、更新情報取得処理部221、状態管理処理部213、情報取得・情報要求・設定変更指示処理部210、停止チェック処理部204、停止通知処理部205、通知転送処理部206、情報転送処理部207、処理指示変換処理部208、更新情報格納処理部209、および、状態管理DB(Data Base)214、装置情報格納DB215、返り値指定DB211、更新情報格納DB212を備えている。
ヘルスチェック受信処理部216は、監視エージェント233内のメッセージング処理部225から送信された生存通知(keep alive通知)を受け取ってレスポンスを返す。ヘルスチェック再受信処理部217は、監視エージェント233内のメッセージング処理部225から再送された生存通知(keep alive通知)を受け取ってレスポンスを返す。また、アラート受信処理部218は、監視エージェント233内のメッセージング処理部225から送信された監視対象装置235のアラート通知を受け取ってレスポンスを返す。また、装置情報受信処理部219は、監視エージェント233内のメッセージング処理部225から送信された監視対象装置235の情報や添付ファイルを含む通知を受け取ってレスポンスを返す。
更新情報転送処理部220は、監視エージェント233内のメッセージング処理部225から送信された更新情報要求通知を受け取って更新情報ファイルを返す。また、更新情報取得処理部221は、更新情報転送処理部220が監視エージェント233に転送する更新情報ファイルを更新情報格納DB212より取得して更新情報転送処理部220に渡す。
状態管理処理部213は、ヘルスチェック受信処理部216、ヘルスチェック再受信処理部217、アラート受信処理部218、装置情報受信処理部219、更新情報転送処理部220が、監視エージェント233のメッセージング処理部225から、それぞれに対する通知を受けた場合に、通知元の監視エージェント233のID、監視対象装置235のID、通知時間、通知の種別を状態管理DB214に格納する。
情報取得・情報要求・設定変更指示処理部210は、ヘルスチェック受信処理部216、ヘルスチェック再受信処理部217、アラート受信処理部218、装置情報受信処理部219が監視エージェント233から受けた通知に対してレスポンスを返信する際に、返り値指定DB211から監視エージェント233のIDをキーに検索した返り値を与える。この返り値は、監視エージェント233への操作指示となる。
停止チェック処理部204は、状態管理DB214を定期的にチェックし、一定時間通知のない監視エージェント233は停止していると判断する。また、停止通知処理部205は、停止チェック処理部204のチェック結果を受けて、停止していると判断した監視エージェント233のIDを操作端末201の管理処理部202に通知する。また、通知転送処理部206は、アラート受信処理部218、装置情報受信処理部219が、監視エージェント233からそれぞれの通知を受けた場合に、アラート通知、あるいは、情報通知を操作端末201内の管理処理部202に転送する。
情報転送処理部207は、アラート受信処理部218、装置情報受信処理部219が、監視エージェント233からそれぞれの通知を受けた場合に、アラート通知を、あるいは、情報通知に添付されたファイルを、装置情報格納DB215に格納して操作端末201内の管理処理部202に転送する。
処理指示変換処理部208は、監視エージェント233に対する操作端末201内の指示処理部203の指示を受けて、指示内容を対応する番号やコマンドに変換して、返り値DB211に格納する。また、更新情報格納処理部209は、監視エージェント233に対する操作端末201内の指示処理部203の指示を受けて、監視エージェント233に転送するファームウェア等の更新情報ファイルを、更新情報格納DB212に格納する。
状態管理DB214は、監視エージェント233の状態を管理する。監視エージェント233のID、監視対象装置235のID、通知受信時間、通知種別、通知内容等の項目からなるテーブルを持つ。また、装置情報格納DB215は、監視エージェント233からアップロードされた装置情報ファイルを格納する。
返り値指定DB211は、監視エージェント233へのレスポンスに指定する返り値を格納する。監視エージェント233のID、監視対象装置235のID、指示入力時間、返り値(指示内容)、指示備考、指示状況(指示済みか未済か)、指示時間、指示通知種別等の各項目からなるテーブルを持つ。また、更新情報格納DB212は、監視エージェント233にダウンロードする更新ファイルを格納する。
操作端末201は、管理処理部202と指示処理部203を備えている。管理処理部202は、監視装置222の停止通知処理部205から監視対象装置235に関する停止情報の通知を、監視装置222の通知転送処理部206からアラート情報、構成、性能情報の通知を、監視装置222の装置情報転送処理部206から構成、性能情報についてのファイルの転送を、それぞれ受け、ディスプレイに表示するなどしてオペレータに情報を伝達する。
オペレータは、管理処理部202から伝えられる監視対象装置235の停止情報、アラート情報、構成、性能情報の通知、および、構成、性能情報ファイルに記載の情報をもとに、監視対象装置235に対する指示を判断する。
指示処理部203は、オペレータの入力に従って、監視エージェント233に対する情報取得、更新情報の要求、設定変更等の指示を、監視装置222の処理指示変換処理部208に伝える。また、指示処理部203は、オペレータの入力に従って、監視エージェント233に対してダウンロードする更新ファイルを更新情報格納DB212に格納するため、監視装置222の更新情報格納処理部209に更新ファイルを渡す。
次に、図3を参照して、本実施形態に係る遠隔監視システムにおける監視エージェント319と監視装置320との間の通信シーケンスの概要を説明する。処理の詳細内容については後述する。図3においては、監視エージェント319側の処理を縦軸307に示し、監視装置320側の処理を縦軸308に示す。監視エージェント319、監視装置320は、図2における監視エージェント233、監視装置222にそれぞれ対応する。
まず、step301における定期的通報を説明する。監視エージェント319は、設定された周期(例えば、5分)で定期的に監視対象装置のヘルスチェック(正常動作の確認)を行い、その結果を、監視装置320にヘルスチェック通知(keep alive通知)メッセージ309として送信する。通知を受けた監視装置320は、送信元の監視エージェント319にレスポンスメッセージ310を送信する。例えば、正常動作をしていると云う監視エージェントからのメッセージに対して了解というレスポンスを送信する。
メッセージの送信に、例えばHTTPを利用した場合、監視エージェント319から監視装置320にHTTPリクエストを送信し、監視装置320から監視エージェント319にHTTPレスポンスを送信することになる。これは、監視エージェント319から、HTTP/HTML(Hyper Text Markup Language)インタフェースを通じて監視装置320のWebアプリケーションを呼び出すということである。HTTPの上位のプロトコルとしてSOAP(Simple Object Access Protocol)を使用し、監視エージェント319から、SOAP/XML(Extensible Markup Language)インタフェース通じて監視装置320のWebサービスを呼び出すということであっても良い。以下、監視エージェント319と監視装置320間の通信は、全てこのような「リクエストメッセージの送信」と「リクエストメッセージに応答するレスポンスメッセージの送信」という方式に則ることとする。
次に、step302における緊急通報を説明する。監視エージェント319は、監視対象装置のシステム異常(例えば、装置温度上昇、ハードディスクの容量不足、メールプロセスのダウン)等の緊急時に受けたアラート通知311を監視装置320に送信する。通知を受けた監視装置320は、送信元の監視エージェント319にレスポンス312を送信する。この際のレスポンスは、監視対象装置に異常が発生したことを了解する旨のレスポンスであって、監視エージェント319に対する具体的な指示は、この異常発生に適宜に対応処理するために監視装置320で種々勘案し判断する必要があるので、即答することができない場合があり、通常、次回の定期的通報に対するレスポンスにこの具体的指示を含ませるのであり、以下に示すステップからなる。
そこで、step303におけるオペレータ指示を説明する。アラート通知311を受信した監視装置320は、オペレータの指示に従って、監視エージェント319に伝える指示を、内部データベース(図2の返り値指定DB211)に格納する。
次に、step304における定期的通報を説明する。監視エージェント319は、監視装置320に定期的にヘルスチェック通知313を送信する。通知を受けた監視装置320は、監視エージェント319に伝える指示を、内部データベース(図2の返り値指定DB211)から検索し、監視エージェント319へのレスポンス314に装置情報取得指示を埋め込んで送信する。監視装置320は、監視エージェント319からのどの通知のレスポンスに対して指示を埋め込んでも良いが、オペレータが指示した後、最も早い時間に通知されたメッセージに対するレスポンスに指示を与えることとする。図3では、アラート通知311を受けたオペレータが、指示内容の判断を行い、監視装置320に指示を与る。監視装置320は、その後通知されたヘルスチェック通知313へのレスポンスに指示を与えている。
さらに、step305における情報アップロードを説明する。ここで、監視エージェントから監視装置への情報提供がアップロードで、逆向きの情報提供がダウンロードである。監視エージェント319は、監視装置320から受けたレスポンスに監視対象装置情報の取得指示(例えば、装置温度の10分間のログを取れとの指示)がある場合、それに従い、監視対象装置からレスポンスに指定された情報を取得して監視装置320に送信する。取得情報が値(ファイルではなくて直接の応答値)の形式の場合は、リクエストメッセージ(図3における符号315)内に記述して、取得情報がファイル形式の場合は、リクエストメッセージの添付ファイルとして送信する。情報を受けた監視装置320は、送信元の監視エージェント319にレスポンス316を送信する。
step306における定期的通報を説明する。step301と同様に、監視エージェント319は、監視装置320に定期的にヘルスチェック通知313を送信する。通知を受けた監視装置320は、送信元の監視エージェント319にレスポンス318を送信する。
以上のstep301からstep306のシーケンスに示すように、本実施形態に係るエージェント駆動型監視システムの特徴は、監視エージェント319から監視装置320へ定期的リクエストメッセージ、および、不定期のリクエストメッセージを送信し、それに対するレスポンスメッセージに監視装置320から監視エージェント319への指示を埋め込むことにより、監視エージェント319と監視装置320との間でアプリケーションレベルでの双方向通信を実現している。即ち、本実施形態におけるリクエストメッセージとレスポンスメッセージとは対となって一つのメッセージシーケンスが完了するように構成されているので、リクエストとレスポンスとの処理のタイムラグが少なく、互いのメッセージの関連付けがなされているので、相互の片方向通信とは異なり、双方向通信を形成している。因みに、電子メール等における相互の片方向通信では、一方の装置から他方の装置へのメッセージ送信で1つのメッセージシーケンスが完了している。
メッセージの通信にはHTTP等を利用する。HTTPS(Hyper Text Transfer Protocol over SSL)を利用すれば、通信のセキュリティを確保することが可能である。このリクエストメッセージとレスポンスメッセージの一対のメッセージ交換は、監視エージェント319を起点とする通信である。例えばHTTPやHTTPSを利用する場合、それらは一般的に使用されているので、監視対象装置側に設置されたファイアウォールの通信ポートにおける外部に対する防御手段は既に設けられており、特別な設定を施す必要はない。
次に、図4を参照して、本実施形態に係る遠隔監視システムにおける監視エージェントの処理フローを説明する。図4における監視対象装置418、監視エージェント419、監視装置420は、図2の監視対象装置235、監視エージェント233、監視装置222にそれぞれ対応する。
監視対象装置418において行われる装置管理(ヘルスチェック)処理414、装置管理(アラート)処理415、装置管理(情報取得処理)416,417、は、図2の装置管理処理部234において実施される処理である。また、監視エージェント419において行われるスリープ処理413、ヘルスチェック処理401、アラート処理402、装置情報取得処理404,410、メッセージング処理405、メール送信処理408、更新情報要求処理411、設定変更処理412は、それぞれ、図2のスリープ処理部228、ヘルスチェック処理部227、アラート処理部229、装置情報取得処理部230、メッセージング処理部225、メール送信処理部226、更新情報要求処理部231、設定変更処理部232において実施される処理である。
また、監視装置420において行われるヘルスチェック受信処理421、ヘルスチェック再受信処理422、アラート受信処理423、装置情報受信処理424、更新情報転送処理425は、それぞれ図2のヘルスチェック受信処理部216、ヘルスチェック再受信処理部217、アラート受信処理部218、装置情報受信処理部219、更新情報転送処理部220において実施される処理である。
以下、図4を参照して監視エージェントの処理フローを説明する。まず、step401におけるヘルスチェック処理401では、一定時間のスリープ処理413を行った後(図3に示す定期的通報の時間間隔を例えば5分間とするスリープ処理後)、装置管理(ヘルスチェック)処理414を呼び出し、監視対象装置418についてのヘルスチェック(生存確認)を行い、その結果を受け取る。
次に、step402におけるアラート処理402では、監視対象装置418にシステム異常等の問題が発生した際に、監視対象装置235内の装置管理処理部234が行う装置管理(アラート)処理415により、監視対象装置418からのアラートを受け取る。
さらに、step403におけるアラートに対する情報取得判断では、step402において取得したアラートに対して、その発生時に監視対象装置から取得すべき情報が予め定義されている場合はstep404に進み、定義されていない(アラート発生時に情報を取得する必要がない)場合は、step405に進む。
step404における装置情報取得処理404では、装置管理処理(情報取得)処理416を呼び出し、発生アラートに対して予め定義されている監視対象装置418の構成、性能情報を取得する。
次に、step405におけるメッセージング処理405では、定期的なヘルスチェック処理401の結果を受けて、その結果をリクエストメッセージに埋め込み、HTTP等に従って、監視装置420のヘルスチェック受信処理421に送信する。そして、ヘルスチェック受信処理421からレスポンスメッセージを受信する。ヘルスチェック受信処理421については後述する。また、メッセージング処理405では、緊急時のアラート処理402の結果を受けて、その結果をリクエストメッセージに埋め込み、監視装置420のアラート受信処理422に送信する。そして、アラート受信処理422からレスポンスメッセージを受信する。アラート受信処理422については後述する。
また、ヘルスチェック通知の再送時には、監視装置420のヘルスチェック再受信処理422にリクエストメッセージを送信し、ヘルスチェック再受信処理422からレスポンスメッセージを受信する。
同様に、装置情報取得処理410、設定変更処理412からの分岐においては、監視装置420の装置情報受信処理424にリクエストメッセージを送信し、装置情報受信処理424からレスポンスメッセージを受信する。さらに同様に、更新情報要求処理411からの分岐においては、監視装置420の更新情報転送処理425にリクエストメッセージを送信し、更新情報転送処理425から更新情報を受信し、指定位置に保存する。更新情報は、テキストファイルやバイナリファイルでありレスポンスメッセージに添付されている。監視装置420内の各処理については、後述する。
さらに、step406におけるレスポンス有無の判断では、step405で送信したリクエストメッセージに対して、監視装置420からのレスポンスが有るか、もしくは、タイムアウトしているかを判断する。レスポンスが有る場合はstep409に進み、レスポンスの内容判読処理を行う。レスポンスが無い場合はstep407に進む通知の再送処理を行う。
次に、step407におけるメッセージ再送の判断では、一つのヘルスチェック処理やアラート処理の通知メッセージの送信回数が、予め設定された閾値以内の場合は、step405のメッセージング処理に戻り、通知の再送を行う。通知を行うまでにスリープ処理を入れ、一定時間経過の後、再送を実施してもよい。ヘルスチェック通知の再送信の場合、メッセージング処理405においては、監視装置420のヘルスチェック再受信処理422にリクエストメッセージを送信し、レスポンスを受信する。
通知の送信回数が設定された閾値を超える場合は、リクエストメッセージの送信を断念し、電子メール(SMTP)による通知に切り替える。
次に、step408におけるメール送信処理では、リクエストメッセージの再送を繰り返しても、レスポンスを得られない場合は、その代替手段として電子メール(SMTP)による通知を行う。リクエストメッセージと同様の内容を電子メールにより監視装置420に送信する。また、この処理の内容を監視エージェント419の処理ログに記録する。
また、step409におけるレスポンスの返り値(レスポンスメッセージの内容)の内容判断では、監視装置420に対して送信したリクエストメッセージに対するレスポンスメッセージに監視エージェント419に対する処理指示が含まれているか判断する。処理指示が無い場合は、スリープ処理413を経て通常のヘルスチェック処理401を繰り返す。処理指示がある場合は、その指示内容に従い、step410からstep412の各処理を行う。レスポンスメッセージに複数の指示が埋め込まれている場合は、それぞれの指示を実行する。
step410における装置情報取得処理で、監視装置420からのレスポンスメッセージに、監視対象装置418についての情報取得が指示されている場合、装置情報取得処理410では、装置管理処理(情報所得)処理417を呼び出し、監視装置420からのレスポンスに指定された監視対象装置418についての構成、性能に関する情報を取得する。取得情報をメッセージング処理405に渡し、監視装置420の装置情報受信処理424にリクエストメッセージとして、或いは、リクエストメッセージの添付ファイルとして送信する。以降、step406以下の処理を繰り返す。
また、step411における更新情報要求処理で、監視装置420からのレスポンスメッセージに、監視装置420に対する更新ファイル情報の取得要求が指示されている場合、更新情報要求処理411では、監視装置420からのレスポンスメッセージに指定されたファームウェア等の更新ファイルの名称やIDをメッセージング処理405に渡し、監視装置420の更新情報転送処理425にリクエストメッセージの形式で要求する。指定した更新ファイルは、リクエストメッセージに対するレスポンスメッセージの添付ファイルとしてダウンロードされる。レスポンスが無い場合は、step407以下の再送処理を行う。
更新情報転送処理424からのレスポンスメッセージには、テキスト形式あるいはバイナリ形式の更新ファイルが添付されている。更新ファイルを受信したときは、step409から、装置情報取得処理410に進み、監視対象装置418の装置管理(情報取得)処理417を通じて、更新ファイルがダウンロードされていることを確認し、あるいは、更新ファイルのバージョン情報を取得し、それらの情報を、メッセージング処理405を通じて監視装置420の装置情報受信処理424に通知する。以降、step406以下の処理を繰り返す。
また、step412における設定変更処理で、監視装置420からのレスポンスメッセージに、監視エージェント419に対する設定変更が指示されている場合、設定変更処理412では、監視装置420からのレスポンスに指定された監視エージェント419についてのスリープ時間変更や再送回数変更等の設定変更を行う。設定変更後に、設定変更内容をメッセージング処理405に渡し、監視装置420の装置情報受信処理424にリクエストメッセージとして通知する。以降、step406以下の処理を繰り返す。
次に、step413におけるスリープ処理で、step409からの分岐において、スリープ処理413では、一致時間のスリープ処理を実行した後、処理をヘルスチェック処理401に渡す。
監視対象装置418からのアラート発生時といった緊急時においては、監視装置420側のオペレータは、必要時に必要な情報を監視対象装置418から収集できることが必要である。そこで、監視エージェント419は、監視対象装置418からのアラート発生時といった緊急時等において、監視装置420が任意の時刻に監視エージェントに419に指示を通知できるようにするため、短周期でヘルスチェック通知を行う。具体的には、アラート処理402〜メッセージング処理405〜レスポンスメッセージの返り値の内容判断409という処理ステップからの分岐時は、緊急時であると判断し、一定時間、スリープ処理時間を事前に決められた短時間に設定する。或いは、監視装置420からのレスポンスメッセージに埋め込まれたスリープ処理時間変更指示に従ってスリープ処理時間の設定変更を行い、スリープ処理時間を一定時間、短時間化する。
また、監視対象装置418からのアラート発生時といった緊急時においては、監視装置420側のオペレータが十分に状況を判断できる時間を経た後、必要な情報を監視対象装置418から収集できることが望ましい。そこで、監視エージェント419は、監視対象装置418からのアラート発生時といった緊急時等において、監視装置420が指定の時刻に監視エージェント419に指示を通知できるようにするため、指定時間にヘルスチェック通知を行う。具体的には、監視装置420からのレスポンスメッセージに埋め込まれたスリープ処理時間変更指示に従ってスリープ処理時間の設定変更を行い、監視装置420に指定された時間の間、或いは、指定された時刻まで、スリープ処理を行う。
以上説明したstep401からstep413のシーケンスに示すように、本実施形態に係るエージェント駆動型監視システムは、監視エージェント419からの通知が監視装置420に届いていない場合に再送を繰り返すことにより通知を確実にする。さらに、監視エージェント419を起点とした監視装置420への通信であっても、任意の時刻に監視装置420の指示を監視エージェント419に通知することができる。また、監視装置420の指定の時刻に指示を監視エージェント419に通知することができる。
次に、図5を参照して、本実施形態に係る遠隔監視システムにおける監視装置の処理フローを説明する。図5における監視エージェント527、監視装置529、操作端末530は、図2の監視エージェント233、監視装置222、操作端末201にそれぞれ対応する。
監視エージェント527において行われるメッセージング処理525は、図2のメッセージング処理部225において実施される処理である。また、監視装置529において行われるヘルスチェック受信処理520、ヘルスチェック再受信処理523、アラート受信処理521、装置情報受信処理524、更新情報転送処理522は、それぞれ、図2のヘルスチェック受信処理部216、ヘルスチェック再受信処理部217、アラート受信処理部218、装置情報受信処理部219、更新情報転送処理部220において実施される処理である。
さらに、監視装置529において行われる状態管理処理502、通知転送処理503、装置情報転送処理505、更新情報取得処理506、情報取得・情報要求・設定変更指示処理507、停止チェック処理513、停止通知処理515、更新情報格納処理518、処理指示変換処理519は、それぞれ、図2の状態管理処理部213、通知転送処理部206、装置情報転送処理部207、更新情報取得処理部221、情報取得・情報要求・設定変更指示処理部210、停止チェック処理部204、停止通知処理部205、更新情報格納処理部209、処理指示変換処理部208において実施される処理である。また、監視装置529における状態管理DB509、装置情報格納DB510、更新情報格納DB511、返り値指定DB512は、それぞれ図2の状態管理DB214、装置情報格納DB215、更新情報格納DB212、返り値指定DB211に対応する。
操作端末530において行われる管理処理516、指示処理517は、それぞれ、図2の管理処理部202、指示処理部203において実施される処理である。なお、図5において、監視エージェント527のメッセージング処理525が上下段に記載されているが、図示の都合上で2段にしたのであり、これらは同一の構成要素(ソフトウエア)である。
次に、監視装置529におけるヘルスチェック受信処理520とヘルスチェック再受信処理523における処理内容、アラート受信処理521と装置情報受信処理524における処理内容、更新情報転送処理522における処理内容、に分けてそれぞれ説明する。これらの処理は、監視エージェント527のメッセージング処理525からの通知メッセージをトリガーとして起動する。
まず、ヘルスチェック受信処理520とヘルスチェック再受信処理523における処理内容について説明する。処理は、以下のstep501、step502、step507、step508からなる(図5の図示フローで上から下へのフローを参照)。step501におけるリクエストメッセージ受信処理501では、監視エージェント527のメッセージング処理525によりヘルスチェック通知、あるいは、ヘルスチェックの再通知が送信されてきたとき、その通知の実体であるリクエストメッセージを受信する。
次に、step502における状態管理処理502では、監視エージェント527、および、監視エージェント527が組み込まれている監視対象装置の状態を管理するため、ヘルスチェック通知、あるいは、ヘルスチェック再通知を受けた場合に、通知元の監視エージェント527のID、監視対象装置のID、通知受信時間、通知種別、通知内容等を状態管理DB509に格納する。通知種別は、ここでは、ヘルスチェック通知、あるいは、ヘルスチェック再通知である。なお、監視エージェント528が監視対象装置でなく、それらを管理する管理装置に組み込まれている場合は管理装置のIDを格納する。
次に、step507における情報取得・情報要求・設定変更指示処理507では、監視エージェント527に情報取得、情報要求、設定変更といった指示を与えるため、返り値指定DB512から、通知元の監視エージェント527のID、監視対象装置のIDをキーとして返り値を検索し、ヘルスチェック通知、あるいは、ヘルスチェック再通知に対するレスポンスメッセージに埋め込む。
返り値指定DB512には、監視エージェント527のID、監視対象装置のID、指示入力時間、返り値(指示内容)、指示備考、指示状況(指示済みか未済みか)、指示時間、指示通知種別の項目からなるテーブルが格納されている。返り値には指示内容を示す番号やコマンドが格納されている。例えば、返り値0は処理無し、返り値1001は指定IDの監視対象装置からの過去1日のシステムログ取得、というように、事前に設定しておく。返り値指定DB512において、同一IDの監視エージェント527に対して、指示入力時間の異なる複数の返り値(指示内容)が格納されていてもよい。通常は、一つのレスポンスには、一つの返り値(一つの指示)を与えるが、複数の返り値(複数の指示)を与えてもよい。通知元の監視エージェント527のID、監視対象装置のID、および、指示状況が指示未済みであるという条件で、返り指定DB512から検索し、検索結果を、監視エージェント527へのレスポンスに埋め込み、返り値とする。
一つの指示が、一つの監視エージェント527への複数のレスポンスに対して与えられることを防ぎ、一つのレスポンスに対してのみ与えられるようにするため、返り値指定DB512から返り値を検索し、一つのレスポンスにその値を埋め込んだら、返り値指定DB512の当該指示データにおける指示状況を指示未済から指示済みに変更し、指示時間にstep502での通知受信時間入力し、指示通知種別に指示を与えた通知の種別(ヘルスチェック、アラート等)を入力する。
さらに、step508におけるレスポンスメッセージ送信処理において、step507で監視エージェント527に対する指示を埋め込んだレスポンスメッセージを、監視エージェント527からのヘルスチェック通知、あるいは、ヘルスチェック再通知に対するレスポンスとして、監視エージェント527のメッセージング処理525に送信する。
次に、アラート受信処理521と装置情報受信処理524における処理内容について説明する。処理は、以下のstep501、step502、step503、step504、step505、step507、step508からなる。
まず、step501におけるリクエストメッセージ受信処理では、上述したヘルスチェック受信処理520の場合と同様の処理を行う。次に、step502におる状態管理処理では、上述したヘルスチェック受信処理520の場合と同様の処理を行う。
次に、step503における通知転送処理503では、リクエストメッセージからアラートや装置情報に関する情報を取り出し、操作端末530の管理処理516に転送する。転送情報は、通知元の監視エージェント527のID、監視対象装置のID、通知受信時間、通知種別、アラートや装置情報(監視対象装置の構成、性能情報、ファイル更新確認情報、設定変更内容等)といった通知内容である。管理処理516では、通知内容をディスプレイに表示しオペレータに伝達する。
さらに、step504における添付ファイルの有無判断では、通知にファイルが添付されているか否かを判断する。この添付ファイルは、図3において符号315で示す装置情報をファイル化したものである。次に、step505における装置情報(添付ファイル)転送処理505では、通知にファイルが添付されている場合に、添付ファイルを装置情報格納DB510に格納し、管理処理516に装置情報ファイルとして転送する。管理処理516は、転送ファイルをディスプレイに表示しオペレータに伝達する。
また、step507における情報取得・情報要求・設定変更指示処理では、上述したヘルスチェック受信処理520の場合と同様の処理を行う。さらに、step508におけるレスポンスメッセージ送信処理では、上述したヘルスチェック受信処理520の場合と同様の処理を行う。
最後に、更新情報転送処理522における処理内容について説明する。処理は、以下のstep501、step502、step506、step508からなる。
まず、step501におけるリクエストメッセージ受信処理では、上述したヘルスチェック受信処理520の場合と同様の処理を行う。さらに、step502における状態管理処理では、上述したヘルスチェック受信処理520の場合と同様の処理を行う。
次に、step506における更新情報取得処理506では、リクエストメッセージからファームウェア等の更新情報ファイル名を取り出し、更新情報格納DB511から検索、取得する。さらに、step508におけるレスポンスメッセージ送信処理では、step506で取得したファイルはレスポンスメッセージの添付ファイルとし、監視エージェント527へのレスポンスとしてメッセージング処理525に送信する。
監視装置529においては、定期的に監視対象装置の死活チェック、および、停止通知処理を行う。まず、step513における停止チェック処理513では、1分周期というように定期的に状態管理DB509のチェックを行い、予め登録されている全ての監視エージェント527について、過去一定時間以内に、例えば過去15分以内に、通知が来ていることを確認する。
次に、step514における停止機器の有無を判断では、予め登録されている全ての監視エージェント527について、過去一定時間以内に通知が来ていない場合、監視エージェント527が停止していると判断する。
さらに、step515における停止通知処理において、監視エージェント527が停止していると判断された場合に、停止通知処理515では、停止している監視エージェント527のID、そのエージェントからの最も新しい通知の受信時間、通知種別、通知内容等を操作端末530の管理処理516に通知する。管理処理516は、通知内容をディスプレイに表示しオペレータに知らせる。
さらに、監視装置529においては、更新情報格納処理518にて、操作端末530の指示処理517の指示に従い、監視エージェント527にダウンロードする更新情報ファイルを更新情報格納DB511に格納する。さらに、処理指示変換処理519では、操作端末530の指示処理517の指示に従い、監視エージェント527への指示内容を対応する数値やコマンドに変換し、返り値指定DB512に入力する。返り値指定DB512への入力項目は、指示対象となる監視エージェント527のID、監視対象装置のID、指示入力時間、返り値(指示内容)、指示備考である。なお、指示処理517への指示はオペレータが行う。
以上説明した監視装置529における処理シーケンスに示すように、本実施形態に係るエージェント駆動型監視システムは、監視エージェント527からのリクエストメッセージに対するレスポンスメッセージに監視エージェント527への指示を埋め込むことにより、監視装置529から監視エージェント525に情報取得、情報要求、設定変更といった指示を伝えることができる。
次に、図6を参照して、本実施形態に係る遠隔監視システムにおける監視エージェントから監視装置への通知の優先制御について説明する。図6における監視エージェント601、優先制御装置602、監視装置603は、それぞれ、図2の監視エージェント233、優先制御装置224、監視装置222に対応する。優先制御装置602における優先制御処理部609は、図2の優先制御処理部223に対応する。
優先制御装置602の優先制御処理部609は、内部に監視装置603への転送優先度の異なる複数のキューを持っている。例えば、図6のように高優先度キュー610、中優先度キュー611、低優先度キュー612の三つのキューを持っている。優先制御処理部609は通知の優先度に応じて各優先度のキューに振り分け、高優先度のキュー内の通知から優先的に監視装置603に転送する。
キューのサイズは、監視装置603の処理能力を考慮して適切な値とする。低優先度キュー612の場合は、処理が優先されないためキューから通知が廃棄されることも有る。この場合は、通知元の監視エージェント610にレスポンスが返らないため、結果として再送を促すことになる。
通知の優先度の識別方法には、通知メッセージに優先度をつける方法と、通知メッセージの宛先に優先度をつける方法がある。前者の場合、通知メッセージのヘッダーやデータ部分に識別子を記載し、その識別子により各キューに振り分ける。図6の場合、ヘルスチェック通知604には低優先度、ヘルスチェック再通知605には中優先度、アラート通知606、対象装置情報通知607、更新情報要求通知608には高優先度の識別子をつけ、優先制御処理部609では、その識別子に応じて高優先度キュー610、中優先度キュー611、低優先度キュー612に振り分ける。
後者の場合、通知メッセージに記載された宛先を識別し、それによって各キューに振り分ける。通知にHTTPを利用している場合、宛先はURL(Uniform Resource Locator)である。図6の場合、通知の宛先がヘルスチェック受信処理613の場合には低優先度度キュー612に格納し、通知の宛先がヘルスチェック再受信処理614の場合には中優先度キュー611に格納し、通知の宛先がアラート受信処理615、装置情報受信処理616、更新情報受信処理617の場合には高優先度キュー610に格納する。
以上の処理により、本実施形態に係るエージェント駆動型監視システムは、監視エージェント601からの通知が膨大な場合においても、アラート通知606や対象装置情報通知607等の重要な通知を優先的に監視装置603に転送し処理を行うことができる。
次に、図7を参照して、本実施形態に係るエージェント駆動型監視システムに関する通知のスケジューリング、および、監視装置の負荷抑制について説明する。図7における監視エージェント1(701)、監視エージェント2(702)、監視エージェントn(703)は、図2の監視エージェント233に対応する。図7における監視装置704は、図2の監視装置222に対応する。
複数の監視エージェント(監視エージェント1(701)、監視エージェント2(702)、監視エージェントn(703))から監視装置704に通知が送られる場合を想定する。多数の監視エージェントからの定期的なヘルスチェック通知等の通知が同期すると、監視装置704側の単位時間当りの処理通知数が増加するため、監視装置704の負荷は増大する。例えば、時刻705に監視エージェント1(701)、監視エージェント2(702)〜監視エージェントn(703)から一斉にヘルスチェック通知が監視装置704に送信されたとすると、グラフ713に示すように監視装置704の単位時間当りの受信通知数は大きくなる。
各監視エージェントにおける次のヘルスチェック通知を、前回のヘルスチェック通知時刻705から一定時間後(例えば、5分後)の時刻709に実施すると、各監視エージェントからの通知の同期は解消されず、監視装置704側の単位時間当りの処理負荷はグラフ713のように同じく大きな状態となる。このような負荷のピークの時刻に、いずれかの監視エージェントからアラート等の重要な通知が送信されても、処理を実施できない可能性が有る。
そこで、本実施形態においては、各監視エージェントにおける次のヘルスチェック通知を、各監視エージェントが監視装置704から通知のレスポンスを受け取った時刻から一定時間後に実施するようにする。すなわち、監視装置704において、単位時間に処理能力以上の通知を受信した場合、通知のレスポンスに遅延が発生し、各監視エージェントにおける通知レスポンスの受信時刻706,707,708には、ずれが生じる結果となる(例えば、2秒毎のずれ発生)。監視エージェント1(701)は通知レスポンス受信時刻706より一定時間後の時刻710に、監視エージェント2(702)は通知レスポンス受信時刻707より一定時間後の時刻711に、監視エージェントn(703)は通知レスポンス受信時刻708より一定時間後の時刻712に、それぞれ次のヘルスチェック通知を実施するようにすれば、各監視エージェントからの通知の同期は解消され、監視サーバ704側の単位時間当りの処理負荷はグラフ714のように平滑化される。
このように、本実施形態に係るエージェント駆動型監視システムにおいては、一定時間のスリープ処理の起点時刻を前回の定期的通知の送信時刻ではなく、前回の定期的通知の受信時刻とすることにより、複数エージェントでの定期的通知の時刻同期を抑制し、監視装置における負荷を抑えることができる。
以上説明したように、本発明の実施形態に係るエージェント駆動型監視システムは、次のような特徴と機能を奏するものである。即ち、本発明の実施形態は、監視対象装置側に配置した監視エージェントに、監視対象装置のヘルスチェックを定期的に行うヘルスチェック部と、監視対象装置の異常発生時に当該装置内部からアラートを受信するアラート受信部と、監視装置へリクエストメッセージを送信することにより、ヘルスチェック結果を定期的に通知し、かつ、アラートを異常発生時に通知するメッセージング部を設け、監視装置に、監視対象装置のログや性能情報、管理情報の取得命令、監視エージェントの設定変更命令を、監視エージェントからのリクエストメッセージに対するレスポンスメッセージに埋め込むことにより、監視エージェントに指示を通知する情報取得・情報要求・設定変更指示部を設け、さらに、上記監視エージェントに、監視装置からのレスポンスメッセージによって通知された命令に応じて、監視装置指定のログや性能情報、管理情報を取得し、上記メッセージング部を通じて取得情報を監視装置にアップロード(監視対象装置から監視装置への情報提供)する対象装置情報取得部と、上記メッセージング部を通じて更新ファイルを監視装置に要求する更新情報要求部と、自身の設定変更を行う設定変更部を設ける。
また、本発明の実施形態は、監視エージェントに、監視装置へリクエストメッセージを送信することにより、ヘルスチェックやアラート、ログ、取得情報を通知した時に監視装置からレスポンスメッセージが無い場合、レスポンスを得られるまで一定時間間隔で一定回数、再通知するメッセージング部と、それでもレスポンスが得られない場合に電子メールにて通報を通知するメール送信部を設けている。
また、本発明の実施形態は、監視装置が任意の時刻に、監視対象装置のログや性能情報、管理情報の取得命令、更新ファイルの取得要求命令、監視エージェントの設定変更命令を監視エージェントに通知できるようにするため、監視対象装置内に組み込んだ監視エージェントに、監視対象装置内の管理部よりアラート受信したときに、あるいは、監視装置からのレスポンスメッセージによって通知された指示にヘルスチェック通知の周期が指定されていたときに、監視装置に、一定期間、指定周期でヘルスチェックを通知するメッセージング部を設ける。
また、本発明の実施形態は、監視装置が指定時刻に、監視対象装置のログや性能情報、管理情報の取得命令、更新ファイルの取得要求命令、監視エージェントの設定変更命令を監視エージェントに通知できるようにするため、監視対象装置内に組み込んだ監視エージェントに、監視装置からのレスポンスメッセージによって通知された指示にヘルスチェック通知の送信時刻が指定されていた場合に、監視装置の指定時刻にヘルスチェックを通知するメッセージング部を設ける。
本発明は、以上のような構成を備えているので、インターネット経由での監視装置と監視対象装置の情報通信において、ファイアウォールの設定変更無しに、双方向通信を実現できる。従って、監視装置と監視対象装置の間での処理の時刻同期が可能になり、監視装置は必要時に監視対象装置から情報を得ることができる。また、重要度の高い通信を優先することも可能であり、さらに、監視装置の負荷を抑制することもできる。
本発明の実施形態に係るエージェント駆動型監視システムにおける全体構成を示す図である。 本発明の実施形態に係るエージェント駆動型監視システムの論理的な機能構成を示す図である。 本実施形態に係るエージェント駆動型監視システムにおける監視エージェント監視装置との間の通信シーケンスの概要を示す図である。 本実施形態に係るエージェント駆動型監視システムにおける監視エージェントの処理フローを示す図である。 本実施形態に関する監視装置の処理フローを示す図である。 本実施形態に関する監視エージェントから監視装置への通知の優先制御を説明する図である。 本実施形態に関する通知のスケジューリング及び監視装置の負荷抑制を説明する図である。
符号の説明
101 優先制御装置
102 監視装置
103 操作端末
104 インターネット
105 ファイアウォール
106 監視対象装置
107 ファイアウォール
108 管理装置
109 監視対象装置
110 CPU110
111 メモリ
112 ハードディスク
113 キーボード
114 ディスプレイ
115 通信インタフェース

Claims (8)

  1. 1つ以上の監視対象装置とネットワークを通して接続された監視装置と、前記監視対象装置自体の監視と前記監視装置との通信を行う監視エージェントを内部配置した監視対象装置と、前記監視対象装置側に設けられたファイアウォールと、を備えたエージェント駆動型監視システムであって、
    前記監視エージェントは、前記監視対象装置における正常動作確認又は異常発生時のアラートのリクエストメッセージを定期的又は不定期的に前記監視装置に通報し、
    前記監視装置は、前記リクエストメッセージに対応してレスポンスメッセージを前記ファイアウォールを通して前記監視エージェントに通報し、
    前記レスポンスメッセージに、前記監視対象装置のログ、性能情報又は管理情報の取得命令、前記監視装置内の更新ファイルの取得要求命令、あるいは、前記監視エージェントの設定変更命令を埋め込むことにより、前記監視装置は前記監視エージェントに指示を通知する
    ことを特徴とするエージェント駆動型監視システム。
  2. 1つ以上の監視対象装置とネットワークを通して接続された監視装置と、前記監視対象装置自体の監視と前記監視装置との通信を行う監視エージェントを内部配置した監視対象装置と、前記監視対象装置側に設けられたファイアウォールと、を備えたエージェント駆動型監視システムであって、
    前記監視エージェントは、前記監視対象装置における正常動作確認又は異常発生時のアラートのリクエストメッセージを定期的又は不定期的に前記監視装置に通報し、
    前記監視装置は、前記リクエストメッセージに対応してレスポンスメッセージを前記ファイアウォールを通して前記監視エージェントに通報し、
    前記レスポンスメッセージに、前記監視対象装置のログ、性能情報又は管理情報の取得命令、前記監視装置内の更新ファイルの取得要求命令、あるいは、前記監視エージェントの設定変更命令を埋め込むことにより、前記監視装置は前記監視エージェントに指示を通知し、
    前記監視エージェントへの指示通知に応じて、前記監視エージェントは、前記ログ、性能情報又は管理情報を取得してこの取得した情報を前記監視装置にアップロードし、前記更新ファイルを前記監視装置に要求し、あるいは、前記監視エージェントの設定変更を行う
    ことを特徴とするエージェント駆動型監視システム。
  3. 請求項1に記載のエージェント駆動型監視システムにおいて、
    前記監視エージェントは、前記リクエストメッセージを通報したとき、前記監視装置からレスポンスメッセージが無い場合、レスポンスメッセージが得られるまで所定回数だけリクエストメッセージを再通報し、
    前記所定回数を超えて前記レスポンスメッセージが得られない場合に電子メールによって通報する
    ことを特徴とするエージェント駆動型監視システム。
  4. 請求項1に記載のエージェント駆動型監視システムにおいて、
    前記監視エージェントが前記監視対象装置からアラートを取得した場合、又は、前記レスポンスメッセージによる指示通知に前記正常動作確認の通報周期が指定されていた場合、前記監視エージェントは、一定期間に亘って、定期的周期よりも短い所定周期で、又は、前記指定周期で前記正常動作確認を通報する
    ことを特徴とするエージェント駆動型監視システム。
  5. 請求項1に記載のエージェント駆動型監視システムにおいて、
    前記レスポンスメッセージによる指示通知に前記正常動作確認の通報の送信時刻が指定されていた場合、前記監視エージェントは、前記指定時刻に前記正常動作確認を通報する
    ことを特徴とするエージェント駆動型監視システム。
  6. 請求項1に記載のエージェント駆動型監視システムにおいて、
    前記監視エージェントからの正常動作確認の通報、前記監視エージェントからのアラートの通報、前記監視対象装置からの取得情報の通報、前記監視装置への前記更新ファイルの要求通報、前記監視装置への前記指定時刻での正常動作確認の通報、前記リクエストメッセージの再通報、のそれぞれに対して、予め優先度を設定しておき、前記優先度に応じて前記通報又は前記再通報をキューに格納し、前記優先度の高いキュー内の通報又は再通報から順に前記監視装置に転送する
    ことを特徴とするエージェント駆動型監視システム。
  7. 請求項1に記載のエージェント駆動型監視システムにおいて、
    前記監視エージェントが前記監視装置へ定期的に正常動作確認の通報を行う場合、前回の正常動作確認の通報に対するレスポンスメッセージを受信してから一定時間後に正常動作確認を実行し前記監視装置へ通報を行うことにより、複数の監視エージェント間での定期的な正常動作確認の通報時刻をずらす
    ことを特徴とするエージェント駆動型監視システム。
  8. 1つ以上の監視対象装置とネットワークを通して接続された監視装置と、前記監視対象装置自体の監視と前記監視装置との通信を行う監視エージェントを内部配置した監視対象装置と、前記監視対象装置側に設けられたファイアウォールと、を備えて、前記監視エージェントを通して前記監視装置が前記監視対象装置を監視する監視方法であって、
    前記監視対象装置における正常動作確認又は異常発生時のアラートのリクエストメッセージを定期的又は不定期的に前記監視エージェントが前記監視装置に通報するステップと、
    前記リクエストメッセージに対応してレスポンスメッセージを前記ファイアウォールを通して前記監視装置が前記監視エージェントに通報するステップと、からなり、
    前記監視対象装置のログ、性能情報又は管理情報の取得命令、前記監視装置内の更新ファイルの取得要求命令、あるいは、前記監視エージェントの設定変更命令を、前記レスポンスメッセージに埋め込むことにより、前記監視装置が前記監視エージェントに指示を通知する
    ことを特徴とするエージェント駆動型監視方法。
JP2003375867A 2003-11-05 2003-11-05 エージェント駆動型監視システム及び方法 Pending JP2005141391A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003375867A JP2005141391A (ja) 2003-11-05 2003-11-05 エージェント駆動型監視システム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003375867A JP2005141391A (ja) 2003-11-05 2003-11-05 エージェント駆動型監視システム及び方法

Publications (1)

Publication Number Publication Date
JP2005141391A true JP2005141391A (ja) 2005-06-02

Family

ID=34687114

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003375867A Pending JP2005141391A (ja) 2003-11-05 2003-11-05 エージェント駆動型監視システム及び方法

Country Status (1)

Country Link
JP (1) JP2005141391A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007334612A (ja) * 2006-06-14 2007-12-27 Canon Inc デバイス管理システム及びその管理装置の制御方法
WO2008087911A1 (ja) * 2007-01-16 2008-07-24 Kabushiki Kaisha Toshiba 遠隔監視・診断システム
JP2009064264A (ja) * 2007-09-06 2009-03-26 Ricoh Co Ltd 機器、機器管理システム及び機器管理方法
JP2009193207A (ja) * 2008-02-13 2009-08-27 Nec Corp 情報採取手順管理システム
JP2010086095A (ja) * 2008-09-30 2010-04-15 Ntt Data Corp 監視サーバ、ネットワーク監視方法
JP2013182508A (ja) * 2012-03-02 2013-09-12 Pfu Ltd 情報処理システム、管理端末装置、情報処理装置、情報処理方法、及びプログラム
JP2014526078A (ja) * 2011-06-27 2014-10-02 ▲華▼▲為▼終端有限公司 デバイス管理方法、装置、およびシステム
JP2017016179A (ja) * 2015-06-26 2017-01-19 セイコーエプソン株式会社 制御装置、ネットワークシステム、及び、制御装置の制御方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007334612A (ja) * 2006-06-14 2007-12-27 Canon Inc デバイス管理システム及びその管理装置の制御方法
WO2008087911A1 (ja) * 2007-01-16 2008-07-24 Kabushiki Kaisha Toshiba 遠隔監視・診断システム
US8255187B2 (en) 2007-01-16 2012-08-28 Kabushiki Kaisha Toshiba Remote monitoring diagnostic system
JP2009064264A (ja) * 2007-09-06 2009-03-26 Ricoh Co Ltd 機器、機器管理システム及び機器管理方法
JP2009193207A (ja) * 2008-02-13 2009-08-27 Nec Corp 情報採取手順管理システム
JP2010086095A (ja) * 2008-09-30 2010-04-15 Ntt Data Corp 監視サーバ、ネットワーク監視方法
JP2014526078A (ja) * 2011-06-27 2014-10-02 ▲華▼▲為▼終端有限公司 デバイス管理方法、装置、およびシステム
JP2013182508A (ja) * 2012-03-02 2013-09-12 Pfu Ltd 情報処理システム、管理端末装置、情報処理装置、情報処理方法、及びプログラム
US9219618B2 (en) 2012-03-02 2015-12-22 Pfu Limited Information processing system, information processing device, management terminal device, and computer readable medium
JP2017016179A (ja) * 2015-06-26 2017-01-19 セイコーエプソン株式会社 制御装置、ネットワークシステム、及び、制御装置の制御方法

Similar Documents

Publication Publication Date Title
CN107547589B (zh) 一种数据采集处理方法以及装置
US20070124458A1 (en) Method and system for event notification on network nodes
US6167448A (en) Management event notification system using event notification messages written using a markup language
US20080155067A1 (en) Apparatus for transferring data via a proxy server and an associated method and computer program product
JP2006221376A (ja) プラント緊急時情報表示システムと方法、Webサーバ
CN103067230A (zh) 一种通过植入监控代码实现对http服务监控的方法
EP2908497B1 (en) Method, device and system for remote management of terminal peripheral
CN104598300A (zh) 分布式业务流程定制方法及系统
JP2006011888A (ja) 遠隔管理システム
JP2005141391A (ja) エージェント駆動型監視システム及び方法
JP2007249829A (ja) 内部ネットワーク間通信システム及び情報処理装置及び中継情報処理装置及び通信制御プログラム及び内部ネットワーク間における通信制御方法及び遠隔障害管理システム及び被管理装置及び管理装置
JP2005165402A (ja) 設備管理装置および遠隔設備管理システム
JP5560641B2 (ja) データ管理装置、データ管理プログラムおよびデータ管理方法
JP2004206634A (ja) 監視方法、稼動監視装置、監視システム及びコンピュータプログラム
JP6665503B2 (ja) データ収集システム、データ収集装置及びデータ収集方法
EP2444754A1 (en) Link server web-based air-conditioning monitoring system
JP2006195554A (ja) 統合監視システム
EP1912187A2 (en) System and method for intelligent data routing in a premises protection network
CN110825505B (zh) 任务调度方法、装置、计算机设备及存储介质
EP1662704B1 (en) Monitoring system, apparatus to be monitored, monitoring apparatus and monitoring method
JP2014041404A (ja) ターミナルサービス監視装置
JP2011095886A (ja) アプリケーションサーバ、アプリケーション障害再現方法、およびアプリケーション障害再現プログラム
JP5378847B2 (ja) 監視装置
CN112000552A (zh) 机床的监控方法、装置、系统、电子设备及存储介质
CN114143065B (zh) 一种安全事件处理方法、装置、设备及介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050621

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080304

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080701