JP2010108382A - 監視プログラム、監視方法および情報処理装置 - Google Patents

監視プログラム、監視方法および情報処理装置 Download PDF

Info

Publication number
JP2010108382A
JP2010108382A JP2008281904A JP2008281904A JP2010108382A JP 2010108382 A JP2010108382 A JP 2010108382A JP 2008281904 A JP2008281904 A JP 2008281904A JP 2008281904 A JP2008281904 A JP 2008281904A JP 2010108382 A JP2010108382 A JP 2010108382A
Authority
JP
Japan
Prior art keywords
message
messages
transmission
control information
control unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008281904A
Other languages
English (en)
Other versions
JP5006302B2 (ja
Inventor
Hiroyuki Okayasu
弘之 岡安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Frontech Ltd filed Critical Fujitsu Frontech Ltd
Priority to JP2008281904A priority Critical patent/JP5006302B2/ja
Publication of JP2010108382A publication Critical patent/JP2010108382A/ja
Application granted granted Critical
Publication of JP5006302B2 publication Critical patent/JP5006302B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】通信不可期間に発生したメッセージを効率的に通知する。
【解決手段】メッセージ取得手段1dは、送信手段1cによるメッセージ送信が不可となると、取得した各メッセージをそれぞれの発生時間と共にメッセージ記憶手段1aに格納する。制御情報記憶手段1bは、コンピュータ1の所定の状態の開始を示す第1のメッセージと、この状態の終了を示す第2のメッセージとを対応付けた制御情報を記憶する。メッセージ制御手段1eは、送信手段1cによるメッセージ送信が可となると、制御情報記憶手段1bに記憶された制御情報に基づき、メッセージ記憶手段1aに記憶された各メッセージに、第1のメッセージと第1のメッセージ以後に発生した第2のメッセージとが含まれていることを検出すると、各メッセージのうち少なくとも検出した第1のメッセージと第2のメッセージとを除くメッセージを送信手段1cに出力する。
【選択図】図1

Description

本発明は、監視プログラム、監視方法および情報処理装置に関し、特に監視により得た状態を示すメッセージを管理装置に送信する監視プログラム、監視方法および情報処理装置に関する。
従来、ネットワークで接続された複数のコンピュータを有するネットワークシステムが利用されている。ネットワークシステムでは、例えば、サービスを提供するサーバとサービスを利用する複数のクライアントとが接続される。
ここで、ネットワークシステムの運用上、コンピュータやネットワーク機器で発生している障害等の状態を集中管理することが求められる。このため、ネットワークシステムでは、コンピュータ等の所定の状態を収集して管理者に通知する監視サーバが設けられる。
監視サーバは、監視対象のコンピュータ等で発生した状態を示すメッセージを、例えばSNMP(Simple Network Management Protocol)を用いて収集することができる。SNMPは、ネットワークで接続されたコンピュータ等を監視・制御するためのプロトコルである。SNMPによる監視では、監視対象とするコンピュータ等(以下、単に監視対象という)にSNMPのエージェントとなるアプリケーションプログラムが導入され、監視サーバ側にSNMPのマネージャとなるアプリケーションプログラムが導入される。
SNMPエージェントは、例えば、コンピュータで生成されるログ情報を監視し、通知が必要なログ情報が生成されると、これを示すメッセージを生成してSNMPマネージャに通知する。SNMPマネージャは、複数の監視対象からのメッセージを集約し、表示装置や電子メール等を介して管理者に通知する。
なお、このようなネットワークシステムの監視方法として、収集したメッセージから対応を要する障害を容易に識別できるようにするため、監視サーバが監視対象から受信したメッセージに応じて管理者への通知の要否や通知内容を管理する方法が知られている(例えば、特許文献1,2参照)。
特開2000−278360号公報 特開2003−015973号公報
しかし、上記特許文献1,2記載の方法では、監視サーバ側で管理者への通知内容等を管理する。このため、ネットワークの規模が大きいと多数の監視対象から送信されるメッセージによってネットワークや監視サーバの負荷が増大するという問題がある。
特に、ネットワークの障害や監視サーバの障害等によって監視対象から監視サーバに対してメッセージを送信できない場合、多数の監視対象で障害時に蓄積された未送信メッセージが、障害復旧時に一斉に送信されることが考えられる。この場合、ネットワークや監視サーバに過大な負荷をかけてしまう可能性がある。
更に、未送信メッセージには、過去の情報が含まれる。このため、監視対象の現時点の状態とは異なったメッセージが送信されることが考えられる。この場合、例えば、現時点では復旧済みのエラーが管理者に通知され無駄な作業が生じる可能性もある。
本発明はこのような点に鑑みてなされたものであり、通信不可期間に発生したメッセージを効率的に通知する監視プログラム、監視方法および情報処理装置を提供することを目的とする。
上記課題を解決するために、管理装置と接続されたコンピュータに、このコンピュータの状態を監視させ、監視により得た状態を示すメッセージを管理装置に送信させる監視プログラムが提供される。この監視プログラムを実行するコンピュータは、メッセージ取得手段、送信手段、メッセージ記憶手段、制御情報記憶手段およびメッセージ制御手段を有する。メッセージ取得手段は、メッセージを順次取得する。送信手段は、メッセージ取得手段が取得したメッセージを順次送信する。メッセージ記憶手段は、送信手段によるメッセージの送信が不可能となると、メッセージ取得手段が順次取得した複数のメッセージを複数のメッセージそれぞれの発生時間と共に記憶する。制御情報記憶手段は、コンピュータの所定の状態の開始を示す第1のメッセージと、所定の状態の終了を示す第2のメッセージとを対応付けた制御情報を記憶する。メッセージ制御手段は、送信手段によるメッセージの送信が可能となると、制御情報記憶手段に記憶された制御情報に基づいて、メッセージ記憶手段に記憶された複数のメッセージに、第1のメッセージとこの第1のメッセージよりも後の時点に発生した第2のメッセージとが含まれていることを検出すると、複数のメッセージのうち少なくとも検出した第1のメッセージと第2のメッセージとを除くメッセージを送信手段に出力する。
このような監視プログラムを実行するコンピュータによれば、送信手段によるメッセージの送信が不可能となると、メッセージ取得手段により順次取得された複数のメッセージが複数のメッセージそれぞれの発生時間と共にメッセージ記憶手段に格納される。そして、送信手段によるメッセージの送信が可能となると、メッセージ制御手段により、制御情報記憶手段に記憶されたコンピュータの所定の状態の開始を示す第1のメッセージと、所定の状態の終了を示す第2のメッセージとを対応付けた制御情報に基づいて、メッセージ記憶手段に記憶された複数のメッセージに、第1のメッセージとこの第1のメッセージよりも後の時点に発生した第2のメッセージとが含まれていることが検出されると、複数のメッセージのうち少なくとも検出された第1のメッセージと第2のメッセージとを除くメッセージが送信手段に出力される。
また、上記課題を解決するために、上記監視プログラムにより実現される処理と同様の処理を行う監視方法が提供される。また、上記課題を解決するために、上記監視プログラムを実行するコンピュータと同様の機能を有する情報処理装置が提供される。
上記監視プログラム、監視方法および情報処理装置によれば、通信不可期間に発生したメッセージを効率的に通知することが可能となる。
以下、本実施の形態を図面を参照して詳細に説明する。
図1は、本実施の形態の概要を示す図である。コンピュータ1は、管理装置2と接続されている。コンピュータ1は、管理装置2にコンピュータ1の所定の状態を示すメッセージを送信する。管理装置2は、コンピュータ1の状態を管理するコンピュータである。コンピュータ1は、メッセージ記憶手段1a、制御情報記憶手段1b、送信手段1c、メッセージ取得手段1dおよびメッセージ制御手段1eを有する。
メッセージ記憶手段1aは、複数のメッセージを記憶する。
制御情報記憶手段1bは、コンピュータの所定の状態の開始を示す第1のメッセージと、所定の状態の終了を示す第2のメッセージとを対応付けた制御情報を記憶する。
送信手段1cは、管理装置2にメッセージを送信する。なお、送信手段1cは、管理装置2へのメッセージ送信を正常に行うことができる場合には、メッセージ取得手段1dから取得するメッセージを管理装置2に送信する。また、送信手段1cは、管理装置2へのメッセージ送信が不可能となり、その後メッセージ送信が可能となった直後には、メッセージ制御手段1eから取得するメッセージを管理装置2に送信する。
メッセージ取得手段1dは、複数のメッセージを取得し、送信手段1cによるメッセージ送信が不可能となると、取得した複数のメッセージをこの複数のメッセージそれぞれの発生時間と共にメッセージ記憶手段1aに格納する。
メッセージ制御手段1eは、送信手段1cによるメッセージ送信が可能となると、制御情報記憶手段1bに記憶された制御情報を取得する。そして、取得した制御情報に基づいて、メッセージ記憶手段1aに記憶された複数のメッセージのうち、第1のメッセージと、この第1のメッセージよりも後の時点に発生した第2のメッセージと、が含まれていると検出すると、複数のメッセージのうち少なくとも検出した第1のメッセージと第2のメッセージとを除くメッセージを送信手段に出力する。
上記コンピュータ1によれば、送信手段1cによるメッセージの送信が不可能となると、メッセージ記憶手段1aに未送信のメッセージが記憶される。そして、送信手段1cによるメッセージの送信が可能となると、メッセージ制御手段1eにより、メッセージ記憶手段1aに記憶された未送信メッセージのうち、制御情報記憶手段1bに記憶された制御情報に基づき、障害時から障害復旧までの期間に発生し、かつ終了した状態を示すメッセージの管理装置2への送信が抑制される。
すなわち、コンピュータ1において発生した過去の状態のうち、既に終了した状態に関しては、管理装置2に通知しないよう制御される。
このため、ネットワーク障害等でメッセージ送信が行えずコンピュータ1に未送信メッセージを蓄積しても、ネットワーク障害復旧後に送信するメッセージの情報量を効率的に削減することができる。これにより、障害復旧直後のネットワークや管理装置2に対する負荷を軽減することができる。
また、例えば、第1のメッセージが所定のエラーの発生を示すメッセージ、第2のメッセージがこのエラーの復旧を示すメッセージとして定義すれば、管理装置2に対して復旧済みのエラーを通知することもなくなる。これにより、管理者に対する無駄な作業の発生を防止することができる。
また、制御情報に関連するメッセージの他のパターンを定義することで、効率的な監視を実現することも可能である。
例えば、メッセージ記憶手段1aに記憶された複数のメッセージに、上記の第2のメッセージ(状態の終了)に対して、第2のメッセージよりも後の時点に発生した第1のメッセージ(状態の開始)が含まれている場合が考えられる。
この場合、メッセージ制御手段1eは、第1のメッセージおよび第2のメッセージのうち、第1のメッセージのみを出力する。これにより、管理者への通知が不要なメッセージの送信を抑制し、送信するメッセージの情報量を効率的に削減することが可能となる。
また、例えば、管理者が特に注目すべき状態に関しては、制御情報に、この状態の開始を示す第3のメッセージと、この状態の終了を示す第4のメッセージとに対応付けて、第5のメッセージを定義することも考えられる。このとき、例えば、第5のメッセージは、第3のメッセージと第4のメッセージとで示される情報を集約したメッセージとなる。
この場合、メッセージ制御手段1eは、メッセージ記憶手段1aに記憶された複数のメッセージのうち、第3のメッセージと、この第3のメッセージよりも後の時点に発生した第4のメッセージと、が含まれていると、これら第3のメッセージと第4のメッセージとに代えて第5のメッセージを出力する。このように、状態の開始と終了とを集約して1つのメッセージで通知することで、管理者に対する状態の識別を容易にし、メッセージの情報量を効率的に削減することができる。
ところで、コンピュータ1は、ネットワークを介して接続された複数のコンピュータやネットワーク機器の状態を監視サーバによって監視するネットワークシステムで用いる場合に適している。以下では、コンピュータ1から送信されるメッセージによりコンピュータ1の状態を監視するネットワークシステムを例に挙げて、更に詳細に説明する。
[第1の実施の形態]
以下、第1の実施の形態を図面を参照して詳細に説明する。
図2は、ネットワークシステムの構成を示す図である。このネットワークシステムでは、ネットワーク10を介してコンピュータ100,200、業務サーバ300および監視サーバ400が接続されている。ネットワーク10は、有線または無線のIP(Internet Protocol)ネットワークである。
コンピュータ100,200は、監視サーバ400により監視される。コンピュータ100,200には、例えば、SNMPエージェントがそれぞれ導入される。各SNMPエージェントは、コンピュータ100,200でOS(Operating System)やアプリケーションプログラム(以下、アプリケーションという)が出力するログやハードウェアが出力する情報を検知して、監視サーバ400への送信が必要なものをメッセージ化して監視サーバ400に送信する。
業務サーバ300は、監視サーバ400により監視される。業務サーバ300にも、コンピュータ100,200と同様に、例えば、SNMPエージェントが導入される。
監視サーバ400は、コンピュータ100,200および業務サーバ300の状態を監視する。監視サーバ400には、例えば、SNMPマネージャが導入され、コンピュータ100,200および業務サーバ300にそれぞれ導入されたSNMPエージェントからのメッセージを受信する。
なお、監視サーバ400には、端末装置40が接続されている。管理者は、端末装置40に出力されるメッセージを閲覧して、コンピュータ100,200および業務サーバ300で発生している障害等の情報を把握し、障害等に対応する。
図3は、コンピュータのハードウェア構成を示すブロック図である。コンピュータ100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス107を介してRAM(Random Access Memory)102、HDD(Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105および通信インタフェース106が接続されている。
RAM102には、CPU101に実行させるOSのプログラムやアプリケーションのプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。
HDD103には、コンピュータ100上のOSやアプリケーションが扱うデータが格納される。
グラフィック処理装置104には、モニタ11が接続されている。グラフィック処理装置104は、CPU101からの命令に従って、画像をモニタ11の画面に表示させる。入力インタフェース105には、キーボード12とマウス13とが接続されている。入力インタフェース105は、キーボード12やマウス13から送られてくる信号を、バス107を介してCPU101に送信する。
通信インタフェース106は、ネットワーク10に接続されている。通信インタフェース106は、ネットワーク10を介して、他のコンピュータや監視サーバ400との間でデータの送受信を行う。
なお、コンピュータ200、業務サーバ300および監視サーバ400もコンピュータ100と同様のハードウェア構成により実現することができる。
図4は、第1の実施の形態のコンピュータの機能構成を示すブロック図である。コンピュータ100は、ログ情報記憶部110、メッセージ記憶部120、制御情報記憶部130、メッセージ生成部140、メッセージ送信部150およびメッセージ制御部160を有する。
ログ情報記憶部110は、コンピュータ100上のOS、アプリケーションおよびハードウェア等が出力するログファイルを記憶する。ログファイルには、OS等で発生する警告やエラー通知等を示す文字列が、その発生時点の時間と共に出力される。ログファイルは、OS、アプリケーションおよびハードウェア毎に存在していてもよい。
メッセージ記憶部120は、メッセージ送信部150がネットワーク10の障害や監視サーバ400の障害(以下、通信障害という)の影響で、監視サーバ400にメッセージを送信できない場合、通信障害期間中にメッセージ生成部140により生成されたメッセージを記憶する。
制御情報記憶部130は、通信障害復旧時にメッセージ記憶部120に記憶されたメッセージを監視サーバ400へ送信する際の制御ルールを定義した制御情報を記憶する。
メッセージ生成部140は、ログ情報記憶部110に記憶されたログファイルを監視して、所定の警告やエラー通知等を示す文字列がログファイルに追加されると、この警告やエラー通知等を監視サーバ400に通知するためのメッセージを生成する。
メッセージ生成部140は、正常運用時(監視サーバ400との通信障害は発生していない時点)では、生成したメッセージをメッセージ送信部150に出力する。また、メッセージ生成部140は、通信障害時には、生成したメッセージをエラー通知等の発生した時間と共にメッセージ記憶部120に格納する。
メッセージ送信部150は、正常運用時には、メッセージ生成部140が生成したメッセージを監視サーバ400に送信する。また、メッセージ送信部150は、通信障害時には、監視サーバ400との通信を確立することが不可となるため、メッセージを送信することができなくなる。メッセージ送信部150は、この状態をメッセージ生成部140に通知する。これにより、メッセージ生成部140は、通信障害を検知する。
また、メッセージ送信部150は、通信障害の復旧直後には、メッセージ制御部160から取得するメッセージを監視サーバ400に送信する。メッセージ送信部150は、通信障害時に、例えば定期的に監視サーバ400との通信の確立を試みる。そして、通信が確立されると通信障害が復旧したことを検知し、これをメッセージ生成部140やメッセージ制御部160に通知する。これにより、メッセージ生成部140やメッセージ制御部160は、通信障害の復旧を検知する。
メッセージ制御部160は、通信障害が復旧したことを検知すると、メッセージ記憶部120に記憶された未送信メッセージを最も古いものから取得する。そして、制御情報記憶部130に記憶された制御情報に基づいて、取得した未送信メッセージから該当の状態に対するメッセージ送信の要否やメッセージの内容を決定する。メッセージ制御部160は、決定した内容に基づいて、メッセージを生成すると、生成したメッセージをメッセージ送信部150に出力する。
図5は、第1の実施の形態の未送信メッセージ管理テーブルのデータ構造例を示す図である。未送信メッセージ管理テーブル121は、メッセージ記憶部120に格納される。未送信メッセージ管理テーブル121には、発生日時を示す項目および未送信メッセージを示す項目が設けられている。各項目の横方向に並べられた情報同士が互いに関連付けられて、1つの未送信メッセージに関する情報を構成する。
発生日時を示す項目には、該当のメッセージに関連するエラー通知等の発生した年月日や時刻が設定される。未送信メッセージを示す項目には、監視サーバ400に対して未送信のメッセージが設定される。
未送信メッセージ管理テーブル121には、例えば、発生日時が“2008/09/01 08:30:25”、未送信メッセージが“データファイル読込エラー発生”という情報が設定される。
なお、未送信メッセージ管理テーブル121には、メッセージ生成部140により生成されたメッセージが順次格納されるため、各未送信メッセージが発生した順に時系列に設定される。
図6は、第1の実施の形態のメッセージ制御テーブルのデータ構造例を示す図である。メッセージ制御テーブル131は、制御情報記憶部130に格納される。メッセージ制御テーブル131には、ルールIDを示す項目、発生メッセージを示す項目、関連メッセージを示す項目および通知メッセージを示す項目が設けられている。各項目の横方向に並べられた情報同士が互いに関連付けられて、1つの制御ルールに関する情報を構成する。
ルールIDを示す項目には、ルールIDが設定される。発生メッセージを示す項目には、メッセージ記憶部120に記憶されたある時点に発生するメッセージが設定される。関連メッセージを示す項目には、発生メッセージの発生した時点よりも後の時点に発生し、発生メッセージと関連のあるメッセージが設定される。ここで、発生メッセージと関連メッセージとの関連とは、例えば、ある状態の開始と終了との関連付けを示す。通知メッセージを示す項目には、発生メッセージと関連メッセージとに基づいて、監視サーバ400に送信するための通知メッセージの情報が設定される。
メッセージ制御テーブル131には、例えば、ルールIDが“1”、発生メッセージが“システムエラー発生”、関連メッセージが“システムエラー復旧”、通知メッセージが“−(なし)”という情報が設定される。これは、通信障害時に“システムエラー発生”、“システムエラー復旧”の順にメッセージが発生していた場合、これらメッセージの送信を行わないことを示している。
また、ルールIDが“4”、発生メッセージが“データファイル読込エラー復旧”、関連メッセージが“データファイル読込エラー発生”、通知メッセージが“データファイル読込エラー発生”という情報が設定される。これは、通信障害時に“データファイル読込エラー復旧”、“データファイル読込エラー発生”の順にメッセージが発生していた場合、“データファイル読込エラー復旧”は送信せず、“データファイル読込エラー発生”のみを送信することを示している。
また、ルールIDが“11”、発生メッセージが“入金業務エラー発生”、関連メッセージが“入金業務エラー復旧”、通知メッセージが“入金業務エラー発生=>復旧(YYYY/MM/DD HH:MM:SS発生、YYYY/MM/DD HH:MM:SS復旧)”という情報が設定される。これは、通信障害時に“入金業務エラー発生”、“入金業務エラー復旧”の順にメッセージが発生していた場合、これらのメッセージを集約して、発生の時間および復旧の時間をまとめた1つのメッセージとして送信することを示している。なお、“YYYY/MM/DD HH:MM:SS”の箇所には、未送信メッセージ管理テーブル121における該当のメッセージの発生日時が設定される。
また、ルールIDが“12”、発生メッセージが“入金業務エラー発生”、関連メッセージが“−(なし)”、通知メッセージが“入金業務エラー発生(YYYY/MM/DD HH:MM:SSから継続中)”という情報が設定される。これは、通信障害時に“入金業務エラー発生”が発生しており、その後に関連するメッセージが存在しない場合には、“入金業務エラー”の状態を開始時点の時間の情報を追加して、詳しく説明したメッセージを送信することを示している。
更に、ルールIDが“50”、発生メッセージが“(未登録メッセージ)”、関連メッセージが“−(なし)”、通信メッセージが“(未登録メッセージ)”という情報が設定される。これは、通信障害時にメッセージ制御テーブル131に登録されていないメッセージが発生している場合には、該当のメッセージをそのまま送信することを示している。
なお、メッセージ制御テーブル131では、未登録メッセージをそのまま送信することとしたが、未登録メッセージに関しては、送信を行わない旨の定義を行うことも考えられる。
次に、以上のような構成を備えるコンピュータ100において実行される処理の詳細を説明する。
図7は、第1の実施の形態の通信復旧時処理の手順を示すフローチャートである。以下、図7に示す処理をステップ番号に沿って説明する。
[ステップS11]メッセージ制御部160は、通信障害が復旧したことを検知する。
[ステップS12]メッセージ制御部160は、メッセージ記憶部120に記憶された未送信メッセージ管理テーブル121を取得する。
[ステップS13]メッセージ制御部160は、未送信メッセージ管理テーブル121に通信障害期間中に発生したメッセージが存在するか否かを判定する。存在する場合、処理がステップS14に移される。存在しない場合、処理が完了する。
[ステップS14]メッセージ制御部160は、未送信メッセージ管理テーブル121に存在する未送信メッセージを、制御情報記憶部130に記憶されたメッセージ制御テーブル131に基づいて編集し、メッセージ送信部150に出力する。そして、メッセージ送信部150がメッセージ制御部160から取得するメッセージを監視サーバ400に送信して、処理が完了する。
このように、メッセージ制御部160は、通信障害が復旧すると、メッセージ記憶部120に記憶された未送信メッセージ管理テーブル121を参照して、通信障害期間中に発生したメッセージの有無を判定する。
そして、通信障害期間中に発生したメッセージが存在すると、制御情報記憶部130に記憶されたメッセージ制御テーブル131に基づいて、発生したメッセージの送信要否や内容を決定する。
以下では、上記ステップS14で示したメッセージ制御部160の処理を詳細に説明する。
図8は、第1の実施の形態のメッセージ送信処理の手順を示すフローチャートである。以下、図8に示す処理をステップ番号に沿って説明する。なお、以下の処理は、図7におけるステップS14の処理を詳細に示したものである。
[ステップS101]メッセージ制御部160は、未送信メッセージ管理テーブル121に含まれるメッセージのうちの1つを抽出する。このとき、メッセージ制御部160は、抽出対象となっている未送信メッセージのうち、最も古いメッセージを抽出する。
[ステップS102]メッセージ制御部160は、制御情報記憶部130に記憶されたメッセージ制御テーブル131を取得する。
[ステップS103]メッセージ制御部160は、上記ステップS101で抽出したメッセージがメッセージ制御テーブル131に発生メッセージとして含まれるか否か、すなわち、抽出したメッセージが編集の対象となっているか否かを判定する。編集対象である場合、処理がステップS104に移される。編集対象でない場合、処理がステップS109に移される。
[ステップS104]メッセージ制御部160は、メッセージ制御テーブル131から、該当する発生メッセージに対応する関連メッセージを取得する。そして、この関連メッセージを未送信メッセージ管理テーブル121の最も古いメッセージから新しいメッセージへと順に検索する。
[ステップS105]メッセージ制御部160は、上記ステップS104の検索の結果、発生メッセージの発生時点よりも後の時点で関連メッセージが存在しているか否かを判定する。存在している場合、処理がステップS106に移される。存在していない場合、処理がステップS108に移される。
[ステップS106]メッセージ制御部160は、メッセージ制御テーブル131において、該当の発生メッセージと関連メッセージ(関連メッセージなしの場合を含む)とに対応付けられた通知メッセージが設定されているか否かを判定する。設定されている場合、処理がステップS107に移される。設定されていない場合、処理がステップS111に移される。
[ステップS107]メッセージ制御部160は、メッセージ制御テーブル131に設定されている通知メッセージの内容に基づいて送信メッセージを生成し、メッセージ送信部150に出力する。
[ステップS108]メッセージ制御部160は、メッセージ制御テーブル131において、該当の発生メッセージに対する関連メッセージが存在しない場合にも通知メッセージが設定されているか否か、すなわち、関連メッセージが存在しない場合にも編集対象であるか否かを判定する。編集対象である場合、処理がステップS106に移される。編集対象でない場合、処理がステップS109に移される。なお、この判定は、例えば、メッセージ制御テーブル131に設定されたルールID“12,15”の内容に基づくものである。
[ステップS109]メッセージ制御部160は、発生メッセージと同一の送信メッセージを生成し、メッセージ送信部150に出力する。
[ステップS110]メッセージ送信部150は、メッセージ制御部160から取得するメッセージを監視サーバ400に送信する。
[ステップS111]メッセージ制御部160は、上記ステップS101で抽出した発生メッセージおよび上記ステップS104の検索で最初に検出した関連メッセージを未送信メッセージ管理テーブル121から削除し、抽出対象から除外する。なお、発生メッセージに対する関連メッセージが存在していない場合には、抽出した発生メッセージのみを削除する。
[ステップS112]メッセージ制御部160は、未送信メッセージ管理テーブル121に含まれる未抽出の未送信メッセージが存在するか否かを判定する。存在する場合、処理がステップS101に移される。存在しない場合、処理が完了する。
このようにして、メッセージ制御部160は、メッセージ制御テーブル131に基づいて、未送信メッセージの送信方法を制御する。
メッセージ制御テーブル131には、エラーが発生し、その後復旧したものに関してはメッセージを送信しない、または、管理者が注目すべきエラーに関しては、発生および復旧を詳細な時間情報を含む1つのメッセージに集約して送信する旨の制御ルールが設定される。
これにより、管理者に対して無駄なメッセージを送信し、無駄な作業が発生することを防止することができる。また、無駄なメッセージの送信が抑制されるため、通信復旧時におけるネットワーク10や監視サーバ400の負荷を軽減することができる。この効果は、監視サーバ400の監視対象が多数存在するほど顕著となる。
図9は、第1の実施の形態の送信メッセージの具体例を示す図である。未送信メッセージ管理テーブル121には、通信障害によって未送信となっているメッセージ121a,121b,・・・,121lが設定されている。
メッセージ制御部160は、制御情報記憶部130に記憶されたメッセージ制御テーブル131に基づいて、未送信メッセージ管理テーブル121に設定されたメッセージ121a,121b,・・・,121lの送信方法を制御する。そして、送信メッセージ群511に含まれるメッセージ511a,511b,・・・,511eを生成する。
具体的には、メッセージ制御部160は、メッセージ制御テーブル131に基づいて、以下の処理を行う。以下、ルールIDは、メッセージ制御テーブル131のルールIDを示す項目に対応するものとする。
(1)メッセージ121aはルールID“50”に基づいて、メッセージ511aとして出力される。
(2)メッセージ121bとメッセージ121dとに関しては、ルールID“3”に基づいて、これらに関するメッセージは出力されない。
(3)メッセージ121cとメッセージ121eとに関しては、ルールID“1”に基づいて、これらに関するメッセージは出力されない。
(4)メッセージ121fはルールID“1”に定義される関連メッセージが存在しないので、メッセージ511bとして出力される。
(5)メッセージ121gとメッセージ121kとは、ルールID“11”に基づいて、メッセージ511cとして出力される。
(6)メッセージ121hとメッセージ121iとに関しては、ルールID“3”に基づいて、これらに関するメッセージは出力されない。
(7)メッセージ121jはルールID“15”に基づいて、メッセージ511dとして出力される。
(8)メッセージ121lはルールID“50”に基づいて、メッセージ511eとして出力される。
なお、メッセージ編集のないメッセージ511a,511b,511eに関しては、未送信メッセージ管理テーブル121の発生日時と共に送信される。また、メッセージ511c,511dに関しては、メッセージ制御部160による各メッセージの生成日時と共に送信される。
このように、コンピュータ100では、通信障害時に発生したシステムエラーメッセージのうち、既に復旧したシステムエラーに関しては、監視サーバ400に送信しないよう制御される。
これにより、通信障害復旧時にコンピュータ100に蓄積された未送信メッセージの送信に際して、送信するメッセージの情報量を効率的に削減することができる。そして、復旧済みのエラーを管理者に通知することもなくなるので、管理者に対する無駄な作業の発生を防止することができる。また、コンピュータ200や業務サーバ300等、他の監視対象でもこのような制御を行うことで、通信障害復旧直後のメッセージ送信によるネットワーク10や監視サーバ400の負荷を軽減することができる。
また、コンピュータ100では、通信障害時に発生したメッセージのうち、管理者が特に注目すべきエラーに関しては、情報の集約や詳細化を行って送信するよう制御する。
例えば、入金業務エラー発生、入金業務エラー復旧の順となっているものは、これらの情報を集約した1つのメッセージとして送信するよう制御される。これにより、管理者によるエラーの識別を容易にすると共に、メッセージの情報量を効率的に削減することができる。
また、例えば、出金業務エラー発生後、出金業務エラー復旧のメッセージが存在しない場合には、出金業務エラーの継続状態を詳細に説明するメッセージに編集して送信する。これにより、管理者によるエラーの識別を容易にすることができる。
[第2の実施の形態]
次に、第2の実施の形態を図面を参照して詳細に説明する。前述の第1の実施の形態との相違点を中心に説明し、同様の事項については説明を省略する。
第2の実施の形態では、未送信メッセージの送信方法に所定のオプションを選択可能とし、送信方法の制御処理の高速化および送信するメッセージに優先度を付加できるようにする点が第1の実施の形態と異なる。
以下では、このためのコンピュータの構成を詳細に説明する。
なお、第2の実施の形態のネットワークシステムは、図2に示した第1の実施の形態のコンピュータシステムの構成と同一であるため説明を省略する。
また、第2の実施の形態のコンピュータのハードウェア構成は、図3に示した第1の実施の形態のコンピュータ100のハードウェア構成と同一であるため説明を省略する。
図10は、第2の実施の形態のコンピュータの機能構成を示すブロック図である。コンピュータ100aは、ログ情報記憶部110、メッセージ記憶部120a、制御情報記憶部130a、メッセージ生成部140、メッセージ送信部150およびメッセージ制御部160aを有する。
ここで、ログ情報記憶部110、メッセージ生成部140およびメッセージ送信部150に関しては、図4に示した第1の実施の形態のコンピュータ100の機能構成において、同一の符号を付して説明した構成と同一であるため説明を省略する。
メッセージ記憶部120aは、メッセージ送信部150が通信障害の影響で監視サーバ400にメッセージを送信できない場合、メッセージ生成部140により通信障害期間に生成されたメッセージを記憶する。このため、メッセージ記憶部120aには、図5に示す未送信メッセージ管理テーブル121と同一のテーブルが格納される。また、メッセージ記憶部120aは、メッセージ制御部160aが生成した送信メッセージを一時的に記憶する。
制御情報記憶部130aは、通信障害復旧時にメッセージ記憶部120aに記憶されたメッセージを送信する際の制御ルールを定義した制御情報を記憶する。この制御情報は、図6に示すメッセージ制御テーブル131と同一である。また、制御情報記憶部130aは、メッセージ制御部160aによる処理効率の向上や通信方法を制御するために利用可能なオプション設定情報を記憶する。
メッセージ制御部160aは、通信障害が復旧したことを検知すると、メッセージ記憶部120aに記憶された制御情報に基づいて、取得した未送信メッセージから該当の状態に対するメッセージ送信の要否やメッセージの内容を決定する。このとき、メッセージ制御部160aは、制御情報記憶部130aに記憶されたオプション設定情報に基づいて、利用を指示されたオプションに従った処理を行う。メッセージ制御部160aは、オプションに従った処理により生成した送信メッセージをメッセージ送信部150に出力する。
図11は、第2の実施の形態のオプション設定テーブルのデータ構造例を示す図である。オプション設定テーブル132は、制御情報記憶部130aに記憶される。オプション設定テーブル132には、オプションを示す項目、内容を示す項目、条件を示す項目および利用を示す項目が設けられている。各項目の横方向に並べられた情報同士が互いに関連付けられて、1つのオプションに関する情報を構成する。
オプションを示す項目には、管理者がメッセージ制御部160に対してオプションの利用を指示するための文字列が設定される。内容を示す項目には、該当のオプションにより実現される具体的な制御の内容が設定される。条件を示す項目には、該当の制御を行うための条件が設定される。利用を示す項目には、該当のオプションの利用が指示されているか否かを示す情報が設定される。
オプション設定テーブル132には、例えば、オプションが“−H”、内容が“高速化制御”、条件が“−(なし)”、利用が“○”という情報が設定される。これは、メッセージ制御部160の処理の実行の際に、“−H”オプションが入力されていると、このオプションにより、メッセージ制御部160の処理を高速化することを示している。そして、利用の“○”は、メッセージ制御部160の処理の実行の際に、“−H”オプションの利用が選択されていることを示している。
また、オプション設定テーブル132には、例えば、オプションが“−S”、内容が“通知順序制御”、条件が““発生”を含み“復旧”を含まないメッセージを優先”、利用が“×”という情報が設定される。これは、メッセージ制御部160の処理の実行の際に、“−S”オプションが入力されていると、このオプションにより、メッセージ制御部160がメッセージ送信部150に出力するメッセージの順序を制御することを示している。このとき、メッセージ制御部160は、条件に設定された内容に基づいて、出力するメッセージの順序を決定する。そして、利用の“×”は、メッセージ制御部160の処理の実行の際に“−S”オプションの利用が選択されていないことを示している。
なお、“−H,−S”オプションの利用の選択は、例えば、メッセージ制御部160に入力する実行コマンドに含めることで行うことができる。また、メッセージ制御テーブル131にこれらオプションの利用可否を設定するカラムを新たに設けて入力するようにしてもよい。このようにしてオプションの利用入力がなされると、オプション設定テーブル132の該当のオプションの利用を示す項目に“○”が設定される。
また、オプション設定テーブル132の利用を示す項目を直接操作して設定することもできる。
更に、“−H,−S”オプションは、両方を同時に利用してもよいし、片方のみを利用してもよい。
次に、以上のような構成を備えるコンピュータ100aにおいて実行される処理の詳細を説明する。
図12は、第2の実施の形態の通信復旧時処理の手順を示すフローチャートである。以下、図12に示す処理をステップ番号に沿って説明する。
[ステップS21]メッセージ制御部160aは、通信障害が復旧したことを検知する。
[ステップS22]メッセージ制御部160aは、メッセージ記憶部120aに記憶された未送信メッセージ管理テーブル121を取得する。
[ステップS23]メッセージ制御部160aは、未送信メッセージ管理テーブル121に通信障害期間中に発生したメッセージが存在するか否かを判定する。存在する場合、処理がステップS24に移される。存在しない場合、処理が完了する。
[ステップS24]メッセージ制御部160aは、制御情報記憶部130aに記憶されたオプション設定テーブル132を取得する。
[ステップS25]メッセージ制御部160aは、オプションの利用が指示されているか否かを判定する。“−H”オプションを利用し、“−S”オプションを利用しない場合、処理がステップS26に移される。“−H”オプションを利用せず、“−S”オプションを利用する場合、処理がステップS27に移される。“−H,−S”オプションの両方を利用する場合、処理がステップS28に移される。“−H,−S”オプションの両方を利用しない場合、処理がステップS29に移される。
[ステップS26]メッセージ制御部160aは、“−H”オプションを利用したメッセージ送信制御を実行し、これにより生成したメッセージをメッセージ送信部150に出力する。
[ステップS27]メッセージ制御部160aは、“−S”オプションを利用したメッセージ送信制御を実行し、これにより生成したメッセージをメッセージ送信部150に出力する。
[ステップS28]メッセージ制御部160aは、“−H,−S”オプションを利用したメッセージ送信制御を実行し、これにより生成したメッセージをメッセージ送信部150に出力する。
[ステップS29]メッセージ制御部160aは、オプションを利用しないメッセージ送信制御を実行し、これにより生成したメッセージをメッセージ送信部150に出力する。
上記ステップS26〜ステップS29のいずれの場合も、メッセージ送信部150がメッセージ制御部160aから取得するメッセージを監視サーバ400に送信して、処理が完了する。
以下、上記ステップS26〜ステップS28の処理を詳細に説明する。なお、上記ステップS29の処理は、図8に示した第1の実施の形態メッセージ送信処理の手順と同一であるため説明を省略する。
まず、“−H”オプションを利用する場合のメッセージ送信処理に関して説明する。
図13は、第2の実施の形態の“−H”オプションを利用したメッセージ送信処理の手順を示すフローチャートである。以下、図13に示す処理をステップ番号に沿って説明する。なお、以下の処理は、図12におけるステップS26の処理を詳細に示したものである。
[ステップS121]メッセージ制御部160aは、未送信メッセージ管理テーブル121に含まれるメッセージのうちの1つを抽出する。このとき、メッセージ制御部160aは、抽出対象となっている未送信メッセージのうち、最も古いメッセージを抽出する。
[ステップS122]メッセージ制御部160aは、制御情報記憶部130aに記憶されたメッセージ制御テーブル131を取得する。
[ステップS123]メッセージ制御部160aは、上記ステップS121で抽出したメッセージがメッセージ制御テーブル131に発生メッセージとして含まれるか否か、すなわち、抽出したメッセージが編集の対象となっているか否かを判定する。編集対象である場合、処理がステップS124に移される。編集対象でない場合、処理がステップS131に移される。
[ステップS124]メッセージ制御部160aは、メッセージ制御テーブル131から、該当する発生メッセージに対応する関連メッセージを取得する。そして、この関連メッセージを未送信メッセージ管理テーブル121の最も新しいメッセージから古いメッセージへと順に検索する。
[ステップS125]メッセージ制御部160aは、上記ステップS124の検索の結果、発生メッセージの発生時点よりも後の時点で関連メッセージが存在しているか否かを判定する。存在している場合、処理がステップS126に移される。存在していない場合、処理がステップS130に移される。
[ステップS126]メッセージ制御部160aは、メッセージ制御テーブル131において、該当の発生メッセージと関連メッセージ(関連メッセージなしの場合を含む)とに対応付けられた通知メッセージが設定されているか否かを判定する。設定されている場合、処理がステップS127に移される。設定されていない場合、処理がステップS129に移される。
[ステップS127]メッセージ制御部160aは、メッセージ制御テーブル131に設定されている通知メッセージの内容に基づいて送信メッセージを生成し、メッセージ送信部150に出力する。
[ステップS128]メッセージ送信部150は、メッセージ制御部160aから取得する送信メッセージを監視サーバ400に送信する。
[ステップS129]メッセージ制御部160aは、上記ステップS121で抽出した発生メッセージおよび上記ステップS124で検索した関連メッセージと同一の未送信メッセージを未送信メッセージ管理テーブル121から全て削除し、抽出対象から除外する。なお、発生メッセージに対する関連メッセージが存在していない場合には、抽出した発生メッセージと同一の未送信メッセージを全て削除する。
[ステップS130]メッセージ制御部160aは、メッセージ制御テーブル131において、該当の発生メッセージに対する関連メッセージが存在しない場合にも通知メッセージが設定されているか否か、すなわち、関連メッセージが存在しない場合にも編集対象であるか否かを判定する。編集対象である場合、処理がステップS126に移される。編集対象でない場合、処理がステップS131に移される。
[ステップS131]メッセージ制御部160は、上記ステップS121で抽出した発生メッセージと同一の送信メッセージを生成し、メッセージ送信部150に出力する。
[ステップS132]メッセージ送信部150は、メッセージ制御部160aから取得するメッセージを監視サーバ400に送信する。
[ステップS133]メッセージ制御部160aは、上記ステップS121で抽出した発生メッセージを未送信メッセージ管理テーブル121から削除し、抽出対象から除外する。
[ステップS134]メッセージ制御部160aは、未送信メッセージ管理テーブル121に含まれる未抽出の未送信メッセージが存在するか否かを判定する。存在する場合、処理がステップS121に移される。存在しない場合、処理が完了する。
このように、メッセージ制御部160aは、“−H”オプションを利用する場合、未送信メッセージ管理テーブル121から抽出した発生メッセージに対し、未送信メッセージ管理テーブル121の最新の時点から順に関連メッセージを検索する。そして、関連メッセージが存在する場合、抽出した発生メッセージと関連メッセージとの間の同一内容の未送信メッセージを全て削除する。
例えば、通信障害期間に発生した最初の“エラーA発生”と最後の“エラーA復旧”とのみを未送信メッセージ管理テーブル121から抽出する。そして、これらメッセージの発生時間の間に含まれる“エラーA発生”と“エラーA復旧”とを示す未送信メッセージを全て未送信メッセージ管理テーブル121から削除し、メッセージ送信処理を省略する。
次に、“−S”オプションを利用する場合のメッセージ送信処理に関して説明する。
図14は、第2の実施の形態の“−S”オプションを利用したメッセージ送信処理の手順を示すフローチャートである。以下、図14に示す処理をステップ番号に沿って説明する。なお、以下の処理は、図12におけるステップS27の処理を詳細に示したものである。
[ステップS141]メッセージ制御部160aは、未送信メッセージ管理テーブル121に含まれるメッセージのうちの1つを抽出する。このとき、メッセージ制御部160aは、抽出対象となっている未送信メッセージのうち、最も古いメッセージを抽出する。
[ステップS142]メッセージ制御部160aは、制御情報記憶部130aに記憶されたメッセージ制御テーブル131を取得する。
[ステップS143]メッセージ制御部160aは、上記ステップS141で抽出したメッセージがメッセージ制御テーブル131に発生メッセージとして含まれるか否か、すなわち、抽出したメッセージが編集の対象となっているか否かを判定する。編集対象である場合、処理がステップS144に移される。編集対象でない場合、処理がステップS149に移される。
[ステップS144]メッセージ制御部160aは、メッセージ制御テーブル131から、該当する発生メッセージに対応する関連メッセージを取得する。そして、この関連メッセージを未送信メッセージ管理テーブル121で最も古いメッセージから新しいメッセージへと順に検索する。
[ステップS145]メッセージ制御部160aは、上記ステップS144の検索の結果、発生メッセージの発生時点よりも後の時点で関連メッセージが存在しているか否かを判定する。存在している場合、処理がステップS146に移される。存在していない場合、処理がステップS148に移される。
[ステップS146]メッセージ制御部160aは、メッセージ制御テーブル131において、該当の発生メッセージと関連メッセージ(関連メッセージなしの場合を含む)とに対応付けられた通知メッセージが設定されているか否かを判定する。設定されている場合、処理がステップS147に移される。設定されていない場合、処理がステップS151に移される。
[ステップS147]メッセージ制御部160aは、メッセージ制御テーブル131に設定されている通知メッセージの内容に基づいて送信メッセージを生成する。
[ステップS148]メッセージ制御部160aは、メッセージ制御テーブル131において、該当の発生メッセージに対する関連メッセージが存在しない場合にも通知メッセージが設定されているか否か、すなわち、関連メッセージが存在しない場合にも編集対象であるか否かを判定する。編集対象である場合、処理がステップS146に移される。編集対象でない場合、処理がステップS149に移される。
[ステップS149]メッセージ制御部160aは、上記ステップS141で抽出した発生メッセージと同一の送信メッセージを生成する。
[ステップS150]メッセージ制御部160aは、生成した送信メッセージをメッセージ記憶部120aに送信候補メッセージとして格納する。
[ステップS151]メッセージ制御部160aは、上記ステップS141で抽出した発生メッセージおよび上記ステップS145の検索で最初に検出した関連メッセージを未送信メッセージ管理テーブル121から削除し、抽出対象から除外する。なお、発生メッセージに対する関連メッセージが存在していない場合には、抽出した発生メッセージのみを削除する。
[ステップS152]メッセージ制御部160aは、未送信メッセージ管理テーブル121に含まれる未抽出の未送信メッセージが存在するか否かを判定する。存在する場合、処理がステップS141に移される。存在しない場合、処理がステップS153に移される。
[ステップS153]メッセージ制御部160aは、メッセージ記憶部120aに記憶された送信候補メッセージを、制御情報記憶部130aに記憶された“−S”オプションの条件に基づく優先順にメッセージ送信部150に出力する。メッセージ送信部150は、メッセージ制御部160aから取得する送信メッセージを監視サーバ400に送信して、処理が完了する。
このように、メッセージ制御部160aは、“−S”オプションを利用する場合、生成した送信メッセージをメッセージ記憶部120aに保持する。そして、制御情報記憶部130aに記憶されたオプション設定テーブル132に設定された“−S”オプションの条件に従って、メッセージ送信部150への出力順序を制御する。
次に、“−H,−S”オプションを両方利用する場合のメッセージ送信処理に関して説明する。
図15は、第2の実施の形態の“−H,−S”オプションを利用したメッセージ送信処理の手順を示すフローチャートである。以下、図15に示す処理をステップ番号に沿って説明する。なお、以下の処理は、図12におけるステップS28の処理を詳細に示したものである。
[ステップS161]メッセージ制御部160aは、未送信メッセージ管理テーブル121に含まれるメッセージのうちの1つを抽出する。このとき、メッセージ制御部160aは、抽出対象となっている未送信メッセージのうち、最も古いメッセージを抽出する。
[ステップS162]メッセージ制御部160aは、制御情報記憶部130aに記憶されたメッセージ制御テーブル131を取得する。
[ステップS163]メッセージ制御部160aは、上記ステップS161で抽出したメッセージがメッセージ制御テーブル131に発生メッセージとして含まれるか否か、すなわち、抽出したメッセージが編集の対象となっているか否かを判定する。編集対象である場合、処理がステップS164に移される。編集対象でない場合、処理がステップS171に移される。
[ステップS164]メッセージ制御部160aは、メッセージ制御テーブル131から、該当する発生メッセージに対応する関連メッセージを取得する。そして、この関連メッセージを未送信メッセージ管理テーブル121の最も新しいメッセージから古いメッセージへと順に検索する。
[ステップS165]メッセージ制御部160aは、上記ステップS164の検索の結果、発生メッセージの発生時点よりも後の時点で関連メッセージが存在しているか否かを判定する。存在している場合、処理がステップS166に移される。存在していない場合、処理がステップS170に移される。
[ステップS166]メッセージ制御部160aは、メッセージ制御テーブル131において、該当の発生メッセージと関連メッセージ(関連メッセージなしの場合を含む)とに対応付けられた通知メッセージが設定されているか否かを判定する。設定されている場合、処理がステップS167に移される。設定されていない場合、処理がステップS169に移される。
[ステップS167]メッセージ制御部160aは、メッセージ制御テーブル131に設定されている通知メッセージの内容に基づいて送信メッセージを生成する。
[ステップS168]メッセージ制御部160aは、生成した送信メッセージをメッセージ記憶部120aに送信候補メッセージとして格納する。
[ステップS169]メッセージ制御部160aは、上記ステップS161で抽出した発生メッセージおよび上記ステップS164で検索した関連メッセージと同一の未送信メッセージを未送信メッセージ管理テーブル121から全て削除し、抽出対象から除外する。なお、発生メッセージに対する関連メッセージが存在していない場合には、抽出した発生メッセージと同一の未送信メッセージを全て削除する。
[ステップS170]メッセージ制御部160aは、メッセージ制御テーブル131において、該当の発生メッセージに対する関連メッセージが存在しない場合にも通知メッセージが設定されているか否か、すなわち、関連メッセージが存在しない場合にも編集対象であるか否かを判定する。編集対象である場合、処理がステップS166に移される。編集対象でない場合、処理がステップS171に移される。
[ステップS171]メッセージ制御部160aは、上記ステップS161で抽出した発生メッセージと同一の送信メッセージを生成する。
[ステップS172]メッセージ制御部160aは、生成した送信メッセージをメッセージ記憶部120aに送信候補メッセージとして格納する。
[ステップS173]メッセージ制御部160aは、上記ステップS161で抽出した発生メッセージを未送信メッセージ管理テーブル121から削除し、抽出対象から除外する。
[ステップS174]メッセージ制御部160aは、未送信メッセージ管理テーブル121に含まれる未抽出の未送信メッセージが存在するか否かを判定する。存在する場合、処理がステップS161に移される。存在しない場合、処理がステップS175に移される。
[ステップS175]メッセージ制御部160aは、メッセージ記憶部120aに記憶された送信候補メッセージを、制御情報記憶部130aに記憶された“−S”オプションの条件に基づいて優先順にメッセージ送信部150に出力する。メッセージ送信部150は、メッセージ制御部160aから取得する送信メッセージを監視サーバ400に送信して、処理が完了する。
このように、メッセージ制御部160aは、“−H,−S”の両方のオプションを利用して処理を実行することも可能である。
図16は、第2の実施の形態の送信メッセージの第1の具体例を示す図である。ここでは、メッセージ制御部160aが“−H”オプションによる処理の高速化制御を行う場合を示す。未送信メッセージ管理テーブル122は、メッセージ記憶部120aに記憶される未送信メッセージ管理テーブル121の他の例を示すものである。未送信メッセージ管理テーブル122には、通信障害によって未送信となっているメッセージ122a,122b,・・・,122lが設定されている。
メッセージ制御部160aは、制御情報記憶部130aに記憶されたメッセージ制御テーブル131およびオプション設定テーブル132に基づいて、未送信メッセージ管理テーブル122に設定されたメッセージ122a,122b,・・・,122lの送信方法を制御する。そして、送信メッセージ群512のメッセージ512a,512b,512c,512dを生成する。
具体的には、メッセージ制御部160aは、メッセージ制御テーブル131およびオプション設定テーブル132に基づいて、以下の処理を行う。以下、ルールIDは、メッセージ制御テーブル131のルールIDを示す項目に対応するものとする。
(1)メッセージ122aはルールID“50”に基づいて、メッセージ512aとして出力される。
(2)メッセージ122bに対して、メッセージ122kが検索される。そして、メッセージ122bとメッセージ122kとに関して、ルールID“3”に基づき、これらに関するメッセージは出力されない。
(3)メッセージ122d〜122h,122jは、“−H”オプションに基づいて、削除され、送信処理の対象から除外される。
(4)メッセージ122cは、ルールID“1”に定義される関連メッセージが存在しないので、メッセージ512bとして出力される。
(5)メッセージ122iは、ルールID“12”に基づいて、メッセージ512cとして出力される。
(6)メッセージ122lはルールID“50”に基づいて、メッセージ512dとして出力される。
なお、メッセージ編集のないメッセージ512a,512b,511dに関しては、未送信メッセージ管理テーブル122の発生日時と共に送信される。また、メッセージ511cに関しては、メッセージ制御部160aによるメッセージ511cの生成日時と共に送信される。
このように、メッセージ制御部160aは、“−H”オプションにより、未送信メッセージ管理テーブル122から抽出した発生メッセージに対し、未送信メッセージ管理テーブル122の最新の時点から順に関連メッセージを検索する。そして、関連メッセージが存在する場合、抽出した発生メッセージと関連メッセージとの間の同一内容の未送信メッセージを全て送信処理の対象から除外する。
これにより、第1の実施の形態の効果に加えて、メッセージ送信処理に係るコンピュータ100aの負荷を軽減することができる。また、メッセージ送信処理を高速に行うことができる。
図17は、第2の実施の形態の送信メッセージの第2の具体例を示す図である。ここでは、メッセージ制御部160aが“−S”オプションによる送信メッセージの通知順序制御を行う場合を示す。
メッセージ制御部160aは、生成したメッセージを送信候補メッセージ群513としてメッセージ記憶部120aに一時的に格納する。送信候補メッセージ群513には、メッセージ513a,513b,・・・,513eが含まれる。ここで、メッセージ編集のないメッセージ513aは、未送信メッセージ管理テーブルで管理される発生日時と共に送信される。また、メッセージ513b,513c,513d,513eに関しては、メッセージ制御部160aによる各メッセージの生成日時と共に送信される。
そして、メッセージ制御部160aは、制御情報記憶部130aに記憶されたオプション設定テーブル132の“−S”オプションに設定された条件に基づいて、送信メッセージ群514を生成する。なお、送信メッセージ群514は、図中上側に示したメッセージから順に監視サーバ400への送信が行われる。
メッセージ制御部160aは、例えば、““発生”を含み“復旧”を含まないメッセージを優先”という条件により、送信候補メッセージ群513のメッセージ513a,513b,・・・,513eの通知順序が変更される。具体的には、メッセージ513a,513c,513e,513b,513dの順となる。
このように、メッセージ制御部160aは、“−S”オプションにより、生成した送信メッセージの通知順序を制御する。
これにより、第1の実施の形態の効果に加えて、設定する条件によって送信するメッセージの優先順序を適切に決定できるようになる。例えば、“発生”を含み“復旧”を含まないメッセージの優先度を上げ、既に復旧済みの状態を示すメッセージの優先度を下げて監視サーバ400へ送信する。そして、この優先度の順で管理者に通知を行うことで、管理者へ優先度の高いメッセージに対する注意を促すことができる。
以上、本発明の監視プログラム、監視方法および情報処理装置を図示の実施の形態に基づいて説明したが、これらに限定されるものではなく、各部の構成は同様の機能を有する任意の構成のものに置き換えることができる。また、他の任意の構成物や工程が付加されてもよい。また、本発明は前述した実施の形態のうちの任意の2以上の構成(特徴)を組み合わせたものであってもよい。
なお、上記の処理機能は、コンピュータによって実現することができる。この場合、上記の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体には、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録装置には、HDD、フレキシブルディスク(FD)、磁気テープ(MT)などがある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc - Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。光磁気記録媒体には、MO(Magneto - Optical disk)などがある。
上記プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータに格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
上記プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラム若しくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。
本実施の形態の概要を示す図である。 ネットワークシステムの構成を示す図である。 コンピュータのハードウェア構成を示すブロック図である。 第1の実施の形態のコンピュータの機能構成を示すブロック図である。 第1の実施の形態の未送信メッセージ管理テーブルのデータ構造例を示す図である。 第1の実施の形態のメッセージ制御テーブルのデータ構造例を示す図である。 第1の実施の形態の通信復旧時処理の手順を示すフローチャートである。 第1の実施の形態のメッセージ送信処理の手順を示すフローチャートである。 第1の実施の形態の送信メッセージの具体例を示す図である。 第2の実施の形態のコンピュータの機能構成を示すブロック図である。 第2の実施の形態のオプション設定テーブルのデータ構造例を示す図である。 第2の実施の形態の通信復旧時処理の手順を示すフローチャートである。 第2の実施の形態の“−H”オプションを利用したメッセージ送信処理の手順を示すフローチャートである。 第2の実施の形態の“−S”オプションを利用したメッセージ送信処理の手順を示すフローチャートである。 第2の実施の形態の“−H,−S”オプションを利用したメッセージ送信処理の手順を示すフローチャートである。 第2の実施の形態の送信メッセージの第1の具体例を示す図である。 第2の実施の形態の送信メッセージの第2の具体例を示す図である。
符号の説明
1 コンピュータ
1a メッセージ記憶手段
1b 制御情報記憶手段
1c 送信手段
1d メッセージ取得手段
1e メッセージ制御手段
2 管理装置

Claims (8)

  1. 管理装置と接続されたコンピュータに、前記コンピュータの状態を監視させ、監視により得た状態を示すメッセージを前記管理装置に送信させる監視プログラムであって、
    前記コンピュータを、
    メッセージを順次取得するメッセージ取得手段、
    前記メッセージ取得手段が取得したメッセージを順次送信する送信手段、
    前記送信手段によるメッセージの送信が不可能となると、前記メッセージ取得手段が順次取得した複数のメッセージを当該複数のメッセージそれぞれの発生時間と共に記憶するメッセージ記憶手段、
    前記コンピュータの所定の状態の開始を示す第1のメッセージと、前記所定の状態の終了を示す第2のメッセージとを対応付けた制御情報を記憶する制御情報記憶手段、
    前記送信手段によるメッセージの送信が可能となると、前記制御情報記憶手段に記憶された前記制御情報に基づいて、前記メッセージ記憶手段に記憶された前記複数のメッセージに、前記第1のメッセージと当該第1のメッセージよりも後の時点に発生した前記第2のメッセージとが含まれていることを検出すると、前記複数のメッセージのうち少なくとも検出した当該第1のメッセージと当該第2のメッセージとを除くメッセージを前記送信手段に出力するメッセージ制御手段、
    として機能させることを特徴とする監視プログラム。
  2. 前記メッセージ制御手段は、前記メッセージ記憶手段に記憶された前記複数のメッセージに、前記第2のメッセージと当該第2のメッセージよりも後の時点に発生した前記第1のメッセージとが含まれていることを検出すると、前記複数のメッセージのうち少なくとも検出した当該第2のメッセージを除くメッセージを前記送信手段に出力する、
    ことを特徴とする請求項1記載の監視プログラム。
  3. 前記制御情報記憶手段は、前記制御情報に前記コンピュータの前記第1のメッセージで示される状態とは異なる状態の開始を示す第3のメッセージと、当該第3のメッセージが示す状態の終了を示す第4のメッセージと、前記第3のメッセージと前記第4のメッセージとが示す情報を含む第5のメッセージと、の対応付けを含めて記憶し、
    前記メッセージ制御手段は、前記制御情報記憶手段に記憶された前記制御情報に基づいて、前記メッセージ記憶手段に記憶された前記複数のメッセージに、前記第3のメッセージと当該第3のメッセージよりも後の時点に発生した前記第4のメッセージとが含まれていることを検出すると、当該第3のメッセージと当該第4のメッセージとに代えて、前記第5のメッセージを前記送信手段に出力する、
    ことを特徴とする請求項1または2記載の監視プログラム。
  4. 前記メッセージ制御手段は、前記メッセージ記憶手段に記憶された前記複数のメッセージにおいて前記第1のメッセージを検出すると、当該第1のメッセージに対応する前記第2のメッセージを前記複数のメッセージのうち、前記発生時間が最も新しい時点から過去に向かって検索して、最初に検出した前記第2のメッセージの発生時間と検出された前記第1のメッセージの発生時間との間の期間を取得し、少なくとも当該期間に含まれる前記第1のメッセージと同一のメッセージおよび前記第2のメッセージと同一のメッセージを除くメッセージを前記送信手段に出力する、
    ことを特徴とする請求項1乃至3記載の監視プログラム。
  5. 前記制御情報記憶手段は、更に、メッセージの内容に応じた優先度を示す優先度情報を記憶し、
    前記メッセージ制御手段は、前記制御情報記憶手段に記憶された前記優先度情報に基づいて、前記送信手段に出力するメッセージの出力順序を制御する、
    ことを特徴とする請求項1乃至4記載の監視プログラム。
  6. 前記メッセージ制御手段は、前記メッセージ記憶手段に記憶された前記複数のメッセージにおいて前記第3のメッセージを検出すると、当該第3のメッセージに対応する前記第4のメッセージを前記複数のメッセージのうち、前記発生時間が最も新しい時点から過去に向かって検索して、最初に検出した前記第4のメッセージの発生時間と検出された前記第3のメッセージの発生時間との間の期間を取得し、少なくとも当該期間に含まれる前記第3のメッセージと同一のメッセージおよび前記第4のメッセージと同一のメッセージに代えて前記第5のメッセージを前記送信手段に出力する、
    ことを特徴とする請求項3記載の監視プログラム。
  7. 管理装置と接続され、自装置の状態を監視して、監視により得た状態を示すメッセージを前記管理装置に送信する情報処理装置の監視方法であって、
    メッセージ取得手段が、送信手段によるメッセージの送信が不可能となると、取得した前記複数のメッセージを当該複数のメッセージそれぞれの発生時間と共にメッセージ記憶手段に格納し、
    メッセージ制御手段が、送信手段によるメッセージの送信が可能となると、制御情報記憶手段に記憶された前記情報処理装置の所定の状態の開始を示す第1のメッセージと、前記所定の状態の終了を示す第2のメッセージとを対応付けた制御情報に基づいて、前記メッセージ記憶手段に記憶された前記複数のメッセージに、前記第1のメッセージと当該第1のメッセージよりも後の時点に発生した前記第2のメッセージとが含まれていることを検出すると、前記複数のメッセージのうち少なくとも検出した当該第1のメッセージと当該第2のメッセージとを除くメッセージを前記送信手段に出力する、
    ことを特徴とする監視方法。
  8. 管理装置と接続され、自装置の状態を監視して、監視により得た状態を示すメッセージを前記管理装置に送信する情報処理装置であって、
    メッセージを順次取得するメッセージ取得手段と、
    前記メッセージ取得手段が取得したメッセージを順次送信する送信手段と、
    前記送信手段によるメッセージの送信が不可能となると、前記メッセージ取得手段が順次取得した複数のメッセージを当該複数のメッセージそれぞれの発生時間と共に記憶するメッセージ記憶手段と、
    自装置の所定の状態の開始を示す第1のメッセージと、前記所定の状態の終了を示す第2のメッセージとを対応付けた制御情報を記憶する制御情報記憶手段と、
    前記送信手段によるメッセージの送信が可能となると、前記制御情報記憶手段に記憶された前記制御情報に基づいて、前記メッセージ記憶手段に記憶された前記複数のメッセージに、前記第1のメッセージと当該第1のメッセージよりも後の時点に発生した前記第2のメッセージとが含まれていることを検出すると、前記複数のメッセージのうち少なくとも検出した当該第1のメッセージと当該第2のメッセージとを除くメッセージを前記送信手段に出力するメッセージ制御手段と、
    を有することを特徴とする情報処理装置。
JP2008281904A 2008-10-31 2008-10-31 監視プログラム、監視方法および情報処理装置 Expired - Fee Related JP5006302B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008281904A JP5006302B2 (ja) 2008-10-31 2008-10-31 監視プログラム、監視方法および情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008281904A JP5006302B2 (ja) 2008-10-31 2008-10-31 監視プログラム、監視方法および情報処理装置

Publications (2)

Publication Number Publication Date
JP2010108382A true JP2010108382A (ja) 2010-05-13
JP5006302B2 JP5006302B2 (ja) 2012-08-22

Family

ID=42297746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008281904A Expired - Fee Related JP5006302B2 (ja) 2008-10-31 2008-10-31 監視プログラム、監視方法および情報処理装置

Country Status (1)

Country Link
JP (1) JP5006302B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013143003A (ja) * 2012-01-11 2013-07-22 Fujitsu Telecom Networks Ltd 通信システム、snmpのマネージャ装置およびsnmpのエージェント装置
JPWO2013084316A1 (ja) * 2011-12-07 2015-04-27 三菱電機株式会社 ネットワーク解析装置、管理システム、ネットワーク解析方法及びプログラム

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07325784A (ja) * 1994-05-31 1995-12-12 Nec Corp ネットワーク障害表示復旧方式
JPH1196043A (ja) * 1997-09-22 1999-04-09 The Sumitomo Bank Ltd 分散システムにおけるセンター監視システム
JP2000134201A (ja) * 1998-10-23 2000-05-12 Nec Eng Ltd ネットワークの監視方法及びこれを利用したネットワークの監視装置並びにネットワークの監視プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000278360A (ja) * 1999-03-19 2000-10-06 Fujitsu Fip Corp 障害監視装置並びに障害監視プログラムを記録した記録媒体
JP2003015973A (ja) * 2001-07-02 2003-01-17 Canon Inc ネットワークデバイス管理装置、管理方法及び管理プログラム
JP2003152722A (ja) * 2001-11-14 2003-05-23 Nec Corp 障害情報表示システム
JP2006004085A (ja) * 2004-06-16 2006-01-05 Canon Sales Co Inc サーバ装置及びその制御方法、プログラム
JP2006203792A (ja) * 2005-01-24 2006-08-03 Fujitsu Ltd 移動端末からのエラー情報収集蓄積方法、移動端末及び局側のエラー情報収集蓄積装置
JP2007013928A (ja) * 2005-05-31 2007-01-18 Nec Networks & System Integration Corp 遠隔障害監視装置及び遠隔障害監視方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07325784A (ja) * 1994-05-31 1995-12-12 Nec Corp ネットワーク障害表示復旧方式
JPH1196043A (ja) * 1997-09-22 1999-04-09 The Sumitomo Bank Ltd 分散システムにおけるセンター監視システム
JP2000134201A (ja) * 1998-10-23 2000-05-12 Nec Eng Ltd ネットワークの監視方法及びこれを利用したネットワークの監視装置並びにネットワークの監視プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000278360A (ja) * 1999-03-19 2000-10-06 Fujitsu Fip Corp 障害監視装置並びに障害監視プログラムを記録した記録媒体
JP2003015973A (ja) * 2001-07-02 2003-01-17 Canon Inc ネットワークデバイス管理装置、管理方法及び管理プログラム
JP2003152722A (ja) * 2001-11-14 2003-05-23 Nec Corp 障害情報表示システム
JP2006004085A (ja) * 2004-06-16 2006-01-05 Canon Sales Co Inc サーバ装置及びその制御方法、プログラム
JP2006203792A (ja) * 2005-01-24 2006-08-03 Fujitsu Ltd 移動端末からのエラー情報収集蓄積方法、移動端末及び局側のエラー情報収集蓄積装置
JP2007013928A (ja) * 2005-05-31 2007-01-18 Nec Networks & System Integration Corp 遠隔障害監視装置及び遠隔障害監視方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2013084316A1 (ja) * 2011-12-07 2015-04-27 三菱電機株式会社 ネットワーク解析装置、管理システム、ネットワーク解析方法及びプログラム
US9686095B2 (en) 2011-12-07 2017-06-20 Mitsubishi Electric Corporation Network analysis device, management system, network analysis method and program
JP2013143003A (ja) * 2012-01-11 2013-07-22 Fujitsu Telecom Networks Ltd 通信システム、snmpのマネージャ装置およびsnmpのエージェント装置

Also Published As

Publication number Publication date
JP5006302B2 (ja) 2012-08-22

Similar Documents

Publication Publication Date Title
JP4900982B2 (ja) サーバ・クラスタにおいてフェイルオーバを管理するための方法、フェイルオーバ・サーバ及びコンピュータ・プログラム
JP4872944B2 (ja) 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム
TWI510955B (zh) Data monitoring method, system and its server side, the client side
US8255893B2 (en) Software management process, software management apparatus, and computer-readable medium storing software management program
JP2008065668A (ja) 障害発生の原因箇所の発見を支援する技術
WO2012072344A1 (en) Endpoint-to-endpoint communications status monitoring
JP5006302B2 (ja) 監視プログラム、監視方法および情報処理装置
JP2004178296A (ja) ナレッジ型運用管理システム,方法およびプログラム
US20110225463A1 (en) Detecting and recovering from process failures
EP3171565B1 (en) Methods, devices and system for netconf hello packets interaction
JP4888465B2 (ja) メッセージ管理システム、監視対象装置、監視装置、メッセージ管理方法およびそのプログラム
JP5475130B2 (ja) 監視プログラム、監視システム及び監視方法
JP4600324B2 (ja) ポリシー管理システム、ポリシーマネージャ、ポリシーエージェント、ルール生成方法及びプログラム
WO2011161835A1 (ja) 原因分析構成変更のための方法および装置
JP5594000B2 (ja) 監視ネットワーク、プログラム、記録媒体
JP2015095876A (ja) プラント監視制御システム
JP6590142B2 (ja) 情報処理装置及び情報処理プログラム
JP6135430B2 (ja) 情報処理装置、方法、プログラム、及びシステム
JP5954738B2 (ja) ファイルのバックアップの処理を行うコンピュータ、システム、方法およびプログラム
JP5378847B2 (ja) 監視装置
JP2007249614A (ja) システム装置及び情報収集方法
JP2010211494A (ja) 情報処理システム、メッセージ管理方法及びメッセージ管理プログラム
JP2007140651A (ja) 計算機システム
JP2007018131A (ja) 障害情報収集・送信方法、および障害情報収集・送信プログラムおよび、障害情報収集・送信システム
JP2019079354A (ja) 情報処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120522

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120523

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120524

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150601

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees