JP2003122598A - 監視情報通報システム - Google Patents

監視情報通報システム

Info

Publication number
JP2003122598A
JP2003122598A JP2001312204A JP2001312204A JP2003122598A JP 2003122598 A JP2003122598 A JP 2003122598A JP 2001312204 A JP2001312204 A JP 2001312204A JP 2001312204 A JP2001312204 A JP 2001312204A JP 2003122598 A JP2003122598 A JP 2003122598A
Authority
JP
Japan
Prior art keywords
monitoring
computer
failure
unit
notification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001312204A
Other languages
English (en)
Inventor
Takao Shimadachi
隆男 島立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP2001312204A priority Critical patent/JP2003122598A/ja
Publication of JP2003122598A publication Critical patent/JP2003122598A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

(57)【要約】 【課題】 監視対象コンピュータの状態監視を行い、発
生した障害によって通報を自動的に最適な復旧対応者に
送信し、迅速な復旧を可能とする監視情報通知システム
を提供する。 【解決手段】 ネットワーク上の複数台の監視対象コン
ピュータ3a,3b ,・・・の状態を監視する監視コンピュ
ータ2を備え、該監視コンピュータは、監視対象コンピ
ュータの状態について状態監視を行い、監視対象コンピ
ュータの障害の有無を監視して、障害と判定した場合
に、障害の内容に応じた最も適切な復旧対象者に、自動
的に振り分け通知を行うように監視情報通知システムを
構成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、監視対象コンピ
ュータで発生した障害を迅速に復旧させることを可能に
した監視情報通報システムに関する。
【0002】
【従来の技術】従来、特開平11−272507号公報
には、監視対象コンピュータの検査を定期的に行い、障
害の有無を判定して、障害があれば指定された通報先に
通報するように構成したシステムについて、開示がなさ
れている。
【0003】
【発明が解決しようとする課題】しかしながら、上記公
報開示のシステムでは、障害発生時の通報先が固定され
ているため、発生した障害の種類によっては適切に対応
できないことがある。本発明は、上記課題を解決するた
めになされるものであって、発生した障害によって通報
先を自動的に変更することにより、最も適切な復旧対応
者に送信して、迅速な復旧を可能とする監視情報通報シ
ステムを提供することを目的とする。
【0004】
【課題を解決するための手段】上記課題を解決するた
め、本発明は、ネットワーク上に複数台のコンピュータ
を有するネットワークコンピュータシステムおいて、ネ
ットワーク上の複数のコンピュータの状態を監視する監
視コンピュータを備え、該監視コンピュータは、監視対
象コンピュータの状態について状態監視を行い、監視対
象コンピュータの障害の有無を監視して、障害と判定し
た場合に障害の内容に応じた最も適切な復旧対象者に自
動的に振り分け通知を行うようにして監視情報通報シス
テムを構成するものである。
【0005】このように構成した監視情報通報システム
においては、監視対象コンピュータの状態について状態
監視を行い、監視対象コンピュータの障害の有無を判定
して、障害と判定した場合に障害の内容に応じた最も適
切な復旧対象者に自動的に振り分け通知を行うようにし
ているので、迅速な復旧を可能とする。
【0006】
【発明の実施の形態】次に、実施の形態について説明す
る。図1は、本発明に係る監視情報通報システムの実施
の形態の全体構成を示すブロック図である。本実施の形
態に係る監視情報通報システム1は、監視コンピュータ
2と、該監視コンピュータ2によりLAN(ローカル・
エリア・ネットワーク: Local Area Network )を介し
て、状態を監視される複数の監視対象コンピュータ3
a,3b,・・・からなる監視対象コンピュータ群3と
で構成されている。そして、各監視対象コンピュータ3
a,3b,・・・には、それぞれ自分自身のシステム状
態を監視する監視データ収集部3a1,3b1,・・・を備
えている。
【0007】また、監視コンピュータ2には、状態検査
部23を介して、監視対象コンピュータ群3の各監視対象
コンピュータ3a,3b,・・・に状態検査を指示し、
その検査結果を受信して異常の有無を判定する監視部22
と、障害に応じて最も適切な通知先を割り当てる通知宛
先割当部24と、該通知宛先割当部24によって割り当てら
れた通知宛先に通報メッセージを通報する通報部25と、
監視部22に前記異常の有無を判定する基準を提供して通
報メッセージの送信を支援する監視情報管理部21と、監
視対象コンピュータ3a,3b,・・・の各監視データ
収集部3a1,3b1,・・・からの検査結果を受信し記録
する検査結果記録部26を備えている。
【0008】そして、前記通知宛先割当部24は、予め予
想される障害を分類し、キーワードを設け、対応する通
報先を指定した図2の(A),(B)に例示するような
リストを保存する手段と、障害発生内容の解析を行いキ
ーワードを抽出する手段と、抽出されたキーワード毎の
キーワード対応メールリストを抽出する手段と、対応メ
ールリスト宛先への図3の(A),(B)に例示するよ
うな通報メッセージ作成と登録を行う手段とを備えてい
る。また、通報メッセージは、予め予測される障害用の
メッセージと、実際の障害発生内容の情報及び監視情報
管理部21から提供される異常有無の判定基準とを組み合
わせて、図4に示すような通報メッセージフォーマット
に当てはまるように、通知宛先割当部24にて自動的に生
成されるようになっている。
【0009】次に、上記のように構成されている監視情
報通報システムの動作を、図5に示すシステム処理フロ
ー図を用いて説明する。この処理フローは、監視コンピ
ュータ2から監視対象コンピュータ群3の各監視対象コ
ンピュータ3a,3b,・・・の状態を監視し、監視部
22によって障害が発生したと判定された場合に、通知宛
先割当部24によって自動振り分け通知を行う部分を示し
ている。以下、各ステップ毎に順次説明する。
【0010】ステップS1:指定した時間間隔にて、監
視コンピュータ2は各監視対象コンピュータ3a,3
b,・・・に自分自身の状態を検査するように依頼す
る。指定した時間間隔は、分又は時間単位とする。各監
視対象コンピュータ3a,3b,・・・への依頼のタイ
ミングは監視コンピュータ2の内蔵時計と同期すること
とし、依頼の時間間隔の起点は常に午前0時とする。ま
た、監視コンピュータ2と各監視対象コンピュータ3
a,3b,・・・は、常に時間同期を行っていることと
する。 ステップS2:監視コンピュータ2の監視部22から状態
検査部23を介して依頼を受けて、各監視対象コンピュー
タ3a,3b,・・・は自分自身の監視データ収集部3
a1,3b1,・・・による処理を実行し、状態検査を行
う。 ステップS3:監視コンピュータ2の監視部22は、各監
視対象コンピュータ3a,3b,・・・の監視データ収
集部3a1,3b1,・・・から検査結果を、状態検査部23
を介して受信し、検査結果を検査結果記録部26に書き込
みを行う。 ステップS4:監視コンピュータ2の監視部22は検査結
果を解析し、監視情報管理部21から提供される異常有無
の判定基準を基に、障害発生有無の判定を行う。障害有
りの場合はステップS41〜S48のフローに移り、障害な
しの場合はステップS5へ移り、フロー終了とする。
【0011】ステップS41:上記ステップS4の障害発
生有無の判定において障害有りの判定となった場合、監
視部22はまず通知宛先割当部24を起動させ、監視部22が
検査結果とそれに対応する判定基準を通知宛先割当部24
に渡す。 ステップS42:通知宛先割当部24は、監視部22から送ら
れてきた検査結果とそれに対応する判定基準を基に、障
害発生内容の解析を行う。 ステップS43:通知宛先割当部24は、障害発生内容の解
析結果から、予め登録されたキーワードと同じものがあ
れば、そのキーワードを抽出する。 ステップS44:通知宛先割当部24は、抽出したキーワー
ドに対応する宛先リストを選択するために、該通知宛先
割当部24に蓄えられているキーワード対応リストを参照
する。 ステップS45:通知宛先割当部24は、抽出したキーワー
ドに対応する宛先リストを抽出する。 ステップS46:通知宛先割当部24は、対応メールリスト
宛先への通報メッセージを、予め予測される障害用のメ
ッセージと、実際の障害発生内容の情報及び監視部22か
ら提供される異常有無の判定基準とを組み合わせて作成
し、通知宛先割当部24に登録する。 ステップS47:通知宛先割当部24は、通報メッセージを
通報するための通報部25を起動する。 ステップS48:通報部25は、通知宛先割当部24から渡さ
れた通報メッセージを対応メールリストに示されている
宛先にLANを介して送信し、ステップ5に移り、フロ
ー終了とする。
【0012】次に、2つの具体的な処理例について説明
する。まず、具体的処理例1として、監視対象コンピュ
ータ3a(ライセンスサーバ)において、ライセンスデ
ーモンが動作していない場合を、同じく図5に示すフロ
ーチャートに基づいて説明する。なお、ライセンスデー
モンとは、コンピュータ上で動作するツールのライセン
スを管理するプロセスである。ツールAのライセンスデ
ーモンが動作していない場合、ツールAは使用できな
い。
【0013】ステップS1:指定した時間間隔にて、監
視コンピュータ2は、監視対象コンピュータ3aに対し
て自分自身の状態を検査するように依頼する。 ステップS2:監視コンピュータ2の監視部22から依頼
を受けて、監視対象コンピュータ3aは自分自身の監視
データ収集部3a1の処理を実行し、状態検査を行う。こ
こで、監視データ収集部3a1は監視対象コンピュータ3
aにおいて、「ライセンスデーモンが動作していない」
という情報を収集する。 ステップS3:監視コンピュータ2の監視部22は、監視
対象コンピュータ3aから「ライセンスデーモンが動作
していない」という情報を含んだ検査結果を受信し、そ
の検査結果を検査結果記録部26に書き込みを行う。 ステップS4:監視コンピュータ2の監視部22は検査結
果を解析し、監視情報管理部21から提供される異常有無
の判定基準を基に、障害発生有無の判定を行う。判定基
準の中に、「監視対象コンピュータ3aにおけるライセ
ンスデーモン未動作なら障害」という項目があり、今回
はこの基準で障害有りとなり、ステップS41〜S48のフ
ローに移る。
【0014】ステップS41:上記ステップS4の障害発
生有無の判定において障害有りの判定となったため、監
視部22はまず通知宛先割当部24を起動させ、監視部22が
検査結果とそれに対応する判定基準を、通知宛先割当部
24に渡す。 ステップS42:通知宛先割当部24は、監視部22から送ら
れてきた検査結果「ライセンスデーモン未動作」と、そ
れに対応する判定基準「監視対象コンピュータ3aにお
けるライセンスデーモン未動作なら障害」を基に、障害
発生内容の解析を行う。 ステップS43:通知宛先割当部24は、障害発生内容の解
析結果から、予め登録されたキーワード「監視対象コン
ピュータ3a」、「ライセンスデーモン未動作」と同じ
ものがあり、該当キーワード「監視対象コンピュータ3
a」、「ライセンスデーモン未動作」を抽出する。 ステップS44:通知宛先割当部24は、抽出したキーワー
ドに対応する宛先リストを選択するために、該通知宛先
割当部24に蓄えられている図2の(A)に示すキーワー
ド対応リストを参照する。 ステップS45:通知宛先割当部24は、図2の(A)に示
すキーワード対応リストに基づき、宛先リストを抽出す
る。 ステップS46:通知宛先割当部24は、対応メールリスト
への通報メッセージを、予め予測される障害用のメッセ
ージ「xxx が動作しておりません。動作確認をお願い致
します。」と、実際の障害発生内容の情報「ライセンス
デーモンが動作していない」及び監視部22から提供され
る異常有無の判定基準「監視対象コンピュータ3aにお
けるライセンスデーモン未動作なら障害」とを組み合わ
せ作成し、図3の(A)に示すような形式とし、通知宛
先割当部24に登録する。 ステップS47:通知宛先割当部24は、通報メッセージを
通報するために通報部25を起動する。 ステップS48:通報部25は、通知宛先割当部24から渡さ
れた通報メッセージを、対応メールリストの宛先「xxx
@yyyyy.co.jp,zzz @yyyyy.co.jp,vvv @xxxxx.com 」
に、LANを介して送信する。 ステップS5:フローを終了し、待機状態となる。
【0015】これにより、対応メールリストへの宛先
は、監視対象コンピュータ3a(ライセンスサーバ)の
管理者となっている。そのため、通知受け取り対象者に
よって、ライセンスデーモン再起動などの障害復旧を迅
速に行うことが可能となる。
【0016】次に、監視対象コンピュータ3b(ファイ
ルサーバ)において、物理ディスク「Disk5」上にある
パーティション「/part4」の使用率が90%を越えている
場合を処理例2として、同じく図5に示すフローチャー
トに基づいて説明する。 ステップS1:指定した時間間隔にて、監視コンピュー
タ2は、監視対象コンピュータ3bに対して自分自身の
状態を検査するように依頼する。 ステップS2:監視コンピュータ2の監視部22から依頼
を受けて、監視対象コンピュータ3bは自分自身の監視
データ収集部3b1の処理を実行し、状態検査を行う。こ
こで、監視データ収集部3b1は監視対象コンピュータ3
bにおいて、「Disk5:/part4の使用率が95%」という
情報を収集する。 ステップS3:監視コンピュータ2の監視部22は、監視
対象コンピュータ3bから「監視対象コンピュータ3b
のDisk5:/part4の使用率が95%」という情報を含んだ
検査結果を受信し、その検査結果を検査結果記録部26に
書き込みを行う。 ステップS4:監視コンピュータ2の監視部22は検査結
果を解析し、監視情報管理部21から提供される異常有無
の判定基準を基に、障害発生有無の判定を行う。判定基
準の中に、「ディスク使用率90%以上は障害」という項
目があり、今回はこの基準で障害有りとなり、ステップ
S41〜S48のフローに移る。
【0017】ステップS41:上記ステップS4の障害発
生有無の判定において障害有りの判定となったため、監
視部22はまず通知宛先割当部24を起動させ、監視部22が
検査結果とそれに対応する判定基準を、通知宛先割当部
24に渡す。 ステップS42:通知宛先割当部24は、監視部22から送ら
れてきた検査結果「監視対象コンピュータ3bのDisk
5:/part4の使用率が95%」と、それに対応する判定基
準「ディスク使用率90%以上は障害」を基に、障害発生
内容の解析を行う。 ステップS43:通知宛先割当部24は、障害発生内容の解
析結果から、予め登録されたキーワード「監視対象コン
ピュータ3b」、「Disk5:/part4の使用率」、「ディ
スク使用率90%以上」と同じものがあり、該当キーワー
ド「監視対象コンピュータ3b」、「Disk5:/part4の
使用率」、「ディスク使用率90%以上」を抽出する。 ステップS44:通知宛先割当部24は、抽出したキーワー
ドに対応する宛先リストを選択するために、該通知宛先
割当部24に蓄えられている図2の(B)に示すキーワー
ド対応リストを参照する。 ステップS45:通知宛先割当部24は、図2の(B)に示
すキーワード対応リストに基づき、宛先リストを抽出す
る。 ステップS46:通知宛先割当部24は、対応メールリスト
への通報メッセージを、予め予測される障害用のメッセ
ージ「xxx パーティションの使用率が90%を越えており
ます。不必要データを消去して下さい。」と、実際の障
害発生内容の情報「Disk5:/part4の使用率が95%」及
び監視部22から提供される異常有無の判定基準「ディス
ク使用率90%以上は障害」とを組み合わせ作成し、図3
の(B)に示すような形式とし、通知宛先割当部24に登
録する。 ステップS47:通知宛先割当部24は、通報メッセージを
通報するために通報部25を起動する。 ステップS48:通報部25は、通知宛先割当部24から渡さ
れた通報メッセージを、対応メールリストの宛先「aaa
@yyyyy.co.jp,bbb @yyyyy.co.jp,vvv @xxxxx.com 」
にLANを介して送信する。 ステップS5:フローを終了し、待機状態となる。
【0018】以上により、対応メールリストの宛先は、
監視対象コンピュータ3bのDisk5:/part4の使用者と
なっている。そのため、通知受け取り対象者によって、
不必要データの消去などの障害復旧を迅速に行うことが
可能となる。
【0019】
【発明の効果】以上、実施の形態に基づいて詳細に説明
したように、本発明によれば、監視対象コンピュータに
て発生した障害毎に通報先を自動的に振り分けられ、最
も適切な復旧対応者に通知されるようになっているの
で、迅速な復旧が可能な監視情報通知システムを実現す
ることができる。
【図面の簡単な説明】
【図1】本発明に係る監視情報通知システムの実施の形
態を示すブロック構成図である。
【図2】図1に示した実施の形態における通知宛先割当
部で保存するキーワード対応リスト例を示す図である。
【図3】図1に示した実施の形態における通知宛先割当
部で作成登録する通報メッセージ例を示す図である。
【図4】図1に示した実施の形態における通知宛先割当
部で生成される通報メッセージのフォーマットを示す図
である。
【図5】図1に示した実施の形態の動作を説明するため
のフローチャートである。
【符号の説明】
1 監視情報通知システム 2 監視コンピュータ 21 監視情報管理部 22 監視部 23 状態検査部 24 通知宛先割当部 25 通報部 26 検査結果記録部 3 監視対象コンピュータ群 3a,3b,・・・ 監視対象コンピュータ 3a1,3b1,・・・ 監視データ収集部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 ネットワーク上に複数台のコンピュータ
    を有するネットワークコンピュータシステムおいて、ネ
    ットワーク上の複数のコンピュータの状態を監視する監
    視コンピュータを備え、該監視コンピュータは、監視対
    象コンピュータの状態について状態監視を行い、監視対
    象コンピュータの障害の有無を監視して、障害と判定し
    た場合に障害の内容に応じた最も適切な復旧対象者に自
    動的に振り分け通知を行うように構成したことを特徴と
    する監視情報通報システム。
  2. 【請求項2】 前記監視コンピュータは、前記監視対象
    コンピュータに状態検査を指示し、その検査結果を受信
    して障害の有無を判定する監視部と、障害に応じて通知
    先を割り当てる通知宛先割当部と、前記通知宛先割当部
    によって割り当てられた通知宛先に通報メッセージを通
    報する通報部と、前記監視部に前記障害の有無を判定す
    る基準を提供し、前記通報メッセージの送信を支援する
    監視情報管理部とを備えていることを特徴とする請求項
    1に係る監視情報通報システム。
  3. 【請求項3】 前記通知宛先割当部は、予め予想される
    障害を分類し、キーワードを設け、対応する通報先を指
    定したリストを保存する手段と、障害発生内容の解析を
    行いキーワードを抽出する手段と、抽出されたキーワー
    ド毎のキーワード対応メールリストを抽出する手段と、
    対象メールリストへの通報メッセージ作成と登録を行う
    手段とを備えていることを特徴とする請求項2に係る監
    視情報通報システム。
JP2001312204A 2001-10-10 2001-10-10 監視情報通報システム Withdrawn JP2003122598A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001312204A JP2003122598A (ja) 2001-10-10 2001-10-10 監視情報通報システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001312204A JP2003122598A (ja) 2001-10-10 2001-10-10 監視情報通報システム

Publications (1)

Publication Number Publication Date
JP2003122598A true JP2003122598A (ja) 2003-04-25

Family

ID=19130900

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001312204A Withdrawn JP2003122598A (ja) 2001-10-10 2001-10-10 監視情報通報システム

Country Status (1)

Country Link
JP (1) JP2003122598A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012053680A (ja) * 2010-09-01 2012-03-15 Mizuho Information & Research Institute Inc 監視処理システム、監視処理方法及び監視処理プログラム
JP2014048973A (ja) * 2012-08-31 2014-03-17 Ricoh Co Ltd 情報処理システム、情報処理方法およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012053680A (ja) * 2010-09-01 2012-03-15 Mizuho Information & Research Institute Inc 監視処理システム、監視処理方法及び監視処理プログラム
JP2014048973A (ja) * 2012-08-31 2014-03-17 Ricoh Co Ltd 情報処理システム、情報処理方法およびプログラム

Similar Documents

Publication Publication Date Title
US6651183B1 (en) Technique for referencing failure information representative of multiple related failures in a distributed computing environment
CN100405311C (zh) 用于计算机系统中的多个分区的错误监视的方法
US9369521B2 (en) Naming of distributed business transactions
JP4172807B2 (ja) 障害発生の原因箇所の発見を支援する技術
JP3983138B2 (ja) 障害情報収集プログラムおよび障害情報収集装置
US8326971B2 (en) Method for using dynamically scheduled synthetic transactions to monitor performance and availability of E-business systems
CN111046011B (zh) 日志收集方法、系统、装置、电子设备及可读存储介质
JP4466615B2 (ja) 運用管理システム、監視装置、被監視装置、運用管理方法及びプログラム
CN105610648A (zh) 一种运维监控数据的采集方法及服务器
CN109559121B (zh) 交易路径调用异常分析方法、装置、设备及可读存储介质
JP2002366394A (ja) ログデータの収集管理方法
JP2004348640A (ja) ネットワーク管理システム及びネットワーク管理方法
JP2003122598A (ja) 監視情報通報システム
CN112818204B (zh) 一种业务的处理方法、装置、设备及存储介质
JP2019082941A (ja) ログ収集システム及びプログラム
US8930369B2 (en) Information processing apparatus, message classifying method and non-transitory medium for associating series of transactions
JP3202721B2 (ja) 故障予測システム、故障予測方法および故障予測プログラムを記録した記録媒体
CN109634848B (zh) 一种银行大型测试环境管理方法及系统
JP2001195377A (ja) 孤立判定システムとその管理方法及び記録媒体
JP6926646B2 (ja) 事業者間一括サービス管理装置および事業者間一括サービス管理方法
JP2001005795A (ja) 分散システムにおける異常検出方法
JP4286594B2 (ja) 障害解析データ採取装置およびその方法
US20070248008A1 (en) Management support method, management support system, management support apparatus and recording medium
JPH11272507A (ja) 監視情報通報システムおよびそのプログラム記録媒体
WO2022168196A1 (ja) 保守システム、情報処理装置、保守方法、およびプログラム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050104