JP2007233686A - 障害監視通報システム、障害監視通報装置、および障害監視通報プログラム - Google Patents

障害監視通報システム、障害監視通報装置、および障害監視通報プログラム Download PDF

Info

Publication number
JP2007233686A
JP2007233686A JP2006054627A JP2006054627A JP2007233686A JP 2007233686 A JP2007233686 A JP 2007233686A JP 2006054627 A JP2006054627 A JP 2006054627A JP 2006054627 A JP2006054627 A JP 2006054627A JP 2007233686 A JP2007233686 A JP 2007233686A
Authority
JP
Japan
Prior art keywords
reporting
setting information
console message
monitoring
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006054627A
Other languages
English (en)
Inventor
Takuya Ueshiba
卓也 上芝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006054627A priority Critical patent/JP2007233686A/ja
Publication of JP2007233686A publication Critical patent/JP2007233686A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

【課題】多様化する運用形態の変化に応じて、通報条件を動的に設定できる障害監視通報システムを提供する。
【解決手段】通報辞書情報記憶部14には、通報対象となりうる通報メッセージに対応づけて、各コンピュータシステムにおける対象フラグを登録した通報辞書情報を記憶する。また、通報辞書更新情報記憶部15には、通報辞書情報の更新トリガとなる辞書更新メッセージに対応づけて、対象フラグの更新内容を登録した通報辞書更新情報を記憶する。通報辞書更新手段12は、辞書更新メッセージが出力された場合に、通報辞書更新情報の対象フラグの更新内容に基づいて、通報辞書情報の辞書更新メッセージ出力元コンピュータシステムにおける各通報メッセージの対象フラグを更新する。通報制御手段13は、通報メッセージが出力された場合に、通報辞書情報の該通報メッセージ出力元コンピュータシステムにおける対象フラグに基づいて、通報を行う。
【選択図】図1

Description

本発明は、コンピュータシステムの障害を監視して通報する障害監視通報システム、障害監視通報装置、および障害監視通報プログラムに関し、特に、通報条件を動的に設定可能な障害監視通報システム、障害監視通報装置、および障害監視通報プログラムに関する。
従来、コンピュータシステムの障害を監視して通報する障害管理通報システムでは、通報による負荷を抑えつつ運用に支障をきたすような障害を確実に通報するために様々な通報条件が用いられている。例えば、通報対象や通報間隔等を障害レベル、発生回数、発生頻度に基づいて定めた条件などである。
特許文献1には、顧客システムの運用効率の低下を防止しつつ、障害情報の記憶容量の関係から従来なら通知しないような重要度の低い障害が頻発することによって重大な障害へ発展することを防ぐために、低レベル障害の情報を一定時間蓄積した上で通報する障害情報通報システムが記載されている。
また、特許文献2には、情報処理装置の障害部品を的確に指南するために、部品の故障率を管理し、通報された障害情報に基づいて部品の故障率を更新することによって、被疑部品を表示する際に用いる被疑順位を動的に設定することができる障害管理方式が記載されている。
特開平06−028221号公報(段落0021−0023) 特開2004−355424号公報(段落0036−0038)
しかしながら、特許文献1に記載の障害情報通報システムは、障害レベルに応じて通報間隔を切り替えるよう定義された通報条件に従って動作することによって、効果を生じさせているのであって、例えば、マルチOSシステムにおける運用OSの切替が発生した場合など、多様化する運用形態に応じて通報条件を変化させるような動的な対応は考慮されていない。従って、運用形態が変化した際に、通報条件に用いられる設定値(例えば、通報レベルの設定)を人手によって変更する必要が生じたり、通報しなくてもよい障害が通報されたり、通報すべき障害が通報されないなどの誤通報や通報漏れが生じてしまう可能性がある。
また、特許文献2に記載の障害管理方式は、障害回数に応じて既存部品の故障率を更新することによって被疑順位を変更しているのであって、例えば、拡張スロットを備えた装置にハードウェアが追加された場合に、追加されたハードウェアの故障率までもが反映されるわけではない。
つまり、従来の障害監視通報システムでは、予めSG(System Generation)にて設定された通報条件に基づいて通報を行っているため、運用OSの変更等による通報対象の変更など、多様化する運用形態の動的変化に対応できないという問題点があった。その理由は、多様化する運用形態の動的変化に合致するように、通報条件を動的に設定することができないからである。
そこで、本発明は、多様化する運用形態の変化に応じて、通報条件を動的に設定できる障害監視通報システム、障害監視通報装置、および障害監視通報プログラムを提供することを目的とする。
本発明による障害監視通報システムは、コンピュータシステムの障害の発生を通報する障害監視通報システムであって、前記コンピュータシステムの障害の発生を監視する障害監視通報装置を備え、前記障害監視通報装置は、前記コンピュータシステムから出力される前記コンピュータシステムの運用状態を示すコンソールメッセージを監視する監視手段(例えば、コンソールメッセージ監視手段11)と、前記監視手段の監視結果に基づいて、コンピュータシステムの障害の発生を通報するための通報条件を設定する通報条件設定手段(例えば、通報辞書更新手段12)とを備えたことを特徴とする。
また、障害監視通報装置は、通報条件設定手段が設定した通報条件に基づいて、コンピュータシステムから出力されるコンソールメッセージが示す障害の発生を通報する通報手段(例えば、通報制御手段13)を備えていてもよい。
また、通報条件設定手段は、所定のコンソールメッセージが出力された場合に、該コンソールメッセージに対応づけられた通報条件の設定内容を示す情報に基づいて、通報条件を設定してもよい。
また、障害監視通報システムは、コンピュータシステムの障害の発生を通報する障害監視通報システムであって、前記コンピュータシステムの障害の発生を監視する障害監視通報装置を備え、前記障害監視通報装置は、前記コンピュータシステムの障害状態と稼働状態とを含む運用状態を示すコンソールメッセージの出力を検出する検出手段(例えば、コンソールメッセージ監視手段11)と、障害状態を示すコンソールメッセージに対応づけて、コンピュータシステムの障害の発生を通報するための通報条件にかかる設定情報であって、コンピュータシステムの運用形態に応じて変化する設定情報を記憶する設定情報記憶手段(例えば、通報辞書情報記憶部14)と、所定のコンソールメッセージが検出された場合に、前記設定情報記憶手段に記憶されている設定情報を更新する設定情報更新手段(例えば、通報辞書更新手段12)と、前記設定情報記憶手段に記憶されているコンソールメッセージが検出された場合に、該コンソールメッセージに対応づけて記憶されている設定情報に基づいて通報制御を行う通報制御手段(例えば、通報制御手段13)とを備えていてもよい。なお、検出手段は、例えば、コンピュータシステムから出力されるコンソールメッセージを受信することによって、出力を検出する。
また、障害監視通報装置は、所定のコンソールメッセージに対応づけて、前記設定情報に記憶されている各コンソールメッセージの設定情報の更新内容を示す設定更新情報を記憶する設定更新情報記憶手段を(例えば、通報辞書更新情報記憶部15)備え、設定情報更新手段は、前記設定更新情報記憶手段に記憶されているコンソールメッセージが検出された場合に、該コンソールメッセージに対応づけて記憶されている設定更新情報に基づいて、設定情報記憶手段に記憶されている設定情報を更新してもよい。
また、障害監視通報システムは、複数のコンピュータシステムの障害の発生を通報する障害監視通報システムであって、設定情報記憶手段は、コンピュータシステム毎に設定情報を記憶し、設定情報更新手段は、所定のコンソールメッセージが検出された場合に、前記設定情報記憶手段に記憶されている該コンソールメッセージの対象コンピュータシステムの設定情報を更新し、通報制御手段は、前記設定情報記憶手段に記憶されているコンソールメッセージが検出された場合に、該コンソールメッセージに対応づけて記憶されている該コンソールメッセージの対象コンピュータシステムの設定情報に基づいて、通報制御を行ってもよい。
また、設定情報更新手段は、設定更新情報記憶手段に記憶されているコンソールメッセージを受信した場合に、該コンソールメッセージに対応づけて記憶されている設定更新情報に基づいて、設定情報記憶手段に記憶されている該コンソールメッセージの対象コンピュータシステムの設定情報を更新してもよい。
また、設定情報記憶手段は、障害状態を示すコンソールメッセージに対応づけて、少なくとも通報対象か否かを示す対象フラグを設定情報として記憶し、設定情報更新手段は、所定のコンソールメッセージが検出された場合に、前記設定情報記憶手段に記憶されている対象フラグを更新し、通報制御手段は、前記設定情報記憶手段に記憶されているコンソールメッセージが検出された場合に、該コンソールメッセージに対応づけて記憶されている対象フラグが通報対象か否かを判定し、通報対象である場合に通報を行ってもよい。
また、設定情報更新手段は、運用形態の変化を示すコンソールメッセージが検出された場合に、稼働中または実装中のユニットの障害を示すコンソールメッセージを通報対象とし、非稼働中または未実装のユニットの障害を示すコンソールメッセージを通報対象外とする旨の更新を行ってもよい。
また、本発明による障害監視通報装置は、コンピュータシステムの障害の発生を監視して通報する障害監視通報装置であって、前記コンピュータシステムの障害状態と稼働状態とを含む運用状態を示すコンソールメッセージの出力を検出する検出手段と、障害状態を示すコンソールメッセージに対応づけて、コンピュータシステムの障害の発生を通報するための通報条件にかかる設定情報であって、コンピュータシステムの運用形態に応じて変化する設定情報を記憶する設定情報記憶手段と、所定のコンソールメッセージが検出された場合に、前記設定情報記憶手段に記憶されている設定情報を更新する設定情報更新手段と、前記設定情報記憶手段に記憶されているコンソールメッセージが検出された場合に、該コンソールメッセージに対応づけて記憶されている設定情報に基づいて通報制御を行う通報制御手段とを備えたことを特徴とする。
また、本発明による障害監視通報プログラムは、コンピュータシステムの障害の発生を監視して通報するための障害監視通報プログラムであって、コンピュータに、前記コンピュータシステムの障害状態と稼働状態とを含む運用状態を示すコンソールメッセージの出力を検出する処理、所定のコンソールメッセージが検出された場合に、障害状態を示すコンソールメッセージに対応づけて記憶されている、コンピュータシステムの障害の発生を通報するための通報条件にかかる設定情報であって、コンピュータシステムの運用形態に応じて変化する設定情報を更新する処理、および障害状態を示すコンソールメッセージが検出された場合に、該コンソールメッセージに対応づけて記憶されている設定情報に基づいて通報制御を行う処理を実行させることを特徴とする。
本発明によれば、監視対象であるコンピュータシステムから出力されるコンソールメッセージに基づいて、通報条件にかかる設定情報を自動で更新するので、多様化する運用形態の変化に応じて、通報条件を動的に設定できる。従って、人手による再設定を要せずに、運用形態の変更等による誤通報や通報漏れを防ぐことができる。
また、特定のメッセージをトリガにして、予め定めておいた内容に更新することができるので、運用形態の変化に対応するだけでなく、保守時に所定の通報を制限するなど、通報対象を拡大・縮小する等の通報対象制御を自在に実現することができる。
以下、本発明の実施の形態を図面を参照して説明する。図1は、本発明による障害監視通報システムの構成例を示すブロック図である。図1に示す障害監視通報システムでは、障害の監視対象であるコンピュータシステムS1〜S6と、コンピュータシステムS1〜S6の障害の検出・通報を行う障害監視通報装置10と、制御卓装置30とが、通信ネットワーク40を介して接続されている。なお、図1では6つのコンピュータシステムを監視対象として示しているが、監視対象はいくつであってもよい。また、コンピュータシステムは、通信ネットワーク40を介してシステムの運用状態(障害状態や稼働状態、測定値等)を示す情報を出力する機能を有していれば、どのようなシステムであってもよい。例えば、コンソールメッセージを出力するOSが駆動する情報処理システムや、コンソールメッセージを出力するようなコンピュータシステムでなくても運用状態を示す情報を出力するテレメータ装置であってもよい。
制御卓装置30は、コンピュータシステムS1〜S6を操作するための制御卓である。また、障害監視通報装置10は、コンソールメッセージ監視手段11と、通報辞書更新手段12と、通報制御手段13と、通報辞書情報記憶部14と、通報辞書更新情報記憶部15とを備える。障害監視通報装置10は、例えばパーソナルコンピュータ等の情報処理装置である。
本実施の形態では、障害監視通報装置10において、監視対象のコンピュータシステムから出力されるコンソールメッセージを監視し、特定のコンソールメッセージをきっかけ(トリガ)にして、通報条件を更新することによって多様化する運用形態に合致した通報制御を行う。ここで、コンソールメッセージとは、コンピュータシステムの運用状態(障害状態や稼働状態、測定値等)を示すメッセージであって、例えば、コンピュータシステムのコンソールに出力されるメッセージに該当する。障害監視通報装置10は、運用形態に応じて異なる通報条件にかかる設定(例えば、通報対象)を可変値として扱うことを前提に、運用形態の変化を検出した際に、通報条件にかかる可変的な設定値を変化後の運用形態に合致するよう更新することによって、その時々の運用形態に合致した通報制御を行う。なお、運用形態に応じて更新する設定値は、監視対象のコンピュータシステム毎に管理する。以下、通報条件にかかる可変的な設定値を可変設定値という。
可変設定値の例として、例えば、運用形態に応じて通報対象を切り替える場合には、通報対象か否かを示す対象フラグを用意し、「コンソールメッセージが示す障害の対象フラグが通報対象である場合に通報する」という通報条件の下、対象フラグを更新する。対象フラグの更新は、例えば、マルチOSシステムにおいて運用OSが切り替わったことを検出した場合に、稼働中OSに属する障害の対象フラグを通報対象とし、非稼働中OSに属する障害の対象フラグを通報対象外とすることが考えられる。この場合に、OSとは無関係な障害の対象フラグを更新しないよう制御してもよい。
また、本実施の形態では、監視対象のコンソールメッセージを通報メッセージとして定義し、各通報メッセージに対応づけて、各コンピュータシステムにおける可変設定値(ここでは、対象フラグを指す)を登録した情報を通報辞書情報として記憶しておく。また、運用形態の変化を示すコンソールメッセージを辞書更新メッセージとして定義し、各辞書更新メッセージに対応づけて、通報辞書情報に登録された可変設定値の更新内容を登録した情報を通報辞書更新情報として記憶しておく。なお、通報辞書更新情報には、その辞書更新メッセージを受信した後の運用形態に合致するように、各通報メッセージに対応づけられた可変設定値の更新内容(更新後の値や更新しない旨を示す値)を登録する。そして、通報辞書更新情報に登録されている辞書更新メッセージの出力を検出した場合に、通報辞書更新情報に登録されている更新内容に基づいて、通報辞書情報に登録されている該当コンピュータシステムにおける可変設定値を更新する。
次に、障害監視通報装置10の各手段について説明する。コンソールメッセージ監視手段11は、監視対象である全コンピュータシステムから、通報メッセージまたは辞書更新メッセージに合致するコンソールメッセージが出力されるか否かを監視する。通報辞書更新手段12は、コンソールメッセージ監視手段11からの指示を受けて、通報辞書情報を更新する。通報制御手段13は、コンソールメッセージ監視手段11からの指示を受けて、コンソールメッセージが示す障害の通報を実施する。また、通報辞書情報記憶部14は、通報辞書情報を記憶する。通報辞書更新情報記憶部15は、通報辞書更新情報を記憶する。
図2は、通報辞書情報の登録例を示す説明図である。図2に示す対象フラグは、1=通報する、0=通報しないを意味する。なお、図2では、”OS1 panic”と”OS2 panic”の各コンピュータシステムにおける対象フラグの例として、マルチOSシステムにおけるOSの稼働/非稼働に対応した通報対象制御の一例を示している。つまり、コンピュータシステムS1〜S4ではOS1が稼働中のため、OS1の障害を通報対象に設定している例であって、コンピュータシステムS5,S6ではOS2が稼働中のため、OS2の障害を通報対象に設定している例である。また、”HW1”の対象フラグは、拡張スロットの実装/未実装に対応した通報対象制御の一例である。
以下は、通報辞書情報の構造を要素数で表現した式である。なお、n1は監視対象コンピュータシステム数、n2は通報メッセージ数を示す。
通報辞書情報=(通報メッセージ+対象フラグ×n1)×n2
また、図3は、通報辞書更新情報の登録例を示す説明図である。図3に示す対象フラグの更新内容は、通報辞書情報における通報メッセージの登録順に、それぞれ1=通報する、0=通報しない、2=更新対象外を意味する。例えば、辞書更新メッセージ”OS1 boot”の更新内容(1022)は、”OS1 panic”の対象フラグを1に変更し、”OS2 panic”の対象フラグを0に変更し、3番目と4番目に登録されている通報メッセージ”HW1”と”HW2”の対象フラグは変更しない旨を示している。つまり、稼働OSがOS2からOS1に切り替わった場合に、OS1の障害を通報対象にし、OS2の障害を通報対象外とする旨の更新内容の一例である。
以下は、通報辞書更新情報の構造を要素数で表現した式である。なお、n2は通報メッセージ数、n3は辞書更新メッセージ数を示す。
通報辞書更新情報=(辞書更新メッセージ+対象フラグ×n2)×n3
本実施の形態において、コンソールメッセージ監視手段11、通報辞書更新手段12および通報制御手段13は、プログラムに従って動作するCPUによって実現される。なお、コンソールメッセージ監視手段11または通報制御手段13は、プログラムに従って動作するCPUと、通信を行うハードウェア装置とによって実現される場合もある。また、通報制御手段13および通報辞書情報記憶部14は、ハードディスク装置等の記憶装置によって実現される。
次に、図4のフローチャートを参照して本実施の形態の動作を説明する。図4は、害監視通報装置10の処理フローの一例である。ここで、通報条件は、「コンソールメッセージが通報辞書情報に登録されている通報メッセージであって、かつ対象フラグが1(=通報する)である場合に通報する」と定義されているものとする。また、通報辞書情報記憶部14には、図2に示す通報辞書情報が、また、通報辞書更新情報記憶部15には、図3に示す通報辞書更新情報が登録されているものとする。
コンソールメッセージ監視手段11は、監視対象であるコンピュータシステムS1〜S6から通報辞書情報記憶部14に登録された通報メッセージに合致するメッセージ、または通報辞書更新情報記憶部15に登録された辞書更新メッセージに合致するメッセージが出力されるのを検出するため、コンピュータシステムS1〜S6から出力されるコンソールメッセージを監視する。コンソールメッセージ監視手段11は、まず、通信ネットワーク40を介して監視対象のコンピュータシステムS1〜S6から出力されるコンソールメッセージを取得する(ステップS101:メッセージ取得処理)。コンソールメッセージ監視手段11は、例えば、インターネットやLAN(local area network)を介してコンピュータシステムから送信されるコンソールメッセージを受信することによって取得する。
次に、コンソールメッセージ監視手段11は、取得したコンソールメッセージが、通報メッセージに合致するメッセージか否かを判定する。コンソールメッセージ監視手段11は、例えば、取得したコンソールメッセージと合致するメッセージが通報辞書情報記憶部14に通報メッセージとして登録されているか否かを検索する。検索した結果、登録されている場合には、通報メッセージに合致するメッセージが出力されたとして、通報条件に合致するか否かを判定する(ステップS102:通報判断処理)。
本実施の形態では、コンソールメッセージ監視手段11は、検出された通報メッセージに対し、出力元コンピュータシステムにおける可変設定値に基づく通報条件の判定を行う。ここでは、検出された通報メッセージに対し、出力元コンピュータシステムにおける対象フラグの現在の値が、通報対象となっている場合に、通報条件に合致するとして、通報制御手段13に通報指示を出す(ステップS102のYes)。
コンソールメッセージ監視手段11から通報指示を受けた通報制御手段13は、例えば、予め設定された通報先(例えば、システムの管理者が用いる端末)に通報メッセージを送信することによって通報を行う(ステップS103:通報処理)。なお、図2に示す例では、もし”OS1 panic”が、コンピュータシステムS1から出力された場合には、対象フラグが1=通報すると設定されているので通報処理が行われ、コンピュータシステムS5から出力された場合には対象フラグが0=通報しないと設定されているので通報処理は行われないことになる。
なお、コンソールメッセージ監視手段11は、通報メッセージか否かを判定するだけで、通報制御手段13が、可変設定値に基づく通報条件の判定を行うことも可能である。例えば、対象フラグ以外に可変設定値がある場合や、可変設定値に応じて通報間隔等の制御が伴う場合には、通報制御手段13は、個々の判定や制御を行ったうえで、最終的に通報条件に合致した場合に通報処理を行うこともできる。
次に、コンソールメッセージ監視手段11は、取得したコンソールメッセージが、辞書更新メッセージに合致するメッセージか否かを判定する(ステップS104:更新判断処理)。コンソールメッセージ監視手段11は、例えば、取得したコンソールメッセージと合致するメッセージが通報辞書更新情報記憶部15に辞書更新メッセージとして登録されているか否かを検索する。検索した結果、登録されている場合には、コンソールメッセージ監視手段11は、辞書更新メッセージに合致するメッセージが出力されたとして、通報辞書更新手段12に更新指示を出す(ステップS104のYes)。
コンソールメッセージ監視手段11から更新指示を受けた通報辞書更新手段12は、検出された辞書更新メッセージに対応づけられた通報辞書更新情報に基づいて、通報辞書情報を更新する(ステップS105:通報辞書更新処理)。通報辞書更新手段12は、通報辞書更新情報記憶部15に記憶されている検出された辞書更新メッセージに対応づけられた通報辞書更新情報に基づいて、通報辞書情報記憶部14に記憶されている通報辞書情報に登録されている辞書更新メッセージの出力元コンピュータシステムにおける可変設定値を更新する。ここでは、辞書更新メッセージに対応づけて登録されている各通報メッセージの対象フラグの更新内容に基づいて、通報辞書情報に登録されている各通報メッセージの辞書更新メッセージの出力元コンピュータシステムにおける対象フラグの値を更新する。
図5は、コンピュータシステムS1から”OS2 boot”が出力された場合の更新例を示す説明図である。通報辞書更新手段12は、コンピュータシステムS1から”OS2 boot”が検出された場合には、通報辞書情報記憶部14に登録されている各通報メッセージのコンピュータシステムS1における対象フラグを、次のように変更する。図2および図3に示す登録例では、”OS1 panic”の対応フラグを1から0に、”OS2 pacic”の対応フラグを0から1に変更する。なお、本例では、”HW1”,”HW2”の対応フラグは変更対象外であるため、変更しない(現在の値のままとする)。
なお、通報対象となりうる通報メッセージが、通報辞書の更新トリガである辞書更新メッセージとなりうる場合、つまり、通報メッセージと辞書更新メッセージとでコンソールメッセージが重複する場合には、コンソールメッセージ監視手段11は、通報判断処理(ステップS102)と更新判断処理(ステップS104)とを独立に実行することも可能である。
このように、本実施の形態によれば、通報辞書更新手段12による辞書更新処理にて、通報辞書情報記憶部14の内容をコンピュータシステム毎の現在の稼働状態に合致した内容に動的に変更することにより、監視対象メッセージを選択し、通報対象の拡大や縮小などの通報対象制御を行うことができ、運用形態の変更等による誤通報や通報漏れを防ぐことができる。
また、本実施の形態では、コンピュータシステム毎に可変設定値を管理するので、複数システムを対象とする障害監視通報システムにおいて、各コンピュータシステムの運用形態に合致した通報制御を行うことができる。
なお、本実施の形態では、通報辞書更新の構成として、コンピュータシステムから出力されるコンソールメッセージと対応づけて更新内容を登録する例を示したが、例えば、運用形態の変更を制御卓装置30から制御する場合などに、制御卓装置30が運用形態の変化を示すメッセージを出力する場合には、制御卓装置30から出力されるメッセージと対応づけて登録することも可能である。そのような場合には、障害監視通報装置10は、制御卓装置30から出力されるメッセージを監視して、通報辞書情報を更新することになる。また、特定のメッセージと対応づけて更新内容を登録することによって、特定のメッセージをきっかけに通報辞書情報を更新することができるので、運用形態の変化に対応するだけでなく、保守時に所定の通報を制限するなど、通報対象を拡大・縮小する等の通報対象制御を自在に実現することができる。
また、本実施の形態では、可変設定値の例として、通報対象か否かを示す対象フラグを用いる場合を説明したが、対象フラグだけでなく、運用形態に応じて障害レベルが変化するような場合には、障害レベルを可変設定値とすることも可能である。また、運用形態に応じて障害となる上下限値が変化するような場合には、測定値を示すコンソールメッセージに対し、障害が発生したか否かを判定するための上下限値を可変設定値とすることも可能である。
本発明は、コンピュータシステムの障害を監視して通報する障害監視通報システムに好適に適用できる。
本発明による障害監視通報システムの構成例を示すブロック図。 通報辞書情報の登録例を示す説明図。 通報辞書更新情報の登録例を示す説明図。 本実施の形態による障害監視通報装置の動作例を示すフローチャート。 通報辞書情報の更新例を示す説明図。
符号の説明
S1〜S6 コンピュータシステム
10 障害監視通報装置
11 コンソールメッセージ監視手段
12 通報辞書更新手段
13 通報制御手段
14 通報辞書情報記憶部
15 通報辞書更新情報記憶部
30 制御卓装置
40 通信ネットワーク

Claims (11)

  1. コンピュータシステムの障害の発生を通報する障害監視通報システムであって、
    前記コンピュータシステムの障害の発生を監視する障害監視通報装置を備え、
    前記障害監視通報装置は、
    前記コンピュータシステムから出力される前記コンピュータシステムの運用状態を示すコンソールメッセージを監視する監視手段と、
    前記監視手段の監視結果に基づいて、コンピュータシステムの障害の発生を通報するための通報条件を設定する通報条件設定手段とを備えた
    ことを特徴とする障害監視通報システム。
  2. 障害監視通報装置は、通報条件設定手段が設定した通報条件に基づいて、コンピュータシステムから出力されるコンソールメッセージが示す障害の発生を通報する通報手段を備えた請求項1記載の障害監視通報システム。
  3. 通報条件設定手段は、所定のコンソールメッセージが出力された場合に、該コンソールメッセージに対応づけられた通報条件の設定内容を示す情報に基づいて、通報条件を設定する請求項1または請求項2に記載の障害監視通報システム。
  4. コンピュータシステムの障害の発生を通報する障害監視通報システムであって、
    前記コンピュータシステムの障害の発生を監視する障害監視通報装置を備え、
    前記障害監視通報装置は、
    前記コンピュータシステムの障害状態と稼働状態とを含む運用状態を示すコンソールメッセージの出力を検出する検出手段と、
    障害状態を示すコンソールメッセージに対応づけて、コンピュータシステムの障害の発生を通報するための通報条件にかかる設定情報であって、コンピュータシステムの運用形態に応じて変化する設定情報を記憶する設定情報記憶手段と、
    所定のコンソールメッセージが検出された場合に、前記設定情報記憶手段に記憶されている設定情報を更新する設定情報更新手段と、
    前記設定情報記憶手段に記憶されているコンソールメッセージが検出された場合に、該コンソールメッセージに対応づけて記憶されている設定情報に基づいて通報制御を行う通報制御手段とを備えた
    ことを特徴とする障害監視通報システム。
  5. 障害監視通報装置は、
    所定のコンソールメッセージに対応づけて、前記設定情報に記憶されている各コンソールメッセージの設定情報の更新内容を示す設定更新情報を記憶する設定更新情報記憶手段を備え、
    設定情報更新手段は、前記設定更新情報記憶手段に記憶されているコンソールメッセージが検出された場合に、該コンソールメッセージに対応づけて記憶されている設定更新情報に基づいて、設定情報記憶手段に記憶されている設定情報を更新する
    請求項4記載の障害監視通報システム。
  6. 複数のコンピュータシステムの障害の発生を通報する障害監視通報システムであって、
    設定情報記憶手段は、コンピュータシステム毎に設定情報を記憶し、
    設定情報更新手段は、所定のコンソールメッセージが検出された場合に、前記設定情報記憶手段に記憶されている該コンソールメッセージの対象コンピュータシステムの設定情報を更新し、
    通報制御手段は、前記設定情報記憶手段に記憶されているコンソールメッセージが検出された場合に、該コンソールメッセージに対応づけて記憶されている該コンソールメッセージの対象コンピュータシステムの設定情報に基づいて、通報制御を行う
    請求項4記載の障害監視通報システム。
  7. 複数のコンピュータシステムの障害の発生を通報する障害監視通報システムであって、
    設定情報更新手段は、設定更新情報記憶手段に記憶されているコンソールメッセージを受信した場合に、該コンソールメッセージに対応づけて記憶されている設定更新情報に基づいて、設定情報記憶手段に記憶されている該コンソールメッセージの対象コンピュータシステムの設定情報を更新する
    請求項5記載の障害監視通報システム。
  8. 設定情報記憶手段は、障害状態を示すコンソールメッセージに対応づけて、少なくとも通報対象か否かを示す対象フラグを設定情報として記憶し、
    設定情報更新手段は、所定のコンソールメッセージが検出された場合に、前記設定情報記憶手段に記憶されている対象フラグを更新し、
    通報制御手段は、前記設定情報記憶手段に記憶されているコンソールメッセージが検出された場合に、該コンソールメッセージに対応づけて記憶されている対象フラグが通報対象か否かを判定し、通報対象である場合に通報を行う
    請求項4から請求項7のうちのいずれか1項に記載の障害監視通報システム。
  9. 設定情報更新手段は、運用形態の変化を示すコンソールメッセージが検出された場合に、稼働中または実装中のユニットの障害を示すコンソールメッセージを通報対象とし、非稼働中または未実装のユニットの障害を示すコンソールメッセージを通報対象外とする旨の更新を行う請求項8記載の障害監視通報システム。
  10. コンピュータシステムの障害の発生を監視して通報する障害監視通報装置であって、
    前記コンピュータシステムの障害状態と稼働状態とを含む運用状態を示すコンソールメッセージの出力を検出する検出手段と、
    障害状態を示すコンソールメッセージに対応づけて、コンピュータシステムの障害の発生を通報するための通報条件にかかる設定情報であって、コンピュータシステムの運用形態に応じて変化する設定情報を記憶する設定情報記憶手段と、
    所定のコンソールメッセージが検出された場合に、前記設定情報記憶手段に記憶されている設定情報を更新する設定情報更新手段と、
    前記設定情報記憶手段に記憶されているコンソールメッセージが検出された場合に、該コンソールメッセージに対応づけて記憶されている設定情報に基づいて通報制御を行う通報制御手段とを備えた
    ことを特徴とする障害監視通報装置。
  11. コンピュータシステムの障害の発生を監視して通報するための障害監視通報プログラムであって、
    コンピュータに、
    前記コンピュータシステムの障害状態と稼働状態とを含む運用状態を示すコンソールメッセージの出力を検出する処理、
    所定のコンソールメッセージが検出された場合に、障害状態を示すコンソールメッセージに対応づけて記憶されている、コンピュータシステムの障害の発生を通報するための通報条件にかかる設定情報であって、コンピュータシステムの運用形態に応じて変化する設定情報を更新する処理、および
    障害状態を示すコンソールメッセージが検出された場合に、該コンソールメッセージに対応づけて記憶されている設定情報に基づいて通報制御を行う処理
    を実行させるための障害監視通報プログラム。
JP2006054627A 2006-03-01 2006-03-01 障害監視通報システム、障害監視通報装置、および障害監視通報プログラム Pending JP2007233686A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006054627A JP2007233686A (ja) 2006-03-01 2006-03-01 障害監視通報システム、障害監視通報装置、および障害監視通報プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006054627A JP2007233686A (ja) 2006-03-01 2006-03-01 障害監視通報システム、障害監視通報装置、および障害監視通報プログラム

Publications (1)

Publication Number Publication Date
JP2007233686A true JP2007233686A (ja) 2007-09-13

Family

ID=38554221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006054627A Pending JP2007233686A (ja) 2006-03-01 2006-03-01 障害監視通報システム、障害監視通報装置、および障害監視通報プログラム

Country Status (1)

Country Link
JP (1) JP2007233686A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016021207A (ja) * 2014-07-16 2016-02-04 株式会社リコー 機器管理装置、機器管理システム、情報処理方法、及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001053947A1 (fr) * 2000-01-18 2001-07-26 Fujitsu Limited Dispositif de compte-rendu d'information de message pour systeme sous surveillance
JP2001337848A (ja) * 2000-05-24 2001-12-07 Nec Software Chubu Ltd 稼働情報監視システム
JP2005004723A (ja) * 2003-05-20 2005-01-06 Hitachi Ltd 管理項目管理システム及び方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001053947A1 (fr) * 2000-01-18 2001-07-26 Fujitsu Limited Dispositif de compte-rendu d'information de message pour systeme sous surveillance
JP2001337848A (ja) * 2000-05-24 2001-12-07 Nec Software Chubu Ltd 稼働情報監視システム
JP2005004723A (ja) * 2003-05-20 2005-01-06 Hitachi Ltd 管理項目管理システム及び方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016021207A (ja) * 2014-07-16 2016-02-04 株式会社リコー 機器管理装置、機器管理システム、情報処理方法、及びプログラム

Similar Documents

Publication Publication Date Title
CN103377094B (zh) 异常监测方法和装置
EP2251790A1 (en) Server device, method of detecting failure of server device, and program of detecting failure of server device
JP2006277062A (ja) アプリケーション管理装置およびそのソフトウェアを格納した記憶媒体
WO2017120106A1 (en) Deferred server recovery in computing systems
CN110445650B (zh) 检测报警方法、设备及服务器
US9798625B2 (en) Agentless and/or pre-boot support, and field replaceable unit (FRU) isolation
CN113127201A (zh) 故障应用服务器隔离方法及装置、电子设备和存储介质
JP2012080181A (ja) 障害情報管理方法および障害情報管理プログラム
US20050033952A1 (en) Dynamic scheduling of diagnostic tests to be performed during a system boot process
JP2010231293A (ja) 監視装置
JP2007233686A (ja) 障害監視通報システム、障害監視通報装置、および障害監視通報プログラム
US20080216057A1 (en) Recording medium storing monitoring program, monitoring method, and monitoring system
CN111737060A (zh) 处理组件异常的方法、装置及电子设备
JP2017207903A (ja) 処理装置、方法及びプログラム
CN110567515A (zh) 一种故障预警方法、装置及智能楼宇控制系统
CN112181780A (zh) 容器化平台核心组件的检测及告警方法、装置及设备
JP5268820B2 (ja) 監視装置用プログラムの書き換え方法
JP2007286707A (ja) 機器診断システム
US11636013B2 (en) Event-driven system failover and failback
CN114443439B (zh) 基于arm服务器的控制方法、装置、设备以及存储介质
JP6474962B2 (ja) 情報処理装置、情報処理装置における障害検知方法、および情報処理装置における障害検知プログラム
JP2011259032A (ja) 監視システム
JP6863013B2 (ja) 情報処理装置、コンピュータシステム、監視システム構築方法およびコンピュータプログラム
JP5034474B2 (ja) 施設管理システムの地震発生時の優先制御方法
JP2008293441A (ja) 機器障害予測方法及び機器障害予測装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100914

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110208