JP2003228497A - 障害通知システムおよび障害通知プログラム - Google Patents
障害通知システムおよび障害通知プログラムInfo
- Publication number
- JP2003228497A JP2003228497A JP2002027445A JP2002027445A JP2003228497A JP 2003228497 A JP2003228497 A JP 2003228497A JP 2002027445 A JP2002027445 A JP 2002027445A JP 2002027445 A JP2002027445 A JP 2002027445A JP 2003228497 A JP2003228497 A JP 2003228497A
- Authority
- JP
- Japan
- Prior art keywords
- message
- information
- output
- group
- presentation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
ペレータに提示できるようにする。 【解決手段】 一つの障害に起因する一連の障害によっ
て発生する各メッセージを一つのグループに属するメッ
セージとして関連づけ、そのグループに対応する代表メ
ッセージを定める。また、各メッセージがどのグループ
に属するのかを示す情報も保持する。一つのメッセージ
を受信すると、そのメッセージがどのグループに属する
のかを判断する。そして、受信したメッセージが、同じ
グループに属する他の各メッセージの受信時刻を基準と
する有効期間以内に受信されているか否かを判断する。
他の各メッセージの受信時刻を基準とする有効期間以内
に受信されているならば、予め定められている代表メッ
セージを出力する。
Description
で障害が生じた場合に障害の発生を通知する障害通知シ
ステムおよび障害通知プログラムに関する。
下、CPUと記す。)、記憶装置等の様々な機器を備え
ている。これらの各機器は、障害を検出すると障害を通
知するメッセージ(通知電文)を出力し、CPUはこの
メッセージを出力装置に出力する。オペレータはメッセ
ージを解析して障害の原因を究明する。なお、各機器が
メッセージを出力するのではなく、CPUが各機器を監
視し、CPU自身が各機器の障害に応じたメッセージを
出力する場合もある。情報処理システムによっては、各
機器等が通常運用時(障害が発生していないとき)に障
害の通知以外の目的でメッセージを出力することもあ
る。
すると、その障害に起因して他の箇所でも障害が生じ、
障害が発生した各箇所が個々にメッセージを出力する。
従って、一つの障害に起因して多くのメッセージが出力
されてしまう。多くのメッセージから根本的な障害の原
因を解析する作業は慣れや経験を必要とし、また、作業
時間がかかるという問題がある。
の数を減らして、オペレータの解析負担を軽減させるた
め装置等が種々提案されている。例えば、特開2000
−183881号公報には、あるメッセージに続いて発
生するメッセージの情報を保持し、障害発生時に最初に
発生したメッセージに続く次のメッセージの発生を監視
し、そのメッセージが発生したら更に次のメッセージの
発生を監視する障害分析装置が記載されている。この障
害分析装置は、次ぎに続くメッセージがない最後のメッ
セージが発生したとき、このメッセージに対する障害分
析結果を出力する。しかし、そのような障害分析装置で
は、予め各メッセージが出力される順番を把握しておか
なければならない。複数の障害が同時に発生することに
よって新たな障害が生じるような場合には、各メッセー
ジの順番を定めにくく、障害分析が困難であった。
は、最初にメッセージが発生してから時間tmの間に発
生したメッセージをメッセージバッファに格納し、時間
tmが経過してから時間trの間に発生したメッセージ
を予備メッセージバッファに格納する障害メッセージ出
力制御システムが記載されている。この障害メッセージ
出力制御システムは、メッセージバッファ内のメッセー
ジで優先度の高いメッセージを抽出し、他のメッセージ
の出力を抑止する。予備メッセージバッファ内のメッセ
ージについても優先度の高いメッセージを抽出し、他の
メッセージの出力を抑止する。この時間tm,trは、
制御系(CP系)、入出力系(IO系)等の系統毎に定
める。
御システムでは、優先度の低いメッセージの出力を的確
に抑止できない場合があった。例えば、一つの根本的な
障害の発生に伴ってメッセージM1〜M5が順番に発生
したとする。そして、オペレータに通知すべきのメッセ
ージは、メッセージM3であるとする。なお、オペレー
タに通知すべきメッセージが最初に発生するとは限らな
い。時間tmの間にメッセージM1〜M3が発生し、そ
の後の時間trの間にメッセージM4,M5が発生した
場合には、メッセージM3以外に、出力を抑止すべきメ
ッセージM4またはM5も出力してしまう。
ジM1〜M5が同じメッセージバッファに格納されるよ
うにすれば、メッセージM3のみを抽出し、他のメッセ
ージの出力を抑止できる。しかし、時間tmを大きく設
定すると、根本的な障害に伴う各メッセージが短時間の
間に発生する場合であっても、時間tmの経過を待たね
ばならず、オペレータへのメッセージの提示が遅れるこ
ともある。
害に伴って出力される各メッセージがメッセージバッフ
ァに蓄積され、その中から最も優先度の高いメッセージ
のみを抽出すると、独立した二つの障害のうち一方しか
オペレータに通知されないことになってしまう。
する場合には、通常運用時におけるメッセージの出力時
から時間tm経過するまでに発生したメッセージがメッ
セージバッファに格納される。この時間tmの間に障害
が発生すると、その障害に伴って出力されるメッセージ
がメッセージバッファと予備メッセージバッファに分散
されてしまい、抑止すべきメッセージが出力されてしま
う場合もある。例えば、障害に無関係なメッセージの出
力から時間tmの間に障害が発生し、メッセージM1〜
M3がメッセージバッファに格納され、メッセージM
4,M5が予備メッセージバッファに格納されたとす
る。この場合、オペレータに提示すべきメッセージM3
だけでなく、M4またはM5も出力されてしまう。
ような場合にどのようなメッセージをオペレータに提示
するのかを任意に定められることが好ましい。例えば、
オペレータに提示するメッセージの内容等を任意に設定
できることが好ましい。しかし、従来のシステムではこ
のような設定ができなかった。
ージ以外のメッセージの提示を的確に抑止できるように
することを目的とする。また、本発明は、発生するメッ
セージの順番に関わりなく、提示すべきメッセージをオ
ペレータに提示できるようにすることを目的とする。ま
た、どのような場合にどのようなメッセージを提示する
のかを任意に設定できるようにすることを目的とする。
ステムは、障害によってメッセージを発生させる情報処
理システムに適用される障害通知システムであって、新
たに一つのメッセージが発生したときに、オペレータに
提示すべき提示メッセージを出力すべきか否かを判断す
る判断手段と、判断手段が出力すべきと判断した提示メ
ッセージを出力する提示メッセージ出力手段とを備えた
ことを特徴とする。
障害によって発生するメッセージのグループに属する一
つのメッセージが新たに発生したときに、提示メッセー
ジを出力すべきか否かを判断する。
ージが発生した場合に、そのメッセージが属するグルー
プの他の全てのメッセージが既に発生していて、かつ、
新たなメッセージの発生確認時刻とグループ内の各メッ
セージの発生確認時刻との差が各メッセージ毎に定めら
れた各所定時間以内であれば、新たなメッセージが属す
るグループに対応する提示メッセージを出力すべきと判
断する。そのような構成によれば、メッセージの発生順
序が変化する場合であっても、提示メッセージを出力す
べきか否かを判断することができる。
によって発生する各メッセージを一つのグループに属す
るメッセージとして関連付け、グループ毎に、関連付け
られた各メッセージの情報と提示メッセージの情報とを
対応させて保持する関連付け情報保持手段を備え、判断
手段は、新たなメッセージが属するグループの他の全て
のメッセージが既に発生しているか否か、および、新た
なメッセージの発生確認時刻とグループ内の各メッセー
ジの発生確認時刻との差が各メッセージ毎に定められた
各所定時間以内であるか否かを、関連付け情報保持手段
が保持する情報に基づいて判断する。
報と、各提示メッセージの内容とを対応させて保持する
提示メッセージ情報保持手段と、少なくとも、関連付け
られた各メッセージの情報と、その各メッセージが属す
るグループに対応する提示メッセージの内容とを入力す
る入力手段と、入力手段が入力した提示メッセージの内
容と、その提示メッセージの識別情報とを対応させて提
示メッセージ情報保持手段に保持させ、関連付けられた
各メッセージの情報とその各メッセージが属するグルー
プに対応する提示メッセージの識別情報とを対応させて
関連付け情報保持手段に保持させる情報設定手段とを備
えることが好ましい。そのような構成によれば、管理者
が提示メッセージの内容を任意に定めることができるの
で、オペレータが解析しやすいように提示メッセージの
内容を定めることができる。
の情報として、各メッセージ毎に定められた各所定時間
の情報を含む情報を入力してもよい。そのような構成に
よれば、管理者が各メッセージ毎の所定時間を定めるこ
とができる。
複数のグループに属している場合、新たに発生したメッ
セージが属するそれぞれのグループ毎に、提示メッセー
ジを出力すべきか否かを判断することが好ましい。その
ような構成によれば、独立した別個の障害が複数発生し
たとしても、各障害について提示メッセージを出力する
ことができる。
は、情報処理システムが障害によりメッセージを発生さ
せたときに、オペレータに提示すべき提示メッセージを
出力する障害通知プログラムであって、コンピュータ
に、新たに一つのメッセージが発生した場合に、一つの
障害に起因する一連の障害によって発生するメッセージ
のグループのうち、新たに発生したメッセージが属する
グループを特定し、特定したグループに対応する提示メ
ッセージを出力すべき否かを判断する機能、および提示
メッセージを出力すべきと判断したときに、提示メッセ
ージを出力する機能を実現させることを特徴とする。
を参照して説明する。図1は、本発明による障害通知シ
ステムの実施の一形態を示す説明図であり、本発明を一
台の情報処理システムに適用した場合を示す。本例に示
す障害通知システム1は、本発明が適用される情報処理
システム20のCPU2と、記憶装置3と、出力装置1
0と、入力装置11とを備える。CPU2は、記憶装置
3が備える障害通知プログラム4に従って、オペレータ
に提示すべき提示メッセージの出力処理等の本例に示す
処理を行う。また、記憶装置3は、情報処理システム2
0の機能を実現するためのプログラム(図示せず)も記
憶し、CPU2は、このプログラムに従って情報処理シ
ステム20が目的とする機能を実現する。
置によって構成される。入力装置11は、例えば、キー
ボード等によって構成される。
は、CPU2、記憶装置3、出力装置10、入力装置1
1以外の機器を備えていてもよい。図1では、通信ネッ
トワークとの間で情報を入出力するネットワークインタ
フェース部21を備える場合を示す。情報処理システム
20が備える機器は、システムによって異なる。
ば、記憶装置3、ネットワークインタフェース部21
等)は、障害が発生するとメッセージをCPU2に出力
する。CPU2に障害が発生したときは、CPU2がメ
ッセージを生成する。各メッセージには、個々のメッセ
ージを識別するためのIDであるメッセージID(以
下、MIDと記す。)が割り当てられる。
たと判断すると、障害毎に予め定められた、オペレータ
に提示すべき提示メッセージを出力装置10に出力す
る。以下、この提示メッセージを代表メッセージと記
す。代表メッセージの内容(本文)は、情報処理システ
ム20の管理者によって定められる。管理者は障害毎に
代表メッセージを定めるので、代表メッセージは複数存
在する。各代表メッセージにもMIDが割り当てられ
る。なお、障害通知システム1が、管理者が定めた情報
を登録するときの動作については後述する。
発生する各メッセージは、同じグループに属するメッセ
ージとして関連付けられる。そして、同じグループに属
するとして関連付けられた各メッセージの情報と、その
グループに対応する代表メッセージとの対応関係を示す
情報を、以下、メッセージコリレーションと記す。関連
付けられるメッセージの組み合わせは、後述するよう
に、管理者によって定められる。
その障害に起因して情報処理システム20が備える各機
器が複数のメッセージを出力するとする。この場合、一
つのメッセージコリレーションによって、関連づけられ
ている複数のメッセージが特定される。また、そのメッ
セージコリレーションによって、オペレータに提示すべ
き代表メッセージも特定される。別の障害発生時に出力
されるメッセージのグループについても、他のメッセー
ジコリレーションによって、関連付けられる各メッセー
ジと、オペレータに提示すべき代表メッセージが特定さ
れる。各メッセージコリレーションには、個々のメッセ
ージコリレーションを識別するためのIDであるメッセ
ージコリレーションID(以下、CIDと記す。)が割
り当てられる。
は一つのグループだけに属するとは限らず、複数のグル
ープに属していてもよい。例えば、あるメッセージが、
障害Xの発生時にも、別の障害Yの発生時にも出力され
るのであれば、そのメッセージは複数のグループに属す
ることになる。
ージが、どのメッセージコリレーションに含まれている
のかを示す情報を保持する。メッセージマスタテーブル
(以下、MMTと記す。)5は、この情報を保持する領
域である。図2は、MMT5に保持される情報の例を示
す。一つのメッセージが、あるメッセージコリレーショ
ンのグループに属するメッセージとして関連づけられて
いるならば、そのメッセージのMIDに対応付けられ
て、そのメッセージコリレーションのCIDが保持され
る。メッセージが複数のグループに属するならば、その
メッセージのMIDに対して複数のCIDが対応付けら
れる。そして、各メッセージのMID毎にCIDが保持
される。図2に示す例では、MID_1のメッセージ
は、CID_1のメッセージコリレーションのグループ
に属しているとともに、CID_2やCID_3等のメ
ッセージコリレーションのグループにも属していること
になる。
ーションの情報を保持する。コリレーションマスタテー
ブル(以下、CMTと記す。)6は、各メッセージコリ
レーションの情報を保持する領域である。図3は、CM
T6に保持される情報の例を示す。図3に示すように、
各メッセージコリレーションでは、各メッセージコリレ
ーションのCIDと、代表メッセージのMIDと、同じ
グループに属するとして関連づけられたメッセージの情
報とを対応させる。また、関連づけられたメッセージの
情報には、メッセージ毎にMIDと、有効期間と、メッ
セージの発生確認時刻とを含める。
ジを受信したときの時刻またはCPU2がメッセージを
生成したときの時刻を、メッセージの発生確認時刻とす
る場合について説明する。以下、メッセージの発生確認
時刻を受信時刻と記す。受信時刻の初期値は、例えば、
データがない旨の情報(以下、NULLと記す。)とし
て定める。その後、CPU2がメッセージを受信または
生成すると、CPU2は受信時刻を更新する。図3に示
す例では、CPU2が「時刻1」にMID_1のメッセ
ージを受信したことを示している。また、MID_4の
メッセージはまだ出力されていないことを示している。
ときに代表メッセージを出力装置10に出力する。第一
の条件は、同じグループに属するとして関連づけられた
全てのメッセージの受信時刻がNULLでないことであ
る。すなわち、グループ内の各メッセージがCPU2に
受信されていることである。第二の条件は、最後に出力
されたメッセージの受信時刻が、先に出力された各メッ
セージの受信時刻から各メッセージ毎に定められた各所
定時間以内であることである。関連づけられたメッセー
ジの情報に含まれる有効期間は、この所定期間を示す。
ジコリレーションは、MID_1〜MID_3の三つの
メッセージのみを関連づけているとする。図4は、CP
U2がこの三つのメッセージを受信するタイミングの例
を示す。図4(a)に示す場合、最後に出力されたMI
D_3のメッセージの受信時刻は、先に出力されたMI
D_1のメッセージの受信時刻からの所定時間(有効期
間T1)以内であり、MID_2のメッセージの受信時
刻からの所定時間(有効期間T2)以内である。従っ
て、第一の条件と第二の条件をともに満たすので、CP
U2は代表メッセージを出力装置10に出力する。
MID_3のメッセージの受信時刻は、先に出力された
MID_1のメッセージの受信時刻からの所定時間(有
効期間T1)以内であるが、MID_2のメッセージの
受信時刻からの所定時間(有効期間T2)以内に入って
いない。従って、第二の条件を満たさないので、CPU
2は、三つのメッセージを受信した場合でも代表メッセ
ージを出力しない。
限らない。図4(c)は、MID_3,MID_2,M
ID_1の順に出力された場合の例である。最後に出力
されたMID_1のメッセージの受信時刻は、先に出力
されたMID_3のメッセージの受信時刻からの所定時
間(有効期間T3)以内であり、MID_2のメッセー
ジの受信時刻からの所定時間(有効期間T2)以内であ
る。従って、第一の条件と第二の条件をともに満たすの
で、CPU2は代表メッセージを出力装置10に出力す
る。
は限らない。図3に示す例では、MID_1の有効期限
は、CID_1のメッセージコリレーションではT1で
あるが、CID_4のメッセージコリレーションではT
4である。このように複数のメッセージコリレーション
が共通のメッセージを含んでいる場合、そのメッセージ
の有効期間はメッセージコリレーション毎に異なってい
てもよい。
ジや管理者によって定められた代表メッセージのMID
と、メッセージの本文との対応関係を示す情報を保持す
る。メッセージボディテーブル(以下、MBTと記
す。)7は、この情報を保持する領域である。管理者が
代表メッセージを定めていない場合、MBT7には各機
器が出力するメッセージのMIDと本文との対応関係の
みが登録される。その後、管理者が代表メッセージを定
めると、代表メッセージのMIDと本文の対応関係の情
報が追加される。図5は、MBT7に保持される情報の
例を示す。CPU2は、第一の条件と第二の条件を満た
したときに、CMT6から代表メッセージのMIDを特
定し、そのMIDに対応する本文の情報をMBT7から
抽出する。そして、その本文を出力装置10に出力す
る。
ション定義ファイル(以下、定義ファイルと記す。)8
を記憶する。定義ファイル8は、MMT5、CMT6、
およびMBT7の内容を決定するためのテキストファイ
ルであり、オペレータによって入力される。オペレータ
は所定の書式に従って定義ファイル8を作成する。図6
(a)は定義ファイル8の書式の例を示す。本例では、
一つのメッセージコリレーションの情報を1行のテキス
トとして作成する場合の例を示す。なお、1行のテキス
トとは、テキスト情報の先頭から改行文字まで、または
改行文字から改行文字までのテキストのことである。図
6に例示する書式の場合、オペレータが定めたCID、
代表メッセージのMID、代表メッセージの本文の順に
テキスト情報を作成し、本文に続いて、関連づける各メ
ッセージのMID、有効期間を繰り返す。図6(b)
は、この書式に従って作成した定義ファイル8の例を示
す。
に属することになるか、各メッセージの有効期間をどの
ような値にするか、および代表メッセージの本文を定め
て、定義ファイル8を作成し、入力装置10から入力す
る。管理者は、メッセージの本文として、障害の解決方
法や技術情報等を書き込んでもよい。CPU2は、入力
された定義ファイル8を記憶装置3に記憶し、定義ファ
イル8に基づいてMMT5、CMT6、およびMBT7
に情報を登録する。管理者は、定義ファイル8に新たな
メッセージコリレーションを追加してもよい。その場
合、CPU2は再度定義ファイル8を読み込んで、追加
された情報をMMT5等に登録する。
CMT6によって実現される。判断手段および情報設定
手段はCPU2によって実現される。提示メッセージ出
力手段は、出力装置10によって実現される。提示メッ
セージ情報保持手段は、MBT7によって実現される。
入力手段は、入力装置11によって実現される。
たに一つのメッセージが発生した場合に、一つの障害に
起因する一連の障害によって発生するメッセージのグル
ープのうち、新たに発生したメッセージが属するグルー
プを特定し、特定したグループに対応する提示メッセー
ジを出力すべきか否かを判断する機能、および提示メッ
セージを出力すべきと判断したときに、提示メッセージ
を出力する機能を実現させるための障害通知プログラム
を保持する。
ル8に基づいてMMT5等に情報を登録するときの動作
について説明する。図7は、MMT5等への情報登録時
の処理経過の例を示す流れ図である。最初に、CPU2
は、記憶装置3が記憶する定義ファイル8をオープンす
る(ステップS1)。すなわち、定義ファイル8からデ
ータを読み込める状態にする。続いて、定義ファイル8
に定められた各メッセージコリレーションについて、以
下に示す処理を行う。本例の場合、定義ファイル8の行
数だけ、以下の処理を繰り返す。
行分のデータを読み込む(ステップS2)。1行分のデ
ータには、一つのメッセージコリレーションの情報が含
まれる。CPU2は、その1行分のデータから、代表メ
ッセージの本文を取得する(ステップS3)。そして、
CPU2は、代表メッセージの本文をMBT7に追加登
録する。また、読み込んだ1行分のデータから代表メッ
セージのMIDも取得して、本文と対応させてMBT7
に追加登録する(ステップS4)。次に、CPU2は、
読み込んだ1行分のデータからCIDを取得し、そのC
IDと代表メッセージのMIDとを対応させてCMT6
に追加登録する(ステップS5)。
分のデータに含まれるMID(有効期間に対応している
MID)毎に、以下のステップS6からステップS13
までの処理を行う。すなわち、MIDの数だけステップ
S6からステップS13までの処理を繰り返す。CPU
2は、1行分のデータから、対応しているMIDおよび
有効期間の情報を1組取得する(ステップS6)。そし
て、ステップS6で取得したMIDが既にMMT5に登
録されているか否かを判断する(ステップS7)。
に登録されていないならば、CPU2は、MMT5にそ
のMIDを新たに登録する(ステップS8)。また、そ
のMIDの受信時刻の初期値を定める(ステップS
9)。本例では、受信時刻の初期値をNULLと定め
る。
に登録されているならば、CPU2は、MMT5から、
そのMIDに対応するCIDを一つ取得する(ステップ
S10)。MIDに対応するCIDが複数あるならば、
その中から任意のCIDを取得する。そして、CPU2
は、そのCIDを用いて、ステップS6で取得したMI
Dに対応する受信時刻をCMT6から取得する(ステッ
プS11)。ステップS11において、CPU2は、C
IDに対応する情報をCMT6から取得し、その情報の
中からMIDに対応する受信時刻を取得する。
CPU2は、ステップS5で取得したCID(1行分の
データから取得したCID)を、ステップS6で取得し
たMIDに対応させてMMT5に追加登録する(ステッ
プS12)。続いてCPU2は、ステップS6で取得し
たMIDおよび有効期間と、ステップS9またはステッ
プS11で取得した受信時刻とをCMT6に追加登録す
る(ステップS13)。このとき、CPU2は、MI
D、有効期間、および受信時刻を、ステップS5で取得
したCIDに対応させて登録する。
行分のデータから次のMIDおよび有効期間の情報を取
得して、ステップS6からステップS13までの動作を
繰り返す。一行分のデータに含まれる各MIDについ
て、ステップS6からステップS13までの処理を終了
したならば、ステップS2で読み込んだ1行分のデータ
に対する処理を終了する。そして、CPU2は、次の1
行分のデータを定義ファイル8から読み込んで、ステッ
プS2以降の動作を繰り返す。定義ファイル8の各行の
データについて処理を終了したならば、定義ファイル8
をクローズする(ステップS14)。すなわち、ファイ
ルオープン前の状態にする。
U2が受信して、代表メッセージを出力するか否かの判
断を行うときの動作について説明する。図8は、メッセ
ージ受信時の処理経過の例を示す流れ図である。CPU
2は、一つのメッセージを受信するとそのメッセージの
MIDを確認する(ステップS21)。そして、そのM
IDがMMT5に登録されているか否かを判断する(ス
テップS22)。登録されていないならば、処理を終了
する。
登録されているならば、CPU2は障害通知システム1
が管理している時刻を確認する(ステップS23)。こ
の時刻がメッセージの受信時刻となる。次に、CPU2
は、MMT5から、受信したメッセージのMIDに対応
する全てのCIDを取得する(ステップS24)。CP
U2は、取得した各CID毎に、以下に示す処理を行
う。すなわち、取得したCIDの数だけ以下の処理を繰
り返す。
に対応するCIDの中から一つのCIDを抽出する(ス
テップS25)。そして、CMT6から、そのCIDに
対応する各情報を取得する(ステップS26)。すなわ
ち、CIDに対応する代表メッセージのMIDおよび、
同じグループに属するとして関連付けられた各メッセー
ジのMID、有効期間、受信時刻の情報を取得する。C
PU2は、関連付けられた各メッセージのうち、受信し
たメッセージのMIDに対応する受信時刻をステップS
23で確認した時刻に更新する(ステップS27)。ま
た、CMT6に保持される受信時刻の情報も更新する。
例えば、図3に例示する情報の中からCID_1に対応
する各情報を取得して、MID_1に対応する受信時刻
を更新したとする。このとき、取得した情報だけでな
く、CMT6でMID_1に対応して保持される受信時
刻も更新する。
ッセージの出力条件(上述の第一の条件および第二の条
件)が満たされているか否かを確認するために用いるカ
ウント値を0に初期化する。そして、ステップS26で
取得した情報に含まれるMID、有効期間、および受信
時刻の各組み合わせ毎に以下の処理を行う。すなわち、
MID、有効期間、および受信時刻の組み合わせの数だ
け以下の処理を行う。
ら取得した情報の中から、MID、有効期間、および受
信時刻の組み合わせを一組抽出する(ステップS2
8)。そして、その受信時刻がNULLではなく、か
つ、抽出したMIDの受信時刻と、新たに受信したメッ
セージの受信時刻(ステップS23で確認した時刻)の
差が、抽出した有効期間以下であるという条件を満たし
ているか否かを判断する(ステップS29)。この条件
が満たされているならば、カウント値を1増加し(ステ
ップS30)、他の組み合わせについてステップS28
以降の動作を繰り返す。また、条件が満たされていなけ
れば、カウント値を増加せずに、他の組み合わせについ
てステップS28以降の動作を繰り返す。
受信した結果、ステップS26で、図3に例示するCI
D_1に対応する情報を取得したとする。また、取得し
た情報のうち、MID_3に対応する受信時刻を「時刻
3」に更新したとする。この場合、ステップS28で
は、MID_1、T1(有効期間)、時刻1(受信時
刻)という組み合わせを抽出する。そして、ステップS
29では、時刻1がNULLではないことを確認する。
また、時刻1と時刻3の差が、有効期間T1以下である
ことを確認する。これらの確認ができたならばカウント
値を1増加し、確認できなかったならばカウント値を増
加しない。続いて、MID_2、T2(有効期間)、時
刻2(受信時刻)という組み合わせを抽出し、同様の処
理を行う。
_3のメッセージであるので、次に抽出されるMID_
3、T3(有効期間)、時刻3(受信時刻)という組み
合わせでは、ステップS29の条件は満たされる。
の処理を行ったならば、ステップS28から始まる繰り
返し処理を終了する。次にCPU2は、カウント値がM
ID、有効期間、受信時刻の組み合わせの数と等しいか
否かを判断する(ステップS31)。等しくなければ、
代表メッセージの出力条件(上述の第一の条件および第
二の条件)が満たされていないことになる。この場合、
ステップS24で取得したCIDのうち、他のCIDに
ついてステップS25以降の動作を繰り返す。
信時刻の組み合わせの数と等しければ、代表メッセージ
の出力条件は満たされている。この場合、CPU2は、
ステップS26でCMT6から取得した情報の中から代
表メッセージのMIDを抽出する(ステップS32)。
CPU2は、このMIDに対応する代表メッセージの本
文をMBT7から取得し(ステップS33)、出力装置
11に表示する(ステップS34)。その後、ステップ
S24で取得したCIDのうち、他のCIDについてス
テップS25以降の動作を繰り返す。各CIDについて
ステップS25以降の動作を行ったならば処理を終了す
る。
各機器が複数のメッセージを出力したとしても、代表メ
ッセージのみを出力する。従って、慣れや経験のないオ
ペレータでも、障害の原因を解析しやすくなる。また、
管理者は代表メッセージの本文の内容を任意に設定でき
るので、代表メッセージとして障害の解決方法や技術情
報等も出力でき、オペレータの負担を一層軽減できる。
ープに属するメッセージが全て出力されていたとして
も、出力されたタイミングも考慮して代表メッセージを
出力すべきか否かを判断できる。そして、管理者は、有
効期間も任意に設定できる。従って、障害毎に適切に代
表メッセージの出力条件を定めることができる。例え
ば、ある障害発生時にはMID_1のメッセージはすぐ
に出力されるが、別の障害発生時には遅れて出力される
ような場合、障害毎に有効期間を変更することができ
る。また、ある障害発生時には短時間の間に集中的に同
じグループのメッセージが出力されるが、別の障害発生
時には時間をおいて出力されるような場合であっても、
障害毎に各メッセージの有効期間を設定できる。よっ
て、様々な障害について、代表メッセージを出力すべき
条件が満たされたならば、直ちに代表メッセージを出力
するようにできる。
外の目的でメッセージを出力することがある情報処理シ
ステムである場合、そのようなメッセージに対しても代
表メッセージを定義することで、有効な情報を代表メッ
セージとしてまとめて出力させることができる。例え
ば、いくつかのソフトウェアが起動して一つのまとまっ
た処理を行う処理系の場合、個々のソフトウェアが起動
完了時に出すメッセージを監視し、一つの代表メッセー
ジに束ねて出力させることで、管理者は処理系単位でシ
ステムの稼働状況を把握することができる。
メッセージの順番に関わりなく、メッセージを受信する
度に代表メッセージを出力するか否かを判断することが
できる。さらに、CPU2が一つのメッセージを受信し
たことにより、複数のメッセージコリレーションについ
て代表メッセージ出力条件が満たされたならば、各代表
メッセージを出力する。従って、別個の障害が発生した
としても、それぞれの障害に関する代表メッセージを出
力することができる。
ッセージと、管理者が定める代表メッセージとを同じM
BT7に保持する場合を示した。代表メッセージのMI
Dおよび本文の情報を、各機器が出力するメッセージと
は別個に保持するようにしてもよい。すなわち、代表メ
ッセージ専用のMBTを設けてもよい。ただし、上記の
例のように、各機器が出力するメッセージと、管理者が
定める代表メッセージとを同じMBT7に保持すれば、
各メッセージおよび各代表メッセージを一律に管理する
ことができる。
び代表メッセージのMIDを定めて定義ファイル8を作
成する場合を示した。管理者ではなくCPU2がCID
や代表メッセージのMIDを定めてもよい。この場合、
管理者は定義ファイル8を作成するときに、CIDや代
表メッセージのMIDをファイルに記載せずに入力す
る。CPU2は、定義ファイル8から一行分のデータを
読み込んだときに、CMT6に未だ登録されていないC
IDを割り当て、また、MBT7に未だ登録されていな
いMIDを代表メッセージのMIDとして割り当てれば
よい。
なかった場合にはCPU2がCIDやMIDを割り当
て、管理者がCIDやMIDを指定した場合には、その
CIDやMIDを用いてMMT5等への登録処理を行っ
てもよい。例えば、図6(b)に例示する定義ファイル
の一行分のデータで、最初のカンマ(,)の前に情報が
存在するならば、CPU2は、CIDが指定されている
と判断してそのCIDを取得すればよい。最初のカンマ
の前に情報が存在しないならば、CIDが指定されてい
ないと判断してCIDを割り当てればよい。同様に、1
行分のデータで、最初のカンマと二番目のカンマの間に
情報が存在するならば、CPU2は代表メッセージのM
IDが指定されていると判断してそのMIDを取得すれ
ばよい。情報が存在しなければ、代表メッセージのMI
Dは指定されていないと判断して、代表メッセージのM
IDを割り当てればよい。
報をテキストファイル(定義ファイル8)として保持す
る場合を示した。テキストファイルとして保持するので
はなく、管理者が入力する情報を登録するデータベース
を備えていてもよい。すなわち、データベースに、管理
者が入力するCID、代表メッセージのMID、本文、
各メッセージのMIDおよび有効期間を登録する構成で
あってもよい。この場合であっても、図7に示す処理と
同様の処理を行うことによって、MMT5等への情報登
録を行うことができる。ただし、1つのメッセージコリ
レーション分のデータを取得するときには、データベー
スからデータを取得する。また、ステップS1,S15
の処理は行わなくてよい。
各機器がCPU2にメッセージを出力する場合を示した
が、CPU2が各機器を監視して、各機器に障害が発生
したときにCPU2がメッセージを生成してもよい。
ステムだけに限定されない。通信ネットワークを介して
接続される複数の情報処理装置を備え、各情報処理装置
がメッセージを出力する情報処理システムにも本発明は
適用できる。この場合、障害通知システムは、通信ネッ
トワークに接続され、各情報処理装置からメッセージを
受信して、代表メッセージを出力するか否かを判断すれ
ばよい。また、例えば、障害通知システムが各情報処理
装置を監視し、障害発生時にメッセージを生成して、代
表メッセージを出力するか否かを判断してもよい。さら
に、各情報処理装置の各々において、一つまたは複数の
プログラムが動作し、それぞれのプログラムから出力さ
れるメッセージを監視し、プログラム動作上の障害に対
応した代表メッセージを出力するか否かを判断してもよ
い。すなわち、MIDにより一意に特定できるメッセー
ジが出力されるような処理系であれば、メッセージを出
力する機器やプログラムの種類、またはメッセージが経
由する通信ネットワークの形態に関わらず、本発明を適
用することができる。
たに一つのメッセージが発生したときに、オペレータに
提示すべき提示メッセージを出力すべきか否かを判断す
る判断手段と、判断手段が出力すべきと判断した提示メ
ッセージを出力する提示メッセージ出力手段とを備えて
いるので、提示メッセージ以外のメッセージの出力を防
止して、提示メッセージのみをオペレータに提示するこ
とができる。従って、オペレータは、提示メッセージに
よって障害原因の解析作業を進めることができ、慣れや
経験のないオペレータでも、障害の原因を解析しやすく
なる。また、解析作業時間も短縮できる。
ば、コンピュータに、新たに一つのメッセージが発生し
た場合に、一つの障害に起因する一連の障害によって発
生するメッセージのグループのうち、新たに発生したメ
ッセージが属するグループを特定し、特定したグループ
に対応する提示メッセージを出力すべき否かを判断する
機能、および提示メッセージを出力すべきと判断したと
きに、提示メッセージを出力する機能を実現させるの
で、提示メッセージ以外のメッセージの出力を防止し
て、提示メッセージのみをオペレータに提示することが
できる。従って、オペレータは、提示メッセージによっ
て障害原因の解析作業を進めることができ、慣れや経験
のないオペレータでも、障害の原因を解析しやすくな
る。また、解析作業時間も短縮できる。
の例を示す説明図である。
情報の例を示す説明図である。
を示すの説明図である。
の例を示す説明図である。
る。
図である。
Claims (8)
- 【請求項1】 障害によってメッセージを発生させる情
報処理システムに適用される障害通知システムであっ
て、 新たに一つのメッセージが発生したときに、オペレータ
に提示すべき提示メッセージを出力すべきか否かを判断
する判断手段と、 判断手段が出力すべきと判断した提示メッセージを出力
する提示メッセージ出力手段とを備えたことを特徴とす
る障害通知システム。 - 【請求項2】 判断手段は、一つの障害に起因する一連
の障害によって発生するメッセージのグループに属する
一つのメッセージが新たに発生したときに、提示メッセ
ージを出力すべきか否かを判断する請求項1に記載の障
害通知システム。 - 【請求項3】 判断手段は、新たに一つのメッセージが
発生した場合に、前記メッセージが属するグループの他
の全てのメッセージが既に発生していて、かつ、新たな
メッセージの発生確認時刻とグループ内の各メッセージ
の発生確認時刻との差が各メッセージ毎に定められた各
所定時間以内であれば、新たなメッセージが属するグル
ープに対応する提示メッセージを出力すべきと判断する
請求項2に記載の障害通知システム。 - 【請求項4】 一つの障害に起因する一連の障害によっ
て発生する各メッセージを一つのグループに属するメッ
セージとして関連付け、グループ毎に、関連付けられた
各メッセージの情報と提示メッセージの情報とを対応さ
せて保持する関連付け情報保持手段を備え、 判断手段は、新たなメッセージが属するグループの他の
全てのメッセージが既に発生しているか否か、および、
新たなメッセージの発生確認時刻とグループ内の各メッ
セージの発生確認時刻との差が各メッセージ毎に定めら
れた各所定時間以内であるか否かを、関連付け情報保持
手段が保持する情報に基づいて判断する請求項3に記載
の障害通知システム。 - 【請求項5】 各提示メッセージを識別するための識別
情報と、各提示メッセージの内容とを対応させて保持す
る提示メッセージ情報保持手段と、 少なくとも、関連付けられた各メッセージの情報と、前
記各メッセージが属するグループに対応する提示メッセ
ージの内容とを入力する入力手段と、 入力手段が入力した提示メッセージの内容と、前記提示
メッセージの識別情報とを対応させて提示メッセージ情
報保持手段に保持させ、関連付けられた各メッセージの
情報と前記各メッセージが属するグループに対応する提
示メッセージの識別情報とを対応させて関連付け情報保
持手段に保持させる情報設定手段とを備えた請求項4に
記載の障害通知システム。 - 【請求項6】 入力手段は、関連付けられた各メッセー
ジの情報として、各メッセージ毎に定められた各所定時
間の情報を含む情報を入力する請求項5に記載の障害通
知システム。 - 【請求項7】 判断手段は、新たに発生したメッセージ
が複数のグループに属している場合、新たに発生したメ
ッセージが属するそれぞれのグループ毎に、提示メッセ
ージを出力すべきか否かを判断する請求項2から請求項
6のうちのいずれか1項に記載の障害通知システム。 - 【請求項8】 情報処理システムが障害によりメッセー
ジを発生させたときに、オペレータに提示すべき提示メ
ッセージを出力する障害通知プログラムであって、 コンピュータに、新たに一つのメッセージが発生した場
合に、一つの障害に起因する一連の障害によって発生す
るメッセージのグループのうち、新たに発生したメッセ
ージが属するグループを特定し、特定したグループに対
応する提示メッセージを出力すべき否かを判断する機
能、および提示メッセージを出力すべきと判断したとき
に、提示メッセージを出力する機能を実現させるための
障害通知プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002027445A JP2003228497A (ja) | 2002-02-04 | 2002-02-04 | 障害通知システムおよび障害通知プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002027445A JP2003228497A (ja) | 2002-02-04 | 2002-02-04 | 障害通知システムおよび障害通知プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003228497A true JP2003228497A (ja) | 2003-08-15 |
Family
ID=27748961
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002027445A Pending JP2003228497A (ja) | 2002-02-04 | 2002-02-04 | 障害通知システムおよび障害通知プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003228497A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006252459A (ja) * | 2005-03-14 | 2006-09-21 | Nomura Research Institute Ltd | 監視装置及び監視方法 |
JP2010282521A (ja) * | 2009-06-08 | 2010-12-16 | Hitachi Electronics Service Co Ltd | 障害監視装置 |
JP2011526121A (ja) * | 2008-06-25 | 2011-09-29 | トムソン ライセンシング | 監視システムにおけるメッセージの対象とされたユーザへの通知 |
JP2012099092A (ja) * | 2010-11-02 | 2012-05-24 | Internatl Business Mach Corp <Ibm> | インシデント・プールの管理方法、システムおよびコンピュータ・プログラム |
JP2012123783A (ja) * | 2010-12-07 | 2012-06-28 | Internatl Business Mach Corp <Ibm> | 適切なアラートの配信方法、システムおよびコンピュータ・プログラム |
-
2002
- 2002-02-04 JP JP2002027445A patent/JP2003228497A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006252459A (ja) * | 2005-03-14 | 2006-09-21 | Nomura Research Institute Ltd | 監視装置及び監視方法 |
JP2011526121A (ja) * | 2008-06-25 | 2011-09-29 | トムソン ライセンシング | 監視システムにおけるメッセージの対象とされたユーザへの通知 |
JP2010282521A (ja) * | 2009-06-08 | 2010-12-16 | Hitachi Electronics Service Co Ltd | 障害監視装置 |
JP2012099092A (ja) * | 2010-11-02 | 2012-05-24 | Internatl Business Mach Corp <Ibm> | インシデント・プールの管理方法、システムおよびコンピュータ・プログラム |
JP2012123783A (ja) * | 2010-12-07 | 2012-06-28 | Internatl Business Mach Corp <Ibm> | 適切なアラートの配信方法、システムおよびコンピュータ・プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109634728B (zh) | 作业调度方法、装置、终端设备及可读存储介质 | |
CN108763038B (zh) | 告警数据的管理方法、装置、计算机设备及存储介质 | |
JP4701148B2 (ja) | 障害回復システム及びサーバ | |
WO2019237586A1 (zh) | 定时任务管理方法、装置、计算机设备及存储介质 | |
CN110324174B (zh) | 区块链环境检测方法、设备、装置及存储介质 | |
CN111159049A (zh) | 接口自动化测试方法及系统 | |
WO2023123943A1 (zh) | 接口自动化测试方法、装置、介质、设备及程序 | |
CN111078567A (zh) | 自动化测试平台的报告生成方法、终端和存储介质 | |
CN112286723A (zh) | 机房容灾控制方法、终端及存储介质 | |
KR20130042503A (ko) | 통신 테스트 장치 및 방법 | |
JP2003228497A (ja) | 障害通知システムおよび障害通知プログラム | |
CN113658351A (zh) | 一种产品生产的方法、装置、电子设备及存储介质 | |
JP2016071398A (ja) | テスト実行装置、テスト実行方法およびコンピュータプログラム | |
CN115190046B (zh) | 一种服务器集群的检测方法、检测装置及计算设备 | |
US20090083747A1 (en) | Method for managing application programs by utilizing redundancy and load balance | |
JPH1063539A (ja) | 運行監視通報システム | |
CN111090575B (zh) | 测试方法 | |
CN112613298A (zh) | 数据校验方法、系统、计算机程序产品和电子设备 | |
CN110362464B (zh) | 软件分析方法及设备 | |
CN112199229A (zh) | 数据处理方法、装置、设备和存储介质 | |
US7861033B2 (en) | System architecture for implementing virtual disk service equipment | |
CN116756054B (zh) | 一种测试方法、装置、电子设备及存储介质 | |
CN112825044B (zh) | 任务执行方法、装置及计算机存储介质 | |
WO2021139280A1 (zh) | 基于zookeeper的日志处理方法、装置、计算机设备和存储介质 | |
KR950010835B1 (ko) | 컴퓨터 시스템의 서비스 네트워크에서 한 컴퓨터 시스템상의 문제 예방 실행 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051017 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20051115 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20051115 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060228 |