JP2003228497A - 障害通知システムおよび障害通知プログラム - Google Patents

障害通知システムおよび障害通知プログラム

Info

Publication number
JP2003228497A
JP2003228497A JP2002027445A JP2002027445A JP2003228497A JP 2003228497 A JP2003228497 A JP 2003228497A JP 2002027445 A JP2002027445 A JP 2002027445A JP 2002027445 A JP2002027445 A JP 2002027445A JP 2003228497 A JP2003228497 A JP 2003228497A
Authority
JP
Japan
Prior art keywords
message
information
output
group
presentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002027445A
Other languages
English (en)
Inventor
Seiji Matsushita
誠司 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Software Chubu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Software Chubu Ltd filed Critical NEC Software Chubu Ltd
Priority to JP2002027445A priority Critical patent/JP2003228497A/ja
Publication of JP2003228497A publication Critical patent/JP2003228497A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 故障発生時に提示すべきメッセージのみをオ
ペレータに提示できるようにする。 【解決手段】 一つの障害に起因する一連の障害によっ
て発生する各メッセージを一つのグループに属するメッ
セージとして関連づけ、そのグループに対応する代表メ
ッセージを定める。また、各メッセージがどのグループ
に属するのかを示す情報も保持する。一つのメッセージ
を受信すると、そのメッセージがどのグループに属する
のかを判断する。そして、受信したメッセージが、同じ
グループに属する他の各メッセージの受信時刻を基準と
する有効期間以内に受信されているか否かを判断する。
他の各メッセージの受信時刻を基準とする有効期間以内
に受信されているならば、予め定められている代表メッ
セージを出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報処理システム
で障害が生じた場合に障害の発生を通知する障害通知シ
ステムおよび障害通知プログラムに関する。
【0002】
【従来の技術】情報処理システムは、中央処理装置(以
下、CPUと記す。)、記憶装置等の様々な機器を備え
ている。これらの各機器は、障害を検出すると障害を通
知するメッセージ(通知電文)を出力し、CPUはこの
メッセージを出力装置に出力する。オペレータはメッセ
ージを解析して障害の原因を究明する。なお、各機器が
メッセージを出力するのではなく、CPUが各機器を監
視し、CPU自身が各機器の障害に応じたメッセージを
出力する場合もある。情報処理システムによっては、各
機器等が通常運用時(障害が発生していないとき)に障
害の通知以外の目的でメッセージを出力することもあ
る。
【0003】
【発明が解決しようとする課題】ある箇所で障害が発生
すると、その障害に起因して他の箇所でも障害が生じ、
障害が発生した各箇所が個々にメッセージを出力する。
従って、一つの障害に起因して多くのメッセージが出力
されてしまう。多くのメッセージから根本的な障害の原
因を解析する作業は慣れや経験を必要とし、また、作業
時間がかかるという問題がある。
【0004】そこで、オペレータに提示するメッセージ
の数を減らして、オペレータの解析負担を軽減させるた
め装置等が種々提案されている。例えば、特開2000
−183881号公報には、あるメッセージに続いて発
生するメッセージの情報を保持し、障害発生時に最初に
発生したメッセージに続く次のメッセージの発生を監視
し、そのメッセージが発生したら更に次のメッセージの
発生を監視する障害分析装置が記載されている。この障
害分析装置は、次ぎに続くメッセージがない最後のメッ
セージが発生したとき、このメッセージに対する障害分
析結果を出力する。しかし、そのような障害分析装置で
は、予め各メッセージが出力される順番を把握しておか
なければならない。複数の障害が同時に発生することに
よって新たな障害が生じるような場合には、各メッセー
ジの順番を定めにくく、障害分析が困難であった。
【0005】また、特開平11−120036号公報に
は、最初にメッセージが発生してから時間tmの間に発
生したメッセージをメッセージバッファに格納し、時間
tmが経過してから時間trの間に発生したメッセージ
を予備メッセージバッファに格納する障害メッセージ出
力制御システムが記載されている。この障害メッセージ
出力制御システムは、メッセージバッファ内のメッセー
ジで優先度の高いメッセージを抽出し、他のメッセージ
の出力を抑止する。予備メッセージバッファ内のメッセ
ージについても優先度の高いメッセージを抽出し、他の
メッセージの出力を抑止する。この時間tm,trは、
制御系(CP系)、入出力系(IO系)等の系統毎に定
める。
【0006】しかし、そのような障害メッセージ出力制
御システムでは、優先度の低いメッセージの出力を的確
に抑止できない場合があった。例えば、一つの根本的な
障害の発生に伴ってメッセージM1〜M5が順番に発生
したとする。そして、オペレータに通知すべきのメッセ
ージは、メッセージM3であるとする。なお、オペレー
タに通知すべきメッセージが最初に発生するとは限らな
い。時間tmの間にメッセージM1〜M3が発生し、そ
の後の時間trの間にメッセージM4,M5が発生した
場合には、メッセージM3以外に、出力を抑止すべきメ
ッセージM4またはM5も出力してしまう。
【0007】時間tmを十分に大きく設定し、メッセー
ジM1〜M5が同じメッセージバッファに格納されるよ
うにすれば、メッセージM3のみを抽出し、他のメッセ
ージの出力を抑止できる。しかし、時間tmを大きく設
定すると、根本的な障害に伴う各メッセージが短時間の
間に発生する場合であっても、時間tmの経過を待たね
ばならず、オペレータへのメッセージの提示が遅れるこ
ともある。
【0008】また、独立した二つの障害が発生し、各障
害に伴って出力される各メッセージがメッセージバッフ
ァに蓄積され、その中から最も優先度の高いメッセージ
のみを抽出すると、独立した二つの障害のうち一方しか
オペレータに通知されないことになってしまう。
【0009】さらに、通常運用時でもメッセージを出力
する場合には、通常運用時におけるメッセージの出力時
から時間tm経過するまでに発生したメッセージがメッ
セージバッファに格納される。この時間tmの間に障害
が発生すると、その障害に伴って出力されるメッセージ
がメッセージバッファと予備メッセージバッファに分散
されてしまい、抑止すべきメッセージが出力されてしま
う場合もある。例えば、障害に無関係なメッセージの出
力から時間tmの間に障害が発生し、メッセージM1〜
M3がメッセージバッファに格納され、メッセージM
4,M5が予備メッセージバッファに格納されたとす
る。この場合、オペレータに提示すべきメッセージM3
だけでなく、M4またはM5も出力されてしまう。
【0010】また、情報処理システムの管理者が、どの
ような場合にどのようなメッセージをオペレータに提示
するのかを任意に定められることが好ましい。例えば、
オペレータに提示するメッセージの内容等を任意に設定
できることが好ましい。しかし、従来のシステムではこ
のような設定ができなかった。
【0011】本発明は、オペレータに提示すべきメッセ
ージ以外のメッセージの提示を的確に抑止できるように
することを目的とする。また、本発明は、発生するメッ
セージの順番に関わりなく、提示すべきメッセージをオ
ペレータに提示できるようにすることを目的とする。ま
た、どのような場合にどのようなメッセージを提示する
のかを任意に設定できるようにすることを目的とする。
【0012】
【課題を解決するための手段】本発明による障害通知シ
ステムは、障害によってメッセージを発生させる情報処
理システムに適用される障害通知システムであって、新
たに一つのメッセージが発生したときに、オペレータに
提示すべき提示メッセージを出力すべきか否かを判断す
る判断手段と、判断手段が出力すべきと判断した提示メ
ッセージを出力する提示メッセージ出力手段とを備えた
ことを特徴とする。
【0013】判断手段は、一つの障害に起因する一連の
障害によって発生するメッセージのグループに属する一
つのメッセージが新たに発生したときに、提示メッセー
ジを出力すべきか否かを判断する。
【0014】例えば、判断手段は、新たに一つのメッセ
ージが発生した場合に、そのメッセージが属するグルー
プの他の全てのメッセージが既に発生していて、かつ、
新たなメッセージの発生確認時刻とグループ内の各メッ
セージの発生確認時刻との差が各メッセージ毎に定めら
れた各所定時間以内であれば、新たなメッセージが属す
るグループに対応する提示メッセージを出力すべきと判
断する。そのような構成によれば、メッセージの発生順
序が変化する場合であっても、提示メッセージを出力す
べきか否かを判断することができる。
【0015】例えば、一つの障害に起因する一連の障害
によって発生する各メッセージを一つのグループに属す
るメッセージとして関連付け、グループ毎に、関連付け
られた各メッセージの情報と提示メッセージの情報とを
対応させて保持する関連付け情報保持手段を備え、判断
手段は、新たなメッセージが属するグループの他の全て
のメッセージが既に発生しているか否か、および、新た
なメッセージの発生確認時刻とグループ内の各メッセー
ジの発生確認時刻との差が各メッセージ毎に定められた
各所定時間以内であるか否かを、関連付け情報保持手段
が保持する情報に基づいて判断する。
【0016】各提示メッセージを識別するための識別情
報と、各提示メッセージの内容とを対応させて保持する
提示メッセージ情報保持手段と、少なくとも、関連付け
られた各メッセージの情報と、その各メッセージが属す
るグループに対応する提示メッセージの内容とを入力す
る入力手段と、入力手段が入力した提示メッセージの内
容と、その提示メッセージの識別情報とを対応させて提
示メッセージ情報保持手段に保持させ、関連付けられた
各メッセージの情報とその各メッセージが属するグルー
プに対応する提示メッセージの識別情報とを対応させて
関連付け情報保持手段に保持させる情報設定手段とを備
えることが好ましい。そのような構成によれば、管理者
が提示メッセージの内容を任意に定めることができるの
で、オペレータが解析しやすいように提示メッセージの
内容を定めることができる。
【0017】入力手段は、関連付けられた各メッセージ
の情報として、各メッセージ毎に定められた各所定時間
の情報を含む情報を入力してもよい。そのような構成に
よれば、管理者が各メッセージ毎の所定時間を定めるこ
とができる。
【0018】判断手段は、新たに発生したメッセージが
複数のグループに属している場合、新たに発生したメッ
セージが属するそれぞれのグループ毎に、提示メッセー
ジを出力すべきか否かを判断することが好ましい。その
ような構成によれば、独立した別個の障害が複数発生し
たとしても、各障害について提示メッセージを出力する
ことができる。
【0019】また、本発明による障害通知プログラム
は、情報処理システムが障害によりメッセージを発生さ
せたときに、オペレータに提示すべき提示メッセージを
出力する障害通知プログラムであって、コンピュータ
に、新たに一つのメッセージが発生した場合に、一つの
障害に起因する一連の障害によって発生するメッセージ
のグループのうち、新たに発生したメッセージが属する
グループを特定し、特定したグループに対応する提示メ
ッセージを出力すべき否かを判断する機能、および提示
メッセージを出力すべきと判断したときに、提示メッセ
ージを出力する機能を実現させることを特徴とする。
【0020】
【発明の実施の形態】以下、本発明の実施の形態を図面
を参照して説明する。図1は、本発明による障害通知シ
ステムの実施の一形態を示す説明図であり、本発明を一
台の情報処理システムに適用した場合を示す。本例に示
す障害通知システム1は、本発明が適用される情報処理
システム20のCPU2と、記憶装置3と、出力装置1
0と、入力装置11とを備える。CPU2は、記憶装置
3が備える障害通知プログラム4に従って、オペレータ
に提示すべき提示メッセージの出力処理等の本例に示す
処理を行う。また、記憶装置3は、情報処理システム2
0の機能を実現するためのプログラム(図示せず)も記
憶し、CPU2は、このプログラムに従って情報処理シ
ステム20が目的とする機能を実現する。
【0021】出力装置10は、例えば、ディスプレイ装
置によって構成される。入力装置11は、例えば、キー
ボード等によって構成される。
【0022】本発明が適用される情報処理システム20
は、CPU2、記憶装置3、出力装置10、入力装置1
1以外の機器を備えていてもよい。図1では、通信ネッ
トワークとの間で情報を入出力するネットワークインタ
フェース部21を備える場合を示す。情報処理システム
20が備える機器は、システムによって異なる。
【0023】情報処理システム20が備える機器(例え
ば、記憶装置3、ネットワークインタフェース部21
等)は、障害が発生するとメッセージをCPU2に出力
する。CPU2に障害が発生したときは、CPU2がメ
ッセージを生成する。各メッセージには、個々のメッセ
ージを識別するためのIDであるメッセージID(以
下、MIDと記す。)が割り当てられる。
【0024】また、障害通知システム1は、障害が生じ
たと判断すると、障害毎に予め定められた、オペレータ
に提示すべき提示メッセージを出力装置10に出力す
る。以下、この提示メッセージを代表メッセージと記
す。代表メッセージの内容(本文)は、情報処理システ
ム20の管理者によって定められる。管理者は障害毎に
代表メッセージを定めるので、代表メッセージは複数存
在する。各代表メッセージにもMIDが割り当てられ
る。なお、障害通知システム1が、管理者が定めた情報
を登録するときの動作については後述する。
【0025】一つの障害に起因する一連の障害によって
発生する各メッセージは、同じグループに属するメッセ
ージとして関連付けられる。そして、同じグループに属
するとして関連付けられた各メッセージの情報と、その
グループに対応する代表メッセージとの対応関係を示す
情報を、以下、メッセージコリレーションと記す。関連
付けられるメッセージの組み合わせは、後述するよう
に、管理者によって定められる。
【0026】例えば、一つの根本的な障害が生じると、
その障害に起因して情報処理システム20が備える各機
器が複数のメッセージを出力するとする。この場合、一
つのメッセージコリレーションによって、関連づけられ
ている複数のメッセージが特定される。また、そのメッ
セージコリレーションによって、オペレータに提示すべ
き代表メッセージも特定される。別の障害発生時に出力
されるメッセージのグループについても、他のメッセー
ジコリレーションによって、関連付けられる各メッセー
ジと、オペレータに提示すべき代表メッセージが特定さ
れる。各メッセージコリレーションには、個々のメッセ
ージコリレーションを識別するためのIDであるメッセ
ージコリレーションID(以下、CIDと記す。)が割
り当てられる。
【0027】また、各機器が出力する個々のメッセージ
は一つのグループだけに属するとは限らず、複数のグル
ープに属していてもよい。例えば、あるメッセージが、
障害Xの発生時にも、別の障害Yの発生時にも出力され
るのであれば、そのメッセージは複数のグループに属す
ることになる。
【0028】記憶装置3は、各機器が出力する各メッセ
ージが、どのメッセージコリレーションに含まれている
のかを示す情報を保持する。メッセージマスタテーブル
(以下、MMTと記す。)5は、この情報を保持する領
域である。図2は、MMT5に保持される情報の例を示
す。一つのメッセージが、あるメッセージコリレーショ
ンのグループに属するメッセージとして関連づけられて
いるならば、そのメッセージのMIDに対応付けられ
て、そのメッセージコリレーションのCIDが保持され
る。メッセージが複数のグループに属するならば、その
メッセージのMIDに対して複数のCIDが対応付けら
れる。そして、各メッセージのMID毎にCIDが保持
される。図2に示す例では、MID_1のメッセージ
は、CID_1のメッセージコリレーションのグループ
に属しているとともに、CID_2やCID_3等のメ
ッセージコリレーションのグループにも属していること
になる。
【0029】また、記憶装置3は、各メッセージコリレ
ーションの情報を保持する。コリレーションマスタテー
ブル(以下、CMTと記す。)6は、各メッセージコリ
レーションの情報を保持する領域である。図3は、CM
T6に保持される情報の例を示す。図3に示すように、
各メッセージコリレーションでは、各メッセージコリレ
ーションのCIDと、代表メッセージのMIDと、同じ
グループに属するとして関連づけられたメッセージの情
報とを対応させる。また、関連づけられたメッセージの
情報には、メッセージ毎にMIDと、有効期間と、メッ
セージの発生確認時刻とを含める。
【0030】本例では、CPU2が各機器からメッセー
ジを受信したときの時刻またはCPU2がメッセージを
生成したときの時刻を、メッセージの発生確認時刻とす
る場合について説明する。以下、メッセージの発生確認
時刻を受信時刻と記す。受信時刻の初期値は、例えば、
データがない旨の情報(以下、NULLと記す。)とし
て定める。その後、CPU2がメッセージを受信または
生成すると、CPU2は受信時刻を更新する。図3に示
す例では、CPU2が「時刻1」にMID_1のメッセ
ージを受信したことを示している。また、MID_4の
メッセージはまだ出力されていないことを示している。
【0031】CPU2は、以下の二つの条件を満たした
ときに代表メッセージを出力装置10に出力する。第一
の条件は、同じグループに属するとして関連づけられた
全てのメッセージの受信時刻がNULLでないことであ
る。すなわち、グループ内の各メッセージがCPU2に
受信されていることである。第二の条件は、最後に出力
されたメッセージの受信時刻が、先に出力された各メッ
セージの受信時刻から各メッセージ毎に定められた各所
定時間以内であることである。関連づけられたメッセー
ジの情報に含まれる有効期間は、この所定期間を示す。
【0032】例えば、図3に示すCID_1のメッセー
ジコリレーションは、MID_1〜MID_3の三つの
メッセージのみを関連づけているとする。図4は、CP
U2がこの三つのメッセージを受信するタイミングの例
を示す。図4(a)に示す場合、最後に出力されたMI
D_3のメッセージの受信時刻は、先に出力されたMI
D_1のメッセージの受信時刻からの所定時間(有効期
間T1)以内であり、MID_2のメッセージの受信時
刻からの所定時間(有効期間T2)以内である。従っ
て、第一の条件と第二の条件をともに満たすので、CP
U2は代表メッセージを出力装置10に出力する。
【0033】図4(b)に示す場合、最後に出力された
MID_3のメッセージの受信時刻は、先に出力された
MID_1のメッセージの受信時刻からの所定時間(有
効期間T1)以内であるが、MID_2のメッセージの
受信時刻からの所定時間(有効期間T2)以内に入って
いない。従って、第二の条件を満たさないので、CPU
2は、三つのメッセージを受信した場合でも代表メッセ
ージを出力しない。
【0034】各メッセージが出力される順番は一定とは
限らない。図4(c)は、MID_3,MID_2,M
ID_1の順に出力された場合の例である。最後に出力
されたMID_1のメッセージの受信時刻は、先に出力
されたMID_3のメッセージの受信時刻からの所定時
間(有効期間T3)以内であり、MID_2のメッセー
ジの受信時刻からの所定時間(有効期間T2)以内であ
る。従って、第一の条件と第二の条件をともに満たすの
で、CPU2は代表メッセージを出力装置10に出力す
る。
【0035】一つのメッセージの有効期間は常に一定と
は限らない。図3に示す例では、MID_1の有効期限
は、CID_1のメッセージコリレーションではT1で
あるが、CID_4のメッセージコリレーションではT
4である。このように複数のメッセージコリレーション
が共通のメッセージを含んでいる場合、そのメッセージ
の有効期間はメッセージコリレーション毎に異なってい
てもよい。
【0036】記憶装置3は、各機器が出力するメッセー
ジや管理者によって定められた代表メッセージのMID
と、メッセージの本文との対応関係を示す情報を保持す
る。メッセージボディテーブル(以下、MBTと記
す。)7は、この情報を保持する領域である。管理者が
代表メッセージを定めていない場合、MBT7には各機
器が出力するメッセージのMIDと本文との対応関係の
みが登録される。その後、管理者が代表メッセージを定
めると、代表メッセージのMIDと本文の対応関係の情
報が追加される。図5は、MBT7に保持される情報の
例を示す。CPU2は、第一の条件と第二の条件を満た
したときに、CMT6から代表メッセージのMIDを特
定し、そのMIDに対応する本文の情報をMBT7から
抽出する。そして、その本文を出力装置10に出力す
る。
【0037】また、記憶装置3は、メッセージコリレー
ション定義ファイル(以下、定義ファイルと記す。)8
を記憶する。定義ファイル8は、MMT5、CMT6、
およびMBT7の内容を決定するためのテキストファイ
ルであり、オペレータによって入力される。オペレータ
は所定の書式に従って定義ファイル8を作成する。図6
(a)は定義ファイル8の書式の例を示す。本例では、
一つのメッセージコリレーションの情報を1行のテキス
トとして作成する場合の例を示す。なお、1行のテキス
トとは、テキスト情報の先頭から改行文字まで、または
改行文字から改行文字までのテキストのことである。図
6に例示する書式の場合、オペレータが定めたCID、
代表メッセージのMID、代表メッセージの本文の順に
テキスト情報を作成し、本文に続いて、関連づける各メ
ッセージのMID、有効期間を繰り返す。図6(b)
は、この書式に従って作成した定義ファイル8の例を示
す。
【0038】管理者は、どのメッセージが同じグループ
に属することになるか、各メッセージの有効期間をどの
ような値にするか、および代表メッセージの本文を定め
て、定義ファイル8を作成し、入力装置10から入力す
る。管理者は、メッセージの本文として、障害の解決方
法や技術情報等を書き込んでもよい。CPU2は、入力
された定義ファイル8を記憶装置3に記憶し、定義ファ
イル8に基づいてMMT5、CMT6、およびMBT7
に情報を登録する。管理者は、定義ファイル8に新たな
メッセージコリレーションを追加してもよい。その場
合、CPU2は再度定義ファイル8を読み込んで、追加
された情報をMMT5等に登録する。
【0039】本例において、関連付け情報保持手段は、
CMT6によって実現される。判断手段および情報設定
手段はCPU2によって実現される。提示メッセージ出
力手段は、出力装置10によって実現される。提示メッ
セージ情報保持手段は、MBT7によって実現される。
入力手段は、入力装置11によって実現される。
【0040】また、記憶装置3は、コンピュータに、新
たに一つのメッセージが発生した場合に、一つの障害に
起因する一連の障害によって発生するメッセージのグル
ープのうち、新たに発生したメッセージが属するグルー
プを特定し、特定したグループに対応する提示メッセー
ジを出力すべきか否かを判断する機能、および提示メッ
セージを出力すべきと判断したときに、提示メッセージ
を出力する機能を実現させるための障害通知プログラム
を保持する。
【0041】次に、障害通知システム1が、定義ファイ
ル8に基づいてMMT5等に情報を登録するときの動作
について説明する。図7は、MMT5等への情報登録時
の処理経過の例を示す流れ図である。最初に、CPU2
は、記憶装置3が記憶する定義ファイル8をオープンす
る(ステップS1)。すなわち、定義ファイル8からデ
ータを読み込める状態にする。続いて、定義ファイル8
に定められた各メッセージコリレーションについて、以
下に示す処理を行う。本例の場合、定義ファイル8の行
数だけ、以下の処理を繰り返す。
【0042】まず、CPU2は、定義ファイル8から1
行分のデータを読み込む(ステップS2)。1行分のデ
ータには、一つのメッセージコリレーションの情報が含
まれる。CPU2は、その1行分のデータから、代表メ
ッセージの本文を取得する(ステップS3)。そして、
CPU2は、代表メッセージの本文をMBT7に追加登
録する。また、読み込んだ1行分のデータから代表メッ
セージのMIDも取得して、本文と対応させてMBT7
に追加登録する(ステップS4)。次に、CPU2は、
読み込んだ1行分のデータからCIDを取得し、そのC
IDと代表メッセージのMIDとを対応させてCMT6
に追加登録する(ステップS5)。
【0043】CPU2は、ステップS5に続いて、1行
分のデータに含まれるMID(有効期間に対応している
MID)毎に、以下のステップS6からステップS13
までの処理を行う。すなわち、MIDの数だけステップ
S6からステップS13までの処理を繰り返す。CPU
2は、1行分のデータから、対応しているMIDおよび
有効期間の情報を1組取得する(ステップS6)。そし
て、ステップS6で取得したMIDが既にMMT5に登
録されているか否かを判断する(ステップS7)。
【0044】ステップS6で取得したMIDがMMT5
に登録されていないならば、CPU2は、MMT5にそ
のMIDを新たに登録する(ステップS8)。また、そ
のMIDの受信時刻の初期値を定める(ステップS
9)。本例では、受信時刻の初期値をNULLと定め
る。
【0045】ステップS6で取得したMIDがMMT5
に登録されているならば、CPU2は、MMT5から、
そのMIDに対応するCIDを一つ取得する(ステップ
S10)。MIDに対応するCIDが複数あるならば、
その中から任意のCIDを取得する。そして、CPU2
は、そのCIDを用いて、ステップS6で取得したMI
Dに対応する受信時刻をCMT6から取得する(ステッ
プS11)。ステップS11において、CPU2は、C
IDに対応する情報をCMT6から取得し、その情報の
中からMIDに対応する受信時刻を取得する。
【0046】ステップS9またはステップS11の後、
CPU2は、ステップS5で取得したCID(1行分の
データから取得したCID)を、ステップS6で取得し
たMIDに対応させてMMT5に追加登録する(ステッ
プS12)。続いてCPU2は、ステップS6で取得し
たMIDおよび有効期間と、ステップS9またはステッ
プS11で取得した受信時刻とをCMT6に追加登録す
る(ステップS13)。このとき、CPU2は、MI
D、有効期間、および受信時刻を、ステップS5で取得
したCIDに対応させて登録する。
【0047】ステップS13の終了後、CPU2は、1
行分のデータから次のMIDおよび有効期間の情報を取
得して、ステップS6からステップS13までの動作を
繰り返す。一行分のデータに含まれる各MIDについ
て、ステップS6からステップS13までの処理を終了
したならば、ステップS2で読み込んだ1行分のデータ
に対する処理を終了する。そして、CPU2は、次の1
行分のデータを定義ファイル8から読み込んで、ステッ
プS2以降の動作を繰り返す。定義ファイル8の各行の
データについて処理を終了したならば、定義ファイル8
をクローズする(ステップS14)。すなわち、ファイ
ルオープン前の状態にする。
【0048】次に、各機器が出力したメッセージをCP
U2が受信して、代表メッセージを出力するか否かの判
断を行うときの動作について説明する。図8は、メッセ
ージ受信時の処理経過の例を示す流れ図である。CPU
2は、一つのメッセージを受信するとそのメッセージの
MIDを確認する(ステップS21)。そして、そのM
IDがMMT5に登録されているか否かを判断する(ス
テップS22)。登録されていないならば、処理を終了
する。
【0049】受信したメッセージのMIDがMMT5に
登録されているならば、CPU2は障害通知システム1
が管理している時刻を確認する(ステップS23)。こ
の時刻がメッセージの受信時刻となる。次に、CPU2
は、MMT5から、受信したメッセージのMIDに対応
する全てのCIDを取得する(ステップS24)。CP
U2は、取得した各CID毎に、以下に示す処理を行
う。すなわち、取得したCIDの数だけ以下の処理を繰
り返す。
【0050】CPU2は、受信したメッセージのMID
に対応するCIDの中から一つのCIDを抽出する(ス
テップS25)。そして、CMT6から、そのCIDに
対応する各情報を取得する(ステップS26)。すなわ
ち、CIDに対応する代表メッセージのMIDおよび、
同じグループに属するとして関連付けられた各メッセー
ジのMID、有効期間、受信時刻の情報を取得する。C
PU2は、関連付けられた各メッセージのうち、受信し
たメッセージのMIDに対応する受信時刻をステップS
23で確認した時刻に更新する(ステップS27)。ま
た、CMT6に保持される受信時刻の情報も更新する。
例えば、図3に例示する情報の中からCID_1に対応
する各情報を取得して、MID_1に対応する受信時刻
を更新したとする。このとき、取得した情報だけでな
く、CMT6でMID_1に対応して保持される受信時
刻も更新する。
【0051】ステップS27の後、CPU2は、代表メ
ッセージの出力条件(上述の第一の条件および第二の条
件)が満たされているか否かを確認するために用いるカ
ウント値を0に初期化する。そして、ステップS26で
取得した情報に含まれるMID、有効期間、および受信
時刻の各組み合わせ毎に以下の処理を行う。すなわち、
MID、有効期間、および受信時刻の組み合わせの数だ
け以下の処理を行う。
【0052】CPU2は、ステップS26でCMT6か
ら取得した情報の中から、MID、有効期間、および受
信時刻の組み合わせを一組抽出する(ステップS2
8)。そして、その受信時刻がNULLではなく、か
つ、抽出したMIDの受信時刻と、新たに受信したメッ
セージの受信時刻(ステップS23で確認した時刻)の
差が、抽出した有効期間以下であるという条件を満たし
ているか否かを判断する(ステップS29)。この条件
が満たされているならば、カウント値を1増加し(ステ
ップS30)、他の組み合わせについてステップS28
以降の動作を繰り返す。また、条件が満たされていなけ
れば、カウント値を増加せずに、他の組み合わせについ
てステップS28以降の動作を繰り返す。
【0053】例えば、MID_3のメッセージを新たに
受信した結果、ステップS26で、図3に例示するCI
D_1に対応する情報を取得したとする。また、取得し
た情報のうち、MID_3に対応する受信時刻を「時刻
3」に更新したとする。この場合、ステップS28で
は、MID_1、T1(有効期間)、時刻1(受信時
刻)という組み合わせを抽出する。そして、ステップS
29では、時刻1がNULLではないことを確認する。
また、時刻1と時刻3の差が、有効期間T1以下である
ことを確認する。これらの確認ができたならばカウント
値を1増加し、確認できなかったならばカウント値を増
加しない。続いて、MID_2、T2(有効期間)、時
刻2(受信時刻)という組み合わせを抽出し、同様の処
理を行う。
【0054】なお、新たに受信したメッセージがMID
_3のメッセージであるので、次に抽出されるMID_
3、T3(有効期間)、時刻3(受信時刻)という組み
合わせでは、ステップS29の条件は満たされる。
【0055】各組み合わせについてステップS28以降
の処理を行ったならば、ステップS28から始まる繰り
返し処理を終了する。次にCPU2は、カウント値がM
ID、有効期間、受信時刻の組み合わせの数と等しいか
否かを判断する(ステップS31)。等しくなければ、
代表メッセージの出力条件(上述の第一の条件および第
二の条件)が満たされていないことになる。この場合、
ステップS24で取得したCIDのうち、他のCIDに
ついてステップS25以降の動作を繰り返す。
【0056】また、カウント値がMID、有効期間、受
信時刻の組み合わせの数と等しければ、代表メッセージ
の出力条件は満たされている。この場合、CPU2は、
ステップS26でCMT6から取得した情報の中から代
表メッセージのMIDを抽出する(ステップS32)。
CPU2は、このMIDに対応する代表メッセージの本
文をMBT7から取得し(ステップS33)、出力装置
11に表示する(ステップS34)。その後、ステップ
S24で取得したCIDのうち、他のCIDについてス
テップS25以降の動作を繰り返す。各CIDについて
ステップS25以降の動作を行ったならば処理を終了す
る。
【0057】本発明によれば、情報処理システム20の
各機器が複数のメッセージを出力したとしても、代表メ
ッセージのみを出力する。従って、慣れや経験のないオ
ペレータでも、障害の原因を解析しやすくなる。また、
管理者は代表メッセージの本文の内容を任意に設定でき
るので、代表メッセージとして障害の解決方法や技術情
報等も出力でき、オペレータの負担を一層軽減できる。
【0058】また、有効期間を設定するので、同じグル
ープに属するメッセージが全て出力されていたとして
も、出力されたタイミングも考慮して代表メッセージを
出力すべきか否かを判断できる。そして、管理者は、有
効期間も任意に設定できる。従って、障害毎に適切に代
表メッセージの出力条件を定めることができる。例え
ば、ある障害発生時にはMID_1のメッセージはすぐ
に出力されるが、別の障害発生時には遅れて出力される
ような場合、障害毎に有効期間を変更することができ
る。また、ある障害発生時には短時間の間に集中的に同
じグループのメッセージが出力されるが、別の障害発生
時には時間をおいて出力されるような場合であっても、
障害毎に各メッセージの有効期間を設定できる。よっ
て、様々な障害について、代表メッセージを出力すべき
条件が満たされたならば、直ちに代表メッセージを出力
するようにできる。
【0059】また、各機器が通常運用時に障害の通知以
外の目的でメッセージを出力することがある情報処理シ
ステムである場合、そのようなメッセージに対しても代
表メッセージを定義することで、有効な情報を代表メッ
セージとしてまとめて出力させることができる。例え
ば、いくつかのソフトウェアが起動して一つのまとまっ
た処理を行う処理系の場合、個々のソフトウェアが起動
完了時に出すメッセージを監視し、一つの代表メッセー
ジに束ねて出力させることで、管理者は処理系単位でシ
ステムの稼働状況を把握することができる。
【0060】また、CPU2は、各機器から出力される
メッセージの順番に関わりなく、メッセージを受信する
度に代表メッセージを出力するか否かを判断することが
できる。さらに、CPU2が一つのメッセージを受信し
たことにより、複数のメッセージコリレーションについ
て代表メッセージ出力条件が満たされたならば、各代表
メッセージを出力する。従って、別個の障害が発生した
としても、それぞれの障害に関する代表メッセージを出
力することができる。
【0061】なお、上記の例では、各機器が出力するメ
ッセージと、管理者が定める代表メッセージとを同じM
BT7に保持する場合を示した。代表メッセージのMI
Dおよび本文の情報を、各機器が出力するメッセージと
は別個に保持するようにしてもよい。すなわち、代表メ
ッセージ専用のMBTを設けてもよい。ただし、上記の
例のように、各機器が出力するメッセージと、管理者が
定める代表メッセージとを同じMBT7に保持すれば、
各メッセージおよび各代表メッセージを一律に管理する
ことができる。
【0062】また、上記の例では、管理者がCIDおよ
び代表メッセージのMIDを定めて定義ファイル8を作
成する場合を示した。管理者ではなくCPU2がCID
や代表メッセージのMIDを定めてもよい。この場合、
管理者は定義ファイル8を作成するときに、CIDや代
表メッセージのMIDをファイルに記載せずに入力す
る。CPU2は、定義ファイル8から一行分のデータを
読み込んだときに、CMT6に未だ登録されていないC
IDを割り当て、また、MBT7に未だ登録されていな
いMIDを代表メッセージのMIDとして割り当てれば
よい。
【0063】さらに、管理者がCIDやMIDを指定し
なかった場合にはCPU2がCIDやMIDを割り当
て、管理者がCIDやMIDを指定した場合には、その
CIDやMIDを用いてMMT5等への登録処理を行っ
てもよい。例えば、図6(b)に例示する定義ファイル
の一行分のデータで、最初のカンマ(,)の前に情報が
存在するならば、CPU2は、CIDが指定されている
と判断してそのCIDを取得すればよい。最初のカンマ
の前に情報が存在しないならば、CIDが指定されてい
ないと判断してCIDを割り当てればよい。同様に、1
行分のデータで、最初のカンマと二番目のカンマの間に
情報が存在するならば、CPU2は代表メッセージのM
IDが指定されていると判断してそのMIDを取得すれ
ばよい。情報が存在しなければ、代表メッセージのMI
Dは指定されていないと判断して、代表メッセージのM
IDを割り当てればよい。
【0064】また、上記の例では、管理者が入力した情
報をテキストファイル(定義ファイル8)として保持す
る場合を示した。テキストファイルとして保持するので
はなく、管理者が入力する情報を登録するデータベース
を備えていてもよい。すなわち、データベースに、管理
者が入力するCID、代表メッセージのMID、本文、
各メッセージのMIDおよび有効期間を登録する構成で
あってもよい。この場合であっても、図7に示す処理と
同様の処理を行うことによって、MMT5等への情報登
録を行うことができる。ただし、1つのメッセージコリ
レーション分のデータを取得するときには、データベー
スからデータを取得する。また、ステップS1,S15
の処理は行わなくてよい。
【0065】上記の各例では、情報処理システム20の
各機器がCPU2にメッセージを出力する場合を示した
が、CPU2が各機器を監視して、各機器に障害が発生
したときにCPU2がメッセージを生成してもよい。
【0066】本発明が適用されるのは1台の情報処理シ
ステムだけに限定されない。通信ネットワークを介して
接続される複数の情報処理装置を備え、各情報処理装置
がメッセージを出力する情報処理システムにも本発明は
適用できる。この場合、障害通知システムは、通信ネッ
トワークに接続され、各情報処理装置からメッセージを
受信して、代表メッセージを出力するか否かを判断すれ
ばよい。また、例えば、障害通知システムが各情報処理
装置を監視し、障害発生時にメッセージを生成して、代
表メッセージを出力するか否かを判断してもよい。さら
に、各情報処理装置の各々において、一つまたは複数の
プログラムが動作し、それぞれのプログラムから出力さ
れるメッセージを監視し、プログラム動作上の障害に対
応した代表メッセージを出力するか否かを判断してもよ
い。すなわち、MIDにより一意に特定できるメッセー
ジが出力されるような処理系であれば、メッセージを出
力する機器やプログラムの種類、またはメッセージが経
由する通信ネットワークの形態に関わらず、本発明を適
用することができる。
【0067】
【発明の効果】本発明の障害通知システムによれば、新
たに一つのメッセージが発生したときに、オペレータに
提示すべき提示メッセージを出力すべきか否かを判断す
る判断手段と、判断手段が出力すべきと判断した提示メ
ッセージを出力する提示メッセージ出力手段とを備えて
いるので、提示メッセージ以外のメッセージの出力を防
止して、提示メッセージのみをオペレータに提示するこ
とができる。従って、オペレータは、提示メッセージに
よって障害原因の解析作業を進めることができ、慣れや
経験のないオペレータでも、障害の原因を解析しやすく
なる。また、解析作業時間も短縮できる。
【0068】また、本発明の障害通知プログラムによれ
ば、コンピュータに、新たに一つのメッセージが発生し
た場合に、一つの障害に起因する一連の障害によって発
生するメッセージのグループのうち、新たに発生したメ
ッセージが属するグループを特定し、特定したグループ
に対応する提示メッセージを出力すべき否かを判断する
機能、および提示メッセージを出力すべきと判断したと
きに、提示メッセージを出力する機能を実現させるの
で、提示メッセージ以外のメッセージの出力を防止し
て、提示メッセージのみをオペレータに提示することが
できる。従って、オペレータは、提示メッセージによっ
て障害原因の解析作業を進めることができ、慣れや経験
のないオペレータでも、障害の原因を解析しやすくな
る。また、解析作業時間も短縮できる。
【図面の簡単な説明】
【図1】 本発明の実施の一形態を示す説明図である。
【図2】 メッセージマスタテーブルに保持される情報
の例を示す説明図である。
【図3】 コリレーションマスタテーブルに保持される
情報の例を示す説明図である。
【図4】 代表メッセージの出力条件の説明図である。
【図5】 メッセージコリレーション定義ファイルの例
を示すの説明図である。
【図6】 メッセージボディテーブルに保持される情報
の例を示す説明図である。
【図7】 情報登録時の処理経過の例を示す流れ図であ
る。
【図8】 メッセージ受信時の処理経過の例を示す流れ
図である。
【符号の説明】
1 障害通知システム 2 中央処理装置(CPU) 3 記憶装置 4 障害通知プログラム 5 メッセージマスタテーブル 6 コリレーションマスタテーブル 7 メッセージボディテーブル 8 メッセージコリレーション定義ファイル 10 出力装置 11 入力装置

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 障害によってメッセージを発生させる情
    報処理システムに適用される障害通知システムであっ
    て、 新たに一つのメッセージが発生したときに、オペレータ
    に提示すべき提示メッセージを出力すべきか否かを判断
    する判断手段と、 判断手段が出力すべきと判断した提示メッセージを出力
    する提示メッセージ出力手段とを備えたことを特徴とす
    る障害通知システム。
  2. 【請求項2】 判断手段は、一つの障害に起因する一連
    の障害によって発生するメッセージのグループに属する
    一つのメッセージが新たに発生したときに、提示メッセ
    ージを出力すべきか否かを判断する請求項1に記載の障
    害通知システム。
  3. 【請求項3】 判断手段は、新たに一つのメッセージが
    発生した場合に、前記メッセージが属するグループの他
    の全てのメッセージが既に発生していて、かつ、新たな
    メッセージの発生確認時刻とグループ内の各メッセージ
    の発生確認時刻との差が各メッセージ毎に定められた各
    所定時間以内であれば、新たなメッセージが属するグル
    ープに対応する提示メッセージを出力すべきと判断する
    請求項2に記載の障害通知システム。
  4. 【請求項4】 一つの障害に起因する一連の障害によっ
    て発生する各メッセージを一つのグループに属するメッ
    セージとして関連付け、グループ毎に、関連付けられた
    各メッセージの情報と提示メッセージの情報とを対応さ
    せて保持する関連付け情報保持手段を備え、 判断手段は、新たなメッセージが属するグループの他の
    全てのメッセージが既に発生しているか否か、および、
    新たなメッセージの発生確認時刻とグループ内の各メッ
    セージの発生確認時刻との差が各メッセージ毎に定めら
    れた各所定時間以内であるか否かを、関連付け情報保持
    手段が保持する情報に基づいて判断する請求項3に記載
    の障害通知システム。
  5. 【請求項5】 各提示メッセージを識別するための識別
    情報と、各提示メッセージの内容とを対応させて保持す
    る提示メッセージ情報保持手段と、 少なくとも、関連付けられた各メッセージの情報と、前
    記各メッセージが属するグループに対応する提示メッセ
    ージの内容とを入力する入力手段と、 入力手段が入力した提示メッセージの内容と、前記提示
    メッセージの識別情報とを対応させて提示メッセージ情
    報保持手段に保持させ、関連付けられた各メッセージの
    情報と前記各メッセージが属するグループに対応する提
    示メッセージの識別情報とを対応させて関連付け情報保
    持手段に保持させる情報設定手段とを備えた請求項4に
    記載の障害通知システム。
  6. 【請求項6】 入力手段は、関連付けられた各メッセー
    ジの情報として、各メッセージ毎に定められた各所定時
    間の情報を含む情報を入力する請求項5に記載の障害通
    知システム。
  7. 【請求項7】 判断手段は、新たに発生したメッセージ
    が複数のグループに属している場合、新たに発生したメ
    ッセージが属するそれぞれのグループ毎に、提示メッセ
    ージを出力すべきか否かを判断する請求項2から請求項
    6のうちのいずれか1項に記載の障害通知システム。
  8. 【請求項8】 情報処理システムが障害によりメッセー
    ジを発生させたときに、オペレータに提示すべき提示メ
    ッセージを出力する障害通知プログラムであって、 コンピュータに、新たに一つのメッセージが発生した場
    合に、一つの障害に起因する一連の障害によって発生す
    るメッセージのグループのうち、新たに発生したメッセ
    ージが属するグループを特定し、特定したグループに対
    応する提示メッセージを出力すべき否かを判断する機
    能、および提示メッセージを出力すべきと判断したとき
    に、提示メッセージを出力する機能を実現させるための
    障害通知プログラム。
JP2002027445A 2002-02-04 2002-02-04 障害通知システムおよび障害通知プログラム Pending JP2003228497A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002027445A JP2003228497A (ja) 2002-02-04 2002-02-04 障害通知システムおよび障害通知プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002027445A JP2003228497A (ja) 2002-02-04 2002-02-04 障害通知システムおよび障害通知プログラム

Publications (1)

Publication Number Publication Date
JP2003228497A true JP2003228497A (ja) 2003-08-15

Family

ID=27748961

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002027445A Pending JP2003228497A (ja) 2002-02-04 2002-02-04 障害通知システムおよび障害通知プログラム

Country Status (1)

Country Link
JP (1) JP2003228497A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252459A (ja) * 2005-03-14 2006-09-21 Nomura Research Institute Ltd 監視装置及び監視方法
JP2010282521A (ja) * 2009-06-08 2010-12-16 Hitachi Electronics Service Co Ltd 障害監視装置
JP2011526121A (ja) * 2008-06-25 2011-09-29 トムソン ライセンシング 監視システムにおけるメッセージの対象とされたユーザへの通知
JP2012099092A (ja) * 2010-11-02 2012-05-24 Internatl Business Mach Corp <Ibm> インシデント・プールの管理方法、システムおよびコンピュータ・プログラム
JP2012123783A (ja) * 2010-12-07 2012-06-28 Internatl Business Mach Corp <Ibm> 適切なアラートの配信方法、システムおよびコンピュータ・プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252459A (ja) * 2005-03-14 2006-09-21 Nomura Research Institute Ltd 監視装置及び監視方法
JP2011526121A (ja) * 2008-06-25 2011-09-29 トムソン ライセンシング 監視システムにおけるメッセージの対象とされたユーザへの通知
JP2010282521A (ja) * 2009-06-08 2010-12-16 Hitachi Electronics Service Co Ltd 障害監視装置
JP2012099092A (ja) * 2010-11-02 2012-05-24 Internatl Business Mach Corp <Ibm> インシデント・プールの管理方法、システムおよびコンピュータ・プログラム
JP2012123783A (ja) * 2010-12-07 2012-06-28 Internatl Business Mach Corp <Ibm> 適切なアラートの配信方法、システムおよびコンピュータ・プログラム

Similar Documents

Publication Publication Date Title
CN109634728B (zh) 作业调度方法、装置、终端设备及可读存储介质
CN108763038B (zh) 告警数据的管理方法、装置、计算机设备及存储介质
JP4701148B2 (ja) 障害回復システム及びサーバ
WO2019237586A1 (zh) 定时任务管理方法、装置、计算机设备及存储介质
CN110324174B (zh) 区块链环境检测方法、设备、装置及存储介质
CN111159049A (zh) 接口自动化测试方法及系统
WO2023123943A1 (zh) 接口自动化测试方法、装置、介质、设备及程序
CN111078567A (zh) 自动化测试平台的报告生成方法、终端和存储介质
CN112286723A (zh) 机房容灾控制方法、终端及存储介质
KR20130042503A (ko) 통신 테스트 장치 및 방법
JP2003228497A (ja) 障害通知システムおよび障害通知プログラム
CN113658351A (zh) 一种产品生产的方法、装置、电子设备及存储介质
JP2016071398A (ja) テスト実行装置、テスト実行方法およびコンピュータプログラム
CN115190046B (zh) 一种服务器集群的检测方法、检测装置及计算设备
US20090083747A1 (en) Method for managing application programs by utilizing redundancy and load balance
JPH1063539A (ja) 運行監視通報システム
CN111090575B (zh) 测试方法
CN112613298A (zh) 数据校验方法、系统、计算机程序产品和电子设备
CN110362464B (zh) 软件分析方法及设备
CN112199229A (zh) 数据处理方法、装置、设备和存储介质
US7861033B2 (en) System architecture for implementing virtual disk service equipment
CN116756054B (zh) 一种测试方法、装置、电子设备及存储介质
CN112825044B (zh) 任务执行方法、装置及计算机存储介质
WO2021139280A1 (zh) 基于zookeeper的日志处理方法、装置、计算机设备和存储介质
KR950010835B1 (ko) 컴퓨터 시스템의 서비스 네트워크에서 한 컴퓨터 시스템상의 문제 예방 실행 방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20051115

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20051115

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060228