JP2003162430A - 障害情報管理装置および障害情報管理方法 - Google Patents

障害情報管理装置および障害情報管理方法

Info

Publication number
JP2003162430A
JP2003162430A JP2001361211A JP2001361211A JP2003162430A JP 2003162430 A JP2003162430 A JP 2003162430A JP 2001361211 A JP2001361211 A JP 2001361211A JP 2001361211 A JP2001361211 A JP 2001361211A JP 2003162430 A JP2003162430 A JP 2003162430A
Authority
JP
Japan
Prior art keywords
notification
fault
failure
information
new
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2001361211A
Other languages
English (en)
Inventor
Nobutane Mori
信胤 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2001361211A priority Critical patent/JP2003162430A/ja
Publication of JP2003162430A publication Critical patent/JP2003162430A/ja
Abandoned legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 複数の被監視対象から通知された障害通知の
重複を検知する。 【解決手段】 障害情報管理装置21が障害情報受信部
22と障害情報重複分析部24を有する。障害情報受信
部22は、分散した複数の被監視装置20a,20b,
20cの各々から被監視装置自身での障害の発生を示す
障害通知を受信することが可能である。障害情報重複分
析部24は、受信データ蓄積部23または障害情報蓄積
部32に蓄積された過去の障害通知と、新たに障害情報
受信部22で受信された障害通知とが一定の相関関係に
あるか否かを判断する。この判断が肯定的な場合に、障
害情報重複分析部24は、重複した障害通知へ行うべき
処理、例えば廃棄を新たな障害通知に対して行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、分散した複数の
被監視装置のいずれかから受信した障害通知を管理する
障害情報管理装置および障害情報管理方法に関するもの
である。
【0002】
【従来の技術】図11は、特開平5−334128号公
報に示された従来の障害自動通報装置を示す。図におい
て、1は障害自動通報装置としてのコンピュータ、2は
保守センタシステム、3は障害情報格納ファイル、10
はOS(operatingsystem)制御部、1
1は障害検出部、12は障害情報収集部、13は通報判
定部、14は送信部を示す。
【0003】次に動作について説明する。コンピュータ
1において、OS制御部10はコンピュータ1全体を制
御する。障害検出部11はコンピュータ1で発生した障
害を検出し、障害の検出をOS制御部10と障害情報収
集部12と通報判定部13にそれぞれ通知する。障害検
出部11から通知を受けると、OS制御部10は障害情
報を採取する。障害検出部11から通知を受けると、障
害情報収集部12はOS制御部10が保持している障害
情報を保守センタシステム2に通報する通報情報に加工
する。
【0004】通報判定部13は障害検出部11が検出し
た障害を保守センタシステム2に自動通報する必要があ
るか否かを判定する。具体的には、通報判定部13は障
害検出部11から送られてきた障害通知を一時記憶し、
この障害通知をその通知以前に記憶された障害通知すべ
てと比較する。その比較結果が一致する場合、通報判定
部13は、すでに保守センタシステム2に同一の障害情
報が自動通報されており、この障害情報を保守センタシ
ステム2へ自動通報するのは不要と判定し、送信部14
にその旨を通知する。他の場合には、通報判定部13
は、この障害情報を保守センタシステム2へ自動通報す
るのが必要と判定し、送信部14には通知を行わない。
【0005】送信部14は、障害情報収集部12で加工
された通報情報を通報判定部13の判定結果に基づい
て、保守センタシステム2に送信するか廃棄する。すな
わち、送信部14は保守センタシステム2への自動通報
を不要とする通報判定部13からの通知を受取ると、障
害情報収集部12から送られてくる障害情報を保守セン
タシステム2に送信せず、この障害情報を廃棄する。こ
れによって、同一の障害情報が保守センタシステム2に
重複して送信されることはない。
【0006】一方、通報判定部13が送信部14へ通知
を行わない場合には、送信部14は障害情報収集部12
からの障害情報を保守センタシステム2に送信する。送
信されてきた障害情報を保守センタシステム2は障害情
報格納ファイル3に蓄積する。
【0007】
【発明が解決しようとする課題】従来の障害情報管理装
置および障害情報管理方法は、以上のように構成されて
いるので、障害情報の重複の判断を行っているのが障害
情報を送信する送信元の個々のコンピュータ(被監視装
置)であるため、同時または短期間の間に複数の送信元
で同様の障害が発生した場合であっても、そのような障
害の発生を識別することができないなどの課題があっ
た。例えば、複数の被監視装置において同一の誤ったプ
ログラムを同時または短期間の間に起動した場合や、複
数の被監視装置が共通に通信するサーバのようなコンピ
ュータが故障した場合には、複数の被監視装置から同時
または短期間の間に原因を同じくする重複した障害情報
が保守センタシステムに通知されることがある。しか
し、従来の技術では、複数の対象から通知される障害情
報が重複した障害情報であるか否か判断ができない。従
って、重複した障害情報に適切な処理、例えば廃棄を行
うこともできない。
【0008】この発明は上記のような課題を解決するた
めになされたもので、複数の被監視対象から通知された
障害通知の重複を検知する障害情報管理装置および障害
情報管理方法を得ることを目的とする。
【0009】
【課題を解決するための手段】この発明に係る障害情報
通知装置は、分散した複数の被監視装置の各々から被監
視装置自身での障害の発生を示す障害通知を受信するこ
とが可能な障害情報受信部と、前記障害情報受信部で受
信された障害通知を蓄積する情報蓄積部と、新たに前記
障害情報受信部で受信された障害通知と、前記情報蓄積
部に蓄積された過去の障害通知とが一定の相関関係にあ
るか否かを判断する障害情報重複分析部と、前記障害情
報重複分析部の判断が肯定的な場合に、重複した障害通
知へ行うべき処理を前記新たな障害通知に対して行う重
複処理部とを備えたものである。
【0010】この発明に係る障害情報通知装置は、障害
情報重複分析部には、新たな障害通知が過去の障害通知
と相違していても前記新たな障害通知が重複した障害通
知であると判断するための許容相違情報が登録されてお
り、前記障害情報重複分析部は、前記新たな障害通知と
前記過去の障害通知との相違が前記許容相違情報で指定
されたことに属する場合に、前記新たな障害通知が前記
過去の障害通知と一定の相関関係にあると判断するもの
である。
【0011】この発明に係る障害情報通知装置は、障害
情報重複分析部には、新たな障害通知が過去の障害通知
と相違していても前記新たな障害通知が重複した障害通
知であると判断するための許容相違条件が登録されてお
り、前記障害情報重複分析部は、前記新たな障害通知と
前記過去の障害通知との相違が前記許容相違条件にあて
はまる場合に、前記新たな障害通知が前記過去の障害通
知と一定の相関関係にあると判断するものである。
【0012】この発明に係る障害情報通知装置は、障害
情報管理装置の内部状態に基づいて、重複処理部が重複
した障害通知へ行うべき処理を無効にするか否か決定す
ることが可能な有効無効決定部をさらに備えるものであ
る。
【0013】この発明に係る障害情報通知装置は、障害
情報重複分析部による判断が肯定的な場合に、重複した
障害通知に関連する表示を表示装置に表示することがで
きる形式の重複関連情報を生成する重複関連情報生成部
をさらに備えるものである。
【0014】この発明に係る障害情報通知方法は、分散
した複数の被監視装置のいずれかから被監視装置自身で
の障害の発生を示す障害通知を受信する工程と、新たに
受信された障害通知と、蓄積された過去の障害通知とが
一定の相関関係にあるか否かを判断する工程と、前記判
断が肯定的な場合に、重複した障害通知へ行うべき処理
を前記新たな障害通知に対して行う工程とを備えたもの
である。
【0015】この発明に係る障害情報通知方法は、判断
する工程では、新たな障害通知が過去の障害通知と相違
していても前記新たな障害通知が重複した障害通知であ
ると判断するための許容相違情報を用いて、前記新たな
障害通知と前記過去の障害通知との相違が前記許容相違
情報で指定されたことに属する場合に、前記新たな障害
通知が前記過去の障害通知と一定の相関関係にあると判
断するものである。
【0016】この発明に係る障害情報通知方法は、判断
する工程では、新たな障害通知が過去の障害通知と相違
していても前記新たな障害通知が重複した障害通知であ
ると判断するための許容相違条件を用いて、前記新たな
障害通知と前記過去の障害通知との相違が前記許容相違
条件にあてはまる場合に、前記新たな障害通知が前記過
去の障害通知と一定の相関関係にあると判断するもので
ある。
【0017】この発明に係る障害情報通知方法は、障害
情報管理装置の内部状態に基づいて、重複した障害通知
へ行うべき処理を実行するか否かを決定する工程をさら
に備えるものである。
【0018】この発明に係る障害情報通知方法は、判断
する工程による判断が肯定的な場合に、重複した障害通
知に関連する表示を表示装置に表示することができる形
式の重複関連情報を生成する工程をさらに備えるもので
ある。
【0019】
【発明の実施の形態】以下、この発明の実施の一形態を
説明する。 実施の形態1.図1はこの発明の実施の形態1による障
害情報管理装置の構成を示すブロック図である。図にお
いて、21は障害情報管理装置、20a,20b,20
cは障害情報管理装置21の監視対象である被監視装
置、22は障害情報受信部、23は受信データ蓄積部
(情報蓄積部)、24は障害情報重複分析部(重複処理
部)、30は障害情報表示部、31は障害情報転送処理
部、32は障害情報蓄積部を示す。この実施の形態に係
る障害情報管理装置21は、例えばコンピュータであっ
て、障害情報受信部22、受信データ蓄積部23、障害
情報重複分析部24、障害情報表示部30、障害情報転
送処理部31、障害情報蓄積部32を備える。
【0020】次に動作について説明する。被監視装置2
0a,20b,20cは障害通知の送信元になりうる。
すなわち、被監視装置20a,20b,20cのおのお
のは、自装置で障害が発生した場合に、障害通知を生成
し、障害情報受信部22に障害通知を送信する。好まし
くは、この障害通知は、障害が発生した被監視装置を表
す識別子ならびに障害の種類と程度および障害の発生時
刻を表す情報を含む。
【0021】障害情報受信部22は、分散した複数の被
監視装置20a,20b,20cの各々から被監視装置
20a,20b,20c自身での障害の発生を示す障害
通知を無線または有線によって、直接的または図示しな
い転送装置を介して間接的に受信することが可能であ
る。被監視装置20a,20b,20cのいずれかから
障害通知を受信すると、障害情報受信部22はその障害
通知を受信データ蓄積部23に渡す。例えば、コンピュ
ータにおける通信装置が障害情報受信部22に該当す
る。
【0022】受信データ蓄積部23は、障害情報受信部
22で受信された障害通知を障害情報受信部22から受
け取り、そのままの形式で障害通知を一時的に蓄積す
る。例えば、コンピュータにおけるFIFO(firs
t−in,first−out)形式のバッファが障害
情報受信部22に該当する。
【0023】障害情報重複分析部24は、受信データ蓄
積部23から障害通知を読み出す。複数の障害通知が受
信データ蓄積部23に蓄積されている場合には、この読
み出しの形式は、例えば、先に蓄積したものを先に読み
出すFIFO形式である。
【0024】障害情報重複分析部24は、新たに障害情
報受信部22で受信された障害通知と、過去の障害通知
とが一定の相関関係にあるか否かを判断する。そして、
障害情報重複分析部24は、この判断が肯定的な場合
に、後述する重複した障害通知へ行うべき例外処理を新
たな障害通知に対して行う。例えば、コンピュータにお
ける中央演算処理装置が障害情報重複分析部24に該当
する。
【0025】障害情報重複分析部24は、例えば、受信
データ蓄積部23から読み出した連続して受信した二つ
の障害通知が一定の相関関係にある場合に、重複した障
害通知へ行うべき例外処理を新たな障害通知に対して行
ってもよい。この場合には、受信データ蓄積部23は、
過去の障害通知を蓄積する情報蓄積部とみなすことがで
きる。
【0026】あるいは、障害情報重複分析部24は、受
信データ蓄積部23から読み出した新たな障害通知と、
障害情報蓄積部32から読み出した過去の障害通知の全
てとを比較し、新たな障害通知が過去の障害通知のいず
れかと一定の相関関係にある場合に、重複した障害通知
へ行うべき例外処理を新たな障害通知に対して行っても
よい。この場合には、障害情報蓄積部32が、過去の障
害通知を蓄積する情報蓄積部とみなすことができる。
【0027】この実施の形態では、「一定の相関関係に
ある」とは、新たな障害通知の内容が過去の障害通知の
内容と完全一致することをいう。このような「一定の相
関関係にある」場合には、現在処理しようとする障害通
知は、過去の障害通知と重複した障害通知である。例え
ば、同一の被監視装置が同じ障害通知を再送する場合
に、重複した障害通知が障害情報管理装置21に受信さ
れるので、このような事態が起こりうる。
【0028】また、上述のように、障害通知が、障害が
発生した被監視装置を表す識別子ならびに障害の種類と
程度および障害の発生時刻を表す情報を含む場合には、
被監視装置の識別子を無視して、新たな障害通知に示さ
れた障害の種類と程度および障害の発生時刻を表す情報
が、過去の障害通知に示されたものと完全一致すれば、
「一定の相関関係にある」と判断すると好ましい。この
ような「一定の相関関係にある」場合には、現在処理し
ようとする障害通知は、たとえ送信元が異なっていて
も、過去の障害通知と重複した障害通知である。例え
ば、複数の被監視装置において同一の誤ったプログラム
を同時に起動した場合や、複数の被監視装置が共通に通
信するサーバが故障した場合に、このような事態が起こ
りうる。
【0029】他方、新たな障害通知と過去の障害通知と
が一定の相関関係からはずれた場合には、現在処理しよ
うとする障害通知は、真に新たな障害を通告する障害通
知である。この場合には、障害情報重複分析部24は、
新たな障害通知に基づいた障害情報を障害情報表示部3
0に表示させる。これにより障害情報管理装置21の運
用者は、被監視装置20a,20b,20cのいずれか
で障害が発生したことを視覚的に知ることができる。こ
のとき障害情報表示部30に表示される障害情報は、障
害が発生した被監視装置を表す識別情報ならびに障害の
種類と程度および障害の発生時刻を表す情報を含むこと
が好ましい。障害情報表示部30は例えばコンピュータ
のモニタである。
【0030】また、新たな障害通知と過去の障害通知と
が一定の相関関係からはずれた場合には、障害情報重複
分析部24は、新たな障害通知を障害情報蓄積部32に
蓄積する。従って、この障害情報管理装置21の使用の
間に、真に新たな障害を通告する障害通知が蓄積されて
ゆく。障害情報蓄積部32は例えばコンピュータの記憶
装置であり、フレキシブルディスクのようなコンピュー
タから取り出し可能な記憶装置であってもよい。
【0031】障害情報蓄積部32に格納される障害通知
は、上述したように、障害が発生した被監視装置を表す
識別子ならびに障害の種類と程度および障害の発生時刻
を表す情報を含む形式を有する。また、障害情報蓄積部
32に格納される障害通知は、表示装置にこれらの識別
子および情報を表示することができる形式を有する。す
なわち、障害情報管理装置21では、情報蓄積部32か
らここに蓄積された過去の障害通知を読み出して、障害
情報表示部30に過去の障害通知に関するこれらの識別
子および情報を表示することができる。従って、障害情
報管理装置21の運用者は、過去の障害通知を参照し
て、障害を解析し、原因の究明その他の目的に過去の障
害通知を活用することが可能である。
【0032】また、新たな障害通知と過去の障害通知と
が一定の相関関係からはずれた場合には、障害情報重複
分析部24は、この新たな障害通知を障害情報転送処理
部31に転送する。障害情報転送処理部31は、障害情
報重複分析部24から転送された新たな障害通知をその
ままの形式で、または別の形式に変換して、他の装置に
転送する。例えば、コンピュータにおける通信装置が障
害情報転送処理部31に該当する。
【0033】障害情報転送処理部31が新たな障害通知
をそのままの形式で他の装置に転送する場合には、転送
先の装置でも、上記と同様の方式で、その装置の障害情
報表示部に新たな障害通知に基づいた障害情報を表示さ
せることができる。また、転送先の装置でも、上記と同
様の方式で、障害通知を蓄積し、過去の障害通知に基づ
いて障害を解析することができる。
【0034】また、障害情報転送処理部31は新たな障
害通知を別の形式、例えばインターネットを利用した電
子メールの形式、またはページャ網もしくは携帯電話網
に適合したショートメールの形式に変換し、変換した障
害通知を他の装置に転送してもよい。この場合には、被
監視装置20a,20b,20cのいずれかで障害が発
生したことを転送先の装置を利用して、障害情報管理装
置21から離れた場所にいる運用者が知ることができ
る。変換された障害通知も、障害が発生した被監視装置
を表す識別子ならびに障害の種類と程度および障害の発
生時刻を表す情報を含むと好ましい。
【0035】他方、新たな障害通知と過去の障害通知と
が一定の相関関係にあると判断した場合には、障害情報
重複分析部24は、重複した障害通知へ行うべき例外処
理を新たな障害通知に対して行う。具体的には、障害情
報重複分析部24は、この判断に対応する新たな障害通
知を破棄し、この障害通知を障害情報表示部30にも障
害情報転送処理部31にも渡さず、障害情報蓄積部32
にも格納しない。従って、障害情報表示部30には、こ
の障害通知に基づいた障害情報が表示されず、転送先の
他の装置にも障害通知は転送されない。
【0036】図2は、この実施の形態1による障害情報
重複分析部24の動作の一例を示すフローチャートであ
る。この動作は、受信データ蓄積部23に新たに受信し
た障害通知が格納されると開始される。まずステップS
T1で、障害情報重複分析部24は受信した新たな障害
通知を受信データ蓄積部23から読み出す。次に、ステ
ップST2で、障害情報蓄積部32に格納された過去の
障害通知のファイルを読み出して、このファイルから新
たな障害通知と比較される過去の障害通知の比較候補を
選択する。さらに、ステップST3で、新たな障害通知
がこの選択された比較候補と完全同一か否か判断し、こ
の判断が否定的であれば、ステップST4で、過去の障
害通知のファイルに次の比較候補があるか否か判断す
る。
【0037】ステップST4の判断が肯定的であれば、
動作はステップST2に戻り、ファイルから新たな障害
通知と比較される過去の障害通知の次の比較候補を選択
する。次の比較候補がなくなりステップST4の判断が
否定的になった場合には、動作はステップST5に進
み、新たな障害通知に対して、障害通知の通常の処理が
実行される。すなわち、新たな障害通知は、障害情報表
示部30および障害情報転送処理部31に渡され、障害
情報蓄積部32に格納される。この後、動作は終了す
る。
【0038】ファイル中のいずれかの過去の障害通知が
新たな障害通知と完全同一であった場合には、ステップ
ST3の判断が肯定的になり、動作はステップST6に
進み、新たな障害通知に対して、障害通知の例外処理が
実行される。すなわち、新たな障害通知は廃棄され、障
害情報表示部30および障害情報転送処理部31に渡さ
れず、障害情報蓄積部32に格納されない。この後、動
作は終了する。
【0039】以上のように、この実施の形態1によれ
ば、複数の被監視装置20a,20b,20cの個々が
自身の障害通知の重複送信を防止しなくても、被監視装
置20a,20b,20cから通知された障害通知の重
複を障害情報管理装置21で検知することができ、重複
した障害通知に対して適切な処理を採ることが可能であ
るなどの効果が得られる。
【0040】例えば、過去の障害通知と重複する新たに
受信した障害通知を破棄し、障害情報表示部30に障害
情報を表示せず、転送先の他の装置に障害通知を転送も
しないことによって、大量の重複した障害情報が発生し
た場合でも、運用者が大量の障害情報の個々について判
断に追われることなく、判断すべき障害情報のみについ
て判断を行ったり、通常の運用を続けたりすることがで
きる。また、転送先の他の装置への転送も行わないた
め、その装置にも影響が及ばない。
【0041】また、過去の障害通知と重複する新たに受
信した障害通知を障害情報蓄積部32にも渡さないた
め、障害通知の蓄積のための記憶領域の消費を抑えるこ
とができる。
【0042】また、障害通知のうちの障害が発生した被
監視装置を表す識別子を無視して、新たな障害通知の内
容と過去の障害通知の内容とが一定の相関関係にあるか
否か判断することによって、同一の原因によって複数の
被監視装置で障害が発生した場合であっても、それらの
障害に起因する障害通知を重複すると判断することが可
能である。
【0043】上記の実施の形態1では、新たな障害通知
が過去の障害通知とが一定の相関関係にあると判断した
場合には、障害情報重複分析部24は、この判断に対応
する新たな障害通知を破棄し、この障害通知を障害情報
表示部30にも障害情報転送処理部31にも渡さず、障
害情報蓄積部32にも格納しない。
【0044】但し、この発明を上記の実施の形態1に限
定する意図ではない。重複した障害通知へ行うべき例外
処理として、この障害通知を障害情報表示部30にだけ
渡して障害情報転送処理部31には渡さなかったり、こ
の障害通知を障害情報表示部30にも障害情報転送処理
部31にも渡さないが障害情報蓄積部32には格納する
ような選択的な処理を行ってもよい。
【0045】さらに、重複した障害通知を障害情報蓄積
部32に格納する場合には、下記のような例外処理を行
ってもよい。すなわち、障害情報蓄積部32に蓄積され
る過去の障害通知を記述した通常のファイルとは、別の
ファイルに重複した障害通知を格納してもよい。このよ
うな例外処理を採った場合には、通常とは別のファイル
に格納された重複した障害通知を運用者が参照して、障
害を解析し、原因の究明その他の目的に重複した障害通
知を活用することが可能である。
【0046】実施の形態2.次に、この発明に係る実施
の形態2を説明する。実施の形態2による障害情報管理
装置の構造は、図1に示された実施の形態1による障害
情報管理装置21の構造と同じでよい。従って、この実
施の形態2の説明についても、図1を引用し、同じ特徴
および動作についての説明は繰り返さない。但し、上記
の実施の形態1では、新たな障害通知の内容が過去の障
害通知(のいずれか)の内容に完全に一致する場合を重
複する障害通知とみなして例外処理を行う。しかし、実
施の形態2では、新たな障害通知の内容が過去の障害通
知(のいずれか)の内容と相違していても、相違点があ
らかじめ障害情報管理装置21に登録された許容相違情
報で指定されたことに属する場合には、新たな障害通知
が過去の障害通知と一定の相関関係にあると判断して、
新たな障害通知に対して例外処理を行う。
【0047】このため、障害情報管理装置21の障害情
報重複分析部24には、新たな障害通知が過去の障害通
知と相違していても、新たな障害通知が重複した障害通
知であると判断するための許容相違情報が登録されてい
る。障害情報重複分析部24は、新たな障害通知の内容
と過去の障害通知(の全て)の内容を比較し、新たな障
害通知の許容相違情報以外の内容が、過去の障害通知
(のいずれか)の内容に一致する場合には、新たな障害
通知が過去の障害通知と一定の相関関係にあると判断す
る。
【0048】実施の形態1に関連して述べたように、障
害情報重複分析部24は、例えば、受信データ蓄積部2
3から読み出した連続して受信した二つの障害通知が一
定の相関関係にある場合に、重複した障害通知へ行うべ
き例外処理を新たな障害通知に対して行ってもよい。あ
るいは、障害情報重複分析部24は、受信データ蓄積部
23から読み出した新たな障害通知と、障害情報蓄積部
32から読み出した全ての過去の障害通知とを比較し、
新たな障害通知が過去の障害通知のいずれかと一定の相
関関係にある場合に、重複した障害通知へ行うべき例外
処理を新たな障害通知に対して行ってもよい。
【0049】次に動作について説明する。障害通知のう
ちの比較から除外する部分、すなわち許容相違には、例
えば、被監視装置20a,20b,20cの有する対応
する特定の部分における障害の発生時刻がある。図3
は、実施の形態2の動作を説明するための図表である。
図3における「登録パターン」は、許容相違情報の登録
パターンを示しており、ここで示された登録パターン
は、Power Module Error(パワーモ
ジュールエラー)のうちのtime(発生時刻)を障害
通知のうちの許容相違にすることを意味する。パワーモ
ジュールとは、被監視装置20a,20b,20cがそ
れぞれ備え、各装置に給電するための部品である。図3
中の%any%は任意であることを意味し、結果的にこ
の登録パターンはtime(発生時刻)を障害通知のう
ちの比較から除外することを意味する。
【0050】このような登録パターンが設定されている
場合に、図3に示すように、新たな障害通知Aがパワー
モジュールエラーを含み、その発生時刻が23時12分
55秒であったと仮定する。また、この障害通知Aに近
似した障害通知Bがパワーモジュールエラーを含み、そ
の発生時刻が23時12分50秒であったと仮定する。
このとき、障害情報重複分析部24は、新たに通知され
た障害通知Aは、過去に通知されていた障害通知Bに重
複していると判断する。
【0051】図4は、この実施の形態2による障害情報
重複分析部24の動作の一例を示すフローチャートであ
る。この動作においては、新たな障害通知が、過去の障
害通知のうちの比較候補と完全同一でないためにステッ
プST3の判断が否定的であった場合には、動作はステ
ップST7に進む。ステップST7では、相違が許容相
違情報で指定されたことに属するか判断する。この判断
が否定的であれば、ステップST4で、過去の障害通知
のファイルに次の比較候補があるか否か判断する。
【0052】相違が許容相違情報で指定されたことに属
する場合には、ステップST7の判断が肯定的になり、
動作はステップST6に進み、新たな障害通知に対し
て、障害通知の例外処理が実行される。例外処理として
は、実施の形態1に関して上述した例外処理のいずれで
あってもよい。図4中のステップST1〜ST6につい
ては、実施の形態1に関して説明し図2に同じ符号で示
したステップと同じである。
【0053】許容相違情報で指定された相違が図3に例
示されたように任意である場合には、図4中のステップ
ST3とステップST7とを統合して、ステップST3
とステップST7で行うのと等価の処理を一つのステッ
プで行ってもよい。すなわち、新たな障害通知を過去の
障害通知と比較する際に、許容相違情報で指定された属
性(図3でいうパワーモジュールエラーの発生時刻)を
比較から除外してもよい。
【0054】以上のように、この実施の形態2によれ
ば、新たな障害通知が過去の障害通知と相違していて
も、相違が許容相違情報で指定されたことに属する場合
には、新たな障害通知が重複した障害通知であると判断
することができる。従って、運用者は許容相違情報を障
害情報重複分析部24に登録することによって、重複し
た障害通知とみなすことのできる障害通知の数を増加さ
せることが可能であるなどの効果が得られる。
【0055】特に、障害の発生時刻を許容相違情報で指
定することにより、同じ障害を繰り返して通知するよう
に設定された被監視装置20a,20b,20cについ
ても、障害の重複を適切に判断することができる。
【0056】実施の形態3.次に、この発明に係る実施
の形態3を説明する。実施の形態3による障害情報管理
装置の構造は、図1に示された実施の形態1による障害
情報管理装置21の構造と同じでよい。従って、この実
施の形態3の説明についても、図1を引用し、同じ特徴
および動作についての説明は繰り返さない。但し、実施
の形態3では、新たな障害通知の内容が過去の障害通知
(のいずれか)の内容と相違していても、相違点があら
かじめ障害情報管理装置21に登録された許容相違条件
にあてはまる場合には、新たな障害通知が過去の障害通
知と一定の相関関係にあると判断して、新たな障害通知
に対して例外処理を行う。
【0057】このため、障害情報管理装置21の障害情
報重複分析部24には、新たな障害通知が過去の障害通
知と相違していても、新たな障害通知が重複した障害通
知であると判断するための許容相違条件が登録されてい
る。障害情報重複分析部24は、必要に応じて、新たな
障害通知および過去の障害通知に演算または処理を施し
て、新たな障害通知の内容と過去の障害通知(の全て)
の内容との相違が許容相違条件にあてはまるか否か判断
する。相違が許容相違条件にあてはまる場合には、新た
な障害通知が過去の障害通知と一定の相関関係にあると
判断する。
【0058】実施の形態1に関連して述べたように、障
害情報重複分析部24は、例えば、受信データ蓄積部2
3から読み出した連続して受信した二つの障害通知が一
定の相関関係にある場合に、重複した障害通知へ行うべ
き例外処理を新たな障害通知に対して行ってもよい。あ
るいは、障害情報重複分析部24は、受信データ蓄積部
23から読み出した新たな障害通知と、障害情報蓄積部
32から読み出した過去の障害通知の全てとを比較し、
新たな障害通知が過去の障害通知のいずれかと一定の相
関関係にある場合に、重複した障害通知へ行うべき例外
処理を新たな障害通知に対して行ってもよい。
【0059】次に動作について説明する。図5は、この
実施の形態3による障害情報重複分析部24の動作の一
例を示すフローチャートである。この動作においては、
新たな障害通知が、過去の障害通知のうちの比較候補と
完全同一でないためにステップST3の判断が否定的で
あった場合には、動作はステップST8に進む。ステッ
プST8では、相違が許容相違条件にあてはまるか判断
する。この判断が否定的であれば、ステップST4で、
過去の障害通知のファイルに次の比較候補があるか否か
判断する。
【0060】相違が許容相違条件にあてはまる場合に
は、ステップST8の判断が肯定的になり、動作はステ
ップST6に進み、新たな障害通知に対して、障害通知
の例外処理が実行される。例外処理としては、実施の形
態1に関して上述した例外処理のいずれであってもよ
い。図5中のステップST1〜ST6については、実施
の形態1に関して説明し図2に同じ符号で示したステッ
プと同じである。
【0061】この実施の形態に関する許容相違条件に
は、様々なものが該当する。図6から図8は、そのよう
な許容相違条件の具体例を示す図表である。図6におけ
る許容相違条件(「条件」)は、新たな障害通知と過去
の障害通知の不一致文字が全て16進数字か記号である
ことを表す。この許容相違条件に従って、新たな障害通
知と過去の障害通知の不一致文字が全て16進数字か記
号である場合には、障害情報重複分析部24は新たに通
知された障害通知は、過去に通知されていた障害通知に
重複していると判断する。
【0062】例えば、図6に示すように、新たな障害通
知AがあるアプリケーションについてのMemory
Access Error(メモリアクセスエラー)を
含み、そのメモリアクセスエラーで示されたエラーが生
じたアドレスが「0011:AD33」であったと仮定
する。また、この障害通知Aに近似した障害通知Bがメ
モリアクセスエラーを含み、そのメモリアクセスエラー
で示されたエラーが生じたアドレスが「0012:DD
BA」であったと仮定する。図6における「AAAA
Application」は、あるアプリケーションプ
ログラムの名前である。両方の障害通知の相違は、これ
は16進数字または記号という許容相違条件に合致す
る。このとき、障害情報重複分析部24は、新たに通知
された障害通知Aは、過去に通知されていた障害通知B
に重複していると判断する。図6に示された許容相違条
件の例は、例えば、複数の被監視装置において同一の誤
ったプログラムを起動したような場合に、そのプログラ
ムに起因する重複した障害通知を識別することができる
ので便利である。
【0063】また、図7に示すように、許容相違条件
(「条件」)として、割合を障害情報重複分析部24に
登録することも可能である。図7における許容相違条件
は、不一致文字が数値でその相違が3%未満ということ
である。この許容相違条件に従って、障害情報重複分析
部24は、新たな障害通知と過去の障害通知に基づいて
演算を行い、両者の相違の割合を算出し、相違の割合が
3%未満である場合には、障害情報重複分析部24は新
たに通知された障害通知は、過去に通知されていた障害
通知に重複していると判断する。
【0064】例えば、図7に示すように、新たな障害通
知AがDisk array temperature
is 96 degrees(ディスクアレイ温度が
96度)というWarning(警告)であったと仮定
する。また、この障害通知Aに近似した障害通知Bがデ
ィスクアレイ温度が95度という警告であったと仮定す
る。両方の障害通知の相違は、不一致文字が数値でその
相違が約1%であるから、上記の許容相違条件に合致す
る。このとき、障害情報重複分析部24は、新たに通知
された障害通知Aは、過去に通知されていた障害通知B
に重複していると判断する。図6に示された許容相違条
件の例は、例えば、同じ被監視装置において障害がわず
かに悪化したことに起因する重複した障害通知を識別す
ることができるので便利である。
【0065】図8は、相違許容条件として使用できる他
の例を示す。図8に示された相違許容条件のいずれの例
も、不一致部分の割合または個数が小さいことを表す。
これらの例は、例えば、同じ被監視装置において障害が
わずかに悪化したことに起因する重複した障害通知を識
別することができるので便利である。
【0066】以上のように、この実施の形態3によれ
ば、新たな障害通知が過去の障害通知と相違していて
も、相違が許容相違条件にあてはまる場合には、新たな
障害通知が重複した障害通知であると判断することがで
きる。従って、運用者は許容相違条件を障害情報重複分
析部24に登録することによって、重複した障害通知と
みなすことのできる障害通知の数を増加させることが可
能であるなどの効果が得られる。
【0067】特に、障害情報管理装置21の運用者にと
って未知の種類の障害通知であるなどの理由により、実
施の形態2における事前の許容相違情報のパターンが登
録されていなくても、実施の形態3では許容相違条件に
基づいて、ある程度の確度をもって重複判断ができる。
また、事前の許容相違情報のパターン登録が不要である
ことから、この障害情報管理装置21を実現するために
多数の許容相違情報を登録する負荷が軽減できる。
【0068】実施の形態4.次に、この発明に係る実施
の形態4を説明する。実施の形態4による障害情報管理
装置の構造は、図1に示された実施の形態1による障害
情報管理装置21の構造と同じでよい。従って、この実
施の形態4の説明についても、図1を引用し、同じ特徴
および動作についての説明は繰り返さない。
【0069】上記の実施の形態1〜実施の形態3では、
受信した障害通知の全てに対して重複判断を行う。しか
し、大量の障害通知が集中して発生しているのでなけれ
ば、必ずしも重複した障害通知の廃棄を行う必要はな
く、むしろシステム運用者に全ての障害通知を示すほう
が正確な状況を掴みやすく好都合な場合がある。
【0070】そこで、この実施の形態4では、障害情報
管理装置21の内部状態に基づいて、障害情報重複分析
部24による重複した障害通知へ行うべき例外処理を実
行するか否かを障害情報重複分析部(有効無効決定部)
24が決定する。そして、実行するという決定が得られ
た場合には、障害情報重複分析部24は、新たな障害通
知と過去の障害通知とが一定の相関関係にあるか否かに
ついての判断を実行し、さらに一定の相関関係があれ
ば、障害情報重複分析部24は、該当する新たな障害通
知に対して重複した障害通知へ行うべき例外処理を実行
する。
【0071】他方、実行しないという決定が得られた場
合には、障害情報重複分析部24は、新たな障害通知と
過去の障害通知とが一定の相関関係にあるか否かについ
ての判断を実行せず、従って新たな障害通知が重複した
障害通知であったとしても、この新たな障害通知に対し
て重複した障害通知へ行うべき例外処理を実行しない。
あるいは、障害情報重複分析部24は、新たな障害通知
と過去の障害通知とが一定の相関関係にあるか否かにつ
いて判断してもよいが、新たな障害通知が重複した障害
通知であったとしても、この新たな障害通知に対して重
複した障害通知へ行うべき例外処理を実行しない。いず
れにせよ、重複した障害通知へ行うべき例外処理は無効
にされる。
【0072】次に動作について説明する。図9は、この
実施の形態4による障害情報重複分析部24の動作の一
例を示すフローチャートである。この動作は、受信デー
タ蓄積部23に新たに受信した障害通知が格納されると
開始される。まず、ステップST9で、障害情報管理装
置21の内部状態に基づいて、新たな障害通知が過去の
障害通知と一定の相関関係にあるか否かについての重複
判断を実行するか否かを障害情報重複分析部(有効無効
決定部)24が決定する。ステップST9の判断の基礎
となる障害情報管理装置21の内部状態としては、様々
な条件が考えられ、例えば、図1の受信データ蓄積部2
3への障害通知の蓄積の度合い、または、図1の障害情
報表示部30に表示されている障害通知のうち未解決扱
いになっている障害通知の数が挙げられる。これらの度
合いまたは数が大きい場合、すなわち障害情報管理装置
21内で障害通知が混雑している場合には、重複判断を
実行しない。但し、この発明はここで挙げた内部状態の
種類に限定されない。
【0073】ステップST9の判断が肯定的であれば、
動作はステップST1に進み、障害情報重複分析部24
は受信した新たな障害通知を受信データ蓄積部23から
読み出す。以後、実施の形態1と同様の動作が行われ
る。図4中のステップST1〜ST6については、実施
の形態1に関して説明し図2に同じ符号で示したステッ
プと同じである。
【0074】他方、ステップST9の判断が否定的であ
れば、動作はステップST10に進み、障害情報重複分
析部24は受信した新たな障害通知を受信データ蓄積部
23から読み出す。さらに動作はステップST5に進
み、新たな障害通知に対して、障害通知の通常の処理が
実行される。
【0075】以上のように、この実施の形態4によれ
ば、システム運用者に対処の余力があると想定される場
合は、障害通知の廃棄を避けて、入念な障害通知の分析
を行わせることができるなどの効果が得られる。
【0076】図2および図9を比較すると明らかなよう
に、図9に示すフローチャートは図2に示すフローチャ
ートを修正したものであるが、このフローチャートはこ
の発明の例示であって、この発明を限定する意図ではな
い。実施の形態2または実施の形態3に係る図4または
図5のフローチャートの動作を同様に修正し、新たな障
害通知が過去の障害通知と相違していても、相違が許容
相違情報に示されたことに属する場合または許容相違条
件にあてはまる場合には、新たな障害通知が重複した障
害通知であると判断してもよい。
【0077】実施の形態5.次に、この発明に係る実施
の形態5を説明する。実施の形態5による障害情報管理
装置の構造は、図1に示された実施の形態1による障害
情報管理装置21の構造と同じでよい。従って、この実
施の形態5の説明についても、図1を引用し、同じ特徴
および動作についての説明は繰り返さない。
【0078】上記の実施の形態1〜実施の形態4では、
重複する障害通知であると判断された障害通知は廃棄ま
たは別処理されるが、障害情報表示部30および障害情
報転送処理部31には、重複する障害が発生したことが
通知されず、システム運用者には同一または類似の障害
通知の多発があったことが分からない。また、実施の形
態2および実施の形態3については、相違があっても重
複する障害通知であるとみなした場合には、どの部分が
過去の障害通知と異なるのかが直ぐには分からない。従
って、必要な対処が抜けてしまう可能性がある。
【0079】そこで、この実施の形態5では、障害情報
重複分析部24が重複した障害通知へ行うべき例外処理
に応じて、例外処理に関連する表示を表示装置に表示す
ることができる形式の重複処理関連情報を障害情報重複
分析部(重複関連情報生成部)24が生成する。ここで
いう表示装置は、例えば、障害情報管理装置21におけ
る障害情報表示部30だけでなく、他の装置の表示装置
も含む。従って、重複処理関連情報に基づいて、障害情
報表示部30および他の装置の表示装置は、例外処理に
関連する表示を表示することができる。
【0080】重複処理関連情報を生成すると、障害情報
重複分析部24は、重複処理関連情報をこれに対応する
過去の障害通知に関連づけて、この障害通知に基づいた
障害情報および重複処理関連情報に基づいた例外処理に
関連する表示を障害情報表示部30に表示させる。
【0081】図10は、重複処理関連情報に基づいた例
外処理に関連する表示の例を示す。図10に示すよう
に、重複検出前(重複する新たな障害通知が検出される
前)には、障害情報表示部30に、Frame tem
perature is 95degrees(フレー
ム温度が95度)という障害情報が表示されている。ま
た、この実施の形態では、障害情報に対応する障害に対
して、運用者の処置が行われていないことを示す「未処
置」という状態表示が障害情報の最初の表示の際に表示
される。障害に対して処置を行った場合には、図示しな
い入力装置を用いて、運用者は図10に示すように状態
表示を「処置済」に変更する指令を障害情報管理装置2
1に入力することができる。この指令を受けて、障害情
報表示部30は、状態表示を「処置済」に変更する。こ
こでいう「処置」は、発生した障害に対して運用者がそ
の解決を試みて施した処置を意味し、障害情報管理装置
21の内部で障害通知に対して行う「処理」とは異な
る。
【0082】重複検出後(重複する新たな障害通知が検
出された後)には、図10に示すように、重複処理関連
情報に基づいた例外処理に関連する情報、すなわち、同
一または類似の種類の障害通知を受信した件数(重複
数)、同一または類似の種類の障害通知のうち最新のも
のを受信した時刻(最終時刻)、および最新の障害通知
中の他の同一または類似の種類の障害通知との相違が障
害情報表示部30に表示される。最新の障害通知中の他
の同一または類似の種類の障害通知との相違として、具
体的には図10では、数値96に下線が付与される。こ
れにより運用者の注意が喚起される。相違がない場合に
は、このような表示は行われない。図10は例外処理に
関連する情報を例示するが、この発明を限定する意図で
はなく、他の種類の情報を他の方式で表示してもよい。
例えば、相違を示すためには、下線で特定するのでなく
てもよく、文字の点滅、着色、フォントサイズの変更に
よって特定するのでもよい。
【0083】また、この実施の形態では、過去の障害通
知に対応する障害を運用者がすでに処置していたとして
も、重複検出後、障害情報重複分析部24は、障害情報
表示部30の状態表示を「未処置」に自動的に変更す
る。すなわち、少なくとも最新の障害通知に関連する障
害に対して未処置であるという推定が運用者に通知され
る。最新の障害に対して処置を行った場合には、上述の
ように、運用者は状態表示を「処置済」に変更する指令
を障害情報管理装置21に入力することができる。
【0084】また、障害情報重複分析部24は、重複処
理関連情報をこれに対応する過去の障害通知に関連づけ
て障害情報蓄積部32に格納する。すなわち重複処理関
連情報を過去の障害通知に付加して、障害通知を更新し
て格納する。従って、障害情報蓄積部32から過去の障
害通知を読み出せば、障害通知に基づいた障害情報およ
び重複処理関連情報に基づいた例外処理に関連する表示
を障害情報表示部30または他の装置の表示装置は表示
することが可能である。
【0085】また、障害情報重複分析部24は、重複処
理関連情報をこれに対応する過去の障害通知に関連づけ
て障害情報転送処理部31に転送する。障害情報転送処
理部31は、重複処理関連情報をそのままの形式で、ま
たは別の形式に変換して、他の装置に転送する。
【0086】以上のように、この実施の形態5によれ
ば、システム運用者に障害通知の重複があったことを知
らせ、最新の障害通知への対処の抜けを防ぐことができ
るなどの効果が得られる。
【0087】以上、この発明をその好適な実施の形態を
参照しながら詳細に図示して説明したが、請求の範囲に
記載された本発明の趣旨および範囲の区域内で、形式お
よび細部に関する様々な変更が可能であることは当業者
であれば理解できることだろう。かかる変更、代替、修
正も本発明の範囲に含まれる均等なものであると意図す
る。
【0088】例えば、上述の実施の形態に係る障害情報
管理装置21は、障害情報表示部30、障害情報転送処
理部31、障害情報蓄積部32を備えているが、これら
の一つまたはいくつかを有しない障害情報管理装置もこ
の発明の範囲に属する。例えば、障害情報転送処理部3
1を設けずに、他の装置への情報の転送を行わない障害
情報管理装置もこの発明の範囲に属する。あるいは、障
害情報表示部30および障害情報蓄積部32を設けず
に、他の装置への情報の転送を行うが自身では障害通知
に関する情報を運用者に提示しない、中継装置もこの発
明の範囲に属する。
【0089】
【発明の効果】以上のように、この発明によれば、分散
した複数の被監視装置の各々から被監視装置自身での障
害の発生を示す障害通知を受信することが可能な障害情
報受信部と、前記障害情報受信部で受信された障害通知
を蓄積する情報蓄積部と、新たに前記障害情報受信部で
受信された障害通知と、前記情報蓄積部に蓄積された過
去の障害通知とが一定の相関関係にあるか否かを判断す
る障害情報重複分析部と、前記障害情報重複分析部の判
断が肯定的な場合に、重複した障害通知へ行うべき処理
を前記新たな障害通知に対して行う重複処理部とを備え
るように構成したので、複数の被監視装置の個々が自身
の障害通知の重複送信を防止しなくても、被監視装置か
ら通知された障害通知の重複を障害情報管理装置で検知
することができ、重複した障害通知に対して適切な処理
を採ることが可能であるなどの効果がある。
【0090】この発明によれば、障害情報重複分析部に
は、新たな障害通知が過去の障害通知と相違していても
前記新たな障害通知が重複した障害通知であると判断す
るための許容相違情報が登録されており、前記障害情報
重複分析部は、前記新たな障害通知と前記過去の障害通
知との相違が前記許容相違情報で指定されたことに属す
る場合に、前記新たな障害通知が前記過去の障害通知と
一定の相関関係にあると判断するように構成したので、
新たな障害通知が過去の障害通知と相違していても、相
違が許容相違情報で指定されたことに属する場合には、
新たな障害通知が重複した障害通知であると判断するこ
とができる。従って、運用者は許容相違情報を障害情報
重複分析部に登録することによって、重複した障害通知
とみなすことのできる障害通知の数を増加させることが
可能であるなどの効果がある。
【0091】この発明によれば、障害情報重複分析部に
は、新たな障害通知が過去の障害通知と相違していても
前記新たな障害通知が重複した障害通知であると判断す
るための許容相違条件が登録されており、前記障害情報
重複分析部は、前記新たな障害通知と前記過去の障害通
知との相違が前記許容相違条件にあてはまる場合に、前
記新たな障害通知が前記過去の障害通知と一定の相関関
係にあると判断するように構成したので、新たな障害通
知が過去の障害通知と相違していても、相違が許容相違
条件にあてはまる場合には、新たな障害通知が重複した
障害通知であると判断することができる。従って、運用
者は許容相違条件を障害情報重複分析部に登録すること
によって、重複した障害通知とみなすことのできる障害
通知の数を増加させることが可能であるなどの効果があ
る。
【0092】この発明によれば、障害情報管理装置の内
部状態に基づいて、重複処理部が重複した障害通知へ行
うべき処理を無効にするか否か決定することが可能な有
効無効決定部をさらに備えるように構成したので、シス
テム運用者に対処の余力があると想定される場合は、障
害通知の廃棄を避けて、入念な障害通知の分析を行わせ
ることができるなどの効果がある。
【0093】この発明によれば、障害情報重複分析部に
よる判断が肯定的な場合に、重複した障害通知に関連す
る表示を表示装置に表示することができる形式の重複関
連情報を生成する重複関連情報生成部をさらに備えるよ
うに構成したので、システム運用者に障害通知の重複が
あったことを知らせ、最新の障害通知への対処の抜けを
防ぐことができるなどの効果がある。
【0094】この発明によれば、分散した複数の被監視
装置のいずれかから被監視装置自身での障害の発生を示
す障害通知を受信する工程と、新たに受信された障害通
知と、蓄積された過去の障害通知とが一定の相関関係に
あるか否かを判断する工程と、前記判断が肯定的な場合
に、重複した障害通知へ行うべき処理を前記新たな障害
通知に対して行う工程とを備えるように構成したので、
複数の被監視装置の個々が自身の障害通知の重複送信を
防止しなくても、被監視装置から通知された障害通知の
重複を障害情報管理装置で検知することができ、重複し
た障害通知に対して適切な処理を採ることが可能である
などの効果がある。
【0095】この発明によれば、判断する工程では、新
たな障害通知が過去の障害通知と相違していても前記新
たな障害通知が重複した障害通知であると判断するため
の許容相違情報を用いて、前記新たな障害通知と前記過
去の障害通知との相違が前記許容相違情報で指定された
ことに属する場合に、前記新たな障害通知が前記過去の
障害通知と一定の相関関係にあると判断するように構成
したので、新たな障害通知が過去の障害通知と相違して
いても、相違が許容相違情報で指定されたことに属する
場合には、新たな障害通知が重複した障害通知であると
判断することができる。従って、重複した障害通知とみ
なすことのできる障害通知の数を増加させることが可能
であるなどの効果がある。
【0096】この発明によれば、判断する工程では、新
たな障害通知が過去の障害通知と相違していても前記新
たな障害通知が重複した障害通知であると判断するため
の許容相違条件を用いて、前記新たな障害通知と前記過
去の障害通知との相違が前記許容相違条件にあてはまる
場合に、前記新たな障害通知が前記過去の障害通知と一
定の相関関係にあると判断するように構成したので、新
たな障害通知が過去の障害通知と相違していても、相違
が許容相違条件にあてはまる場合には、新たな障害通知
が重複した障害通知であると判断することができる。従
って、重複した障害通知とみなすことのできる障害通知
の数を増加させることが可能であるなどの効果がある。
【0097】この発明によれば、障害情報管理装置の内
部状態に基づいて、重複した障害通知へ行うべき処理を
実行するか否かを決定する工程をさらに備えるように構
成したので、システム運用者に対処の余力があると想定
される場合は、障害通知の廃棄を避けて、入念な障害通
知の分析を行わせることができるなどの効果がある。
【0098】この発明によれば、判断する工程による判
断が肯定的な場合に、重複した障害通知に関連する表示
を表示装置に表示することができる形式の重複関連情報
を生成する工程をさらに備えるように構成したので、シ
ステム運用者に障害通知の重複があったことを知らせ、
最新の障害通知への対処の抜けを防ぐことができるなど
の効果がある。
【図面の簡単な説明】
【図1】 この発明の実施の形態1による障害情報管理
装置の構成を示すブロック図である。
【図2】 実施の形態1による障害情報重複分析部の動
作の一例を示すフローチャートである。
【図3】 この発明の実施の形態2の動作を説明するた
めの図表である。
【図4】 実施の形態2による障害情報重複分析部の動
作の一例を示すフローチャートである。
【図5】 この発明の実施の形態3による障害情報重複
分析部の動作の一例を示すフローチャートである。
【図6】 実施の形態3に関する許容相違条件の具体例
を示す図表である。
【図7】 実施の形態3に関する許容相違条件の他の具
体例を示す図表である。
【図8】 実施の形態3に関する相違許容条件として使
用できる他の例を示す図表である。
【図9】 この発明の実施の形態4による障害情報重複
分析部の動作の一例を示すフローチャートである。
【図10】 この発明の実施の形態5による重複処理関
連情報に基づいた例外処理に関連する表示の例を示す図
である。
【図11】 従来の障害自動通報装置を示すブロック図
である。
【符号の説明】
20a,20b,20c 被監視装置、21 障害情報
管理装置、22 障害情報受信部、23 受信データ蓄
積部(情報蓄積部)、24 障害情報重複分析部(重複
処理部、有効無効決定部、重複関連情報生成部)、30
障害情報表示部、31 障害情報転送処理部、32
障害情報蓄積部(情報蓄積部)。
フロントページの続き Fターム(参考) 5B042 GA11 GA12 GA36 GA39 GC17 JJ02 JJ03 JJ18 KK09 KK15 LA20 MA11 MA14 MB04 MC15 NN04 5B089 GA01 GB02 JA36 JB17 KA12 KC21 KC47 MC08

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 分散した複数の被監視装置の各々から被
    監視装置自身での障害の発生を示す障害通知を受信する
    ことが可能な障害情報受信部と、 前記障害情報受信部で受信された障害通知を蓄積する情
    報蓄積部と、 新たに前記障害情報受信部で受信された障害通知と、前
    記情報蓄積部に蓄積された過去の障害通知とが一定の相
    関関係にあるか否かを判断する障害情報重複分析部と、 前記障害情報重複分析部の判断が肯定的な場合に、重複
    した障害通知へ行うべき処理を前記新たな障害通知に対
    して行う重複処理部とを備えた障害情報管理装置。
  2. 【請求項2】 障害情報重複分析部には、新たな障害通
    知が過去の障害通知と相違していても前記新たな障害通
    知が重複した障害通知であると判断するための許容相違
    情報が登録されており、前記障害情報重複分析部は、前
    記新たな障害通知と前記過去の障害通知との相違が前記
    許容相違情報で指定されたことに属する場合に、前記新
    たな障害通知が前記過去の障害通知と一定の相関関係に
    あると判断することを特徴とする請求項1記載の障害情
    報管理装置。
  3. 【請求項3】 障害情報重複分析部には、新たな障害通
    知が過去の障害通知と相違していても前記新たな障害通
    知が重複した障害通知であると判断するための許容相違
    条件が登録されており、前記障害情報重複分析部は、前
    記新たな障害通知と前記過去の障害通知との相違が前記
    許容相違条件にあてはまる場合に、前記新たな障害通知
    が前記過去の障害通知と一定の相関関係にあると判断す
    ることを特徴とする請求項1記載の障害情報管理装置。
  4. 【請求項4】 障害情報管理装置の内部状態に基づい
    て、重複処理部が重複した障害通知へ行うべき処理を無
    効にするか否か決定することが可能な有効無効決定部を
    さらに備えることを特徴とする請求項1から請求項3の
    いずれか1項記載の障害情報管理装置。
  5. 【請求項5】 障害情報重複分析部による判断が肯定的
    な場合に、重複した障害通知に関連する表示を表示装置
    に表示することができる形式の重複関連情報を生成する
    重複関連情報生成部をさらに備えることを特徴とする請
    求項1から請求項4のいずれか1項記載の障害情報管理
    装置。
  6. 【請求項6】 分散した複数の被監視装置のいずれかか
    ら被監視装置自身での障害の発生を示す障害通知を受信
    する工程と、 新たに受信された障害通知と、蓄積された過去の障害通
    知とが一定の相関関係にあるか否かを判断する工程と、 前記判断が肯定的な場合に、重複した障害通知へ行うべ
    き処理を前記新たな障害通知に対して行う工程とを備え
    た障害情報管理方法。
  7. 【請求項7】 判断する工程では、新たな障害通知が過
    去の障害通知と相違していても前記新たな障害通知が重
    複した障害通知であると判断するための許容相違情報を
    用いて、前記新たな障害通知と前記過去の障害通知との
    相違が前記許容相違情報で指定されたことに属する場合
    に、前記新たな障害通知が前記過去の障害通知と一定の
    相関関係にあると判断することを特徴とする請求項6記
    載の障害情報管理方法。
  8. 【請求項8】 判断する工程では、新たな障害通知が過
    去の障害通知と相違していても前記新たな障害通知が重
    複した障害通知であると判断するための許容相違条件を
    用いて、前記新たな障害通知と前記過去の障害通知との
    相違が前記許容相違条件にあてはまる場合に、前記新た
    な障害通知が前記過去の障害通知と一定の相関関係にあ
    ると判断することを特徴とする請求項6記載の障害情報
    管理方法。
  9. 【請求項9】 障害情報管理装置の内部状態に基づい
    て、重複した障害通知へ行うべき処理を実行するか否か
    を決定する工程をさらに備えることを特徴とする請求項
    6から請求項8のいずれか1項記載の障害情報管理方
    法。
  10. 【請求項10】 判断する工程による判断が肯定的な場
    合に、重複した障害通知に関連する表示を表示装置に表
    示することができる形式の重複関連情報を生成する工程
    をさらに備えることを特徴とする請求項6から請求項9
    のいずれか1項記載の障害情報管理方法。
JP2001361211A 2001-11-27 2001-11-27 障害情報管理装置および障害情報管理方法 Abandoned JP2003162430A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001361211A JP2003162430A (ja) 2001-11-27 2001-11-27 障害情報管理装置および障害情報管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001361211A JP2003162430A (ja) 2001-11-27 2001-11-27 障害情報管理装置および障害情報管理方法

Publications (1)

Publication Number Publication Date
JP2003162430A true JP2003162430A (ja) 2003-06-06

Family

ID=19171910

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001361211A Abandoned JP2003162430A (ja) 2001-11-27 2001-11-27 障害情報管理装置および障害情報管理方法

Country Status (1)

Country Link
JP (1) JP2003162430A (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005141467A (ja) * 2003-11-06 2005-06-02 Nomura Research Institute Ltd コンピュータシステムの監視装置および監視方法
JP2005275673A (ja) * 2004-03-24 2005-10-06 Nec Fielding Ltd 遠隔保守システム、遠隔保守方法、監視装置、及びプログラム
JP2007128424A (ja) * 2005-11-07 2007-05-24 Fujitsu Ltd 監視装置、監視方法、監視システム
WO2007099578A1 (ja) * 2006-02-27 2007-09-07 Fujitsu Limited 故障解析装置
JP2007265109A (ja) * 2006-03-29 2007-10-11 Yamatake Corp 施設管理装置および方法
JP2007286874A (ja) * 2006-04-17 2007-11-01 Fujitsu Ltd 情報検索方法および情報検索プログラム
JP2008217735A (ja) * 2007-03-08 2008-09-18 Nec Corp 障害解析システム、方法、及び、プログラム
US8042008B2 (en) 2008-05-30 2011-10-18 Fujitsu Limited Information processing device, transfer circuit and error controlling method for information processing device
JP2012078945A (ja) * 2010-09-30 2012-04-19 Hitachi Solutions Ltd 管理システム、デバイス管理方法、及び遠隔管理装置
JP2012155461A (ja) * 2011-01-25 2012-08-16 Mitsubishi Electric Corp 障害情報・装置情報蓄積装置
JP2012239375A (ja) * 2006-07-05 2012-12-06 Arizona Pubric Service Co 装置の状態の例外に基づく通知のための方法
WO2014010021A1 (ja) * 2012-07-09 2014-01-16 富士通株式会社 情報処理装置、情報処理システム、情報処理装置制御方法及び情報処理装置制御プログラム
JP2014182720A (ja) * 2013-03-21 2014-09-29 Fujitsu Ltd 情報処理システム、情報処理装置及び障害処理方法
JP2016062340A (ja) * 2014-09-18 2016-04-25 日本電気株式会社 情報処理システム、情報処理装置、情報処理方法、及び、プログラム
JP2019036194A (ja) * 2017-08-18 2019-03-07 富士通株式会社 監視制御プログラム、監視制御方法、および情報処理装置

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005141467A (ja) * 2003-11-06 2005-06-02 Nomura Research Institute Ltd コンピュータシステムの監視装置および監視方法
JP4530645B2 (ja) * 2003-11-06 2010-08-25 株式会社野村総合研究所 コンピュータシステムの監視装置および監視方法
JP2005275673A (ja) * 2004-03-24 2005-10-06 Nec Fielding Ltd 遠隔保守システム、遠隔保守方法、監視装置、及びプログラム
JP2007128424A (ja) * 2005-11-07 2007-05-24 Fujitsu Ltd 監視装置、監視方法、監視システム
WO2007099578A1 (ja) * 2006-02-27 2007-09-07 Fujitsu Limited 故障解析装置
US8166337B2 (en) 2006-02-27 2012-04-24 Fujitsu Limited Failure analysis apparatus
JPWO2007099578A1 (ja) * 2006-02-27 2009-07-16 富士通株式会社 故障解析装置
JP4523659B2 (ja) * 2006-02-27 2010-08-11 富士通株式会社 故障解析装置
JP4695000B2 (ja) * 2006-03-29 2011-06-08 株式会社山武 施設管理装置および方法
JP2007265109A (ja) * 2006-03-29 2007-10-11 Yamatake Corp 施設管理装置および方法
JP2007286874A (ja) * 2006-04-17 2007-11-01 Fujitsu Ltd 情報検索方法および情報検索プログラム
JP2012239375A (ja) * 2006-07-05 2012-12-06 Arizona Pubric Service Co 装置の状態の例外に基づく通知のための方法
JP2008217735A (ja) * 2007-03-08 2008-09-18 Nec Corp 障害解析システム、方法、及び、プログラム
US8042008B2 (en) 2008-05-30 2011-10-18 Fujitsu Limited Information processing device, transfer circuit and error controlling method for information processing device
JP2012078945A (ja) * 2010-09-30 2012-04-19 Hitachi Solutions Ltd 管理システム、デバイス管理方法、及び遠隔管理装置
JP2012155461A (ja) * 2011-01-25 2012-08-16 Mitsubishi Electric Corp 障害情報・装置情報蓄積装置
WO2014010021A1 (ja) * 2012-07-09 2014-01-16 富士通株式会社 情報処理装置、情報処理システム、情報処理装置制御方法及び情報処理装置制御プログラム
JP2014182720A (ja) * 2013-03-21 2014-09-29 Fujitsu Ltd 情報処理システム、情報処理装置及び障害処理方法
JP2016062340A (ja) * 2014-09-18 2016-04-25 日本電気株式会社 情報処理システム、情報処理装置、情報処理方法、及び、プログラム
JP2019036194A (ja) * 2017-08-18 2019-03-07 富士通株式会社 監視制御プログラム、監視制御方法、および情報処理装置

Similar Documents

Publication Publication Date Title
JP2003162430A (ja) 障害情報管理装置および障害情報管理方法
US20090235119A1 (en) System for monitoring and diagnosing remote devices
CN112506702B (zh) 数据中心容灾方法、装置、设备及存储介质
EP3842974B1 (en) Information processing device, information processing method, and program
JP4808187B2 (ja) 経路切替方法及び装置
JP5409536B2 (ja) ゲートウェイ装置
CN114090293A (zh) 一种服务提供方法及电子设备
JP3691272B2 (ja) 分散処理システムおよび障害解析情報の保存方法
CN114710389B (zh) 信息处理方法和信息处理装置
JP2008005118A (ja) ネットワーク監視システム
KR100235570B1 (ko) 2이상의 주전산기를 병립 연결한 시스템의 클러스터 관리 마스터 시스템의 클러스터 관리방법
CN107786673A (zh) 一种物联网系统
WO2023127477A1 (ja) 車載装置、プログラム及び、情報処理方法
JP2751861B2 (ja) ネットワークシステム障害検出処理回路
JP4299572B2 (ja) 障害通報方式および障害通報方法
JP4089459B2 (ja) 不在装置通知手段を備えた接続状態検出システム
JPH07253912A (ja) プロセス監視装置
KR960001084B1 (ko) 교환기의 프로세서간 통신망에서 노드의 경보발생 노드 확인 방법
JPH11272508A (ja) 監視対象装置の異常検出方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体
JPH0936853A (ja) ネットワーク上におけるデータ交換方式
JPH03123230A (ja) ネットワーク監視システムの関連アラーム早期検出装置
JP2828044B2 (ja) 障害通知機能を有する通信装置、通信システムおよび障害通知方法
JPH10229589A (ja) 監視方法及び監視システム
JP6301750B2 (ja) 中継装置
CN112416720A (zh) 一种计算机故障纠错系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041018

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070724

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20070814