JP3450264B2 - 障害検出システム - Google Patents

障害検出システム

Info

Publication number
JP3450264B2
JP3450264B2 JP2000103974A JP2000103974A JP3450264B2 JP 3450264 B2 JP3450264 B2 JP 3450264B2 JP 2000103974 A JP2000103974 A JP 2000103974A JP 2000103974 A JP2000103974 A JP 2000103974A JP 3450264 B2 JP3450264 B2 JP 3450264B2
Authority
JP
Japan
Prior art keywords
failure
msg
node
pattern
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000103974A
Other languages
English (en)
Other versions
JP2001292143A (ja
Inventor
幸一 津田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solutions Innovators Ltd
Original Assignee
NEC Solutions Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solutions Innovators Ltd filed Critical NEC Solutions Innovators Ltd
Priority to JP2000103974A priority Critical patent/JP3450264B2/ja
Publication of JP2001292143A publication Critical patent/JP2001292143A/ja
Application granted granted Critical
Publication of JP3450264B2 publication Critical patent/JP3450264B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)
  • Small-Scale Networks (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は障害検出システムに
関し、特に複数のサーバ、ワークステーション装置がネ
ットワークで接続されたシステムの監視装置の障害メッ
セージの検出システムとその出力を利用し障害発生装置
を推定するシステムに関する。
【0002】
【従来の技術】図11は、複数のサーバやワークステー
ションがネットワーク9で接続され、各ノード装置の運
転状況を監視する監視装置50を有するシステムの従来
例を示したものである。ノード#1装置60には、監視
プログラム(S)(Sはスレーブの略)62を常駐させ
ておき、運用AP(A)63、運用AP(B)64、オ
ペレーティングシステム61のカーネル612や周辺装
置制御部613から障害メッセージ(以下メッセージを
MSGと省略)を含む運転状況MSGを受信ないし収集
する。
【0003】この際、ノード#1装置60の下位に接続
された複数の周辺装置66、・・、69からのMSGは
周辺装置制御部613を通じて通知される。監視プログ
ラム(S)62は、これらのMSGを通信制御部61
1、ネットワーク9、通信制御部522を通じて監視プ
ログラム(M)(Mはマスタの略)51に通知する。
【0004】監視プログラム(M)51は受信したMS
Gを到着順に表示制御部521を介しディスプレイ10
に表示し、監視装置の利用者(管理者)90に通知す
る。この際、MSGに発信元のノード番号を付与して通
知するが、MSGの緊急度や、種別(障害通知/警告/
通常の処理状況)を明確に区別して通知はしない。
【0005】これは、監視装置も含め各ノードの装置
が、オペレーテイングシステムあるいはメーカ、機種が
多様であり、MSGの内容上の形式が統一されてないの
で、監視プログラム(S)62や監視プログラム(M)
51がMSGの緊急度や、種別を認識出来ないからであ
る。
【0006】従って、利用者90は、障害MSGが極め
て希に画面表示ないし通知されても、見落とすこともあ
る。又、システムのプログラムや、ハードウェア及びそ
れらが通知する広範囲のMSGの意味をよく理解し、訓
練されてない限り的確に障害の内容を把握出来ない。即
ち、システムが障害MSGを出力後の、障害が起きてい
る旨の把握、障害発生装置の把握は利用者90の判断に
よる。
【0007】
【発明が解決しようとする課題】従って、この従来技術
には、次の様な問題点があった。第1の問題点は、障害
が迅速に検出出来ないことである。その理由は、障害情
報と障害以外の情報が区別なく通知され、そのままで
は、通知された情報が障害情報かを利用者が判断する必
要があり、そのため、障害を検出する迄に時間が掛かる
為である。
【0008】第2の問題点は、障害が発生した場合、ノ
ード障害か周辺装置障害かが分からないことである。そ
の理由は、発生した情報を、全てノードで発生した情報
としていた為である。
【0009】第3の問題点は、装置間の通信障害が発生
した場合、障害を検出したノード(装置)は分かるが、
発生装置を特定するのに時間がかかり、対応処置が遅れ
ることである。
【0010】これらの問題の解決手段として、上記を鑑
みMSG内容の統一が考えられるがこの様なMSGを通
信上のプロトコルだけでなく内容も含めて、グローバル
な標準で統一するのは、機能や設計上の制約となり旨く
ない。
【0011】
【課題を解決するための手段】本発明の第1の障害検出
システムは、複数のサーバ装置やワークステーション装
置がネットワークで接続されたシステムに於いて、ネッ
トワークのノードである前記接続された装置より、障害
メッセージを含む運転状況メッセージを受け利用者に通
知する監視手段を備え、ネットワークノード装置は、配
下に周辺装置を接続し、周辺装置の障害メッセージも含
めて前記監視手段に通知し、前記監視手段は通知される
可能性のある障害メッセージについてその特徴が予め登
録されたパターンファイルとしてノード障害用パターン
ファイルと、周辺装置障害用パターンファイルとを
し、前記運転状況メッセージを受けると、そのメッセー
ジを前記周辺装置障害用パターンファイル及びノード障
害用パターンファイルの個々のパターンと比較し、その
メッセージが周辺装置障害メッセージ、ノード障害メッ
セージ、それら以外のメッセージの何れであるか判定
し、これら種別を明確に区別して利用者に通知すると共
に、前記周辺装置障害用パターンファイルは個々のパタ
ーン毎に、対応する周辺装置障害メッセージがメッセー
ジ中の何処に障害状態の周辺装置を特定する情報を含む
かを示す位置情報を付随し、前記監視手段が、受信メッ
セージを周辺装置障害メッセージと判定した場合、判定
に用いたパターンに付随する前記位置情報に従い周辺装
置特定情報を取出し、特定した周辺装置の障害である旨
を追記し利用者に通知することを特徴とする。
【0012】
【0013】
【0014】本発明の第の障害検出システムは、前記
の障害検出システムにおいて、前記パターンファイ
ルは、個々のパターンを、パターン対応の障害メッセー
ジの先頭文字をキーとしてブロック化した形で登録して
おき、前記監視手段が、受信メッセージをその先頭文字
に従って、前記パターンファイルの対応ブロックと比較
し、障害メッセージか否かを判定することを特徴とす
る。
【0015】
【0016】
【0017】
【0018】
【0019】
【発明の実施の形態】次に、本発明の第1実施形態につ
いて図面を参照し説明する。図1は、複数のサーバやワ
ークステーションがネットワーク9で接続され、各ノー
ド装置の運転状況を監視する監視装置1を有するシステ
ムの例を示したものである。監視装置1には本発明の障
害検出システムが搭載されている。ネットワーク9のノ
ード#1、#2、・・#Nには、監視装置1、通信サー
バ2、サーバ3、サーバ4、ワークステーション5、・
・ワークステーション8が接続され、例えばオンライン
の業務システムを構成している。
【0020】通信サーバ2は外部回線にも接続され、外
部回線とシステムの各装置との通信を仲介する。サーバ
3は、顧客からの商品購入オーダをオンラインで受付け
キューイングすると共に、配下に周辺装置31(ハード
ディスク)や、周辺装置34(磁気テープ装置)を接続
しオーダ受付処理や、販売商品の代金入金処理のデータ
ベースを更新管理している。サーバ4は商品の生産管理
処理や、部材発注処理を行い、配下に周辺装置41(ハ
ードディスク)や、周辺装置44(プリンタ装置)を接
続し、関連ファイルを更新管理し、発注伝票等の印刷を
行っている。
【0021】ワークステーション5、・・8は業務処理
を遂行するための端末で、それぞれ利用者が分担して操
作している。例えば、ワークステーション5は顧客から
の購入オーダの受付け処理をし、ワークステーション6
は販売品の決済処理をし、ワークステーション7は商品
の生産指示をオンラインで行い、ワークステーション8
は商品生産用の部材手配をオンラインで処理している。
【0022】従って、ワークステーション5のオーダレ
セプションAPからは、サーバ3の対応APや、データ
ベースにはアクセス出来、サーバ4の生産計画ファイル
には参照のみ可能である。同様にワークステーション6
の決済APからは、サーバ3の対応APや、データベー
スにはアクセス出来、オーダレセプションの一部のファ
イルは参照のみ出来る。ワークステーション7の生産管
理APからは、サーバ4の対応APや、関連ファイルに
はアクセス出来、オーダレセプションの一部のファイル
は参照のみ出来る。即ち、ワークステーション5〜8は
それぞれ搭載APが異なっており、通信出来るサーバも
制限されておりフリーではない。このことは、装置間の
通信障害検出時、相手側に起因して障害検出したことが
分かれば、相手装置の識別情報そのものが障害MSGで
通知されなくとも、AP名を手がかりとし相手を特定す
るのに役立つ。
【0023】尚、ノード#2〜#Nの各装置の構成は、
図11のノード#1装置の構成と同様である。ここで好
適には監視プログラム(S)62が各装置に搭載されて
いるが、必須ではない。即ち、業務APやオペレーティ
ングシステム(OS)のカーネル、周辺制御部613、
通信制御部611がそれぞれ監視装置1に直接MSGを
送る場合には不要である。
【0024】又、ノード#2〜#Nの各装置のOS、機
種、等は統一されている必要はなく、最低限ネットワー
ク通信上の互換が有ればよい。
【0025】次に図2を参照し、監視装置1の構成を説
明する。OS12は通信制御部122、表示制御部12
1を含む。通信制御部122はノード#2〜#Nの各装
置の通信制御部と通信をするトランスポート層迄の通信
手段である。
【0026】MSG取得部13は、ノード#2〜#Nの
各装置ノードで発生した障害MSGを含む運転状況MS
Gを取得する。好適には監視プログラム(S)62が収
集あるいは受信したMSGを受け取る。
【0027】パターン作成部17は、障害MSGを識別
するためのパターンを事前に作成する。パターンは障害
を表す単語の組合せである。パターンファイル15、1
6には、パターン作成部17で作成した周辺装置障害
用、ノード装置障害用パターンを登録しておく。
【0028】MSG解析通知部14は、取得したMSG
とパターンファイル15、16のマッチングを行い、ノ
ード装置障害MSG、周辺装置障害MSG、その他のM
SG(通常の運転状況MSG)の識別をし、障害MSG
に明確な区分情報を付加しMSGを表示制御部121に
渡す。
【0029】10は運転状況MSGを表示したり、パタ
ーン作成の為に事前収集したMSGや、作成パターンを
表示するためのディスプレイである。11はこれらの指
示、操作を行う為のキーボードである。
【0030】次に図3を参照し、MSG解析通知部14
の詳細構成を説明する。周辺装置障害マッチング部14
ー1は、MSG取得部13で取得したMSGが周辺装置
障害MSGかを周辺装置用のパターンファイル15をも
とに判断する。
【0031】周辺装置特定部14−2は、周辺装置障害
用のパターンファイル15にある周辺装置名位置情報を
用いてMSGから周辺装置名を取り出す。周辺装置障害
通知部14−3は、周辺装置の障害を通知する。
【0032】ノード障害振り分け部14−4は、ノード
障害用の全てのパターンとマッチングを行わず、MSG
の先頭の文字によるマッチング対象の振り分けを行う。
【0033】ノード障害マッチング部14−5は、MS
Gがノード障害MSGかの判断をパターンファイル16
の上記先頭文字対応のブロックのパターン情報をもとに
行う。ノード置障害通知部14−6は、ノード装置障害
を通知する。
【0034】次に、本発明の実施の形態の動作について
図面を参照して説明する。図4は、図2のパターン作成
部17に対応したパターン作成処理例を示すものであ
る。
【0035】先ず、ノードが出力する障害MSGを、障
害発生前に情報収集する。同時に、ノードが出力する障
害MSG以外のMSGも収集しておく(ステップA
1)。具体的には、CD−ROM化されたMSG集より
障害MSG、それ以外のMSGに区分して入力する。C
D−ROM化されていない場合には各装置のメーカより
該当のテキスト情報をオンライン転送乃至フロッピー
(登録商標)ディスクや光磁気ディスク媒体で入手す
る。乃至はマニュアルのMSG集より収集しテキスト情
報化する。
【0036】収集した障害MSGをノード用、周辺装置
用に分ける(ステップA2)。次にステップA2で分け
られたノード用の障害MSG一つ一つから障害を表しそ
うな文字列を三つ取り出して一つのパターン(組合せ)
とする。その際、MSGの先頭の文字によりa(又は
A)〜z(又はZ)及びその他の27種類のパターン群
に振り分ける(ステップA3)。
【0037】ステップA2で分けられた周辺装置用の障
害MSG一つ一つから周辺装置の障害を表しそうな文字
列を三つ取り出して一つのパターンとする。その障害M
SGには周辺装置名が表示される位置が決まっているた
め、その周辺装置名の位置情報も取り出し、パターンの
付随情報として追加する(ステップA4)。
【0038】ここで、ノード障害MSG用パターンは、
周辺装置障害MSGや障害以外のMSGにマッチしない
ことを確認しておく(ステップA5)。マッチするMS
Gが存在する場合は、そのノード障害MSG用パターン
を手直しマッチしない様にする(ステップA6)。
【0039】同様に、周辺装置障害MSG用パターン
は、ノード障害MSGや障害以外のMSGにマッチしな
いことを確認しておく(ステップA7)。マッチするM
SGが存在する場合は、その周辺装置障害MSG用パタ
ーンを手直しマッチしない様にする(ステップA8)。
【0040】ステップA5で確認されたパターンからノ
ード障害用の編集可能なパターンファイル16を、ステ
ップA7で確認されたパターンと位置情報からは周辺装
置障害用の編集可能なパターンファイル15を作成す
る。例えば一つのパターン、或いは一つのパターンと位
置情報を1レコードとしてレコードを集積しファイルを
構成すればよい。
【0041】又、新機種装置の増設や、置換等で障害情
報の増(減)が生じた場合には、ノード障害用パターン
ファイル16、周辺装置用パターンファイル15にパタ
ーンデータ、位置情報をレコード単位で追加(削除)す
る(ステップA10)。
【0042】図5に、図11に示すMSG発生元、図3
のMSG取得部13〜ノード障害通知部14−6が行う
障害検出処理フローを示す。以下、本フロチャートに従
って説明する。
【0043】ノードでノード障害MSG、周辺装置障害
MSG、又はその他(通常の運転状況)MSGが発生す
る(ステップB1)。MSG取得部13は発生したMS
Gを取得する(ステップB2)。
【0044】周辺装置障害マッチング部14−1で取得
MSGに対し、先ず周辺装置用の障害パターンとマッチ
ングを行う(ステップB3)。マッチングが成功した場
合、周辺装置特定部14−2は、一致したパターンと共
に保持している単語位置情報を元にMSGから周辺装置
名を取得する(ステップB4)。
【0045】周辺装置障害通知部14−3は、取得した
周辺装置名と共に、周辺装置障害である旨を追記しこの
MSGを通知する(ステップB5)。
【0046】ステップB3でマッチングしなかった場
合、ノード障害振り分け部14−4が呼び出されMSG
の先頭の文字を基にマッチング対象を27種類のノード
障害用のパターン群に振り分ける(ステップB6)。振
り分けられたマッチング対象とMSGとのマッチング
を、ノード障害マッチング部14ー5で行う(ステップ
B7)。
【0047】マッチングが成功した場合、ノード障害通
知部14−6がノード障害である旨を追記しこのMSG
を通知する(ステップB8)。ステップB7でマッチン
グが成功しなかった場合、障害MSGである旨の追記は
行わず、MSGをそのまま通知する(ステップB9)。
【0048】尚、上記例では周辺装置障害用パターンと
のマッチングでは、MSGの先頭文字等による振り分け
は行ってないが、MSG数が多い場合にはノード障害用
パターンのマッチングと同様に行えば、高速される。
【0049】次に、MSGの具体例を用い説明する。図
6の(A)は障害MSG例を示し、(B)はそれらMS
Gに対し予め用意されたパターンデータと付随情報を示
す。
【0050】MSGの(1)は周辺装置31が出力する
ディスク障害MSGの一例であり、パターンデータとし
ては(B)の上段に示す様に、DISC、error、
frequentの3語とする。
【0051】又、MSGの5番目のワードがHDU31
と言う周辺装置名を含むので周辺装置名位置情報はW5
と登録する。
【0052】MSGの(3)は通信サーバ2が出力する
受信データのエラーが規定回数超えて発生した旨のMS
Gである。パターンデータとしては(B)の下段に示す
様に、over、limit、errorの3語とす
る。そしてこのMSGの先頭文字は「O」で有るため、
パターンファイル16の「O」のブロックに登録する。
【0053】これらの障害MSGがそれぞれ周辺装置障
害MSG、ノード障害MSGと識別された際のディスプ
レイ10での表示例を図7に示す。(1)のMSGであ
れば「*周辺装置障害MSG(HDU31)*」の追記
をし表示する。この追記部分乃至MSG全体の文字色を
他と区別し、利用者の注意を喚起するために例えば赤色
とする。或いは「*」をブリンキング表示する。
【0054】又、図示してないが、上記追記された障害
MSGを通常の運転状況MSGとは別のウインドウに表
示するようにしてもよい。
【0055】又、周辺装置名位置情報はMSGの先頭か
らの文字位置で保持するようにしても良い。例えば、
(1)のMSGではCH32〜CH35とする。
【0056】又、周辺装置障害時の障害状態周辺装置の
識別情報としては、周辺装置名の代わりにノード番号
と、ノード装置上の接続ポート番号としてもよい。
【0057】次に、本発明の第2実施形態について図面
を参照し説明する。図8は本実施形態の監視装置1Aの
構成を示したブロック図である。図2の監視装置1と異
なる点は、障害装置推定部18を有し、ノード障害用パ
ターンファイル26はパターンデータの他に付随情報を
持つ点である。
【0058】付随情報としては、対応するMSGが装置
の内部動作により検出された自装置障害MSGである
か、他装置と通信中に検出され他装置に起因し検出され
た障害MSGであるかを示す自他区分情報と、他区分の
場合の相手特定情報の属性、MSG内の位置が登録され
ている。
【0059】属性としては、通信上の相手のIP(イン
ターネットプロトコル)アドレス、MAC(メディアア
クセスコントロール)アドレス、相手プログラム名、自
プログラム名に対応して、「1」、「2」、「4」、
「8」のコードがアサインされている。又相手特定情報
を含まない場合は「0」とする。
【0060】又、障害装置推定部18は、各装置の通信
部が有している通信上のアドレスと装置のノード番号の
対応を保持するアドレス表181と、プログラム名と、
それが搭載されている装置のノード番号の対応情報を保
持するプログラム表182と、各プログラムの通信相手
プログラムを示したプログラム間通信表183を有して
いる。
【0061】次に、本実施形態の動作について図面を参
照し説明する。図9に、前記図6のノード障害MSG例
(3)〜(5)に対する、パターンデータと付随情報を
示す。(3)のMSGに対しては、他装置からの受信デ
ータのエラーにつき自他区分を他を示す「2」とし、又
MSG中に相手IPアドレス(133.121.1.
1)を含むので、属性を「1」とし相手特定情報位置を
W10とする。
【0062】同様に、(5)のMSGに対しては、他装
置のプログラムと接続出来ないので自他区分を「2」と
し、又MSG中に相手プログラム(Partssyst
em)を含むので、属性を「4」とし相手特定情報位置
をW6とする。
【0063】(4)のMSGに対しては、自装置の内部
動作で検出したエラーにつき自他区分を自を示す「1」
とする。
【0064】MSG(3)が、MSG解析通知部24に
入力されノード障害MSGと識別されると、その旨の付
加情報が追記され表示制御部121に渡され、表示され
る。同時にMSG(3)と、上記付随情報が障害装置推
定部18に渡される。障害装置推定部18は、相手特定
情報位置によりMSG(3)より相手特定情報を取り出
し、属性コードよりこれをIPアドレスと見なし、アド
レス表181を索引し相手ノード番号を得る。
【0065】MSG(5)が入力された場合も同様に動
作するが、障害装置推定部18は、相手特定情報位置に
よりMSGより相手特定情報を取り出し、属性コードよ
りこれを相手のプログラム名と見なし、プログラム表1
82を索引し相手ノード番号を得る。尚、属性コードが
「8」であれば、MSGより自プログラム名を取りだ
し、プログラム通信表183を索引し、相手プログラム
名を得て、プログラム表182を索引し相手ノード番号
を得る。
【0066】障害装置推定部18は、最初の障害MSG
を受けると所定時間(数秒から数十秒)内に受けた後続
の障害MSGも含めて、それぞれの障害MSGに対し上
記前処理を行い、その結果を総合判定し障害発生装置を
特定ないし推定し利用者に通知する。
【0067】総合判定の例を図10に示す。項1はノー
ド#Iより周辺装置障害MSGのみ受けた場合で、これ
はそのままノード#I配下の周辺装置を障害発生装置と
特定し通知する。項2の周辺装置障害MSGにそのノー
ドの自装置障害MSGが伴う場合も同様にその周辺装置
を障害発生装置と通知する。
【0068】項3の自装置障害MSGのみの場合や、項
4のノード#Iの自装置障害MSGとノード#Jのノー
ド#I装置を指摘した他装置障害MSGでは、ノード#
I装置を障害発生装置と特定し通知する。
【0069】項5の、ノード#I、#Jの装置が共にノ
ード#Kを指摘した他装置障害MSGを受けると、障害
発生装置の第1候補はノード#K装置で、第2候補はノ
ード#I、#J、#Kに係わるネットワーク(ケーブ
ル、リピータ等)と推定される旨利用者に通知する。
【0070】項6の、ノード#I、#Jの装置がそれぞ
れノード#K、ノード#Lを指摘した他装置障害MSG
の組み合わせでは、障害発生装置としてはノード#I、
#J、#K、#Lに係わるネットワークと推定される旨
を利用者に通知する。
【0071】項7の、ノード#Iの装置によるノード#
J指摘の他装置障害MSGのみの場合は、障害発生装置
の第1候補はノード#J装置で、第2候補はノード#
I、#Jに係わるネットワークと推定される旨を利用者
に通知する。
【0072】項8の、ノード#Iの装置による相手装置
不明の他装置障害MSGのみの場合は、「ノード#Iの
装置が他装置との通信による障害を検出しましたが相手
装置は推定出来ません。障害MSGの前後のMSG、シ
ステム及び各装置の通信ログ等により推定して下さい」
と通知する。
【0073】以上の説明では、監視手段を監視装置1或
いは1Aに搭載された例で説明したが、図1の通信サー
バ2、サーバ3、サーバ4、ワークステーション5から
8のいずれかの装置に、その装置の本来のプログラムと
ともに監視手段が併せて搭載されている場合でも本発明
の障害検出システムは構成出来る。
【0074】
【発明の効果】本発明の第1実施形態によれば、利用者
に通知されるMSGを、事前作成された周辺装置障害M
SG用パターン、ノード障害MSG用パターンによりM
SGの種類を識別し、障害MSGの場合その識別結果を
追記し明確に利用者に通知するので、障害が発生した場
合、迅速に障害の切り分けを行える効果がある。
【0075】又、周辺装置障害用パターンに付随し周辺
装置を特定するための単語位置情報を備えているので、
周辺装置に障害が発生した場合、障害が発生した周辺装
置を特定できる効果を有す。
【0076】又、障害MSGを識別する為のパターン群
をa(又はA)〜z(又はZ)及びその他の27種類に
ブロック分けしておき、MSGの先頭文字に対応するブ
ロックのパターンとのみ比較解析するので、より高速に
上記識別通知を行ない利用者に通知出来る。
【0077】更に、パターンファイルは個々の障害MS
Gに対応したパターン及び付随情報を一つの構成単位
(レコード)としているので、障害MSGの増減に応
じ、パターンファイルを容易に再編集出来る効果も有
す。
【0078】本発明の第2実施形態によれば、前記ノー
ド障害MSG用パターンに付随し、自他区分、相手特定
情報位置、属性を備え、装置間の通信障害等のMSGよ
り相手特定情報を抽出し、これをアドレス表、プログラ
ム表及びプログラム通信表により相手装置のノード番号
に変換するので、障害発生装置を特定乃至推定し、利用
者に通知するので、障害対応処置をより迅速に行える効
果を有す。
【図面の簡単な説明】
【図1】本発明の障害検出システムを含む情報処理シス
テム全体の構成図。
【図2】図1の監視装置1の構成を示すブロック図。
【図3】図2のMSG解析通知部14の詳細構成とその
周辺を示すブロック図。
【図4】図3のパターン作成部17の処理を示すフロー
チャート。
【図5】本発明の第1実施形態の、障害検出処理を示す
フロチャート。
【図6】障害MSGの具体例と、対応するパターンデー
タと付随情報を示す図。
【図7】周辺装置障害MSG、ノード障害MSGの画面
表示例を示す図。
【図8】本発明の第2実施形態における、監視装置1A
の構成を示すブロック図。
【図9】本発明の第2実施形態における、ノード障害用
パターンデータと付随情報を示す図。
【図10】本発明の第2実施形態における、障害装置推
定部18の障害発生装置判定条件及び結果を示す図。
【図11】従来の監視装置を含む情報処理システム全体
の構成図。
【符号の説明】
1、1A 監視装置 2 通信サーバ 3、4 サーバ 5、8 ワークステーション 9 ネットワーク 10 ディスプレイ 11 キーボード 12 オペレーティングシステム(OS) 13 MSG取得部 14、24 MSG解析通知部 15 パターンファイル(周辺装置障害用) 16、26 パターンファイル(ノード障害用) 17、27 パターン作成部 18 障害装置推定部 121 表示制御部 122 通信制御部 181 アドレス表 182 プログラム表 183 プログラム間通信表
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平10−49219(JP,A) 特開 平8−25766(JP,A) 特開 平6−309194(JP,A) 特開 平5−199232(JP,A) 特開 平9−130414(JP,A) 特開 平11−212826(JP,A) 特開 平9−305880(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04L 12/28

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 複数のサーバ装置やワークステーション
    装置がネットワークで接続されたシステムに於いて、ネ
    ットワークのノードである前記接続された装置より、障
    害メッセージを含む運転状況メッセージを受け利用者に
    通知する監視手段を備え、ネットワークノード装置は、
    配下に周辺装置を接続し、周辺装置の障害メッセージも
    含めて前記監視手段に通知し、前記監視手段は通知され
    る可能性のある障害メッセージについてその特徴が予め
    登録されたパターンファイルとしてノード障害用パター
    ンファイルと、周辺装置障害用パターンファイルとを
    し、前記運転状況メッセージを受けると、そのメッセー
    ジを前記周辺装置障害用パターンファイル及びノード障
    害用パターンファイルの個々のパターンと比較し、その
    メッセージが周辺装置障害メッセージ、ノード障害メッ
    セージ、それら以外のメッセージの何れであるか判定
    し、これら種別を明確に区別して利用者に通知すると共
    に、前記周辺装置障害用パターンファイルは個々のパタ
    ーン毎に、対応する周辺装置障害メッセージがメッセー
    ジ中の何処に障害状態の周辺装置を特定する情報を含む
    かを示す位置情報を付随し、前記監視手段が、受信メッ
    セージを周辺装置障害メッセージと判定した場合、判定
    に用いたパターンに付随する前記位置情報に従い周辺装
    置特定情報を取出し、特定した周辺装置の障害である旨
    を追記し利用者に通知することを特徴とする障害検出シ
    ステム。
  2. 【請求項2】 前記パターンファイルは、個々のパター
    ンを、パターン対応の障害メッセージの先頭文字をキー
    としてブロック化した形で登録しておき、前記監視手段
    が、受信メッセージをその先頭文字に従って、前記パタ
    ーンファイルの対応ブロックと比較し、障害メッセージ
    か否かを判定することを特徴とする請求項記載の障害
    検出システム。
JP2000103974A 2000-04-05 2000-04-05 障害検出システム Expired - Fee Related JP3450264B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000103974A JP3450264B2 (ja) 2000-04-05 2000-04-05 障害検出システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000103974A JP3450264B2 (ja) 2000-04-05 2000-04-05 障害検出システム

Publications (2)

Publication Number Publication Date
JP2001292143A JP2001292143A (ja) 2001-10-19
JP3450264B2 true JP3450264B2 (ja) 2003-09-22

Family

ID=18617597

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000103974A Expired - Fee Related JP3450264B2 (ja) 2000-04-05 2000-04-05 障害検出システム

Country Status (1)

Country Link
JP (1) JP3450264B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4944391B2 (ja) * 2005-05-11 2012-05-30 富士通株式会社 メッセージ異常自動判別装置、方法、及びプログラム
JP5423904B2 (ja) * 2010-11-17 2014-02-19 富士通株式会社 情報処理装置、メッセージ抽出方法およびメッセージ抽出プログラム
JP5541130B2 (ja) 2010-12-10 2014-07-09 富士通株式会社 管理装置、管理方法および管理用プログラム
JP6201670B2 (ja) 2013-11-15 2017-09-27 富士通株式会社 判定装置、判定プログラム、及び判定方法

Also Published As

Publication number Publication date
JP2001292143A (ja) 2001-10-19

Similar Documents

Publication Publication Date Title
US11297087B2 (en) Validation of systems data
US6253204B1 (en) Restoring broken links utilizing a spider process
US7685280B2 (en) Populating requests to multiple destinations using a mass request
US20150206111A1 (en) Information processing apparatus for electronic receipt data
US9646289B2 (en) Powertag: manufacturing and support system method and apparatus for multi-computer solutions
US10116509B2 (en) System and method for monitoring and managing objects across data centers
US8983862B2 (en) Initiating a service call for a hardware malfunction in a point of sale system
JPWO2006117833A1 (ja) 監視シミュレーション装置,方法およびそのプログラム
JP2002215477A (ja) デバイス状態監視システム、デバイス状態監視処理方法及び情報記録媒体
US20170300401A1 (en) Methods and systems that identify problems in applications
CN110244994A (zh) 用于数据处理系统的数据模块管理
US20070169085A1 (en) Stack-based problem identification for a software component
US8031858B2 (en) Call flow framework for consistent troubleshooting across multiple vendors and locations
US20220382579A1 (en) Systems and Methods for Transaction Tracing Within an IT Environment
JP3450264B2 (ja) 障害検出システム
JP2010009411A (ja) 仮想化環境運用支援システム及び仮想環境運用支援プログラム
JP2005242988A (ja) ログ情報管理システム、サービス提供システム、ログ情報管理プログラムおよびサービス提供プログラム、並びにログ情報管理方法およびサービス提供方法
US10078829B2 (en) Information processing device, transaction processing system, and recording device
JPH10154177A (ja) 協調作業支援システム
JP2022178869A (ja) 運用支援プログラム、情報処理装置および運用支援方法
CN112416713A (zh) 操作审计系统及方法、计算机可读存储介质、电子设备
JP2002351702A (ja) オンライン利用の端末稼働統計データ作成方法及び装置
JPH0541706A (ja) ネツトワーク自動監視・制御システム
US20210383311A1 (en) Methods and apparatus for marketplace item updates
KR102597616B1 (ko) 전자 상거래에서의 이상 거래 탐지를 위한 클러스터링 방법 및 시스템

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030624

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees