JPH08328979A

JPH08328979A - 障害管理方法

Info

Publication number: JPH08328979A
Application number: JP7130625A
Authority: JP
Inventors: Hisashi Oono; 久支大野
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1995-05-29
Filing date: 1995-05-29
Publication date: 1996-12-13

Abstract

(57)【要約】【目的】複数のネットワークにまたがって構成された
複雑なシステムにおいても、人的作業を必要とせずに障
害の集中管理および遠隔での管理が可能な障害管理方法
を得る。【構成】障害を通知する障害情報を転送するための障
害情報通知先を、各装置２１〜２６毎にあらかじめ定め
ておき、ある１つの装置２５上で障害が発生した場合
に、当該装置はその障害情報通知先に基づいて当該障害
情報を、いくつかのネットワークにまたがって接続され
ている装置２２（２１）に対して送信し、それを受信し
た装置はその障害情報通知先に基づいて当該障害情報を
他のネットワークにつながる特定装置２３に対して送信
するようにしたもの。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、ローカル・エリア・
ネットワーク（以下、ＬＡＮという）等のネットワーク
を利用したシステム上での、障害の集中管理および遠隔
での管理を行う障害管理方法に関するもので、特にその
汎用性の向上に関するものである。

【０００２】

【従来の技術】図１４は例えば、特公平５−７２１４０
号公報に示された従来の障害管理方法が適用されるシス
テムの装置構成および情報の流れを示す構成図である。
図において、１はネットワークの一例としてのＬＡＮで
あり、２，３はこのＬＡＮ１に接続されている端末装置
である。４はＬＡＮ１に接続されてＬＡＮ１内の障害を
管理する障害管理装置であり、５はこの障害管理装置４
に装備されている障害情報蓄積装置である。６は当該シ
ステムを管理するホスト計算機であり、７はホスト計算
機６に装備されている障害情報蓄積装置、８は同じく表
示装置である。９はＬＡＮ１を介して端末装置２，３と
このホスト計算機６とを結ぶコミニケーションサーバで
ある。１０は端末装置２の障害検出・転送装置、１１は
端末装置３の障害検出・転送装置であり、１２はコミニ
ケーションサーバ９の障害検出・転送装置である。１３
は障害管理装置４の障害検出・転送装置であり、１４は
障害管理装置４内のネットワーク管理プログラムであ
る。１５はホスト計算機６内にある通信機能であり、１
６はホスト計算機６内のネットワーク管理プログラムで
ある。

【０００３】次に動作について説明する。まず、障害の
発生が端末装置２の障害検出・転出装置１０により検出
される（図１４のａ）。検出された障害に関する障害情
報はＬＡＮ１を介して障害管理装置４に送信され、それ
を受信した障害管理装置４の障害検出・転出装置１３
は、障害管理装置４に接続されている障害情報蓄積装置
５にその障害情報を蓄積する（図１４のｂ）。システム
を管理するオペレータはホスト計算機６に接続される表
示装置８にて障害管理装置４内の障害情報蓄積装置５内
に蓄積されている障害情報を検索および抽出をして、ホ
スト計算機６に情報収集の指示を出し、ホスト計算機６
はコミニケーションサーバ９を経由して障害管理装置４
内のネットワーク管理プログラム１４に障害情報の送信
を要求する（図１４のｃ）。障害管理装置４のネットワ
ーク管理プログラム１４はその要求に従って障害情報蓄
積装置５から該当するデータを取り出し、ホスト計算機
６に対してそのデータを送信し、当該データを受けたホ
スト計算機６はそれに基づく障害情報を表示装置８に表
示するとともに、その障害情報を障害情報蓄積装置７に
蓄積する（図１４のｄ）。

【０００４】

【発明が解決しようとする課題】従来の障害管理方法は
以上のように構成されているので、その機能は障害情報
の蓄積程度にとどまり、また発生した障害の対処に対し
ても人的作業が伴うため、早急に対処しなければならな
い障害に対しては遅れが生じてしまうなどの問題点があ
り、さらに、複数のＬＡＮ１にまたがって構成されてい
るような複雑なシステムにおいては障害の集中的な管理
が面倒になるなどの問題点もあった。

【０００５】この発明は上記のような問題点を解消する
ためになされたもので、人的作業を必要とせずに障害に
対する対処を行うことが可能であり、複数のＬＡＮにま
たがって構成された複雑なシステムにおいても障害の集
中管理および遠隔での管理が可能となる障害管理方法を
得ることを目的とする。

【０００６】

【課題を解決するための手段】請求項１の発明に係る障
害管理方法は、装置の１つに障害が発生した場合、各装
置毎にあらかじめ定められている障害情報通知先に基づ
いて、その障害を通知する障害情報を、いくつかのネッ
トワークにまたがって接続されている装置を経由して、
他のネットワークにつながっている特定の装置に対して
送信することを可能としたものである。

【０００７】請求項２の発明に係る障害管理方法は、装
置の１つに障害が発生した場合、その障害の内容があら
かじめ分類、定義されている障害レベルのどれに該当す
るかを識別し、その障害レベルに沿った処理を行うこと
を可能としたものである。

【０００８】請求項３の発明に係る障害管理方法は、装
置の１つに障害が発生した場合、あらかじめ障害の内容
毎に定義されている障害発生後の処理項目を示す処理ビ
ットパターンに従って、その障害内容に対して必要な処
理項目のみを実行することを可能としたものである。

【０００９】請求項４の発明に係る障害管理方法は、装
置の１つに障害が発生した場合、あらかじめ定められた
ウェイト時間に従って、障害情報を一定の時差を設けて
送信することを可能としたものである。

【００１０】請求項５の発明に係る障害管理方法は、短
時間に複数の装置で障害が発生した場合、それらの装置
間であらかじめ定められたウェイト時間に従って時差を
設けて障害情報の送信を行うことを可能としたものであ
る。

【００１１】

【作用】請求項１の発明における障害管理方法は、各装
置毎に障害情報通知先をあらかじめ定めておき、障害が
発生した場合には、障害情報通知先に従っていくつかの
ネットワークにまたがって接続されている装置に障害情
報を送信し、それを受けた装置は、障害情報通知先に従
って当該障害情報を他のネットワークにつながっている
装置に送信することにより、障害情報をいくつかのネッ
トワークにまたがって接続されている装置経由で、他の
ネットワークに接続された特定の装置に送信することが
可能となり、複数のネットワークにまたがる複雑なシス
テムにおいても、人的作業を必要とすることなく、障害
の集中管理および遠隔での管理が行える障害管理方法を
実現する。

【００１２】請求項２の発明における障害管理方法は、
障害をあらかじめ複数の障害レベルに分類、定義してお
き、障害が発生した場合にはその障害内容からそれに該
当する障害レベルに沿った処理を行うことにより、発生
した障害の程度に応じた処理を自動的に行うことを可能
とする。

【００１３】請求項３の発明における障害管理方法は、
あらかじめ障害毎にその処理項目を処理ビットパターン
として定義しておき、障害が発生した場合にはその処理
ビットパターンに従って、発生した障害の内容に応じて
必要な処理項目のみを実行することにより、その障害要
因に適した処理項目を自動的に選択して実行することを
可能とする。

【００１４】請求項４の発明における障害管理方法は、
あらかじめ所定のウェイト時間を定めておき、１つの装
置上に複数の障害が発生した場合には、そのウェイト時
間に応じた時差で障害情報を順次送信することにより、
短時間の間に複数の障害が発生しても、ネットワークの
負荷を上昇させることなく障害管理を行うことを可能と
する。

【００１５】請求項５の発明における障害管理方法は、
あらかじめ各装置毎に異なったウェイト時間を定めてお
き、複数の装置で短時間の間に障害が発生した場合に、
それらの装置間でそのウェイト時間に応じた時間差で障
害情報の送信を行うことにより、複数の装置において短
時間の間に障害が発生しても、ネットワークの負荷を上
昇させることなく障害管理を行うことを可能とする。

【００１６】

【実施例】

実施例１．以下、この発明の一実施例を図について説明
する。図１はこの発明の実施例１による障害管理方法が
適用されるシステムの装置構成および情報の流れを示す
構成図である。図において、１ａ，１ｂ，１ｃはそれぞ
れ独立した複数のネットワークとしてのＬＡＮであり、
２１はそのＬＡＮ１ａとＬＡＮ１ｂとにまたがって接続
されている装置としての中央処理装置、２２はＬＡＮ１
ｂとＬＡＮ１ｃとにまたがって接続されている装置とし
ての中央処理装置である。２３はＬＡＮ１ａに接続され
ている装置としての端末装置、２４はＬＡＮ１ｂに接続
されている装置としての端末装置であり、２５，２６は
ＬＡＮ１ｃに接続されている装置としての端末装置であ
る。

【００１７】２７は中央処理装置２１に、２８は中央処
理装置２２にそれぞれ装備されている障害検出・管理タ
スクであり、２９は端末装置２３に、３０は端末装置２
４に、３１は端末装置２５に、３２は端末装置２６にそ
れぞれ装備されている障害検出・管理タスクである。３
３，３４は中央処理装置２１に、３５，３６は中央処理
装置２２にそれぞれ装備されているＬＡＮ通信制御タス
クであり、３７は端末装置２３に、３８は端末装置２４
に、３９は端末装置２５に、４０は端末装置２６にそれ
ぞれ装備されているＬＡＮ通信制御タスクである。４１
は中央処理装置２１に、４２は中央処理装置２２にそれ
ぞれ内蔵されて、各装置の障害情報等を集合的に蓄積す
る障害情報蓄積ファイルであり、４３は端末装置２３
に、４４は端末装置２４に、４５は端末装置２５に、４
６は端末装置２６にそれぞれ内蔵されて、自装置の障害
情報の蓄積を行う個別の障害情報蓄積ファイルである。

【００１８】次に動作について説明する。図１にはＬＡ
Ｎ１ｃに接続された端末装置２５で発生した障害が、別
系統のＬＡＮ１ａに接続された端末装置２３に通知され
る情報の流れが示されている。ここで、図２は中央処理
装置２２内に保持されている障害通知先格納テーブルを
示す説明図、図３は中央処理装置２１内に保持されてい
る障害通知先格納テーブルを示す説明図であり、図中、
５０，６０はその障害通知先格納テーブルそのものを示
し、５１，６１はこれら障害通知先格納テーブル５０，
６０上の障害情報通知先を示している。

【００１９】図１に示したＬＡＮ１ａ，ＬＡＮ１ｂ，Ｌ
ＡＮ１ｃによる３つの独立したＬＡＮで構成されてシス
テムにおいて、端末装置２５内で発生した障害がその障
害検出・管理タスク３１で検出されると（図１のｅ）、
障害検出・管理タスク３１は当該障害情報を自装置内の
障害情報蓄積ファイル４５に書き込む（図１のｆ）。そ
してその障害情報を、ＬＡＮ通信制御タスク３９よりＬ
ＡＮ１ｃを経由して中央処理装置２２に送る（図１の
ｇ）。中央処理装置２２の障害検出・処理タスク２８は
ＬＡＮ通信制御タスク３６を介して受け取ったその障害
情報を、自装置内の障害情報蓄積ファイル４２に書き込
む（図１のｈ）。その後、図２に示される障害通知先格
納テーブル５０を検索して、当該障害情報を転送する障
害情報通知先５１を抽出し、受け取った障害情報をその
障害情報通知先５１で指定される中央処理装置２１に、
ＬＡＮ通信制御タスク３５よりＬＡＮ１ｂを経由して送
信する（図１のｉ）。

【００２０】中央処理装置２１の障害検出・処理タスク
２７はＬＡＮ通信制御タスク３４を介してその障害情報
を受け取り、それを自装置内の障害情報蓄積ファイル４
１に書き込む（図１のｊ）。その後、図３に示される障
害通知先格納テーブル６０を検索して次の障害情報通知
先６１を抽出し、受け取った障害情報をその障害情報通
知先６１で指定される端末装置２３に、ＬＡＮ通信制御
タスク３３よりＬＡＮ１ａを経由して送信する（図１の
ｋ）。端末装置２３の障害検出・処理タスク２７はその
障害情報をＬＡＮ通信制御タスク３４を介して受け取
り、それを自装置内の障害情報蓄積ファイル４３に書き
込む（図１のｌ）。

【００２１】なお、この実施例１では障害情報を障害情
報蓄積ファイル４１〜４６に蓄積するとしているが、出
力先は外部の記憶媒体（例えば、フロッピィドライブ）
であってもよく、また、表示機能を備えているものにつ
いてはそれに表示することが可能であるし、プリンタ機
能を備えているものについてはそれより帳票出力するこ
とも可能である。

【００２２】障害情報の通知の流れは以上に説明したと
おりであるが、次に各装置の処理について、図４および
図５のフローチャートを用いて説明する。図４は端末装
置側の障害検出・管理タスク３１（２９，３０，３２）
の内部処理の流れを示すフローチャートである。端末装
置側の障害検出・管理タスク３１はステップＳＴ１で障
害の発生を検出し、ステップＳＴ２においてこのステッ
プＳＴ１での障害検出による障害通知の有無を判定して
おり、通常はこのステップＳＴ２において障害通知待ち
を行っている。ステップＳＴ２で障害検出の通知があっ
たと判定されると、ステップＳＴ３に移行して自装置内
の障害情報蓄積ファイル４５にその障害情報を書き込
む。次にステップＳＴ４に進み、ＬＡＮ通信制御タスク
３９よりその障害情報を親装置（ここでは中央処理装置
２２）へ転送し、ステップＳＴ２に戻る。

【００２３】また、図５は中央処理装置側の障害検出・
管理タスク２８（２７）の内部処理を示すフローチャー
トである。中央処理装置側の障害検出・管理タスク２８
もステップＳＴ１０で障害の発生を検出しており、ステ
ップＳＴ１１で子装置側からの障害報告を受信してい
る。ステップＳＴ１２ではこのステップＳＴ１０での障
害検出、あるいはステップＳＴ１１での障害報告の受信
による障害通知の有無を判定しており、通常はこのステ
ップＳＴ１２において障害通知待ちを行っている。ステ
ップＳＴ１２で障害検出の通知があったと判定される
と、ステップＳＴ１３に移行して自装置内の障害情報蓄
積ファイル４２にその障害情報を書き込む。次にステッ
プＳＴ１４に進み、当該障害情報の通知先を障害通知先
格納テーブル５０から検索し、ステップＳＴ１５にてそ
の障害情報を抽出された通知先（この場合には中央処理
装置２１）にＬＡＮ通信制御タスク３５を介して転送す
る。それを受けた中央処理装置２１でも同様にして、自
装置内の障害情報蓄積ファイル４１にその障害情報を書
き込み、それを障害通知格納テーブル６０の検索にて抽
出された通知先（この場合には端末装置２３）に通知す
る。

【００２４】以上のように処理することにより、複数の
ＬＡＮにまたがって構成された複雑なシステムにおいて
も、人的作業を伴うことなく自動的に障害情報を他のＬ
ＡＮ系統につながる端末装置に対して送信し、管理を行
うことが可能となる。

【００２５】実施例２．図６はこの発明の実施例２にお
ける障害管理方法にて参照される、障害情報を定義する
定義テーブルを示す説明図である。図において、７０は
その定義テーブルそのものであり、７１は定義テーブル
７０上の障害番号、７２は定義テーブル７０上の障害レ
ベル、７３は定義テーブル７０上の障害内容を示してい
る。また、７４は障害レベル３の場合の処理を説明する
ためのデータを表すレコードであり、７５は障害レベル
１の場合の処理を説明するためのデータを表すレコー
ド、７６は障害レベル２の場合の処理を説明するための
データを表すレコードである。

【００２６】次に動作について説明する。従来の障害管
理方法が適用されたシステムでは、障害が起こった場合
の処理はその障害を分析するためのログを残すことを目
的としており、障害に対して行う処理としてはその内容
を表示する程度のものであった。この実施例２では、発
生した障害に対して自動的に対処を行う手段について説
明する。障害には履歴さえ残せばよいような軽度のもの
から、装置自体を止めて修理を施さなければならないよ
うな重度のものまで様々なものがある。そのため、障害
を複数のレベルに分けてそれぞれのレベルに対応した処
理を施すことにより、その処理を実現している。この実
施例２では、障害を３つのレベルに分けた場合について
説明する。

【００２７】図７はこの実施例２による障害管理方法が
適用されたシステムの内部動作を示すフローチャートで
あり、図１に示されるシステムにおける各端末装置２３
〜２６内の障害検出・処理タスク２９〜３２の動作を示
している。端末装置２５内で障害が発生した場合、その
障害検出・処理タスク３１はステップＳＴ２０において
その障害を検出する。ステップＳＴ２１ではこのステッ
プＳＴ２０での障害検出による障害通知の有無を判定し
ており、通常はこのステップＳＴ２１において障害通知
待ちを行っている。ステップＳＴ２１で障害検出の通知
があったと判定されると、ステップＳＴ２２に移行して
自装置内の障害情報蓄積ファイル４５にその障害情報を
書き込む。その後ステップＳＴ２３において、障害番号
を検索キーにして定義テーブル７０の検索を行い、発生
した障害がどのレベルのものかを抽出する。

【００２８】ここで、定義テーブル７０は好ましくは、
システム上の各装置２１〜２６の全てにあらかじめ定義
されたものであり、存在する位置は、障害検出・処理タ
スク２７〜３２の中にあってもよいし、障害検出・処理
タスク２７〜３２外に設けたファイルのような形であっ
てもよい。定義テーブル７０は前述のように、１つのデ
ータが障害番号７１、障害レベル７２、および障害内容
７３（必須のものではない）の３つで構成されており、
障害番号７１をキーにして検索されるものである。例え
ば、発生した障害の障害番号が電源異常を示す「１００
２」であった場合には、定義テーブル７０の障害番号７
１の項目を検索し、該当するレコード７５より障害レベ
ル「１」を抽出する。

【００２９】そして、次のステップＳＴ２４に進んで障
害レベルの判定を行い、この場合には障害レベルが
「１」であるためステップＳＴ２６に分岐する。ステッ
プＳＴ２６ではその障害情報を親装置（この場合には中
央処理装置２２）に転送し、次にステップＳＴ２７にお
いて、障害が発生した端末装置２５が二重系であるかど
うかの判定を行う。その結果、二重系に構成されていれ
ばステップＳＴ２８にて系の切り替えを行ってからステ
ップＳＴ２９に進み、二重系に構成されていなければそ
のままステップＳＴ２９に進む。ステップＳＴ２９では
障害が発生した装置（この場合には端末装置２３）を停
止状態にする。

【００３０】同様にして、発生した障害の障害番号が通
信エラーを示す「１００３」であれば、ステップＳＴ２
３において該当するレコード７６により障害レベル
「２」が抽出される。従って、ステップＳＴ２４による
障害レベルの判定の結果、障害レベルが「２」であるた
めステップＳＴ２５に分岐する。ステップＳＴ２５では
その障害情報を親装置（中央処理装置２２）に通知した
後、ステップＳＴ２１に戻って障害通知待ちの状態とな
る。また、発生した障害の障害番号が不正入力有りを示
す「１００１」であった場合、該当するレコード７４に
より障害レベル「３」が抽出されるので、ステップＳＴ
２４における障害レベルの判定の結果、そのままステッ
プＳＴ２１に戻って障害通知待ちの状態となる。

【００３１】以上のように処理することにより、障害が
発生した場合に、その障害の程度に応じて自動的に対処
することが可能となり、人的作業を省き、大規模システ
ムにおいて処理を分散化させる１つの手段となる。

【００３２】実施例３．図８はこの発明の実施例３にお
ける障害管理方法にて参照される、障害情報を定義する
定義テーブルを示す説明図である。図において、８０は
その定義テーブルそのものであり、８１は定義テーブル
８０上の障害番号を示し、８２は定義テーブル８０上の
障害内容を示している。また、８３〜８８は定義テーブ
ル８０上の障害に対する処理ビットパターンの各ビット
を示しており、ビット８３はログ書き込みの要・不要
を、ビット８４は画面表示の有無を、ビット８５は警報
出力の有無を、ビット８６は上位親装置への通知の要・
不要を、ビット８７は系切替の要・不要を、ビット８８
は装置停止の要・不要をそれぞれ定義している。８９は
障害番号「１００１」の処理を説明するためのデータを
表すレコードである。

【００３３】次に動作について説明する。上記実施例２
では障害を複数のレベルに分けて障害に対する処理を決
定していたが、この実施例３では障害に対する処理をも
っと細分化し、それぞれの処理に対して実行の要否をビ
ットパターン化して定義しておくことにより、複雑な処
理パターンを実現している。ここで、図９はこの実施例
３による障害管理方法が適用されたシステムの内部動作
を示すフローチャートであり、図１に示したシステムに
おける各端末装置２３〜２６内の障害検出・処理タスク
２９〜３２の動作を示している。

【００３４】端末装置２５内で障害が発生した場合、そ
の障害検出・処理タスク３１はステップＳＴ３０におい
てその障害を検出する。ステップＳＴ３１ではこのステ
ップＳＴ３０での障害検出による障害通知の有無を判定
しており、通常はこのステップＳＴ３１において障害通
知待ちを行っている。ステップＳＴ３１で障害検出の通
知があったと判定されると、ステップＳＴ３２に移行し
てその障害の処理ビットパターン８３〜８８の抽出を行
う。例えば、障害番号「１００１」の障害が発生した場
合、定義テーブル８０を障害番号８１を検索キーとして
検索し、該当するレコード８９よりその処理ビットパタ
ーン８３〜８８を抽出する。

【００３５】次に、抽出した処理ビットパターン８３〜
８８の、ログ書き込みの要否を示す最初のビット８３を
ステップＳＴ３３で検定する。この場合、ビット８３は
「１」であるのでステップＳＴ３４に分岐し、自装置内
の障害情報蓄積ファイル４５にその障害情報の書き込み
を行ってステップＳＴ３５に進む。なお、このビット８
３が「０」であればそのままステップＳＴ３５に進む。
ステップＳＴ３５では次の画面表示の要否を示すビット
８４の検定を行い、このビット８４が「１」であるので
ステップＳＴ３６に分岐して、画面表示を行った後ステ
ップＳＴ３７に進む。なお、ビット８３が「０」であれ
ばそのままステップＳＴ３７に進む。ステップＳＴ３７
では警報出力の要否を示すビット８５の検定を行い、そ
れが「０」であるのでステップＳＴ３８による警報出力
は行わずにステップＳＴ３９に進む。なお、このビット
８５が「１」である場合にはステップＳＴ３９に分岐し
て、警報出力を行った後ステップＳＴ３９に進む。

【００３６】次に、ステップＳＴ３９では通知の要否を
示すビット８６の検定を行い、それが「０」であるので
ステップＳＴ４０による通知は行わずにステップＳＴ４
１に進む。なお、このビット８６が「１」であればステ
ップＳＴ３９に分岐して、上位の親装置への通知を行っ
た後ステップＳＴ４１に進む。ステップＳＴ４１では系
切替の要否を示すビット８７の検定を行い、それが
「０」であるのでステップＳＴ４２による通知は行わず
にステップＳＴ４３に進む。なお、このビット８７が
「１」であればステップＳＴ４２に分岐して、系の切り
替えを行った後ステップＳＴ４３に進む。ステップＳＴ
４３では停止の要否を示すビット８８の検定を行い、そ
れが「０」であるのでそのままステップＳＴ３１に戻っ
て障害通知待ちの状態となり、ステップＳＴ４４による
装置の停止は行わない。なお、このビット８８が「１」
であればステップＳＴ４４に分岐して、障害の発生した
装置を停止させる。

【００３７】以上のように処理することにより、発生し
た障害に対して、それぞれの障害要因に適した処理を簡
単に実現することが可能となる。

【００３８】実施例４．図１０はこの発明の実施例４に
よる障害管理方法が適用されたシステムの内部動作を示
すフローチャートであり、図１に示したシステムにおけ
る各端末装置２３〜２６内の障害検出・処理タスク２９
〜３２の動作を示している。

【００３９】次に動作について説明する。複数の装置を
ＬＡＮで接続したシステムにおいては、各装置間でのデ
ータのやりとりがＬＡＮを使用して行われるため、接続
される装置数が増えるほどＬＡＮの負荷が高いものとな
ってしまう。また、障害は瞬間的に多発することが多い
ため、中央処理装置などでそれを集中管理する場合に
は、ＬＡＮの負荷を瞬間的に上げる要因となってくる。
この実施例４では、そのような場合でもＬＡＮの負荷を
上げることなく中央処理装置への障害通知処理を行うこ
とを目的としている。

【００４０】端末装置２５内で障害が発生した場合、障
害検出・処理タスク３１はステップＳＴ５０でそれを検
出する。ステップＳＴ５１ではこのステップＳＴ５０に
おける障害検出による障害通知の有無を判定しており、
通常はこのステップＳＴ５１にて障害通知待ちを行って
いる。ステップＳＴ５１で障害検出の通知があったと判
定されると、ステップＳＴ５２に移行して自装置内の障
害情報蓄積ファイル４５にその障害情報を書き込んでス
テップＳＴ５３に進み、ＬＡＮ通信制御タスク３９より
その障害情報を親装置（ここでは中央処理装置２２）へ
転送する。次にステップＳＴ５４に進んで、一定の時間
（この場合には１秒間）だけウェイトした後、ステップ
ＳＴ５１に戻り、次の障害通知の有無を判定する。以
下、上記と同様の処理を繰り返す。

【００４１】このように、この実施例４では親装置への
障害情報の通知処理に際して、障害情報の送信後、ステ
ップＳＴ５４においてある一定時間のウェイト処理を行
うことにより、障害情報が連続的に送信されるのを防い
でいる。なお、ここで注意しなければならないのは、こ
のウェイト処理の間に発生した障害については処理され
なくなってしまうので、障害通知を待つステップＳＴ５
１の処理を、いつでも障害を受け付けられるような、好
ましくはキューの形とし、そのキューの大きさ（最大に
溜められる個数）も十分なものとしなければならない。

【００４２】以上のように処理することにより、同一装
置内で瞬間的に複数の障害が発生しても、送信に時差を
もうけているため、ＬＡＮの負荷を上げることなく障害
管理を実現することが可能となる。

【００４３】実施例５．図１１はこの発明の実施例５に
よる障害管理方法が適用されるシステムの装置構成およ
び情報の流れを示す構成図であり、各部には図１の相当
部分と同一の符号を付してその説明は省略する。なお、
この図１１には端末装置２４，２５および２６で同時に
障害が発生し、その障害情報を中央処理装置２２の障害
情報蓄積ファイル４１に書き込んで集中管理する場合に
ついて示している。

【００４４】また、図１２は各装置が保持している、シ
ステム全体の装置構成を定義した共通の定義テーブルを
示す説明図である。図において、９０は当該定義テーブ
ルそのものであり、９１〜９４はこの定義テーブル９０
上のシステム装置情報を示している。このシステム装置
情報９１〜９４には中央処理装置２２、端末装置２４、
端末装置２５、端末装置２６、・・・・・のように、障
害発生時の障害通知のウェイト時間が短いものから順に
当該システムを構成している装置名が記録されている。
なお、この定義テーブル９０は各装置２２，２４〜２６
で同じ配列のものを有するのが好ましい。

【００４５】次に動作について説明する。上記実施例４
では、１つの装置内で瞬時に多発する障害についての処
理を示したが、この実施例５ではＬＡＮに関わる障害の
ようなシステム内の複数の装置において同時に発生する
ような障害について、ＬＡＮの負荷を上げることなく中
央処理装置への障害通知処理を行うことを目的としてい
る。例えば、図１１に示されるようなシステムにおい
て、端末装置２４，２５，２６内に同時に障害が発生し
たとすると、実施例１の場合には同時に中央処理装置２
２に対して障害通知処理が行われるため、一時的にＬＡ
Ｎの負荷が高くなることがあるが、各端末装置２４，２
５，２６による中央処理装置２２への障害通知の送信を
時間的にずらすことにより、瞬間的なＬＡＮの負荷の上
昇を防いでいる。

【００４６】図１１に示す独立した２つのＬＡＮ１ｂ，
ＬＡＮ１ｃにて構成されたシステムにおいて、端末装置
２４内で発生した障害がその障害検出・管理タスク３０
で検出されると（図１１のｍ）、障害検出・管理タスク
３０は当該障害情報を自装置内の障害情報蓄積ファイル
４４に書き込むとともに（図１１のｎ）、その障害情報
をＬＡＮ通信制御タスク３８よりＬＡＮ１ｂを経由して
中央処理装置２２に送る（図１１のｏ）。また、端末装
置２５内で発生した障害はその障害検出・管理タスク３
１で検出され（図１１のｐ）、その障害情報が自装置の
障害情報蓄積ファイル４５に書き込まれるとともに（図
１１のｑ）、ＬＡＮ通信制御タスク３９よりＬＡＮ１ｃ
を経由して中央処理装置２２に送られ（図１１のｒ）、
同様に、端末装置２６内で発生した障害はその障害検出
・管理タスク３２で検出され（図１１のｓ）、その障害
情報が自装置の障害情報蓄積ファイル４６に書き込まれ
るとともに（図１１のｔ）、ＬＡＮ通信制御タスク４０
よりＬＡＮ１ｃを経由して中央処理装置２２に送られる
（図１１のｕ）。

【００４７】なお、この端末装置２４のＬＡＮ通信制御
タスク３８、端末装置２５のＬＡＮ通信制御タスク３
９、および端末装置２６のＬＡＮ通信制御タスク４０か
ら中央処理装置２２へ送られる障害情報は、所定の時間
差（例えば１秒）を設けて端末装置２４、端末装置２
５、端末装置２６の順番で送信される。中央処理装置２
２の障害検出・処理タスク２８はそれらの障害情報をＬ
ＡＮ通信制御タスク３５あるいは３６を介して受け取
り、それを自装置内の障害情報蓄積ファイル４２に順次
書き込む（図１１のｖ）。

【００４８】障害情報の通知の流れは以上に説明したと
おりであるが、次に各装置間において送信時間をずら
し、送信される障害情報に所定の時間差をつける方法に
ついて説明する。ここで、図１３はこの実施例５による
障害管理方法が適用されたシステムの内部動作を示すフ
ローチャートであり、図１１に示したシステムにおける
各端末装置２４〜２６内の障害検出・処理タスク３０〜
３２の動作を示している。今、例えば端末装置２４で障
害が発生した場合、障害検出・処理タスク３０はステッ
プＳＴ６０でそれを検出する。ステップＳＴ６１ではこ
のステップＳＴ６０における障害検出による障害通知の
有無を判定しており、通常はこのステップＳＴ６１にて
障害通知待ちを行っている。ステップＳＴ６１で障害検
出の通知があったと判定されると、ステップＳＴ６２に
移行して自装置内の障害情報蓄積ファイル４４にその障
害情報を書き込んでステップＳＴ６３に進み、変数ｎを
０に初期化する。

【００４９】次に、ステップＳＴ６４に進んで定義ファ
イル９０の１行目のシステム装置情報９１を読み込み、
ステップＳＴ６５でそれと自装置の装置名とを比較す
る。この場合、読み込んだシステム装置情報の装置名は
「中央処理装置２２」で自装置の装置名「端末装置２
４」とは同値ではないため、ステップＳＴ６６で変数ｎ
に１を加えてステップＳＴ６４に戻り、２行目のシステ
ム装置情報９２を読み込む。この場合、読み込んだ装置
名は「端末装置２４」で自装置の装置名と同値であるの
で、ステップＳＴ６５による判定の結果、処理はステッ
プＳＴ６７に移行する。ここで、変数ｎの値は１となっ
ているため、ステップＳＴ６７において１秒間だけウェ
イトした後ステップＳＴ６８に進み、ＬＡＮ通信制御タ
スク３８よりその障害情報を親装置（ここでは中央処理
装置２２）へ転送する。

【００５０】同様にして、端末装置２５で障害が発生し
た場合には２秒間だけウェイトした後に、端末装置２６
で障害が発生した場合には３秒間だけウェイトした後
に、それぞれ親装置への障害情報の転送が行われる。従
って、各端末装置２４〜２６で同時に障害が発生した場
合でも、その障害通知を各端末装置２４〜２６で時間差
を設けて送信することが可能となり、それらがかち合う
ことを防止することができる。

【００５１】以上のように処理することにより、複数の
装置によって構成される大規模システムにおいて、複数
の装置に同時に発生する障害についてもＬＡＮの負荷を
上げることなく障害管理を実現することが可能となる。

【００５２】

【発明の効果】請求項１の発明によれば、１つの装置に
発生した障害の障害情報を、各装置毎にあらかじめ定め
られている障害情報通知先に基づいて、いくつかのネッ
トワークにまたがって接続されている装置に送信し、そ
れを受けた装置は当該障害情報を他のネットワークにつ
ながる装置に送信するように構成したので、いくつかの
ネットワークにまたがって接続されている装置を経由し
て、他のネットワークにつながっている特定装置に対し
て障害情報を送信することができるようになり、人的作
業を必要とせずに障害に対する対処を行うことが可能と
なって、複数のネットワークにまたがった複雑な構成の
システムにおいても、障害の集中管理および遠隔での管
理が行える障害管理方法が得られる効果がある。

【００５３】請求項２の発明によれば、障害をあらかじ
め複数の障害レベルに分類、定義しておき、障害が発生
した場合に、その障害内容が障害レベルのどれに該当す
るかを識別して障害レベルに沿った処理を行うように構
成したので、発生した障害の程度によって、それに適し
た対処方法を自動的に選択して実施することが可能とな
り、大規模なシステムにおける処理の分散化に有効とな
る効果がある。

【００５４】請求項３の発明によれば、あらかじめ障害
毎にその処理項目を処理ビットパターンとして定義して
おき、障害が発生した場合に、その処理ビットパターン
に従って発生した障害の内容に対して必要な処理項目の
みを実行するように構成したので、発生した障害に対し
てそれぞれの障害要因により適した処理を簡単に実現す
ることが可能になる効果がある。

【００５５】請求項４の発明によれば、１つの装置に複
数の障害が発生した場合に、あらかじめ定められたウェ
イト時間に従って、一定の時差を設けて障害情報を送信
するように構成したので、短時間の間に複数の障害が発
生した場合においても、ネットワークの負荷上昇を伴う
ことなく障害管理を行うことが可能になる効果がある。

【００５６】請求項５の発明によれば、短時間の間に複
数の装置で障害が発生した場合に、それらの装置間であ
らかじめ定められたウェイト時間に従って、一定の時差
を設けて障害情報を送信するように構成したので、装置
で同時に複数の障害が発生した場合においても、ネット
ワークの負荷上昇を伴うことなく障害管理を行うことが
可能になる効果がある。

【図面の簡単な説明】

【図１】この発明の実施例１による障害管理方法が適
用されたシステムの装置構成および情報の流れを示す構
成図である。

【図２】上記実施例における中央処理装置２２が保持
する障害通知先格納テーブルを示す説明図である。

【図３】上記実施例における中央処理装置２１が保持
する障害通知先格納テーブルを示す説明図である。

【図４】上記実施例における端末装置側の障害検出・
管理タスクの内部処理を示すフローチャートである。

【図５】上記実施例における中央処理装置側の障害検
出・管理タスクの内部処理を示すフローチャートであ
る。

【図６】この発明の実施例２による障害管理方法にて
使用される定義テーブルを示す説明図である。

【図７】上記実施例における障害検出・管理タスクの
内部動作を示すフローチャートである。

【図８】この発明の実施例３による障害管理方法にて
使用される定義テーブルを示す説明図である。

【図９】上記実施例における障害検出・管理タスクの
内部動作を示すフローチャートである。

【図１０】この発明の実施例４による障害管理方法が
適用されたシステムにおける障害検出・管理タスクの内
部動作を示すフローチャートである。

【図１１】この発明の実施例５による障害管理方法が
適用されたシステムの装置構成および情報の流れを示す
構成図である。

【図１２】上記実施例において使用される定義テーブ
ルを示す説明図である。

【図１３】上記実施例における障害検出・管理タスク
の内部動作を示すフローチャートである。

【図１４】従来の障害管理方法が適用されたシステム
の装置構成および情報の流れを示す構成図である。

【符号の説明】

１ａ〜１ｃＬＡＮ（ネットワーク）、２１，２２中
央処理装置（いくつかのネットワークにまたがって接続
されている装置）、２３〜２６端末装置（ネットワー
クのそれぞれに接続されている装置）、５１，６１障
害情報通知先、７２障害レベル、７３，８２障害内
容、８３〜８８処理ビットパターン。

フロントページの続き (51)Int.Cl.⁶ 識別記号庁内整理番号ＦＩ技術表示箇所Ｈ０４Ｌ 12/28 9466−5ＫＨ０４Ｌ 11/08 12/24 12/26

Claims

【特許請求の範囲】

【請求項１】独立した複数のネットワークと、前記ネ
ットワークのそれぞれに接続されている装置と、いくつ
かの前記ネットワークにまたがって接続されている装置
とで構成されているシステムの、前記各装置において発
生した障害の管理を行う障害管理方法において、前記障
害を通知する障害情報を転送するための障害情報通知先
を、前記各装置毎にあらかじめ定めておき、ある１つの
前記装置上で障害が発生した場合に、当該装置は前記障
害情報通知先に基づいてその障害情報を前記いくつかの
ネットワークにまたがって接続されている装置に対して
送信し、当該いくつかのネットワークにまたがって接続
されている装置は、前記障害情報通知先に基づいてその
障害情報を他のネットワークにつながっている装置に対
して送信することを特徴とする障害管理方法。
【請求項２】障害を複数の障害レベルにあらかじめ分
類および定義しておき、ある１つの前記装置上で障害が
発生した場合に、その障害内容に基づいて前記障害レベ
ルのどれに該当するかを識別し、当該障害レベルに沿っ
た処理を行うことを特徴とする請求項１に記載の障害管
理方法。
【請求項３】障害毎に発生後の処理に関する項目を処
理ビットパターンとしてあらかじめ定義しておき、ある
１つの前記装置上で障害が発生した場合に、その障害内
容に対応した前記処理ビットパターンに沿って処理を行
うことを特徴とする請求項１に記載の障害管理方法。
【請求項４】１つの障害情報を送信してから次の障害
情報を送信するまでのウェイト時間をあらかじめ定めて
おき、ある１つの前記装置上で複数の障害が発生した場
合に、前記ウェイト時間に従って一定の時差を設けて障
害情報の送信を行うことを特徴とする請求項１に記載の
障害管理方法。
【請求項５】前記各装置毎にそれぞれ異なった値の、
障害発生からその障害情報の送信までのウェイト時間を
あらかじめ定めておき、短時間の間に複数の前記装置に
おいて障害が発生した場合に、各装置は定められた前記
ウェイト時間に従って装置間で時差を設けて障害情報の
送信を行うことを特徴とする請求項１に記載の障害管理
方法。