JPH08328979A - 障害管理方法 - Google Patents

障害管理方法

Info

Publication number
JPH08328979A
JPH08328979A JP7130625A JP13062595A JPH08328979A JP H08328979 A JPH08328979 A JP H08328979A JP 7130625 A JP7130625 A JP 7130625A JP 13062595 A JP13062595 A JP 13062595A JP H08328979 A JPH08328979 A JP H08328979A
Authority
JP
Japan
Prior art keywords
failure
fault
information
management method
devices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7130625A
Other languages
English (en)
Inventor
Hisashi Oono
久支 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP7130625A priority Critical patent/JPH08328979A/ja
Publication of JPH08328979A publication Critical patent/JPH08328979A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 複数のネットワークにまたがって構成された
複雑なシステムにおいても、人的作業を必要とせずに障
害の集中管理および遠隔での管理が可能な障害管理方法
を得る。 【構成】 障害を通知する障害情報を転送するための障
害情報通知先を、各装置21〜26毎にあらかじめ定め
ておき、ある1つの装置25上で障害が発生した場合
に、当該装置はその障害情報通知先に基づいて当該障害
情報を、いくつかのネットワークにまたがって接続され
ている装置22(21)に対して送信し、それを受信し
た装置はその障害情報通知先に基づいて当該障害情報を
他のネットワークにつながる特定装置23に対して送信
するようにしたもの。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、ローカル・エリア・
ネットワーク(以下、LANという)等のネットワーク
を利用したシステム上での、障害の集中管理および遠隔
での管理を行う障害管理方法に関するもので、特にその
汎用性の向上に関するものである。
【0002】
【従来の技術】図14は例えば、特公平5−72140
号公報に示された従来の障害管理方法が適用されるシス
テムの装置構成および情報の流れを示す構成図である。
図において、1はネットワークの一例としてのLANで
あり、2,3はこのLAN1に接続されている端末装置
である。4はLAN1に接続されてLAN1内の障害を
管理する障害管理装置であり、5はこの障害管理装置4
に装備されている障害情報蓄積装置である。6は当該シ
ステムを管理するホスト計算機であり、7はホスト計算
機6に装備されている障害情報蓄積装置、8は同じく表
示装置である。9はLAN1を介して端末装置2,3と
このホスト計算機6とを結ぶコミニケーションサーバで
ある。10は端末装置2の障害検出・転送装置、11は
端末装置3の障害検出・転送装置であり、12はコミニ
ケーションサーバ9の障害検出・転送装置である。13
は障害管理装置4の障害検出・転送装置であり、14は
障害管理装置4内のネットワーク管理プログラムであ
る。15はホスト計算機6内にある通信機能であり、1
6はホスト計算機6内のネットワーク管理プログラムで
ある。
【0003】次に動作について説明する。まず、障害の
発生が端末装置2の障害検出・転出装置10により検出
される(図14のa)。検出された障害に関する障害情
報はLAN1を介して障害管理装置4に送信され、それ
を受信した障害管理装置4の障害検出・転出装置13
は、障害管理装置4に接続されている障害情報蓄積装置
5にその障害情報を蓄積する(図14のb)。システム
を管理するオペレータはホスト計算機6に接続される表
示装置8にて障害管理装置4内の障害情報蓄積装置5内
に蓄積されている障害情報を検索および抽出をして、ホ
スト計算機6に情報収集の指示を出し、ホスト計算機6
はコミニケーションサーバ9を経由して障害管理装置4
内のネットワーク管理プログラム14に障害情報の送信
を要求する(図14のc)。障害管理装置4のネットワ
ーク管理プログラム14はその要求に従って障害情報蓄
積装置5から該当するデータを取り出し、ホスト計算機
6に対してそのデータを送信し、当該データを受けたホ
スト計算機6はそれに基づく障害情報を表示装置8に表
示するとともに、その障害情報を障害情報蓄積装置7に
蓄積する(図14のd)。
【0004】
【発明が解決しようとする課題】従来の障害管理方法は
以上のように構成されているので、その機能は障害情報
の蓄積程度にとどまり、また発生した障害の対処に対し
ても人的作業が伴うため、早急に対処しなければならな
い障害に対しては遅れが生じてしまうなどの問題点があ
り、さらに、複数のLAN1にまたがって構成されてい
るような複雑なシステムにおいては障害の集中的な管理
が面倒になるなどの問題点もあった。
【0005】この発明は上記のような問題点を解消する
ためになされたもので、人的作業を必要とせずに障害に
対する対処を行うことが可能であり、複数のLANにま
たがって構成された複雑なシステムにおいても障害の集
中管理および遠隔での管理が可能となる障害管理方法を
得ることを目的とする。
【0006】
【課題を解決するための手段】請求項1の発明に係る障
害管理方法は、装置の1つに障害が発生した場合、各装
置毎にあらかじめ定められている障害情報通知先に基づ
いて、その障害を通知する障害情報を、いくつかのネッ
トワークにまたがって接続されている装置を経由して、
他のネットワークにつながっている特定の装置に対して
送信することを可能としたものである。
【0007】請求項2の発明に係る障害管理方法は、装
置の1つに障害が発生した場合、その障害の内容があら
かじめ分類、定義されている障害レベルのどれに該当す
るかを識別し、その障害レベルに沿った処理を行うこと
を可能としたものである。
【0008】請求項3の発明に係る障害管理方法は、装
置の1つに障害が発生した場合、あらかじめ障害の内容
毎に定義されている障害発生後の処理項目を示す処理ビ
ットパターンに従って、その障害内容に対して必要な処
理項目のみを実行することを可能としたものである。
【0009】請求項4の発明に係る障害管理方法は、装
置の1つに障害が発生した場合、あらかじめ定められた
ウェイト時間に従って、障害情報を一定の時差を設けて
送信することを可能としたものである。
【0010】請求項5の発明に係る障害管理方法は、短
時間に複数の装置で障害が発生した場合、それらの装置
間であらかじめ定められたウェイト時間に従って時差を
設けて障害情報の送信を行うことを可能としたものであ
る。
【0011】
【作用】請求項1の発明における障害管理方法は、各装
置毎に障害情報通知先をあらかじめ定めておき、障害が
発生した場合には、障害情報通知先に従っていくつかの
ネットワークにまたがって接続されている装置に障害情
報を送信し、それを受けた装置は、障害情報通知先に従
って当該障害情報を他のネットワークにつながっている
装置に送信することにより、障害情報をいくつかのネッ
トワークにまたがって接続されている装置経由で、他の
ネットワークに接続された特定の装置に送信することが
可能となり、複数のネットワークにまたがる複雑なシス
テムにおいても、人的作業を必要とすることなく、障害
の集中管理および遠隔での管理が行える障害管理方法を
実現する。
【0012】請求項2の発明における障害管理方法は、
障害をあらかじめ複数の障害レベルに分類、定義してお
き、障害が発生した場合にはその障害内容からそれに該
当する障害レベルに沿った処理を行うことにより、発生
した障害の程度に応じた処理を自動的に行うことを可能
とする。
【0013】請求項3の発明における障害管理方法は、
あらかじめ障害毎にその処理項目を処理ビットパターン
として定義しておき、障害が発生した場合にはその処理
ビットパターンに従って、発生した障害の内容に応じて
必要な処理項目のみを実行することにより、その障害要
因に適した処理項目を自動的に選択して実行することを
可能とする。
【0014】請求項4の発明における障害管理方法は、
あらかじめ所定のウェイト時間を定めておき、1つの装
置上に複数の障害が発生した場合には、そのウェイト時
間に応じた時差で障害情報を順次送信することにより、
短時間の間に複数の障害が発生しても、ネットワークの
負荷を上昇させることなく障害管理を行うことを可能と
する。
【0015】請求項5の発明における障害管理方法は、
あらかじめ各装置毎に異なったウェイト時間を定めてお
き、複数の装置で短時間の間に障害が発生した場合に、
それらの装置間でそのウェイト時間に応じた時間差で障
害情報の送信を行うことにより、複数の装置において短
時間の間に障害が発生しても、ネットワークの負荷を上
昇させることなく障害管理を行うことを可能とする。
【0016】
【実施例】
実施例1.以下、この発明の一実施例を図について説明
する。図1はこの発明の実施例1による障害管理方法が
適用されるシステムの装置構成および情報の流れを示す
構成図である。図において、1a,1b,1cはそれぞ
れ独立した複数のネットワークとしてのLANであり、
21はそのLAN1aとLAN1bとにまたがって接続
されている装置としての中央処理装置、22はLAN1
bとLAN1cとにまたがって接続されている装置とし
ての中央処理装置である。23はLAN1aに接続され
ている装置としての端末装置、24はLAN1bに接続
されている装置としての端末装置であり、25,26は
LAN1cに接続されている装置としての端末装置であ
る。
【0017】27は中央処理装置21に、28は中央処
理装置22にそれぞれ装備されている障害検出・管理タ
スクであり、29は端末装置23に、30は端末装置2
4に、31は端末装置25に、32は端末装置26にそ
れぞれ装備されている障害検出・管理タスクである。3
3,34は中央処理装置21に、35,36は中央処理
装置22にそれぞれ装備されているLAN通信制御タス
クであり、37は端末装置23に、38は端末装置24
に、39は端末装置25に、40は端末装置26にそれ
ぞれ装備されているLAN通信制御タスクである。41
は中央処理装置21に、42は中央処理装置22にそれ
ぞれ内蔵されて、各装置の障害情報等を集合的に蓄積す
る障害情報蓄積ファイルであり、43は端末装置23
に、44は端末装置24に、45は端末装置25に、4
6は端末装置26にそれぞれ内蔵されて、自装置の障害
情報の蓄積を行う個別の障害情報蓄積ファイルである。
【0018】次に動作について説明する。図1にはLA
N1cに接続された端末装置25で発生した障害が、別
系統のLAN1aに接続された端末装置23に通知され
る情報の流れが示されている。ここで、図2は中央処理
装置22内に保持されている障害通知先格納テーブルを
示す説明図、図3は中央処理装置21内に保持されてい
る障害通知先格納テーブルを示す説明図であり、図中、
50,60はその障害通知先格納テーブルそのものを示
し、51,61はこれら障害通知先格納テーブル50,
60上の障害情報通知先を示している。
【0019】図1に示したLAN1a,LAN1b,L
AN1cによる3つの独立したLANで構成されてシス
テムにおいて、端末装置25内で発生した障害がその障
害検出・管理タスク31で検出されると(図1のe)、
障害検出・管理タスク31は当該障害情報を自装置内の
障害情報蓄積ファイル45に書き込む(図1のf)。そ
してその障害情報を、LAN通信制御タスク39よりL
AN1cを経由して中央処理装置22に送る(図1の
g)。中央処理装置22の障害検出・処理タスク28は
LAN通信制御タスク36を介して受け取ったその障害
情報を、自装置内の障害情報蓄積ファイル42に書き込
む(図1のh)。その後、図2に示される障害通知先格
納テーブル50を検索して、当該障害情報を転送する障
害情報通知先51を抽出し、受け取った障害情報をその
障害情報通知先51で指定される中央処理装置21に、
LAN通信制御タスク35よりLAN1bを経由して送
信する(図1のi)。
【0020】中央処理装置21の障害検出・処理タスク
27はLAN通信制御タスク34を介してその障害情報
を受け取り、それを自装置内の障害情報蓄積ファイル4
1に書き込む(図1のj)。その後、図3に示される障
害通知先格納テーブル60を検索して次の障害情報通知
先61を抽出し、受け取った障害情報をその障害情報通
知先61で指定される端末装置23に、LAN通信制御
タスク33よりLAN1aを経由して送信する(図1の
k)。端末装置23の障害検出・処理タスク27はその
障害情報をLAN通信制御タスク34を介して受け取
り、それを自装置内の障害情報蓄積ファイル43に書き
込む(図1のl)。
【0021】なお、この実施例1では障害情報を障害情
報蓄積ファイル41〜46に蓄積するとしているが、出
力先は外部の記憶媒体(例えば、フロッピィドライブ)
であってもよく、また、表示機能を備えているものにつ
いてはそれに表示することが可能であるし、プリンタ機
能を備えているものについてはそれより帳票出力するこ
とも可能である。
【0022】障害情報の通知の流れは以上に説明したと
おりであるが、次に各装置の処理について、図4および
図5のフローチャートを用いて説明する。図4は端末装
置側の障害検出・管理タスク31(29,30,32)
の内部処理の流れを示すフローチャートである。端末装
置側の障害検出・管理タスク31はステップST1で障
害の発生を検出し、ステップST2においてこのステッ
プST1での障害検出による障害通知の有無を判定して
おり、通常はこのステップST2において障害通知待ち
を行っている。ステップST2で障害検出の通知があっ
たと判定されると、ステップST3に移行して自装置内
の障害情報蓄積ファイル45にその障害情報を書き込
む。次にステップST4に進み、LAN通信制御タスク
39よりその障害情報を親装置(ここでは中央処理装置
22)へ転送し、ステップST2に戻る。
【0023】また、図5は中央処理装置側の障害検出・
管理タスク28(27)の内部処理を示すフローチャー
トである。中央処理装置側の障害検出・管理タスク28
もステップST10で障害の発生を検出しており、ステ
ップST11で子装置側からの障害報告を受信してい
る。ステップST12ではこのステップST10での障
害検出、あるいはステップST11での障害報告の受信
による障害通知の有無を判定しており、通常はこのステ
ップST12において障害通知待ちを行っている。ステ
ップST12で障害検出の通知があったと判定される
と、ステップST13に移行して自装置内の障害情報蓄
積ファイル42にその障害情報を書き込む。次にステッ
プST14に進み、当該障害情報の通知先を障害通知先
格納テーブル50から検索し、ステップST15にてそ
の障害情報を抽出された通知先(この場合には中央処理
装置21)にLAN通信制御タスク35を介して転送す
る。それを受けた中央処理装置21でも同様にして、自
装置内の障害情報蓄積ファイル41にその障害情報を書
き込み、それを障害通知格納テーブル60の検索にて抽
出された通知先(この場合には端末装置23)に通知す
る。
【0024】以上のように処理することにより、複数の
LANにまたがって構成された複雑なシステムにおいて
も、人的作業を伴うことなく自動的に障害情報を他のL
AN系統につながる端末装置に対して送信し、管理を行
うことが可能となる。
【0025】実施例2.図6はこの発明の実施例2にお
ける障害管理方法にて参照される、障害情報を定義する
定義テーブルを示す説明図である。図において、70は
その定義テーブルそのものであり、71は定義テーブル
70上の障害番号、72は定義テーブル70上の障害レ
ベル、73は定義テーブル70上の障害内容を示してい
る。また、74は障害レベル3の場合の処理を説明する
ためのデータを表すレコードであり、75は障害レベル
1の場合の処理を説明するためのデータを表すレコー
ド、76は障害レベル2の場合の処理を説明するための
データを表すレコードである。
【0026】次に動作について説明する。従来の障害管
理方法が適用されたシステムでは、障害が起こった場合
の処理はその障害を分析するためのログを残すことを目
的としており、障害に対して行う処理としてはその内容
を表示する程度のものであった。この実施例2では、発
生した障害に対して自動的に対処を行う手段について説
明する。障害には履歴さえ残せばよいような軽度のもの
から、装置自体を止めて修理を施さなければならないよ
うな重度のものまで様々なものがある。そのため、障害
を複数のレベルに分けてそれぞれのレベルに対応した処
理を施すことにより、その処理を実現している。この実
施例2では、障害を3つのレベルに分けた場合について
説明する。
【0027】図7はこの実施例2による障害管理方法が
適用されたシステムの内部動作を示すフローチャートで
あり、図1に示されるシステムにおける各端末装置23
〜26内の障害検出・処理タスク29〜32の動作を示
している。端末装置25内で障害が発生した場合、その
障害検出・処理タスク31はステップST20において
その障害を検出する。ステップST21ではこのステッ
プST20での障害検出による障害通知の有無を判定し
ており、通常はこのステップST21において障害通知
待ちを行っている。ステップST21で障害検出の通知
があったと判定されると、ステップST22に移行して
自装置内の障害情報蓄積ファイル45にその障害情報を
書き込む。その後ステップST23において、障害番号
を検索キーにして定義テーブル70の検索を行い、発生
した障害がどのレベルのものかを抽出する。
【0028】ここで、定義テーブル70は好ましくは、
システム上の各装置21〜26の全てにあらかじめ定義
されたものであり、存在する位置は、障害検出・処理タ
スク27〜32の中にあってもよいし、障害検出・処理
タスク27〜32外に設けたファイルのような形であっ
てもよい。定義テーブル70は前述のように、1つのデ
ータが障害番号71、障害レベル72、および障害内容
73(必須のものではない)の3つで構成されており、
障害番号71をキーにして検索されるものである。例え
ば、発生した障害の障害番号が電源異常を示す「100
2」であった場合には、定義テーブル70の障害番号7
1の項目を検索し、該当するレコード75より障害レベ
ル「1」を抽出する。
【0029】そして、次のステップST24に進んで障
害レベルの判定を行い、この場合には障害レベルが
「1」であるためステップST26に分岐する。ステッ
プST26ではその障害情報を親装置(この場合には中
央処理装置22)に転送し、次にステップST27にお
いて、障害が発生した端末装置25が二重系であるかど
うかの判定を行う。その結果、二重系に構成されていれ
ばステップST28にて系の切り替えを行ってからステ
ップST29に進み、二重系に構成されていなければそ
のままステップST29に進む。ステップST29では
障害が発生した装置(この場合には端末装置23)を停
止状態にする。
【0030】同様にして、発生した障害の障害番号が通
信エラーを示す「1003」であれば、ステップST2
3において該当するレコード76により障害レベル
「2」が抽出される。従って、ステップST24による
障害レベルの判定の結果、障害レベルが「2」であるた
めステップST25に分岐する。ステップST25では
その障害情報を親装置(中央処理装置22)に通知した
後、ステップST21に戻って障害通知待ちの状態とな
る。また、発生した障害の障害番号が不正入力有りを示
す「1001」であった場合、該当するレコード74に
より障害レベル「3」が抽出されるので、ステップST
24における障害レベルの判定の結果、そのままステッ
プST21に戻って障害通知待ちの状態となる。
【0031】以上のように処理することにより、障害が
発生した場合に、その障害の程度に応じて自動的に対処
することが可能となり、人的作業を省き、大規模システ
ムにおいて処理を分散化させる1つの手段となる。
【0032】実施例3.図8はこの発明の実施例3にお
ける障害管理方法にて参照される、障害情報を定義する
定義テーブルを示す説明図である。図において、80は
その定義テーブルそのものであり、81は定義テーブル
80上の障害番号を示し、82は定義テーブル80上の
障害内容を示している。また、83〜88は定義テーブ
ル80上の障害に対する処理ビットパターンの各ビット
を示しており、ビット83はログ書き込みの要・不要
を、ビット84は画面表示の有無を、ビット85は警報
出力の有無を、ビット86は上位親装置への通知の要・
不要を、ビット87は系切替の要・不要を、ビット88
は装置停止の要・不要をそれぞれ定義している。89は
障害番号「1001」の処理を説明するためのデータを
表すレコードである。
【0033】次に動作について説明する。上記実施例2
では障害を複数のレベルに分けて障害に対する処理を決
定していたが、この実施例3では障害に対する処理をも
っと細分化し、それぞれの処理に対して実行の要否をビ
ットパターン化して定義しておくことにより、複雑な処
理パターンを実現している。ここで、図9はこの実施例
3による障害管理方法が適用されたシステムの内部動作
を示すフローチャートであり、図1に示したシステムに
おける各端末装置23〜26内の障害検出・処理タスク
29〜32の動作を示している。
【0034】端末装置25内で障害が発生した場合、そ
の障害検出・処理タスク31はステップST30におい
てその障害を検出する。ステップST31ではこのステ
ップST30での障害検出による障害通知の有無を判定
しており、通常はこのステップST31において障害通
知待ちを行っている。ステップST31で障害検出の通
知があったと判定されると、ステップST32に移行し
てその障害の処理ビットパターン83〜88の抽出を行
う。例えば、障害番号「1001」の障害が発生した場
合、定義テーブル80を障害番号81を検索キーとして
検索し、該当するレコード89よりその処理ビットパタ
ーン83〜88を抽出する。
【0035】次に、抽出した処理ビットパターン83〜
88の、ログ書き込みの要否を示す最初のビット83を
ステップST33で検定する。この場合、ビット83は
「1」であるのでステップST34に分岐し、自装置内
の障害情報蓄積ファイル45にその障害情報の書き込み
を行ってステップST35に進む。なお、このビット8
3が「0」であればそのままステップST35に進む。
ステップST35では次の画面表示の要否を示すビット
84の検定を行い、このビット84が「1」であるので
ステップST36に分岐して、画面表示を行った後ステ
ップST37に進む。なお、ビット83が「0」であれ
ばそのままステップST37に進む。ステップST37
では警報出力の要否を示すビット85の検定を行い、そ
れが「0」であるのでステップST38による警報出力
は行わずにステップST39に進む。なお、このビット
85が「1」である場合にはステップST39に分岐し
て、警報出力を行った後ステップST39に進む。
【0036】次に、ステップST39では通知の要否を
示すビット86の検定を行い、それが「0」であるので
ステップST40による通知は行わずにステップST4
1に進む。なお、このビット86が「1」であればステ
ップST39に分岐して、上位の親装置への通知を行っ
た後ステップST41に進む。ステップST41では系
切替の要否を示すビット87の検定を行い、それが
「0」であるのでステップST42による通知は行わず
にステップST43に進む。なお、このビット87が
「1」であればステップST42に分岐して、系の切り
替えを行った後ステップST43に進む。ステップST
43では停止の要否を示すビット88の検定を行い、そ
れが「0」であるのでそのままステップST31に戻っ
て障害通知待ちの状態となり、ステップST44による
装置の停止は行わない。なお、このビット88が「1」
であればステップST44に分岐して、障害の発生した
装置を停止させる。
【0037】以上のように処理することにより、発生し
た障害に対して、それぞれの障害要因に適した処理を簡
単に実現することが可能となる。
【0038】実施例4.図10はこの発明の実施例4に
よる障害管理方法が適用されたシステムの内部動作を示
すフローチャートであり、図1に示したシステムにおけ
る各端末装置23〜26内の障害検出・処理タスク29
〜32の動作を示している。
【0039】次に動作について説明する。複数の装置を
LANで接続したシステムにおいては、各装置間でのデ
ータのやりとりがLANを使用して行われるため、接続
される装置数が増えるほどLANの負荷が高いものとな
ってしまう。また、障害は瞬間的に多発することが多い
ため、中央処理装置などでそれを集中管理する場合に
は、LANの負荷を瞬間的に上げる要因となってくる。
この実施例4では、そのような場合でもLANの負荷を
上げることなく中央処理装置への障害通知処理を行うこ
とを目的としている。
【0040】端末装置25内で障害が発生した場合、障
害検出・処理タスク31はステップST50でそれを検
出する。ステップST51ではこのステップST50に
おける障害検出による障害通知の有無を判定しており、
通常はこのステップST51にて障害通知待ちを行って
いる。ステップST51で障害検出の通知があったと判
定されると、ステップST52に移行して自装置内の障
害情報蓄積ファイル45にその障害情報を書き込んでス
テップST53に進み、LAN通信制御タスク39より
その障害情報を親装置(ここでは中央処理装置22)へ
転送する。次にステップST54に進んで、一定の時間
(この場合には1秒間)だけウェイトした後、ステップ
ST51に戻り、次の障害通知の有無を判定する。以
下、上記と同様の処理を繰り返す。
【0041】このように、この実施例4では親装置への
障害情報の通知処理に際して、障害情報の送信後、ステ
ップST54においてある一定時間のウェイト処理を行
うことにより、障害情報が連続的に送信されるのを防い
でいる。なお、ここで注意しなければならないのは、こ
のウェイト処理の間に発生した障害については処理され
なくなってしまうので、障害通知を待つステップST5
1の処理を、いつでも障害を受け付けられるような、好
ましくはキューの形とし、そのキューの大きさ(最大に
溜められる個数)も十分なものとしなければならない。
【0042】以上のように処理することにより、同一装
置内で瞬間的に複数の障害が発生しても、送信に時差を
もうけているため、LANの負荷を上げることなく障害
管理を実現することが可能となる。
【0043】実施例5.図11はこの発明の実施例5に
よる障害管理方法が適用されるシステムの装置構成およ
び情報の流れを示す構成図であり、各部には図1の相当
部分と同一の符号を付してその説明は省略する。なお、
この図11には端末装置24,25および26で同時に
障害が発生し、その障害情報を中央処理装置22の障害
情報蓄積ファイル41に書き込んで集中管理する場合に
ついて示している。
【0044】また、図12は各装置が保持している、シ
ステム全体の装置構成を定義した共通の定義テーブルを
示す説明図である。図において、90は当該定義テーブ
ルそのものであり、91〜94はこの定義テーブル90
上のシステム装置情報を示している。このシステム装置
情報91〜94には中央処理装置22、端末装置24、
端末装置25、端末装置26、・・・・・のように、障
害発生時の障害通知のウェイト時間が短いものから順に
当該システムを構成している装置名が記録されている。
なお、この定義テーブル90は各装置22,24〜26
で同じ配列のものを有するのが好ましい。
【0045】次に動作について説明する。上記実施例4
では、1つの装置内で瞬時に多発する障害についての処
理を示したが、この実施例5ではLANに関わる障害の
ようなシステム内の複数の装置において同時に発生する
ような障害について、LANの負荷を上げることなく中
央処理装置への障害通知処理を行うことを目的としてい
る。例えば、図11に示されるようなシステムにおい
て、端末装置24,25,26内に同時に障害が発生し
たとすると、実施例1の場合には同時に中央処理装置2
2に対して障害通知処理が行われるため、一時的にLA
Nの負荷が高くなることがあるが、各端末装置24,2
5,26による中央処理装置22への障害通知の送信を
時間的にずらすことにより、瞬間的なLANの負荷の上
昇を防いでいる。
【0046】図11に示す独立した2つのLAN1b,
LAN1cにて構成されたシステムにおいて、端末装置
24内で発生した障害がその障害検出・管理タスク30
で検出されると(図11のm)、障害検出・管理タスク
30は当該障害情報を自装置内の障害情報蓄積ファイル
44に書き込むとともに(図11のn)、その障害情報
をLAN通信制御タスク38よりLAN1bを経由して
中央処理装置22に送る(図11のo)。また、端末装
置25内で発生した障害はその障害検出・管理タスク3
1で検出され(図11のp)、その障害情報が自装置の
障害情報蓄積ファイル45に書き込まれるとともに(図
11のq)、LAN通信制御タスク39よりLAN1c
を経由して中央処理装置22に送られ(図11のr)、
同様に、端末装置26内で発生した障害はその障害検出
・管理タスク32で検出され(図11のs)、その障害
情報が自装置の障害情報蓄積ファイル46に書き込まれ
るとともに(図11のt)、LAN通信制御タスク40
よりLAN1cを経由して中央処理装置22に送られる
(図11のu)。
【0047】なお、この端末装置24のLAN通信制御
タスク38、端末装置25のLAN通信制御タスク3
9、および端末装置26のLAN通信制御タスク40か
ら中央処理装置22へ送られる障害情報は、所定の時間
差(例えば1秒)を設けて端末装置24、端末装置2
5、端末装置26の順番で送信される。中央処理装置2
2の障害検出・処理タスク28はそれらの障害情報をL
AN通信制御タスク35あるいは36を介して受け取
り、それを自装置内の障害情報蓄積ファイル42に順次
書き込む(図11のv)。
【0048】障害情報の通知の流れは以上に説明したと
おりであるが、次に各装置間において送信時間をずら
し、送信される障害情報に所定の時間差をつける方法に
ついて説明する。ここで、図13はこの実施例5による
障害管理方法が適用されたシステムの内部動作を示すフ
ローチャートであり、図11に示したシステムにおける
各端末装置24〜26内の障害検出・処理タスク30〜
32の動作を示している。今、例えば端末装置24で障
害が発生した場合、障害検出・処理タスク30はステッ
プST60でそれを検出する。ステップST61ではこ
のステップST60における障害検出による障害通知の
有無を判定しており、通常はこのステップST61にて
障害通知待ちを行っている。ステップST61で障害検
出の通知があったと判定されると、ステップST62に
移行して自装置内の障害情報蓄積ファイル44にその障
害情報を書き込んでステップST63に進み、変数nを
0に初期化する。
【0049】次に、ステップST64に進んで定義ファ
イル90の1行目のシステム装置情報91を読み込み、
ステップST65でそれと自装置の装置名とを比較す
る。この場合、読み込んだシステム装置情報の装置名は
「中央処理装置22」で自装置の装置名「端末装置2
4」とは同値ではないため、ステップST66で変数n
に1を加えてステップST64に戻り、2行目のシステ
ム装置情報92を読み込む。この場合、読み込んだ装置
名は「端末装置24」で自装置の装置名と同値であるの
で、ステップST65による判定の結果、処理はステッ
プST67に移行する。ここで、変数nの値は1となっ
ているため、ステップST67において1秒間だけウェ
イトした後ステップST68に進み、LAN通信制御タ
スク38よりその障害情報を親装置(ここでは中央処理
装置22)へ転送する。
【0050】同様にして、端末装置25で障害が発生し
た場合には2秒間だけウェイトした後に、端末装置26
で障害が発生した場合には3秒間だけウェイトした後
に、それぞれ親装置への障害情報の転送が行われる。従
って、各端末装置24〜26で同時に障害が発生した場
合でも、その障害通知を各端末装置24〜26で時間差
を設けて送信することが可能となり、それらがかち合う
ことを防止することができる。
【0051】以上のように処理することにより、複数の
装置によって構成される大規模システムにおいて、複数
の装置に同時に発生する障害についてもLANの負荷を
上げることなく障害管理を実現することが可能となる。
【0052】
【発明の効果】請求項1の発明によれば、1つの装置に
発生した障害の障害情報を、各装置毎にあらかじめ定め
られている障害情報通知先に基づいて、いくつかのネッ
トワークにまたがって接続されている装置に送信し、そ
れを受けた装置は当該障害情報を他のネットワークにつ
ながる装置に送信するように構成したので、いくつかの
ネットワークにまたがって接続されている装置を経由し
て、他のネットワークにつながっている特定装置に対し
て障害情報を送信することができるようになり、人的作
業を必要とせずに障害に対する対処を行うことが可能と
なって、複数のネットワークにまたがった複雑な構成の
システムにおいても、障害の集中管理および遠隔での管
理が行える障害管理方法が得られる効果がある。
【0053】請求項2の発明によれば、障害をあらかじ
め複数の障害レベルに分類、定義しておき、障害が発生
した場合に、その障害内容が障害レベルのどれに該当す
るかを識別して障害レベルに沿った処理を行うように構
成したので、発生した障害の程度によって、それに適し
た対処方法を自動的に選択して実施することが可能とな
り、大規模なシステムにおける処理の分散化に有効とな
る効果がある。
【0054】請求項3の発明によれば、あらかじめ障害
毎にその処理項目を処理ビットパターンとして定義して
おき、障害が発生した場合に、その処理ビットパターン
に従って発生した障害の内容に対して必要な処理項目の
みを実行するように構成したので、発生した障害に対し
てそれぞれの障害要因により適した処理を簡単に実現す
ることが可能になる効果がある。
【0055】請求項4の発明によれば、1つの装置に複
数の障害が発生した場合に、あらかじめ定められたウェ
イト時間に従って、一定の時差を設けて障害情報を送信
するように構成したので、短時間の間に複数の障害が発
生した場合においても、ネットワークの負荷上昇を伴う
ことなく障害管理を行うことが可能になる効果がある。
【0056】請求項5の発明によれば、短時間の間に複
数の装置で障害が発生した場合に、それらの装置間であ
らかじめ定められたウェイト時間に従って、一定の時差
を設けて障害情報を送信するように構成したので、装置
で同時に複数の障害が発生した場合においても、ネット
ワークの負荷上昇を伴うことなく障害管理を行うことが
可能になる効果がある。
【図面の簡単な説明】
【図1】 この発明の実施例1による障害管理方法が適
用されたシステムの装置構成および情報の流れを示す構
成図である。
【図2】 上記実施例における中央処理装置22が保持
する障害通知先格納テーブルを示す説明図である。
【図3】 上記実施例における中央処理装置21が保持
する障害通知先格納テーブルを示す説明図である。
【図4】 上記実施例における端末装置側の障害検出・
管理タスクの内部処理を示すフローチャートである。
【図5】 上記実施例における中央処理装置側の障害検
出・管理タスクの内部処理を示すフローチャートであ
る。
【図6】 この発明の実施例2による障害管理方法にて
使用される定義テーブルを示す説明図である。
【図7】 上記実施例における障害検出・管理タスクの
内部動作を示すフローチャートである。
【図8】 この発明の実施例3による障害管理方法にて
使用される定義テーブルを示す説明図である。
【図9】 上記実施例における障害検出・管理タスクの
内部動作を示すフローチャートである。
【図10】 この発明の実施例4による障害管理方法が
適用されたシステムにおける障害検出・管理タスクの内
部動作を示すフローチャートである。
【図11】 この発明の実施例5による障害管理方法が
適用されたシステムの装置構成および情報の流れを示す
構成図である。
【図12】 上記実施例において使用される定義テーブ
ルを示す説明図である。
【図13】 上記実施例における障害検出・管理タスク
の内部動作を示すフローチャートである。
【図14】 従来の障害管理方法が適用されたシステム
の装置構成および情報の流れを示す構成図である。
【符号の説明】
1a〜1c LAN(ネットワーク)、21,22 中
央処理装置(いくつかのネットワークにまたがって接続
されている装置)、23〜26 端末装置(ネットワー
クのそれぞれに接続されている装置)、51,61 障
害情報通知先、72 障害レベル、73,82 障害内
容、83〜88 処理ビットパターン。
フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 H04L 12/28 9466−5K H04L 11/08 12/24 12/26

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 独立した複数のネットワークと、前記ネ
    ットワークのそれぞれに接続されている装置と、いくつ
    かの前記ネットワークにまたがって接続されている装置
    とで構成されているシステムの、前記各装置において発
    生した障害の管理を行う障害管理方法において、前記障
    害を通知する障害情報を転送するための障害情報通知先
    を、前記各装置毎にあらかじめ定めておき、ある1つの
    前記装置上で障害が発生した場合に、当該装置は前記障
    害情報通知先に基づいてその障害情報を前記いくつかの
    ネットワークにまたがって接続されている装置に対して
    送信し、当該いくつかのネットワークにまたがって接続
    されている装置は、前記障害情報通知先に基づいてその
    障害情報を他のネットワークにつながっている装置に対
    して送信することを特徴とする障害管理方法。
  2. 【請求項2】 障害を複数の障害レベルにあらかじめ分
    類および定義しておき、ある1つの前記装置上で障害が
    発生した場合に、その障害内容に基づいて前記障害レベ
    ルのどれに該当するかを識別し、当該障害レベルに沿っ
    た処理を行うことを特徴とする請求項1に記載の障害管
    理方法。
  3. 【請求項3】 障害毎に発生後の処理に関する項目を処
    理ビットパターンとしてあらかじめ定義しておき、ある
    1つの前記装置上で障害が発生した場合に、その障害内
    容に対応した前記処理ビットパターンに沿って処理を行
    うことを特徴とする請求項1に記載の障害管理方法。
  4. 【請求項4】 1つの障害情報を送信してから次の障害
    情報を送信するまでのウェイト時間をあらかじめ定めて
    おき、ある1つの前記装置上で複数の障害が発生した場
    合に、前記ウェイト時間に従って一定の時差を設けて障
    害情報の送信を行うことを特徴とする請求項1に記載の
    障害管理方法。
  5. 【請求項5】 前記各装置毎にそれぞれ異なった値の、
    障害発生からその障害情報の送信までのウェイト時間を
    あらかじめ定めておき、短時間の間に複数の前記装置に
    おいて障害が発生した場合に、各装置は定められた前記
    ウェイト時間に従って装置間で時差を設けて障害情報の
    送信を行うことを特徴とする請求項1に記載の障害管理
    方法。
JP7130625A 1995-05-29 1995-05-29 障害管理方法 Pending JPH08328979A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7130625A JPH08328979A (ja) 1995-05-29 1995-05-29 障害管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7130625A JPH08328979A (ja) 1995-05-29 1995-05-29 障害管理方法

Publications (1)

Publication Number Publication Date
JPH08328979A true JPH08328979A (ja) 1996-12-13

Family

ID=15038722

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7130625A Pending JPH08328979A (ja) 1995-05-29 1995-05-29 障害管理方法

Country Status (1)

Country Link
JP (1) JPH08328979A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10247926A (ja) * 1997-03-03 1998-09-14 Victor Co Of Japan Ltd Lan通信装置
JP2000040045A (ja) * 1998-07-24 2000-02-08 Mitsubishi Electric Corp 監視システム
JP2000209201A (ja) * 1999-01-11 2000-07-28 Fujitsu Ltd ネットワ―ク管理方法及びネットワ―ク管理システム
JP2001209561A (ja) * 2000-01-27 2001-08-03 Mitsubishi Electric Corp 異常処理方式及び異常処理方法
GB2372857B (en) * 2001-03-01 2005-08-03 Hewlett Packard Co Launch service or purchase request directly from a network-enabled appliance
JP2007164284A (ja) * 2005-12-09 2007-06-28 Mitsubishi Electric Corp 情報管理装置
US8032796B2 (en) 2008-06-09 2011-10-04 Fujitsu Limited Monitoring apparatus and method of monitoring by a carrier
WO2023021642A1 (ja) * 2021-08-19 2023-02-23 楽天モバイル株式会社 ネットワーク管理装置、ネットワーク管理方法およびネットワーク管理システム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10247926A (ja) * 1997-03-03 1998-09-14 Victor Co Of Japan Ltd Lan通信装置
JP2000040045A (ja) * 1998-07-24 2000-02-08 Mitsubishi Electric Corp 監視システム
JP2000209201A (ja) * 1999-01-11 2000-07-28 Fujitsu Ltd ネットワ―ク管理方法及びネットワ―ク管理システム
US6970919B1 (en) 1999-01-11 2005-11-29 Fujitsu Limited Method and system for network management
JP2001209561A (ja) * 2000-01-27 2001-08-03 Mitsubishi Electric Corp 異常処理方式及び異常処理方法
US6862688B2 (en) 2000-01-27 2005-03-01 Mitsubishi Denki Kabushiki Kaisha Fault handling system and fault handling method
GB2372857B (en) * 2001-03-01 2005-08-03 Hewlett Packard Co Launch service or purchase request directly from a network-enabled appliance
JP2007164284A (ja) * 2005-12-09 2007-06-28 Mitsubishi Electric Corp 情報管理装置
US8032796B2 (en) 2008-06-09 2011-10-04 Fujitsu Limited Monitoring apparatus and method of monitoring by a carrier
WO2023021642A1 (ja) * 2021-08-19 2023-02-23 楽天モバイル株式会社 ネットワーク管理装置、ネットワーク管理方法およびネットワーク管理システム

Similar Documents

Publication Publication Date Title
US7827446B2 (en) Failure recovery system and server
CA2130411C (en) Method and system for high availability document image and coded data processing
KR0136501B1 (ko) 신호중계교환기 운용관리시스템의 제어방법
JPH0668041A (ja) コンピュータ・システム
JPH0612288A (ja) 情報処理システム及びその監視方法
JPH08328979A (ja) 障害管理方法
JP3203016B2 (ja) 二重化部スタンバイ系からの一重化部に対するアクセス方式
US5583986A (en) Apparatus for and method of duplex operation and management for signalling message exchange no. 1 system
JP3449425B2 (ja) コンピュータネットワーク監視支援システム
JPH11175141A (ja) 警報装置およびハードコピー出力制御システム
JP2000076215A (ja) ネットワークシステムおよびサーバの状態情報取得方法
JPH0720121B2 (ja) リング網での障害箇所の検出方法
JPS6143354A (ja) ロギング処理方式
JPH05260132A (ja) Osiネットワーク管理方式
JP3209582B2 (ja) 二重化構成データ処理システム
KR950035202A (ko) 지능망 서비스 데이타의 지역 이중화된 지능망 서비스 제어용 트랜잭션 처리 시스팀 및 지역이중화 관리를 위한 계층 제어 방법
JPH03169128A (ja) 障害出力方式
JPH07191920A (ja) コンピュータネットワーク
JPH11122270A (ja) 遠方監視制御装置
JPH0877120A (ja) サービス障害復旧方法
JPH06164715A (ja) 通信ネットワーク管理装置
JPH06282454A (ja) 自動故障診断方式
JPH06214829A (ja) 遠隔保守方法および装置
JPH0369228A (ja) 障害判定装置
JPH08339202A (ja) 誤制御防止方法およびプラント監視制御システム