JPH09307635A - 最適診断開始時期決定方法 - Google Patents
最適診断開始時期決定方法Info
- Publication number
- JPH09307635A JPH09307635A JP8116577A JP11657796A JPH09307635A JP H09307635 A JPH09307635 A JP H09307635A JP 8116577 A JP8116577 A JP 8116577A JP 11657796 A JP11657796 A JP 11657796A JP H09307635 A JPH09307635 A JP H09307635A
- Authority
- JP
- Japan
- Prior art keywords
- time
- monitoring
- failure
- failure information
- diagnosis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Monitoring And Testing Of Exchanges (AREA)
Abstract
(57)【要約】
【課題】 通信システムにおける障害発生時の診断開始
時期の決定方法に関し、発生した障害の内容に応じて最
適な診断開始時期を決定する方法を提供することを目的
とする。 【解決手段】 通信システム内において発生する可能性
がある障害情報ごとに障害情報が発生してから診断を開
始するまでの監視時間を指定した監視時間指定手段を備
え、通信システムを構成する装置より障害の発生を通知
する最初の障害情報を受信したときに、監視時間指定手
段よりその障害情報に指定されている監視時間を受信し
てその監視時間が経過するまでの間に発生した他の障害
情報を保存し、監視時間が経過したときに最初の障害情
報と監視時間中に受信した他の障害情報を用いて障害箇
所を特定する診断処理を開始するように構成する。
時期の決定方法に関し、発生した障害の内容に応じて最
適な診断開始時期を決定する方法を提供することを目的
とする。 【解決手段】 通信システム内において発生する可能性
がある障害情報ごとに障害情報が発生してから診断を開
始するまでの監視時間を指定した監視時間指定手段を備
え、通信システムを構成する装置より障害の発生を通知
する最初の障害情報を受信したときに、監視時間指定手
段よりその障害情報に指定されている監視時間を受信し
てその監視時間が経過するまでの間に発生した他の障害
情報を保存し、監視時間が経過したときに最初の障害情
報と監視時間中に受信した他の障害情報を用いて障害箇
所を特定する診断処理を開始するように構成する。
Description
【0001】
【発明の属する技術分野】本発明は通信システムにおけ
る障害発生時の診断開始時期の決定方法に関する。
る障害発生時の診断開始時期の決定方法に関する。
【0002】交換機などの通信システムは障害発生時に
通信に支障が生じないよう主要な装置を二重化してシス
テムを構成するのが一般的である。このような二重化シ
ステムにおいては、運用中の装置に障害が発生すると障
害が発生した装置を予備の装置と切り替えたのち、障害
が発生した装置について自動診断機能を用いて診断する
ように構成されているものが多い。
通信に支障が生じないよう主要な装置を二重化してシス
テムを構成するのが一般的である。このような二重化シ
ステムにおいては、運用中の装置に障害が発生すると障
害が発生した装置を予備の装置と切り替えたのち、障害
が発生した装置について自動診断機能を用いて診断する
ように構成されているものが多い。
【0003】ところが、真の障害原因が障害情報を送出
した装置にあるとは限らないため、障害情報が1件発生
したときに、障害情報を送出してきた装置を直ちに診断
しても異常が発見できない場合も多い。このため、交換
機などに備えられる自動診断処理機能は、最初の障害情
報が発生してから一定時間障害発生状況を監視し、その
間に収集された障害情報をもとに障害装置を特定した
り、診断対象装置を決定して自動診断を開始するように
作られているのが普通である。
した装置にあるとは限らないため、障害情報が1件発生
したときに、障害情報を送出してきた装置を直ちに診断
しても異常が発見できない場合も多い。このため、交換
機などに備えられる自動診断処理機能は、最初の障害情
報が発生してから一定時間障害発生状況を監視し、その
間に収集された障害情報をもとに障害装置を特定した
り、診断対象装置を決定して自動診断を開始するように
作られているのが普通である。
【0004】このような方法は障害箇所を特定する精度
が低い診断を行わずに、障害箇所を特定できる確率(的
中率)が高い診断を行うことになるので診断の効率は良
いが、診断の開始時期が遅れるために、障害回復が遅く
なったり、信頼性の低い片系での運転時間を長引かせる
という欠点を有している。このため、診断の効率を低下
させずにシステムの信頼性を高めることができる診断開
始時期の決定方法が必要となっている。
が低い診断を行わずに、障害箇所を特定できる確率(的
中率)が高い診断を行うことになるので診断の効率は良
いが、診断の開始時期が遅れるために、障害回復が遅く
なったり、信頼性の低い片系での運転時間を長引かせる
という欠点を有している。このため、診断の効率を低下
させずにシステムの信頼性を高めることができる診断開
始時期の決定方法が必要となっている。
【0005】
【従来の技術】図9及び図10は診断対象となる交換機の
構成と実装をそれぞれモデル的に図示したものである。
また、図11は従来技術の自動診断処理機能の構成図、図
12は従来技術の自動診断機能の処理フロー図である。以
下、図9及び図10の構成と実装形態をもつ交換機を例に
従来技術における自動診断機能について説明する。
構成と実装をそれぞれモデル的に図示したものである。
また、図11は従来技術の自動診断処理機能の構成図、図
12は従来技術の自動診断機能の処理フロー図である。以
下、図9及び図10の構成と実装形態をもつ交換機を例に
従来技術における自動診断機能について説明する。
【0006】図9の交換機は二重化構成されている交換
機の片系のみを図示している。交換機は中央制御装置
(以下、CCと記す)51、主記憶装置(以下、MMと記
す)52、端末制御装置(以下、TCと記す)53及び保守
用端末(WT)54などからなる制御系装置50と、スイッ
チ61、装置62及びそれぞれ伝送路に接続される複数の回
線装置63からなる通話路系装置60からなる。ここで、回
線装置63の一部は装置62のひとつ(以下、装置M1 と記
す)の下位に接続され、残りの回線装置63はもうひとつ
の装置62(以下、装置M2 と記す)の下位に接続されて
いるものとする。以下、装置M1 の下位に接続されてい
る個々の回線装置63を装置L11〜L1m、装置M2 の下位
に接続されている個々の回線装置63を装置L21〜L1nと
記す。
機の片系のみを図示している。交換機は中央制御装置
(以下、CCと記す)51、主記憶装置(以下、MMと記
す)52、端末制御装置(以下、TCと記す)53及び保守
用端末(WT)54などからなる制御系装置50と、スイッ
チ61、装置62及びそれぞれ伝送路に接続される複数の回
線装置63からなる通話路系装置60からなる。ここで、回
線装置63の一部は装置62のひとつ(以下、装置M1 と記
す)の下位に接続され、残りの回線装置63はもうひとつ
の装置62(以下、装置M2 と記す)の下位に接続されて
いるものとする。以下、装置M1 の下位に接続されてい
る個々の回線装置63を装置L11〜L1m、装置M2 の下位
に接続されている個々の回線装置63を装置L21〜L1nと
記す。
【0007】図9に図示された各装置はプリント配線基
盤上に回路が構成されるパッケージ形態になっている
が、これらのパッケージはフレーム(架)に作られた複
数段のシェルフに挿入される。図10はそのようなパッケ
ージ形式の装置が実装された状態を図示しているが、図
10では2つのフレーム70(各々をフレーム#0,フレー
ム#1と記す)に各4段のシェルフ71(各シェルフをシ
ェルフ#0〜シェルフ#3と記す)が設けられ、各シェ
ルフにパッケージ72(各パッケージをパッケージP#
0,パッケージP#1,・・と記す)が実装された状態
を示している。
盤上に回路が構成されるパッケージ形態になっている
が、これらのパッケージはフレーム(架)に作られた複
数段のシェルフに挿入される。図10はそのようなパッケ
ージ形式の装置が実装された状態を図示しているが、図
10では2つのフレーム70(各々をフレーム#0,フレー
ム#1と記す)に各4段のシェルフ71(各シェルフをシ
ェルフ#0〜シェルフ#3と記す)が設けられ、各シェ
ルフにパッケージ72(各パッケージをパッケージP#
0,パッケージP#1,・・と記す)が実装された状態
を示している。
【0008】いま、図9において装置A1 内のXと記し
た箇所に障害が発生したとする。Xの部分は装置L11〜
L1mとの接続箇所であるが、この部分が例えばコネクタ
のような部分であると装置M1 に異常が発生したという
障害情報が発せられないことがある。例えば接続処理過
程において装置M1 及び装置L11を介して伝送路に接続
が行われた場合、Xの箇所に不良部分があると装置L11
が所定の動作をしないために装置L11が異常という障害
情報がCC51に伝えられる可能性が高い。
た箇所に障害が発生したとする。Xの部分は装置L11〜
L1mとの接続箇所であるが、この部分が例えばコネクタ
のような部分であると装置M1 に異常が発生したという
障害情報が発せられないことがある。例えば接続処理過
程において装置M1 及び装置L11を介して伝送路に接続
が行われた場合、Xの箇所に不良部分があると装置L11
が所定の動作をしないために装置L11が異常という障害
情報がCC51に伝えられる可能性が高い。
【0009】CC51はこの障害情報を受けて直ちに装置
L11の診断を開始したとする。この場合、確かに装置L
11により伝送路に接続を行うことができないので、診断
結果として装置L11が異常であるという判定がなされる
可能性が高い。しかし、この判定結果により保守者が装
置L11のパッケージを交換しても障害が回復しないこと
は明らかである。障害が装置M1 と装置L11〜L1mを接
続する配線部分(図9のYの部分など)に発生したとき
も同様な結果となる可能性が大きい。従って、診断の際
にはこのように障害箇所の的中率が低い診断、即ち、効
率が悪い診断を行わないようにすることが重要である。
L11の診断を開始したとする。この場合、確かに装置L
11により伝送路に接続を行うことができないので、診断
結果として装置L11が異常であるという判定がなされる
可能性が高い。しかし、この判定結果により保守者が装
置L11のパッケージを交換しても障害が回復しないこと
は明らかである。障害が装置M1 と装置L11〜L1mを接
続する配線部分(図9のYの部分など)に発生したとき
も同様な結果となる可能性が大きい。従って、診断の際
にはこのように障害箇所の的中率が低い診断、即ち、効
率が悪い診断を行わないようにすることが重要である。
【0010】従来技術の診断機能はこの点に留意して作
られているが、最初に従来技術の診断機能の構成につい
て図11を主体に、図9及び図10を併用して説明する。図
11の装置81は図9の制御系及び通話路系を構成する各種
の装置に相当するもので、装置A〜装置Zは種類の異な
る装置を各1個づつ記したものである(以下、個々の装
置81を装置A〜装置Zと記す)。
られているが、最初に従来技術の診断機能の構成につい
て図11を主体に、図9及び図10を併用して説明する。図
11の装置81は図9の制御系及び通話路系を構成する各種
の装置に相当するもので、装置A〜装置Zは種類の異な
る装置を各1個づつ記したものである(以下、個々の装
置81を装置A〜装置Zと記す)。
【0011】障害情報受信処理部82は例えば図9のCC
51内に置かれ、装置A〜装置Zから障害情報が送られた
ときに障害情報の受付けと処理を行う部分である。例え
ば、装置Aのひとつが障害情報を送出してきた場合はそ
の装置Aを非運用状態にし、装置Aが二重化された装置
であれば予備系の装置Aと切り替える。なお、装置の障
害情報は必ずしもその装置から送出されるとは限らず、
例えば装置Aの障害情報にはCC51自身または他の装置
が処理中に装置Aの異常を検出した場合の障害情報も含
まれる。
51内に置かれ、装置A〜装置Zから障害情報が送られた
ときに障害情報の受付けと処理を行う部分である。例え
ば、装置Aのひとつが障害情報を送出してきた場合はそ
の装置Aを非運用状態にし、装置Aが二重化された装置
であれば予備系の装置Aと切り替える。なお、装置の障
害情報は必ずしもその装置から送出されるとは限らず、
例えば装置Aの障害情報にはCC51自身または他の装置
が処理中に装置Aの異常を検出した場合の障害情報も含
まれる。
【0012】図11の90は障害箇所を特定する診断処理を
行う診断処理部で、自動診断受付処理部91、診断実行ス
ケジューリング処理部92、障害箇所特定処理部93と、装
置別の診断を実行する装置A診断実行部94a 〜装置Z診
断実行部94z から成る。診断処理部90は物理的には図9
のCC51とMM52または図示省略されたディスク装置な
どに収容され、CC51によって実行されるが、収容場所
は直接関係がないので詳細説明は省略する。
行う診断処理部で、自動診断受付処理部91、診断実行ス
ケジューリング処理部92、障害箇所特定処理部93と、装
置別の診断を実行する装置A診断実行部94a 〜装置Z診
断実行部94z から成る。診断処理部90は物理的には図9
のCC51とMM52または図示省略されたディスク装置な
どに収容され、CC51によって実行されるが、収容場所
は直接関係がないので詳細説明は省略する。
【0013】いま、或る装置の異常が検出されたとす
る。障害情報は異常を検出した装置内に一時蓄積された
のち障害情報受信処理部82に送られ、前述のような障害
処理が行われる一方、障害情報はその装置より直接また
は障害情報受信処理部82を経て自動診断受付処理部91に
送られ、自動診断受付処理部91の内部または図9のMM
32内などに記憶される。自動診断受付処理部91は障害情
報を受信しても直ちに診断実行スケジューリング処理部
92を起動せず、一定時間(例えば1分間)他の障害の発
生状況を監視する。これは図9により説明したように、
例えば装置Aを図9の装置L11とした場合に直ちに装置
L11の診断を行っても障害箇所の的中率が高くならない
可能性があるためである。
る。障害情報は異常を検出した装置内に一時蓄積された
のち障害情報受信処理部82に送られ、前述のような障害
処理が行われる一方、障害情報はその装置より直接また
は障害情報受信処理部82を経て自動診断受付処理部91に
送られ、自動診断受付処理部91の内部または図9のMM
32内などに記憶される。自動診断受付処理部91は障害情
報を受信しても直ちに診断実行スケジューリング処理部
92を起動せず、一定時間(例えば1分間)他の障害の発
生状況を監視する。これは図9により説明したように、
例えば装置Aを図9の装置L11とした場合に直ちに装置
L11の診断を行っても障害箇所の的中率が高くならない
可能性があるためである。
【0014】一定時間を経過すると自動診断受付処理部
91は受信した障害情報を診断実行スケジューリング処理
部92に送る。診断実行スケジューリング処理部92はこれ
らの障害情報を障害箇所特定処理部93に送り、障害箇所
を特定する処理を行わせる。障害箇所特定処理部93はこ
のような障害情報を解析し、障害箇所が特定できた場合
は被疑装置の実装情報(後述)を出力する。障害箇所を
特定できなかった場合は、障害箇所特定処理部93は障害
が存在する可能性が高い装置の情報を診断実行スケジュ
ーリング処理部92に送る。障害が存在する可能性がある
装置が複数ある場合には診断実行スケジューリング処理
部92は重要な装置から診断を実行するようスケジューリ
ングを行う。例えば、装置Aと装置Bについて診断が必
要な場合に装置Bの重要度が高ければ、装置B診断実行
部94b を起動して装置Bの診断を実行させ、その後に装
置A診断実行部94a を起動して装置Aの診断を実行させ
る。装置A診断実行部94a 及び装置B診断実行部94a は
障害箇所が特定できた場合は特定した装置の実装情報を
出力する。
91は受信した障害情報を診断実行スケジューリング処理
部92に送る。診断実行スケジューリング処理部92はこれ
らの障害情報を障害箇所特定処理部93に送り、障害箇所
を特定する処理を行わせる。障害箇所特定処理部93はこ
のような障害情報を解析し、障害箇所が特定できた場合
は被疑装置の実装情報(後述)を出力する。障害箇所を
特定できなかった場合は、障害箇所特定処理部93は障害
が存在する可能性が高い装置の情報を診断実行スケジュ
ーリング処理部92に送る。障害が存在する可能性がある
装置が複数ある場合には診断実行スケジューリング処理
部92は重要な装置から診断を実行するようスケジューリ
ングを行う。例えば、装置Aと装置Bについて診断が必
要な場合に装置Bの重要度が高ければ、装置B診断実行
部94b を起動して装置Bの診断を実行させ、その後に装
置A診断実行部94a を起動して装置Aの診断を実行させ
る。装置A診断実行部94a 及び装置B診断実行部94a は
障害箇所が特定できた場合は特定した装置の実装情報を
出力する。
【0015】次に、図12と図11を併用して従来技術の診
断処理フローについて説明する。図12は図11の診断機能
部90において行われる診断処理の処理フロー図を図示し
たものであるが、図11による説明と重複する部分は簡単
に説明する。なお、以下の括弧内に示すS51〜S61は図
11中の各ステップに付された符号である。
断処理フローについて説明する。図12は図11の診断機能
部90において行われる診断処理の処理フロー図を図示し
たものであるが、図11による説明と重複する部分は簡単
に説明する。なお、以下の括弧内に示すS51〜S61は図
11中の各ステップに付された符号である。
【0016】図12に示す最初の障害情報(1) が発生する
と、図11の障害処理部82による障害情報の受付処理が行
われたのち(図12では図示省略)、障害情報(1) は図11
の自動診断受付処理部91に送られる(図12のS101 参
照)。図11の自動診断受付処理部91はこの障害情報を受
信してから一定時間(例えば1分間)障害発生状況の監
視を行う(S102 )。この一定時間内に図12に示す障害
情報(2) 〜障害情報(n)が発生したものとすると、これ
らも自動診断受付処理部91に受付けられる。
と、図11の障害処理部82による障害情報の受付処理が行
われたのち(図12では図示省略)、障害情報(1) は図11
の自動診断受付処理部91に送られる(図12のS101 参
照)。図11の自動診断受付処理部91はこの障害情報を受
信してから一定時間(例えば1分間)障害発生状況の監
視を行う(S102 )。この一定時間内に図12に示す障害
情報(2) 〜障害情報(n)が発生したものとすると、これ
らも自動診断受付処理部91に受付けられる。
【0017】一定時間が経過すると自動診断受付処理部
91はその間に受信した障害情報(1)〜障害情報(n) の障
害情報を診断実行管理スケジューリング処理部92に送
り、診断実行管理スケジューリング処理部92は障害箇所
特定処理部93と共同動作を行って障害箇所を特定する処
理を行う(S103 →S104 )。この処理は一定時間内に
受信した障害情報を用いて障害箇所を特定する解析を行
うもので、1次解析処理と呼ぶ。1次解析処理によって
障害箇所が特定できた場合には保守端末などにその装置
の実装情報などを出力する(S105 →S106 )。
91はその間に受信した障害情報(1)〜障害情報(n) の障
害情報を診断実行管理スケジューリング処理部92に送
り、診断実行管理スケジューリング処理部92は障害箇所
特定処理部93と共同動作を行って障害箇所を特定する処
理を行う(S103 →S104 )。この処理は一定時間内に
受信した障害情報を用いて障害箇所を特定する解析を行
うもので、1次解析処理と呼ぶ。1次解析処理によって
障害箇所が特定できた場合には保守端末などにその装置
の実装情報などを出力する(S105 →S106 )。
【0018】1次解析処理で障害箇所が特定できなかっ
た場合、診断実行管理スケジューリング処理部92は障害
原因が存在する可能性がある装置を装置の重要度が高い
装置から診断を実行するスケジューリングを行い、図11
に示す装置A診断実行部94a〜装置Z診断実行部94z の
中の該当診断実行部を用いて順次被疑装置の診断を実行
する(S107 )。この診断を実行する処理を2次解析処
理と呼ぶ。2次解析処理によって障害箇所が特定できた
場合にはその装置の実装情報を出力する(S108 →S10
9 )。
た場合、診断実行管理スケジューリング処理部92は障害
原因が存在する可能性がある装置を装置の重要度が高い
装置から診断を実行するスケジューリングを行い、図11
に示す装置A診断実行部94a〜装置Z診断実行部94z の
中の該当診断実行部を用いて順次被疑装置の診断を実行
する(S107 )。この診断を実行する処理を2次解析処
理と呼ぶ。2次解析処理によって障害箇所が特定できた
場合にはその装置の実装情報を出力する(S108 →S10
9 )。
【0019】2次解析処理によっても障害箇所が特定で
きなかった場合は、障害箇所は診断によって発見できる
範囲にはない(診断対象範囲外)と判断し、障害箇所が
存在する可能性がある装置の範囲(以下、被疑範囲と記
す)のみを特定してその範囲にある装置の実装情報を出
力する(S110 →S111 )。この被疑範囲を特定する処
理を3次解析処理と呼ぶ。
きなかった場合は、障害箇所は診断によって発見できる
範囲にはない(診断対象範囲外)と判断し、障害箇所が
存在する可能性がある装置の範囲(以下、被疑範囲と記
す)のみを特定してその範囲にある装置の実装情報を出
力する(S110 →S111 )。この被疑範囲を特定する処
理を3次解析処理と呼ぶ。
【0020】上記のように診断処理部90は障害箇所を特
定したり被疑範囲を示す処理を行うが、障害箇所を特定
する具体的な例を図9のXまたはYの部分に障害原因が
ある場合を例に説明する。この例では先ず、装置L11の
異常を知らせる障害情報が先ず図11の自動診断受付処理
部82に受付けられる(図12のS101 )。自動診断受付処
理部91は最初の障害情報の受信から一定時間の間、障害
情報の受付けを続けるが、この例では装置L11からの障
害情報に続いて図9の装置L12〜装置L1mのいくつかか
らも障害情報が送られてくる可能性が大きい。一定時間
を経過するとその間に受信した障害情報が自動診断受付
処理部91より診断実行管理スケジューリング処理部92に
送られるが、それらの障害情報が例えば装置L11〜装置
L1mの中の多くの装置から障害情報が発生し、装置L21
〜装置L2nからは障害情報が全く発生していない、とい
うような状況を示していれば、障害箇所特定処理部93に
おける1次解析によって障害箇所が装置M1 と特定され
る可能性が大きい。この例のような場合には、最初に発
生した障害情報のみによって障害解析を行ってもこのよ
うに明確に障害箇所を特定することは困難である。即
ち、前記の一定時間は一つの障害箇所を原因として発生
する複数の障害情報がほぼ出尽くしてから(障害情報の
発生が安定化してから)診断を開始するようにするため
に設けられた時間であり、安定監視時間とも呼ばれる。
定したり被疑範囲を示す処理を行うが、障害箇所を特定
する具体的な例を図9のXまたはYの部分に障害原因が
ある場合を例に説明する。この例では先ず、装置L11の
異常を知らせる障害情報が先ず図11の自動診断受付処理
部82に受付けられる(図12のS101 )。自動診断受付処
理部91は最初の障害情報の受信から一定時間の間、障害
情報の受付けを続けるが、この例では装置L11からの障
害情報に続いて図9の装置L12〜装置L1mのいくつかか
らも障害情報が送られてくる可能性が大きい。一定時間
を経過するとその間に受信した障害情報が自動診断受付
処理部91より診断実行管理スケジューリング処理部92に
送られるが、それらの障害情報が例えば装置L11〜装置
L1mの中の多くの装置から障害情報が発生し、装置L21
〜装置L2nからは障害情報が全く発生していない、とい
うような状況を示していれば、障害箇所特定処理部93に
おける1次解析によって障害箇所が装置M1 と特定され
る可能性が大きい。この例のような場合には、最初に発
生した障害情報のみによって障害解析を行ってもこのよ
うに明確に障害箇所を特定することは困難である。即
ち、前記の一定時間は一つの障害箇所を原因として発生
する複数の障害情報がほぼ出尽くしてから(障害情報の
発生が安定化してから)診断を開始するようにするため
に設けられた時間であり、安定監視時間とも呼ばれる。
【0021】障害箇所特定処理部93は障害装置を特定す
るとその装置の実装情報(フレーム番号、シェルフ番
号、パッケージ番号)を保守端末(例えば図9の保守端
末54)などに出力する(図12のS104 〜S106 )。前記
装置Mの実装場所が図10のフレーム#0、シェルフ#2
のパッケージP#2であると出力されれば、保守者はそ
の実装位置に装着されているパッケージ(図10に斜線の
網目が付されたパッケージ)を新しいパッケージと交換
し、動作試験を行う。
るとその装置の実装情報(フレーム番号、シェルフ番
号、パッケージ番号)を保守端末(例えば図9の保守端
末54)などに出力する(図12のS104 〜S106 )。前記
装置Mの実装場所が図10のフレーム#0、シェルフ#2
のパッケージP#2であると出力されれば、保守者はそ
の実装位置に装着されているパッケージ(図10に斜線の
網目が付されたパッケージ)を新しいパッケージと交換
し、動作試験を行う。
【0022】一定時間内に発生した障害情報が上記のよ
うに明確でなく、障害箇所が特定できなかった場合には
障害情報の中で異常が発生したとされた装置について診
断を実行する(図12のS105 →S107)が、その際複数の
装置の試験が必要であれば、重要度の高い装置(例えば
図9のCC51など)から診断を行う。
うに明確でなく、障害箇所が特定できなかった場合には
障害情報の中で異常が発生したとされた装置について診
断を実行する(図12のS105 →S107)が、その際複数の
装置の試験が必要であれば、重要度の高い装置(例えば
図9のCC51など)から診断を行う。
【0023】上記の診断、即ち、2次解析処理によって
も障害箇所が特定できなかった場合は、障害が存在する
可能性のある装置を被疑範囲とする。上記の例では、例
えば障害情報を送出した複数の装置(装置L11〜装置L
1mの中のいくつかを含む)と装置M1 を被疑範囲として
それらの装置の実装情報を出力する。被疑範囲の装置の
実装位置が例えば図10のフレーム#0、シェルフ#2の
パッケージP#4〜P#7と指定された場合は、保守者
は指定された範囲のパッケージ(図10に点による網目が
付されたパッケージ)を順次新しいパッケージと交換
し、障害が回復したか否かを確認する。
も障害箇所が特定できなかった場合は、障害が存在する
可能性のある装置を被疑範囲とする。上記の例では、例
えば障害情報を送出した複数の装置(装置L11〜装置L
1mの中のいくつかを含む)と装置M1 を被疑範囲として
それらの装置の実装情報を出力する。被疑範囲の装置の
実装位置が例えば図10のフレーム#0、シェルフ#2の
パッケージP#4〜P#7と指定された場合は、保守者
は指定された範囲のパッケージ(図10に点による網目が
付されたパッケージ)を順次新しいパッケージと交換
し、障害が回復したか否かを確認する。
【0024】
【発明が解決しようとする課題】以上のように、従来技
術では最初に発生した障害情報のみを用いて診断を開始
せずに、一定時間障害情報の発生状況を監視し、その間
に発生したすべての障害情報を用いて障害箇所を特定す
るようにしているため、障害解析や診断の効率がよく、
障害箇所の的中率が高くなっている。しかし、一定時間
としてどのような障害が発生しても障害発生状況がほぼ
安定する比較的長い時間を設定し、どのような種類の障
害が発生しても一律に一定時間の監視を行ってから診断
を開始することになるため、原因が比較的明確な障害が
発生したような場合には診断開始までに無駄な時間を費
やす結果となり、また、重要な装置に障害が発生した場
合などには、所定の時間内に障害を回復させることがで
きない事態が発生するという問題があった。また、二重
化システムでは障害発生後、予備装置に切替えた状態と
なるが、診断開始の遅れは片系での運転時間を長引かせ
ることになり、障害装置が重要装置であるような場合に
はシステムの信頼性を低下させるという欠点ともなって
いた。
術では最初に発生した障害情報のみを用いて診断を開始
せずに、一定時間障害情報の発生状況を監視し、その間
に発生したすべての障害情報を用いて障害箇所を特定す
るようにしているため、障害解析や診断の効率がよく、
障害箇所の的中率が高くなっている。しかし、一定時間
としてどのような障害が発生しても障害発生状況がほぼ
安定する比較的長い時間を設定し、どのような種類の障
害が発生しても一律に一定時間の監視を行ってから診断
を開始することになるため、原因が比較的明確な障害が
発生したような場合には診断開始までに無駄な時間を費
やす結果となり、また、重要な装置に障害が発生した場
合などには、所定の時間内に障害を回復させることがで
きない事態が発生するという問題があった。また、二重
化システムでは障害発生後、予備装置に切替えた状態と
なるが、診断開始の遅れは片系での運転時間を長引かせ
ることになり、障害装置が重要装置であるような場合に
はシステムの信頼性を低下させるという欠点ともなって
いた。
【0025】本発明は発生した障害の内容に応じて最適
な診断開始時期を決定する方法を提供することを目的と
する。
な診断開始時期を決定する方法を提供することを目的と
する。
【0026】
【課題を解決するための手段】図1乃至図3は本発明の
最適診断開始時期決定方法の原理説明図である。図中、
1は通信システム内において発生する可能性がある障害
情報ごとに各障害情報が発生してから診断を開始するま
でに必要な障害発生状況の監視時間を指定した監視時間
指定手段である。
最適診断開始時期決定方法の原理説明図である。図中、
1は通信システム内において発生する可能性がある障害
情報ごとに各障害情報が発生してから診断を開始するま
でに必要な障害発生状況の監視時間を指定した監視時間
指定手段である。
【0027】図1においては、通信システムを構成する
装置より障害の発生を通知する第1の障害情報を受信し
たときに(図1のステップS1参照)、監視時間指定手
段1を用いて第1の障害情報に対して指定された監視時
間を索引し(S2)、索引した監視時間を監視実行時間
として設定(S3) したのち、監視実行時間が経過する
までの間に発生した他の障害情報を受付けて保存する。
監視実行時間が経過すると、第1の障害情報と監視実行
時間中に受信した他の障害情報を用いて障害箇所を特定
する診断処理を開始する(S4→S5)。
装置より障害の発生を通知する第1の障害情報を受信し
たときに(図1のステップS1参照)、監視時間指定手
段1を用いて第1の障害情報に対して指定された監視時
間を索引し(S2)、索引した監視時間を監視実行時間
として設定(S3) したのち、監視実行時間が経過する
までの間に発生した他の障害情報を受付けて保存する。
監視実行時間が経過すると、第1の障害情報と監視実行
時間中に受信した他の障害情報を用いて障害箇所を特定
する診断処理を開始する(S4→S5)。
【0028】以上のように、図1の最適診断開始時期決
定方法では発生した障害の種類に応じて監視時間を変え
るので、診断を開始するまでに無駄な時間を費やすこと
がない。
定方法では発生した障害の種類に応じて監視時間を変え
るので、診断を開始するまでに無駄な時間を費やすこと
がない。
【0029】図2においては、監視実行時間の経過中に
新たな障害情報を受信したときは、監視時間指定手段1
を用いて新たな障害情報に対して指定されている監視時
間を索引し(図2のS11〜S12)、索引した新たな監視
時間をその時点で設定されている監視実行時間に加算し
て新たな監視実行時間として設定する(S13→S14→S
15) 。その際、新たな監視時間をその時点で設定されて
いる監視実行時間に加算して算出した監視実行時間が予
め定められた最大監視時間を超えたときは最大監視時間
を新たな監視実行時間として設定する(S14→S16)。
新たな障害情報を受信したときは、監視時間指定手段1
を用いて新たな障害情報に対して指定されている監視時
間を索引し(図2のS11〜S12)、索引した新たな監視
時間をその時点で設定されている監視実行時間に加算し
て新たな監視実行時間として設定する(S13→S14→S
15) 。その際、新たな監視時間をその時点で設定されて
いる監視実行時間に加算して算出した監視実行時間が予
め定められた最大監視時間を超えたときは最大監視時間
を新たな監視実行時間として設定する(S14→S16)。
【0030】以上のように、図2の最適診断開始時期決
定方法では最初の障害発生後の監視実行時間中に他の障
害が発生した場合に監視時間を延長するので、障害解析
に必要な障害情報を充分に収集することができ、診断の
効率を高めることができる。また、監視時間を延長した
場合も予め定めた最大監視時間以上に長くすることがな
いので、診断開始が一定時間以上遅れることがない。
定方法では最初の障害発生後の監視実行時間中に他の障
害が発生した場合に監視時間を延長するので、障害解析
に必要な障害情報を充分に収集することができ、診断の
効率を高めることができる。また、監視時間を延長した
場合も予め定めた最大監視時間以上に長くすることがな
いので、診断開始が一定時間以上遅れることがない。
【0031】図3においては、監視時間指定手段1内の
特定の障害情報に対して、指定した監視時間を監視実行
時間として固定的に設定することを指示する監視時間固
定指定情報を付与しておく。障害情報を受信し、監視時
間指定手段1を用いてその障害情報に対して指定されて
いる監視時間を索引したときにその障害情報に対して監
視時間固定指定情報が付与されていたとき、その時点で
監視実行時間が設定されていなければ索引した監視時間
を監視実行時間として固定的に設定する(図3のS21〜
S24→S25)。また、すでに監視実行時間が設定されて
いればその時点で設定されている監視実行時間を固定化
させる(S24→S26)。
特定の障害情報に対して、指定した監視時間を監視実行
時間として固定的に設定することを指示する監視時間固
定指定情報を付与しておく。障害情報を受信し、監視時
間指定手段1を用いてその障害情報に対して指定されて
いる監視時間を索引したときにその障害情報に対して監
視時間固定指定情報が付与されていたとき、その時点で
監視実行時間が設定されていなければ索引した監視時間
を監視実行時間として固定的に設定する(図3のS21〜
S24→S25)。また、すでに監視実行時間が設定されて
いればその時点で設定されている監視実行時間を固定化
させる(S24→S26)。
【0032】以上のように、図3の最適診断開始時期決
定方法では発生した障害の種類に応じて、監視時間を固
定化することができる。例えば、重要度の高い装置に障
害が発生した場合、その障害が最初の障害であればその
障害情報に対して監視時間指定手段1に指定されている
監視時間をそのまま監視実行時間として固定的に設定
し、監視実行時間中に他の障害が発生しても監視時間を
延長しないようにすることにより診断開始時期を遅らせ
ないようにすることができる。また、その障害よりも以
前に発生した障害によりすでに監視実行時間が設定され
ていたときは、その時点で設定されている監視実行時間
を固定化させるので、重要度の高い装置に発生した障害
に対しては徒に診断開始時間を遅らせることがない。
定方法では発生した障害の種類に応じて、監視時間を固
定化することができる。例えば、重要度の高い装置に障
害が発生した場合、その障害が最初の障害であればその
障害情報に対して監視時間指定手段1に指定されている
監視時間をそのまま監視実行時間として固定的に設定
し、監視実行時間中に他の障害が発生しても監視時間を
延長しないようにすることにより診断開始時期を遅らせ
ないようにすることができる。また、その障害よりも以
前に発生した障害によりすでに監視実行時間が設定され
ていたときは、その時点で設定されている監視実行時間
を固定化させるので、重要度の高い装置に発生した障害
に対しては徒に診断開始時間を遅らせることがない。
【0033】
【発明の実施の形態】図4乃至図6は本発明の最適診断
開始時期決定方法の実施例の処理フロー図、図7は本発
明を適用する交換システムのモデル構成図、図8は本発
明の実施例の監視時間指定テーブルの構成図である。
開始時期決定方法の実施例の処理フロー図、図7は本発
明を適用する交換システムのモデル構成図、図8は本発
明の実施例の監視時間指定テーブルの構成図である。
【0034】最初に本発明を適用する通信システムにつ
いて説明する。本発明を適用する通信システムは原則と
して主要装置が二重化されたシステムであるが、一例と
して図7に図示された交換システムの構成について説明
する。図7は制御系と通話路系の主要部分が二重化され
ている交換システムの構成を図示している。二重化部分
は0系と1系の2つの系からなり、一方の系(0系とす
る)が運用に供され、他方の系(1系とする)は待機中
(予備系)の状態であるとする。
いて説明する。本発明を適用する通信システムは原則と
して主要装置が二重化されたシステムであるが、一例と
して図7に図示された交換システムの構成について説明
する。図7は制御系と通話路系の主要部分が二重化され
ている交換システムの構成を図示している。二重化部分
は0系と1系の2つの系からなり、一方の系(0系とす
る)が運用に供され、他方の系(1系とする)は待機中
(予備系)の状態であるとする。
【0035】2つの制御系10-0, 10-1の内部は各々中央
制御装置11-0, 11-1(以下、各々をCC#0,CC#1
と記し、総称する場合にはCC11と記す。他の装置につ
いても同様とする)とその下部に接続された主記憶装置
(以下、MMと記す)12-0,12-1、ハードディスクユニ
ット(HDK)14-0, 14-1とその制御を行うコントロー
ラ(SCC)13-0, 13-1、保守用端末(図示省略)の制
御を行う端末制御装置15-0, 15-1(図にはイーサネット
コントローラETCの例を図示)などからなっており、
CC#0及びCC#1とMM#0及びMM#1の間は交
絡するケーブルで接続されている。また、各々2組のプ
ロセッサ・アクセス・コントローラ(PAC)16-00,16
-01 または16-10,16-11 を介して通話路系20と接続され
ている。
制御装置11-0, 11-1(以下、各々をCC#0,CC#1
と記し、総称する場合にはCC11と記す。他の装置につ
いても同様とする)とその下部に接続された主記憶装置
(以下、MMと記す)12-0,12-1、ハードディスクユニ
ット(HDK)14-0, 14-1とその制御を行うコントロー
ラ(SCC)13-0, 13-1、保守用端末(図示省略)の制
御を行う端末制御装置15-0, 15-1(図にはイーサネット
コントローラETCの例を図示)などからなっており、
CC#0及びCC#1とMM#0及びMM#1の間は交
絡するケーブルで接続されている。また、各々2組のプ
ロセッサ・アクセス・コントローラ(PAC)16-00,16
-01 または16-10,16-11 を介して通話路系20と接続され
ている。
【0036】通話路系20はスイッチ(SW)21-0,21-1
及び中速度回線インタフェース・シェルフ(MIF:Me
dium Speed Interface Shelf)22-0,22-1が二重化さ
れ、回線対応部23は二重化されていない構成となってい
るが、回線対応部23はMIF#0及びMIF#1の両方
に接続されている。
及び中速度回線インタフェース・シェルフ(MIF:Me
dium Speed Interface Shelf)22-0,22-1が二重化さ
れ、回線対応部23は二重化されていない構成となってい
るが、回線対応部23はMIF#0及びMIF#1の両方
に接続されている。
【0037】図7の交換システムに障害が発生したとき
の診断方法は、診断開始までの監視時間を決定する方法
を除き、図9乃至図12により説明した従来技術における
診断方法とほぼ同一であるので、簡単に説明する。図7
の交換システムにおいていずれかの装置に障害が発生す
ると、障害情報は運用中のCC#0に送られる。
の診断方法は、診断開始までの監視時間を決定する方法
を除き、図9乃至図12により説明した従来技術における
診断方法とほぼ同一であるので、簡単に説明する。図7
の交換システムにおいていずれかの装置に障害が発生す
ると、障害情報は運用中のCC#0に送られる。
【0038】CC#0は障害情報により異常が報告され
た装置を運用系から除き、二重化されている場合は予備
系の装置と切替える。例えば図7のSW#0に異常が発
生した場合にはSW#0を非運用状態としたのち予備系
となっていたSW#1と切替える。この場合、障害が発
生するまでは0系の制御系10-0の各装置(CC#0な
ど)とSW#0はPAC#00を介して制御情報を授受し
ていたが、スイッチ21の切替え後は制御系10-0の各装置
はPAC#01を介してSW#1と制御情報を授受するよ
うになる。
た装置を運用系から除き、二重化されている場合は予備
系の装置と切替える。例えば図7のSW#0に異常が発
生した場合にはSW#0を非運用状態としたのち予備系
となっていたSW#1と切替える。この場合、障害が発
生するまでは0系の制御系10-0の各装置(CC#0な
ど)とSW#0はPAC#00を介して制御情報を授受し
ていたが、スイッチ21の切替え後は制御系10-0の各装置
はPAC#01を介してSW#1と制御情報を授受するよ
うになる。
【0039】以上のようなシステムを前提に、以下、本
発明による最適診断開始時期決定方法の処理の実施例に
ついて図面を参照しながら説明する。交換システムなど
における診断処理部は一般にソフトウェアが主体となっ
ており、従来技術の説明においても触れたようにCC11
内に常駐されているものと、MM12内またはHDK14内
に記憶されていて必要なときにCC11内に読み込まれる
ものとがある。本発明において最適診断開始時期を決定
する処理を行う部分(以下、診断開始時期決定処理部と
記す)も診断処理部に準ずるが、説明の便から以下にお
いては診断開始時期決定処理部はCC11内に設定されて
いるものとして説明する。
発明による最適診断開始時期決定方法の処理の実施例に
ついて図面を参照しながら説明する。交換システムなど
における診断処理部は一般にソフトウェアが主体となっ
ており、従来技術の説明においても触れたようにCC11
内に常駐されているものと、MM12内またはHDK14内
に記憶されていて必要なときにCC11内に読み込まれる
ものとがある。本発明において最適診断開始時期を決定
する処理を行う部分(以下、診断開始時期決定処理部と
記す)も診断処理部に準ずるが、説明の便から以下にお
いては診断開始時期決定処理部はCC11内に設定されて
いるものとして説明する。
【0040】最初に図4を参照して本発明の実施例を説
明する。図4は図1の原理説明図に対応する実施例であ
るが、以下の説明に記載する装置の符号は図7に記載さ
れた符号、括弧内のS41〜S48は図4の各ステップに付
された符号である。
明する。図4は図1の原理説明図に対応する実施例であ
るが、以下の説明に記載する装置の符号は図7に記載さ
れた符号、括弧内のS41〜S48は図4の各ステップに付
された符号である。
【0041】運用中に最初の障害情報が発生し、CC#
0がこれを受信すると(図4のS41参照)、CC#0内
の診断開始時期決定処理部は診断開始時期を決定するた
めに必要な数値の初期設定を行う(図4のS42)。初期
設定する数値は、最初の障害情報受信からの経過時間を
計数するカウンタ(経過時間カウンタと呼ぶ)の計数値
(以下、Tcnt と記す)と、最初の障害情報受信から診
断開始までの時間を規定する監視実行時間(以下、Tse
t と記す)で、いずれも初期設定により数値を“0”に
設定する。なお、時間を計数する経過時間カウンタは公
知の技術が使用できるので図面の記載と説明は省略す
る。
0がこれを受信すると(図4のS41参照)、CC#0内
の診断開始時期決定処理部は診断開始時期を決定するた
めに必要な数値の初期設定を行う(図4のS42)。初期
設定する数値は、最初の障害情報受信からの経過時間を
計数するカウンタ(経過時間カウンタと呼ぶ)の計数値
(以下、Tcnt と記す)と、最初の障害情報受信から診
断開始までの時間を規定する監視実行時間(以下、Tse
t と記す)で、いずれも初期設定により数値を“0”に
設定する。なお、時間を計数する経過時間カウンタは公
知の技術が使用できるので図面の記載と説明は省略す
る。
【0042】初期設定を終わると監視時間指定テーブル
1(図1乃至図3に図示された監視時間指定手段1の実
施形態)にアクセスし、受信した障害情報に対して指定
されている監視時間(Ts と記す)を索引する(S43)
。監視時間指定テーブル1は図7のMM12内に記憶さ
れているが、図8は監視時間指定テーブル1の構成の一
例を図示したものである。図8に示すように、監視時間
指定テーブル1には障害発生装置の障害種別ごとに必要
な監視時間、即ち、その障害が発生してから診断を開始
するまでに他の障害の発生状況を監視しなければならな
い最小時間が指定されている。なお、障害発生装置は障
害情報によって異常が指摘された装置であり、障害情報
を送信した装置とは限らない。また、障害種別は障害情
報によって通知される障害内容についての情報である。
障害種別の情報が障害種別コードによって送られ、その
障害種別コードのみで障害発生装置まで定まる場合には
障害発生装置の欄は設ける必要がないが、図8では説明
の便から障害種別を障害発生装置別に記載している。監
視時間固定指定については後述する。
1(図1乃至図3に図示された監視時間指定手段1の実
施形態)にアクセスし、受信した障害情報に対して指定
されている監視時間(Ts と記す)を索引する(S43)
。監視時間指定テーブル1は図7のMM12内に記憶さ
れているが、図8は監視時間指定テーブル1の構成の一
例を図示したものである。図8に示すように、監視時間
指定テーブル1には障害発生装置の障害種別ごとに必要
な監視時間、即ち、その障害が発生してから診断を開始
するまでに他の障害の発生状況を監視しなければならな
い最小時間が指定されている。なお、障害発生装置は障
害情報によって異常が指摘された装置であり、障害情報
を送信した装置とは限らない。また、障害種別は障害情
報によって通知される障害内容についての情報である。
障害種別の情報が障害種別コードによって送られ、その
障害種別コードのみで障害発生装置まで定まる場合には
障害発生装置の欄は設ける必要がないが、図8では説明
の便から障害種別を障害発生装置別に記載している。監
視時間固定指定については後述する。
【0043】診断開始時期決定処理部は監視時間指定テ
ーブル1を介して監視時間Ts を得ると、監視実行時間
Tset を決定する。監視実行時間Tset は実際に監視を
行う時間を指定するものであるが、図4においては監視
実行時間Tset に監視時間Ts の値を設定する(S44)
。例えば、発生した障害種別がSW#0の電源以外の
障害であれば、監視時間指定テーブル1(図8)に指定
された監視時間Ts は30秒であるので、監視実行時間
Tset =Ts =30(秒)に設定する。
ーブル1を介して監視時間Ts を得ると、監視実行時間
Tset を決定する。監視実行時間Tset は実際に監視を
行う時間を指定するものであるが、図4においては監視
実行時間Tset に監視時間Ts の値を設定する(S44)
。例えば、発生した障害種別がSW#0の電源以外の
障害であれば、監視時間指定テーブル1(図8)に指定
された監視時間Ts は30秒であるので、監視実行時間
Tset =Ts =30(秒)に設定する。
【0044】監視実行時間Tset の設定を終わると、そ
れ以後に発生する障害情報を受信してMM12などに蓄積
する(S45) 。それと並行して、経過時間カウンタに例
えば1秒ごとにパルスを送ってカウントアップさせ(T
cnt に“1”を加算する)、Tcnt が監視実行時間Tse
t に達したか否かを確認する(S46,S47)。Tcntが
Tset に達しなければ障害情報の受信を続け、Tcnt ≧
Tset となったら診断処理を開始する(S48) 。診断処
理は最初に受信した障害情報とその後の監視実行時間T
set 経過中に受信した障害情報のすべてを用いて行うの
で診断処理を開始する際に診断処理部にすべての障害情
報を送る。
れ以後に発生する障害情報を受信してMM12などに蓄積
する(S45) 。それと並行して、経過時間カウンタに例
えば1秒ごとにパルスを送ってカウントアップさせ(T
cnt に“1”を加算する)、Tcnt が監視実行時間Tse
t に達したか否かを確認する(S46,S47)。Tcntが
Tset に達しなければ障害情報の受信を続け、Tcnt ≧
Tset となったら診断処理を開始する(S48) 。診断処
理は最初に受信した障害情報とその後の監視実行時間T
set 経過中に受信した障害情報のすべてを用いて行うの
で診断処理を開始する際に診断処理部にすべての障害情
報を送る。
【0045】図4における診断処理を開始するステップ
S48は従来技術の説明に使用した図12のステップS104
に相当する。従って、診断処理開始のステップS48は、
受信したすべての障害情報を用いて障害箇所を特定する
1次解析処理から始まることを示しいる。診断処理を開
始するステップS48以後の診断処理は図12のステップS
104 〜S111 の処理と同一であるので説明を省略する。
S48は従来技術の説明に使用した図12のステップS104
に相当する。従って、診断処理開始のステップS48は、
受信したすべての障害情報を用いて障害箇所を特定する
1次解析処理から始まることを示しいる。診断処理を開
始するステップS48以後の診断処理は図12のステップS
104 〜S111 の処理と同一であるので説明を省略する。
【0046】以上のように、図4の診断開始時期決定方
法では障害の種類によって監視時間を変えているので、
いたずらに診断開始の時期を遅らせることがない。な
お、図8の監視時間指定テーブルには電源障害に対して
短い監視時間に時間(例えば10秒)を指定した例を記
載しているが、これは電源障害のように障害箇所と障害
内容が明確なものは障害箇所を特定するために多くの障
害情報を収集する必要がないことを示している。また、
図8ではCCの障害に対して短い監視時間を設定してい
るが、これはCCのような重要な装置に障害が発生した
場合には短時間の間に関連する障害情報が発生し、必要
な情報が得られる可能性が高いことと、できるだけ速や
かに診断を開始する必要があることに配慮して設定され
たことを示している。なお、CCの障害でも障害の種類
によっては監視時間を長く設定するものがあることは勿
論である。
法では障害の種類によって監視時間を変えているので、
いたずらに診断開始の時期を遅らせることがない。な
お、図8の監視時間指定テーブルには電源障害に対して
短い監視時間に時間(例えば10秒)を指定した例を記
載しているが、これは電源障害のように障害箇所と障害
内容が明確なものは障害箇所を特定するために多くの障
害情報を収集する必要がないことを示している。また、
図8ではCCの障害に対して短い監視時間を設定してい
るが、これはCCのような重要な装置に障害が発生した
場合には短時間の間に関連する障害情報が発生し、必要
な情報が得られる可能性が高いことと、できるだけ速や
かに診断を開始する必要があることに配慮して設定され
たことを示している。なお、CCの障害でも障害の種類
によっては監視時間を長く設定するものがあることは勿
論である。
【0047】次に本発明の他の実施例について、図5を
参照して説明する。図4の方法では障害が発生したとき
にその障害の種類によって監視実行時間を固定的に設定
していたが、監視実行時間中に新たに受信した障害情報
の内容によっては更に多くの障害情報を収集するために
監視実行時間を延ばした方がよい場合がある。図5は監
視実行時間中に新たな障害情報を受信したときに監視実
行時間を変更する処理フローの一例を図示したものであ
るが、同図は図2の原理説明図に対応する実施例にな
る。以下の説明に記載する装置の符号は図7に記載され
た符号、括弧内のS51〜S63は図5の各ステップに付さ
れた符号を記載したものである。
参照して説明する。図4の方法では障害が発生したとき
にその障害の種類によって監視実行時間を固定的に設定
していたが、監視実行時間中に新たに受信した障害情報
の内容によっては更に多くの障害情報を収集するために
監視実行時間を延ばした方がよい場合がある。図5は監
視実行時間中に新たな障害情報を受信したときに監視実
行時間を変更する処理フローの一例を図示したものであ
るが、同図は図2の原理説明図に対応する実施例にな
る。以下の説明に記載する装置の符号は図7に記載され
た符号、括弧内のS51〜S63は図5の各ステップに付さ
れた符号を記載したものである。
【0048】運用中に最初の障害情報が発生し、CC#
0がこれを受信すると(図5のS51参照)、診断開始時
期決定処理部が図4におけると同様にTcnt とTset の
初期設定を行う(S52)。初期設定後CCは障害情報の
受信を継続する(S53)が、処理はステップS54に進
む。ステップS54においてはTcnt はまだ“0”である
のでステップS56に飛び、監視時間指定テーブル1によ
り最初の障害情報に対する監視時間を索引し、監視時間
Ts を得る(S56)。なお、図5のステップS56は図4
のステップS43に相当する。
0がこれを受信すると(図5のS51参照)、診断開始時
期決定処理部が図4におけると同様にTcnt とTset の
初期設定を行う(S52)。初期設定後CCは障害情報の
受信を継続する(S53)が、処理はステップS54に進
む。ステップS54においてはTcnt はまだ“0”である
のでステップS56に飛び、監視時間指定テーブル1によ
り最初の障害情報に対する監視時間を索引し、監視時間
Ts を得る(S56)。なお、図5のステップS56は図4
のステップS43に相当する。
【0049】次に監視実行時間を算出するが、監視実行
時間Tset はその時点で設定されている監視実行時間T
set に監視時間Tsを加算して算出する(図5のS5
7)。この時点ではTset =0であるので、新たな監視
実行時間Tset はTset =Ts となる。即ち、最初の障
害情報に対する監視実行時間Tset は図4のステップS
44において設定された値と同一の値になる。
時間Tset はその時点で設定されている監視実行時間T
set に監視時間Tsを加算して算出する(図5のS5
7)。この時点ではTset =0であるので、新たな監視
実行時間Tset はTset =Ts となる。即ち、最初の障
害情報に対する監視実行時間Tset は図4のステップS
44において設定された値と同一の値になる。
【0050】監視実行時間Tset を算出するとその監視
実行時間Tset が最大監視時間Tmax (以下、Tmax =
60秒とする)を超えたか否か確認する(S58)。仮に
最初の障害情報がディスク制御装置13の電源断以外の障
害を通知する障害情報であったとすると図8の監視時間
指定テーブルに指定されている監視時間Ts は20秒で
あるので、Tset =Ts =20(秒)となる。この場合
はTset <60であるので算出した値(20秒)を監視
実行時間Tset として設定する(S59) 。
実行時間Tset が最大監視時間Tmax (以下、Tmax =
60秒とする)を超えたか否か確認する(S58)。仮に
最初の障害情報がディスク制御装置13の電源断以外の障
害を通知する障害情報であったとすると図8の監視時間
指定テーブルに指定されている監視時間Ts は20秒で
あるので、Tset =Ts =20(秒)となる。この場合
はTset <60であるので算出した値(20秒)を監視
実行時間Tset として設定する(S59) 。
【0051】最初の障害情報受信から1秒が経過すると
経過時間カウンタが“1”だけカウントアップし、Tcn
t =1となる(図5のS61)。ここでTcnt が監視実行
時間Tset に達したか否か確認する(S62)が、この時
点ではTcnt (=1)<Tset (=20)であるのでス
テップS53に戻る。
経過時間カウンタが“1”だけカウントアップし、Tcn
t =1となる(図5のS61)。ここでTcnt が監視実行
時間Tset に達したか否か確認する(S62)が、この時
点ではTcnt (=1)<Tset (=20)であるのでス
テップS53に戻る。
【0052】ステップS53に戻ったのちステップS54に
進むと、今度はTcnt ≠0であるのでステップS55に進
む。ステップS53における障害情報の受信は1秒経過中
も続けられているので、その間に新たな障害情報を受信
したか否かをステップS55で確認する。新たな障害情報
が受信されていないことが確認された場合にはそのまま
時間の経過を待つ(S55→S61)が、新たな障害情報が
受信されていた場合はステップS56に進み、新たな障害
情報に対する監視時間を索引する(S56) 。
進むと、今度はTcnt ≠0であるのでステップS55に進
む。ステップS53における障害情報の受信は1秒経過中
も続けられているので、その間に新たな障害情報を受信
したか否かをステップS55で確認する。新たな障害情報
が受信されていないことが確認された場合にはそのまま
時間の経過を待つ(S55→S61)が、新たな障害情報が
受信されていた場合はステップS56に進み、新たな障害
情報に対する監視時間を索引する(S56) 。
【0053】新たな障害情報がハードディスクユニット
14の機構障害であるとすれば、図8の監視時間指定テー
ブルより監視時間Ts =30秒が得られるので、監視実行
時間を改めて算出する(S57) 。新たな監視実行時間T
set はその時点で設定されている監視実行時間Tset に
新たな障害情報に対して指定されている監視時間Tsを
加算して算出するので、この例では新たな監視実行時間
はTset =20+30=50(秒)となる。ここで新た
な監視実行時間Tset が最大監視時間(60秒)を超え
たか否かを確認する(S58)が、この例ではTset <6
0となるので算出値(50秒)を新たな監視実行時間T
set として設定する(S59) 。即ち、この例では新たな
障害情報の受信に伴って監視実行時間が延長されたこと
になる。
14の機構障害であるとすれば、図8の監視時間指定テー
ブルより監視時間Ts =30秒が得られるので、監視実行
時間を改めて算出する(S57) 。新たな監視実行時間T
set はその時点で設定されている監視実行時間Tset に
新たな障害情報に対して指定されている監視時間Tsを
加算して算出するので、この例では新たな監視実行時間
はTset =20+30=50(秒)となる。ここで新た
な監視実行時間Tset が最大監視時間(60秒)を超え
たか否かを確認する(S58)が、この例ではTset <6
0となるので算出値(50秒)を新たな監視実行時間T
set として設定する(S59) 。即ち、この例では新たな
障害情報の受信に伴って監視実行時間が延長されたこと
になる。
【0054】さらに1秒が経過するとTcnt =2となる
が、まだTcnt <Tset (=50)であるのでステップ
S53に戻る。それ以後、新たな障害情報を受信しなかっ
た場合は、ステップS53〜S55→S61→S62→S53のル
ープを繰り返すが、その間に新たな障害情報を受信した
場合はその障害の監視時間Ts を索引して監視実行時間
Tset を算出し直す(S55〜S57)。その際、新たに算
出された監視実行時間Tset が最大監視時間(=60
秒)を超えたならば監視実行時間には最大監視時間の値
を設定し、Tset =60に固定する(S58→S60)。こ
のようにして時間が経過し、Tcnt が監視実行時間Tse
t になると、CC#0は診断処理を開始する(S62→S
63)。なお、図5ではTset =60が設定された場合も
以後の障害情報を受信した場合はステップS56〜S60の
処理を行うようになっているが、Tset =60が設定さ
れた場合にはステップS54とステップS55の間でTset
=60であるか否かの確認を行い、Tset =60のとき
はステップS61に進むようにしてもよい。
が、まだTcnt <Tset (=50)であるのでステップ
S53に戻る。それ以後、新たな障害情報を受信しなかっ
た場合は、ステップS53〜S55→S61→S62→S53のル
ープを繰り返すが、その間に新たな障害情報を受信した
場合はその障害の監視時間Ts を索引して監視実行時間
Tset を算出し直す(S55〜S57)。その際、新たに算
出された監視実行時間Tset が最大監視時間(=60
秒)を超えたならば監視実行時間には最大監視時間の値
を設定し、Tset =60に固定する(S58→S60)。こ
のようにして時間が経過し、Tcnt が監視実行時間Tse
t になると、CC#0は診断処理を開始する(S62→S
63)。なお、図5ではTset =60が設定された場合も
以後の障害情報を受信した場合はステップS56〜S60の
処理を行うようになっているが、Tset =60が設定さ
れた場合にはステップS54とステップS55の間でTset
=60であるか否かの確認を行い、Tset =60のとき
はステップS61に進むようにしてもよい。
【0055】以上のように、図5の処理では障害の発生
状況によって監視実行時間Tset を補正する。例えば先
の例のように、最初にディスク制御装置の障害情報を受
信して監視(監視時間20秒)を行っている間にハード
ディスクユニットの機構障害を知らせる障害情報を受信
した場合には、ハードディスクユニットの機構障害の障
害箇所を特定するために必要とされている監視時間(3
0秒)を最初の監視時間に加えて監視を続けるので、そ
の後の障害情報の発生状況を適切な時間監視することが
できる。また、障害情報が多発した場合でも監視実行時
間の算出値が最大監視時間(例えば60秒)以上になる
場合には監視実行時間を最大監視時間の値に設定するの
で、障害情報が多発しても最初の障害情報を受信してか
ら最大監視時間を経過すれば必ず診断処理を開始するこ
とになり、診断開始時期が必要以上に遅れるようなこと
がない。
状況によって監視実行時間Tset を補正する。例えば先
の例のように、最初にディスク制御装置の障害情報を受
信して監視(監視時間20秒)を行っている間にハード
ディスクユニットの機構障害を知らせる障害情報を受信
した場合には、ハードディスクユニットの機構障害の障
害箇所を特定するために必要とされている監視時間(3
0秒)を最初の監視時間に加えて監視を続けるので、そ
の後の障害情報の発生状況を適切な時間監視することが
できる。また、障害情報が多発した場合でも監視実行時
間の算出値が最大監視時間(例えば60秒)以上になる
場合には監視実行時間を最大監視時間の値に設定するの
で、障害情報が多発しても最初の障害情報を受信してか
ら最大監視時間を経過すれば必ず診断処理を開始するこ
とになり、診断開始時期が必要以上に遅れるようなこと
がない。
【0056】次に本発明の他の実施例について、図6を
参照して説明する。図5の方法では監視時間経過後に直
ちに診断を開始した方がよいとされる障害(例えばCC
の電源障害)が発生したときにも、監視実行時間中に他
の障害情報を受信すると監視実行時間が延長される。図
6の処理方法は特定の障害情報については以後発生の障
害情報に対して指定されている監視時間を加えずに、特
定の障害情報に定められている監視時間が経過したら診
断処理を開始する方法である。以下、図6について図5
と同一部分を省略して説明する。なお、以下の括弧内の
S71〜S88は図6の各ステップに付された符号である。
参照して説明する。図5の方法では監視時間経過後に直
ちに診断を開始した方がよいとされる障害(例えばCC
の電源障害)が発生したときにも、監視実行時間中に他
の障害情報を受信すると監視実行時間が延長される。図
6の処理方法は特定の障害情報については以後発生の障
害情報に対して指定されている監視時間を加えずに、特
定の障害情報に定められている監視時間が経過したら診
断処理を開始する方法である。以下、図6について図5
と同一部分を省略して説明する。なお、以下の括弧内の
S71〜S88は図6の各ステップに付された符号である。
【0057】図6において、最初の障害情報を受信して
からその障害情報に指定されている監視時間を索引する
までの処理(図6のS71〜S77)は図5の処理(図5の
S51〜S56)とほぼ同一である。なお、図6では図5に
はないステップS75が加えられているが、最初の障害情
報の場合にはこのステップS75は関係がないので内容は
変わらない。
からその障害情報に指定されている監視時間を索引する
までの処理(図6のS71〜S77)は図5の処理(図5の
S51〜S56)とほぼ同一である。なお、図6では図5に
はないステップS75が加えられているが、最初の障害情
報の場合にはこのステップS75は関係がないので内容は
変わらない。
【0058】監視時間の索引(S77)を終わるとステッ
プS78においてその障害情報に対して監視時間固定の指
定が行われているか否かを確認する。監視時間固定の指
定は図8に一例が記載してあるように監視時間指定テー
ブル1の中に「監視時間固定指定」の項を設けて指定す
る。図8において「監視時間固定指定」に“1”が設定
されているものが監視時間を固定するように指定された
障害、“0”が設定されているものが固定が指定されて
いない障害である。
プS78においてその障害情報に対して監視時間固定の指
定が行われているか否かを確認する。監視時間固定の指
定は図8に一例が記載してあるように監視時間指定テー
ブル1の中に「監視時間固定指定」の項を設けて指定す
る。図8において「監視時間固定指定」に“1”が設定
されているものが監視時間を固定するように指定された
障害、“0”が設定されているものが固定が指定されて
いない障害である。
【0059】図6においては監視時間指定テーブル1を
索引したとき(S77) に監視時間固定指定情報も同時に
索引される。最初の障害情報が例えばCCの電源障害で
あれば監視時間固定指定があるため図6のステップS78
よりステップS79に進む。ここで監視実行時間Tset に
“0”以外の数値が設定されているか否かを確認する
が、最初の障害情報のときはTset =0であるので索引
した監視時間Ts (CCの電源障害の例ではTs =10
秒)を監視実行時間Tset に固定化して設定する(S79
→S80)。この固定化はTset の値を記憶する箇所に例
えば固定化を意味するビットを付加するなどにより行
う。Tset ≠0の場合については後述する。
索引したとき(S77) に監視時間固定指定情報も同時に
索引される。最初の障害情報が例えばCCの電源障害で
あれば監視時間固定指定があるため図6のステップS78
よりステップS79に進む。ここで監視実行時間Tset に
“0”以外の数値が設定されているか否かを確認する
が、最初の障害情報のときはTset =0であるので索引
した監視時間Ts (CCの電源障害の例ではTs =10
秒)を監視実行時間Tset に固定化して設定する(S79
→S80)。この固定化はTset の値を記憶する箇所に例
えば固定化を意味するビットを付加するなどにより行
う。Tset ≠0の場合については後述する。
【0060】ステップS78において監視時間固定の指定
の有無を確認したときに監視時間固定の指定がなければ
ステップS82に進むが、以後の処理(S82→S87)は図
5における処理(S57→S62)と同一である。
の有無を確認したときに監視時間固定の指定がなければ
ステップS82に進むが、以後の処理(S82→S87)は図
5における処理(S57→S62)と同一である。
【0061】監視時間固定の指定があり、ステップS80
において監視時間Ts を監視実行時間Tset に設定した
場合はその状態で時間の経過を待ち、1秒が経過すると
再びステップS73に戻る(S86→S87→S73)。ステッ
プS73に戻ったのちステップS74に進むが、今度はTcn
t =0ではないのでステップS75に進む。ステップS75
で固定化された監視実行時間Tset が設定されているか
否か確認するが、この例では先にステップS80でTset
=Ts =10(秒)が固定設定されているのでステップ
S76以下の処理を行うことなく時間の経過を待つ(S75
→S86)。以後、監視実行時間の10秒が経過するまで
上記の処理を繰り返し、Ts =Tset になると診断処理
を開始する(S87→S88)。なお、監視実行時間の10
秒の間は他の障害情報の収集が続けられているので、診
断処理開始の際は最初の障害情報と以後の10秒の間に受
信した障害情報が診断処理に使用される(S88) 。
において監視時間Ts を監視実行時間Tset に設定した
場合はその状態で時間の経過を待ち、1秒が経過すると
再びステップS73に戻る(S86→S87→S73)。ステッ
プS73に戻ったのちステップS74に進むが、今度はTcn
t =0ではないのでステップS75に進む。ステップS75
で固定化された監視実行時間Tset が設定されているか
否か確認するが、この例では先にステップS80でTset
=Ts =10(秒)が固定設定されているのでステップ
S76以下の処理を行うことなく時間の経過を待つ(S75
→S86)。以後、監視実行時間の10秒が経過するまで
上記の処理を繰り返し、Ts =Tset になると診断処理
を開始する(S87→S88)。なお、監視実行時間の10
秒の間は他の障害情報の収集が続けられているので、診
断処理開始の際は最初の障害情報と以後の10秒の間に受
信した障害情報が診断処理に使用される(S88) 。
【0062】次に、最初に受信した障害情報に監視時間
固定の指定がなく、監視実行時間中に新たに発生した障
害情報に監視時間固定の指定があった場合の例について
説明する。最初に受信した障害情報に監視時間固定の指
定がない場合は図6のS71〜S74→S77→S78→S82→
S83→S84の各ステップの処理が行われたのち、1秒が
経過するとS86, S87のステップを経てステップS73に
戻る。この過程で監視実行時間Tset に最初の障害情報
に指定されていた監視時間Ts の値が設定される。
固定の指定がなく、監視実行時間中に新たに発生した障
害情報に監視時間固定の指定があった場合の例について
説明する。最初に受信した障害情報に監視時間固定の指
定がない場合は図6のS71〜S74→S77→S78→S82→
S83→S84の各ステップの処理が行われたのち、1秒が
経過するとS86, S87のステップを経てステップS73に
戻る。この過程で監視実行時間Tset に最初の障害情報
に指定されていた監視時間Ts の値が設定される。
【0063】ステップS73に戻ったのち、S73→S74→
S75と進むが、先に設定した監視実行時間Tset は固定
化されていないのでステップS75よりステップS76に進
む。CC#0はその間(この場合は1秒間)、他の障害
情報を受信しているが、説明の便から新たな障害情報を
ひとつだけ受信したとする。この場合はステップS76か
らステップS77に進むが、監視時間視点テーブル1を索
引した結果、新たな障害情報には監視時間固定の指定が
あったとする。
S75と進むが、先に設定した監視実行時間Tset は固定
化されていないのでステップS75よりステップS76に進
む。CC#0はその間(この場合は1秒間)、他の障害
情報を受信しているが、説明の便から新たな障害情報を
ひとつだけ受信したとする。この場合はステップS76か
らステップS77に進むが、監視時間視点テーブル1を索
引した結果、新たな障害情報には監視時間固定の指定が
あったとする。
【0064】この場合はS77→S78→S79と進むが、ス
テップS79においてTset =0でないことが確認される
ため、ステップS81に進み、その時点で設定されている
監視実行時間Tset の値を固定化する。固定化の指定先
に説明した方法で行うが、以後の処理も先に説明したも
のと同様になる。
テップS79においてTset =0でないことが確認される
ため、ステップS81に進み、その時点で設定されている
監視実行時間Tset の値を固定化する。固定化の指定先
に説明した方法で行うが、以後の処理も先に説明したも
のと同様になる。
【0065】以上の処理を具体的の例により説明する。
最初に受信した障害情報がスイッチの電源断以外の障害
であったとすると、図8の監視時間指定テーブルでは監
視時間としてTs =30(秒)が索引される。従って、
この障害情報に対して監視実行時間はTset =Ts =3
0が設定される。このTset の値は固定化されていない
ので、1秒経過後に図6のステップS73に戻ったのちは
ステップS75からステップS76に進む。この1秒経過の
間にCC#1が回線対応部23の電源断障害の障害情報を
受信していればステップS77に進み、監視時間の索引を
行うが、図8の監視時間指定テーブルでは回線対応部23
の電源断障害に対しては監視時間としてTs =20
(秒)が固定指定されている。
最初に受信した障害情報がスイッチの電源断以外の障害
であったとすると、図8の監視時間指定テーブルでは監
視時間としてTs =30(秒)が索引される。従って、
この障害情報に対して監視実行時間はTset =Ts =3
0が設定される。このTset の値は固定化されていない
ので、1秒経過後に図6のステップS73に戻ったのちは
ステップS75からステップS76に進む。この1秒経過の
間にCC#1が回線対応部23の電源断障害の障害情報を
受信していればステップS77に進み、監視時間の索引を
行うが、図8の監視時間指定テーブルでは回線対応部23
の電源断障害に対しては監視時間としてTs =20
(秒)が固定指定されている。
【0066】そこでこの場合は回線対応部23の電源断障
害に対して指定されている監視時間は使用せずに、監視
時間固定の指定のみによりステップS78に進む。ステッ
プS78において監視実行時間についてTset =0である
か否か確認するが、この場合はTset =30が設定され
ているのでこのTset =30をそのまま固定化する。以
後、監視実行時間が経過する間、ステップS73に戻って
処理を繰り返すが、以後の処理においてはステップS75
よりステップS86に進むので、最初に設定された監視実
行時間の値は固定化されたまま30秒が経過すれば診断
処理が開始される。
害に対して指定されている監視時間は使用せずに、監視
時間固定の指定のみによりステップS78に進む。ステッ
プS78において監視実行時間についてTset =0である
か否か確認するが、この場合はTset =30が設定され
ているのでこのTset =30をそのまま固定化する。以
後、監視実行時間が経過する間、ステップS73に戻って
処理を繰り返すが、以後の処理においてはステップS75
よりステップS86に進むので、最初に設定された監視実
行時間の値は固定化されたまま30秒が経過すれば診断
処理が開始される。
【0067】なお、以上においては監視時間固定の指定
がある障害情報を受信したときはその時点で設定されて
いる監視実行時間をそのまま固定するとしたが、既に設
定されている監視実行時間よりも新たに受信した障害情
報に対して指定されている監視時間の方が長い場合があ
り得るので、そのような場合にはステップS81において
設定済の監視実行時間と新たに索引した監視時間のいず
れか大きい方の値を新たな監視実行時間として固定的に
設定するようにしてもよい(図6の処理をこのような処
理に変えるることは容易であるので処理フローの図示は
省略する)。
がある障害情報を受信したときはその時点で設定されて
いる監視実行時間をそのまま固定するとしたが、既に設
定されている監視実行時間よりも新たに受信した障害情
報に対して指定されている監視時間の方が長い場合があ
り得るので、そのような場合にはステップS81において
設定済の監視実行時間と新たに索引した監視時間のいず
れか大きい方の値を新たな監視実行時間として固定的に
設定するようにしてもよい(図6の処理をこのような処
理に変えるることは容易であるので処理フローの図示は
省略する)。
【0068】以上のように、図6では最初の障害情報を
受信してから監視中に他の障害情報を受信した場合には
図5におけると同様に監視実行時間を延ばして監視を続
けるが、特定の障害情報を受信した場合には図4におけ
ると同様に、その特定の障害情報に指定されている監視
時間の間だけ監視を行って診断処理を開始する。従っ
て、障害情報が多発するような場合には有効な障害情報
を最大限収集して障害の解析を行うことができ、原因が
比較的特定し易い障害(例えば各種の装置の電源障害な
ど)や緊急性のある障害(例えばCCの障害など)が発
生した場合には最小限の監視で診断処理を開始すること
によってシステムの信頼性を向上することができる。
受信してから監視中に他の障害情報を受信した場合には
図5におけると同様に監視実行時間を延ばして監視を続
けるが、特定の障害情報を受信した場合には図4におけ
ると同様に、その特定の障害情報に指定されている監視
時間の間だけ監視を行って診断処理を開始する。従っ
て、障害情報が多発するような場合には有効な障害情報
を最大限収集して障害の解析を行うことができ、原因が
比較的特定し易い障害(例えば各種の装置の電源障害な
ど)や緊急性のある障害(例えばCCの障害など)が発
生した場合には最小限の監視で診断処理を開始すること
によってシステムの信頼性を向上することができる。
【0069】以上、図4乃至図6及び図8を用いて本発
明の実施例を説明したが、これらの図面はあくまで本発
明の実施例の一部を示したものに過ぎず、本発明が図示
された内容や数値のみに限定されるものでないことは言
うまでもない。例えば、図4乃至図6及び図8に記載し
た時間は秒を単位として記載しているが、例えばミリ秒
(ms)を単位として動作するものであっても差し支え
ないことは明らかである。また、上記の説明は図7に図
示した交換システムに本発明を適用した場合を前提に行
ったが、本発明を適用する対象が図7の構成をもつ交換
システムに限定されるものでないことは勿論、本発明が
通信システム以外のシステム、例えば情報処理システム
にも適用可能であることは明らかである。
明の実施例を説明したが、これらの図面はあくまで本発
明の実施例の一部を示したものに過ぎず、本発明が図示
された内容や数値のみに限定されるものでないことは言
うまでもない。例えば、図4乃至図6及び図8に記載し
た時間は秒を単位として記載しているが、例えばミリ秒
(ms)を単位として動作するものであっても差し支え
ないことは明らかである。また、上記の説明は図7に図
示した交換システムに本発明を適用した場合を前提に行
ったが、本発明を適用する対象が図7の構成をもつ交換
システムに限定されるものでないことは勿論、本発明が
通信システム以外のシステム、例えば情報処理システム
にも適用可能であることは明らかである。
【0070】
【発明の効果】以上説明したように、本発明によれば、
障害が発生してから診断処理を開始するまでの監視時間
を障害情報の内容に応じて変えることができるので、障
害解析に必要な他の障害情報を収集する時間を発生した
障害の種類ごとに最適な時間に設定することができる。
また、監視時間中に他の障害情報が発生した場合には監
視時間を延ばして障害解析に有効な障害情報を最大限収
集するようにすることもできる。更に、複数の障害情報
が発生した場合に監視時間を延長して障害情報を最大限
収集するようにすると同時に、障害情報の中に原因が比
較的特定し易い障害や緊急性のある障害が発生した場合
には最小限の監視で診断処理を開始するようにすること
もできる。
障害が発生してから診断処理を開始するまでの監視時間
を障害情報の内容に応じて変えることができるので、障
害解析に必要な他の障害情報を収集する時間を発生した
障害の種類ごとに最適な時間に設定することができる。
また、監視時間中に他の障害情報が発生した場合には監
視時間を延ばして障害解析に有効な障害情報を最大限収
集するようにすることもできる。更に、複数の障害情報
が発生した場合に監視時間を延長して障害情報を最大限
収集するようにすると同時に、障害情報の中に原因が比
較的特定し易い障害や緊急性のある障害が発生した場合
には最小限の監視で診断処理を開始するようにすること
もできる。
【0071】このため、本発明においては障害解析に必
要な障害情報を収集するために障害が発生してから必要
以上の時間を費やすことなく最適な時期に診断を開始す
ることができ、障害の回復時期の短縮とシステムの信頼
性の向上に大きく貢献する。
要な障害情報を収集するために障害が発生してから必要
以上の時間を費やすことなく最適な時期に診断を開始す
ることができ、障害の回復時期の短縮とシステムの信頼
性の向上に大きく貢献する。
【図1】 本発明の最適診断開始時期決定方法原理説明
図(1)
図(1)
【図2】 本発明の最適診断開始時期決定方法原理説明
図(2)
図(2)
【図3】 本発明の最適診断開始時期決定方法原理説明
図(3)
図(3)
【図4】 本発明の最適診断開始時期決定方法の実施例
処理フロー図(1)
処理フロー図(1)
【図5】 本発明の最適診断開始時期決定方法の実施例
処理フロー図(2)
処理フロー図(2)
【図6】 本発明の最適診断開始時期決定方法の実施例
処理フロー図(3)
処理フロー図(3)
【図7】 本発明を適用する交換システムのモデル構成
図
図
【図8】 本発明の実施例監視時間指定テーブル構成図
【図9】 診断対象交換機のモデル構成図
【図10】 診断対象交換機のモデル実装図
【図11】 従来技術の自動診断処理機能の構成図
【図12】 従来技術の自動診断処理機能の処理フロー
図
図
1 監視時間指定手段(監視時間指定テーブル)
Claims (3)
- 【請求項1】 通信システム内において発生する可能性
がある障害情報ごとに各障害情報が発生してから診断を
開始するまでに必要な障害発生状況の監視時間を指定し
た監視時間指定手段を備え、 通信システムを構成する装置より障害の発生を通知する
第1の障害情報を受信したときに、前記監視時間指定手
段を用いて該第1の障害情報に対して指定された監視時
間を索引して索引した監視時間を監視実行時間として設
定したのち、該監視実行時間が経過するまでの間に発生
した他の障害情報を受付けて保存し、 前記監視実行時間が経過したときに前記第1の障害情報
と監視実行時間中に受信した他の障害情報を用いて障害
箇所を特定する診断処理を開始することを特徴とする最
適診断開始時期決定方法。 - 【請求項2】 前記監視実行時間の経過中に新たな障害
情報を受信したときは、前記監視時間指定手段を用いて
新たな障害情報に対して指定されている監視時間を索引
して索引した新たな監視時間をその時点で設定されてい
る監視実行時間に加算して新たな監視実行時間として設
定し、かつ、新たな監視時間をその時点で設定されてい
る監視実行時間に加算して算出した監視実行時間が予め
定められた最大監視時間を超えたときは該最大監視時間
を新たな監視実行時間として設定することを特徴とする
請求項1記載の最適診断開始時期決定方法。 - 【請求項3】 前記監視時間指定手段内の特定の障害情
報に対して、指定した監視時間を監視実行時間として固
定的に設定することを指示する監視時間固定指定情報を
付与し、 障害情報を受信し、前記監視時間指定手段を用いて該障
害情報に対して指定されている監視時間を索引したとき
に該障害情報に対して監視時間固定指定情報が付与され
ていたときは、その時点で監視実行時間が設定されてい
なければ索引した監視時間を監視実行時間として固定的
に設定し、すでに監視実行時間が設定されていればその
時点で設定されている監視実行時間を固定化させること
を特徴とする請求項2記載の最適診断開始時期決定方
法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8116577A JPH09307635A (ja) | 1996-05-10 | 1996-05-10 | 最適診断開始時期決定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8116577A JPH09307635A (ja) | 1996-05-10 | 1996-05-10 | 最適診断開始時期決定方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH09307635A true JPH09307635A (ja) | 1997-11-28 |
Family
ID=14690570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8116577A Withdrawn JPH09307635A (ja) | 1996-05-10 | 1996-05-10 | 最適診断開始時期決定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH09307635A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013161211A (ja) * | 2012-02-03 | 2013-08-19 | Nec Computertechno Ltd | 情報処理装置、故障診断制御装置、故障判定方法、故障判定プログラム |
-
1996
- 1996-05-10 JP JP8116577A patent/JPH09307635A/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013161211A (ja) * | 2012-02-03 | 2013-08-19 | Nec Computertechno Ltd | 情報処理装置、故障診断制御装置、故障判定方法、故障判定プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5875290A (en) | Method and program product for synchronizing operator initiated commands with a failover process in a distributed processing system | |
CA1267226A (en) | Fault recovery in a distributed processing system | |
CN108847982B (zh) | 一种分布式存储集群及其节点故障切换方法和装置 | |
US6012150A (en) | Apparatus for synchronizing operator initiated commands with a failover process in a distributed processing system | |
JPH0772871B2 (ja) | 履歴分析にもとづくコンピュータの故障回復 | |
JP2636179B2 (ja) | コモンコントロール冗長系切替方法 | |
EP0102059A2 (en) | Data transmission device for loop transmission system | |
KR950013808B1 (ko) | 멀티포트 접속장치 및 디렉토리 생성 방법 및 장치 | |
US5461609A (en) | Packet data network switch having internal fault detection and correction | |
CN112148535A (zh) | 一种机架式设备双监控系统 | |
JPH09307635A (ja) | 最適診断開始時期決定方法 | |
JP2000196748A (ja) | 回線切り替え装置および回線切り替え方法、並びに記録媒体 | |
US6528901B1 (en) | Automatic protection switching | |
JPH07262042A (ja) | プロセッサ障害検出方法 | |
CN111309504A (zh) | 嵌入式模块串口冗余传输的控制方法及相关组件 | |
CN118245269B (zh) | Pci设备的故障处理方法及装置、故障处理系统 | |
CA1143026A (en) | Computer system | |
JP2004213412A (ja) | 二重化制御装置 | |
WO2001015389A1 (fr) | Procede de reglage d'horloge, dispositif de communication utilisant ce procede et systeme de communication | |
KR20030058144A (ko) | 정보통신 시스템의 프로세스 장애 감시방법 및 복구방법 | |
JP2007026038A (ja) | パス監視システム,パス監視方法,およびパス監視プログラム | |
JPH11177594A (ja) | 通信制御装置 | |
JP3239856B2 (ja) | ローカルエリアネットワークにおける情報処理装置の障害通知システム及び障害通知装置 | |
JP3012491B2 (ja) | 二重化装置のマイクロ診断方法 | |
JPH09160803A (ja) | 自己診断情報の通信方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20030805 |