JPH04229741A - リンク結合システム内の故障を分離し分析する装置及び方法 - Google Patents

リンク結合システム内の故障を分離し分析する装置及び方法

Info

Publication number
JPH04229741A
JPH04229741A JP3065348A JP6534891A JPH04229741A JP H04229741 A JPH04229741 A JP H04229741A JP 3065348 A JP3065348 A JP 3065348A JP 6534891 A JP6534891 A JP 6534891A JP H04229741 A JPH04229741 A JP H04229741A
Authority
JP
Japan
Prior art keywords
link
fault
failure
report
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3065348A
Other languages
English (en)
Other versions
JPH0793624B2 (ja
Inventor
Jr Anthony Carusone
アンソニー・カルソーネ・ジュニア
Albert W Garrigan
アルバート・ウィリアム・ガリガン
Wayne Hunsinger
ウェイン・ハンジンガー
Gerald T Moffitt
ジェラルド・トーマス・マフィット
David E Spencer
デーヴィド・アール・スペンサー
Jordan M Taylor
ジョーダン・エム・テイラー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH04229741A publication Critical patent/JPH04229741A/ja
Publication of JPH0793624B2 publication Critical patent/JPH0793624B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、リンクで結合されたシ
ステム、たとえば、複数の通信リンクによって結合され
たホスト・プロセッサと交換機と制御装置の分散ネット
ワークとして配列されたデータ処理システム等の故障を
分離し分析する方法および装置に関するものである。詳
細には、本発明は、システム自体の中で発生する故障レ
ポートを利用して、かかるシステム(またはネットワー
ク)中の故障を分離する方法および装置に関するもので
ある。このレポートは、好ましくは所定の期間中に中央
位置に送られ、考えられる故障の性質および位置を識別
する単一のエラー・メッセージを発生させるのに使用さ
れる。本発明の好ましい実施例では、故障の位置検出と
分析を実行する際に一般に用いられる、システム全体の
構成表を作成したり維持したりする必要がない。
【0002】
【従来の技術】データ処理システム等、システムの構成
要素が複数の通信リンクによって結合されている分散ネ
ットワーク中の故障を分離する方法は多数知られている
。たとえば、診断ソフトウェアを使用して、オペレータ
が故障位置を決定するのを助ける特定の試験を行うこと
ができる。この種のソフトウェアは、一般にエラー・ロ
グを生成するが、エラー・ログはしばしば単一の故障事
象に関係する複数の項目を含んでいる。オペレータは、
通常は記録されたデータを分析してからでないと、故障
位置の結論を出すことができない。
【0003】米国特許第4633467号明細書は、ソ
フトウェアを使ってコンピュータ・システムにおける故
障を分離する方法の例を教示している。具体的には、シ
ステム内のハードウェア・ユニットが、エラー状態の検
出に応じてエラー・レポートを生成する。たとえば、上
記特許に教示されている方法を実施したソフトウェアを
利用して、個別レポートからレポート・リストを作成す
ることができる。このソフトウェアは、故障の履歴を与
えるだけでなく、最近の故障と比較した経過時間に基づ
いてエージングを行う。故障のあるユニットを分離しや
すくするために、重み付け処理を行う。
【0004】上記特許の方法では、どのユニットが活動
状態の通信経路にあるかを暗黙に判定するために、構成
情報を維持し検索する必要がある。この時、これらのユ
ニットは故障位置の候補となる。
【0005】上記特許に教示された分析の結果、単一の
故障から生じる複数の項目を含むリストが得られる。し
たがって、オペレータが最終的に故障を分離するには、
このリストを分析しなければならない。さらに、考えら
れる故障の原因について診断を行うことができない。
【0006】上述のように、上記の故障分析法では、タ
イマに基づく機構を使用するが、タイミングはある種の
レポートを除外するための基礎として使用されるにすぎ
ない。
【0007】米国特許第4727548号明細書および
米国特許第4745593号明細書は、米国特許第46
33467号明細書と類似の故障分離システムを開示し
ている。これら3つの特許はいずれも、なんらかの形で
タイムアウト方式を利用している。
【0008】米国特許第4727548号明細書に開示
された発明によれば、タイムアウトを使用して、その中
で信号リンク上の故障を検出すべき活動ウィンドウを形
成する。タイムアウト・ウィンドウ内で遷移が生じない
場合、リンク上で故障があることが示される。
【0009】米国特許第4745593号明細書に記述
された発明によれば、ネットワークのノードを介してテ
スト・パケットを送り、タイムアウト方式を用いて、予
期した応答かどうか検査する。応答が認められない場合
は、エラーがあることが分かる。
【0010】上記の特許に教示された発明はいずれも、
単一の障害に対して複数のエラー・レポートを生成する
傾向があり、自動的にレコードを統合して、複数のエラ
ー・メッセージを避け、オペレータのために単一のエラ
ー・メッセージを生成するものはない。さらに、上記の
方式はすべて、考えられる故障の原因を識別するために
ある種の大域的な構成情報(構成表等)を維持する必要
がある。
【0011】故障を分離する他の方法は、米国特許第4
554661号明細書および米国特許第4570261
号明細書に記載されている。
【0012】米国特許第4554661号は、システム
・エラー状況の変化を探すための状況フィルタとして機
能するハードウェアを使用する。これらの変化は、故障
の検出、または故障が修復されたことを示すものである
。故障は、構成要素の内部、または構成要素の外部にあ
るものとして、あるいは分離されないものとして認識さ
れる。
【0013】米国特許第4554661号明細書に教示
されたハードウェアに基づく方式は、ソフトウェアに基
づく故障位置検出方法と同様に、システム全体の構成情
報を生成し維持する必要がある。さらに、やはり単一の
故障から複数のエラーが生じる可能性があり、このよう
な場合、故障を分離するために、さらに試験または分析
を行わなければならない。
【0014】米国特許第4570261号明細書には、
故障分離を行うために使用する投票方式が教示されてい
る。この方式もタイマに基づくもので、上述のタイマに
基づくエージングと同様、可能なエラーの原因を決定す
る前に、投票を重み付けする。
【0015】米国特許第4570261号は、分散シス
テムで有用であるが、上記に引用した他の特許と同様に
、通常構成表の形をした構成情報を作成し維持しなけれ
ばならない。この特許の教示を使用すると、やはり単一
のエラー事象について複数のエラー・レポートがオペレ
ータに出力される傾向がある。
【0016】さらに、引用した特許はいずれも、分散リ
ンク結合システム中でエラー・レポートの自動合成を行
って、単一の故障位置を分離、識別すると同時に、故障
原因の診断を行うものではない。
【0017】故障の位置検出と同時に、故障原因の診断
を行うことが望ましい。問題を解決するために、サービ
ス要員を(多くの場合、顧客の事業所へ)派遣しなけれ
ばならない場合には特にそうである。考えられる故障原
因のデータが、サービス要員の派遣の前に得られれば、
(a)問題を解決するのに必要な部品または装置を決定
するために最初に事業所を訪問し、(b)その部品また
は装置を取りに中央供給施設に戻り、(c)再び事業所
に戻る等に伴う時間および経費を節減(一部を回避)す
る助けになる。
【0018】光伝送媒体、光電子システム構成要素等の
出現により、上記のネットワークを数キロメートルにも
わたって分散することが可能になった。以前は、システ
ムの故障が検出されても、システム中の装置はせいぜい
数百フィート離れている程度で、同じ建物内にあるのが
普通であったため、サービス要員を間違った場所に派遣
する機会はほとんどなかった。しかし最近は、単一のネ
ットワーク中の装置が地理的に分散しているため、故障
の位置検出と(故障の原因に関する)分析を十分正確に
行って、問題を処理するために、サービス要員を正しい
場所に正しい装置を持って行かせることが重要である。
【0019】故障原因の正確な診断により、サービス要
員を正しい場所に派遣できることは、システムに使用す
る構成要素の故障率が高い場合にはさらに重要となる。
【0020】上記の種類の分散ネットワークは、本発明
の使用で大きな利益が得られる場である。このようなネ
ットワークの代表例は、1989年10月30日付出願
の米国特許出願第07/429267号(日本出願特願
平2−268281号)明細書に記載されているシステ
ムである。特願平2−268281号明細書には、デー
タ処理システムの中の、(CPUの)ある入出力チャネ
ルと、別の入出力チャネルまたは(周辺装置制御装置(
CU)を介して)周辺装置との間で接続を行うための交
換機およびそのプロトコルが記載されている。特願平2
−268281号明細書を引用により本明細書に合体す
る。
【0021】上記の特許出願では、CPUとCUとの間
に設けた交換機ユニットを使用して、単一のCPUネッ
トワーク接続から複数のCUへ、および単一のCUネッ
トワーク接続から複数のCPUへの接続が可能になるよ
うにする。伝送媒体と送信機、受信機および両端の関連
電子回路を含めて、2つのユニット間の双方向接続をリ
ンクと呼ぶ。リンクの1端の送信機、受信機関連電子回
路をリンク接続機構と呼ぶ。
【0022】リンクに故障が発生すると、リンクの両端
に症状が発生し、交換機ユニットを介して伝播し、複数
のリンクの両端に現れる。故障の症状は、このようにし
て故障したリンクの両端に現れるとともに、故障しない
リンクの端部にも伝播する。その結果、エラーが複数の
位置で検出される。これらの故障レポートを1か所に集
めて、どのリンクが故障しており、そのリンクの各種の
要素で、故障が発生した確率がいくらかを分析できるな
ら望ましいことである。
【0023】上記のように、従来の技術を使用すると、
1つの故障から複数のレポートが生成される結果、オペ
レータに故障を示すメッセージが複数得られ、複数位置
で複数の故障レポートが得られ、同じ故障に対して何回
もサービス要員を呼ぶ可能性が生じる。この情報の分析
と、どの種類のサービスが必要かの判断は、時間のかか
るプロセスである。
【0024】各交換機とほとんどのCUは、1つの経路
またはリンクが故障したとき動作および通信が続行でき
るように、CPUへの経路を有する複数のリンク接続機
構を備えている。ほとんどの装置では、CPUは相互に
通信し、またはそれぞれが中央位置に通信する。
【0025】
【発明が解決しようとする課題】上記の特願平2−26
8281号明細書に記載されているもののようなネット
ワークで、これらの複数のリンク接続機構の利点と、C
PUが相互に、または中央位置とあるいはその両方で通
信する能力を利用して、ネットワーク中のユニットが見
つけた故障の情報を、主リンクだけでなく(これ自体が
故障することがある)、代替レポート・リンクをも介し
て収集できるようになるなら望ましいことである。
【0026】さらに、このようなネットワークで、単一
の故障に対して生成された複数の故障レポートを、分析
のために中央位置で収集することができ、ネットワーク
の完全な構成を知らなくても、どのレポートが特定の発
生事象に属するかを判定する方法が得られるなら望まし
いことである。
【0027】単一の発生事象から生じた複数の故障レポ
ートを分析するには、中央地点で受け取った故障レポー
トのうち、どれが単一の発生事象からのものであるかを
判定しなければならない。CPU、CU、および交換機
すべての構成の知識は、上述のように表に保存できるが
、このような表を作成し、これを動的に最新の状態に保
つことは難しい。
【0028】さらに、1組のレポートの出所を単に決定
するだけでは、故障を分離するのに十分な情報が得られ
ない場合に、故障をネットワーク中の複数のユニットの
うちの特定の1つ(または特定のリンク)に分離できる
なら望ましいことである。たとえば、故障して、自分で
はエラー・レポートを出せないユニットを識別できるな
ら望ましいことである。
【0029】上記のすべての理由により、故障の分離お
よび分析を行うことができ、かつ、(a)故障位置の情
報と考えられる故障原因の診断を自動的に生成し、(b
)システム全体の構成情報、たとえばシステム構成表を
作成したり維持したりする必要なしに上記の情報を提供
し、(c)エラー・レポートを収集して、分散リンク結
合システム中の主レポート経路が故障した場合でも故障
を分離できる方法を提供し、(d)単一の故障事象に関
連する複数のエラー・レポートが生成された場合でも、
オペレータにその事象に対応する単一のエラー・メッセ
ージを与え、(e)故障を、分散リンク結合システム中
の複数のユニット(またはリンクあるいはその両方)の
1つに正確に分離することのできる、方法および装置を
提供できれば望ましいことである。
【0030】本発明の1目的は、システム全体の構成情
報を作成したり維持したりする必要なく、システム自体
が生成するエラー・レポートに応答する中央ベースの機
構を使用して、故障位置の情報および(リンク結合シス
テム中での)考えられる故障原因の診断を自動的に生成
する方法および装置を提供することにある。
【0031】本発明の他の目的は、リンク結合システム
中の、1組のあらかじめ定義された代替レポート経路を
利用して、あるユニットの主レポート経路が使用不能に
なった場合にエラー・レポートを中央位置で収集しやす
くする方法および装置を提供することにある。
【0032】本発明の他の目的は、リンク結合システム
中で発生した単一のエラー事象に関連して複数のエラー
・メッセージがシステムによって生成された場合でも、
オペレータにその事象に対応する単一のエラー・メッセ
ージを与える方法および装置を提供することにある。
【0033】本発明の他の目的は、故障したユニット自
体が故障を報告できないとき、その故障を、分散リンク
結合システム中の複数のユニット(またはリンクあるい
はその両方)の1つに正確に分離するための、任意選択
のタイマ・ベースの機構を提供することにある。
【0034】
【課題を解決するための手段】本発明の好ましい実施例
によれば、ネットワーク中の交換機、CPUおよびCU
は、それぞれそのユニットを固有に識別する識別子を有
する。ネットワーク上のこれらのユニットの各リンク・
アダプタ(接続機構)には、ユニットIDと、そのユニ
ット上の特定のアダプタを示す固有の番号(インターフ
ェースIDまたはポート番号)とからなる、固有のリン
ク・アダプタ識別子(LAID)が割り当てられる。
【0035】CPU/CUインターフェース・ネットワ
ークに取り付けられた交換機、CPU、またはCUは、
隣接するユニットに接続されるとき、リンクの他端のユ
ニット(以後「隣接」ユニットと称する)とLAIDを
交換する。次に、隣接ユニットのLAIDが、故障が発
生した場合にエラー・レポートの一部として送信できる
ように、各ユニットに局所的に記憶される。システムに
異なるユニットが接続されている可能性があるごとに、
保管された値が現在接続されているリンク・アダプタの
識別子となるように、上記の識別子が再び交換される。
【0036】さらに、本発明によれば、故障が発生した
とき、その故障を見つけた各ユニットから中央位置に故
障レポートが送られる。各故障レポートは、故障を検出
したリンク・アダプタのLAIDとそのリンクの他端に
あるリンク・アダプタのLAID(前に記憶された隣接
ユニットのLAID)を含む。レポートを中央位置で受
け取るとき、単一のリンクの両端からのレポートは、そ
れぞれ同じ2つのLAIDを含んでいるため、容易に識
別される。
【0037】故障が交換機を通って伝播する場合は、2
つのリンクが関係してくる。この場合、各リンクごとに
1対、合計2対の故障レポートが、その交換機のユニッ
ト識別子を共有し、かつ相互に近接した時間に発生する
ため、同じ故障からのものであることがわかる。この発
明が意図する方法および装置は、これらのエラー・レポ
ートを統合して、こうした場合に故障を容易に分離でき
るようにするものである。
【0038】他の状況、たとえば、あるユニット上の複
数のリンク・アダプタを故障させるようなユニット故障
が発生した場合、それらの接続に接続されたリンクの他
端から複数のレポートが生成される。これら複数のレポ
ートは、それぞれ故障ユニットの識別子を含む。本発明
によれば、これらのレポートは統合され、複数の故障レ
ポートが単一の接続された主ユニットを示すので、識別
されたユニットが故障していると推定される。
【0039】さらに、本発明の好ましい実施例によれば
、CPU/CUネットワークに接続された交換機または
制御装置は、そのネットワークへのリンク接続機構の1
つで故障を検出したとき、そのユニットが見つけた故障
に関する情報を収集する。次に、この故障情報は代替リ
ンク接続機構を介していずれかのCPUに送られる。 さらに、CPU/CUインターフェース・ネットワーク
に接続されたCPUは、そのネットワークへのリンク接
続機構の1つで故障を検出したとき、そのCPUが見つ
けた故障に関する情報を収集する。次に、CPUは、そ
のCPUが見つけた故障に関する情報を他のユニットか
ら送られてきた故障情報とともに共通位置に送り、そこ
で単一の発生事象からの故障レポートをすべて統合し分
析して、どのリンクに故障が発生したか、およびそのリ
ンクの各種の構成部品がその故障の原因となっている確
率を決定する。
【0040】本発明は、上記の分析からオペレータへの
単一のメッセージが得られ、サービス要員を(オペレー
タにより、または自動的に)1回呼ぶだけですむように
なることを意図している。その故障のレポートをすべて
統合した、故障の単一の記録が自動的に作成される。
【0041】さらに、本発明の好ましい実施例は、隣接
ユニットの報告という概念を利用し、代替レポート・リ
ンクを(上述のように)あらかじめ定義するとともに、
たとえば、故障したユニット自体がエラーを報告するこ
とができないような状況で、故障を分離し、レコードを
統合するのを助けるタイミング機構を併用して、故障の
位置検出および分析を行うことを意図したものである。
【0042】本発明のこの実施例によれば、その中で単
一の故障発生事象に関連するエラー・レポートを中央位
置で収集できる、あらかじめ定義されたタイム・ウィン
ドウを設定する。この期間に収集されたレポートは、後
で分析される。たとえば、所与のユニットが完全に故障
している場合は、そのユニットの隣接ユニットが、エラ
ー・レポート収集期間(ウィンドウ)中にエラーを報告
したことになる。しかし、故障したユニット自体は報告
しない。したがって、この実施例によれば、タイマ・ベ
ースの機構を使用して、代替のレポート経路を有し、所
定の期間中に報告を行わずその隣接ユニットがエラーを
報告するユニットに、高い故障確率を割り当てることが
できる。
【0043】本発明では、多くの代替実施例が意図され
ている。たとえば、上記のタイマ・ベースの機構を構成
表とともに使用する実施例、隣接ユニットの概念をタイ
マ・ベースの機構と併用し、またはタイマ・ベースの機
構なしで使用する実施例、隣接ユニットの概念を代替レ
ポート経路と併用し、または代替レポート経路なしで使
用する実施例等である。
【0044】本発明は、故障位置の情報を自動的に生成
するとともに、考えられる故障原因の診断を行ない、そ
れらがすべて、単一のエラー・メッセージの形でオペレ
ータに伝えられることを特徴とする。さらに、本発明は
、システム構成表を作成し維持する必要なしに、システ
ム故障を分析し診断できることを特徴とする。
【0045】さらに、本発明は、故障したユニット自体
が報告できない場合でも、また故障したユニットの主レ
ポート経路が使用不能な状況でも、リンク結合システム
中の複数のユニット(またはリンクあるいはその両方)
の1つに故障を正確に分離する機構を特徴とする。
【0046】本発明の上記その他の目的ならびに特徴と
、それらを達成する方法は、当業者には自明であり、本
発明自体は下記の詳細な説明と添付図を参照することに
より理解されよう。
【0047】
【実施例】図1は、データ処理システムのチャネル・サ
ブシステムと1組の制御装置との間で動的な接続を行う
ための、データ処理システムの入出力サブシステムのブ
ロック・ダイアグラムである。システムの動作の詳細に
ついては、前記特願平2−268281号明細書に記載
されている。しかし、完全を期するために、この情報の
一部についてここで復習することにする。
【0048】図1に示す入出力サブシステムは、それぞ
れ複数のリンク12〜18の一端に接続された複数のポ
ートPを有する動的交換機10を含む。リンクの1つ1
8は、動的交換機制御装置20に接続され、他のリンク
12〜17は、チャネルA22やチャネルB  24等
のチャネル、または制御装置26〜29の1つに接続さ
れている。制御装置26〜29は、それぞれ複数の周辺
装置D  30〜33を制御する。
【0049】チャネル22および24はそれぞれ、たと
えば市販のIBMシステム/370XAチャネル・サブ
システム上の単一のインターフェースでよい。チャネル
22および24は、複数の装置D  30〜33の入出
力装置と、データ処理システムの主記憶装置(図示せず
)との間で情報を転送するよう指示し、前記特許出願に
示されているように、チャネル経路を用いて異なる入出
力装置Dの接続の共通制御を行う。チャネル22および
24は、直列チャネルであり、データは直列形式で送受
信される。このことも前記の同時係属特許出願に説明さ
れている。
【0050】リンク12〜17はそれぞれ、制御装置と
チャネル、チャネルと動的交換機(リンク12、13等
)、制御装置と動的交換機(リンク14〜17等)、あ
るいは場合によっては、動的交換機と他の動的交換機と
を物理的に相互接続する2地点間の導線対である。
【0051】リンクの2本の導線は、各伝送方向に1本
ずつ、すなわち同時2方向通信路を形成する。リンクが
チャネルまたは制御装置に接続されるとき、リンクがそ
のチャネルまたは制御装置の入出力インターフェースに
接続されたという。リンクが動的交換機に接続されると
き、リンクはその動的交換機のポートPに接続されたと
いう。動的交換機が2つの動的交換機のポート間の接続
を行うとき、一方のポートに接続されたリンクは、他の
ポートに接続されたリンクに物理的に接続されたと見な
され、接続されている間、1つの連続したリンクと等価
となる。
【0052】図1に示すシステム中のリンクの導線は、
電気導体に限定されない。たとえば、リンク結合したシ
ステムは、光電子部品を相互接続するのに、電気導体の
代わりに光ファイバを使用してもよい。
【0053】動的交換機10は、これに接続された2つ
のリンクを物理的に相互接続する能力を提供する。動的
交換機10のリンク接続点は、動的交換機のポートPで
ある。単一の接続では、2つの動的交換機のポートPし
か相互接続できないが、同じ動的交換機内には同時に複
数の物理的接続が存在することができる。動的交換機1
0は、上記米国特許出願第07/429267号明細書
(日本出願特願平2−268281号明細書)に合体さ
れた米国特許第4605928号、第4630045号
、第4635250号明細書(「交換機」特許)に開示
された方法で生成することができる。
【0054】図4は、動的交換機10の詳細ブロック図
であり、2個だけの動的スイッチ端末ポートPA150
とPB151が示されている。端末ポートPA150と
PB151は、両側マトリクス152を介して接続され
ている。マトリクス152は複数の並列水平導線A〜D
および複数の並列垂直導線A’〜D’から構成されてい
る。導線AとB’およびBとA’のそれぞれの交点のス
イッチ154および155は、初期接続制御によって閉
されており端末ポート150および151の双方向接続
をつくっている。マトリクス152の実際の接続はマト
リクス・アドレス出力母線158の上のマトリクス制御
器によって制御されている。マトリクス制御器156に
は、動的交換機10の端末ポートの接続を記憶する記憶
装置、接続が動的または静的のいずれであっても、つく
ることが許容される接続、および動的交換機10の動作
用の他の情報が含まれている。
【0055】マトリクス制御器156は、前述のマトリ
クス・アドレス出力母線158によりマトリクス152
に接続されており、端末ポート入力母線160を介して
、端末ポート150および151からデータを受信し、
端末ポート出力母線162を介して端末ポート150お
よび151へデータを送る。母線158からの制御信号
は、スイッチ154および155などのマトリクス15
2の交点スイッチを制御する。
【0056】動的接続を要求するのに必要な情報は、母
線160を介してマトリクス制御器へ端末ポートPによ
って送られる。そしてマトリクス制御器156は、要求
された接続が拒否されるか許容されるかという情報で端
末ポートと応答する。各端末ポートPには、初期化の時
その端末ポートに割り当てられた端末ポート番号と端末
ポートの状態を記憶する記憶装置166がある。かくて
端末ポートは、端末ポートがビジーの時、拒否フレーム
を要求ソースに送り返し、または端末ポートがビジーで
ない時、要求が許容されるかどうかを調べるべき要求さ
れた接続について、情報をマトリクス制御器156に与
える。これから説明されるであろうように、端末ポート
Pが要求をマトリクス制御器156に送る時は、端末ポ
ートPの記憶装置166からの端末ポート番号が含まれ
ているので、マトリクス制御器はどの端末ポートが要求
を送ったかがわかる。
【0057】動的スイッチ制御装置20は、マトリクス
152の中の静的接続をつくったり、端末ポートへのア
クセスをブロッキングまたは端末ポートをフェンシング
したり、端末ポートとだけ接続するように端末ポートを
集めてパーティションしたりするために動的スイッチ制
御装置入力母線168によってマトリクス制御器156
に接続されている。オペレータ・コンソール170は動
的スイッチ制御装置の部分であって前述の情報を入力す
る。すなわち、その情報はリンク18を介して動的スイ
ッチ制御装置20に送られ、リンク18は、動的交換機
10の端末ポートの1つに接続されている。
【0058】各端末ポートには、アイドル・ジェネレー
タ(IG)165があり、これが端末ポートのリンクを
通しての伝送のためのアイドル文字をつくりだす。
【0059】各端末ポートは、その記憶装置166の状
態とそのリンク等にしたがってその端末ポートの状態を
決定する状態マシン(SM)167によって、動的に接
続された端末ポートからのフレームの区切り記号にもと
づいて自身の状態を決定する。
【0060】接続が行なわれると、2つの動的交換機の
ポートと、それぞれの2地点間リンクは、上記の「交換
機」特許に記載されているように、動的交換機10内の
交換機マトリックスによって相互接続され、2つのリン
クは、接続されている間、1つの連続したリンクとして
扱われる。送信された情報のフレームが2つの接続され
た交換機ポートPのうちの一方によって受信されると、
そのフレームは通常、他方のポートのリンク上を伝送す
るため、一方のポートから他方のポートに渡される。
【0061】図1に示す交換機を使用する通信は、リン
ク・レベルと装置レベルの2つの階層レベルの機能およ
び直列入出力プロトコルに従う。リンク・レベルのプロ
トコルは、フレームが送信されるときに使用される。こ
のプロトコルは、フレームの構造、大きさ、および保全
性を決定する。リンク・プロトコルはまた、動的交換機
10を介しての接続と、本発明には無関係の他の制御機
能を実現する。各チャネルおよび各制御装置は、リンク
・プロトコルの実施例である、リンク・レベルの機能を
含んでいる。装置レベルは、入出力装置から転送された
データ等のアプリケーション情報をチャネルに伝えるの
に使用される。アプリケーション情報または制御を含む
フレームを、装置レベルのフレームと称する。リンク・
レベルのプロトコルにのみ使用されるフレームを、リン
ク制御フレームと称する。この両種のフレームの例は、
前記の特願平2−268281号明細書に記載されてい
る。
【0062】各リンク・レベル機能には、リンク・アド
レスと称する固有のアドレスが割り当てられている。リ
ンク・レベル機能へのリンク・アドレスの割当ては、リ
ンク・レベルの機能が初期設定を実行する際に行なわれ
る。交換機を介して送られた各フレームは、フレームの
ソースと宛先を識別するリンク・レベル・アドレッシン
グ情報を含む。具体的には、このアドレッシング情報は
、送信側リンク・レベル機能のリンク・アドレス(ソー
ス・リンク・アドレス)と、受信側リンク・レベル機能
のリンク・アドレス(宛先リンク・アドレス)からなる
。交換機は、フレームを受信するポートから、フレーム
を指定の宛先へ送信する正しいポートへの接続を行うた
めに、このアドレッシング情報を使用する。
【0063】図2は、3つのプロセッサ(212、21
4、216)が、2つの交換機(222、224)を介
して4つの制御装置(232、234、236、238
)に接続され、これらの制御装置用の1組のリンク接続
機構(アダプタ)が、対応する固有のリンク・アダプタ
ID(LAID番号)とともに示されている以外は、図
1と同様のブロック・ダイアグラムである。図2はまた
、それぞれリンク280〜282を介してホスト・プロ
セッサ(CPU)212、214、216に接続された
、複数のサービス・プロセッサ(SP)270〜272
を示す。これらのサービス・プロセッサの目的と、それ
らの(破線290および291を介しての)相互接続に
ついては後で説明する。
【0064】表1は、図2に示す各リンクの端部に関連
するLAID番号をまとめたもので、各リンクについて
、「隣接ユニット」、すなわちあるリンクの対向する端
部にあるリンク・アダプタの固有のLAID番号を示す
【表1】                       LAI
D対/隣接ユニット情報          リンク 
             LAID  1     
   LAID  2          240  
            212−1        
  222−1          242     
         212−2          2
24−1          244        
      214−1          222−
2          246           
   214−2          224−2  
        248              
216−1          222−3     
     250              216
−2          224−3        
  252              222−4 
         232−1          2
54              222−5    
      234−1          256 
             222−6       
   236−1          258    
          224−4          
234−2          260       
       224−5          236
−2          262          
    224−6          238−1

0065】本発明の1実施例によれば、各リンクに関連
するLAID対が、システム全体の構成表の作成または
維持を必要とせずに、エラー・レポートの生成に有利に
使用できる「隣接ユニット」情報を形成する。
【0066】図2および表1に示す各LAID番号は、
所与のユニットIDと所与のユニットの特定のアダプタ
を示す固有の番号(上述のインターフェースID、また
はポート番号)を組み合わせたものである。
【0067】具体的には、表1を参照すると、たとえば
、リンク256によって結合されたユニットの隣接ユニ
ット情報は、LAID対222−6と236−1である
。また、表1の各行は、リストされている各リンクの対
向する端部にあるユニットの隣接ユニット情報を示す。 次に、本発明の好ましい実施例によれば、この隣接ユニ
ット情報が、どのように故障の位置検出および分析に利
用できるかを説明する。
【0068】本発明の好ましい実施例によれば、図2の
ユニットのいずれかが最初に隣接ユニットに相互接続さ
れるとき、LAIDが交換され記憶される。個々のLA
ID番号が存在しており、それが各ユニットに局所的に
記憶されるだけでよいので、これを行う手段は、前記の
同時係属特許出願に記載されたシステム中にすでに存在
する。
【0069】そこで、CU236と相互接続された交換
機222に関する例について説明すると、これらのユニ
ットが最初に接続されるとき、LAID対222−6と
236−1が、リンク256の各端部に(すなわち、リ
ンク256に接続されたユニットに局所的に)記憶され
、故障が発生した場合にエラー・レポートの一部として
送るため、隣接ユニット情報が使用可能になる。
【0070】本発明の好ましい実施例によれば、異なる
ユニットが(リンクを介して)システムに接続されてい
る可能性が存在するごとに、接続リンクの両端間でLA
IDが交換され、上記のように将来の使用のため記憶さ
れる。
【0071】さらに、本発明によれば、故障が発生した
とき、その故障を見つけた各ユニットから中央位置に故
障レポートが送られる。この説明では、サービス・プロ
セッサ272を中央位置とする。別の例として、このサ
ービス・プロセッサを、リンク290、291を介して
(図2に示すように)エラー・レポートを処理するPC
が接続されているLAN等に相互接続することもできる
【0072】本発明は、中央位置に送られたエラー・レ
ポートから、中央位置で機能する単一の故障メッセージ
を生成する手段を意図している。このような手段につい
ては、後で図3を参照して説明する。しかしこの時点で
は、各故障レポートが中央位置に送られること、および
各故障レポートが、故障を検出したリンク・アダプタの
LAIDと、リンクの他端にあるのリンク・アダプタの
LAID(以前に記憶されている、故障を報告したユニ
ットの隣接ユニットのLAID)を含むことを理解され
たい。
【0073】レポートを中央位置で受け取ったとき、単
一リンクの両端からのレポートは、同じ2つのLAID
を含むため、容易に識別される。
【0074】例についての説明を続けると、図2のリン
ク256に故障が起こった場合、本発明は、LAID対
222−6、236−1を何らかの方法で交換機ユニッ
ト222とCU236から中央位置(サービス・プロセ
ッサ272等)に送ることを意図している。明らかに、
交換機ユニット222からのLAID対は、故障がない
と見られるリンクを介して通信できるが、CU236か
らのLAID対は、後で説明するように、いずれかの代
替経路を介して通信する必要がある。
【0075】故障が交換機を介して伝播する場合は、2
つのリンクが関係してくる。すなわち、別の例を考える
と、図2のホスト・プロセッサ214からCU238へ
の経路上に故障がある場合は、リンク246および26
2が関係してくる。この場合、交換機(交換機224)
のユニット識別子を共有し、かつ相互に近接した時間に
発生するため、各リンクごとに1対、合計2対の故障レ
ポートが、同じ故障からのものであると推定される。本
発明が意図する方法および装置は、このようなエラー・
レポートを統合して、LAID対を中央位置に送った後
、こうした場合に故障を容易に分離できるようにするも
のである。
【0076】さらに別の例を考えると、ユニット(たと
えば交換機222)の故障が発生した場合、そのユニッ
トの複数のリンク・アダプタが故障し、それらの接続に
接続されたリンクの他端から(この例では、交換機22
2に接続されたすべてのユニットから)複数のレポート
が生成される。これら複数のレポートは、それぞれ故障
ユニットの識別子を含む。本発明によれば、これらのレ
ポートは、(中央位置に報告された後)単一の故障メッ
セージを生成する手段によって中央位置で統合される。 複数の故障レポートが単一の接続ユニットを示すので、
識別されたユニットが故障していると(単一の故障メッ
セージを生成する手段によって)推定される。
【0077】さらに、本発明の好ましい実施例によれば
、CPU/CUネットワークに接続された交換機または
制御装置は、そのネットワークへのリンク接続機構の1
つで故障を検出したとき、その制御装置が見つけた故障
に関する情報をも収集する。次にこの故障情報は、代替
リンク接続機構を介していずれかのCPUに送られる。
【0078】このように、上記のリンク256の故障に
関する例では、本発明は、故障情報を送る代替リンク(
リンク260等)をあらかじめ割り当てておくことを意
図している。このような手段により、CU236から送
られた故障情報は、リンク256が動作不能のときでも
、中央位置(この例ではサービス・プロセッサ272)
に戻ることができる。この例では、CU236は、リン
ク260、250、282、およびユニット216、2
24を介してSP272と通信することができる。
【0079】さらに、CPU/CUインターフェース・
ネットワークに接続されたCPU(ホスト・プロセッサ
)は、そのリンク接続機構の1つに故障を検出したとき
、そのCPUが検出した故障に関する情報を収集する。 次に、CPUは、そのCPUが検出した故障に関する情
報を、他のユニットからそのCPUに送られた故障情報
とともに共通位置に送信し、そこで単一の故障からの故
障レポートをすべて統合した後、どのリンクに故障が発
生したか、およびリンクの各種構成部品がその故障の原
因となる可能性を決定するために分析する。このように
、リンク256の故障に関するエラー情報は、CPU2
12を介してSP272にも報告される。
【0080】さらに、本発明の好ましい実施例は、隣接
ユニット・レポートの概念と、(上述のような)あらか
じめ定義された代替レポート・リンクを、タイミング機
構とともに使用して、故障の位置決めと分析を行って、
たとえば、故障したユニット自体がエラーを報告するこ
とができないような状況でも、故障を分離しレコードを
統合するのを助けることを意図している。タイミング機
構は、エラー・レポートから単一の故障メッセージを生
成する手段として実施することが好ましい。
【0081】本発明の好ましい実施例によれば、エラー
・レポート自体は簡単な構造である。各レポートは、報
告ユニットとそのリンクで結合された隣接ユニットを示
すだけでなく、検出された故障の症状の指示もレポート
の一部として通信する。
【0082】この情報を中央位置に提供する形態の1つ
は、報告ユニットに記憶されているLAID対(すなわ
ち隣接ユニット情報)を送ることである。この情報を提
供する代替方法は、報告ユニットがそのユニット自体の
IDおよび関連するリンク情報を中央位置に供給し、そ
こで接続性(すなわち報告ユニットが接続されている隣
接ユニット)を決定するために、(動的に維持された構
成表を使用して)表の検索が行なえるようにするもので
ある。
【0083】故障の症状については、リンクで結合され
たシステム(たとえば、光ファイバ、電気式等)の性質
に応じて、光の消失(LOL)、リンクが故障により動
作不能となったことを示す信号化された動作不能シーケ
ンス(NOS)等の指示が、エラー・レポートの一部と
して送られることが意図されている。
【0084】本発明の好ましい実施例によれば、その中
で単一の発生事象に関するエラー・レポートを中央位置
で収集できる、あらかじめ定義されたタイム・ウィンド
ウを確立する。本発明の1実施例では、この間隔の長さ
として3分を選択したが、これは単一の故障に関する情
報を収集するには十分すぎる長さである。
【0085】間隔の長さは、本発明を限定する要素を意
味するものではない。またエラー・レポートを収集し分
析する特定の方法でもない。エラー・レポートを収集し
分析する好ましい方法について、後で図3を参照して説
明する。
【0086】エラー・レポートを収集し分析する好まし
い方法は、リンクの両端が故障を見つけたとき、簡単な
問題に回答を与える、すなわちリンクのどちらの端部(
またはリンク自体)が故障の原因であるかを判定するも
のである。再び図2を参照して、たとえば、リンク25
0によって結合された2つのユニット216、224を
例として、故障を収集し分析する好ましい方法について
説明する。
【0087】本発明によれば、ユニット216の論理回
路がリンク250を故障させた場合、ユニット216、
224の両方が、リンク250の故障を中央位置に報告
する。また、ユニット224がリンクを故障させた場合
も、2つのレポートが生成され中央位置に送られる。リ
ンク250自体が故障した場合も、2つの故障レポート
が生成されることに留意されたい。
【0088】故障の原因が違えば、ユニット216、2
24から報告される症状も異なる公算が高い。本発明に
よれば、ユニット216、224からの2つのレポート
が、1つの状態表に統合され、異なる症状がわかれば、
統合された情報から(経験に基づいて)ユニットまたは
リンクへの分離をもたらす単一のレポートが得られ、シ
ステムからオペレータに、問題の診断を準備した修理要
員を適切な場所に派遣するように告げることができる。
【0089】  本発明の好ましい実施例によれば、レ
ポートの統合は、任意選択のタイミング機構を使用して
行なわれる。いずれかのレポートが、状態表のある場所
(たとえば、1組のサービス・プロセッサが接続されて
いるLANに結合されたPC上等)に達すると、タイマ
が始動する。タイマが時間切れになったとき、その期間
に受信されたレポートを検査して、そのうちのどれがタ
イマが時間切れになったレポートと相関するかを調べる
。レポートを時間切れになったレポートと相関させる好
ましい方法は、LAID情報を用いるものであるが、他
の相関規則も使用できる。相関するレポートを、分析の
ために集め、これを表と一緒にして、下記に説明する方
式でエラー事象の経験に基づく診断を行うことができる
。相関され分析されたレポートすべてのタイマは停止す
る。その期間に収集された他のレポートのタイマは継続
する。それらのタイマがそれぞれ時間切れになったとき
も、同じプロセスに従う。
【0090】表自体は、共通の経験から作成することが
できる。たとえば、リンクの両側に接続されたユニット
が、(光ファイバ・システムで)両方とも光の消失を経
験すると、リンク自体が損傷または遮断されたと完全に
推定できる。他の例として、一方のユニットが光の消失
(LOL)を検出し、他方のユニットが、第1のユニッ
トが光の消失を検出して生成した動作不能シーケンス(
NOS)を検出した場合、リンクは作動可能であり、N
OSを検出したユニットのドライバ、またはLOLを検
出したユニットのレシーバに問題がある公算が高い。
【0091】図3に示す表はいくつかの項目を含むが、
そのうちの2つ(項目501、502)は、単一のエラ
ー・メッセージ(および診断)をオペレータに与えるた
めに上記の報告された症状およびIDと共に使用するこ
とのできる、経験に基づく表の例に対応するものである
【0092】任意選択のタイミング機構は、リンクで結
合されたシステム中のユニットが完全に故障したときに
も有用である。この場合も、本発明は、エラー情報の非
同期レポート、あらかじめ定義されたウィンドウ中での
エラー・レポートの収集、および複数レポート中の隣接
ユニットであるユニットがおそらく故障ユニットである
ことを示すアルゴリズムを使用することを意図している
【0093】単一の故障メッセージを生成する手段は、
たとえばレポートを関係づけ合成する(隣接ユニット情
報を用いて行うことが好ましい)コンピュータ・プログ
ラム、ハードウェア、またはファームウェアによって実
現できる。本発明の教示に従って単一の故障メッセージ
を生成する手段を実施するための適当な方法ステップに
ついては、後で説明する。
【0094】単一の故障メッセージを生成する手段は、
上記のタイミング機構を使用して、たとえば、故障した
隣接ユニットがエラー・レポートを送信しない場合に、
隣接ユニットとの突き合わせの試みを中止することがで
きる。明らかに、あるユニットが完全に故障した場合、
そのユニットの隣接ユニットが、エラー・レポート収集
期間内(ウィンドウ内)にエラーを報告するはずである
。しかし、故障したユニット自体は報告しない。
【0095】このように、この実施例によれば、タイマ
・ベースの機構を使用して、隣接ユニットがエラーを報
告するとき、所定の期間内に報告しないユニットに高い
故障の確率を割り当てる。
【0096】具体的には、上記の方法は、上述のように
、ソフトウェア、ハードウェア、マイクロコード、また
はソフトウェア、ハードウェア、マイクロコードの組合
せで実施することができる。例としてソフトウェアを使
用する場合、この方法を実施するプログラムは、上記の
LANに結合したPC、サービス・プロセッサ、または
図2に示すホスト・プロセッサの1つでも実行すること
ができる。
【0097】受信した各レポートの間隔タイマが時間切
れになったとき、単一の故障メッセージを生成する手段
は、たとえば、隣接ユニット情報の突き合わせ(好まし
いシナリオ)、または当業者に周知の技法を利用した他
の突き合わせアルゴリズムの使用により、関連レポート
を集めることができる。関連レポートを集めた後、(上
記の状態表を使用した)表の検索、または当業者が周知
の方法を利用した他の突き合わせアルゴリズムの使用に
より、合成されたエラー・レコードが生成される。次に
、合成されたエラー・レコードから、故障の位置と、経
験に基づく問題の診断の指示とを含むエラー・メッセー
ジを生成することができる。
【0098】図3は、本発明の原理に従って、単一の故
障メッセージを生成するのに使用できる状態表の内容の
例を示す。
【0099】具体的には、図3に表500として示した
もののような状態表は、表の最上部に示すユニットから
送られるエラー・メッセージ中で報告される症状を示す
、複数の項目(501、502等)を含む。たとえば、
項目501は、図2のCPU212が報告するLOLを
(部分的に)反映する。
【0100】表500の最上部の見出しは、送られたエ
ラー・レポートが、隣接ユニット情報を、具体的には、
CPU212の下の項目にLAID対212−1と22
2−1を含むことを示す。項目501の一部として、交
換機222から受信したレポートの内容も示されている
。交換機222からのレポートは、LOLと、送信され
た隣接ユニット情報がLAID対222−1と212−
1であることも示す。これらの2つのレポートは一致し
たLAID番号を有し、従って表の1項目に統合されて
いる。
【0101】この表は、経験によれば、相互接続された
ユニットがそれぞれLOLを検出したときは相互接続媒
体が故障していることが分かっているので、2つのLO
L症状がある場合は(CPU212と交換機222を相
互接続する)ケーブル240が故障していると分析され
るように構成されている。
【0102】項目502も、CPU212と交換機22
2から提供される隣接ユニット情報を使用して、同様に
構成することができる。しかし、この場合は、CPU2
12がNOSを検出し、交換機222がLOLを検出し
たので、CPU212のポート1に関連するドライバが
故障であり、または交換機222のポート1に関連する
レシーバが故障であるという、経験に基づく診断が得ら
れることになる。
【0103】上記の例は、本発明の動作の原理を例示し
たものであり、明らかに、当業者には、多くの変更およ
び修正が明らかなはずである。たとえば、あらかじめ定
義されたタイム・ウィンドウの代わりに、他の少なくと
も1つのユニットが報告すると期待される場合、1つの
報告ユニットだけが関係するデータを処理する前に、い
くつかの項目を収集することができる。また、状態表を
隣接ユニット情報ではなく構成表とともに使用すること
もできる。また、システムに織り込みたい冗長度の量に
応じて、可変数の代替レポート経路に対する表の項目が
作成できる。
【0104】
【発明の効果】以上述べたように、本発明によれば、前
記特許出願(特願平2−268281)に記載されてい
るもののようなネットワークで、これらの複数のリンク
接続機構の利点と、CPUが相互に、または中央位置と
あるいはその両方で通信する能力を利用して、ネットワ
ーク中のユニットが見つけた故障の情報を、主リンクだ
けでなく(これ自体が故障することがある)、代替レポ
ート・リンクをも介して収集できるようになる。
【図面の簡単な説明】
【図1】分散ネットワーク、具体的には複数のリンクを
介し動的交換機を経て複数の制御装置に接続された複数
のチャネルを有するコンピュータ・システムのブロック
・ダイアグラムである。
【図2】図1に示したものと類似のネットワークの、制
御装置用の1組のリンク接続機構(アダプタ)とそれに
対応する固有のリンク・アダプタIDを示すブロック・
ダイアグラムである。
【図3】本発明の原理に基づいて、故障の位置と考えら
れる原因とを示す、単一のエラー・メッセージを生成す
るのに使用できる表の内容の例を示す図である。
【図4】図1の動的交換機の詳細ブロック図である。
【符号の説明】
10  動的交換機 212  ホスト・プロセッサ 214  ホスト・プロセッサ 216  ホスト・プロセッサ 222  交換機 224  交換機 232  制御装置 234  制御装置 236  制御装置 238  制御装置

Claims (30)

    【特許請求の範囲】
  1. 【請求項1】リンク結合システムが複数のリンクによっ
    て相互接続された複数のユニットを含み、さらに上記ユ
    ニットが中央のレポート位置に接続されている、システ
    ム自体の内部から発生する故障レポートを利用して該シ
    ステムにおける故障を分離し分析する装置において、(
    a)ネットワーク中で故障が発生するたびに、これを検
    出する手段と、 (b)検出された故障のレポートを上記中央のレポート
    位置に送る手段と、 (c)上記中央のレポート位置に送られた故障レポート
    を互いに関連づける手段と、 (d)関連づけられた故障レポートから単一のエラー・
    メッセージを発生させる手段とを備えた、リンク結合シ
    ステムにおける故障を分離し分析する装置。
  2. 【請求項2】上記の伝送手段がさらに、検出された故障
    のそれぞれに対して少なくとも1つの故障レポートを生
    成する手段を有し、各レポートは少なくとも、故障を報
    告するユニットの識別と、報告ユニットによって故障が
    検出されたリンクの識別と、検出された故障の症状の指
    示とを含むことを特徴とする、請求項1の装置。
  3. 【請求項3】関連づけられた故障レポートから単一のエ
    ラー・メッセージを発生させる上記の手段が、少なくと
    も一部は、上記の検出された故障の症状の指示に基づい
    て、故障の原因を分離し診断する働きをすることを特徴
    とする、請求項2の装置。
  4. 【請求項4】検出された故障を関連づける上記の手段が
    、所定の期間内に故障レポートを収集する働きをするこ
    とを特徴とする、請求項1の装置。
  5. 【請求項5】検出された故障を関連づける上記の手段が
    さらに、上記の所定の期間内に収集されたレポートにつ
    いて故障レポートの関連づけを行うことを特徴とする、
    請求項4の装置。
  6. 【請求項6】上記の所定の期間が、上記中央のレポート
    位置における故障レポートの受信および収集によって開
    始することを特徴とする、請求項4の装置。
  7. 【請求項7】上記の伝送手段が、上記の少なくとも1つ
    の故障レポートの一部として、隣接ユニット情報を提供
    することを特徴とする、請求項1の装置。
  8. 【請求項8】検出された故障を関連づける上記の手段が
    、上記の隣接ユニット情報を利用して関連づけを行うこ
    とを特徴とする、請求項7の装置。
  9. 【請求項9】上記の隣接ユニット情報がさらに、少なく
    とも1対のリンク・アダプタ識別子(LAID)を有し
    、各LAIDの第1の識別子が、伝送ユニットと、故障
    が検出される所与のリンクに結合された伝送ユニット上
    のリンク・アダプタとを識別し、さらに各LAIDの第
    2の識別子が、上記ユニットと、上記の所与のリンクの
    対向する端部に取り付けられたリンク・アダプタとを識
    別することを特徴とする、請求項7の装置。
  10. 【請求項10】上記の伝送手段が、上記のシステムの少
    なくとも1つのリンクで結合されたユニットを含むこと
    を特徴とする、請求項1の装置。
  11. 【請求項11】上記の伝送手段が、上記のシステムの少
    なくとも1対のリンクで結合されたユニットを含むこと
    を特徴とする、請求項1の装置。
  12. 【請求項12】上記の伝送手段がさらに、上記のシステ
    ムの各ユニットごとに、1組のあらかじめ定義された主
    レポート経路または代替レポート経路を含むことを特徴
    とする、請求項1の装置。
  13. 【請求項13】検出された故障を関連づける上記の手段
    が、システム全体の構成表を利用して故障レポートの関
    連づけを行うことを特徴とする、請求項1の装置。
  14. 【請求項14】検出された故障を関連づける上記の手段
    がさらに、 (a)所定の期間内に故障レポートを収集する手段と、
    (b)各故障レポートの一部として提供される隣接ユニ
    ット情報を利用して、上記の所定の期間内に収集された
    故障レポートを互いに関連づける手段とを含むことを特
    徴とする請求項1の装置。
  15. 【請求項15】上記の各ユニットが、リンク上での着信
    信号の消失に応答して、上記リンク上で所定の発信信号
    を送る手段を含むことを特徴とする、請求項1の装置。
  16. 【請求項16】リンクの1端部にあるユニットから、上
    記リンク上での着信信号の消失を示す第1の故障レポー
    トを受け取り、上記リンクの他端にあるユニットから、
    上記のリンク上に上記の所定の信号が存在することを示
    す第2の故障レポートを受け取ったことに応答して、上
    記のメッセージ発生手段が、上記リンクの1端にあるレ
    シーバまたは上記リンクの他端にあるドライバが考えら
    れる故障源であることを示す、エラー・メッセージを生
    成することを特徴とする、請求項15の装置。
  17. 【請求項17】上記リンクが、光ファイバ・リンクであ
    り、上記の各ユニットが、リンク上での着信光の消失に
    応答して、上記のリンク上に所定の発信シーケンスを発
    生する手段を含むことを特徴とする、請求項1の装置。
  18. 【請求項18】リンク結合システムが複数のリンクによ
    って相互接続された複数のユニットを含み、さらに上記
    ユニットが中央のレポート位置に接続されている、シス
    テム自体の内部から発生する故障レポートを利用して該
    システムにおける故障を分離し分析する装置において、
    (a)上記の複数のユニットに関連し、それぞれに固有
    のリンク・アダプタ識別子(LAID)が割り当てられ
    ている、上記のユニットを上記の複数のリンクに結合す
    るための複数のリンク・アダプタと、 (b)リンクに結合された所与のユニットにある各アダ
    プタのLAIDを、上記の所与のユニットに結合された
    各遠隔アダプタのLAIDとともに、各ユニットに局所
    的に記憶して、各ユニットのリンクで結合された各リン
    ク・アダプタに対する隣接ユニット情報の、局所的に記
    憶されたLAIDの対を形成する手段と、(c)上記の
    隣接ユニット情報ならびに検出された故障の症状を含む
    故障レポートを、故障を検出した各ユニットから上記の
    中央のレポート位置に伝送する手段と、(d)上記の故
    障レポートを上記の中央のレポート位置に記憶する手段
    と、 (e)上記の記憶された故障レポートを互いに関連づけ
    る手段と、 (f)関連づけられた故障レポートから単一のエラー・
    メッセージを発生させる手段とを含む、リンク結合シス
    テムにおける故障を分離し分析する装置。
  19. 【請求項19】(a)ネットワーク中で故障が発生した
    ときそれを検出するステップと、 (b)検出された故障のレポートを報告位置に伝送する
    ステップと、 (c)上記の位置に伝送された故障レポートを互いに関
    連づけて、どのレポートが特定のエラー事象に関係する
    かを判定するステップと、 (d)上記の特定のエラー事象に関係する関連づけられ
    た故障レポートから、故障分離および診断情報を含む、
    単一のエラー・メッセージを生成するステップとを含む
    、リンクで結合されたシステムにおける故障を分離する
    方法。
  20. 【請求項20】上記の関連づけるステップを所定の期間
    内に実行することを特徴とする、請求項19の方法。
  21. 【請求項21】上記の関連づけるステップがさらに、(
    a)上記の報告位置で故障レポートを受け取ったのに応
    答して、データ収集期間を開始するステップと、(b)
    上記期間の開始後、所定の時間が経過したとき、上記の
    データ収集期間を終了するステップと、(c)上記の期
    間内に上記の位置で受け取ったレポートを互いに関連づ
    けるステップとを含むことを特徴とする、請求項19の
    方法。
  22. 【請求項22】各レポートを受け取ったとき期間が開始
    されることを特徴とする、請求項21の方法。
  23. 【請求項23】上記の伝送ステップが、上記のシステム
    中の故障を検出した各ユニットによって実行され、かつ
    各故障レポートが、少なくとも故障レポートを伝送する
    ユニットの識別と、伝送ユニットによって故障が検出さ
    れたリンクの識別と、検出された故障の症状の指示とを
    含むことを特徴とする、請求項19の方法。
  24. 【請求項24】上記の故障レポートの少なくとも1つが
    、伝送ユニットに関する隣接ユニット情報を含むことを
    特徴とする、請求項19の方法。
  25. 【請求項25】上記の伝送ステップがさらに、各レポー
    トを、あらかじめ定義された主レポート経路または代替
    レポート経路を介して、上記の報告位置に伝送すること
    を試みるステップを含むことを特徴とする、請求項19
    の方法。
  26. 【請求項26】各リンクが、リンクによって相互接続さ
    れたユニットに関連する各リンク・アダプタを介して1
    対のユニットを結合し、上記の各リンク・アダプタが、
    それ自体を上記ユニットのネットワーク中の他のリンク
    ・アダプタと区別する固有の識別子を有する、ユニット
    のネットワーク中の故障を分離する方法において、(a
    )リンク・アダプタが故障を検出したのに応答して、少
    なくとも上記故障の検出された症状と、上記の故障を検
    出したリンク・アダプタの識別子とを含む、故障レポー
    トを報告位置に伝送するステップと、(b)上記の故障
    レポートから単一のエラー・メッセージを生成するステ
    ップとを含む、ユニットのネットワーク中の故障を分離
    する方法。
  27. 【請求項27】上記の各リンク・アダプタの識別子を、
    1対のユニットを結合する各リンクの他端にあるリンク
    ・アダプタに伝送するステップを含むことを特徴とする
    、請求項26の方法。
  28. 【請求項28】上記の故障レポートの少なくとも1つが
    、上記の故障を検出したリンク・アダプタが取り付けら
    れているリンクの対向端にあるリンク・アダプタの識別
    子の形の、隣接ユニット情報を含むことを特徴とする、
    請求項26の方法。
  29. 【請求項29】上記の識別子が、ユニットを識別する第
    1の部分と、そのユニットのリンク・アダプタを識別す
    る第2の部分とを有することを特徴とする、請求項26
    の方法。
  30. 【請求項30】上記の生成ステップがさらに、(a)上
    記の報告位置で故障レポートを受け取ったのに応答して
    、データ収集期間を開始するステップと、(b)上記期
    間の開始後、所定の時間が経過したとき、上記のデータ
    収集期間を終了するステップと、(c)上記の期間内に
    受け取ったレポートから上記のメッセージを生成するス
    テップとを含むことを特徴とする、請求項26の方法。
JP3065348A 1990-04-30 1991-03-07 リンク結合システム内の故障を分離し分析する装置及び方法 Expired - Lifetime JPH0793624B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/516,387 US5157667A (en) 1990-04-30 1990-04-30 Methods and apparatus for performing fault isolation and failure analysis in link-connected systems
US516387 1990-04-30

Publications (2)

Publication Number Publication Date
JPH04229741A true JPH04229741A (ja) 1992-08-19
JPH0793624B2 JPH0793624B2 (ja) 1995-10-09

Family

ID=24055351

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3065348A Expired - Lifetime JPH0793624B2 (ja) 1990-04-30 1991-03-07 リンク結合システム内の故障を分離し分析する装置及び方法

Country Status (4)

Country Link
US (1) US5157667A (ja)
EP (1) EP0455442B1 (ja)
JP (1) JPH0793624B2 (ja)
DE (1) DE69118233D1 (ja)

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5253184A (en) * 1991-06-19 1993-10-12 Storage Technology Corporation Failure and performance tracking system
US5668986A (en) * 1991-10-02 1997-09-16 International Business Machines Corporation Method and apparatus for handling data storage requests in a distributed data base environment
SE469543B (sv) * 1991-12-12 1993-07-19 Televerket Anordning foer reservvaeg vid mobilt trunkerat telekommunikationssystem
US5383201A (en) * 1991-12-23 1995-01-17 Amdahl Corporation Method and apparatus for locating source of error in high-speed synchronous systems
GB9202666D0 (en) * 1992-02-07 1992-03-25 Madge Networks Ltd Communication system
US5357608A (en) * 1992-02-20 1994-10-18 International Business Machines Corporation Configurable, recoverable parallel bus
GB9303640D0 (en) * 1993-02-23 1993-04-07 British Telecomm Object-oriented correlation
US5426774A (en) * 1993-04-06 1995-06-20 Honeywell Inc. Method for maintaining a sequence of events function during failover in a redundant multiple layer system
US5519830A (en) * 1993-06-10 1996-05-21 Adc Telecommunications, Inc. Point-to-multipoint performance monitoring and failure isolation system
FI98974C (fi) * 1993-09-24 1997-09-10 Nokia Telecommunications Oy Menetelmä sektoroidun tukiaseman toiminnan varmistamiseksi sekä tukiasema
US5603059A (en) * 1994-04-22 1997-02-11 Pitney Bowes Inc. Software architecture system having a virtual I/O channel including multi-layered communication interface in between virtual stations and physical modules
US5528516A (en) 1994-05-25 1996-06-18 System Management Arts, Inc. Apparatus and method for event correlation and problem reporting
US5483637A (en) * 1994-06-27 1996-01-09 International Business Machines Corporation Expert based system and method for managing error events in a local area network
US5539877A (en) * 1994-06-27 1996-07-23 International Business Machine Corporation Problem determination method for local area network systems
US5673386A (en) * 1994-06-29 1997-09-30 U S West Technologies, Inc. Method and system for identification of software application faults
JP2886093B2 (ja) * 1994-07-28 1999-04-26 株式会社日立製作所 障害処理方法および情報処理システム
FR2724026B1 (fr) * 1994-08-29 1996-10-18 Aerospatiale Procede et dispositif pour l'identification de pannes dans un systeme complexe
US5737600A (en) * 1994-09-12 1998-04-07 International Business Machines Corporation Method and system for log management in a coupled data processing system
US5619645A (en) * 1995-04-07 1997-04-08 Sun Microsystems, Inc. System isolation and fast-fail
JP3532289B2 (ja) * 1995-04-27 2004-05-31 三菱電機株式会社 計算機システム解析装置
US5594861A (en) * 1995-08-18 1997-01-14 Telefonaktiebolaget L M Ericsson Method and apparatus for handling processing errors in telecommunications exchanges
US5590120A (en) * 1995-10-31 1996-12-31 Cabletron Systems, Inc. Port-link configuration tracking method and apparatus
US5740354A (en) * 1995-11-27 1998-04-14 Microsoft Corporation Method and system for associating related errors in a computer system
FR2744310A1 (fr) * 1996-01-31 1997-08-01 Canon Kk Procede, moyen et systeme de communication sur un support de transmission partage
US5768261A (en) * 1996-06-25 1998-06-16 Mci Communications Corporation System and method for identifying the technique used for far-end performance monitoring of a DS1 at a customer service unit
US5845062A (en) * 1996-06-25 1998-12-01 Mci Communications Corporation System and method for monitoring network elements organized in data communication channel groups with craft interface ports
US5864608A (en) * 1996-06-26 1999-01-26 Mci Communications Corporation System and method for formatting performance data in a telecommunications system
US5913036A (en) * 1996-06-28 1999-06-15 Mci Communications Corporation Raw performance monitoring correlated problem alert signals
US5796723A (en) * 1996-06-28 1998-08-18 Mci Communications Corporation System and method for end-to-end threshold setting
US5787074A (en) * 1996-06-28 1998-07-28 Mci Communications Corporation System and method for monitoring point activation
US6072777A (en) * 1996-06-28 2000-06-06 Mci Communications Corporation System and method for unreported root cause analysis
US5778184A (en) * 1996-06-28 1998-07-07 Mci Communications Corporation System method and computer program product for processing faults in a hierarchial network
US5768255A (en) * 1996-06-28 1998-06-16 Mci Communications Corporation System and method for monitoring point identification
US5784359A (en) * 1996-06-28 1998-07-21 Mci Communications Corporation System and method for unreported trouble isolation
US5864662A (en) * 1996-06-28 1999-01-26 Mci Communication Corporation System and method for reported root cause analysis
US5704036A (en) * 1996-06-28 1997-12-30 Mci Communications Corporation System and method for reported trouble isolation
US5790397A (en) * 1996-09-17 1998-08-04 Marathon Technologies Corporation Fault resilient/fault tolerant computing
US6052722A (en) * 1997-03-07 2000-04-18 Mci Communications Corporation System and method for managing network resources using distributed intelligence and state management
US5968189A (en) * 1997-04-08 1999-10-19 International Business Machines Corporation System of reporting errors by a hardware element of a distributed computer system
US5923840A (en) * 1997-04-08 1999-07-13 International Business Machines Corporation Method of reporting errors by a hardware element of a distributed computer system
US6944657B1 (en) 1997-09-22 2005-09-13 Mci Communications Corporation Automatic network synchronization of the network configuration with the management information database
US6215998B1 (en) * 1997-12-11 2001-04-10 Nortel Networks Limited Local component-specific console
US6259448B1 (en) 1998-06-03 2001-07-10 International Business Machines Corporation Resource model configuration and deployment in a distributed computer network
US6549932B1 (en) * 1998-06-03 2003-04-15 International Business Machines Corporation System, method and computer program product for discovery in a distributed computing environment
US6553403B1 (en) * 1998-06-03 2003-04-22 International Business Machines Corporation System, method and computer program product for monitoring in a distributed computing environment
US6460070B1 (en) 1998-06-03 2002-10-01 International Business Machines Corporation Mobile agents for fault diagnosis and correction in a distributed computer environment
DE19828173A1 (de) * 1998-06-24 1999-12-30 Siemens Ag Netzwerk mit mehreren Teilnehmern sowie Teilnehmer für ein derartiges Netzwerk
DE19831720A1 (de) * 1998-07-15 2000-01-20 Alcatel Sa Verfahren zur Ermittlung einer einheitlichen globalen Sicht vom Systemzustand eines verteilten Rechnernetzwerks
US7013305B2 (en) 2001-10-01 2006-03-14 International Business Machines Corporation Managing the state of coupling facility structures, detecting by one or more systems coupled to the coupling facility, the suspended state of the duplexed command, detecting being independent of message exchange
US6385665B1 (en) * 1998-12-18 2002-05-07 Alcatel Usa Sourcing, L.P. System and method for managing faults in a data transmission system
US7287192B1 (en) * 1999-09-23 2007-10-23 Computer Associates Think, Inc. Identifying a failed device in a network
US6442708B1 (en) * 1999-12-14 2002-08-27 Honeywell International Inc. Fault localization and health indication for a controller area network
US6587960B1 (en) * 2000-01-11 2003-07-01 Agilent Technologies, Inc. System model determination for failure detection and isolation, in particular in computer systems
US6594786B1 (en) * 2000-01-31 2003-07-15 Hewlett-Packard Development Company, Lp Fault tolerant high availability meter
US6633876B1 (en) * 2000-06-07 2003-10-14 Sun Microsystems, Inc. Analyzing post-mortem information on a remote computer system using a downloadable code module
US6795941B2 (en) 2000-12-21 2004-09-21 Honeywell International Inc. Method for diagnosing a network
US6763517B2 (en) * 2001-02-12 2004-07-13 Sun Microsystems, Inc. Automated analysis of kernel and user core files including searching, ranking, and recommending patch files
US7159080B1 (en) * 2001-12-20 2007-01-02 Network Appliance, Inc. System and method for storing storage operating system data in switch ports
US7650412B2 (en) * 2001-12-21 2010-01-19 Netapp, Inc. Systems and method of implementing disk ownership in networked storage
US7296068B1 (en) 2001-12-21 2007-11-13 Network Appliance, Inc. System and method for transfering volume ownership in net-worked storage
US6886114B2 (en) * 2002-01-03 2005-04-26 Hewlett-Packard Development Company, L.P. Multiple device error management
US6862698B1 (en) * 2002-01-22 2005-03-01 Cisco Technology, Inc. Method of labeling alarms to facilitate correlating alarms in a telecommunications network
JP4479315B2 (ja) * 2003-06-19 2010-06-09 コニカミノルタエムジー株式会社 画像処理方法および画像処理装置ならびに画像処理プログラム
US7801702B2 (en) 2004-02-12 2010-09-21 Lockheed Martin Corporation Enhanced diagnostic fault detection and isolation
US7584420B2 (en) * 2004-02-12 2009-09-01 Lockheed Martin Corporation Graphical authoring and editing of mark-up language sequences
US7619979B2 (en) 2004-06-15 2009-11-17 International Business Machines Corporation Fault isolation in a network
US20060120181A1 (en) * 2004-10-05 2006-06-08 Lockheed Martin Corp. Fault detection and isolation with analysis of built-in-test results
US20060085692A1 (en) * 2004-10-06 2006-04-20 Lockheed Martin Corp. Bus fault detection and isolation
US7512841B2 (en) * 2004-10-22 2009-03-31 Hewlett-Packard Development Company, L.P. Method and system for network fault analysis
US7624305B2 (en) * 2004-11-18 2009-11-24 International Business Machines Corporation Failure isolation in a communication system
US20080052281A1 (en) 2006-08-23 2008-02-28 Lockheed Martin Corporation Database insertion and retrieval system and method
US8135828B2 (en) * 2005-03-14 2012-03-13 Microsoft Corporation Cooperative diagnosis of web transaction failures
US7427025B2 (en) * 2005-07-08 2008-09-23 Lockheed Marlin Corp. Automated postal voting system and method
US20070211840A1 (en) 2006-02-17 2007-09-13 International Business Machines Corporation Methods and apparatus for analyzing transmission lines with decoupling of connectors and other circuit elements
WO2007099606A1 (ja) * 2006-02-28 2007-09-07 Fujitsu Limited プロセサ制御方法
US20080159155A1 (en) * 2007-01-01 2008-07-03 Paritosh Bajpay Method and apparatus for providing trouble isolation for a permanent virtual circuit
US7729299B2 (en) * 2007-04-20 2010-06-01 Cisco Technology, Inc. Efficient error response in a video conferencing system
JP4644720B2 (ja) * 2008-03-10 2011-03-02 富士通株式会社 制御方法、情報処理装置及びストレージシステム
CN101540932B (zh) * 2008-03-21 2011-01-26 大唐移动通信设备有限公司 一种多路设备的故障定位方法及装置
US9172636B2 (en) 2012-02-28 2015-10-27 Cisco Technology, Inc. Efficient link repair mechanism triggered by data traffic
CN104808648A (zh) * 2015-03-09 2015-07-29 杭州电子科技大学 一种基于k近邻的批次过程在线实时监测方法
DE102016004095B4 (de) * 2016-04-05 2024-02-08 WAGO Verwaltungsgesellschaft mit beschränkter Haftung Automatisches Eingrenzen eines physikalischen Netzwerkfehlers zur Laufzeit

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6170835A (ja) * 1984-09-14 1986-04-11 Hitachi Ltd 集中保守方法
JPS61121633A (ja) * 1984-11-19 1986-06-09 Fujitsu Ltd ネツトワ−ク監視方式
JPS63280537A (ja) * 1987-05-13 1988-11-17 Hitachi Ltd 障害状況報告方式
JPH01158552A (ja) * 1987-09-07 1989-06-21 Nec Eng Ltd 外部インターフェースの一致検出回路
JPH01236850A (ja) * 1988-03-17 1989-09-21 Fujitsu Ltd 障害箇所特定処理装置
JPH01240048A (ja) * 1988-03-22 1989-09-25 Mitsubishi Electric Corp パケツト交換網監視方式
JPH0250540A (ja) * 1988-08-11 1990-02-20 Nec Corp ネットワーク障害監視装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3707714A (en) * 1971-01-08 1972-12-26 Honeywell Inc Multiple error detector
DE2654389C3 (de) * 1976-12-01 1980-07-31 Ibm Deutschland Gmbh, 7000 Stuttgart Wartungssteuerung mit Prozessor und Speicher zur Fehleranalyse und -diagnose für elektronische Datenverarbeitungsanlagen und Verfahren zu deren Betrieb
US4207609A (en) * 1978-05-08 1980-06-10 International Business Machines Corporation Method and means for path independent device reservation and reconnection in a multi-CPU and shared device access system
US4396984A (en) * 1981-03-06 1983-08-02 International Business Machines Corporation Peripheral systems employing multipathing, path and access grouping
US4455605A (en) * 1981-07-23 1984-06-19 International Business Machines Corporation Method for establishing variable path group associations and affiliations between "non-static" MP systems and shared devices
US4438494A (en) * 1981-08-25 1984-03-20 Intel Corporation Apparatus of fault-handling in a multiprocessing system
US4514846A (en) * 1982-09-21 1985-04-30 Xerox Corporation Control fault detection for machine recovery and diagnostics prior to malfunction
US4554661A (en) * 1983-10-31 1985-11-19 Burroughs Corporation Generalized fault reporting system
US4633467A (en) * 1984-07-26 1986-12-30 At&T Bell Laboratories Computer system fault recovery based on historical analysis
US4644532A (en) * 1985-06-10 1987-02-17 International Business Machines Corporation Automatic update of topology in a hybrid network
EP0234191B1 (en) * 1986-01-09 1993-12-29 Nec Corporation Packet-switched communications network with parallel virtual circuits for re-routing message packets
US4727548A (en) * 1986-09-08 1988-02-23 Harris Corporation On-line, limited mode, built-in fault detection/isolation system for state machines and combinational logic
US4745593A (en) * 1986-11-17 1988-05-17 American Telephone And Telegraph Company, At&T Bell Laboratories Arrangement for testing packet switching networks
US4791653A (en) * 1987-08-25 1988-12-13 Hewlett-Packard Company Pseudorandom word sequence synchronizer
US4881230A (en) * 1987-10-05 1989-11-14 Ibm Corporation Expert system for processing errors in a multiplex communications system
US4962497A (en) * 1989-09-21 1990-10-09 At&T Bell Laboratories Building-block architecture of a multi-node circuit-and packet-switching system

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6170835A (ja) * 1984-09-14 1986-04-11 Hitachi Ltd 集中保守方法
JPS61121633A (ja) * 1984-11-19 1986-06-09 Fujitsu Ltd ネツトワ−ク監視方式
JPS63280537A (ja) * 1987-05-13 1988-11-17 Hitachi Ltd 障害状況報告方式
JPH01158552A (ja) * 1987-09-07 1989-06-21 Nec Eng Ltd 外部インターフェースの一致検出回路
JPH01236850A (ja) * 1988-03-17 1989-09-21 Fujitsu Ltd 障害箇所特定処理装置
JPH01240048A (ja) * 1988-03-22 1989-09-25 Mitsubishi Electric Corp パケツト交換網監視方式
JPH0250540A (ja) * 1988-08-11 1990-02-20 Nec Corp ネットワーク障害監視装置

Also Published As

Publication number Publication date
US5157667A (en) 1992-10-20
EP0455442A3 (en) 1992-11-04
JPH0793624B2 (ja) 1995-10-09
DE69118233D1 (de) 1996-05-02
EP0455442B1 (en) 1996-03-27
EP0455442A2 (en) 1991-11-06

Similar Documents

Publication Publication Date Title
JPH04229741A (ja) リンク結合システム内の故障を分離し分析する装置及び方法
JP4433967B2 (ja) マルチサイト上の遠隔二重化リンクを経由するハートビート装置、及びその使用方法
US5473771A (en) Fault-tolerant processing system architecture
CN100407646C (zh) 一种实现数据业务备份的方法
JPH0330553A (ja) データ通信ネツトワークにおける問題判別及び回復のための方法及びシステム
JPH03503588A (ja) 通信回路網の状態に関する情報収集・表示装置
JPH04242463A (ja) 状態変化通知装置及び方法
CN109120522B (zh) 一种多路径状态监测方法及装置
JP2001520777A (ja) 遠距離通信ネットワークにおいてクライアントプログラムをネットワークデバイスにインターフェースするインターフェース
JPH07262042A (ja) プロセッサ障害検出方法
KR0173380B1 (ko) 분산형 액세스 노드 시스템에서의 성능관리 방법
KR0136507B1 (ko) 공통선(No.7) 신호망의 신호교환기와 관리시스템간의 통신이상 검출방법
JPH11177550A (ja) ネットワークの監視方式
KR100206466B1 (ko) 선로다중접속장치의 가입자단말 스케닝방법
KR100442433B1 (ko) 교환기의 공통 제어 프로세서 이중화 장치
KR0174406B1 (ko) 비동기전달모드 전전자 교환기의 경보취합장치 및 그 운용방법
JP2829040B2 (ja) 情報集配信システム
KR100258078B1 (ko) 에이티엠 교환기 연결 링크 보전 기능 구성방법
JP3753496B2 (ja) データ通信交換システムにおける障害検出装置及び方法
KR100644284B1 (ko) 광가입자 전송장치의 관리자와 대행자간 운용관리 통신채널 상태 진단 방법
JP3272114B2 (ja) 分散システムにおける監視試験法
JP2699900B2 (ja) 障害情報収集装置
KR100241340B1 (ko) 에이티엠 교환기 가상 경로 기능 구성방법
JPH01126056A (ja) 主回線異常時の復旧方式
KR19980016046A (ko) Tdx-10계열 교환기의 호처리장애시 원격교환모듈의 단독기능수행방법