JPH05276164A - 通信ネットワークの故障を識別する方法およびシステム - Google Patents

通信ネットワークの故障を識別する方法およびシステム

Info

Publication number
JPH05276164A
JPH05276164A JP4318516A JP31851692A JPH05276164A JP H05276164 A JPH05276164 A JP H05276164A JP 4318516 A JP4318516 A JP 4318516A JP 31851692 A JP31851692 A JP 31851692A JP H05276164 A JPH05276164 A JP H05276164A
Authority
JP
Japan
Prior art keywords
alarm
fault
network
alarms
communication network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4318516A
Other languages
English (en)
Other versions
JPH084266B2 (ja
Inventor
Anastasios T Bouloutas
ティオドロス ブルタス アナスタシオス
Seraphin B Calo
バーナード キャラ セラフィン
Allan J Finkel
ジェイ フィンケル アラン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH05276164A publication Critical patent/JPH05276164A/ja
Publication of JPH084266B2 publication Critical patent/JPH084266B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Multi Processors (AREA)
  • Computer And Data Communications (AREA)

Abstract

(57)【要約】 【目的】 ネットワーク上の故障を識別する。 【構成】 大規模通信ネットワークで故障の局所化とア
ラーム相関の問題をモデル化するとともに、その問題を
解決するアプローチを提供する。特に、新しいアラーム
構成を通信ネットワークを表す一般的なモデルとともに
提供する。1つ以上の故障が存在する場合、幾つかの特
定の処理アルゴリズムをアラーム相関と故障局所化の問
題を解決するために提供する。これらのアルゴリズムは
故障を突き止めるときに達成する正確さの度合いや、イ
ンプリメンテーションのために必要な複雑さの度合いの
点で異なる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、アラーム処理に関し、
特に、限定された障害識別情報のみを提供するアラーム
セットであって、予め存在するアラームセットを用い
て、アラームの相関をとるとともに、通信ネットワーク
内の障害を突き止める方法および装置に関する。
【0002】
【従来の技術】遠隔通信ネットワークは、近年、その規
模が益々大きくなるとともに、益々複雑になっている。
典型的なネットワークは数100のノードより、ノード
は数多くの生産者により供給されるネットワーク装置を
有し、各ノードは異なるトラヒックや帯域幅の要求があ
る。このように益々複雑になると、ネットワークの管理
および制御の点で重大な問題点が引き起こされる。ネッ
トワーク管理の1つの態様には、障害管理があり、障害
管理の本質的な要素は障害を識別することである。不運
にも、大きな通信ネットワーク上での障害は通常避けら
れないものである。だが、障害の原因を素早く検出する
とともに識別することにより、通信システムを頑丈にす
ることができ、その動作をより信頼できるものにするこ
とができる。しかし、ネットワークで障害が生じると、
オペレータはメッセージに閉口させられ、障害を突き止
めるのが困難なタスクになってしまう。情報が余りにも
多すぎると、その結果は情報が余りにも少ない場合と同
様である。すなわち、障害を識別するのがより複雑にな
る。
【0003】通信ネットワークは異なるベンダにより無
関係に製造される装置よりなるのが典型的なので、この
ような装置を内部にインプリメントする方法は、一般的
に、様々である。(しかし、各装置のネットワークの残
りに対するインタフェースは標準化され、広く規格とし
て受け入れられている(例えば、SNA,ISO
等)。)よって、各ネットワーク装置は互いに無関係に
設計されているのが典型的である。通信システム装置の
設計者は、装置とその知覚されたインタフェースの両
方、すなわち、装置監視空間に投影されたネットワーク
の残りが、正確に稼働していることを確認するのが通常
である。無理のない設計プロセスには、装置が稼働中に
出会う種々の障害条件に対するアラームを設計すること
を含む。従って、装置設計者は次の2種類のアラーム、
すなわち、(1)装置内に存在する障害に対するアラー
ム、(2)装置が適合しなければならないインタフェー
スに現れる障害に対するアラームを提供するが典型的で
ある。
【0004】装置内の障害は装置の動作を中断すること
ができ、同様に、他の装置に対する動作を中断すること
ができる。このように装置の動作が中断されると、ネッ
トワーク装置は、それらのインタフェースに関する問題
を示すアラームを発することができる。(従来、装置ア
ラームはテキストストリングよりなり、一意のアラーム
識別子よりなることもある。)したがって、システム管
理者は同一の基本的な問題から発されるアラームで閉口
させられる。一般的に言えば、より多くの情報は一見問
題診断の手助けになるようであるが、実際には手助けに
はならない。通常、アラームメッセージは、明らかに障
害診断に必要な情報は運ばない。むしろ、アラームは、
障害条件、すなわち、障害の徴候を詳細に記述するのが
典型的である。アラームは通常の障害の原因を記述しな
い。
【0005】
【発明が解決しようとする課題】多数のアラームによ
り、次の(1)および(2)のことを行うのは困難であ
る。
【0006】(1)障害を突き止めること。ほとんどの
場合、アラームは障害の位置を明示しない。発されたア
ラームを解析し、ネットワークの問題領域の正確な位置
を示さなければならない。(2)アラームの相関をとる
こと。オペレータまたはソフトウェアプログラムさえネ
ットワーク内に実質的に同時に発することができる数1
00のアラームを試験し、これらのアラームを1つ以上
の特定な障害条件に割り当てる。
【0007】本発明はこれらの問題点を解決し、発せら
れたアラームと、遠隔通信ネットワークのトポロジーを
試験し、障害が発生したネットワークの領域を突き止
め、受信されたアラームとネットワーク内の1つ以上の
障害との相関をとる方法およびシステムを提供しようと
している。
【0008】
【課題を解決するための手段】簡単に要約すると、本発
明の一態様は、複数の装置が接続された通信ネットワー
ク内の障害を識別する方法を備えている。それらの装置
の少なくとも幾つかは、アラームを発して、ネットワー
ク内の知覚された障害に応答するように構成されてい
る。
【0009】その方法は次のステップを含む。ネットワ
ーク内の複数の活動状態のアラームを識別し、各アラー
ムは通信ネットワーク内にコネクションされた装置のう
ちの対応する1つの装置により発せられ、各アラームは
対応する装置状態か、あるいは、対応する装置インタフ
ェース状態の知識のみを示すステップと、予め規定され
た複数のプリミティブのうちの少なくとも1つのプリミ
ティブを、それぞれ識別されたアラームに割り当て、各
割り当てられたプリミティブは対応する装置のネットワ
ーク内の相対的な障害位置を示すステップと、その割り
当てられたプリミティブを用いて、ネットワークの担当
部分に各アラームをマッピングし、そのマッピングされ
た部分は割り当てられたプリミティブにより示された相
対的な障害位置に対応するステップとを備え、可能な障
害位置の集合は各アラームに対して規定され、この規定
された障害位置集合を用いて、ネットワーク内の実際の
障害の可能な位置を判定し、可能な障害位置を識別する
特定の処理アルゴリズムが示され、ここで特許請求され
ている。さらに、記述した方法をインプリメントする種
々の方法が開示されている。
【0010】(通信ネットワークのような)ネットワー
クに対し、かつ、一般化された障害識別とアラームの相
関をとる方法およびシステムがここに示されている。方
法およびシステムは、複数の障害を同時に識別すること
ができるのがほとんどであり、さらに、専門的な知識
(すなわち、各アラームにより示された障害位置)と、
用いられるアルゴリズムを自然に分離するのがほとんど
であり、アラームモデリングと、アルゴリズムを示すこ
とに寄与している。さらに、処理のアプローチにより、
信頼のないアラームを処理するとともに、動的なネット
ワークに対して容易に取ることができる方法およびシス
テムが記述されている。
【0011】また、次のようにすることができる。
【0012】(1)複数の装置が接続された通信ネット
ワークにて、前記装置の少なくとも幾つかはアラームを
供給して前記通信ネットワーク上で知覚された故障に応
答し、前記通信ネットワーク上の故障を識別する方法
は、(a)前記通信ネットワーク上の少なくとも1つの
活動状態のアラームを識別し、前記アラームはそれぞれ
前記通信ネットワークに接続され前記アラームを発する
装置のうちの対応する1つの装置により発され、前記ア
ラームはそれぞれ対応する装置状態の知識かあるいは対
応する装置のインタフェース状態を示すステップ、
(b)識別された各アラームに、予め規定されたプリミ
ティブの少なくとも1つのプリミティブを割り当て、前
記割り当てられたプリミティブは、それぞれ、前記対応
する装置に対してネットワーク内の相対的な故障位置を
示すステップ、(c)前記各アラームを、少なくとも1
つの割り当てられたプリミティブを用いて前記通信ネッ
トワークの担当する部分にマッピングし、前記担当する
部分は前記少なくとも1つの割り当てられたプリミティ
ブにより示された相対的な故障位置に対応し、可能な故
障がある装置の位置の集合が各アラームに対して規定さ
れるステップ、(d)前記規定された故障の位置の集合
を用いて、前記通信ネットワーク上の実際の故障の可能
な位置を判定するステップを備えたことを特徴とする。
【0013】(2)上記(1)に記載の故障を識別する
方法において、複数の活動状態のアラームは前記ネット
ワーク上で識別され、前記ステップ(d)は対応する可
能な故障位置の集合を用いて、前記複数の活動状態のア
ラームの少なくとも幾つかの相関を取り、前記複数の活
動状態の少なくとも幾つかは発生事象を備え、前記発生
事象は前記ステップ(d)で用いられ、前記ネットワー
ク上の前記実際の故障の位置を判定することを特徴とす
る。
【0014】(3)上記(2)に記載の故障を識別する
方法において、前記ステップ(d)は複数の活動状態の
アラームと複数の発生事象との相関を取ることを含み、
前記複数の発生事象は前記通信ネットワーク上の複数故
障の可能な位置を判定するために用いられることを特徴
とする。
【0015】(4)上記(3)に記載の故障を識別する
方法において、前記ステップ(d)は発生事象内で相関
を取った全てのアラームが共通の論理積をシェアリング
するとともに、識別された全てのアラームが前記発生事
象のうちの1つの発生事象に割り当てられるように、最
小の発生事象を構成することをさらに含むことを特徴と
する。
【0016】(5)上記(1)に記載の故障を識別する
方法において、前記ネットワーク上の複数故障は故障の
可能性があり、前記ステップ(d)は前記ネットワーク
上の前記各故障に対して最もありそうな位置を識別する
ことを特徴とする。
【0017】(6)上記(5)に記載の故障を識別する
方法において、前記通信ネットワークに接続された各装
置を第1の情報コストと予め関係付け、前記関係付けた
第1の情報コストは前記装置の障害の可能性に依存する
ステップをさらに含むことを特徴とする。
【0018】(7)上記(6)に記載の故障を識別する
方法において、複数の活動状態のアラームは前記通信ネ
ットワーク内で識別され、前記ステップ(d)は関係す
るアラームの相関をとって複数の発生事象の集合を規定
することを含み、前記ステップ(d)は、各規定された
発生事象に、装置の単一の可能な故障と、該単一の可能
な故障と関係付けられた第1の情報コストと、ステップ
(c)で規定された対応する可能故障の位置の集合内の
可能な故障を有する装置を含む任意のアラームとを関係
付けることをさらに備えたことを特徴とする。
【0019】(8)上記(7)に記載の故障を識別する
方法において、前記ステップ(d)は、各発生事象の集
合に対して、各発生事象内の装置の可能な故障の第1の
情報コストの合計が最小にされ、かつ、全てのアラーム
が前記発生事象の集合内の前記発生事象のうちの1つの
発生事象と関係付けられるように、発生事象の集合を規
定することにより、前記ネットワーク上の実際の故障の
最も可能性のある位置を識別することを含むことを特徴
とする。
【0020】(9)上記(8)に記載の故障を識別する
方法において、ステップ(d)は、各アラーム故障局所
化フィールド内に含まれた故障が最も可能性があること
を、前記関係づけた第1の情報コストを用いて識別する
ことを含むことを特徴とする。
【0021】(10)上記(6)に記載の故障を識別す
る方法は、前記通信ネットワーク上の装置の可能な故障
に、それぞれ、装置の故障に対して供給されるべきアラ
ームを関係付けることをさらに含むことを特徴とする。
【0022】(11)上記(10)に記載の故障を識別
する方法は、各アラームに、特定のアラームが偶発的に
紛失される確率に依存する第2の情報コストと、前記ア
ラームが偶発的に発せられる確率に依存する第3の情報
コストとを予め関係付けることをさらに備えたことを特
徴とする。
【0023】(12)上記(11)に記載の故障を識別
する方法において、ステップ(d)は、前記第1の情報
コストをそれぞれ用いて、第2の情報コストと、第3の
情報コストと、前記識別されたアラームを最も良く説明
する可能な実際の故障を識別するために供給すべき予め
関係付けたアラームとをさらに含むことを特徴とする。
【0024】(13)上記(1)に記載の故障を識別す
る方法において、前記予め規定されたプリミティブは、
上流プリミティブ、下流プリミティブ、およびインタフ
ェースプリミティブを備え、前記上流プリミティブは前
記アラームを発した装置の通信層の上の通信層に実際の
故障が位置することを示し、前記下流プリミティブは前
記アラームを発した装置の通信層の下の通信層に実際の
故障が位置することを示し、前記インタフェースプリミ
ティブは前記アラームを発した装置に対するインタフェ
ースに実際の故障が位置することを示すことを特徴とす
る。
【0025】(14)上記(1)に記載の故障を識別す
る方法において、前記通信ネットワーク上の実際の故障
の可能な位置を表示するステップを備えたことを特徴と
する。
【0026】(15)複数の装置が接続された通信ネッ
トワークにて、前記装置の少なくとも幾つかはアラーム
を供給して前記通信ネットワーク上で知覚された故障に
応答する故障を識別するシステムにおいて、前記通信ネ
ットワーク上の複数の活動状態のアラームを識別し、前
記アラームはそれぞれ前記通信ネットワークに接続され
前記アラームを発する装置のうちの対応する1つの装置
により発され、前記アラームはそれぞれ対応する装置状
態の知識かあるいは対応する装置インタフェース状態を
示す手段と、識別された各アラームに、予め規定された
プリミティブの少なくとも1つのプリミティブを割り当
て、前記割り当てられたプリミティブは、それぞれ、前
記対応する装置に対してネットワーク内の相対的な故障
位置を示す手段と、前記各アラームを、少なくとも1つ
の割り当てられたプリミティブを用いて前記通信ネット
ワークの担当する部分にマッピングし、前記担当する部
分は前記少なくとも1つの割り当てられたプリミティブ
により示された相対的な故障位置に対応し、可能の故障
がある装置の位置の集合が各アラームに対して規定され
る手段と、前記マッピングする手段により生成された前
記規定された故障位置の集合を用いて、前記通信ネット
ワーク上の実際の故障の可能な位置を判定する手段とを
備えたことを特徴とする。
【0027】(16)上記(15)に記載の故障を識別
するシステムにおいて、前記故障を識別するシステムは
前記通信装置内の複数故障を識別することができ、前記
判定する手段は前記マッピングする手段により生成され
た前記予め規定された故障位置の集合を用いて、前記ネ
ットワーク内の各故障に対して可能な位置を判定する手
段を備えたことを特徴とする。
【0028】(17)上記(15)に記載の故障を識別
するシステムにおいて、前記判定する手段は、活動状態
のアラームと複数発生事象との相関をとる手段を備え、
前記複数の発生事象は前記ネットワーク内の前記実際の
故障の可能な位置を判定するために用いられ、前記判定
する手段は、発生事象内の相関を取ったアラームが全て
共通の論理積をシェアリングし、かつ、識別された全て
のアラームが前記発生事象の1つに割り当てられるよう
に、最小の発生事象を構成する手段をさらに含むことを
特徴とする。
【0029】(18)上記(17)に記載の故障を識別
するシステムにおいて、前記判定する手段は、前記ネッ
トワーク内の各装置の故障に正比例する可能性を考慮し
て、前記ネットワーク上の実際の故障の可能な位置を判
定する手段を含むことを特徴とする。
【0030】(19)上記(15)に記載の故障を識別
するシステムにおいて、前記ネットワーク内の実際の故
障の前記可能な位置をオペレータに供給する表示手段を
備えたことを特徴とする。
【0031】(20)複数の装置が接続されているネッ
トワーク内の故障を識別するシステムであって、前記装
置の少なくとも幾つかの装置はアラームを発して前記ネ
ットワーク内で知覚された故障に応答するシステムにお
いて、アラームを供給した各装置を認識し、前記アラー
ムを正規化形式に変換し、前記正規化されたアラームの
形式は対応する装置に対して前記通信ネットワーク内の
故障の位置の相対的な表示を含むアラームレコグナイザ
と、前記正規化されたアラームを受信する前記アラーム
レコグナイザに接続されたアラームマネージャであっ
て、前記通信ネットワークのトポロジーにアクセスし、
各正規化されたアラームに対して可能な故障の位置の集
合を生成し、前記規定された故障位置の集合を用いて前
記通信ネットワークの実際の故障の可能な位置を判定す
る手段をさらに含むアラームマネージャとを備えたこと
を特徴とする。
【0032】(21)上記(20)に記載の故障を識別
するシステムにおいて、複数の活動状態のアラームは前
記通信ネットワーク上で識別され、前記アラームマネー
ジャは対応する可能な故障の位置の集合を用いて、前記
複数の活動状態のアラームの少なくとも幾つかとの相関
をとり、前記相関を取ったアラームの各グループ化は発
生事象を備え、前記アラームマネージャは前記発生事象
を用いて前記通信ネットワーク上の前記実際の故障の位
置を判定することを特徴とする。
【0033】(22)上記(21)に記載の故障を識別
するシステムにおいて、前記アラームマネージャは、発
生事象内の相関を取った全てのアラームが共通の論理積
にシェアリングされるとともに、識別された全てのアラ
ームが前記発生事象のうちの1つの発生事象に割り当て
られるように、最小の発生事象を構成する手段を含むこ
とを特徴とする。
【0034】
【実施例】上述したように、通信ネットワークは通常多
くの異なる製造業者により製造された装置よりなる。典
型的なネットワークはモデム、暗号化装置、CSU、I
DNX、通信回線、およびその他の装置を含む。通信装
置は通信プロトコル(例えば、TCP/IP,SNA,
OSI)の階層内で動作するように設計されている。こ
れらの通信装置はアラーム信号を、例えば、中央制御室
に伝送するか、あるいは、中央制御装置によりポーリン
グするのに適正なアラーム信号をレジスタに供給するこ
とができる。当業者は本発明がいずれかの技術に適用さ
れることを次の説明から認識することができるであろ
う。
【0035】遠隔通信装置は閾値を超えるか、あるい
は、装置が内部問題またはインタフェースで問題を検出
したとき、アラームを発することができる。ネットワー
ク装置は遠隔通信ネットワークのトポロジーを何も知ら
ない。通信ネットワーク内の単一の障害により、複数の
アラームが発されたりして、多くの装置の動作が混乱す
る。これらのアラームの相関をとったり障害位置を診断
することは、オペレータにより指定されるか、あるいは
コンピュータ化されたマシンにより指定される困難なタ
スクである。本発明は、このタスクを支援する自動化通
信ネットワーク管理技術を備えている。
【0036】現在、通信ネットワーク管理は通常手動で
調整されている。中央制御室のオペレータはコンソール
をモニタし、表示されるアラームおよび/またはユーザ
の苦情に基づき決定を下す。このコンソールは3270
IBM プロトコルまたASCIIディスプレイのい
ずれかであるのが典型的である。(再び、単一の障害に
より、文字通り数100のアラームが発せられ表示され
る。)複数のコンソールは共通であり、かつ、物理ネッ
トワークと論理ネットワークの区別があるのが典型的で
ある。
【0037】理想的なアラームでは、 Who: 障害を経験した装置(または、システム)の
名前 What: 障害の条件、すなわち、障害の徴候 Where: 問題が生じたネットワークの位置 When: 問題が検出された時刻 Why: 問題の原因、すなわち、障害の性質 の情報が与えられる。上記の情報が与えられた場合に
は、オペレータまた自動化管理システムは複数のアラー
ムの相関を素早くとり、信頼できる1つの障害または複
数の障害を突き止める。不運にも、記載された情報は、
必ずしも、どの通信システム装置の通常のアラームによ
り提供されるわけではない。というのは、通信ネットワ
ーク内の各装置は、その装置以外の装置についての限定
された情報を知るだけである。ネットワーク装置により
発されたアラームは、大部分、障害を経験している装置
のみにその障害の性質およびその障害検出時刻を通知
し、すなわち、who,whatおよびwhenという
質問に答える。しかし、障害を識別し、アラームの相関
をとるには、さらに情報が必要になる、すなわち、wh
ereおよびwhyという質問に答える必要がある。本
発明によると、暗黙の欠陥局所化情報は通信ネットワー
ク内でそれぞれ生成されたアラームと関係付けられる。
【0038】大部分のアラームは欠陥局所化情報を含ん
でいない。というのは、障害の位置はアラームを発する
装置により正確に知ることはないからである。しかし、
ほとんど全てのアラームは確かに暗黙の欠陥局所化情報
を含む。例えば、チャネルサービス装置(CSU)によ
り発されたアラーム“LOS−DTE”を考慮しなさ
い。このアラームはCSUのデータ端末装置側からの信
号を紛失したことを示すが、T−1伝送回線に接続され
たデータ端末装置側からの信号を紛失したことは示さな
い。そのため、そのアラームは、その障害に対する特定
の位置を示さないとしても、その障害の可能な位置をネ
ットワークの小さい方の部分に限定する。同様にして、
2極違反すなわちBPV(すなわち、CSUにより発せ
られたアラーム)は、伝送回線に関する問題であるが、
CSUに関する問題でないことを示すアラームである。
このアラームはその障害の可能な位置をCSU外の位置
に限定する。
【0039】よって、各ベンダが供給するアラームは、
その障害の位置を表す可能な位置の集合と関係付けるこ
とができる。本発明は、各アラームとその障害の全ての
可能な位置に関係付けるが、大部分の曖昧な位置のみに
は関係付けないことを提案している。アラームが信頼で
きるものであり、かつ、ネットワーク内に単一の障害が
ある場合、障害局所化は簡単である。特に、その障害
は、各アラームにより示された位置の集合の論理積にあ
る。よって、直観的に言うと、共通の論理積を有するア
ラームの相関をとるるべきである。
【0040】しかし、アラームの相関をとる(および障
害を局所化する)アルゴリズムを規定する前に、“発生
事象(incident)”という語を規定する必要が
ある。発生事象という語はここでは相関をとったアラー
ムの集合をいう。理想的には、発生事象は同一の障害に
対して発せられる全てのアラームを含むべきである。入
力される新しいアラームは全て新しい発生事象を生成
し、その発生事象と現存する発生事象を関係づけるか、
あるいは発生事象を全く新しく再構成することができ
る。このようにできるのは、新しいアラームにより、障
害の新しい仮定の蓋然性をより高くすることができるか
らである。
【0041】よって、発生事象はオープンおよびクロー
ズさせることができる。発生事象の生成はアラームの到
着によりトリガされる。しかし、発生事象の削除はより
複雑である。発生事象は、その発生事象に対応させたア
ラームを生成させる障害条件が存在しなくなったとき、
削除(クローズ)される。
【0042】簡単にするため、発生事象を試験したり、
クローズする責任をネットワークオペレータに割り当て
ると仮定する。(ある場合には、あるいはまた、タイミ
ング制御装置が発生事象をクローズするのに用いること
ができる。)適正な試験技法は当業者には明白である。
【0043】本発明に係る処理方法を概括した概要を図
1に示す。
【0044】図1に示すように、受信された各アラーム
を、明示した故障局所化情報に関係付ける。1つのアラ
ームはその故障(可能な故障)の可能な位置を全て表す
位置の集合と関係付けられる。その故障の位置に関する
情報は、ネットワーク構成とは無関係な方法で、1つの
アラームと関係付けることができる。例えば、後述する
プリミティブ(上流、下流、等)と各アラームとを関係
付けることができる。これらのプリミティブは、特定の
ネットワーク構成に適用された場合、可能な故障の集合
を生成することができる。その可能な故障の集合は各ア
ラームと関係付けた故障局所化情報を備えている。
【0045】そのアラームに関係付けたプリミティブを
規定するため、通信ネットワークはモデル化しなければ
ならない。好ましいモデル化では、通信ネットワークは
コネクションの集合よりなる。これを用いて、階層化さ
れた通信ネットワークのコネクションを規定することが
できる。2地点“A”と“B”の間の通信は“A”と
“B”にある装置の正確な動作に依存し、しかも、
“A”と“B”の間のチャネルに依存する。そのチャネ
ルの正確な動作はそのチャネルを備えた装置に依存す
る。よって、自然な階層が形成される。この階層の各層
は上位の層にサービスを提供する。物理伝送回線はその
階層の最下層にある。よって、特定の層にある装置によ
り発せられたアラームは、その障害が上位の層か、下位
の層にあるか、あるいはそのアラームを発している装置
の内部または外部にあるかを区別する。これを用いて、
次のプリミティブが規定される。
【0046】上流:アラームを発する装置の層より上の
層に障害がある。
【0047】下流:アラームを発する装置の層より下の
層に障害がある。
【0048】インタフェース:障害は、yesである場
合、アラームを発する装置に対するインタフェースにあ
り、noである場合、アラームを発する装置にある。
【0049】範囲:アラームを発する装置に依存してお
り、障害の範囲は上流、下流、内部または外部よりもっ
と正確に規定され、例えば、対等装置の障害、または伝
送回線の障害というように規定される。範囲は障害をよ
り狭く局所化する能力を提供する。
【0050】一度、プリミティブが規定されると、障害
局所化フィールドを各アラームに割り当てるのは簡単で
ある。障害の位置と可能な障害の表記を記述するプリミ
ティブと関係付けたアラームを与えると、アラームを生
成することができた障害の集合が識別される。この集合
はここでは「障害局所化フィールド」という。
【0051】本発明の目的は、各アラームの障害局所化
フィールド内の情報を用いて、現れたアラームを最も良
く説明することができる種々の方法を提供することにあ
る。
【0052】さらに、図1を説明する。次の処理ステッ
プ、すなわち、ステップ12では、局所化アルゴリズム
を、受信されたアラームに適用する。後程さらに説明す
るが、本発明に係る幾つかの異なるアルゴリズムはどれ
もこの点で適用することができる。ステップ14では、
所定のアラームの集合に対する1つの障害または複数の
障害を局所化した後、当該ネットワーク内で生成された
新しいアラームに対して、ステップ10および12を繰
り返す。そして、ステップ16では、オペレータに対し
て、その結果を表示することができる。
【0053】第1の局所化アルゴリズムの概要を図2に
示す。このアプローチはここでは「ポジティブ情報アル
ゴリズム」という。図2のルーチンに入った後、プロセ
ッサは新しいアラーム、発生事象の集合およびそれらに
関係付けたアラーム、ネットワークトポロジーの記述、
および可能な障害を受信する(か、あるいはその前に生
成する)。ステップ22にて、この情報から、新しいア
ラームにより示された障害の可能な位置が識別される。
その後、ステップ24にて、発生事象に関係付けられた
全てのアラームが共通の論理積を有する最小の発生事象
を、プロセッサが組み立て、全てのアラームは幾つかの
発生事象に割り当てられる。その後、ステップ26に
て、図1に示す主処理フローに戻る。
【0054】図2に示すアルゴリズムを最小にするステ
ップ24は重要である。というのは、発生事象が障害を
示すからである。アラームと発生事象を正確に関係付け
ることは、必ず、障害の正確な局所化を意味する。よっ
て、このステップでは、最小の発生事象(従って、障
害)であって、アラームの集合の出現を説明することが
できる発生事象(従って、障害)が求められる。ここ
で、障害は多くなく、むしろ少ないという暗黙の仮定が
ある。単一の障害が識別された場合は、発生事象の数は
1であり、全てのアラームは幾つかの障害によるものあ
るので、全てのアラームは共通の論理積を有すべきであ
る。よって、アルゴリズムのステップ24は、その障害
を、全てのアルゴリズムの論理積により規定されたネッ
トワークの特定の部分に局所化する。
【0055】アラームが2つの以上の論理積にある場
合、図2に示すアルゴリズムは適正ではない。さらに、
そのアルゴリズムは一意性を保証しない。例えば、アル
ゴリズムの集合が与えられた場合、最小限の発生事象を
構成する方法(障害の可能な仮定を提案する2つ以上の
方法)が2つ以上ある。例を挙げると、三角形の形状を
した型通信ネットワークの各頂点に置かれる装置から3
つのアラームが発せられたすると、そのアラームの障害
局所化領域は3つの一意的な論理積を生成することがで
きる場合がある。2つの論理積をどのように組み合わせ
ても、充分、最小限の発生事象を規定することができ
る。図2に示すアルゴリズムによりアプローチした場
合、どの2つの論理積が最良かは判定されない。
【0056】その問題を解決する1つの方法には、障害
の演繹的な確率を各ネットワークのコンポーネントに関
係付ける方法がある。この方法によると、ネットワーク
のコンポーネントを含む発生事象を選択しそこなう虞が
最も大きくなる。あるいはまた、障害の確率を各コンポ
ーネントに関係付ける替わりに、「情報コスト」(すな
わち、障害確率の対数の負の値)を障害確率に関係付け
ることができる。情報コストが独立した故障に対する確
率と等しいとしても、確率の替わりに情報コストを用い
て作業することは、ある点(それらが付加的な性質を有
するというような点)で有利である。このような概念を
用いると、図1に示す処理フローのステップ12は、図
3に示すように改善することができる。
【0057】まず、ステップ30にてルーチンに入った
後、ステップ34にて、各発生事象を、(1)単一のコ
ンポーネントの故障、(2)単一のコンポーネントと関
係付けられた情報コスト、(3)それらの故障局所化フ
ィールド内の故障を含む全てのアラームと関係付けるよ
うに指示する。(ネットワークの各要素は障害の確度を
識別する「情報コスト」と予め関係付けるのが好まし
い。ネットワークの構成に関して、この情報は必要であ
る言うことができ、別々に保持された支援データを備え
ている。)その後、ステップ36にて、その集合内の各
発生事象の情報コストの合計が最小にされ、全てのアラ
ームが幾つかの発生事象と関係付けられるような発生事
象の集合が識別される。その後、ステップ38にて、図
1に示す概要処理に戻る。
【0058】概説した方法により、最もありそうな故
障、すなわち、監視されたアラームを最も良く説明する
故障が発生する。当業者は、情報コストを最小にする発
生事象の集合を発見する問題が運悪くNP−完了(NP
−Complete)であることを認識することにな
る。解決法として、最適な解決法と見せ掛ける(簡単な
場合は最適方法を発見する)発見的方法を用いることが
できる。このようなアルゴリズムでは、最小の「相対的
な重み」を有する故障(すなわち、故障をアラームの局
所化フィールドに含むアラームの数だけ分割された故障
の情報コスト)が、受信されたアラームの集合に対して
選択される。故障局所化フィールド内にこの故障を含む
アラームは、全て、考慮されない。そして、アラームが
減った集合であって間近のアラームの集合に関して、選
択ステップが繰り返される。当業者は、図3に示すステ
ップ36に関わる計算問題を解決する可能なアプローチ
のうちのただ1つのアプローチをこのアルゴリズムが表
すことを認識することになる。また、他のアプローチは
特定の応用に従って適正に行うことができる。
【0059】動作例を挙げると、図4ないし図6は一般
的に39と表記した三角形状に構成されたネットワーク
を示す。このネットワークは本発明に従って監視されて
いる。ネットワーク39は多数の通信装置40ないし4
5を含む。各通信装置40ないし45は図4ないし図6
に示すように装置に関連させて重みを有する。第1のア
ラームは装置40,41,および42(集合46を構成
する)が故障していることを示す(図4参照)。図3
は、発生事象の各集合の重みが最小にされ、関連するア
ラームに対して、まず、装置41が故障しているとして
選択されることを指示する。図5において、新しいアラ
ームが受信される。装置42,43,および44は可能
な故障の集合47を備えている。集合46および47の
論理積は、装置42が両アラームの示す故障装置である
ことを示す。
【0060】一度、可能な故障集合48(すなわち、装
置44,45および40)を有する第3のアラームが付
加されると、その解決法は幾分より複雑になる(図6参
照)。例えば、装置41は集合46に包含され、装置4
4の故障は集合47および48に包含される必要があ
る。あるいはまた、装置40の故障は集合46および4
8に対応するアラーム包含されることになる。装置43
の故障は故障局所化フィールド47に包含されることに
なる。アルゴリズムが図3のアルゴリズムであるとする
と、この後者のことを可能にするには解決法を選ばなけ
ればならない。そのアルゴリズムは結果が絶対的に正確
であるとは保証しない。むしろ、そのアルゴリズムは、
受信されたアラームに対して、多分故障しているであろ
う装置の位置を提供する。
【0061】次に、ここで提供される第2の局所化アル
ゴリズムに関し困難なことの1つを、図7に示す通信ネ
ットワーク49を参照して説明する。図7に示す構成で
は、ネットワーク49は5つの装置すなわち直列に接続
された構成要素を含む。装置(A)50は装置(B)5
2に接続され、装置(B)52はT1回線54に接続さ
れている。T1回線54は装置(C)56に接続されて
いる。装置(C)56は装置(D)58に接続されてい
る。よって、トポロジーはA−B−T1−C−Dのよう
に表すことができる。装置(A)50からの第1のアラ
ームであって、装置(B)52、T1回線54、装置
(C)56または装置(D)58のいずれかが故障して
いることを示すアラームが受信されたと仮定する。装置
(D)58からの第2のアラームであって、装置(A)
50、装置(B)52、T1回線54、装置(C)56
のいずれかが故障していることを示すアラームが受信さ
れたと仮定する。通信回線を接続することにより、障害
発生確率が最も高くなると仮定したので、T1回線54
は第1および第2の受信されたアラームにより信号送出
された故障装置であると、図3に示す処理フローを用い
て識別される。第1および第2の受信されたアラームは
アルゴリズムに従って正確に相関がとられるが、故障の
識別は多分不正確であろう。装置(B)52および装置
(C)56からアラームがないことは、その問題はT1
回線54に関する問題ではなく、むしろ、その問題は、
装置(A)50と装置(B)52を接続する回線の故障
および/または装置(C)56と装置(D)58を接続
する回線に関係することがほとんどである。図3に示す
アルゴリズムは、この例の問題の原因を正確に識別する
ことはできない。というのは、必要とする演繹的な情報
量はそのアルゴリズムで用いられる情報量より多いから
である。この例から、アラームがないということは重要
な情報であって、故障識別プロセスでまた考慮すべき情
報であることが分かる。
【0062】第2のアルゴリズムでは無視したが、信頼
できないアラームが存在する場合がある。永続故障を示
すものではないが、閾値を超えるか、あるいは幾つかの
他の過渡条件が発生して、アラームが発生されることが
ある。よって、アラームは、故障表示の観点からいう
と、信頼できなくなる。すなわち、存在しない故障の調
査をトリガすることができる。
【0063】アラームが現れるが存在しないという情報
を利用するため、特定の故障が与えられた場合、どのア
ラームが現れるべきかを知る必要がある。複数故障が発
生した場合、各故障に対する2種類の情報、すなわち、
故障によりトリガされるアラームと、他の故障に起因し
て発されたアラームにその故障が及ぼす影響とを特定す
る必要がある。この情報は当業者によりオフラインで得
ることができると仮定する。明らかに、各故障に関する
情報を特定する方法は、診断されるシステムと、含まれ
る特定の故障に依存している。よって、図8に示した
が、発したアラームを最も良く説明する局所化アルゴリ
ズムを用いることができる(図1の概要処理に関して再
び読み取られる)。
【0064】ステップ60にて、システム機能をオフラ
イン、事前初期設定することは、図3のアルゴリズムに
関係付けて説明したように、まず、情報コストと各可能
な故障を関係付けることを含む。その情報コストは、特
定の故障が生じる確率に相当する。さらに、ステップ6
4にて、所定の故障に基づき現れるべきアラームが識別
される。また、ステップ66にて、さらに2つの情報コ
ストは各アラームに関係付けられる。第1の情報コスト
は特定のアラームが偶発的に失われる確率に依存し、第
2の情報コストはアラームが偶発的に発される確率に依
存する。この情報が存在するとすると、ステップ68に
て、所定のネットワーク上で必要な程度に、ネットワー
ク上の可能な故障を全て識別した後、監視されたアラー
ムを最も良く説明する故障が識別される。
【0065】監視されたアラームは、それらの故障に起
因して発されたかもしれないアラームを、偶発的に発さ
れたアラームは加え、偶発的に失われたアラームを除い
て含むように規定されている。再び、全ての故障の情報
コストの合計を最小にしてアラームの最も良い説明と、
偶発的に起こるアラームの発生と紛失に起因する情報コ
ストとを得ることを、このステップにより行う。図3に
示す処理フローのステップ36に関し、このアプローチ
のステップ68は一般的にNP−完了(NP−Comp
lete)であり、従って、可能な故障の空間を発見的
方法により探索することは、ありそうでかつ実際的なイ
ンプリメンテーションである。監視されたアラームを最
も良く説明する故障を見付け出した後、ステップ69に
て、図1に示す処理フローに戻る。
【0066】本発明に係るソフトウェアシステム70の
ある機能ブロックやコンポーネントを図9に示す。図9
に示す各コンポーネントは良く規定されたインタフェー
スの集合を有する。このインタフェースにより、他のコ
ンポーネントおよび/またはオペレータとの通信が行わ
れる。一度、そのインタフェースが充分に特定される
と、各コンポーネントのインプリメンテーションが独立
して行われる。ソフトウェアシステム70への基本的な
情報入力はアラームのストリームである。そのアラーム
はシステムコンポーネントにより処理され、相関が取ら
れたアラームと故障局所化情報を生成する。
【0067】ソフトウェアシステム70はドライバ71
を含み、ドライバ71はそのシステム70に、処理され
るアラームの集合を供給する。オンラインモードでは、
ドライバ71はサービスポイントからか、あるいは直接
装置からアラームを収集する。そのアラームは、アラー
ムレコグナイザ72に供給され、認識され、利用可能な
内部形式に変換される。その変換プロセスにより、正規
化されたアラームが生成される。再び、アラームが正規
化され、故障局所化情報を含む。変換プロセスは、正規
化されたアラームに関係付けた入力アラームを有するテ
ーブルに基づくのが望ましい。認識されたアラームは、
アグリード・アポン・インタフェースを介してアラーム
マネージャ73に転送される。アラームマネージャ73
は、正規化された入力を、発生事象マネージャ79の機
能を用いて処理する。発生事象マネージャ79は図9に
示す破線100および101を介して各システムコンポ
ーネントに接続されている。
【0068】アラームマネージャ73は故障の局所化お
よびアラームの相関を取ることを担当する。これらは、
構成マネージャ74に記憶されているシステムトポロジ
ーを参照して行われる。(本発明によれば、故障は本シ
ステムのオンラインの再構成に関わらず識別される。)
また、アラームマネージャ73は所定の発生事象に関す
る情報を故障レコグナイザ77に転送することができ
る。故障レコグナイザ77は、発生事象マネージャ79
の機能を用いて、さらに、その発生事象を更新すること
ができる。故障レコグナイザ77は更新された発生事象
に関する情報をインタフェースマネージャ75に利用さ
せる。インタフェースマネージャ75はアラームマネー
ジャ73と、外部アプリケーションおよび/またはディ
スプレイマネージャ76との間の情報の通信を担当す
る。インタフェースマネージャ75は発生事象の表示要
求を、ディスプレイマネージャと、本システムと対話す
る任意のアプリケーションとに転送することができるは
ずである。インタフェースマネージャはロックステップ
でディスプレイマネージャと協働する。ディスプレイマ
ネージャ76は発生事象に関する情報をネットワークオ
ペレータに供給する。ディスプレイマネージャ76は本
質的にはディスプレイ画面を管理する。また、ディスプ
レイマネージャ76はオペレータから入力を受信し、受
信した入力をインタフェースマネージャに送信する。
【0069】また、テスタ78は故障レコグナイザ77
に接続されており、故障レコグナイザ77のために装置
を試験する。装置の試験にはさらに情報を得るため装置
をポーリングするか、あるいは装置を試験モードに設定
することを含む。発生事象マネージャ79はデータ構造
により表された発生事象の管理を担当する。幾つかのコ
ンポーネントは1つの発生事象を同時にシェアリングす
ることができる。この発生事象マネージャはこのシェア
リングのアービトレーションを担当する。本システムが
標準モードである場合、1つの要求は故障を認識するこ
とである。このような場合、インタフェースマネージャ
75は発生事象に関する情報を故障レコグナイザ77に
渡さなければならない。発生事象に関する情報が渡され
た場合はいつでも、発生事象マネージャを呼び出さなけ
ればならない。アラームマネージャの出力は推定故障位
置を示す新しい発生事象の集合である。ここで提供され
た第1の局所化アルゴリズムに従うと、アラームマネー
ジャは、1つの発生事象に関係するアラームが全て共通
の論理積をシェアリングするように発生事象の最小値を
構成し、アラームは全て幾つかの発生事象に割り当てら
れる。
【0070】ソフトウェアシステム70を用いて標準の
処理技術の概要を図10に示す。システム初期化の後
に、ステップ81にて、1つのアラームがアラームレコ
グナイザにより受信される。そして、ステップ82に
て、このアラームは、ルックアップテーブルを用いて正
規の形式に変換される。この変換されたアラームを、再
び、上流、下流、内部または外部のような1つ以上のプ
リミティブに関係付けることができる。そして、ステッ
プ83にて、正規化されたアラームはアラームマネージ
ャ(すなわち、図9に示すアラームマネージャ73)に
送信される。アラームマネージャは、そのアラームの可
能な原因である装置とネットワークのコネクションの集
合を計算する。上述したように、装置のリストは、構成
マネージャにコールして、その構成を動的に試験するこ
とにより得られる。上流、下流、内部または外部のよう
なプリミティブを用いて、その探索をその構成に向け
る。
【0071】次に、ステップ85にて、アラームマネー
ジャは、1つの発生事象に関係する全てのアラームが共
通の論理積をシェアリングし、全てのアラームが幾つか
の発生事象に割り当てられるように、最小発生事象を生
成する。この機能は本質的には図2に示す局所化アルゴ
リズムを備えている。ステップ86にて、望む場合は、
次に、ディスプレイマネージャは最小発生事象の集合を
オペレータに示す。新たに受信したアラームにそれぞれ
関係付けてディスプレイを更新するようにもできる。そ
の後、ステップ87にて、アラームは全て処理するか否
かを照会する。別のアラームが受信された場合は、ステ
ップ81に戻る。アラームの相関取りと故障の局所化が
一度終了すると、全てのアラームは処理され、終了す
る。
【0072】当業者は上述したことから、(通信ネット
ワークのような)ネットワークに対する一般化された故
障識別と、アラームの相関取り方法およびシステムが提
供される。これらの方法及びシステムの大部分により、
専門的な知識(すなわち、各アラームにより示される故
障位置)と、用いられるアルゴリズムとを自然に分離す
る。重要な寄与はアラームのモデル化であり、提供され
た処理アルゴリズムである。また、同時に発生した複数
の故障を識別することができる。さらに、信頼できない
アラームを処理することができる処理アプローチが提供
され、動的なネットワークで容易に採用することができ
る方法およびシステム(新しいノードおよび装置が付加
されるか、あるいはそのネットワークから除去される)
が記載されている。
【0073】本発明を本発明に係る望ましい実施態様に
従って詳細に説明したが、当業者により種々修正および
変更を加えることが可能であり、特許請求の範囲内の種
々の修正および変更は本発明の真の精神および範囲を逸
脱しない。
【0074】
【発明の効果】以上説明したように、本発明によれば、
上記のように構成したので、発せられたアラームと、通
信ネットワークのトポロジーを試験し、障害が発生した
ネットワークの領域を突き止め、受信されたアラームと
ネットワーク内の1つ以上の障害との相関を取ることが
できる。
【図面の簡単な説明】
【図1】本発明に係るアラームの相関と障害識別を機能
的に概観した図である。
【図2】図1に示す処理フローで用いられる第1の局所
化アルゴリズムの例を示す機能ブロック図である。
【図3】図1に示す処理フローで用いられる第2の局所
化アルゴリズムの例を示す機能ブロック図である。
【図4】本発明により障害の相関をとりかつ識別するた
めに複数アラームを順次考慮に入れたネットワークの例
を示す図である。
【図5】本発明により障害の相関をとりかつ識別するた
めに複数アラームを順次考慮に入れたネットワークの例
を示す図である。
【図6】本発明により障害の相関をとりかつ識別するた
めに複数アラームを順次考慮に入れたネットワークの例
を示す図である。
【図7】監視されるネットワークの別の例を示す図であ
る。
【図8】図1に示す処理フローで用いられる第3の局所
化アルゴリズムの例を示す機能ブロック図である。
【図9】本発明に係る1つのアラームの相関と障害識別
システム内のある部分を示すブロック図である。
【図10】図9に示すシステム要素を用いて本発明に係
る1つの標準処理方式を機能的に概観したものを示す図
である。
【符号の説明】
39 ネットワーク 40〜45 通信装置 46〜48 集合 49 通信ネットワーク 50,52,56,58 装置 54 回線 70 ソフトウェアシステム 71 ドライバ 72 アラームレコグナイザ 73 アラームマネージャ 74 構成マネージャ 75 インタフェースマネージャ 76 ディスプレイマネージャ 77 故障レコグナイザ 78 テスタ 79 発生事象マネージャ
フロントページの続き (72)発明者 セラフィン バーナード キャラ アメリカ合衆国 10466 ニューヨーク州 ピークスキル パウダー ホーン ロー ド 25 (72)発明者 アラン ジェイ フィンケル アメリカ合衆国 10956 ニューヨーク州 ニューシティ ヘリティッジ ドライブ 8ビー

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 複数の装置が接続された通信ネットワー
    クにて、前記装置の少なくとも幾つかはアラームを供給
    して前記通信ネットワーク上で知覚された故障に応答
    し、前記通信ネットワーク上の故障を識別する方法は次
    のステップ(a)〜(d)を備えたことを特徴とする故
    障を識別する方法。 (a)前記通信ネットワーク上の少なくとも1つの活動
    状態のアラームを識別し、前記アラームはそれぞれ前記
    通信ネットワークに接続され前記アラームを発する装置
    のうちの対応する1つの装置により発され、前記アラー
    ムはそれぞれ対応する装置状態の知識かあるいは対応す
    る装置のインタフェース状態を示すステップ、 (b)識別された各アラームに、予め規定されたプリミ
    ティブの少なくとも1つのプリミティブを割り当て、前
    記割り当てられたプリミティブは、それぞれ、前記対応
    する装置に対してネットワーク内の相対的な故障位置を
    示すステップ、 (c)前記各アラームを、少なくとも1つの割り当てら
    れたプリミティブを用いて前記通信ネットワークの担当
    する部分にマッピングし、前記担当する部分は前記少な
    くとも1つの割り当てられたプリミティブにより示され
    た相対的な故障位置に対応し、可能な故障がある装置の
    位置の集合が各アラームに対して規定されるステップ、 (d)前記規定された故障の位置の集合を用いて、前記
    通信ネットワーク上の実際の故障の可能な位置を判定す
    るステップ。
  2. 【請求項2】 複数の活動状態のアラームは前記ネット
    ワーク上で識別され、前記ステップ(d)は対応する可
    能な故障位置の集合を用いて、前記複数の活動状態のア
    ラームの少なくとも幾つかの相関を取り、前記複数の活
    動状態の少なくとも幾つかは発生事象を備え、前記発生
    事象は前記ステップ(d)で用いられ、前記ネットワー
    ク上の前記実際の故障の位置を判定することを特徴とす
    る請求項1に記載の故障を識別する方法。
  3. 【請求項3】 前記ネットワーク上の複数故障は故障の
    可能性があり、前記ステップ(d)は前記ネットワーク
    上の前記各故障に対して最もありそうな位置を識別する
    ことを特徴とする請求項1に記載の故障を識別する方
    法。
  4. 【請求項4】 前記予め規定されたプリミティブは、上
    流プリミティブ、下流プリミティブ、およびインタフェ
    ースプリミティブを備え、前記上流プリミティブは前記
    アラームを発した装置の通信層の上の通信層に実際の故
    障が位置することを示し、前記下流プリミティブは前記
    アラームを発した装置の通信層の下の通信層に実際の故
    障が位置することを示し、前記インタフェースプリミテ
    ィブは前記アラームを発した装置に対するインタフェー
    スに実際の故障が位置することを示すことを特徴とする
    請求項1に記載の故障を識別する方法。
  5. 【請求項5】 前記通信ネットワーク上の実際の故障の
    可能な位置を表示するステップを備えたことを特徴とす
    る請求項1に記載の故障を識別する方法。
  6. 【請求項6】 複数の装置が接続された通信ネットワー
    クにて、前記装置の少なくとも幾つかはアラームを供給
    して前記通信ネットワーク上で知覚された故障に応答す
    る故障を識別するシステムにおいて、 前記通信ネットワーク上の複数の活動状態のアラームを
    識別し、前記アラームはそれぞれ前記通信ネットワーク
    に接続され前記アラームを発する装置のうちの対応する
    1つの装置により発され、前記アラームはそれぞれ対応
    する装置状態の知識かあるいは対応する装置インタフェ
    ース状態を示す手段と、 識別された各アラームに、予め規定されたプリミティブ
    の少なくとも1つのプリミティブを割り当て、前記割り
    当てられたプリミティブは、それぞれ、前記対応する装
    置に対してネットワーク内の相対的な故障位置を示す手
    段と、 前記各アラームを、少なくとも1つの割り当てられたプ
    リミティブを用いて前記通信ネットワークの担当する部
    分にマッピングし、前記担当する部分は前記少なくとも
    1つの割り当てられたプリミティブにより示された相対
    的な故障位置に対応し、可能の故障がある装置の位置の
    集合が各アラームに対して規定される手段と、 前記マッピングする手段により生成された前記規定され
    た故障位置の集合を用いて、前記通信ネットワーク上の
    実際の故障の可能な位置を判定する手段とを備えたこと
    を特徴とする故障を識別するシステム。
  7. 【請求項7】 前記故障を識別するシステムは前記通信
    装置内の複数故障を識別することができ、前記判定する
    手段は前記マッピングする手段により生成された前記予
    め規定された故障位置の集合を用いて、前記ネットワー
    ク内の各故障に対して可能な位置を判定する手段を備え
    たことを特徴とする請求項6に記載の故障を識別するシ
    ステム。
  8. 【請求項8】 前記判定する手段は、活動状態のアラー
    ムと複数発生事象との相関をとる手段を備え、前記複数
    の発生事象は前記ネットワーク内の前記実際の故障の可
    能な位置を判定するために用いられ、前記判定する手段
    は、発生事象内の相関を取ったアラームが全て共通の論
    理積をシェアリングし、かつ、識別された全てのアラー
    ムが前記発生事象の1つに割り当てられるように、最小
    の発生事象を構成する手段をさらに含むことを特徴とす
    る請求項6に記載の故障を識別するシステム。
  9. 【請求項9】 前記ネットワーク内の実際の故障の前記
    可能な位置をオペレータに供給する表示手段を備えたこ
    とを特徴とする請求項6に記載の故障を識別するシステ
    ム。
  10. 【請求項10】 複数の装置が接続されているネットワ
    ーク内の故障を識別するシステムであって、前記装置の
    少なくとも幾つかの装置はアラームを発して前記ネット
    ワーク内で知覚された故障に応答するシステムにおい
    て、 アラームを供給した各装置を認識し、前記アラームを正
    規化形式に変換し、前記正規化されたアラームの形式は
    対応する装置に対して前記通信ネットワーク内の故障の
    位置の相対的な表示を含むアラームレコグナイザと、 前記正規化されたアラームを受信する前記アラームレコ
    グナイザに接続されたアラームマネージャであって、前
    記通信ネットワークのトポロジーにアクセスし、各正規
    化されたアラームに対して可能な故障の位置の集合を生
    成し、前記規定された故障位置の集合を用いて前記通信
    ネットワークの実際の故障の可能な位置を判定する手段
    をさらに含むアラームマネージャとを備えたことを特徴
    とする故障を識別するシステム。
JP4318516A 1992-01-03 1992-11-27 通信ネットワークの故障を識別する方法およびシステム Expired - Lifetime JPH084266B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US817011 1992-01-03
US07/817,011 US5309448A (en) 1992-01-03 1992-01-03 Methods and systems for alarm correlation and fault localization in communication networks

Publications (2)

Publication Number Publication Date
JPH05276164A true JPH05276164A (ja) 1993-10-22
JPH084266B2 JPH084266B2 (ja) 1996-01-17

Family

ID=25222164

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4318516A Expired - Lifetime JPH084266B2 (ja) 1992-01-03 1992-11-27 通信ネットワークの故障を識別する方法およびシステム

Country Status (3)

Country Link
US (1) US5309448A (ja)
EP (1) EP0549937A1 (ja)
JP (1) JPH084266B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007096796A (ja) * 2005-09-29 2007-04-12 Fujitsu Ltd ネットワーク障害診断装置、ネットワーク障害診断方法およびネットワーク障害診断プログラム
JP2018148408A (ja) * 2017-03-06 2018-09-20 Kddi株式会社 情報処理装置、情報処理方法、及びプログラム

Families Citing this family (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2117255T3 (es) * 1993-02-23 1998-08-01 British Telecomm Correlacion de eventos.
US5459777A (en) * 1993-10-28 1995-10-17 British Telecommunications Public Limited Company Telecommunications network traffic management system
US5917898A (en) * 1993-10-28 1999-06-29 British Telecommunications Public Limited Company Telecommunications network traffic management system
US5862322A (en) * 1994-03-14 1999-01-19 Dun & Bradstreet Software Services, Inc. Method and apparatus for facilitating customer service communications in a computing environment
SE502852C2 (sv) * 1994-04-08 1996-01-29 Ellemtel Utvecklings Ab Sätt och system för distribuerad övervakning av hårdvara
US5528516A (en) * 1994-05-25 1996-06-18 System Management Arts, Inc. Apparatus and method for event correlation and problem reporting
US5483637A (en) * 1994-06-27 1996-01-09 International Business Machines Corporation Expert based system and method for managing error events in a local area network
US5539877A (en) * 1994-06-27 1996-07-23 International Business Machine Corporation Problem determination method for local area network systems
US6421323B1 (en) 1994-12-23 2002-07-16 Applied Digital Access, Inc. Method and apparatus for analyzing events in a telecommunications system
US5699403A (en) * 1995-04-12 1997-12-16 Lucent Technologies Inc. Network vulnerability management apparatus and method
KR0154863B1 (ko) * 1995-10-20 1998-11-16 김광호 동기식 디지탈 마이크로웨이브 시스템에 있어서 신호감쇄 검출 및 해제 방법
US5812758A (en) * 1995-11-09 1998-09-22 The United States Of America As Represented By The Secretary Of The Navy System level aid for troubleshooting (SLAT)
US5566162A (en) * 1995-12-07 1996-10-15 Northern Telecom Limited Method of sectionalizing trouble on telecommunication network connections
AUPN786896A0 (en) * 1996-02-02 1996-02-29 Telstra Corporation Limited A network fault system
US5758064A (en) * 1996-03-26 1998-05-26 Ncr Corporation Method of diagnosing communication problems of electronic price labels
US5768501A (en) * 1996-05-28 1998-06-16 Cabletron Systems Method and apparatus for inter-domain alarm correlation
US5771274A (en) * 1996-06-21 1998-06-23 Mci Communications Corporation Topology-based fault analysis in telecommunications networks
US5946373A (en) * 1996-06-21 1999-08-31 Mci Communications Corporation Topology-based fault analysis in telecommunications networks
GB2318479B (en) 1996-10-21 2001-04-04 Northern Telecom Ltd Problem model for alarm correlation
GB2318478B (en) * 1996-10-21 2001-01-17 Northern Telecom Ltd Network model for alarm correlation
JPH10222493A (ja) * 1997-02-06 1998-08-21 Kokusai Denshin Denwa Co Ltd <Kdd> 相互因果関係解析システム
US6073089A (en) * 1997-10-22 2000-06-06 Baker; Michelle Systems and methods for adaptive profiling, fault detection, and alert generation in a changing environment which is measurable by at least two different measures of state
US6393386B1 (en) 1998-03-26 2002-05-21 Visual Networks Technologies, Inc. Dynamic modeling of complex networks and prediction of impacts of faults therein
US6148338A (en) * 1998-04-03 2000-11-14 Hewlett-Packard Company System for logging and enabling ordered retrieval of management events
US7224713B2 (en) * 1998-04-09 2007-05-29 Andrzej Partyka Telemetry system with authentication
US6594305B1 (en) 1998-06-30 2003-07-15 Cisco Technology, Inc. Media access layer ping protocol for diagnosing cable modem links
US6973668B1 (en) 1998-06-30 2005-12-06 Cisco Technology, Inc. Method and apparatus for locating a faulty component in a cable television system having cable modems
US6588016B1 (en) * 1998-06-30 2003-07-01 Cisco Technology, Inc. Method and apparatus for locating a faulty component in a cable television system having cable modems
US6253339B1 (en) * 1998-10-28 2001-06-26 Telefonaktiebolaget Lm Ericsson (Publ) Alarm correlation in a large communications network
US6263455B1 (en) 1998-11-05 2001-07-17 At&T Corp. Method and apparatus for analyzing alarm conditions in a networked computing environment
US6239699B1 (en) * 1999-03-03 2001-05-29 Lucent Technologies Inc. Intelligent alarm filtering in a telecommunications network
DE69933919T2 (de) * 1999-04-07 2007-06-06 Lucent Technologies Inc. Filterung eines sekundären Alarms
US6707795B1 (en) 1999-04-26 2004-03-16 Nortel Networks Limited Alarm correlation method and system
US7600007B1 (en) 1999-05-24 2009-10-06 Computer Associates Think, Inc. Method and apparatus for event correlation in service level management (SLM)
US6967974B1 (en) 1999-09-30 2005-11-22 Andrzej Partyka Transmission of urgent messages in telemetry system
US6442708B1 (en) * 1999-12-14 2002-08-27 Honeywell International Inc. Fault localization and health indication for a controller area network
US6694362B1 (en) * 2000-01-03 2004-02-17 Micromuse Inc. Method and system for network event impact analysis and correlation with network administrators, management policies and procedures
US6894975B1 (en) 2000-01-15 2005-05-17 Andrzej Partyka Synchronization and access of the nodes in a communications network
US6731223B1 (en) * 2000-01-15 2004-05-04 Andrzej Partyka Meshed telemetry system
US6604208B1 (en) * 2000-04-07 2003-08-05 Telefonaktiebolaget Lm Ericsson (Publ) Incremental alarm correlation method and apparatus
US6925105B1 (en) 2000-05-01 2005-08-02 Andrzej Partyka Overhead reduction in system for intermittent transmission
GB2362536B (en) * 2000-05-17 2002-05-15 3Com Corp Network management apparatus and method for identifying events on a network
US6816461B1 (en) * 2000-06-16 2004-11-09 Ciena Corporation Method of controlling a network element to aggregate alarms and faults of a communications network
US7209495B2 (en) 2000-09-28 2007-04-24 Andrzej Partyka Urgent messages and power-up in frequency hopping system for intemittent transmission
GB2367721B (en) * 2000-10-06 2004-03-03 Motorola Inc Network management system and method of management control in a communication system
US20050157654A1 (en) * 2000-10-12 2005-07-21 Farrell Craig A. Apparatus and method for automated discovery and monitoring of relationships between network elements
US7043661B2 (en) * 2000-10-19 2006-05-09 Tti-Team Telecom International Ltd. Topology-based reasoning apparatus for root-cause analysis of network faults
US7383191B1 (en) 2000-11-28 2008-06-03 International Business Machines Corporation Method and system for predicting causes of network service outages using time domain correlation
US6795941B2 (en) 2000-12-21 2004-09-21 Honeywell International Inc. Method for diagnosing a network
WO2002073475A1 (en) 2001-03-08 2002-09-19 California Institute Of Technology Exception analysis for multimissions
US6966015B2 (en) * 2001-03-22 2005-11-15 Micromuse, Ltd. Method and system for reducing false alarms in network fault management systems
JP3674533B2 (ja) * 2001-04-24 2005-07-20 日本電気株式会社 波長多重システムにおけるosc信号のクロック同期監視方法
US6744739B2 (en) * 2001-05-18 2004-06-01 Micromuse Inc. Method and system for determining network characteristics using routing protocols
US7043727B2 (en) * 2001-06-08 2006-05-09 Micromuse Ltd. Method and system for efficient distribution of network event data
US7516208B1 (en) 2001-07-20 2009-04-07 International Business Machines Corporation Event database management method and system for network event reporting system
US20050286685A1 (en) * 2001-08-10 2005-12-29 Nikola Vukovljak System and method for testing multiple dial-up points in a communications network
US7363368B2 (en) 2001-12-24 2008-04-22 International Business Machines Corporation System and method for transaction recording and playback
US6862698B1 (en) * 2002-01-22 2005-03-01 Cisco Technology, Inc. Method of labeling alarms to facilitate correlating alarms in a telecommunications network
CA2369351A1 (en) * 2002-01-24 2003-07-24 Alcatel Canada Inc. System and method for providing error analysis and correlation in a network element
CN100438423C (zh) * 2002-08-06 2008-11-26 华为技术有限公司 电信设备故障信息管理方法
CN100450008C (zh) * 2002-10-22 2009-01-07 华为技术有限公司 通信网络告警的处理方法和相关性分析管理器
US7962589B1 (en) * 2002-11-07 2011-06-14 Cisco Technology, Inc. Method and apparatus for providing notification of network alarms using a plurality of distributed layers
US7857701B2 (en) 2004-03-12 2010-12-28 Microsoft Corporation Silent sign-in for offline games
US20060031473A1 (en) * 2004-07-07 2006-02-09 Wood John A System and method for high capacity fault correlation
US7631222B2 (en) * 2004-08-23 2009-12-08 Cisco Technology, Inc. Method and apparatus for correlating events in a network
US7860016B1 (en) * 2004-08-25 2010-12-28 Emc Corporation Method and apparatus for configuration and analysis of network routing protocols
US7900201B1 (en) 2004-12-21 2011-03-01 Zenprise, Inc. Automated remedying of problems in software application deployments
PL1889461T3 (pl) * 2005-06-01 2014-07-31 Fair Isaac Corp System analityczny ubezpieczenia sieci
DE502007004858D1 (de) * 2006-03-23 2010-10-07 Fujitsu Technology Solutions I Verfahren und managementsystem zum konfigurieren eines informationssystems
US8271310B2 (en) * 2006-12-20 2012-09-18 Microsoft Corporation Virtualizing consumer behavior as a financial instrument
US7640460B2 (en) * 2007-02-28 2009-12-29 Microsoft Corporation Detect user-perceived faults using packet traces in enterprise networks
US8015139B2 (en) * 2007-03-06 2011-09-06 Microsoft Corporation Inferring candidates that are potentially responsible for user-perceptible network problems
US8443074B2 (en) 2007-03-06 2013-05-14 Microsoft Corporation Constructing an inference graph for a network
GB0707513D0 (en) * 2007-04-18 2007-05-30 Zenulta Ltd Method of identifying a root cause of a network event
US8161323B2 (en) * 2007-10-19 2012-04-17 Oracle International Corporation Health monitor
US20100131315A1 (en) * 2008-11-25 2010-05-27 International Business Machines Corporation Resolving incident reports
US8284044B2 (en) 2008-12-23 2012-10-09 Telefonaktiebolaget Lm Ericsson (Publ) Poll-based alarm handling system and method
US8140898B2 (en) * 2009-06-16 2012-03-20 Oracle International Corporation Techniques for gathering evidence for performing diagnostics
US8417656B2 (en) * 2009-06-16 2013-04-09 Oracle International Corporation Techniques for building an aggregate model for performing diagnostics
US8171343B2 (en) * 2009-06-16 2012-05-01 Oracle International Corporation Techniques for determining models for performing diagnostics
US8166352B2 (en) * 2009-06-30 2012-04-24 Alcatel Lucent Alarm correlation system
US20110141914A1 (en) * 2009-12-15 2011-06-16 Chen-Yui Yang Systems and Methods for Providing Ethernet Service Circuit Management
US8612377B2 (en) * 2009-12-17 2013-12-17 Oracle International Corporation Techniques for generating diagnostic results
US8423827B2 (en) 2009-12-28 2013-04-16 International Business Machines Corporation Topology based correlation of threshold crossing alarms
JP5564941B2 (ja) * 2009-12-28 2014-08-06 富士通株式会社 障害箇所推定システム、障害箇所推定装置および障害箇所推定方法
US8694836B2 (en) * 2010-01-27 2014-04-08 Telcordia Technologies, Inc. Fault diagnosis employing probabilistic models and statistical learning
US8948587B2 (en) * 2012-06-27 2015-02-03 Centurylink Intellectual Property Llc Use of dying gasp to locate faults in communications networks
US8935572B2 (en) 2012-09-14 2015-01-13 International Business Machines Corporation Remediating events using behaviors
CN103220173B (zh) * 2013-04-09 2015-10-21 北京搜狐新媒体信息技术有限公司 一种报警监控方法及监控系统
EP3231135B1 (en) * 2014-12-12 2019-08-21 Nokia Solutions and Networks Oy Alarm correlation in network function virtualization environment
US10002504B2 (en) 2015-10-01 2018-06-19 Honeywell International Inc. System and method of providing intelligent system trouble notifications using localization
CN108243058B (zh) * 2016-12-27 2021-04-06 中国移动通信集团湖北有限公司 一种基于告警定位故障的方法和装置
CN108270605A (zh) * 2016-12-31 2018-07-10 中国移动通信集团山西有限公司 一种重要网元的确定方法、装置及设备
CN111010306B (zh) * 2020-03-10 2020-06-02 清华大学 动态网络告警分析方法、装置、计算机设备及存储介质
US11558238B1 (en) 2022-01-08 2023-01-17 Bank Of America Corporation Electronic system for dynamic latency reduction through edge computation based on a multi-layered mechanism

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61288648A (ja) * 1985-06-17 1986-12-18 Nec Corp デ−タベ−スを用いた回線監視方式
JPS63287230A (ja) * 1987-05-20 1988-11-24 Mitsubishi Electric Corp パケット交換網制御方式
JPH0250540A (ja) * 1988-08-11 1990-02-20 Nec Corp ネットワーク障害監視装置
JPH04109728A (ja) * 1990-08-30 1992-04-10 Nippon Telegr & Teleph Corp <Ntt> 通信網の管理装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ZA804385B (en) * 1979-08-10 1981-07-29 Plessey Co Ltd Alarm monitoring arrangements for digital telecommunications switching networks
JPS58175335A (ja) * 1982-04-07 1983-10-14 Hitachi Ltd ル−プ式デ−タ伝送システムのル−プバツク制御方法
CA1203875A (en) * 1983-06-16 1986-04-29 Mitel Corporation Switching system loopback test circuit
US4601028A (en) * 1984-06-18 1986-07-15 Rockwell International Corporation Method of and apparatus for checking datapath failure in a communication muldem
GB8422328D0 (en) * 1984-09-04 1984-10-10 Int Computers Ltd Data processing apparatus
JPS61193535A (ja) * 1985-02-22 1986-08-28 Hitachi Ltd ネツトワ−ク保守アドレス操作方法
US4710926A (en) * 1985-12-27 1987-12-01 American Telephone And Telegraph Company, At&T Bell Laboratories Fault recovery in a distributed processing system
US4745597A (en) * 1986-05-14 1988-05-17 Doug Morgan Reconfigurable local area network
JPH0771104B2 (ja) * 1987-01-12 1995-07-31 株式会社テック Pos端末機のインライン異常検出回路
JP2533550B2 (ja) * 1987-07-10 1996-09-11 株式会社日立製作所 デ―タ通信ネットワ―クにおける構成制御方法
US4881230A (en) * 1987-10-05 1989-11-14 Ibm Corporation Expert system for processing errors in a multiplex communications system
JPH01236850A (ja) * 1988-03-17 1989-09-21 Fujitsu Ltd 障害箇所特定処理装置
JP2547084B2 (ja) * 1988-11-29 1996-10-23 富士通株式会社 通信ネットワーク管理制御方式
US4997390A (en) * 1989-06-29 1991-03-05 Amp Incorporated Shunt connector
CA2020784C (en) * 1989-07-11 1994-08-23 Horoshi Shimizu Fault locating system capable of quickly locating a fault in a hierarchical communication network
US4977390A (en) * 1989-10-19 1990-12-11 Niagara Mohawk Power Corporation Real time method for processing alaarms generated within a predetermined system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61288648A (ja) * 1985-06-17 1986-12-18 Nec Corp デ−タベ−スを用いた回線監視方式
JPS63287230A (ja) * 1987-05-20 1988-11-24 Mitsubishi Electric Corp パケット交換網制御方式
JPH0250540A (ja) * 1988-08-11 1990-02-20 Nec Corp ネットワーク障害監視装置
JPH04109728A (ja) * 1990-08-30 1992-04-10 Nippon Telegr & Teleph Corp <Ntt> 通信網の管理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007096796A (ja) * 2005-09-29 2007-04-12 Fujitsu Ltd ネットワーク障害診断装置、ネットワーク障害診断方法およびネットワーク障害診断プログラム
JP4527642B2 (ja) * 2005-09-29 2010-08-18 富士通株式会社 ネットワーク障害診断装置、ネットワーク障害診断方法およびネットワーク障害診断プログラム
JP2018148408A (ja) * 2017-03-06 2018-09-20 Kddi株式会社 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
JPH084266B2 (ja) 1996-01-17
EP0549937A1 (en) 1993-07-07
US5309448A (en) 1994-05-03

Similar Documents

Publication Publication Date Title
JPH05276164A (ja) 通信ネットワークの故障を識別する方法およびシステム
JP3556842B2 (ja) ネットワーク監視機構、ネットワーク監視装置およびネットワーク管理方法
US4937825A (en) Method and apparatus for diagnosing problems in data communication networks
US7961594B2 (en) Methods and systems for history analysis for access paths in networks
Bouloutas et al. Alarm correlation and fault identification in communication networks
US8266272B2 (en) Methods for IT network representation and associated computer program products
US5023873A (en) Method and apparatus for communication link management
US6006016A (en) Network fault correlation
US6012152A (en) Software fault management system
US6556539B1 (en) Selector switch control using priority table
US6271845B1 (en) Method and structure for dynamically drilling down through a health monitoring map to determine the health status and cause of health problems associated with network objects of a managed network environment
US7197489B1 (en) Methods and apparatus for maintaining object data for components in a network
US6532554B1 (en) Network event correlation system using formally specified models of protocol behavior
US7307962B2 (en) System for inference of presence of network infrastructure devices
JP2002533017A (ja) コンピュータネットワークのトポロジを決定する方法
US7836156B1 (en) Method and apparatus for analyzing network infrastructure
Steinder et al. Non-deterministic diagnosis of end-to-end service failures in a multi-layer communication system
JPH10502222A (ja) ハードウエアの分散管理方法およびシステム
US20160142264A1 (en) Device recognition and management
JP3556485B2 (ja) 開放型システム間相互接続においてピング機能の能力を拡張する方法
US20040250260A1 (en) Middle-ware interface status tool and method for using same
CN110474821A (zh) 节点故障检测方法及装置
Bouloutas et al. Distributed fault identification in telecommunication networks
KR19980026888A (ko) 비동기식전송방식(atm) 장치에서 단순망관리규약(snmp)을 사용한 원격지에서의 장애관리방법
RU2801825C2 (ru) Способ, комплекс обработки информации об отказах устройств беспроводных сенсорных сетей передачи данных и связанных сетей