JPH10512109A - 故障監視 - Google Patents

故障監視

Info

Publication number
JPH10512109A
JPH10512109A JP8520298A JP52029896A JPH10512109A JP H10512109 A JPH10512109 A JP H10512109A JP 8520298 A JP8520298 A JP 8520298A JP 52029896 A JP52029896 A JP 52029896A JP H10512109 A JPH10512109 A JP H10512109A
Authority
JP
Japan
Prior art keywords
fault
threshold
alarm
duration
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8520298A
Other languages
English (en)
Inventor
ダウデン、アントワネット
エドワーズ、マイケル・ジョン
チャップマン、スティーブン・ジョン
オマリー、マイケル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
British Telecommunications PLC
Original Assignee
British Telecommunications PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=8217960&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JPH10512109(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by British Telecommunications PLC filed Critical British Telecommunications PLC
Publication of JPH10512109A publication Critical patent/JPH10512109A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Monitoring And Testing Of Exchanges (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)
  • Debugging And Monitoring (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

(57)【要約】 遠隔通信システム(21)で発生する故障が監視され、その開始時間を識別し、その故障が所定の間隔内でクリアしないときは、インターフェイス(16)を介してオペレータにその故障を報告する。所定の間隔内でクリアする一過性の故障は、この種の故障が所定の割合よりも一層頻繁に発生するときを除いて、直接に報告されない。これは、走査間隔、および複数の走査間隔に等しい解析間隔を確立し、システム(21)を故障の発生について連続的に監視し、メモリ(8)に発生時間を記憶することによって決定される。各走査間隔の終りに、それと同時に終る解析間隔中の故障発生数は、カウンタ(11)によって計数される。解析期間内の故障の発生数がユーザ入力(16)によって選択される閾値以上であるときに、アラームインジケータ(17)は作動する。これによって個々の一過性の故障を無視し、ユーザは繰返される間欠的な故障に集中することができる。

Description

【発明の詳細な説明】 故障監視 本発明は、遠隔通信システムの故障の監視に関する。遠隔通信ネットワークは 広域にわたって分布された多数の部品を有し、故障が発生したときにそれらを識 別し、サービス妨害としてネットワークのユーザに気付かれる前に迅速にそれら を処理できることが重要である。代って、ネットワークのユーザ(網の使用者) は、サービス妨害が所定の限界を越える場合の契約上のペナルティを特定してネ ットワークオペレータ(網運営者)とサービスレベル合意をかわすことができる 。故障を識別し、故障をオペレータに警報して、復旧動作を行なうことができる ようにするための多くの方法が知られている。本明細書の目的上“故障”という 用語に含まれるものには、機器又はサービス妨害のみではなく、外的要因による が、復旧動作を必要とする可能性のある過負荷のようなイベント(出来事)があ る。 システムのいろいろなユーザは、異なる環境での告知を必要とする。機器を監 視すべき遠隔通信ネットワークのオペレータは個々の機器の故障を知る必要があ る。しかしながら、遠隔通信ネットワークの機器の部品は、例えば別のルートが 使用可能であるとき、または顧客がシステムの全能力を使用していないときには 、顧客に与えられたサービスレベルについて何ら直接的影響を与えない可能性が ある。対照的に、機器の個々の部品が故障していないとき、例えば全顧客による システム使用の全需要がシステムの能力を越えるときに、顧客がサービス妨害を 受ける可能性がある。この顧客に供給されるサービスを監視するために、ネット ワークオペレータはこのようなサービス妨害を知らされることも必要である。 例えば、遠隔通信ネットワークでは、チャンネルが全能力で運転しているとき 、このチャンネルでは別の呼は不成功となる。この呼の失敗発生率の増加は、ネ ットワークが時間の長きにわたって全能力状態にあることを示す。例えば他の場 所(例えば、時分割多重アクセスシステムの第2チャンネル)から能力を再分配 することによって、復旧動作を行なうことができる。顧客へのサービスが妨害さ れる場合、これらはログすることができる。サービスレベル合意が本質によって 、どの情報が要求されているかが判断されるが、大抵の場合、保証される最小レ ベルが合意されている。最小レベルは、サービスが利用可能である時間の割合で 合 意されてよい。他の環境では、例えば再スタートの処理手順が複雑であるとき、 個々の妨害数を、付加的なまたは代りの規準として使用することができる。 故障監視で難しいことは、一過性の性質とすることができる現象は実際のまた は差し迫った根底の問題の存在を示すことができるが、その代りに重要性をもた ない統計的な揺らぎ以上のものではないことである。それ自身をクリアすると見 る一過性の故障は、原因が停止したことを示すか、または根底的な問題があり、 故障が一定の状況のもとで再び発生することを意味している。所定の閾値を越え て、システムの特性によってアラームがトリガされるときに、この問題に関する 1つの特定のケースが発生する。閾値の設定が高すぎるとき、この状況が既に臨 界的となって、復旧動作を行なうためのマージンを残さなくなるまで、アラーム インジケータはトリガされない。しかしながら、閾値の設定が低すぎると、故障 アラームの指示回数が多くなりすぎる。一過性の故障の重要度は個々の顧客の要 求にしたがって異なる。エラー補正機能を含む端末機器を有する顧客にとって、 間欠的で、一過性の故障は重要でない。しかしながら、中断が、たとえ短くても 、複雑なセキュリティ(保護)処理手順を含む再スタート動作が必要であったり 、機器を再設定するために現場に赴くことが必要な顧客に対して、多数の一過性 の妨害は、長い1回の妨害よりも著しく悪いことになる。 一過性の故障は、一過性でない故障とは別に処理しなければならない。一過性 の故障は自身をクリアするので、それらを手動でクリアするための復旧動作をす る必要はない。しかしながら、それらは自身をクリアするので、一過性の故障の 原因を調査したり、根底の問題を示していることがあるパターンを同定すること は困難である。 従来の技術の故障監視システムは、IBM Technical Disclosure Bulletin No.7 (1992年12月)から知られている。このシステムは毎秒、伝送エラーを検出する ことによって、故障が存在するか否かを記録する。15分間の間に故障を検出し た個々の秒数Xが第1の閾値Lを超えるか、または24時間の間に、故障を検出 した個々の秒数Zが、測定期間の大きさに比例して、Lよりも著しく低い第2の 閾値を超えるときに、警報が送られる。このやり方は長い期間と短い期間の両方 の故障率の統計的に著しい変化を検出できるようにし、突然の大きい変化を即時 に検出でき、さらに通常の短期間の統計的な揺らぎによって誤った警報を発生せ ずに、サンプルの大きさがより大きいために、統計的に重大なより小さい長期間 の変化の検出を可能とする。 この従来の技術のシステムは、故障が存在する秒の数のみを監視する。したが って、個々の故障の継続期間は考慮しない。例えば、15分間で9秒の“エラー 時間”の報告は、それぞれが1秒よりも短い9つの個々の故障、または9秒間の 1つの故障によって行われる。同時にまたは重なり合った継続期間に発生する別 々の故障に対して対策はとられず、各秒ごとに1つの故障の最大値のみを記録す ることができるだけである。 本発明の第1の態様によると、遠隔通信システムの複数の要素を故障について 監視し、該故障に応答してアラームを発生する方法であって、該システムを故障 の発生について監視する段階と、各故障の継続期間を測定する段階と、故障の継 続期間が所定値を越えていれば、アラームインジケータを作動させ、故障の継続 期間が所定値を越えなければ、記憶した値をインクリメントする方法が提供され る。 第2の態様によると、アラームインジケータ、故障の発生を検出するために各 要素に関係付けられた検出手段、該検出手段によって検出された各故障の継続期 間を測定するためのタイミング手段、タイミング手段によって測定された継続期 間が所定の値を越えていれば、アラームを作動するための作動手段、カウント数 を記憶するための計数手段、タイミング手段によって測定された継続期間が所定 値を越えなければ、計数手段に記憶されたカウント数をインクリメントするため のインクリメント手段を含む遠隔通信システムを故障について監視する装置が提 供される。 このようにして、所定の期間内で自然にクリアしないが、クリアしなければな らない故障は、システムオペレータに個々の一過性故障をすべて警報しなくとも 、後の解析のために記憶することができる一過性故障の報告とは容易に区別する ことができる。 好ましくは、故障の開始およびクリアリング時間を記録し、故障の開始時間を 記録した後で、遅延期間が始まり、この遅延期間が終わる前に故障をクリアした ことを記録したときは、記録した値をインクリメントし、故障をクリアしたこと を記録する前にこの遅延期間が終るときは、アラームインジケータを作動する。 好ましくはさらに、システムは、このシステムが不使用になったこと、または このシステムの機能についてユーザに監視される。 好ましい構成では、記憶した値が所定の時間間隔内で閾値以上の値に到達する とき、アラームインジケータが作動する。この付加的な特徴は、本明細書と同じ 日に出願され、同じ優先権を請求している共に出願中のPCT出願(Agents Ref .A25113)の主題である。 この構成は、上記の先行技術の構成のように1または複数の故障が存在する時 間の割合ではなく、実際に発生した故障の回数を測定する。個々の故障の発生回 数に応答してアラームの表示を発生することによって、一過性の故障の発生をシ ステムオペレータに直接に警報するよりも、この故障が注意を必要とするか否か に関するよりよい表示をオペレータが使用できるようになる。ユーザは、このシ ステムを使用して、サービスを使用できない時間数を識別することができる。 好ましくは、この方法は、 解析期間を確立する段階と、 連続的にシステムを故障の発生について監視する段階と、 解析期間よりも短い走査間隔の終りに、それと同時に終る解析期間中の故障 発生数を計数する段階と、 解析期間内の故障の発生数が閾値以上であるときにアラームインジケータを 作動する段階とを含む。 好ましくは、故障の開始およびクリアリング時間が記録され、記録したクリア リング時間が計数されないので、各走査間隔の終りでは、故障は解析期間よりも 長い時間を経過したことになる。 好ましくはさらに、故障発生数が第1と第2の閾値間にあるとき、アラームイ ンジケータは現在の状態で維持される。 好ましい構成では、解析期間内の故障発生数が第1の閾値よりも小さい第2の 閾値以下であるときに、アラームインジケータが停止する。 このアラームインジケータは、故障の継続期間が所定の値を越えたときに作動 するものと同じであってもよい。このアラームインジケータは、記憶した値が第 2の閾値を越えるか、または所定の値よりも大きい継続期間の故障がクリアされ ないままである限り、作動したままになるように構成することができる。記憶し た値が閾値よりも高いままであるか、または継続期間の長い故障がクリアされな いままであるか、またはこの両方であるかに応じて、アラームの動作状態は異な る。 別の構成では、解析期間内の故障発生数が閾値以上であるときに別のアラーム インジケータも作動し、これはオペレータによって受領告知されるまで作動し続 ける。 計数手段はメモリを具備し、解析期間の合計に等しい合計の継続期間を有する 走査間隔の複数のうちの1つでの故障状態の発生数を記憶する。所定の解析期間 および走査間隔の継続期間は選択可能である。 好ましくは、装置は、更新用プロセッサを配置して、各走査間隔の終りに、メ モリ内に記憶されたデータを検索し、それを計数手段に供給し、メモリに命令し て、データを記憶した最初の走査間隔に関連するデータを消去する。 好ましくは、第1の所定の特徴を有する故障状態の発生を第2の所定の特徴を 有するものから弁別するための弁別手段を備え、計数手段は各特徴を別々に有す る故障発生を計数するか、または種々のタイプの1つのみを計数するようにする 。計数手段は、何物かが優先して動作を留保することができる。したがって、ル ーチンテストおよび予め構成されたサービスの中断をこの解析から除いて計数し て、アラームが誤って発生するのを回避することができる。 ここで本発明の実施形態を図面を参照して例示的に記載する。 図1は、遠隔通信システムで発生する一連の故障の概略図である。 図2は、監視されるネットワークの素子と一緒に、間欠的な故障状態の遠隔通 信ネットワークを監視するための本発明の装置についての種々の部品を示す機能 のブロック図である。 図3は、本発明の動作に適したコンピュータの一般的な構造を示す。 図1は、本発明を実現する装置によって監視されるべき遠隔通信システムで発 生する特定の形式の一過性の故障の時間シーケンスを示している。例えば、シス テムは遠隔通信ネットワークであり、故障は通信チャンネルの過負荷、および特 定の顧客に対するサービス妨害であってもよい。 図2を参照して以下に記載されている監視装置では、時間は、それぞれtの長 さを有する多数の走査間隔t1、t2、等に分割される。この実施形態では、走査 間隔は故障の継続時間よりもかなり長く、同じ走査間隔内で複数の故障が発生す る可能性がある。解析期間Tが定められており、この実例では、この解析期間T は走査間隔tの長さの3倍である。しかしながら、実際には解析期間はこれより も非常に長くてもよい。 本発明では、一過性の故障とそれよりも長い継続期間を有する故障とが区別さ れる。故障を識別すると、遅延期間が始まる。遅延期間の長さは、異なる顧客お よびサービスごとに構成することができる。遅延期間中に故障がクリアしないと き、アラームインジケータがトリガされる。このアラームインジケータは、閾値 数を越えるときにトリガされるインジケータと同じであってもよいが、好ましく はアラームは互いに異なっているかまたは異なる動作状態を有していて、1つの 長い妨害と一連の短い妨害とを識別することができるので、オペレータはアラー ムに応答して自己の動作を優先させることができる。しかしながら、遅延期間中 に故障がクリアすると、この故障は1づつ増加する現在の走査間隔に対して一過 性のアラームおよびサービスレベルの一過性の故障スコア(失点)として分類さ れる。所定の故障が発生し、同じ走査間隔内で複数回クリアするとき、この走査 間隔内の最終的な一過性故障のスコアは、この走査間隔内で発生した故障の回数 になる。別のアラームを用意して、それがオペレータによる受領告知がされてク リアされるまで、一過性故障の報告後動作したままとすることができる。 この例では、一過性故障A、B、C、D、Eは、それぞれ走査間隔t2、t4( 2回)、t6、およびt7内で発生する。 各走査間隔の終りに、この装置は、この例では最後の3つの走査閾値で成る解 析期間T中に発生した故障の数を計数し、その数がこの例では3に設定された閾 値に到達するか、または越えるときに、アラームインジケータがトリガされる。 解析期間の数が、第2の閾値、この例では1、以下に下がるときだけ、アラーム インジケータはクリアされる。一過性故障の発生率がある単一の閾値に近いとき 、他の点で発生する可能性のある間欠的なアラームの発生を避けるために異なる 閾値が選択される。例えば、走査間隔t3の終りに、解析期間t1+t2+t3内で 1つの故障Aのみが計数される。次の走査間隔t4の終りでは、解析期間t2+t3 +t4内で3つの故障A、B、Cが計数されて、アラームインジケータがトリガ される。次の走査間隔t5の終りでは、故障Aは解析期間t3+t4+t5の外にあ るので、2つの故障のみが計数される。2つの故障はアラーム閾値である3より も小さいが、この解析期間内の故障数が第2の閾値まで下っていないので、アラ ームはクリアされない。 走査間隔t6の終りには、この解析期間内に3つの故障B、C、Dが再び存在 する。走査間隔t7の終りでは、(走査間隔t7内の)故障Eが付加されるが、故 障BおよびCは解析期間t5 +t6 +t7 の外にあるので、2つの故障Dおよび Eのみが存在する。しかしながら、“クリア”の閾値は通ってないので、アラー ムインジケータは再びオンのままにされる。期間t9の終りでは、故障Eのみが 解析期間t7+t8+t9内に存在するので、故障数はその閾値内に下り、アラー ムインジケータはクリアする。しかしながら、故障“E”の後に期間t8または t9内で1又は複数の別の故障の群が続いたとしても、第2の閾値には到達せず 、アラームインジケータはクリアしない。 故障Eは期間t6から始まってはいるが、アラームインジケータがクリアする 期間t7内にあるとして計数されることに注意すべきである。こうして故障Eを 二重に計数することを避けている。走査間隔t6の終りでは、故障の継続期間が 不確定であるために、クリア時間が使用されるので、故障が長くなる可能性があ る(走査間隔t9およびt10内の故障F参照)。 ここで図2を参照すると、素子2乃至5を含む遠隔通信ネットワーク21におい て故障を監視する装置20の機能部品の機能ブロック図が示されている。これらの 素子はネットワークの機能部品であるか、またはネットワークによって顧客に与 えられるサービスの素子であってもよい。 装置20は、図3に示されているような従来の構造のコンピュータ上で実現され ており、メモリ220 、ディスプレイスクリーン222 およびキーボード224 、中央 処理ユニット226 、およびインターフェイス228 で成る。メモリ220 は、ハード ディスク、ランダムアクセスメモリ(RAM)、および読取り専用メモリ(RO M)の組合せ体として構成することができる。コンピュータはメモリ220 にプロ グラムを記憶し、プログラムは、図2に示されている機能部品1、6、7、8、 9、10、11、12、13、14、15、および16に対応する1組のプログラムモジュール を含む。 装置20は、ネットワーク21の種々の素子2、3、4、5の故障に対してネット ワーク21を監視するための故障モニタ1を含んでいる。モニタ1は、故障の継続 期間が短いか長いかを識別する故障継続期間弁別器6に最初に出力する。故障が 所定の時間内でクリアしたとき、弁別器6はこの故障に関する情報をメモリ8に 送る。各故障に関して記憶された情報は、各故障が関係するネットワーク素子2 、3、4、または5に関する情報、故障の発生時間、および故障をクリアする時 間を含む。発生およびクリア時間は、関連するネットワーク素子2、3、4、お よび5またはモニタ1によって報告することができる。故障が所定の時間内でク リアしないとき、弁別器はアラーム7を作動させて、ディスプレイ222 上で一過 性でない故障をユーザに示す。幾つかの目的のために、例えば中断後に機器をリ セットする必要があるとき、一過性の故障が発生すると、それらをユーザに警報 することも必要である。この種の手立てが必要とされる場合、モニタ1が故障を 検出するときはいつでもアラーム7が作動する。 更新用プロセッサ9は、タイマ10によって制御される走査間隔tでメモリ8か らデータを周期的に検索する。更新用プロセッサ9はメモリ8に命令して、故障 がクリアされてから経過した期間T(解析期間)内の故障に関する情報を消去す る。走査間隔が解析期間を超えないという条件のもとで、解析期間Tおよび走査 間隔tの両方を選択することができる。解析期間Tは、一般的に走査間隔tの数 倍であるので、各走査間隔の終りで、前のT/tの走査間隔内の故障が検索され る。その後、プロセッサ9はカウンタ11にデータを送り、前の解析期間内でクリ アされた、各素子2、3、4、5に関連する故障数を計数する。得られた値は比 較器12に送られて、そこで閾値メモリ13内に記憶された作動および停止の閾値と 比較して、その結果をアラーム制御器14へ送る。アラーム制御器14はさらにアラ ーム状態モニタ15から入力を受け取り、予め存在した状態および以下の真理表に 基いて比較器12から得た結果にしたがってアラームインジケータ7の作動(作動 またはクリア)もする。 したがって計数値が停止の閾値以下であるとき、アラームインジケータはオフ にされる。計数値が停止の閾値を上げるときは、それが作動の閾値を上げるかま たはその閾値よりも大きくなるときにアラームインジケータがオンに切替わるま で、アラームインジケータ7は“オフ”のままである。計数値が閾値間にあると きは、アラームインジケータは“オン”状態のままであり、また停止の閾値以下 であるときは、アラームはオフに切替えらえる。 オペレータがアラームに気付くのに十分な時間を与えるために、停止の閾値を 通過しても、アラームインジケータが作動してから所定数の走査間隔を経過する まで、それを作動状態のまま維持することができる。アラームは手動でクリアす ることもできる。各アラームは一過性の故障を報告した後で、オペレータが受領 告知することによってそれをクリアするまで作動したままにすることができる。 キーボード224 またはその他の入力装置(例えば、マウス)に関連するユーザ 入力16は、故障継続期間弁別器6によって使用される故障継続期間、タイマ10に よって使用される走査間隔、更新用プロセッサ9によって使用される解析期間、 および閾値メモリ13に記憶される閾値を選択することと、モニタ1によって監視 されるべき素子2、3、4、5を選択することを可能にする。 アラームインジケータ7は、素子2、3、4、5の何れがアラームインジケー タ7を作動させたか、あるいは作動は長い継続期間の故障または短い故障の累積 の何れが原因であったかに関する情報をユーザに与える。 ここで図1に示された故障のシーケンスを参照して、装置の動作に関して記載 する。例示的に、1つの素子2のみを監視し、長い/短い故障閾値を5分に、走 査間隔を20分に、解析期間を1時間に、アラームインジケータの作動閾値を3 に、アラームインジケータの停止の閾値を1に設定する。これらの値は、例示の ためにのみ選択されているので、必ずしも実際のシステムに対する適切な値を表 していない。例示の期間の開始時は故障はメモリ8に記録されておらず、アラー ムインジケータ7がまだ作動されていないことを仮定する。 タイマ10は、20分ごとに動作するように更新用プロセッサ9をトリガする。 この種の動作の始め、すなわち走査間隔t1の終りでは、メモリ8はデータを含 んでいないので、更新用プロセッサ9はメモリ8からデータを引出さない。カウ ンタ11はゼロの結果を比較器12に送って、この結果を作動および停止の閾値と比 較する。ゼロ計数は何れの閾値よりも小さいので、アラームインジケータ7は作 動しない。第2の走査間隔t2では、故障Aはモニタ1によって検出される。こ の故障は、5分前に弁別器6によって設定された閾値をクリアし、故障Aに関す るデータはメモリ8に送られる。走査間隔の終りで、更新用プロセッサ9は故障 Aのデータを検索するが、故障が発生して以来経過した時間は解析期間Tよりも 短いので、メモリ8から故障Aを消去しない。データはカウンタ11へ送られ、値 1は比較器12で閾値メモリ13に記憶された値と比較される。ここでカウンタは停 止の閾値であるが、アラームインジケータ7はまだ作動されておらず、計数は作 動の閾値よりも小さいので、アラームインジケータは作動されない。 同様に、走査間隔t3の終りでは、故障はメモリ8に付加されず、故障は解析 期間Tよりも長くメモリ内に存在しないので、前の走査間隔t2の間に更新、計 数、および比較処理が行われる。 走査間隔t4の間、2つの短い故障B、Cが発生する。故障Aが走査間隔t2に 記録されたのと同じ方法で、故障B、Cがメモリ8に付加される。ここで走査間 隔t4の終りで、カウンタ11は3つの故障を計数する。この値3が閾値メモリ13 に記憶された値と比較され、作動閾値であることが分る。比較器12からの出力は 、アラームインジケータが現在作動されていないことを示すアラームインジケ ータ状態モニタ15からの入力と一緒に、アラームインジケータ制御器14へ入力さ れる。これによって、アラーム制御器14はアラームインジケータ7を作動させる 。 走査間隔t5中、別の故障は発生しない。走査間隔t5の終りに、更新用プロセ ッサは、故障Aが以前に走査間隔t2で発生したものが時間Tよりも長く発生した ことを識別する。したがって故障Aはメモリ8から検出される。それゆえにカウ ンタ11は2つの故障(故障BおよびC)のみを計数し、この2の値はメモリ13に 記憶された閾値の値と比較される。この値は作動の閾値よりも小さくなるが、依 然として停止の閾値よりも大きいので、アラームインジケータ7は現在の状態( 作動状態)のままである。 走査間隔t6中に別の故障Dが発生し、別の故障Eがこの走査間隔が終るとき に発生する。故障Eはまだクリアされていないので、それが長/短弁別閾値を越 えるか否かを判断することはまだできない。 それゆえに走査間隔t6 の終りに更新用プロセッサはメモリ8に記憶された3 つの故障B、C、およびDを認めるが、その何れも完全な解析期間Tよりも長く は記憶されない。したがってこれらの故障はメモリ8から消去されず、全てがカ ウンタ11によって計数される。カウンタ11によって決定される3の値は、閾値メ モリ13に記憶された閾値の値と比較され、作動の閾値ににあることが分かる。ア ラームインジケータ状態モニタ15は既に作動しているアラームインジケータ7を 識別するので、新しいアラームの指示は生成されない。 走査間隔t7では故障Eは長/短弁別閾値内でクリアして、メモリ8に記憶さ れる。走査間隔t7の終りで、故障が発生して以来解析期間Tが経過するので、 更新用プロセッサは故障BおよびCを消去してメモリ8を更新する。それゆえに カウンタ11は2つの故障DおよびEのみを計数し、この2の値は、比較器12で閾 値と比較される。この値は再び作動の閾値よりも小さくなるが、依然として停止 の閾値よりも高いので、アラームインジケータ7は現在の状態(作動状態)のま まである。同様に、走査間隔t8では、故障は新たに発生せず、更新用プロセッ サ9によって何も消去されないので、カウンタ11によって計数される故障の数は 2のままであり、アラームインジケータ7は作動したままである。 走査間隔t9の終りの方で、別の故障Fが始まるが、この走査間隔の終りにな る前に長/短弁別閾値に到達しないので、クリアしない。期間t9の終りで故障 Dに対する解析期間Tが終了したとき、この故障が更新用プロセッサ9によって メモリ8から消去される。したがって、カウンタ11によって計数された故障Eの みがメモリ8に残される。それゆえにカウンタ11から比較器12へ出力される値は 1であり、これは停止の閾値である。この結果アラーム制御器14はアラームイン ジケータ7を停止する。 走査間隔t10中に、長/短弁別閾値は、故障Fがクリアする前に終了する。こ の弁別期間の終了時に、弁別器6は故障Fを長い故障として識別し、直ぐにアラ ームインジケータ7を作動する。 一定の環境で、システムは、“故障”の指示を受けなかったとき、“クリア” の指示を受けることができる。例えばシステムが最初に設定されるとき、または 別のより一般的な故障が“故障”の信号を生成したのために、それを受けられな いときに上記のようになる。システムは、この種の“対にされていない”クリア の指示を無視するようにされている。 アラームインジケータ7は、素子2、3、4、または5の何れかが生成する故 障、その合計の継続時間、および発生時間に関する情報を与えることができる。 上記の装置20は、どのレベルでもネットワークの機能を監視するために使用す ることができる。例えば、遠隔通信機器のメンテナンスに責任のあるネットワー クオペレータは、機器の特定の故障事態を監視することを望んでいる。外的要因 によって発生する可能性の高い個々の一過性の妨害は重要でない場合がある。例 えば、機器の故障がシステム内の1点で発生するとき、それと通信している機器 の他の多くの動作事態を妨害(中断)するであろう。ネットワークがいわゆる“ 自然治癒”能力を有するとき、故障した機器の使用を避けるために呼を再びルー ト設定することができ、1つの一過性の妨害のみが他の部品に対して検出される 。しかしながら、機器の1部品から多数の一過性の故障が検出されるとき、これ は、その部品の機能が劣化しつつある進行中の状況を示すことができる。部品が 完全に故障する前に、その使用を避けるかまたは最小にする呼トラヒックの再ル ート設定をするか、またはその部品を回復することによって復旧動作を行なうた めにこの情報を使用することができる。 ネットワークによって供給されるサービスを受ける顧客は通常、サービスそれ 自身が妨害されていなければ、個々の機器の故障に関して考慮しない。この顧客 は、(多数の個々の妨害または合計時間の割合として)サービス妨害の最大レベ ルを特定するネットワークオペレータとサービスレベル契約を結んでいることが よくある。アラームインジケータ7は、ネットワークオペレータおよび/または 顧客がシステムの性能を見て分かるよう監視し、記録されるように、これらのサ ービス妨害の詳細を記録する手段を含むことができる。アラームインジケータ7 は、記憶された詳細を監視して、時間の割合、または合計の経過時間を識別する ために記録された詳細を監視することができるこの時間は、すなわちサービスが 妨害された時間が所定の値を超えてアラームをトリガするときである。
【手続補正書】特許法第184条の8第1項 【提出日】1997年1月29日 【補正内容】 に検出でき、さらに通常の短期間の統計的な揺らぎによって誤った警報を発生せ ずに、サンプルの大きさがより大きいために、統計的に重大なより小さい長期間 の変化の検出を可能とする。 この従来の技術のシステムは、故障が存在する秒の数のみを監視する。したが って、個々の故障の継続期間は考慮しない。例えば、15分間で9秒の“エラー 時間”の報告は、それぞれが1秒よりも短い9つの個々の故障、または9秒間の 1つの故障によって行われる。同時にまたは重なり合った継続期間に発生する別 々の故障に対して対策はとられず、各秒ごとに1つの故障の最大値のみを記録す ることができるだけである。 本発明の第1の態様によると、遠隔通信システムの複数の要素を故障について 監視し、それに応答してアラームを発生する方法であって、要素を故障の発生に ついて監視する段階と、各故障発生の継続期間を測定する段階と、各故障発生に ついて、 その継続期間が所定値を越えていれば、アラームインジケータを作動させ、 その継続期間が所定値を越えなければ、記憶した値をインクリメントする方 法が提供される。 第2の態様によると、アラームインジケータ、故障の発生を検出するために各 要素に関係付けられた検出手段、該検出手段によって検出された各故障の継続期 間を測定するためのタイミング手段、タイミング手段によって測定された継続期 間が所定の値を越えていれば、アラームを作動するための作動手段、カウント数 を記憶するための計数手段、タイミング手段によって測定された継続期間が所定 値を越えなければ、計数手段に記憶されたカウント数をインクリメントするため のインクリメント手段を含む遠隔通信システムを故障について監視する装置が提 供される。 このようにして、所定の期間内で自然にクリアしないが、クリアしなければな らない故障は、システムオペレータに個々の一過性故障をすべて警報しなくとも 、後の解析のために記憶することができる一過性故障の報告とは容易に区別する ことができる。 好ましくは、故障の開始およびクリアリング時間を記録し、故障の開始時間を 請求の範囲 1.遠隔通信システムの複数の要素を故障について監視し、それに応答してアラ ームを発生する方法であって、要素を故障の発生について監視する段階と、各故 障発生の期間を測定する段階と、各故障発生について、その期間が所定値を越え ていればアラームインジケータを作動させ、越えていなければ記憶した値をイン クリメントさせる段階とで成る方法。 2.故障の開始およびクリア時間を記憶し、故障の開始時間を記録した後で、遅 延期間が始まり、該遅延期間が終わる前に故障をクリアしたことを記録するとき は記憶した値をインクリメントし、故障をクリアしたことを記録する前に該遅延 期間が終るときはアラームインジケータを作動する請求項1記載の方法。 3.前記システムが、該システムが不使用になったこと、または該システムの機 能をユーザによって監視される請求項1または2記載の方法。 4.該記憶した値が所定の時間間隔内で閾値以上であるときに、該アラームイン ジケータを作動する請求項1乃至3の何れか1項記載の方法。 5.該解析期間を確立する段階と、 該システムを故障の発生について連続的に監視する段階と、 該解析期間よりも短い走査間隔の終りに、それと同時に終る該解析期間内の 故障発生数を計数する段階と、 該解析期間内の故障発生数が閾値以上であるときにアラームインジケータを 作動する段階とで成る請求項4記載の方法。 6.故障の開始およびクリアリング時間が記憶され、該記録したクリアリング時 間は計数されないために、該故障が、各走査間隔の終りでは該解析期間よりも長 い時間を経過したことになる請求項5記載の方法。 7.解析期間中の故障の発生数が、第1の閾値よりも小さい第2の閾値以下であ るとき、アラームインジケータを作動する段階をさらに含む請求項5または6記 載の方法。 8.解析期間内の故障の発生数が閾値以上であるとき、さらに別のアラームイン ジケータを作動し、それがオペレータによって受領告知されるまで作動し続ける 請求項5乃至7の何れか1項記載の方法。 9.解析期間内の故障数が閾値を越えるときに作動するアラームインジケータが 、故障の継続期間が所定値を越えるときに作動するものと同じである請求項5乃 至8の何れか1項記載の方法。 10.記憶した値が第2の閾値を越えるか、または所定値よりも大きい継続期間 の故障がクリアされないままである請求項9記載の方法。 11.記憶した値がその閾値よりも高いままであるか、または継続期間の長い故 障がクリアされないままであるか、またはその両方であるかに応じて、該アラー ムが異なる動作状態を有する請求項9または10記載の方法。 12.前記遠隔通信システムの複数の要素を故障について監視するための装置で あって、アラームインジケータ、故障の発生を検出するために各要素と関係付け られた検出手段、該検出手段によって検出される各故障の継続期間を測定するた めのタイミング手段、該タイミング手段によって測定される継続期間が所定値を 越えたときにアラームを作動するための作動手段、カウント数を記憶するための 計数手段、および該タイミング手段によって測定される故障の継続期間が該所定 値を越えないときに計数手段に記憶されたカウント数をインクリメントするため のインクリメント手段から成る装置。 13.該検出手段が個々の故障の開始およびクリアリングを検出するための手段 を含み、該タイミング手段が各故障の開始およびクリアリング時間を記録するた めの時間記録手段を含む時間記録手段と、故障の開始の検出によって始動し、故 障のクリアリングの検出によってリセットされ、故障の開始から経過した時間を 測定するための遅延タイミング手段とを含み、該作動手段が遅延タイミング手段 によって測定される経過時間が所定値に到達するときに動作するようにされてお り、該インクリメント手段が該遅延タイミング手段によって測定された経過時間 が該所定値に到達する前に該検出手段が故障のクリアリングを検出するときに動 作するようにされている請求項12記載の装置。 14.所定の解析期間内で、該計数手段に記憶されたカウント数が、所定の作動 閾値に到達するか、または越えるときに動作することができる別のアラーム作動 手段をさらに含む請求項12または13記載の装置。 15.その合計期間が該解析期間の合計である複数の各走査間隔内の故障状態の 発生数を記憶するようにされているメモリをさらに含む請求項14記載の装置。 16.各故障の開始およびクリアリング時間を記録するための時間記録手段、該 開始および/またはクリアリング時間にしたがって所定の解析期間および走査間 隔を割当てる割当て手段とを含む請求項15記載の装置。 17.各走査間隔の終りに、メモリに記憶されたデータを検索し、それを計数手 段に供給し、データを記憶した最初の走査間隔に相関するデータを消去するよう にメモリに命令する更新用プロセッサを含む請求項15または16記載の装置。 18.計数手段に記憶された数が、作動閾値よりも小さい停止閾値以下であると き、アラーム手段を停止する停止手段をさらに含む請求項14乃至17の何れか 1項記載の装置。 19.解析期間中の故障発生数が閾値以上であるときに作動する別のアラームイ ンジケータ、および該別のアラームインジケータを停止するためにオペレータに よって制御可能な手段とを含む請求項14乃至18の何れか1項記載の装置。 20.別のアラーム作動手段によって作動するアラームインジケータが、故障の 継続期間が所定値を越えたときに作動されるものと同じである請求項14乃至1 9の何れか1項記載の装置。 21.記憶した値が第2の閾値を越えるか、または所定値よりも大きい継続期間 の故障がクリアされないままである限り、該アラームインジケータを作動したま まにするように構成されている請求項20記載の装置。 22.記憶した値がその閾値よりも高いままにされるか、または継続期間の長い 故障がクリアされないままか、またはその両方であるかに応じて、該アラームの 動作状態が異なる請求項20または21記載の装置。 23.第1の所定の特徴を有する故障状態の発生と、第2の所定の特徴を有する 故障状態の発生とを弁別するための弁別手段と、該第1の特徴を有する故障の発 生のみを計数するようにされている計数手段とを含む請求項12乃至22の何れ か1項記載の装置。 24.請求項12乃至23の何れか1項記載の監視装置をさらに含む遠隔通信シ ステム。 25.図面を参照して実質的に記載したように遠隔通信システムを故障について 監視する方法。 26.図面を参照して実質的に記載したように遠隔通信システムを故障について 監視する装置。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FR,GB,GR,IE,IT,LU,M C,NL,PT,SE),OA(BF,BJ,CF,CG ,CI,CM,GA,GN,ML,MR,NE,SN, TD,TG),AP(KE,LS,MW,SD,SZ,U G),AL,AM,AT,AU,BB,BG,BR,B Y,CA,CH,CN,CZ,DE,DK,EE,ES ,FI,GB,GE,HU,IS,JP,KE,KG, KP,KR,KZ,LK,LR,LS,LT,LU,L V,MD,MG,MK,MN,MW,MX,NO,NZ ,PL,PT,RO,RU,SD,SE,SG,SI, SK,TJ,TM,TT,UA,UG,US,UZ,V N (72)発明者 エドワーズ、マイケル・ジョン イギリス国、アイピー4・2エックスピ ー、サフォーク、イプスウィッチ、ウエス ターフィールド・ロード 85 (72)発明者 チャップマン、スティーブン・ジョン イギリス国、アイピー1・6エーエイチ、 サフォーク、イプスウィッチ、コングレー ブ・ロード 35 (72)発明者 オマリー、マイケル イギリス国、アイピー13・6イービー、サ フォーク、ウッドブリッジ、ウィロー・バ ーン・ロウアー・ユフォード(番地なし)

Claims (1)

  1. 【特許請求の範囲】 1.遠隔通信システムの故障を監視し、それに応答してアラームを発生する方法 であって、前記システムを故障の発生について監視する段階と、各故障の継続期 間を測定する段階と、該故障の継続期間が所定値を越えたときはアラームインジ ケータを作動する段階と、該故障の継続期間が該所定値を越えないときは記憶し た値をインクリメントさせる段階とを含む方法。 2.故障の開始およびクリアリング時間を記憶し、該故障の開始時間を記録した 後で、遅延期間が始まり、該遅延期間が終わる前に故障をクリアしたことを記録 するときは該記憶した値をインクリメントし、該故障をクリアしたことを記録す る前に該遅延期間が終るときは該アラームインジケータを作動する請求項1記載 の方法。 3.前記システムが、該システムが不使用になったこと、または該システムの機 能をユーザによって監視される請求項1または2記載の方法。 4.所定の時間間隔内で、該記憶した値が閾値以上の値に到達するときに、該ア ラームインジケータを作動する請求項1乃至3の何れか1項記載の方法。 5.解析期間を確立する段階と、 該システムを故障の発生について連続的に監視する段階と、 該解析期間よりも短い走査間隔の終りに、それと同時に終る該解析期間内の 故障発生数を計数する段階と、 該解析期間内の故障の発生数が閾値以上であるときにアラームインジケータ を作動する段階とで成る請求項4記載の方法。 6.故障の開始およびクリアリング時間が記憶され、該記録したクリアリング時 間は計数されないために、該故障が、各走査間隔の終りでは該解析期間よりも長 い時間を経過したことになる請求項5記載の方法。 7.解析期間中の故障の発生数が、第1の閾値よりも小さい第2の閾値以下であ るとき、アラームインジケータを作動する段階をさらに含む請求項5または6記 載の方法。 8.解析期間内の故障の発生数が閾値以上であるとき、さらに別のアラームイン ジケータを作動し、それがオペレータによって受領告知されるまで作動し続ける 請求項5乃至7の何れか1項記載の方法。 9.解析期間内の故障数が閾値を越えるときに作動するアラームインジケータが 、故障の継続期間が所定値を越えるときに作動するものと同じである請求項5乃 至8の何れか1項記載の方法。 10.記憶した値が第2の閾値を越えるか、または所定値よりも大きい継続期間 の故障がクリアされないままである請求項9記載の方法。 11.記憶した値がその閾値よりも高いままであるか、または継続期間の長い故 障がクリアされないままであるか、またはその両方であるかに応じて、該アラー ムが異なる動作状態を有する請求項9または10記載の方法。 12.アラームインジケータ、故障の発生を検出するための検出手段、各故障の 継続期間を測定するためのタイミング手段、該タイミング手段によって測定され る継続期間が所定値を越えたときにアラームを作動するための作動手段、カウン ト数を記憶するための計数手段、および該タイミング手段によって測定される故 障の継続期間が該所定値を越えたときに該計数手段に記憶されたカウント数をイ ンクリメントするためのインクリメント手段から成る遠隔通信システムを故障に ついて監視するための装置。 13.検出手段が個々の故障の開始およびクリアリングを検出するための手段を 含み、タイミング手段が該各故障の開始およびクリアリング時間を記録するため の時間記録手段を含む時間記録手段と、故障の開始の検出によって始動し、故障 のクリアリングの検出によってリセットされ、故障の開始から経過した時間を測 定するための遅延タイミング手段とを含み、作動手段が該遅延タイミング手段に よって測定される経過時間が所定値に到達するときに動作するようにされており 、インクリメント手段が該遅延タイミング手段によって測定された経過時間が該 所定値に到達する前に該検出手段が故障のクリアリングを検出するときに動作す るように構成されている請求項12記載の装置。 14.所定の解析期間内で、計数手段に記憶されたカウント数が、所定の作動閾 値に到達するか、または越えるときに動作することができる別のアラーム作動手 段をさらに含む請求項12または13記載の装置。 15.その合計期間が該解析期間の合計である複数の各走査間隔内の故障状態の 発生数を記憶するようにされているメモリをさらに含む請求項14記載の装置。 16.各故障の開始およびクリアリング時間を記録するための時間記録手段、該 開始および/またはクリアリング時間にしたがって所定の解析期間および走査間 隔を割当てる割当て手段とを含む請求項15記載の装置。 17.各走査間隔の終りに、メモリに記憶されたデータを検索し、それを計数手 段に供給し、データを記憶した最初の走査間隔に相関するデータを消去するよう にメモリに命令する更新用プロセッサを含む請求項15または16記載の装置。 18.計数手段に記憶された数が、作動閾値よりも小さい停止閾値以下であると き、アラーム手段を停止する停止手段をさらに含む請求項14乃至17の何れか 1項記載の装置。 19.解析期間中の故障発生数が閾値以上であるときに作動する別のアラームイ ンジケータ、および該別のアラームインジケータを停止するためにオペレータに よって制御可能な手段とを含む請求項14乃至18の何れか1項記載の装置。 20.別のアラーム作動手段によって作動するアラームインジケータが、故障の 継続期間が所定値を越えたときに作動されるものと同じである請求項14乃至1 9の何れか1項記載の装置。 21.記憶した値が第2の閾値を越えるか、または所定値よりも大きい継続期間 の故障がクリアされないままである限り、該アラームインジケータを作動したま まにするように構成されている請求項20記載の装置。 22.記憶した値がその閾値よりも高いままにされるか、または継続期間の長い 故障がクリアされないままか、またはその両方であるかに応じて、該アラームの 動作状態が異なる請求項20または21記載の装置。 23.第1の所定の特徴を有する故障状態の発生と、第2の所定の特徴を有する 故障状態の発生とを弁別するための弁別手段と、該第1の特徴を有する故障の発 生のみを計数するようにされている計数手段とを含む請求項12乃至22の何れ か1項記載の装置。 24.請求項12乃至23の何れか1項記載の監視装置をさらに含む遠隔通信シ ステム。 25.図面を参照して実質的に記載したように遠隔通信システムを故障について 監視する方法。 26.図面を参照して実質的に記載したように遠隔通信システムを故障について 監視する装置。
JP8520298A 1994-12-23 1995-12-22 故障監視 Pending JPH10512109A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB94309760.0 1994-12-23
EP94309760 1994-12-23
PCT/GB1995/003024 WO1996020548A1 (en) 1994-12-23 1995-12-22 Fault monitoring

Publications (1)

Publication Number Publication Date
JPH10512109A true JPH10512109A (ja) 1998-11-17

Family

ID=8217960

Family Applications (2)

Application Number Title Priority Date Filing Date
JP8520298A Pending JPH10512109A (ja) 1994-12-23 1995-12-22 故障監視
JP8520299A Pending JPH10511524A (ja) 1994-12-23 1995-12-22 故障監視

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP8520299A Pending JPH10511524A (ja) 1994-12-23 1995-12-22 故障監視

Country Status (12)

Country Link
US (2) US6018300A (ja)
EP (2) EP0799540B1 (ja)
JP (2) JPH10512109A (ja)
KR (1) KR980700754A (ja)
CN (2) CN1171181A (ja)
AU (1) AU688652B2 (ja)
DE (1) DE69522712T2 (ja)
FI (2) FI972600A0 (ja)
HK (1) HK1004624A1 (ja)
NO (2) NO972885L (ja)
NZ (2) NZ297845A (ja)
WO (2) WO1996020548A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009237936A (ja) * 2008-03-27 2009-10-15 Toshiba Corp 情報収集装置、方法、及びプログラム
JP2013522741A (ja) * 2010-03-16 2013-06-13 インターナショナル・ビジネス・マシーンズ・コーポレーション 診断データを収集するためのマルチスレッド化コンピューティング環境における方法、装置、およびコンピュータ・プログラム
WO2019159966A1 (ja) * 2018-02-15 2019-08-22 日本電信電話株式会社 監視装置および監視方法

Families Citing this family (103)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI249760B (en) * 1996-07-31 2006-02-21 Canon Kk Remote maintenance system
KR100454935B1 (ko) * 1997-04-11 2004-12-23 삼성전자주식회사 기지국에서의 송신출력 제어방법
FI107312B (fi) * 1997-10-14 2001-06-29 Nokia Networks Oy Verkonvalvontamenetelmä tietoliikenneverkkoa varten
JPH11261471A (ja) * 1998-03-11 1999-09-24 Fujitsu Ltd 移動体通信システムの障害監視装置
JPH11328047A (ja) * 1998-05-12 1999-11-30 Nec Corp デバイスのアラーム検出方法及びデバイスのアラーム検出プログラムを記録したコンピュータ読み取り可能な記録媒体
GB2339119B (en) * 1998-06-30 2003-05-21 Mitel Corp Method and apparatus for event detection in a switching system
JP3196839B2 (ja) * 1998-09-28 2001-08-06 日本電気株式会社 移動通信システムにおける無線品質劣化判定方法及び無線品質監視装置
US6151483A (en) * 1998-10-28 2000-11-21 Ericsson Inc. Method and device for management of base station resources
WO2000038395A1 (de) * 1998-12-21 2000-06-29 Siemens Aktiengesellschaft Verfahren zum erfassen von in wenigstens einer elektrischen einheit, insbesondere einer vermittlungstechnischen einrichtung, auftretenden fehlern
US6198401B1 (en) * 1999-02-12 2001-03-06 Mcgraw Edison Company Detection of sub-cycle, self-clearing faults
US6970831B1 (en) * 1999-02-23 2005-11-29 Performax, Inc. Method and means for evaluating customer service performance
GB9904351D0 (en) * 1999-02-26 1999-04-21 Koninkl Philips Electronics Nv Communication channel quality indicator
US6239699B1 (en) * 1999-03-03 2001-05-29 Lucent Technologies Inc. Intelligent alarm filtering in a telecommunications network
US6418487B1 (en) * 1999-04-30 2002-07-09 Intel Corporation Method to track agents after a loss of state event
US6424927B1 (en) * 1999-06-18 2002-07-23 Sri International Computer-based real-time transient pulse monitoring system and method
US6636991B1 (en) * 1999-12-23 2003-10-21 Intel Corporation Flexible method for satisfying complex system error handling requirements via error promotion/demotion
US6832086B1 (en) * 2000-06-13 2004-12-14 Motorola, Inc. Manager-directed method for event pressure reduction
US6414595B1 (en) * 2000-06-16 2002-07-02 Ciena Corporation Method and system for processing alarm objects in a communications network
US6816461B1 (en) * 2000-06-16 2004-11-09 Ciena Corporation Method of controlling a network element to aggregate alarms and faults of a communications network
US6775236B1 (en) * 2000-06-16 2004-08-10 Ciena Corporation Method and system for determining and suppressing sympathetic faults of a communications network
US7058707B1 (en) 2000-08-01 2006-06-06 Qwest Communications International, Inc. Performance modeling in a VDSL network
US7467193B2 (en) * 2000-08-01 2008-12-16 Qwest Communications International Inc Management of virtual and physical network inventories
CA2328539A1 (en) * 2000-12-13 2002-06-13 Leonard G. D. Allen Solar powered surveillance monitor
NO20006691L (no) * 2000-12-29 2002-07-01 Ericsson Telefon Ab L M Styrt håndtering av fjern-ende ved utstyrssvikt i en MSP1+1 enkeltrettet konfigurasjon
GB2372667B (en) 2001-02-21 2003-05-07 3Com Corp Apparatus and method for providing improved stress thresholds in network management systems
GB2372672B (en) * 2001-02-27 2003-04-30 3Com Corp Network management apparatus and method for processing events associated with device reboot
GB2372673B (en) * 2001-02-27 2003-05-28 3Com Corp Apparatus and method for processing data relating to events on a network
GB2372674B (en) * 2001-02-27 2003-05-07 3Com Corp Network management apparatus and method for determining network events
GB2372671B (en) * 2001-02-27 2003-04-30 3Com Corp Processing network events to reduce the number of events to be displayed
US6734794B2 (en) * 2002-02-27 2004-05-11 Ag Communication Systems Corporation Alarm control algorithm for multi-sourced alarms
US6810337B1 (en) * 2002-03-07 2004-10-26 Bellsouth Intellectual Property Corporation Systems and methods for tracking the age of air pressure and flow alarm conditions within a pressurized cable network
US6639538B1 (en) 2002-05-14 2003-10-28 Sri International Real-time transient pulse monitoring system and method
US7053763B2 (en) * 2002-05-24 2006-05-30 Cingular Wireless Ii, Llc System and method for alarm monitoring
US7149917B2 (en) * 2002-07-30 2006-12-12 Cisco Technology, Inc. Method and apparatus for outage measurement
CN100450008C (zh) * 2002-10-22 2009-01-07 华为技术有限公司 通信网络告警的处理方法和相关性分析管理器
CN100397829C (zh) * 2002-12-27 2008-06-25 华为技术有限公司 一种频发性离散事件性故障的告警方法
CN1310568C (zh) * 2003-02-17 2007-04-11 中国移动通信集团公司 对移动终端用户身份进行安全认证的方法
US7131032B2 (en) * 2003-03-13 2006-10-31 Sun Microsystems, Inc. Method, system, and article of manufacture for fault determination
GB0306237D0 (en) * 2003-03-19 2003-04-23 Marconi Comm Optical Networks Notifications in a telecommunications network
US7278066B2 (en) * 2003-10-22 2007-10-02 Honeywell International Inc Automatic fieldbus device load-mode identification
ES2303909T3 (es) * 2003-12-19 2008-09-01 Telefonaktiebolaget Lm Ericsson (Publ) Gestion de energia adaptativa para un nodo de una red de telecomunicaciones moviles.
KR100666981B1 (ko) * 2004-08-09 2007-01-10 삼성전자주식회사 디지털 방송 시스템의 데이터 수신 상태 관리 방법 및 장치
US7788536B1 (en) 2004-12-21 2010-08-31 Zenprise, Inc. Automated detection of problems in software application deployments
US7599308B2 (en) * 2005-02-04 2009-10-06 Fluke Corporation Methods and apparatus for identifying chronic performance problems on data networks
US7242289B1 (en) * 2005-02-23 2007-07-10 Sprint Communications Company L.P. Method and system for synthetically reproducing a random process
US7383473B2 (en) * 2005-03-01 2008-06-03 Time Warner Cable, Inc. System and method for identifying and isolating faults in a video on demand provisioning system
JP4815141B2 (ja) * 2005-03-29 2011-11-16 富士通株式会社 回路異常動作検出システム
US7295950B2 (en) * 2005-06-23 2007-11-13 International Business Machines Corporation Monitoring multiple channels of data from real time process to detect recent abnormal behavior
CN1921417B (zh) * 2005-08-25 2010-10-06 华为技术有限公司 双向转发检测上报会话状态的方法
US7823029B2 (en) * 2005-09-07 2010-10-26 International Business Machines Corporation Failure recognition, notification, and prevention for learning and self-healing capabilities in a monitored system
WO2007045637A1 (en) * 2005-10-21 2007-04-26 Nokia Siemens Networks Gmbh & Co. Kg Method for reporting alarms of a network element
KR100656473B1 (ko) * 2005-11-09 2006-12-11 삼성전자주식회사 Lan 인터페이스를 구비한 교환망 시스템과 그시스템에서의 과부하 제어방법
CN1996898B (zh) * 2005-12-28 2010-04-14 中兴通讯股份有限公司 一种对数据通道状态进行实时检测的系统和方法
US7496796B2 (en) * 2006-01-23 2009-02-24 International Business Machines Corporation Apparatus, system, and method for predicting storage device failure
CN101385002B (zh) * 2006-02-16 2011-05-04 英国电讯有限公司 报警管理系统
CN100456697C (zh) * 2006-04-20 2009-01-28 华为技术有限公司 一种双向转发检测的自动配置方法及系统
CN101098349B (zh) * 2006-06-27 2010-05-12 中兴通讯股份有限公司 一种网络管理系统和网元管理系统之间的告警计数过滤方法
CN101132589B (zh) * 2006-08-24 2010-12-08 中兴通讯股份有限公司 一种振荡告警处理方法
CN101247254B (zh) * 2007-02-16 2010-11-03 大唐移动通信设备有限公司 一种抑止告警风暴的方法和装置
CN101309165B (zh) * 2007-05-14 2012-04-04 华为技术有限公司 信息报告的控制方法、装置和设备
GB2452025B (en) * 2007-07-26 2012-01-04 Motorola Solutions Inc An alarm event management apparatus and method of operation therefor
US20100027560A1 (en) * 2008-07-29 2010-02-04 At&T Intellectual Property I, L.P. System and method for service mitigation in a communication system
US8451907B2 (en) * 2008-09-02 2013-05-28 At&T Intellectual Property I, L.P. Methods and apparatus to detect transport faults in media presentation systems
WO2010071628A1 (en) * 2008-12-15 2010-06-24 Hewlett-Packard Development Company, L.P. Detecting an unreliable link in a computer system
US9373246B2 (en) * 2010-02-04 2016-06-21 Schneider Electric It Corporation Alarm consolidation system and method
CN102215141A (zh) * 2010-04-02 2011-10-12 华为技术有限公司 中断测量方法和系统及监控设备
US8627150B2 (en) 2011-01-19 2014-01-07 Oracle International Corporation System and method for using dependency in a dynamic model to relate performance problems in a complex middleware environment
US9600523B2 (en) * 2011-01-19 2017-03-21 Oracle International Corporation Efficient data collection mechanism in middleware runtime environment
US8600725B2 (en) 2011-01-19 2013-12-03 Oracle International Corporation System and method for providing a static model map of behaviors in a middleware system, for use in identifying system problems
US8892960B2 (en) 2011-01-19 2014-11-18 Oracle International Corporation System and method for determining causes of performance problems within middleware systems
US8631280B2 (en) 2011-01-19 2014-01-14 Oracle International Corporation Method of measuring and diagnosing misbehaviors of software components and resources
US10533761B2 (en) * 2011-12-14 2020-01-14 Ademco Inc. HVAC controller with fault sensitivity
CN102523137B (zh) * 2011-12-22 2014-10-08 华为技术服务有限公司 一种故障监测方法、装置及系统
JP5970987B2 (ja) * 2012-07-05 2016-08-17 富士通株式会社 故障検出装置、故障検出方法および故障検出プログラム
CN103812714A (zh) * 2012-11-07 2014-05-21 江苏仕德伟网络科技股份有限公司 一种排除网站临时故障的方法
JP6030456B2 (ja) * 2013-01-18 2016-11-24 Kddi株式会社 通信装置
JP6212947B2 (ja) * 2013-05-16 2017-10-18 富士通株式会社 情報処理装置、制御装置及び制御プログラム
CN103684865B (zh) * 2013-12-11 2017-02-08 北京先进数通信息技术股份公司 一种交换系统及一种信息交换方法
US11194690B2 (en) * 2014-05-19 2021-12-07 International Business Machines Corporation Tracking and factoring application near misses/timeouts into path selection and multipathing status
JP2015226273A (ja) * 2014-05-29 2015-12-14 富士通株式会社 監視装置、及び監視システム
US9692665B2 (en) 2014-07-30 2017-06-27 Microsoft Technology Licensing, Llc Failure analysis in cloud based service using synthetic measurements
CN105681064A (zh) * 2014-11-18 2016-06-15 中兴通讯股份有限公司 一种信息处理的方法及装置
CN105893109B (zh) * 2015-01-26 2019-05-31 奇点新源国际技术开发(北京)有限公司 车载终端操作系统的加载方法及装置
US9929970B1 (en) * 2015-12-03 2018-03-27 Innovium, Inc. Efficient resource tracking
US10218589B1 (en) 2015-12-17 2019-02-26 Innovium, Inc. Efficient resource status reporting apparatuses
CN105651327B (zh) * 2016-01-25 2018-01-02 西安应用光学研究所 一种适用于机载光电系统健康状态的监测方法
US10432429B1 (en) 2016-02-16 2019-10-01 Innovium, Inc. Efficient traffic management
CN106289370B (zh) * 2016-07-19 2018-11-23 珠海格力电器股份有限公司 一种故障检测装置和方法
US10210037B2 (en) 2016-08-25 2019-02-19 Uptake Technologies, Inc. Interface tool for asset fault analysis
US10771369B2 (en) * 2017-03-20 2020-09-08 International Business Machines Corporation Analyzing performance and capacity of a complex storage environment for predicting expected incident of resource exhaustion on a data path of interest by analyzing maximum values of resource usage over time
CN107453940A (zh) * 2017-06-19 2017-12-08 深圳市盛路物联通讯技术有限公司 一种基于接入节点的物联网终端设备检测方法及系统
GB2569105A (en) * 2017-11-29 2019-06-12 British Telecomm A method of operating a network node
US11140006B2 (en) 2017-11-29 2021-10-05 British Telecommunications Public Limited Company Method of operating a network node
CN109889353A (zh) * 2017-12-26 2019-06-14 广东电网有限责任公司电力调度控制中心 一种对电力通信检修工作引起的风险分析及控制方法
CA3205887A1 (en) * 2018-01-05 2019-07-11 Illumina, Inc. Predicting reagent chiller instability and flow cell heater failure in sequencing systems
US20190258730A1 (en) * 2018-02-22 2019-08-22 Beckman Coulter, Inc. Time slicing massive data processing
JP6816087B2 (ja) * 2018-11-02 2021-01-20 ファナック株式会社 ロボットのアラーム通知システム
US11069216B2 (en) * 2018-11-13 2021-07-20 Rockwell Automation Technologies, Inc. Performance characterization for a component of an automated industrial process
US11768000B2 (en) * 2020-03-24 2023-09-26 Johnson Controls Tyco IP Holdings LLP System and method to operate HVAC system during voltage variation event
CN112798951A (zh) * 2020-12-25 2021-05-14 上海法雷奥汽车电器系统有限公司 一种故障处理方法、装置、电子设备及存储介质
CN113086876B (zh) * 2021-04-06 2022-06-28 上海建工五建集团有限公司 一种多层卷筒钢丝绳传动方式的卷筒钢丝绳故障检测方法
CN113890815A (zh) * 2021-10-18 2022-01-04 中国电子科技集团公司第三十四研究所 网络设备端口频繁up/down监听告警方法及系统
CN114783162B (zh) * 2022-06-20 2022-10-28 商飞软件有限公司 一种飞机三余度系统告警表决方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4142238A (en) * 1973-03-08 1979-02-27 Robert W. Brandt Monitoring system
US4039768A (en) * 1976-05-26 1977-08-02 Maley James B O Pay telephone station monitor system
US4527271A (en) * 1982-08-17 1985-07-02 The Foxboro Company Process control system with improved fault isolation
US4543567A (en) * 1983-04-14 1985-09-24 Tokyo Shibaura Denki Kabushiki Kaisha Method for controlling output of alarm information
JPS6011657A (ja) * 1983-06-30 1985-01-21 Honda Motor Co Ltd 内燃エンジンの運転パラメ−タセンサの計測系異常検出装置
US4636967A (en) * 1983-10-24 1987-01-13 Honeywell Inc. Monitor circuit
DE3540806A1 (de) * 1985-11-16 1987-05-21 Opel Adam Ag Verfahren und vorrichtung zur fuellstandsmessung in wechselnden beschleunigungen unterworfenen behaeltern
US4996703A (en) * 1986-04-21 1991-02-26 Gray William F Remote supervisory monitoring and control apparatus connected to monitored equipment
GB2222351A (en) * 1988-06-14 1990-02-28 British Telecomm Monitoring apparatus
JPH04178102A (ja) * 1990-11-08 1992-06-25 Toshiba Corp 故障表示装置
US5271011A (en) * 1992-03-16 1993-12-14 Scientific-Atlanta, Inc. Digital audio data muting system and method
GB9303640D0 (en) * 1993-02-23 1993-04-07 British Telecomm Object-oriented correlation
US5390231A (en) * 1993-04-01 1995-02-14 Northern Telecom Limited Protection and recovery of telephone line interface circuits

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009237936A (ja) * 2008-03-27 2009-10-15 Toshiba Corp 情報収集装置、方法、及びプログラム
JP2013522741A (ja) * 2010-03-16 2013-06-13 インターナショナル・ビジネス・マシーンズ・コーポレーション 診断データを収集するためのマルチスレッド化コンピューティング環境における方法、装置、およびコンピュータ・プログラム
US9009537B2 (en) 2010-03-16 2015-04-14 International Business Machines Corporation Diagnostic data capture in a computing environment
WO2019159966A1 (ja) * 2018-02-15 2019-08-22 日本電信電話株式会社 監視装置および監視方法

Also Published As

Publication number Publication date
NO972884D0 (no) 1997-06-20
WO1996020548A1 (en) 1996-07-04
NO972884L (no) 1997-06-20
KR980700754A (ko) 1998-03-30
WO1996020549A1 (en) 1996-07-04
EP0799540B1 (en) 2001-09-12
AU4309796A (en) 1996-07-19
CN1171181A (zh) 1998-01-21
AU688652B2 (en) 1998-03-12
NZ297844A (en) 1997-10-24
MX9704329A (es) 1997-09-30
JPH10511524A (ja) 1998-11-04
US6018300A (en) 2000-01-25
NO972885D0 (no) 1997-06-20
MX9704636A (es) 1997-09-30
FI972599A0 (fi) 1997-06-18
NO972885L (no) 1997-06-20
FI972600A (fi) 1997-06-18
NZ297845A (en) 1997-10-24
EP0799541A1 (en) 1997-10-08
DE69522712D1 (de) 2001-10-18
AU690403B2 (en) 1998-04-23
US5923247A (en) 1999-07-13
FI972599A (fi) 1997-06-18
DE69522712T2 (de) 2002-07-04
HK1004624A1 (en) 1998-11-27
AU4309896A (en) 1996-07-19
CN1171180A (zh) 1998-01-21
FI972600A0 (fi) 1997-06-18
EP0799540A1 (en) 1997-10-08

Similar Documents

Publication Publication Date Title
JPH10512109A (ja) 故障監視
US6182022B1 (en) Automated adaptive baselining and thresholding method and system
KR101045424B1 (ko) 실시간 서비스 저하에 기초한 네트워크 장애의 우선순위 동적 부여 방법 및 장치
US5974457A (en) Intelligent realtime monitoring of data traffic
EP0661847A2 (en) Automated benchmarking with self customization
CN111078453B (zh) 微服务自动熔断和恢复方法、装置、计算机设备及存储介质
CN103392176A (zh) 网络事件管理
WO2023083079A1 (zh) 第三方系统监控系统、方法、装置、设备及存储介质
CN107968727A (zh) 一种cifs服务的检测方法、装置及介质
JPH10304060A (ja) トラヒック測定装置およびトラヒック測定方法
CN113010367A (zh) 针对java进程垃圾回收的监控方法及监控系统
US7367055B2 (en) Communication systems automated security detection based on protocol cause codes
JPH08316958A (ja) ネットワーク管理装置及びその方法
CA2205603C (en) Fault monitoring
AU690403C (en) Fault monitoring
CA2205421C (en) Fault monitoring
CA2312469A1 (en) Method and apparatus for implementing counters in a system with limited primary memory
JP2001265623A (ja) 監視装置
US8031847B2 (en) Traffic evaluation system
MXPA97004636A (en) Ave inspection
MXPA97004329A (en) Ave inspection
KR20110001674A (ko) 트래픽 이상 상태 판별 방법
JP2002027132A (ja) 異常通信検知方法及び装置並びに記憶媒体
JPH07141227A (ja) 障害情報の保全方式
CN114118705A (zh) 一种设备告警的方法和装置