JPH08228211A - 故障検出装置 - Google Patents

故障検出装置

Info

Publication number
JPH08228211A
JPH08228211A JP7033295A JP3329595A JPH08228211A JP H08228211 A JPH08228211 A JP H08228211A JP 7033295 A JP7033295 A JP 7033295A JP 3329595 A JP3329595 A JP 3329595A JP H08228211 A JPH08228211 A JP H08228211A
Authority
JP
Japan
Prior art keywords
module
failure
alarm
node
statistical analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7033295A
Other languages
English (en)
Other versions
JP3277442B2 (ja
Inventor
Yasuyuki Tanaka
康之 田中
Ryoichi Aoyama
良一 青山
Yasufumi Satake
康文 佐竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP03329595A priority Critical patent/JP3277442B2/ja
Publication of JPH08228211A publication Critical patent/JPH08228211A/ja
Application granted granted Critical
Publication of JP3277442B2 publication Critical patent/JP3277442B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

(57)【要約】 【目的】 故障検出処理および故障箇所特定処理の軽減
を図ること。 【構成】 優先的に処理すべきアラーム種別を抽出する
アラーム収集検出手段と、抽出したアラーム種別から通
知された故障が故障の影響範囲がモジュール内に閉じる
か複数モジュールに影響を与えるかを判定するモジュー
ル内/外判定手段と、故障発生箇所を特定する故障箇所
特定手段を有し、アラーム収集検出手段で抽出したアラ
ーム種別からモジュール内/外判定手段を利用してモジ
ュール内故障/モジュール外故障を検出し、モジュール
内故障についてはモジュール内における故障発生箇所を
特定するモジュールレベル統計分析手段と、モジュール
外故障についてはモジュール間故障/モジュール共通故
障の検出と故障発生箇所の特定を行うノードレベル統計
分析手段とから構成される二階層アラーム分析手段を有
する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数のモジュールで構
成されるサービス制御ノードの故障検出を実施するため
に利用する故障検出装置に関し、特に二階層アラーム分
析手段を用いることにより故障検出処理および故障箇所
特定処理の軽減を図った故障検出装置に関する。
【0002】
【従来の技術】近年、通信網設備において、経済性・拡
張性の観点から、サービス制御ノードを複数のモジュー
ル110から構成して機能分散,負荷分散を図ることが
行われている。このような分散システムにおいては、複
数のモジュールから発生するアラームを検出,分析して
故障箇所を推定する必要がある。複数のモジュールの故
障のうち、各モジュールに閉じた故障は当該モジュール
から発生するアラームにより直ちに故障箇所が判明する
が、モジュール間に跨った故障は複数のモジュールから
のアラームを分析する必要がある。この場合における簡
単な分析方法として故障箇所とアラームの対応表を作成
し、アラームの発生を故障箇所判定要素の出現と考え、
故障発生時には出現した判定要素の組み合わせから対応
表を逆に検索し、故障箇所を推定する方法があり、この
分析方法は故障箇所が同時複数に及んだ場合においても
有効である。このような技術として、例えば、青山他
「アラームによる故障推定の一考察」1993年春季信学全
大会B-586で発表されたものがある。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の技術では、故障推定対象装置を広げるに伴ってアラ
ーム数,アラームの組み合わせ,閾値等のパラメータが
膨大になって分析処理が複雑化してしまい、単純に故障
検出および故障箇所を特定することが困難になるという
問題があった。本発明の目的は、上述したごとき故障推
定対象装置を拡大した場合に生じるアラーム分析処理の
複雑化を解決し、故障検出処理および故障箇所特定処理
の軽減を図ることにある。
【0004】
【課題を解決するための手段】本発明は、CCITT Rec.X7
30:ISO/IEC10164-1「警報報告管理機能」で定義されて
いるように、故障発生に関する警報種別を定義する「イ
ベントタイプ」と、故障原因を定義する「想定原因デー
タ(Probable cause data)」と、故障状況を定義する
「特定問題データ(Specific problems data)」と、
システム構成を階層的に定義する「故障検出部データ」
とからなるアラームを通知する分散処理系システムの故
障検出方式において、前記「イベントタイプ」と「想定
原因データ」と「特定問題データ」の組み合わせで定義
するアラーム種別に対して、アラーム種別毎の通知数と
アラーム種別毎に予め設定しておいた重み係数の積から
優先的に処理すべきアラーム種別を抽出するアラーム収
集検出手段(660)と、前記アラーム収集検出手段で
抽出したアラーム種別の「イベントタイプ」と「想定原
因データ」から当該アラームで通知された故障に対し
て、故障の影響範囲がモジュール内に閉じるか複数モジ
ュールに影響を与えるかをデータ内容から予め設定した
分析テーブルを用いて判定するモジュール内/外判定手
段(640)と、アラームの「故障検出部データ」から
システム構成要素単位にアラーム通知数とシステム構成
を考慮し、システム構成要素毎に予め設定した重み係数
の積から故障発生箇所を特定する故障箇所特定手段(6
50)とを有し、前記アラーム収集検出手段で抽出した
アラーム種別からモジュール内/外判定手段(640)
を利用してモジュール内故障/モジュール外故障を検出
し、モジュール内故障については、故障箇所特定手段を
モジュール内に適用し、モジュール内における故障発生
箇所を特定するモジュールレベル統計分析手段(60
0)と、モジュール外故障については、故障箇所特定手
段をモジュール間での構成要素に適用し、モジュール間
故障/モジュール共通故障の検出と故障発生箇所の特定
を行うノードレベル統計分析手段(700)とから構成
される二階層アラーム分析手段を有する。
【0005】
【作用】アラーム収集検出手段(660)は、重みづけ
評価により優先的に処理すべきアラームを抽出している
ことからアラーム数やアラーム組み合わせ数を最適化す
ることができるため、アラーム処理量の減少を図ること
ができる。モジュール内/外判定手段(640)は、故
障箇所がモジュール内かモジュール外かを分析すること
で故障箇所特定に必要なアラーム分析範囲の絞り込みを
行っているため、アラーム分析処理の分散化を実現する
ことができる。故障箇所特定手段(650)は、絞り込
まれたアラームから絞り込まれた分析範囲の中で故障箇
所を特定するため、アラーム分析処理の有効化を実現す
ることができる。従って、アラーム収集検出手段(66
0)とモジュール内/外判定手段(640)と故障箇所
判定手段(650))とを有するモジュールレベル統計
分析手段(600)と、故障箇所特定手段を有するノー
ドレベル統計分析手段(700)とからなる二階層アラ
ーム分析手段により、アラーム数やアラーム組み合わせ
数の最適化やアラーム分析処理の分散化、有効化が可能
となり、本発明の目的である故障検出処理および故障箇
所特定処理の軽減を実現することができる。
【0006】
【実施例】本発明の実施例を図面に基づいて詳細に説明
する。図1は、本発明の一実施例に関わる故障検出装置
とサービス制御ノードの接続構成図である。同図におい
て、サービス制御ノード100は、経済性・拡張性の点
から機能分散・負荷分散により複数のモジュール110
から構成され、情報転送網200(この情報転送網20
0は、特に設けず直結してもよく、またローカルな情報
転送網であってもよい。以下同じ)を通じて、故障検出
装置500に接続される。故障検出装置500は本発明
の対象であり、モジュール110から通知されたアラー
ムの検出、アラームによる故障影響範囲の推定、モジュ
ールに閉じた故障箇所の特定を実施し、サービス制御ノ
ード100を構成するモジュール110毎に配備される
モジュールレベル統計分析手段600と、該モジュール
レベル統計分析手段600を統括し、モジュール間故障
/モジュール共通故障を検出し、故障箇所を特定するノ
ードレベル統計分析手段700と、保守端末からの検出
閾値設定指示の受信や保守端末への故障検出情報の送信
等を実行する保守端末通信制御手段800とから構成さ
れる。保守端末400は、保守者との接点になるもので
あり、情報転送網300を介して、故障検出装置500
に接続され、故障検出装置500で検出した故障情報の
表示、および故障検出のための各種検出閾値や各種デー
タの設定を故障検出装置500に対して実施するもので
ある。
【0007】次に、本発明の対象である故障検出装置5
00を構成しているモジュールレベル統計分析手段60
0,ノードレベル統計分析手段700,保守端末通信制
御手段800の詳細を順次説明する。図2は、モジュー
ルレベル統計分析手段600の内部の構成を示すブロッ
ク図である。モジュールレベル統計分析手段600は、
同図に示すように、サービス制御ノード100内モジュ
ール110において発生した非即時通知アラームの多発
を検出し、モジュール110内に蓄積された非即時通知
アラームを収集し、収集したアラームから「イベントタ
イプ」と「想定原因データ」と「特定問題データ」の組
み合わせで定義するアラーム種別に対して、アラーム種
別毎に通知数をカウントし、予め設定した検出閾値に対
して通知数が超過したアラーム種別を抽出するアラーム
収集検出手段660と、抽出したアラーム種別の「イベ
ントタイプ」と「想定原因データ」から故障の影響範囲
がモジュールに閉じるか複数モジュールに影響を与える
かを予め設定した分析テーブルを用いて判定し、判定の
結果、モジュール外故障検出時にはノードレベル統計分
析手段700に通知し、モジュール内故障検出時には故
障箇所特定手段650に通知するモジュール内/外判定
手段640と、アラームの「故障検出部データ」からモ
ジュール内のシステム構成要素毎にアラームの通知数を
カウントし、モジュール内のシステム構成要素毎に予め
設定した検出閾値に対して通知数が超過したシステム構
成要素を組み合わせることで故障発生箇所を特定する故
障箇所特定手段650とから構成される。
【0008】さらに、アラーム収集検出手段660は、
非即時通知アラームの多発を検出するアラーム検出手段
610と、アラーム検出手段610からの通知を契機と
してモジュール毎に蓄積されているアラームをサービス
制御ノード100内モジュール110から収集するアラ
ーム収集手段620と、収集したアラームに対してアラ
ーム種別毎に通知数をカウントし、検出閾値に対して通
知数が超過したアラーム種別を抽出するアラーム蓄積手
段630とから構成される。
【0009】図3は、ノードレベル統計分析手段700
の内部の構成を示すブロック図である。ノードレベル統
計分析手段700は、同図に示すように、モジュールレ
ベル統計分析手段600からのモジュール外故障検出通
知を受信し、モジュールレベル統計分析手段600に蓄
積されているモジュール外故障を通知するアラーム(以
下、ノードアラームという)を収集・蓄積するノードア
ラーム収集検出手段760と、ノードアラームの「故障
検出部データ」からモジュール間のシステム構成要素毎
にアラームの通知数をカウントし、モジュール間のシス
テム構成要素毎に予め設定した検出閾値に対して通知数
が超過したシステム構成要素を組み合わせることで故障
発生箇所(モジュール間故障発生/モジュール共通故障
発生)を判定し、故障発生情報を保守端末400に通知
するノード故障箇所特定手段730と、保守端末400
から設定された各種検出閾値や各種データを保守端末通
信制御手段800を介して受信し、モジュールレベル統
計分析手段600やノード故障箇所特定手段730に各
種検出閾値を設定する故障検出閾値設定手段740から
構成される。
【0010】さらに、ノードアラーム収集検出手段76
0は、モジュールレベル統計分析手段600からのモジ
ュール外故障検出通知を受信するノードアラーム検出手
段710と、該ノードアラーム検出手段710からの通
知を契機として、モジュール外故障を検出したモジュー
ルレベル統計分析手段600に対してモジュールレベル
統計分析手段600内モジュール内/外判定手段640
に蓄積されているノードアラームを収集・蓄積するノー
ドアラーム収集手段720とから構成される。
【0011】図4は、モジュールレベル統計分析手段6
00内アラーム収集検出手段660におけるアラーム収
集手段620のアラーム管理方法を示すブロック図であ
る。サービス制御ノード100から通知されるアラーム
は、サービスに対する故障の影響度を示す重要度611
と、アラームの警報種別(情報伝達手順や処理に関連す
る通信警報/サービス品質の劣化に関連するサービス品
質警報/装置故障に関連する装置警報/ソフトウエアや
処理故障に関連する処理エラー警報等)を示すイベント
タイプ612と、想定される故障原因(装置故障/モジ
ュール間通信故障/システム故障等)を示す想定原因デ
ータ613と、故障の症状(通信エラー/処理続行不可
能等)を示す特定問題データ614と、サービス制御ノ
ード100内モジュール110の装置構成・機能構成を
階層的に示し、故障検出部位の特定を可能とする故障検
出部データ615から構成される。アラーム収集手段6
20内アラーム管理テーブル618は、サービス制御ノ
ード100内モジュール110から通知されたアラーム
の上述した情報項目を格納項目616とし、アラーム収
集手段620から収集したアラームを格納項目616に
従って、アラームレコード617に格納する。
【0012】図5は、モジュールレベル統計分析手段6
00内アラーム収集検出手段660におけるアラーム蓄
積手段630のアラーム統計分析方法を示すブロック図
である。アラーム蓄積手段630は、アラーム収集手段
620内アラーム管理テーブル618に格納されている
アラームに対して、イベントタイプ612と想定原因デ
ータ613と特定問題データ614の組み合わせから定
義されるアラーム種別毎に通知数621をカウントし、
統一的に設定されている固定検出閾値をアラーム種別毎
に保守端末400から設定した重み係数で除し、予め設
定しておく検出閾値622に対して通知数621が超過
したアラーム種別を検出し、モジュール内/外判定手段
640に通知する。ここで、検出閾値超過アラーム種別
が複数存在する場合には、アラーム種別毎に定義される
重要度611と重み係数の積から算出される(優先順位
の高い)アラーム種別から順次処理を実施する。アラー
ム統計分析テーブル625は、重要度611、イベント
タイプ612、想定原因データ613、特定問題データ
614、通知数621、検出閾値622を格納項目62
3とし、アラーム統計レコード624に統計結果を格納
する。
【0013】図6は、ノード故障箇所特定手段730に
おけるノードアラームの統計分析方法を示すブロック図
である。サービス制御ノード100を構成する全モジュ
ール110は、サービス種別毎にサービス制御を実行す
るサービスプログラムと加入者情報を共通的に所持す
る。このことからノード故障箇所特定手段730は、収
集したノードアラームの故障検出部データ615からア
ラーム通知モジュールの特定/非特定を判定するモジュ
ール番号統計分析テーブル770と、アラーム通知サー
ビスの特定/非特定を判定するサービス種別統計分析テ
ーブル780と、アラーム通知加入者の特定/非特定を
判定する加入者番号統計分析テーブル790から構成す
る。
【0014】さらに、モジュール番号統計分析テーブル
770は、アラーム通知を行ったモジュール番号を格納
するモジュール番号771と、モジュール番号771毎
にアラームの通知数を格納する通知数773と、故障検
出閾値設定手段740によって設定された検出閾値を格
納する検出閾値772を格納項目774とし、モジュー
ル番号統計レコード775に格納する。モジュール番号
統計分析テーブル770では、検出閾値772に対し
て、通知数773を超過したモジュール番号統計レコー
ド775の有無を判定し、モジュール番号統計レコード
775が複数存在する場合には、モジュール共通故障と
判定し、モジュール番号統計レコード775が唯一存在
する場合には、特定モジュール内の故障発生と判定す
る。
【0015】サービス種別統計分析テーブル780は、
アラーム通知時に起動したサービス種別を格納するサー
ビス種別781と、サービス種別781毎にアラームの
通知数を格納する通知数783と、故障検出閾値設定手
段740によって設定された検出閾値を格納する検出閾
値782を格納項目784とし、サービス種別統計レコ
ード785に格納する。サービス種別統計分析テーブル
780では、検出閾値782に対して、通知数783を
超過したサービス種別統計レコード785の有無を判定
し、サービス種別統計レコード785が複数存在する場
合には、サービスに関連した故障の発生はないと判断
し、サービス種別統計レコード785が唯一存在する場
合には、特定サービスの故障発生と判定する。
【0016】加入者番号統計分析テーブル790は、ア
ラーム通知時に起動した加入者番号を格納する加入者番
号791と、加入者番号791毎にアラームの通知数を
格納する通知数793と、故障検出閾値設定手段740
によって設定された検出閾値を格納する検出閾値792
を格納項目794とし、加入者番号統計レコード795
に格納する。加入者番号統計分析テーブル790では、
検出閾値792に対して、通知数793を超過した加入
者番号統計レコード795の有無を判定し、加入者番号
統計レコード795が複数存在する場合には、加入者に
関連した故障の発生はないと判断し、加入者番号統計レ
コード795が唯一存在する場合には、特定加入者の故
障発生と判断する。
【0017】ノード故障箇所特定手段730では、上述
した3つの統計分析テーブル770,780,790の
分析結果の組み合わせから故障箇所を以下の8種類に分
類する。 (1)特定モジュール/特定サービス/特定加入者 (2)特定モジュール/特定サービス (3)特定モジュール/特定加入者 (4)特定モジュール (5)モジュール共通/特定サービス/特定加入者 (6)モジュール共通/特定サービス (7)モジュール共通/特定加入者 (8)モジュール共通
【0018】図7は、故障検出閾値設定手段740にお
ける各種検出閾値設定/管理方法を示すブロック図であ
る。故障検出閾値設定手段740は、アラーム検出閾値
管理テーブル810と、モジュール番号検出閾値管理テ
ーブル820と、サービス番号検出閾値管理テーブル8
30と、加入者番号検出閾値管理テーブル840とから
構成される。アラーム検出閾値管理テーブル810は、
アラーム種別811と、アラーム種別811毎に保守端
末400から設定された重み係数812と、全アラーム
種別で共通的に設定されている固定検出域値813と、
固定検出閾値813を重み係数812で除し、モジュー
ルレベル統計分析手段600内モジュール内/外判定手
段640に対して予め設定したアラーム検出閾値814
を格納項目815とし、アラーム検出閾値レコード81
6に管理する。ここで、重み係数812は、保守端末4
00から設定される。
【0019】モジュール番号検出閾値管理テーブル82
0は、保守端末400によって異常発生呼の上限値が設
定される異常発生呼数821と、保守端末400によっ
てモジュール番号検出閾値を調整するために設定される
検出調整値822と、保守端末400によってサービス
制御ノードのモジュール配備数が設定されるモジュール
数823と、モジュールレベル統計分析手段600内モ
ジュール内/外判定手段640に対してノードレベル故
障の発生を通知するアラーム種別の検出閾値を格納する
ノードアラーム検出閾値824と、ノード故障箇所特定
手段730内モジュール番号統計分析テーブル770に
対して設定するモジュール番号検出閾値825とを格納
項目826とし、モジュール番号検出閾値レコード82
7に管理する。
【0020】ここで、負荷分散により呼処理がサービス
制御ノード内の配備モジュールに均等に振り分けられた
場合、ノードアラーム検出閾値824は、保守端末40
0によって異常発生呼の上限値が設定される異常発生呼
数に対するサービス制御ノード内総モジュール数の比率
から算出される。また、モジュール番号検出閾値825
は、ノードアラーム検出閾値824と同値とすることが
考えられるが、同値とした場合、モジュールレベル統計
分析手段600のノードレベル故障検出通知の通知モジ
ュールのみが閾値超過モジュールとなるため、ノードア
ラームを潜在的に通知するモジュール番号の検出が行え
ない問題があるため、モジュール番号検出閾値は、(ノ
ードレベルアラーム検出閾値)−(検出調整値)として
算出する。ノードアラーム検出閾値824およびモジュ
ール番号検出閾値825の算出式を以下に示す。 (1)ノードアラーム検出閾値=異常発生呼数/サービ
ス制御ノード内総モジュール数ここで、(異常発生呼数
/サービス制御ノード内総モジュール数)は小数点以下
切り下げる。 (2)モジュール番号検出閾値=ノードレベルアラーム
検出閾値−検出調整値ここで、(ノードレベルアラーム
検出閾値−検出調整値)が負となる場合は、0とする。
【0021】サービス番号検出閾値管理テーブル830
は、ノード故障箇所特定手段730内サービス種別統計
分析テーブル780に対して設定するサービス番号検出
閾値831を格納項目832とし、サービス番号検出閾
値レコード833に管理する。ここで、サービス番号検
出閾値831は、保守端末400から設定される。加入
者番号検出閾値管理テーブル840は、ノード故障箇所
特定手段730内加入者番号統計分析テーブル790に
対して設定される加入者番号検出閾値841を格納項目
842とし、加入者番号検出閾値レコード843に管理
する。ここで、カスタマ番号検出閾値841は、保守端
末400から設定される。
【0022】次に、上述した各手段を有する本発明の故
障検出装置における処理手順を図面を用いて詳細に説明
する。図8は、モジュールレベル統計分析手段600に
おけるモジュール内故障検出手順を示した図である。サ
ービス制御ノード100は、経済性・拡張性の点から機
能分散・負荷分散によりモジュールA110、モジュー
ルB111から構成される。モジュールA110は、呼
処理実行中に異常発生(イ)を検出するとアラーム
(ロ)を送出する。しかし、アラーム(ロ)には、一過
性で重要度が低く、複数のアラームの相関関係を分析し
ない限りリアクションが決定できないものがあるため、
モジュールB111では、上記のようなアラームに対し
て通知件数をカウントし、故障検出装置500から予め
設定した閾値を超過した場合(ハ)にアラーム多発通知
(ニ)を故障検出装置500に送出する。ここで、モジ
ュールA110から通知したアラーム(ロ)は、モジュ
ールB111内に蓄積される。モジュールB111から
のアラーム多発通知(二)は、モジュールB111に対
応したモジュールレベル統計分析手段600で受信す
る。アラーム多発通知を受信したモジュールレベル統計
分析手段600では、故障発生箇所の特定や故障発生箇
所に対する措置を実施するために、モジュールB111
に蓄積されているアラームを収集する(ホ、ヘ、ト、
チ)。アラームを収集したモジュールレベル統計分析手
段600では、収集したアラームを統計分析し(リ)、
モジュール内/外故障の判定を行い(ヌ)、モジュール
内故障が発生している場合には、保守端末400に対し
てモジュール内故障検出通知(ル)を送信する。
【0023】図9は、ノードレベル統計分析手段700
におけるモジュール外故障検出手順を示した図である。
アラームの統計分析結果からモジュール外故障の発生を
検出した場合、モジュールレベル統計分析手段600
は、ノードレベル統計分析手段700に対してモジュー
ル外故障検出通知(ワ)を送信する。モジュール外故障
検出通知を受信したモジュールレベル統計分析手段70
0は、モジュールレベル統計分析手段600でモジュー
ル外故障を通知するアラーム(以下、ノードアラーム)
を収集するために(カ、ヨ)、モジュールレベル統計分
析手段600に対して「イベントタイプ」と「想定原因
データ」と「特定問題データ」の組み合わせで定義する
アラーム種別を入力情報としたノードレベルアラーム収
集指示(タ)を送信し、モジュールレベル統計分析手段
600からノードアラームを収集する(レ)。ノードア
ラームを収集したノードレベル統計分析手段700で
は、アラームの「故障検出部データ」を利用した統計分
析により(ソ)、モジュール間/モジュール共通故障を
検出し、保守端末400に対してモジュール間/モジュ
ール共通故障検出通知(ツ)を送信する。
【0024】図10は、ノードレベル統計分析手段70
0内故障検出閾値設定手段740における各種検出閾値
設定手順を示した図である。故障検出閾値設定手段74
0は、モジュールレベル統計分析手段600内モジュー
ル内/外判定手段640に対してアラーム検出閾値を設
定する機能と、ノードレベル統計分析手段700内ノー
ド故障箇所特定手段730に対してモジュール外故障検
出閾値を設定する機能を所持する。まず、アラーム検出
閾値の設定方法を以下に説明する。保守者は、アラーム
と故障の相関関係やアラームの重要性を考慮して保守端
末400から故障検出閾値設定手段740に対してアラ
ーム種別毎の重み係数を設定する。故障検出閾値設定手
段740では、設定された重み係数からアラーム検出閾
値を算出し(ナ)、モジュール内/外判定手段640に
対してアラーム検出閾値を設定する(ラ、ム)。モジュ
ール内/外判定手段640はアラーム検出閾値を設定す
ると、アラーム検出閾値設定通知を故障検出閾値設定手
段740を介して保守端末400に通知する(ウ、
ノ)。
【0025】次に、モジュール外故障検出閾値の設定方
法を以下に説明する。保守者は、サービス制御ノード1
00を構成するモジュール110が負荷分散的に呼処理
を実行することを念頭におき、モジュール配備数と、呼
処理実行中に発生した異常発生呼の上限値と、モジュー
ル間/共通故障を検出するための検出調整値とを保守端
末400から設定する。故障検出閾値設定手段740で
は、保守端末400から設定されたモジュール配備数、
異常発生呼の上限値、検出調整値を利用してモジュール
番号検出閾値、ノードアラーム検出閾値を算出し
(ク)、ノード故障箇所特定手段730に設定する
(ヤ、マ)。ノード故障箇所特定手段730は、モジュ
ール外故障検出閾値設定通知を故障検出閾値設定手段7
40を介して保守端末400に通知する(ケ、フ)。
【0026】
【発明の効果】上述したように、本発明によれば、アラ
ームの通知項目を有効に利用することで、故障分析能力
を維持しつつ、アラーム数やアラーム組み合わせ数の最
適化を行い、アラーム分析処理の分散化や有効化を実現
することができるため、オンラインによる最適なアラー
ム処理の実現性や保守性の改善、経済性の向上を実現す
る効果がある。
【図面の簡単な説明】
【図1】故障検出装置とサービス制御ノードの接続構成
図である。
【図2】モジュールレベル統計分析手段が所持する機能
構成を示すブロック図である。
【図3】ノードレベル統計分析手段が所持する機能構成
を示すブロック図である。
【図4】モジュールレベル統計分析手段内アラーム収集
検出手段におけるアラーム収集手段のアラーム管理方法
を示すブロック図である。
【図5】モジュールレベル統計分析手段内アラーム収集
検出手段におけるアラーム蓄積手段のアラーム統計分析
方法を示すブロック図である。
【図6】ノード故障箇所特定手段におけるノードアラー
ムの統計分析方法を示すブロック図である。
【図7】故障検出閾値設定手段における各種検出閾値設
定/管理方法を示すブロック図である。
【図8】モジュールレベル統計分析手段600における
モジュール内故障検出手順を示す図である。
【図9】ノードレベル統計分析手段700におけるモジ
ュール外故障検出手順を示す図である。
【図10】ノードレベル統計分析手段700内故障検出
閾値設定手段740における各種検出閾値設定手順を示
す図である。
【符号の説明】
100:サービス制御ノード、110:モジュール、2
00,300:情報転送網、400:保守端末、50
0:故障検出装置、600:モジュールレベル統計分析
手段、610:アラーム検出手段、620:アラーム収
集手段、630:アラーム蓄積手段、640:モジュー
ル内/外判定手段、650:故障箇所特定手段、66
0:アラーム収集検出手段、700:ノードレベル統計
分析手段、710:ノードアラーム検出手段、720:
ノードアラーム収集手段、730:ノード故障箇所特定
手段、740:故障検出閾値設定手段、760:ノード
アラーム収集検出手段、800:保守端末通信制御手段

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 複数のモジュールから構成される制御ノ
    ードの故障を検出するための故障検出装置において、 各モジュールからのアラームに基づいてモジュール内故
    障/モジュール外故障を検出し、モジュール内故障につ
    いてモジュール内における故障発生箇所を特定するモジ
    ュールレベル統計分析手段と、モジュール外故障につい
    てモジュール間故障/モジュール共通故障の検出と故障
    発生箇所の特定を行うノードレベル統計分析手段とから
    構成される二階層アラーム分析手段を有することを特徴
    とする故障検出装置。
  2. 【請求項2】 前記モジュールレベル統計分析手段は、
    各モジュールからのアラームに対して、アラーム種別毎
    の通知数とアラーム種別毎に予め設定しておいた重み係
    数の積から優先的に処理すべきアラーム種別を抽出する
    アラーム収集検出手段と、前記アラーム収集検出手段で
    抽出したアラーム種別から当該アラームで通知された故
    障に対して、故障の影響範囲がモジュール内に閉じるか
    複数モジュールに影響を与えるかを判定するモジュール
    内/外判定手段と、システム構成要素単位にアラーム通
    知数とシステム構成を考慮し、システム構成要素毎に予
    め設定した重み係数の積から故障発生箇所を特定する故
    障箇所特定手段とからなることを特徴とする請求項1記
    載の故障検出装置。
  3. 【請求項3】 前記ノードレベル統計分析手段は、前記
    モジュールレベル統計分析手段からのモジュール外故障
    検出通知を受け、当該モジュールレベル統計分析手段の
    ノードアラーム情報を収集するノードアラーム収集検出
    手段と、故障検出閾値を設定する故障検出閾値設定手段
    と、該ノードアラーム収集検出手段と故障検出閾値設定
    手段からの情報に基づいてノード故障箇所を特定するノ
    ード故障箇所特定手段からなることを特徴とする請求項
    1または2記載の故障検出装置。
JP03329595A 1995-02-22 1995-02-22 故障検出装置 Expired - Fee Related JP3277442B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03329595A JP3277442B2 (ja) 1995-02-22 1995-02-22 故障検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03329595A JP3277442B2 (ja) 1995-02-22 1995-02-22 故障検出装置

Publications (2)

Publication Number Publication Date
JPH08228211A true JPH08228211A (ja) 1996-09-03
JP3277442B2 JP3277442B2 (ja) 2002-04-22

Family

ID=12382559

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03329595A Expired - Fee Related JP3277442B2 (ja) 1995-02-22 1995-02-22 故障検出装置

Country Status (1)

Country Link
JP (1) JP3277442B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7085674B2 (en) * 2002-11-29 2006-08-01 Nissin Ion Equipment Co., Ltd. Alarm management method and apparatus therefor
CN100407657C (zh) * 2005-12-23 2008-07-30 华为技术有限公司 一种单板告警查询方法及装置
US8099489B2 (en) 2003-10-17 2012-01-17 Nec Corporation Network monitoring method and system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7085674B2 (en) * 2002-11-29 2006-08-01 Nissin Ion Equipment Co., Ltd. Alarm management method and apparatus therefor
US8099489B2 (en) 2003-10-17 2012-01-17 Nec Corporation Network monitoring method and system
CN100407657C (zh) * 2005-12-23 2008-07-30 华为技术有限公司 一种单板告警查询方法及装置

Also Published As

Publication number Publication date
JP3277442B2 (ja) 2002-04-22

Similar Documents

Publication Publication Date Title
US5872911A (en) Method and system of service impact analysis in a communications network
US8755499B2 (en) Methods, computer program products, and systems for managing voice over internet protocol (VOIP) network elements
WO1997024839A9 (en) Fault impact analysis
CN109660380A (zh) 服务器运行状态的监控方法、平台、系统及可读存储介质
US20100052924A1 (en) Method and System for Detecting and Managing a Fault Alarm Storm
KR20080102394A (ko) 실시간 서비스 저하에 기초한 네트워크 장애의 우선순위 동적 부여 방법 및 장치
JPH07183948A (ja) 通信システムで生じる事象を予測する規則を生成するデータの処理方法
JP2021022759A (ja) ネットワーク分析プログラム、ネットワーク分析装置及びネットワーク分析方法
CN107426051B (zh) 分布式集群系统中节点的工作状态的监测方法、装置及系统
CN107509119A (zh) 一种监控报警方法与装置
CN108390793A (zh) 一种分析系统稳定性的方法及装置
US20150271045A1 (en) Method, apparatus and system for detecting network element load imbalance
JP3277442B2 (ja) 故障検出装置
GB2452025A (en) Alarm event management for a network with alarm event storm detection and management mode
CN113391611B (zh) 动力环境监控系统的预警方法、装置及系统
JP4342795B2 (ja) 監視制御装置
CN111049703A (zh) 网络设备检测方法及系统
US5509063A (en) Method of controlling a telecommunications network using call gapping
JPH09307550A (ja) ネットワークシステム監視装置
CN115470061A (zh) 一种分布式存储系统i/o亚健康智能检测和恢复方法
US20070248008A1 (en) Management support method, management support system, management support apparatus and recording medium
JP2001014188A (ja) 監視システム
JPH0955738A (ja) 故障分析装置
JP7303461B2 (ja) 復旧判定装置、復旧判定方法、および、復旧判定プログラム
JPH04252533A (ja) 障害通知方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090215

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090215

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100215

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110215

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees