JP5504200B2 - 警報集約装置及び警報集約方法 - Google Patents

警報集約装置及び警報集約方法 Download PDF

Info

Publication number
JP5504200B2
JP5504200B2 JP2011078477A JP2011078477A JP5504200B2 JP 5504200 B2 JP5504200 B2 JP 5504200B2 JP 2011078477 A JP2011078477 A JP 2011078477A JP 2011078477 A JP2011078477 A JP 2011078477A JP 5504200 B2 JP5504200 B2 JP 5504200B2
Authority
JP
Japan
Prior art keywords
alarm
alarms
cause
failure
relevant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011078477A
Other languages
English (en)
Other versions
JP2012213112A (ja
Inventor
英樹 高部
裕 鍋島
博哉 井田
修 下柿元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone East Corp
Original Assignee
Nippon Telegraph and Telephone East Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone East Corp filed Critical Nippon Telegraph and Telephone East Corp
Priority to JP2011078477A priority Critical patent/JP5504200B2/ja
Publication of JP2012213112A publication Critical patent/JP2012213112A/ja
Application granted granted Critical
Publication of JP5504200B2 publication Critical patent/JP5504200B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Monitoring And Testing Of Exchanges (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、ネットワーク故障警報を集約する技術に関する。
ネットワーク故障が発生した場合、迅速に対応することが大切である。ネットワーク故障は、ネットワーク上に配置された通信機器が警報を送信することで保守者に通知される。保守者は、警報を確認して故障の発生原因を特定し、対処を行う。
特許文献1には、ネットワークの故障警報を収集し、ネットワークの設備の構成に基づいて故障により影響を受けた回線を特定する技術が開示されている。
特開平9−055739号公報
例えば、光ケーブルが切断された故障が発生した場合は、切断された光ケーブルに収容されているパスやセクションの警報が大量に発生する。警報が大量に発生した場合、従来の表示方法では画面内に警報が表示しきれないため、保守者が画面をスクロールさせて原因を特定する必要があり、故障の特定が非常に困難であった。
本発明は、上記に鑑みてなされたものであり、ネットワーク故障警報が大量に発生した場合でもネットワーク故障の原因の特定を容易にすることを目的とする。
第1の本発明に係る警報集約装置は、複数のネットワークからネットワーク故障に関する警報を受信し、警報を集約して提供する警報集約装置であって、前記警報を受信する受信手段と、同一の区間あるいは同一の地点を含む経路についての前記警報同士を関連性がある警報として絞り込む経路解析手段と、警報の内容に重要度の高低を設定して警報の種別毎に並べた故障特定マトリクスに前記経路解析手段が絞り込んだ前記関連性がある警報それぞれを当てはめて前記関連性がある警報のうち最も重要度が高い警報を原因警報と推定する推定手段と、前記複数のネットワークそれぞれの前記原因警報によって特定される故障箇所が同一地域を示す場合、前記原因警報それぞれを関連付ける関連付け手段と、を有することを特徴とする。
第2の本発明に係る警報集約方法は、複数のネットワークからネットワーク故障に関する警報を受信し、警報を集約して提供する警報集約方法であって、前記警報を受信するステップと、同一の区間あるいは同一の地点を含む経路についての前記警報同士を関連性がある警報として絞り込むステップと、警報の内容に重要度の高低を設定して警報の種別毎に並べた故障特定マトリクスに前記絞り込むステップで絞り込んだ前記関連性がある警報それぞれを当てはめて前記関連性がある警報のうち最も重要度が高い警報を原因警報と推定するステップと、前記複数のネットワークそれぞれの前記原因警報によって特定される故障箇所が同一地域を示す場合、前記原因警報それぞれを関連付けるステップと、を有することを特徴とする。
本発明によれば、ネットワーク故障警報が大量に発生した場合でもネットワーク故障の原因の特定を容易にすることができる。
ネットワークの構成例を示す図である。 本実施の形態における警報集約装置の構成を示す機能ブロック図である。 発生する警報の例を示す図である。 通信装置、セクション、パスの関係を示す図である。 故障特定マトリクスの例を示す図である。 関連性がある警報をツリー状に表示した例を示す図である。 警報を1行に集約して表示した例を示す図である。 各ネットワークにまたがる原因をツリー状に表示した例を示す図である。
以下、本発明の実施の形態について図面を用いて説明する。
図1は、ネットワーク構成の例を示す図である。同図に示すネットワークは、通信装置F〜Hをリング状に接続したリング1、通信装置A〜Eをリング状に接続したリング2、および通信装置I〜Lをリング状に接続したリング3のサブネットワークからなる。通信装置A〜L間は、光ファイバ等により接続され、各通信装置A〜Lには通信端末等が接続され、各リング上に通信経路を確立して通信が行われる。
ネットワーク故障が発生した場合は、ネットワーク故障に関連する各通信装置A〜Lから警報が送信される。例えば、図1の符号101で示すように、同一箇所で各リングの光ファイバを光ケーブルにまとめて敷設された区間において、光ケーブルが何らかの原因で切断された場合は、この切断された光ケーブルを利用していた各リングの通信装置A〜Lそれぞれから警報が送信され、大量の警報が発生する。そこで、本実施の形態における警報集約装置は、大量の警報を集約することで、原因となった警報と、その原因から波及して発生した警報とを区別し、容易にネットワーク故障の原因を特定することを可能とした。以下、本実施の形態における警報集約装置について説明する。
図2は、本実施の形態における警報集約装置の構成を示す機能ブロック図である。同図に示す警報集約装置1は、受信部11、バッファリング部12、フィルタリング部13、故障経路解析部14、故障箇所推定部15、および警報関連付け部16を備える。警報集約装置1が備える各部は、演算処理装置、記憶装置等を備えたコンピュータにより構成して、各部の処理がプログラムによって実行されるものとしてもよい。このプログラムは警報集約装置1が備える記憶装置に記憶されており、磁気ディスク、光ディスク、半導体メモリ等の記録媒体に記録することも、ネットワークを通して提供することも可能である。以下、各部について説明する。
受信部11は、図1に示すネットワーク上の通信装置A〜Lが送信する警報を受信する。図3に受信する警報の例を示す。警報には、警報の種別、ネットワーク名、発信元通信装置、警報の内容が含まれる。警報の種別には、通信経路に関する通信警報と通信装置に関する装置警報があり、通信警報には、故障が発生した階層に応じたセクション警報とパス警報がある。セクション警報はデータリンク層に関する警報であり、パス警報はネットワーク層に関する警報である。
バッファリング部12は、受信部11が受信した警報を取りこぼさないように一時的に蓄積する。バッファリング部12は、件/分で発生している警報量を計算し、バッファリングの有無を判断する。
フィルタリング部13は、バッファリング部12に蓄積された警報を重要警報、非重要警報に分別する。例えば、予め分かっている工事が原因で送信された警報は故障に対応する必要がないので非重要警報に分別する。
故障経路解析部14は、データベース2を参照してパス警報に関連する通信経路を特定し、同一の区間あるいは同一の地点を含む通信経路についての警報同士を関連性がある警報として絞り込む。データベース2には、確立したパスについて両端の通信装置と通信経路に関する情報が格納されており、データベース2を参照することで、パスの通信経路が特定できる。パス警報により特定した通信経路上の、パスよりも上位階層であるセクション、通信装置に関する警報(セクション警報、装置警報)が存在する場合は、それらの警報を関連性がある警報とする。
図4に通信装置、セクション、パスの関係を示す。隣接する通信装置間のデータリンク層で結ばれた経路をセクションと呼び、通信装置間のネットワーク層で確立された通信経路をパスと呼ぶ。パスは1つ以上のセクション上に確立される。図4に示すように、通信装置B−C間のセクションB−Cに故障が発生した場合、通信装置B,Cは、隣接する通信装置との間の通信故障を検出してセクション警報を送信する。また、セクションB−C上に確立されたパスを利用している通信装置、例えば通信装置B−D間にパスが確立されている場合、通信装置B,Dは、確立したパスの通信故障を検出してパス警報を送信する。この場合、通信装置B,Dが送信したパス警報と通信装置B,Cが送信したセクション警報は関連性がある警報となる。なお、通信装置の故障により、セクション警報、パス警報が発生した場合も同様に関連性がある警報として絞り込む。
同時に複数の箇所でネットワーク故障が発生した場合、それぞれのネットワーク故障について関連性がある警報が別々に絞り込まれるので、一方のネットワーク故障を原因とする大量の警報により、他方のネットワーク故障の警報が埋もれてしまうことがない。
故障箇所推定部15は、故障特定マトリクスを参照して、絞り込まれた警報の中から原因を示す警報(原因警報)を推定する。故障特定マトリクスとは、警報の内容に重要度の高低を設定し、警報種別毎に並べたものである。故障箇所推定部15は、関連性がある警報それぞれの内容を故障特定マトリクスに当てはめて、最も重要度が高い警報を原因警報であると推定する。図5に、故障特定マトリクスの例を示す。図5の故障特定マトリクスにおいて、関連性がある警報として、信号断、対向側故障、上位故障のセクション警報、パス警報が絞り込まれた場合、信号断が最も重要度が高くなるので、信号断の警報が原因警報であり、他の警報は、その原因に波及して発せられた警報(波及警報)であると推定される。
警報関連付け部16は、ネットワーク毎に、原因警報に波及警報を括り付けて警報をツリー状に管理する。図6に、関連性がある警報をツリー状に表示した例を示す。同図では、故障が発生したネットワークの下に原因警報を括り付け、その原因警報の下に波及警報を括り付けて表示している。保守者は、Webサーバ3を介して集約した警報を表示させる。個々の警報をクリックして選択することでその警報の詳細を確認することができる。
また、図7に示すように、故障発生箇所を分かりやすく一行にまとめて表示してもよい。図7に示す例では、ネットワーク名、発生箇所、関連性がある警報の数を表示している。警報の数の欄をクリックして選択することで警報の詳細を確認することができる。
複数のネットワークで故障が発生し、ネットワークそれぞれの原因警報によって特定される故障箇所が同一地域を示す場合、例えば図1の符号101に示すように、複数のネットワークの光ファイバを同一箇所に敷設した光ケーブルが切断された場合、図8に示すように、各ネットワークをネットワーク故障原因である「光束の断」に括り付けて表示を行う。複数のネットワークで故障が発生した場合、それらの故障箇所の敷設区間をデータベース2等を参照して特定し、故障箇所の敷設区間が一致している場合は、各ネットワークの故障が同一の原因と考えられるので、それらを関連付けてツリー状に管理する。
以上説明したように、本実施の形態によれば、受信部11が警報を受信して、故障経路解析部14がデータベース2を参照してパス警報に関連する通信経路を特定し、通信経路に同一の区間を含む警報同士を関連性がある警報として絞り込み、故障箇所推定部15が、警報の内容に重要度の高低を設定して警報種別毎に並べた故障特定マトリクスに関連性がある警報それぞれを当てはめて、最も重要度が高い警報を原因警報と推定し、警報関連付け部16が、原因警報に波及警報(他の関連性がある警報)を括り付けて警報をツリー状に管理することにより、大量に発生した警報の原因となる警報を容易に識別できる。その結果、ネットワーク故障警報が大量に発生した場合でも容易にネットワーク故障の原因の特定することができる。
1…警報集約装置
11…受信部
12…バッファリング部
13…フィルタリング部
14…故障経路解析部
15…故障箇所推定部
16…警報関係付け部
2…データベース
3…Webサーバ

Claims (2)

  1. 複数のネットワークからネットワーク故障に関する警報を受信し、警報を集約して提供する警報集約装置であって、
    前記警報を受信する受信手段と、
    同一の区間あるいは同一の地点を含む経路についての前記警報同士を関連性がある警報として絞り込む経路解析手段と、
    警報の内容に重要度の高低を設定して警報の種別毎に並べた故障特定マトリクスに前記経路解析手段が絞り込んだ前記関連性がある警報それぞれを当てはめて前記関連性がある警報のうち最も重要度が高い警報を原因警報と推定する推定手段と、
    前記複数のネットワークそれぞれの前記原因警報によって特定される故障箇所が同一地域を示す場合、前記原因警報それぞれを関連付ける関連付け手段と、
    を有することを特徴とする警報集約装置。
  2. 複数のネットワークからネットワーク故障に関する警報を受信し、警報を集約して提供する警報集約方法であって、
    前記警報を受信するステップと、
    同一の区間あるいは同一の地点を含む経路についての前記警報同士を関連性がある警報として絞り込むステップと、
    警報の内容に重要度の高低を設定して警報の種別毎に並べた故障特定マトリクスに前記絞り込むステップで絞り込んだ前記関連性がある警報それぞれを当てはめて前記関連性がある警報のうち最も重要度が高い警報を原因警報と推定するステップと、
    前記複数のネットワークそれぞれの前記原因警報によって特定される故障箇所が同一地域を示す場合、前記原因警報それぞれを関連付けるステップと、
    を有することを特徴とする警報集約方法。
JP2011078477A 2011-03-31 2011-03-31 警報集約装置及び警報集約方法 Expired - Fee Related JP5504200B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011078477A JP5504200B2 (ja) 2011-03-31 2011-03-31 警報集約装置及び警報集約方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011078477A JP5504200B2 (ja) 2011-03-31 2011-03-31 警報集約装置及び警報集約方法

Publications (2)

Publication Number Publication Date
JP2012213112A JP2012213112A (ja) 2012-11-01
JP5504200B2 true JP5504200B2 (ja) 2014-05-28

Family

ID=47266706

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011078477A Expired - Fee Related JP5504200B2 (ja) 2011-03-31 2011-03-31 警報集約装置及び警報集約方法

Country Status (1)

Country Link
JP (1) JP5504200B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110113208A (zh) * 2019-05-08 2019-08-09 深圳前海微众银行股份有限公司 报警信息处理方法、装置、设备及计算机可读存储介质
US11695617B2 (en) 2020-02-05 2023-07-04 Nippon Telegraph And Telephone Corporation Alarm monitoring system, alarm monitoring method, and program
CN113807697B (zh) * 2021-09-17 2023-10-31 中国联合网络通信集团有限公司 基于告警关联的派单方法及装置
WO2023218519A1 (ja) * 2022-05-10 2023-11-16 日本電信電話株式会社 ネットワーク設備監視装置、ネットワーク設備監視方法およびプログラム

Also Published As

Publication number Publication date
JP2012213112A (ja) 2012-11-01

Similar Documents

Publication Publication Date Title
US20200106662A1 (en) Systems and methods for managing network health
US20180032941A1 (en) Automated Model Based Root Cause Analysis
CN104796273A (zh) 一种网络故障根源诊断的方法和装置
JP5504200B2 (ja) 警報集約装置及び警報集約方法
US20150117244A1 (en) Methods to visualize time-aligned data flow between nodes in a communication network
US20140156846A1 (en) Correlating computing network events
US8589536B2 (en) Network monitoring system
CN105721184A (zh) 一种网络链路质量的监控方法及装置
US20210211346A1 (en) Method and system for assessing network resource failures using passive shared risk resource groups
JP5251538B2 (ja) 異常箇所特定プログラム、異常箇所特定装置、異常箇所特定方法
JP6978687B2 (ja) 監視装置及び監視方法
JP5292929B2 (ja) 監視装置
US20120030572A1 (en) Network visualization system
JP2011160086A (ja) 障害区間判定装置
EP3735767B1 (en) Method and system for assigning resource failure severity in communication networks
US10432451B2 (en) Systems and methods for managing network health
JP6610081B2 (ja) サービス連携管理システム、装置、方法及びプログラム
WO2012070475A1 (ja) 情報処理装置、情報処理方法、並びに情報処理プログラム
CN112769643A (zh) 资源调度方法、装置、电子设备及存储介质
CN113411209A (zh) 一种分布式的密码服务全链路检测系统及方法
JP2008171104A (ja) 業務サービスとシステム性能を監視対象とする監視装置、監視システム、監視方法および監視プログラム
JP5126137B2 (ja) ネットワーク管理システム及びプログラム
JP5444068B2 (ja) 警報管理システム、警報管理装置及び障害原因解析方法
JP5724145B2 (ja) 被疑装置の判定装置、判定方法及び被疑装置の判定プログラム
JP2017060012A (ja) 故障検知装置、故障検知方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140206

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140317

R150 Certificate of patent or registration of utility model

Ref document number: 5504200

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees