JP5600629B2 - 通信網監視装置 - Google Patents

通信網監視装置 Download PDF

Info

Publication number
JP5600629B2
JP5600629B2 JP2011075236A JP2011075236A JP5600629B2 JP 5600629 B2 JP5600629 B2 JP 5600629B2 JP 2011075236 A JP2011075236 A JP 2011075236A JP 2011075236 A JP2011075236 A JP 2011075236A JP 5600629 B2 JP5600629 B2 JP 5600629B2
Authority
JP
Japan
Prior art keywords
node
alarm
notification
failure
communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011075236A
Other languages
English (en)
Other versions
JP2012209846A (ja
Inventor
英俊 横田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2011075236A priority Critical patent/JP5600629B2/ja
Publication of JP2012209846A publication Critical patent/JP2012209846A/ja
Application granted granted Critical
Publication of JP5600629B2 publication Critical patent/JP5600629B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、通信網の障害時に複数の通信装置から発生するアラームを集約して障害原因を推定する通信網監視装置に関する。
通信網を監視するシステムでは、通信装置間の接続の関係性をリレーショナルデータベース等に登録し、その検索機能を利用して複数のアラーム情報を集約する方式が主流であり、例えば特許文献1,2に開示されている。また、同じアラームが複数連続して発生した場合に、これらを一つのアラームとして集約するシステムが存在する。
特開平6−141096号公報 特開2000−200101号公報
しかしながら、接続数の多い装置に対してリレーショナルデータベースを利用した場合、発生したアラームに合致する周辺装置が多くなり、障害の絞り込みに時間がかかるという欠点がある。またリレーショナルデータベースを用いた方式では、網構成が変更された際に、その関係性を手動で書き換える必要があるため、構成変更への対応が煩雑である。このため、異なる装置から発生するアラームを集約する方式は、長期的な運用が困難であった。
本発明の目的は、上記した従来技術の課題を解決し、通信網の障害時に複数の通信装置から発生するアラームを集約することで障害原因を容易に推定できる通信網監視装置を提供することにある。
上記の目的を達成するために、本発明は、通信網の障害時に複数の通信装置から発報されるアラームを集約して障害原因を推定する通信網監視装置において、以下のような手段を講じた点に特徴がある。
(1)各通信装置およびその接続関係がノードおよびエッジで模されたグラフと、各ノードにおいて、対応する通信装置から発報されたアラームの通知先として、近隣ノードが登録されたアラーム集合と、各通信装置が発報するアラームを検知し、発報元の通信装置に対応したノードへアラーム発報を通知する手段と、前記アラーム発報を通知されたノードにおいて、前記アラーム集合に登録されている近隣ノードへ前記アラーム発報を転送する手段と、前記アラーム発報を通知および転送されたノードにおいて、当該アラーム発報の通知元ノードをマークする手段と、各ノードにおいてマークされているノード数に基づいて障害原因を推定する手段とを具備した。
(2)前記アラーム発報を通知する手段は、発報元の通信装置に固有のハッシュ値を算出する手段と、前記ハッシュ値とノードとの対応関係を管理するハッシュテーブルとを具備し、前記発報元の通信装置のハッシュ値をキーに前記ハッシュテーブルを探索して前記発報元の通信装置に対応したノードを特定するようにした。
本発明によれば、以下のような効果が達成される。
(1)網構成に基づくグラフを利用することにより、アラームの集約が自動化されるので、障害原因を容易に推定できるようになる。また、網構成を変更する際も、グラフを利用することによりアラーム集合の修正が容易になる。
(2)通信装置とノードとがハッシュテーブルで対応付けられるので、アラームを発報したノードへの到達がグラフの構成にかかわらず一定となる。
本発明の通信網監視装置が適用される通信網の一例を示した図である。 通信網のグラフ構造を示した図である。 アラーム集合の一例を示した図である。 本発明の一実施形態の動作を示したフローチャートである。 アラームの発報順序の一例を示した図である。 通信装置Cがアラームを発報した際に各ノードにおいてアラーム集合の対応ノードがマークされる様子を示した図である。 通信装置Gがアラームを発報した際に各ノードにおいてアラーム集合の対応ノードがマークされる様子を示した図である。 通信装置Eがアラームを発報した際に各ノードにおいてアラーム集合の対応ノードがマークされる様子を示した図である。 通信装置Fがアラームを発報した際に各ノードにおいてアラーム集合の対応ノードがマークされる様子を示した図である。 通信装置Iがアラームを発報した際に各ノードにおいてアラーム集合の対応ノードがマークされる様子を示した図である。 通信網の構成変更に応じてグラフおよび各ノードのアラーム集合が更新される様子を示した図である。
以下、図面を参照して本発明の実施の形態について詳細に説明する。図1は、本発明の通信網監視装置が適用される通信網の一例を示した図であり、複数のネットワーク装置2(2a〜2d)が相互に接続されて通信網を構成し、各ネットワーク装置2には通信装置(通信ボード)A〜Jが実装されている。各通信装置A〜Jが隣接装置との接続断や品質劣化等を検知して発報するアラームは監視装置1により集約され、当該監視装置1において障害箇所が推定される。
図2は、監視装置1により管理される前記通信網のグラフ構造の一例を示した図であり、前記と同一の符号は同一または同等部分を表している。
図2のグラフでは、各通信装置A〜Jが丸印のノードA〜Jで表現され、ノード間の接続状態はリンク(枝)で表現されている。本実施形態では、ネットワーク装置2aに通信装置Dが実装され、ネットワーク装置2bに通信装置A,B,Cが実装され、ネットワーク装置2cに通信装置E,F,Gが実装され、ネットワーク装置2dに通信装置H,I,Jが実装されている。
また、本実施形態では図3に示したように、各ノードA〜Jには、自ノードに対応した通信装置A〜Jがアラームを発報した際に、このアラーム発報を通知する先の近隣ノードがアラーム集合として予め設定されている。本実施形態では、アラーム発報の通知先が1ホップまでと規定されているので、アラーム集合として、例えばノードAには自ノードを含めて3つのノード[A,B,C]が設定され、ノードEには5つのノード[C,E,F,G,I]が設定され、ノードHには2つのノード[H,I]が設定されている。
さらに、本実施形態ではアラームを発報した通信装置と前記グラフ上での対応ノードとを高速に対応付けるために、各通信装置A〜Jとグラフの各ノードA〜Jとを対応付けるハッシュテーブルが用意されている。これにより、アラームを発報した通信装置のIDをハッシュ関数に適用してハッシュ値H(ID)を求め、このハッシュ値H(ID)でハッシュテーブルを探索することにより、各アラーム発報の対応ノードへの到達時間をグラフの構成に関わらず一定にできるようになる。
次いで、フローチャートを参照して本発明の一実施形態の動作について説明する。図4は、主に前記監視装置1の動作を示したフローチャートであり、ここでは、図5に示したように、時刻t1で通信装置Cがアラームを発報し、その後、時刻t2,t3,t4,t5で、それぞれ通信装置G,E,F,I,Cがアラームを順次に発報した場合を例にして説明する。
時刻t1で通信装置Cがアラームを発報し、これがステップS1で検知されると、ステップS2では、前記通信装置Cの識別子IDaがハッシュ関数に適用されてハッシュ値H(IDa)が算出される。ステップS3では、前記ハッシュ値H(IDa)に基づいてハッシュテーブルを探索することでグラフ上のノードCが特定される。ステップS4では、図6に示したように、前記特定されたノードCへアラーム発報が通知される。
ステップS5では、ノードCのアラーム集合に登録されている近隣ノード(ここでは、1ホップ先のノードA,E)へ前記アラーム発報が転送される。前記アラーム発報を通知されたノードCおよび当該アラーム発報を転送されたノードA,Eでは、図6に示したように、アラーム集合のノードCがマークされる。ステップS6では、最初のアラーム発報時刻t1から所定の監視期間Wが経過したか否かが判定され、最初は経過していないと判定されるのでステップS8へ進み、次のアラーム発報に備えて待機する。
次いで、時刻t2で通信装置Gがアラームを発報し、これがステップS8で検知されると前記ステップS2へ戻り、前記と同様に、通信装置Gの識別子IDgのハッシュ値H(IDg)に基づいてハッシュテーブルを探索することでグラフ上のノードGが特定され、各ノードに設定されているアラーム集合のノードGがマークされる。本実施形態では、図7に示したように、ノードE,Gの各アラーム集合においてノードGが新たにマークされる。
同様に、時刻t3で通信装置Eがアラームを発報すると、図8に示したように、ノードC,E,F,G,Iの各アラーム集合においてノードEが新たにマークされ、時刻t4で通信装置Fがアラームを発報すると、図9に示したように、ノードE,Fの各アラーム集合においてノードFが新たにマークされ、時刻t5で通信装置Iがアラームを発報すると、図10に示したように、ノードE,H,I,Jの各アラーム集合においてノードIが新たにマークされる。その後、ステップS6において、最初のアラームの発報時刻t1からの経過時間が監視期間Wに達した判定されるとステップS7へ進む。
ステップS7では、各ノードのアラーム集合が参照され、マークされているノード数に基づいて障害原因が推定される。本実施形態では、アラーム集合においてマークされているノード数が多いノードほど高い確率で障害箇所と推定される。上記の例では、ノードEのアラーム集合において、5つのノードC,G,E,F,Iがマークされており、これが最大値なので、ノードEが最尤の障害箇所と推定される。
本実施形態によれば、網構成に基づくグラフを利用することにより、アラームの集約が自動化されるので、障害原因を容易に推定できるようになる。
なお、本実施形態では、グラフのリンク(枝)数が多いノードのアラーム集合には多数のノードが登録されることになる。したがって、リンク数が多いノードに対応した通信装置からアラームが発報されると、そのアラーム処理では、対応ノードから多数の近隣ノードへアラーム発報が通知ことになり、その結果、当該アラーム発報の通知に比較的長い時間を要し、その後に発報されるアラームの処理に遅延が生じかねない。そして、リンク数の多いノードのアラーム処理に長い時間を要してしまうと、その後の多数のアラーム処理を監視期間W内に完了できなくなるので、アラーム処理の総数が減少してしまい、障害箇所の推定精度が低下してしまう恐れがある。
このような問題点を解決するためには、各ノードのリンク数を把握しておき、リンク数が所定の閾値を越えるノードのアラーム処理は所定の時間だけ保留し、後発のリンク数の少ないアラーム処理を先に行うことにより、グラフの接続構成に起因する遅延を抑制できるようになる。
また、上記の実施形態では、最初のアラームが発報されてから所定の監視期間Wが経過した時点で、マークされているノード数が最も多いノードを障害原因と推定するものとして説明したが、本発明はこれのみに限定されるものではなく、アラーム集合に登録されている近隣ノードの全てが最初にマークされたノードを最尤の障害原因と推定するようにしても良い。
次いで、網構成の変更への対応方法について説明する。各ネットワーク装置2が図11(a)のように接続されている状態から、図11(b)のように、ネットワーク装置2cの接続先が同2bから同2aに変更される場合、接続が断たれるノードE,C,I間では、ノードEからノードC,Iに対して削除要求が送信される。ノードC,Iでは、当該削除要求に応答してアラーム集合からノードEが削除され、ノードEのアラーム集合からはノードC,Iが削除される。
一方、新たに接続が確立されるノードE,D間では、ノードEからノードDへ修正要求が送信される。この結果、ノードDのアラーム集合は「B,D」から「B,D,E」に修正され、ノードEのアラーム集合は「E,F,G」から「D,E,F,G」に修正される。
このように、本実施形態によれば、ノード間の接続または切断に応じてグラフのアラーム集合を修正するだけで、網構成の変更に対応できるようになる。
1…監視装置、2…ネットワーク装置

Claims (5)

  1. 通信網の障害時に複数の通信装置から発報されるアラームを集約して障害原因を推定する通信網監視装置において、
    各通信装置およびその接続関係がノードおよびエッジで模されたグラフと、
    各ノードにおいて、対応する通信装置から発報されたアラームの通知先として、近隣ノードが登録されたアラーム集合と、
    各通信装置が発報するアラームを検知し、発報元の通信装置に対応したノードへアラーム発報を通知する手段と、
    前記アラーム発報を通知されたノードにおいて、前記アラーム集合に登録されている近隣ノードへ前記アラーム発報を転送する手段と、
    前記アラーム発報を通知および転送されたノードにおいて、当該アラーム発報の通知元ノードをマークする手段と、
    各ノードにおいてマークされているノード数に基づいて障害原因を推定する手段とを具備したことを特徴とする通信網監視装置。
  2. 前記アラーム発報を通知する手段は、
    前記発報元の通信装置に固有のハッシュ値を算出する手段と、
    前記ハッシュ値とノードとの対応関係を管理するハッシュテーブルとを具備し、
    前記発報元の通信装置のハッシュ値をキーに前記ハッシュテーブルを探索して前記発報元の通信装置に対応したノードを特定することを特徴とする請求項1に記載の通信網監視装置。
  3. 前記障害原因を推定する手段は、最初のアラームが発報されてから所定の監視期間が経過した時点で、前記マークされているノード数が最も多いノードを障害原因と推定することを特徴とする請求項1または2に記載の通信網監視装置。
  4. 前記障害原因を推定する手段は、アラーム集合に登録されている近隣ノードの全てが最初にマークされたノードを障害原因と推定することを特徴とする請求項1または2に記載の通信網監視装置。
  5. 通信網の構成変更に応答して前記アラーム集合を修正する手段を具備したことを特徴とする請求項1ないし4のいずれかに記載の通信網監視装置。
JP2011075236A 2011-03-30 2011-03-30 通信網監視装置 Expired - Fee Related JP5600629B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011075236A JP5600629B2 (ja) 2011-03-30 2011-03-30 通信網監視装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011075236A JP5600629B2 (ja) 2011-03-30 2011-03-30 通信網監視装置

Publications (2)

Publication Number Publication Date
JP2012209846A JP2012209846A (ja) 2012-10-25
JP5600629B2 true JP5600629B2 (ja) 2014-10-01

Family

ID=47189228

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011075236A Expired - Fee Related JP5600629B2 (ja) 2011-03-30 2011-03-30 通信網監視装置

Country Status (1)

Country Link
JP (1) JP5600629B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104168137A (zh) * 2014-08-08 2014-11-26 蓝盾信息安全技术有限公司 一种告警压缩的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0369227A (ja) * 1989-08-08 1991-03-25 Fujitsu Ltd ノード障害判定方式
JP2005234762A (ja) * 2004-02-18 2005-09-02 Nippon Telegr & Teleph Corp <Ntt> リソース検索装置及び方法、ならびに、コンピュータプログラム

Also Published As

Publication number Publication date
JP2012209846A (ja) 2012-10-25

Similar Documents

Publication Publication Date Title
EP3231135B1 (en) Alarm correlation in network function virtualization environment
CN113328872B (zh) 故障修复方法、装置和存储介质
US9608900B2 (en) Techniques for flooding optimization for link state protocols in a network topology
JP5767617B2 (ja) ネットワーク障害検出システムおよびネットワーク障害検出装置
US20140089619A1 (en) Object replication framework for a distributed computing environment
JP5033856B2 (ja) ネットワーク構成の想定のための装置、システム
CN105659528B (zh) 一种实现故障定位的方法及装置
US20140317256A1 (en) Loop and Outage Avoidance in Software Defined Network
JP2014175924A5 (ja)
JP2016508638A5 (ja)
JP2014121093A5 (ja)
WO2016095710A1 (zh) 一种调整srlg的方法和装置
JP6434021B2 (ja) データフィードの管理
CN104219087A (zh) 一种故障定位的方法
US11088937B1 (en) System and method for synchronized route update
US9100292B2 (en) Methods for managing upgrading a telecommunication network and devices thereof
JP5600629B2 (ja) 通信網監視装置
CN103763323A (zh) 一种防火墙规则管理方法及装置
JP2010092395A (ja) サーバ管理システム,サーバ管理方法及びサーバ管理用プログラム
WO2021103800A1 (zh) 故障修复操作推荐方法、装置及存储介质
JP6068296B2 (ja) 制御装置、計算資源管理方法及び計算資源管理プログラム
CN103428085A (zh) 一种rip路由的快速切换方法和设备
JP6483592B2 (ja) コントローラおよび制御システム
JP6705815B2 (ja) 候補問題ネットワーク・エンティティの識別
WO2016078461A1 (zh) 一种计算路径的方法和路径计算服务器

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130823

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140507

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140701

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140806

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140818

R150 Certificate of patent or registration of utility model

Ref document number: 5600629

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees