JP6057470B2 - ネットワークのアラーム処理システム - Google Patents

ネットワークのアラーム処理システム Download PDF

Info

Publication number
JP6057470B2
JP6057470B2 JP2013157772A JP2013157772A JP6057470B2 JP 6057470 B2 JP6057470 B2 JP 6057470B2 JP 2013157772 A JP2013157772 A JP 2013157772A JP 2013157772 A JP2013157772 A JP 2013157772A JP 6057470 B2 JP6057470 B2 JP 6057470B2
Authority
JP
Japan
Prior art keywords
alarm
node device
information
processing system
alarm information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013157772A
Other languages
English (en)
Other versions
JP2015029194A (ja
JP2015029194A5 (ja
Inventor
雅典 宮澤
雅典 宮澤
林 通秋
通秋 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2013157772A priority Critical patent/JP6057470B2/ja
Publication of JP2015029194A publication Critical patent/JP2015029194A/ja
Publication of JP2015029194A5 publication Critical patent/JP2015029194A5/ja
Application granted granted Critical
Publication of JP6057470B2 publication Critical patent/JP6057470B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、ネットワークのアラーム処理システムに係り、特に、一つのアラーム原因に対して複数のノード装置から発せられるアラームを集約することで総アラーム数を減じ、かつサイレント障害を確実に検知できるネットワークのアラーム処理システムに関する。
ネットワーク仮想化技術の発展により、インターフェースやネットワーク自体の管理オブジェクト数が爆発的に増加し、発生するアラーム数も増加する傾向にあり、ネットワークの障害状態の把握(特に障害原因解析)に遅れが生じる課題がある。
このような技術課題に対して、本発明の発明者等は、ネットワーク装置が保持するデータを、集中管理基盤上で管理するのではなく、ネットワーク上の各ノード装置内部にデータ処理をオフロードする手法を開発し、特許出願(特許文献1)した。更に、トラヒック量などの品質・性能情報も同様に大幅に増加しており、管理システム側の負荷の増加が予想されるため、処理を装置へオフロードする手法を開発し、特許出願(特許文献2)した。
特願2012-030371号 特願2013-059035号
ネットワークオペレータはネットワークサービスの異常を検知・把握するため、既存方式ではすべての装置で設定されたSNMP(Simple Network Management Protocol)やSyslog情報を、外部管理システム(NMS:Network Management System)で受信し、状態遷移の把握を行っている。しかしながら、既存方式では装置単位でアラーム情報が送信されるため、直接原因でないアラームが送出されてくるとともに、管理対象となるノード装置数が増えるとアラーム情報が爆発的に増加し、結果的に処理遅延が生じる。さらに、サイレント障害の発見に遅延が生じうる。
本発明の目的は、上記の技術課題を解決し、管理システムが持つアラーム管理機能の一部をネットワーク上の各ノード装置内部に配備して機能を分散化すると共に、隣接するノード装置同志がアラーム情報を確認することにより、管理システムへ通知するアラーム数を削減し、更にはサイレント障害を検知できるアラーム処理システムを提供することにある。
上記の目的を達成するために、本発明は、ネットワークのノード装置上でアラーム情報を分散処理するアラーム処理システムにおいて、以下の構成を発明特定事項とした点に特徴がある。
(1)ネットワークトポロジおよび各ノード装置のIDを管理する構成管理手段と、ノード装置により検知されたアラーム情報を蓄積するアラームDBと、ネットワークトポロジに基づいて隣接装置を識別する手段と、相互に隣接するノード装置の一方が他方のアラームDBを参照し、前記アラーム情報と同一のアラーム情報が登録されていれば自装置のアラームDBから前記アラーム情報を削除する手段と、アラームDBに蓄積されているアラーム情報を前記管理システムへ送信する手段とを具備した。
(2)一方のノード装置は、他方のノード装置のアラームDBにアラーム情報と同一のアラーム情報が登録されていると当該アラーム情報に隣接確認フラグをセットし、他方のノード装置は、当該アラームを隣接確認フラグと共に前記管理システムへ送信するようにした。
(3)一方のノード装置は、他方のノード装置のアラームDBにアラーム情報と同一のアラーム情報が登録されていないと当該アラーム情報にサイレントフラグをセットし、当該アラームを前記サイレントフラグと共に管理システムへ送信するようにした。
(4)他方のノード装置は、アラームDBに登録されているアラーム情報に隣接確認フラグがセットされていないとサイレントフラグをセットし、当該アラームを前記サイレントフラグと共に管理システムへ送信するようにした。
本発明によれば、以下のような効果が達成される。
(1)同一のネットワーク障害に起因した同一アラームが複数のノード装置において検知されても、隣接ノード同士で同一アラームが一方の隣接ノードへ集約されるので、複数のノード装置から同一アラームがそれぞれ管理システムへ送信される不都合が防止される。
(2)自装置のみに登録されて隣接ノード装置には未登録のアラームをサイレント障害に起因したアラームと推定し、当該アラームがサイレント障害に起因したアラームである旨の情報と共に管理システムへ送信されるので、管理システムはサイレント障害を簡単に判別できるようになる。
本発明に係るアラーム処理システムが適用されるネットワークノード装置の構成を示した機能ブロック図である。 発明の一実施形態の動作を模式的に表現した図である。 本発明の一実施形態の動作を示したフローチャートである。 アラーム通知のフォーマットを示した図である。
以下、図面を参照して本発明の実施の形態について詳細に説明する。図1は、本発明に係るアラーム処理システムが適用されるネットワークノード装置の構成を示した機能ブロック図であり、ネットワーク上には多数のネットワークノード装置INMおよびその管理システム1が配置されている。
各ノード装置INMではSNMPエージェントがそれぞれ稼働し、各SNMPエージェントは、あらかじめ指定されたイベントの発生や、プロセス値の閾値越え等が検知されるとSNMPトラップ(Trap)を送出する。当該SNMPトラップは、各ノード装置INMのAPIを経由して、管理システム1のSNMPマネージャへ送信される。
ノード装置INMにおいて、アラーム処理基盤21は、SNMPエージェントが送出するSNMPトラップをリアルタイムにモニタリングし、本基盤上に設定されたアラームマスクルールに基づいてマスク処理を行う。アラームマスクルールとは、高速データ処理基盤上に設定されたフィルタ機能により、不必要と判断されたアラームをマスクする機能であり、隣接装置間のアラーム受信状況を確認するアラーム処理フロー機能も具備する。
本実施形態では、構成管理DBで管理されているConnectionおよびConnectionLess、ならびにネットワークで保持されるOID情報以外がマスクされる。そして、アラームマスクされたアラームがアラーム保存DB23で一定時間保存される一方、アラームマスクされなかったアラームはアラームDB22へ保存される。共有データベース25は、複数のノード装置間で構成管理データ(装置構成情報やネットワークトポロジ情報)を共有管理する仕組みを提供する。
API(外部インターフェース機能部)は、アラーム情報の記述されたSNMPトラップを管理システム1へ転送するインターフェース機能を実現する。共有DB25には、ネットワークトポロジおよび各ノード装置INMに固有の識別IDが登録されている。本実施形態では、各ノード装置INMの識別IDとしてIPアドレスが用いられる。
次いで、図2のブロック図および図3のフローチャートを参照して本発明の動作について詳細に説明する。
ステップS1では、各ノード装置INMにおいて稼働中のSNMPエージェントから送出されたアラーム(Trap)が受信されたか否かが判定される。ここでは、相互に隣接するノード装置INM1,INM2において、同一のネットワーク障害に起因した同一アラームの記述されたTrapが、ほぼ同時刻に受信されたものとして説明を続ける。
ステップS2では、当該アラームが各ノード装置INM1,INM2において自装置のアラームDB22にそれぞれ登録される。本実施形態では、図2に示したように、アラームの受信時刻およびその送信元(source)情報、ならびにSNMPトラップのOID(オブジェクトID)に記述されているアラーム(Alarm)情報が抽出されてアラームDB22の同一レコードに登録される。
ステップS3では、構成管理DB25に登録されているネットワークトポロジに基づいて隣接ノード装置INMが識別され、当該隣接ノード装置の識別ID(本実施形態では、IPアドレス)が前記登録されたアラームのレコードに隣接情報として登録される。すなわち、ノード装置INM1では、隣接装置としてノード装置INM2が認識されるので、そのIPアドレスがアラームDB22の対応レコードに隣接情報として登録される。ノード装置INM2では、隣接装置としてノード装置INM1が認識されるので、そのIPアドレスがアラームDB22の対応レコードに隣接情報として登録される。
ステップS4では、各ノード装置INM1,INM2において自装置のアラームDB22が参照され、自装置の装置ID(source情報)および隣接装置の装置ID(隣接情報)のいずれが相対的に若番であるか判断される。ここでは、ノード装置INM1の装置ID(ノード1)よりもノード装置INM2の装置ID(ノード2)が若番であるものとして説明を続ける。したがって、ノード装置INM1では処理がステップS4からステップS5へ進み、ノード装置INM2では処理がステップS4からステップS12へ進む。
初めに老番のノード装置INM1の動作に注目し、ステップS5,S6では、隣接するノード装置INM2のアラームDB22への接続が試行され、接続できればステップS7へ進む。ステップS7では、ノード装置INM2のアラームDB22に、前記ステップS1で自装置が受信したアラーム(アラーム1)と同一のアラームが重複登録されているか否かが判定される。ここでは、アラーム1が重複登録されていると判定されるのでステップS10へ進み、当該隣接するノード装置INM2のアラームDB22において、前記アラーム1と対応付けられた同一レコードの隣接確認フラグFnがセット(=1)される。ステップS11では、ノード装置INM1のアラームDB22から前記重複登録されていたアラーム1が削除される。
次いで若番のノード装置INM2の動作に注目し、ステップS12では所定の時間だけ待機する。ステップS13では、自装置INM2のアラームDB22に既登録のアラームについて、その隣接確認フラグFnが「1」であるか否かが判定され、隣接確認フラグFnが「1」であればステップS9へ進み、「1」でなければステップS8へ進む。本実施形態では、前記ステップS10においてアラーム1の隣接確認フラグFnがセットされているのでステップS9へ進む。ステップS9では、前記アラーム1の記述されたSNMPトラップが管理システム1へ送出される。
これに対して、ノード装置INM1にサイレント障害が発生し、そのアラーム(アラーム2)の記述されたTrapがノード装置INM1のみで受信されていれば、当該処理はノード装置INM1のみで実行され、そのステップS7では、同一アラームが隣接するノード装置INM2のアラームDB22には未登録と判定されるのでステップS8へ進む。ステップS8では、自装置INM1のアラームDB22において前記アラーム2と対応付けられたサイレントフラグFsがセットされる。ステップS9では、前記アラーム2の記述されたSNMPトラップが管理システム1へ送出される。
図4は、各ノード装置INMから管理システム1へ送信されるSNMPトラップのフォーマットを示した図であり、本実施形態では、OID (オブジェクトID)に拡張領域として「対向装置情報」および「サイレント故障情報」が用意されている。そして、前記ステップS8においてサイレントフラグFsがセットされると、ステップS9では、"元のアラーム情報"として前記アラーム2が記述され、"対向装置情報"としてsource情報が記述され、"サイレント故障情報"として前記サイレントフラグFsの値(ここでは、1)の記述されたSNMPトラップが生成されて管理システム1へ送出される。
管理システム1では、SNMPトラップを受信した際に、そのOIDの"サイレント故障情報"がセット(=1)されていれば、"対向装置情報"に記述されたノード装置INMにおいてサイレント障害が発生していると認識できる。また、"サイレント故障情報"がセットされていなければ、サイレント障害以外の例えばリンク障害が発生していると判断できる。
なお、上記の実施形態では、ネットワーク機器を監視、制御するための通信プロトコルとしてSNMPを利用するものとして説明したが、本発明はこれのみに限定されるものではなく、各ノード装置において検知された障害にオリジナルのメッセージやフラグを記述して管理システムに通知できるのであれば、他のプロトコルを用いても良い。
本実施形態によれば、同一のネットワーク障害に起因した同一アラームが複数のノード装置INMにおいて重複検知されても、隣接ノード同士で同一アラームが一方の隣接ノードへ集約されるので、複数のノード装置INMから同一アラームがそれぞれ管理システム1へ送信される不都合が防止される。
また、本実施形態によれば、自装置のみに登録されて隣接ノード装置には未登録のアラームをサイレント障害に起因したアラームと推定し、当該アラームがサイレント障害に起因したアラームである旨の情報と共に管理システム1へ送信されるので、管理システム1はサイレント障害を簡単に判別できるようになる。
1…管理システム,21…アラーム処理基盤,22…アラームDB,23…アラーム保存DB,24…API,25…共有データベース

Claims (6)

  1. ネットワークのノード装置上でアラーム情報を分散処理するアラーム処理システムにおいて、
    ネットワークトポロジおよび各ノード装置のIDを管理する構成管理手段と、
    ノード装置により検知されたアラーム情報を蓄積するアラームDBと、
    前記ネットワークトポロジに基づいて隣接装置を識別する手段と、
    相互に隣接するノード装置の一方が他方のノード装置のアラームDBを参照し、前記アラーム情報と同一のアラーム情報が登録されていれば自装置のアラームDBから前記アラーム情報を削除する手段と、
    アラームDBに蓄積されているアラーム情報を管理システムへ送信する手段とを具備したことを特徴とするアラーム処理システム。
  2. 前記一方のノード装置は、前記他方のノード装置のアラームDBに前記アラーム情報と同一のアラーム情報が登録されていると当該アラーム情報に隣接確認フラグをセットし、前記他方のノード装置は、当該アラームを前記隣接確認フラグと共に前記管理システムへ送信することを特徴とする請求項1に記載のアラーム処理システム。
  3. 前記一方のノード装置は、前記他方のノード装置のアラームDBに前記アラーム情報と同一のアラーム情報が登録されていないと当該アラーム情報にサイレントフラグをセットし、当該アラームを前記サイレントフラグと共に前記管理システムへ送信することを特徴とする請求項1に記載のアラーム処理システム。
  4. 前記他方のノード装置は、アラームDBに登録されているアラーム情報に隣接確認フラグがセットされていないとサイレントフラグをセットし、当該アラームを前記サイレントフラグと共に前記管理システムへ送信することを特徴とする請求項1ないし3のいずれかに記載のアラーム処理システム。
  5. 前記相互に隣接するノード装置は、自装置に固有のIDと隣接装置に固有のIDとを比較して前記ノード装置の一方を決定することを特徴とする請求項1ないし4のいずれかに記載のアラーム処理システム。
  6. 前記管理システムへ送信されるアラーム情報は、SNMPトラップに記述されて送信されることを特徴とする請求項1ないし5のいずれかに記載のアラーム処理システム。
JP2013157772A 2013-07-30 2013-07-30 ネットワークのアラーム処理システム Expired - Fee Related JP6057470B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013157772A JP6057470B2 (ja) 2013-07-30 2013-07-30 ネットワークのアラーム処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013157772A JP6057470B2 (ja) 2013-07-30 2013-07-30 ネットワークのアラーム処理システム

Publications (3)

Publication Number Publication Date
JP2015029194A JP2015029194A (ja) 2015-02-12
JP2015029194A5 JP2015029194A5 (ja) 2016-10-20
JP6057470B2 true JP6057470B2 (ja) 2017-01-11

Family

ID=52492637

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013157772A Expired - Fee Related JP6057470B2 (ja) 2013-07-30 2013-07-30 ネットワークのアラーム処理システム

Country Status (1)

Country Link
JP (1) JP6057470B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6515573B2 (ja) * 2015-02-20 2019-05-22 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP6859758B2 (ja) * 2017-03-06 2021-04-14 日本電気株式会社 ネットワーク監視装置、ネットワーク監視システム、ネットワーク監視方法及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3460737B2 (ja) * 1994-03-18 2003-10-27 富士通株式会社 警報情報転送方式
JP3503592B2 (ja) * 2000-11-22 2004-03-08 日本電気株式会社 ネットワークシステム及び情報機器
US7408458B1 (en) * 2005-12-29 2008-08-05 At&T Corp. Method and apparatus for suppressing duplicate alarms
JP2009296320A (ja) * 2008-06-05 2009-12-17 Nec Corp 監視制御統合装置、伝送装置、監視制御方法およびプログラム

Also Published As

Publication number Publication date
JP2015029194A (ja) 2015-02-12

Similar Documents

Publication Publication Date Title
KR101762237B1 (ko) 서비스 지향 아키텍쳐 내에서 능력을 모니터링하는 방법
EP1999890B1 (en) Automated network congestion and trouble locator and corrector
US20040008727A1 (en) Network resource management in a network device
JP2014534723A5 (ja)
JP2005295209A (ja) レイヤ2ループ検知システム
CN108418710B (zh) 一种分布式监控系统、方法及装置
US10237124B2 (en) Network operation, administration, and maintenance (OAM) method, apparatus, and system
JP2006501717A (ja) 電気通信ネットワーク・エレメントの監視
CN102263651A (zh) Snmp网络管理系统中局端设备连接状态的检测方法
WO2014056345A1 (zh) 监控任务的管理方法及装置
WO2016187979A1 (zh) 双向转发检测bfd报文的发送方法及装置
JP6057470B2 (ja) ネットワークのアラーム処理システム
US10277484B2 (en) Self organizing network event reporting
JP2010205234A (ja) 監視システム、ネットワーク機器、監視情報提供方法およびプログラム
JP2009199556A (ja) 通信監視装置、通信監視方法、コンピュータプログラム、そのシステム
CN113824595B (zh) 链路切换控制方法、装置和网关设备
CN105591920B (zh) 基于irdp的ra报文处理方法及装置
JP2004086522A (ja) 通信ネットワーク監視システム
JP6705815B2 (ja) 候補問題ネットワーク・エンティティの識別
WO2016202025A1 (zh) 陷阱Trap报文处理方法及装置
WO2017165999A1 (zh) 网络服务实现方法、服务控制器及通信系统
JP4818338B2 (ja) 監視サーバ、ネットワーク監視方法
WO2012022150A1 (zh) 一种故障告警方法、系统及装置
US9172596B2 (en) Cross-network listening agent for network entity monitoring
KR101214651B1 (ko) Snmp trap을 이용한 usp의 장애발생을 sms를 이용하여 통지하는 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160128

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20160810

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160901

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161205

R150 Certificate of patent or registration of utility model

Ref document number: 6057470

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees