JP2013150042A - Network monitoring system - Google Patents

Network monitoring system Download PDF

Info

Publication number
JP2013150042A
JP2013150042A JP2012006885A JP2012006885A JP2013150042A JP 2013150042 A JP2013150042 A JP 2013150042A JP 2012006885 A JP2012006885 A JP 2012006885A JP 2012006885 A JP2012006885 A JP 2012006885A JP 2013150042 A JP2013150042 A JP 2013150042A
Authority
JP
Japan
Prior art keywords
alarm
information
alarm information
network
notified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012006885A
Other languages
Japanese (ja)
Inventor
Hirobumi Kitagawa
博文 北川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012006885A priority Critical patent/JP2013150042A/en
Publication of JP2013150042A publication Critical patent/JP2013150042A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a network monitoring system tat is able to monitor a fault occurrence state in real time even when many alarms are issued.SOLUTION: In a network monitoring system, EMS servers collect alarm information transmitted by network elements (NE) and notify an NMS server. In a state in which many alarms are issued, each EMS server creates summary information including only part of the whole information included in the alarm information from the NE, and notifies the NMS server the summary information. The NMS server uses the summary information notified by each EMS server to monitor a fault occurrence state on a communication network in real time.

Description

本発明は、複数のネットワーク要素(Network Element:NE)から送出される警報情報を収集して通信ネットワーク上における障害の発生状況を監視するネットワーク監視システムに関する。   The present invention relates to a network monitoring system that collects alarm information transmitted from a plurality of network elements (NE) and monitors a failure occurrence state on a communication network.

従来のネットワーク監視システムでは、例えば、複数のNEが接続された通信ネットワークにおいて回線や機器で障害が発生すると、該障害を検知したNEが障害の発生部位や重要度などを示す警報情報を生成する。この警報情報は、予め割り当てられたNE群を管理するエレメント管理系(Element Management System:EMS)のサーバにより収集される。そして、ネットワーク上の複数のEMSサーバで収集された警報情報は、ネットワーク全体を管理するネットワーク管理系(Network Management System:NMS)のサーバに通知され、該NMSサーバで纏められた警報情報の一覧がNMSクライアントを介してネットワーク管理者に伝えられる。   In a conventional network monitoring system, for example, when a failure occurs in a line or a device in a communication network to which a plurality of NEs are connected, the NE that detects the failure generates alarm information indicating the location and importance of the failure. . This alarm information is collected by a server of an element management system (EMS) that manages NE groups assigned in advance. The alarm information collected by a plurality of EMS servers on the network is notified to a network management system (NMS) server that manages the entire network, and a list of alarm information collected by the NMS server is obtained. It is communicated to the network administrator via the NMS client.

上記ネットワーク監視システムにおいて、通信ネットワークには多種多様なNE(例えば、交換機、伝送装置、ルータ、コンピュータ装置等)が接続されると共に、該NEの中には大規模かつ多機能のものがあるため、一旦障害が発生すると、NEから大量の警報情報が送出され、それがEMSサーバを介してNMSサーバに通知されることになる。NMSサーバでは、通常、一定の処理能力を有するプロセッサにより全ての警報情報の処理が行われるため、大量の警報情報が集中してNMSサーバに通知されると、NMSサーバの処理が輻輳状態となり、ネットワーク監視システムの処理性能が著しく低下してシステムがダウンしてしまう可能性がある。   In the above network monitoring system, a wide variety of NEs (for example, exchanges, transmission devices, routers, computer devices, etc.) are connected to the communication network, and some of these NEs are large-scale and multifunctional. Once a failure occurs, a large amount of alarm information is sent from the NE, which is notified to the NMS server via the EMS server. In the NMS server, all alarm information is normally processed by a processor having a certain processing capability. Therefore, when a large amount of alarm information is concentrated and notified to the NMS server, the NMS server process becomes congested. There is a possibility that the processing performance of the network monitoring system is significantly lowered and the system is down.

上記のようなNMSサーバの処理輻輳による監視機能の低下を回避するための従来技術として、例えば、NMSサーバで単位時間あたりに受信される警報の情報量が所定の閾値を超えた場合に、EMSサーバからNMSサーバへの警報情報の通知を抑制すると共に、当該警報情報をEMSサーバのバッファに蓄積して通知抑制が解除された後にNMSサーバへ転送することで、通知抑制時の警報情報の取りこぼしを防いてネットワークの監視機能を維持するようにした技術が公知である(例えば、特許文献1参照)。   As a conventional technique for avoiding the deterioration of the monitoring function due to the processing congestion of the NMS server as described above, for example, when the amount of alarm information received by the NMS server per unit time exceeds a predetermined threshold, EMS Suppressing notification of alarm information from the server to the NMS server and storing the alarm information in the buffer of the EMS server and releasing the notification suppression, then transferring it to the NMS server, so that the alarm information when the notification is suppressed is missed Is known to maintain the network monitoring function (see, for example, Patent Document 1).

また、他の従来技術として、NEからの警報情報の多発をEMSサーバで判断し、警報多発時、EMSサーバが警報情報の代わりに警報多発を示すヘッダのみをNMSサーバに送出し、このヘッダの内容を基にNMSサーバが警報情報の分割送信あるいは破棄をEMSサーバに指示することで、NMSサーバの処理輻輳を軽減する技術も公知である(例えば、特許文献2参照)。   As another prior art, the occurrence of alarm information from the NE is determined by the EMS server, and when the alarm occurs frequently, the EMS server sends only the header indicating the alarm occurrence to the NMS server instead of the alarm information. A technique for reducing processing congestion of the NMS server by the NMS server instructing the EMS server to transmit or discard alarm information based on the content is also known (see, for example, Patent Document 2).

特開2001−223694号公報JP 2001-223694 A 特開平11−289304号公報Japanese Patent Laid-Open No. 11-289304

しかし、上記のような従来技術を適用したネットワーク監視システムについては、障害の発生状況をリアルタイムで監視することが難しいという課題がある。すなわち、NMSサーバで受信する警報の情報量が閾値を超えるとEMSサーバからNMSサーバへの警報情報の通知を抑制する場合、通知抑制中に発生した警報情報がNMSサーバに通知されるのは、NMSサーバの輻輳状態が解消した後の時点に限られる。このため、NMSサーバは、輻輳状態の発生から解消までの間、障害の発生状況に関する情報をリアルタイムで取得することができない。   However, the network monitoring system to which the conventional technology as described above is applied has a problem that it is difficult to monitor the occurrence of a failure in real time. That is, when the alarm information amount received by the NMS server exceeds the threshold and the alarm information notification from the EMS server to the NMS server is suppressed, the alarm information generated during the notification suppression is notified to the NMS server. It is limited to the time after the congestion state of the NMS server is resolved. For this reason, the NMS server cannot acquire information relating to the failure occurrence status in real time from the occurrence of the congestion state to the resolution.

なお、前述した特許文献1では、輻輳状態におけるNMSサーバの処理能力を高めるためにNMSサーバを冗長構成とし、EMSサーバを監視するNMSサーバを切り替える方式が提案されている。しかし、このようなNMSサーバの冗長構成は、ネットワーク監視システムの複雑化および高コスト化を招くという欠点がある。   In Patent Document 1 described above, a method is proposed in which the NMS server has a redundant configuration and the NMS server that monitors the EMS server is switched in order to increase the processing capability of the NMS server in a congested state. However, such a redundant configuration of the NMS server has a drawback that the network monitoring system is complicated and expensive.

また、警報多発時にEMSサーバがヘッダのみを送出するも場合も、NMSサーバは、ヘッダにより警報多発の状況を把握できるだけであり、たとえEMSサーバに対して警報情報の分割送信を指示したとしても、分割データが全て揃うまでは当該警報情報のデコード処理ができないため、障害の発生状況に関する情報をリアルタイムで取得することが困難である。   In addition, even when the EMS server sends out only the header at the time of the frequent occurrence of the alarm, the NMS server can only grasp the status of the frequent occurrence of the alarm by the header, even if the EMS server is instructed to transmit the alarm information separately, Since the alarm information cannot be decoded until all of the divided data are prepared, it is difficult to obtain information on the failure occurrence state in real time.

本発明は上記の点に着目してなされたもので、警報多発中であっても障害の発生状況をリアルタイムで監視可能なネットワーク監視システムを提供することを目的とする。   The present invention has been made paying attention to the above points, and an object of the present invention is to provide a network monitoring system capable of monitoring the occurrence of a failure in real time even during frequent alarms.

上記の目的を達成するため本発明は、通信ネットワークに接続する複数のネットワーク要素が障害検知時に送出する警報情報を収集する複数の警報情報収集装置と、前記複数の警報情報収集装置で収集された警報情報を基に、前記通信ネットワーク上における障害の発生状況を監視する障害監視装置と、を備えたネットワーク監視システムを提供する。このネットワーク監視システムの一態様は、前記複数の警報情報収集装置から前記障害監視装置に一定量を超える警報情報が通知される警報多発状態にあるか否かを判断する警報判断手段を備える。また、前記複数の警報情報収集装置は、それぞれ、前記警報判断手段で警報多発状態にあると判断されたとき、受信した前記ネットワーク要素からの警報情報に含まれる全ての情報のうちの一部の情報のみを含む集約情報を生成し、該集約情報を前記障害監視装置に通知する。前記障害監視装置は、前記警報判断手段で警報多発状態にあると判断されたとき、前記複数の警報情報収集装置から通知される前記集約情報を用いて、前記通信ネットワーク上における障害の発生状況をリアルタイムで監視する。   In order to achieve the above object, the present invention collects alarm information collected by a plurality of network elements connected to a communication network upon detection of a failure, and collected by the plurality of alarm information collection devices. Provided is a network monitoring system including a failure monitoring device that monitors a failure occurrence state on the communication network based on alarm information. One aspect of the network monitoring system includes an alarm determination unit that determines whether or not there is an alarm frequent occurrence state in which alarm information exceeding a predetermined amount is notified from the plurality of alarm information collection devices to the failure monitoring device. In addition, each of the plurality of alarm information collection devices is a part of all the information included in the received alarm information from the network element when it is determined by the alarm determination means that the alarm is frequently generated. Aggregated information including only information is generated, and the aggregated information is notified to the failure monitoring apparatus. The failure monitoring device uses the aggregate information notified from the plurality of alarm information collection devices when the alarm determination means determines that the alarm is frequently occurring, and indicates the occurrence status of the failure on the communication network. Monitor in real time.

上記のようなネットワーク監視システムによれば、警報多発状態において各警報情報収集装置から障害監視装置に警報の集約情報を通知するようにしたことで、障害監視装置の処理輻輳を招くことなく、通信ネットワーク上における障害の発生状況をリアルタイムで監視することが可能になる。   According to the network monitoring system as described above, it is possible to communicate the alarm monitoring information from the respective alarm information collecting devices to the fault monitoring device in the alarm frequent occurrence state without causing processing congestion of the fault monitoring device. It is possible to monitor the occurrence of a failure on the network in real time.

ネットワーク監視システムの一実施形態の構成を示すブロック図である。It is a block diagram which shows the structure of one Embodiment of a network monitoring system. 上記実施形態におけるEMSサーバの具体的な構成の一例を示す機能ブロック図である。It is a functional block diagram which shows an example of the specific structure of the EMS server in the said embodiment. 上記実施形態におけるNMSサーバの具体的な構成の一例を示す機能ブロック図である。It is a functional block diagram which shows an example of a specific structure of the NMS server in the said embodiment. 上記実施形態において各NEから送出される警報情報(詳細情報)の具体的な一例を示す図である。It is a figure which shows a specific example of the alarm information (detailed information) sent from each NE in the said embodiment. 上記実施形態におけるEMSサーバのデータベースの具体的な一例を示す図である。It is a figure which shows a specific example of the database of the EMS server in the said embodiment. 図4の警報情報(詳細情報)を基に生成される集約情報の具体的な一例を示す図である。It is a figure which shows a specific example of the aggregate information produced | generated based on the alarm information (detailed information) of FIG. 上記実施形態において定常状態に実施される処理の流れを示すシーケンス図である。It is a sequence diagram which shows the flow of the process implemented in a steady state in the said embodiment. 上記実施形態においてNE群から大量の警報情報が送出される警報多発状態に実施される処理の流れを示すシーケンス図である。It is a sequence diagram which shows the flow of the process implemented in the alarm frequent occurrence state in which a large amount of alarm information is transmitted from NE group in the said embodiment. 図8の警報多発状態からの復帰の際に実施される処理の流れを示すシーケンス図である。It is a sequence diagram which shows the flow of the process implemented at the time of the return from the alarm frequent occurrence state of FIG. 上記実施形態における未通知情報の一例を示す図である。It is a figure which shows an example of the unreported information in the said embodiment. 上記実施形態においてNMSサーバへの警報通知が集中する警報多発状態に実施される処理の流れを示すシーケンス図である。It is a sequence diagram which shows the flow of the process implemented in the alarm frequent occurrence state where the alarm notification to an NMS server concentrates in the said embodiment. 図11の警報多発状態からの復帰の際に実施される処理の流れを示すシーケンス図である。It is a sequence diagram which shows the flow of the process implemented at the time of the return from the alarm frequent occurrence state of FIG. 上記実施形態において警報多発状態の解消前に未通知情報の取得要求を行う場合の処理の流れを示すシーケンス図である。It is a sequence diagram which shows the flow of a process in the case of making an acquisition request | requirement of unreported information before cancellation | release of a warning frequent occurrence state in the said embodiment.

以下、本発明の実施形態について添付図面を参照しながら詳細に説明する。
図1は、本発明の一実施形態によるネットワーク監視システムの構成を示すブロック図である。
図1において、ネットワーク監視システム1は、例えば、複数のネットワーク要素(NE)10A,10A,10A,10B,10B,10Bと、予め割り当てられたNE群を管理する複数のエレメント管理系(EMS)20A,20Bと、各EMS20A,20Bから通知される情報を基にネットワーク全体を管理するネットワーク管理系(NMS)30と、を備える。ここでは、各EMS20A,20Bが警報情報収集装置としての機能を持ち、また、NMS30が障害監視装置としての機能を持つ。
Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.
FIG. 1 is a block diagram showing a configuration of a network monitoring system according to an embodiment of the present invention.
In FIG. 1, the network monitoring system 1 includes, for example, a plurality of network elements (NE) 10A 1 , 10A 2 , 10A 3 , 10B 1 , 10B 2 , 10B 3 and a plurality of elements that manage a pre-assigned NE group. Management systems (EMS) 20A and 20B, and a network management system (NMS) 30 that manages the entire network based on information notified from each EMS 20A and 20B. Here, each EMS 20A, 20B has a function as an alarm information collection device, and the NMS 30 has a function as a failure monitoring device.

各NE10A〜10A,10B〜10Bは、例えば、交換機、伝送装置、ルータ、コンピュータ装置等のネットワーク通信機能を備えた周知の機器であり、ここでは、NE10A〜10Aが通信ネットワークNWに接続にされ、NE10B〜10Bが通信ネットワークNWに接続にされている。各NE10A〜10A,10B〜10Bは、各々が接続するネットワーク回線や機器自体に障害が発生すると、該障害の発生状況を示す警報情報を生成し、該警報情報をEMS20A,20Bに送出することが可能である。なお、上記警報情報の具体的な内容については後で詳しく説明する。 Each NE 10A 1 to 10A 3 , 10B 1 to 10B 3 is a well-known device having a network communication function such as an exchange, a transmission device, a router, and a computer device. Here, NE 10A 1 to 10A 3 are communication networks. NW A is connected, and NEs 10B 1 to 10B 3 are connected to the communication network NW B. Each NE 10A 1 to 10A 3 , 10B 1 to 10B 3 generates alarm information indicating the occurrence of the failure when a failure occurs in the network line to which the NE 10A 1 or 10B 1 to 10B 3 is connected, and the alarm information is transmitted to the EMS 20A or 20B. It can be sent out. The specific contents of the alarm information will be described in detail later.

EMS20Aは、例えば、EMSサーバ21A、EMSクライアント22A、通信線23Aおよび記憶装置24Aを備える。EMSサーバ21Aには、通信ネットワークNWに対応したNE群10A(NE10A〜10A)が通信線23Aを介して接続される。このEMSサーバ21Aは、各NE10A〜10Aから送出される警報情報を収集し、該警報情報をデータベースDBに保存すると共に、該警報情報をEMSクライアント22AおよびNMS30に通知する。データベースDBは、通信ネットワークNWおよびNE10A〜10Aの構成情報、並びに、各NE10A〜10Aからの警報情報などを含み、EMSサーバ21Aに内蔵または外部接続された記憶装置24Aに格納される。 The EMS 20A includes, for example, an EMS server 21A, an EMS client 22A, a communication line 23A, and a storage device 24A. The EMS server 21A, NE group 10A corresponding to the communication network NW A (NE10A 1 ~10A 3) is connected via a communication line 23A. The EMS server 21A collects alarm information transmitted from the NEs 10A 1 to 10A 3 , stores the alarm information in the database DB A , and notifies the EMS client 22A and the NMS 30 of the alarm information. Database DB A is stored configuration information of the communication network NW A and NE10A 1 ~10A 3, as well, and the like alarm information from each NE10A 1 ~10A 3, the storage device 24A which is built in or externally connected to the EMS server 21A Is done.

また、EMSサーバ21Aは、NE群10Aから単位時間あたりに受信した警報情報の総数(以下、「警報数」とする)と予め設定した第1閾値とを比較し、警報数が第1閾値を超過している場合に警報多発状態にあることを判断して、各NE10A〜10Aからの警報情報について、障害の発生状況を監視するのに必要最低限度の情報のみを含む集約情報を生成し、該集約情報を当該警報の詳細情報に代えてNMS30に通知する。このとき、EMSサーバ21Aは、各NE10A〜10Aからの警報情報(詳細情報)にそれぞれ対応させて集約通知を示すフラグをデータベースDBに記録する。ここでは、EMSサーバ21Aが警報判断手段としての機能を備える。なお、上記詳細情報の具体的な内容についても後で詳しく説明する。 Further, the EMS server 21A compares the total number of alarm information received per unit time from the NE group 10A (hereinafter referred to as “alarm number”) with a preset first threshold value, and the alarm number is set to the first threshold value. When it is over, it judges that it is in the state of frequent occurrence of alarm, and generates aggregated information that includes only the minimum information necessary to monitor the occurrence of failure for alarm information from each NE 10A 1 to 10A 3 The aggregated information is notified to the NMS 30 instead of the detailed information of the alarm. At this time, the EMS server 21A records a flag indicating the aggregation notification in the database DB A in association with the alarm information (detailed information) from each of the NEs 10A 1 to 10A 3 . Here, the EMS server 21A has a function as alarm determination means. The specific contents of the detailed information will be described in detail later.

EMSクライアント22Aは、通信ネットワークNWおよびNE群10Aの管理を行う管理者によって操作され、該管理者に対してEMSサーバ21Aから通知される警報情報(詳細情報)を表示等により出力する。 EMS client 22A is operated by the administrator to manage the communication network NW A and NE group 10A, and outputs the display such warning information notified from the EMS server 21A (detailed information) with respect to the administrator.

EMS20Bは、上記EMS20Aと同様の構成であり、EMSサーバ21B、EMSクライアント22B、通信線23Bおよび記憶装置24Bを備える。EMSサーバ21Bには、通信線23Bを介してNE群10Bの各NE10B〜10Bがそれぞれ接続されており、該各NE10B〜10Bから送出される警報情報がデータベースDBに保存される。 The EMS 20B has the same configuration as the EMS 20A, and includes an EMS server 21B, an EMS client 22B, a communication line 23B, and a storage device 24B. The EMS server 21B, alarm information via the communication line 23B each NE10B 1 ~10B 3 of NE group 10B are connected respectively, sent from the respective NE10B 1 ~10B 3 is stored in the database DB B .

図2は、上記EMSサーバ21A,21Bの具体的な構成の一例を示す機能ブロック図である。図2に示すEMSサーバ21A,21Bは、NE通信部211、クライアント通信部212、NMS通信部213、制御部214および警報管理部215を有する。NE通信部211は、配下の各NEとの間で所要のプロトコルに従って通信を行うための機能を持つ。クライアント通信部212は、対応するEMSクライアントとの通信を行う。NMS通信部213は、NMS30の後述するNMSサーバ31との通信を行う。制御部214は、配下の各NEおよびNMSサーバ31に対する制御処理を実行する。警報管理部215は、配下の各NEからの警報情報をデータベースに保存し、警報数の第1閾値超過状態(警報多発状態)において集約情報を生成するなどの警報情報に関する管理処理を行う。   FIG. 2 is a functional block diagram showing an example of a specific configuration of the EMS servers 21A and 21B. The EMS servers 21A and 21B illustrated in FIG. 2 include an NE communication unit 211, a client communication unit 212, an NMS communication unit 213, a control unit 214, and an alarm management unit 215. The NE communication unit 211 has a function for performing communication with each subordinate NE according to a required protocol. The client communication unit 212 performs communication with the corresponding EMS client. The NMS communication unit 213 communicates with an NMS server 31 described later of the NMS 30. The control unit 214 executes control processing for each subordinate NE and NMS server 31. The alarm management unit 215 performs management processing related to alarm information such as storing alarm information from each subordinate NE in a database and generating aggregated information when the number of alarms exceeds the first threshold value (alarm frequent occurrence state).

NMS30は、例えば、NMSサーバ31、NMSクライアント32、通信線33および記憶装置34を備える。NMSサーバ31には、各EMSサーバ21A,21Bが通信線33を介して接続される。このNMSサーバ31は、各EMSサーバ21A,21Bから通知される警報情報(詳細情報若しくは集約情報)をデータベースDBに保存すると共に、該警報情報をNMSクライアント32に通知する。データベースDBは、EMS20A,20B配下の通信ネットワークNW,NWおよびNE10A〜10A,10B〜10Bの構成情報、並びに、各EMSサーバ21A,21Bからの警報情報などを含み、NMSサーバ31に内蔵または外部接続された記憶装置34に格納される。 The NMS 30 includes, for example, an NMS server 31, an NMS client 32, a communication line 33, and a storage device 34. The EMS servers 21 </ b> A and 21 </ b> B are connected to the NMS server 31 via the communication line 33. The NMS server 31 stores alarm information (detailed information or aggregated information) notified from each EMS server 21A, 21B in the database DB, and notifies the NMS client 32 of the alarm information. Database DB comprises EMS20A, the communication network NW A subordinate 20B, NW B and NE10A 1 ~10A 3, 10B 1 ~10B 3 configuration information, as well, such as alarm information from the EMS server 21A, 21B, NMS server The data is stored in a storage device 34 built in 31 or connected externally.

また、NMSサーバ31は、各EMSサーバ21A,21Bから単位時間あたりに通知される警報情報の総情報量(以下、「警報情報量」とする)と予め設定した第2閾値とを比較し、警報情報量が第2閾値を超過している場合に警報多発状態にあることを判断して、全てのEMSサーバ21A,21Bに対して警報情報の集約化を要求する。この警報情報の集約化要求は、警報情報量が第2閾値以下になることで解除される。ここでは、NMSサーバ31が警報判断手段としての機能を備える。   Further, the NMS server 31 compares the total information amount of alarm information notified per unit time from each EMS server 21A, 21B (hereinafter referred to as “alarm information amount”) with a preset second threshold value, When the amount of alarm information exceeds the second threshold, it is determined that the alarm is frequently occurring, and all the EMS servers 21A and 21B are requested to aggregate the alarm information. This alarm information aggregation request is canceled when the amount of alarm information falls below the second threshold. Here, the NMS server 31 has a function as alarm determination means.

NMSクライアント32は、ネットワーク全体(通信ネットワークNW,NWおよびNE群10A,10B)の管理を行う管理者によって操作され、該管理者に対してNMSサーバ31から通知される警報情報(詳細情報若しくは集約情報)を表示等により出力する。 The NMS client 32 is operated by an administrator who manages the entire network (communication networks NW A and NW B and NE groups 10A and 10B), and alarm information (detailed information) notified from the NMS server 31 to the administrator. (Or aggregated information) is output by display or the like.

図3は、上記NMSサーバ31の具体的な構成の一例を示す機能ブロック図である。図3に示すNMSサーバ31は、EMS通信部311、クライアント通信部312、制御部313および警報管理部314を有する。EMS通信部311は、各EMSサーバ21A,21Bとの間で所要のプロトコルに従って通信を行うための機能を持つ。クライアント通信部312は、NMSクライアント32との通信を行う。制御部313は、各EMSサーバ21A,21Bに対する制御処理を実行する。警報管理部314は、各EMSサーバ21A,21Bからの警報情報(詳細情報および集約情報)をデータベースに保存し、警報情報量の第2閾値超過状態(警報多発状態)において警報情報の集約化要求を生成するなどの警報情報に関する管理処理を行う。   FIG. 3 is a functional block diagram showing an example of a specific configuration of the NMS server 31. The NMS server 31 illustrated in FIG. 3 includes an EMS communication unit 311, a client communication unit 312, a control unit 313, and an alarm management unit 314. The EMS communication unit 311 has a function for communicating with each of the EMS servers 21A and 21B according to a required protocol. The client communication unit 312 performs communication with the NMS client 32. The control unit 313 executes control processing for the EMS servers 21A and 21B. The alarm management unit 314 stores alarm information (detailed information and aggregated information) from each EMS server 21A, 21B in a database, and requests alarm information to be aggregated when the alarm information amount exceeds the second threshold (alarms frequently occurring). Management processing related to alarm information such as generating

ここで、前述した各NE10A〜10A,10B〜10Bから送出される警報情報について詳しく説明する。
図4は、上記警報情報の具体的な一例を示す図である。図4の例において、警報情報は、識別子、検知時刻、部位A、部位B、重要度、警報種別、警報名称およびその他の情報を含む。識別子は、監視情報がNE10A〜10A,10B〜10BのうちのどのNEから何番目に送出されたものかを識別可能にする情報である。この識別子としては、例えば、NE毎に個別管理された通し番号などを用いることが可能である。検知時刻は、NEが障害の発生を検知した日時を示す。部位Aおよび部位Bは、当該障害の発生場所を特定可能にする情報であり、部位Aのより詳細な場所を部位Bが示す。具体的には、例えば、部位Aが障害の発生した機器を特定可能にする情報、部位Bは該機器内のどのボードで障害が発生したかを特定可能にする情報に該当する。重要度は、発生した障害がネットワークサービスに及ぼす影響の重要度(障害レベル)を示す。警報種別および警報名称は、障害の具体的な事象に応じて事前に分類定義された種別および名称を示す。
Here, alarm information transmitted from each of the above-described NEs 10A 1 to 10A 3 and 10B 1 to 10B 3 will be described in detail.
FIG. 4 is a diagram showing a specific example of the alarm information. In the example of FIG. 4, the alarm information includes an identifier, detection time, part A, part B, importance, alarm type, alarm name, and other information. Identifier is information monitoring information to allow identifying whether NE10A 1 ~10A 3, 10B 1 that is sent to the ordinal number from which NE of ~10B 3. As this identifier, for example, a serial number managed individually for each NE can be used. The detection time indicates the date and time when the NE detects the occurrence of a failure. The part A and the part B are information that makes it possible to specify the location where the failure occurs, and the part B indicates a more detailed place of the part A. Specifically, for example, the part A corresponds to information that can identify a failed device, and the part B corresponds to information that can identify which board in the device has failed. The importance indicates the importance (failure level) of the influence of the generated failure on the network service. The alarm type and the alarm name indicate the type and name that are classified and defined in advance according to the specific event of the failure.

上記のような警報情報は、送出元のNEに対応したEMSサーバ21A,21Bで収集されてデータベースDB,DBに保存される。図5は、上記データベースDB,DBの具体的な一例を示す図である。図5の例のようにデータベースDB,DBには、各NE10A〜10A,10B〜10Bから送出された警報情報に含まれる全ての情報が、EMSサーバ21A,21Bでの受信順に逐次保存されていく。このとき、EMSサーバ21A,21Bで受信される単位時間あたりの警報数が第1閾値を超過していれば、当該警報に対応した集約通知フラグがONに設定される。 The alarm information as described above is collected by the EMS servers 21A and 21B corresponding to the transmission source NE and stored in the databases DB A and DB B. FIG. 5 is a diagram showing a specific example of the databases DB A and DB B. Database DB A as in the example of FIG. 5, the DB B, all the information contained in each NE10A 1 ~10A 3, 10B 1 alarm information sent from ~10B 3 is, EMS server 21A, reception at 21B It is stored sequentially. At this time, if the number of alarms per unit time received by the EMS servers 21A and 21B exceeds the first threshold, the aggregation notification flag corresponding to the alarm is set to ON.

上記警報数の第1閾値超過状態(警報多発状態)においては、各NEからの警報情報を基に集約情報が生成される。図6は、該集約情報の具体的な一例を示している。この例では、各NEからの警報情報に含まれる全ての情報(詳細情報)のうちで、障害の発生状況を監視するのに必要最低限度の集約情報として、識別子、部位Aおよび重要度が抽出されている。この集約情報は、詳細情報に比べて情報量が大幅に削減されている。このため、警報多発時に、該当するEMSサーバが、配下の各NEから収集した警報の詳細情報に代えて集約情報をNMSサーバ31に通知することで、NMSサーバ31での処理輻輳を防止し、かつ、上記集約情報を用いて障害の発生状況をリアルタイムで監視できるようになる。   In the first threshold excess state (alarm frequent occurrence state) of the number of alarms, the aggregate information is generated based on the alarm information from each NE. FIG. 6 shows a specific example of the aggregate information. In this example, out of all information (detailed information) included in the alarm information from each NE, the identifier, the part A, and the importance are extracted as the aggregate information at the minimum level necessary for monitoring the occurrence of the failure. Has been. The amount of information of this aggregate information is greatly reduced compared to detailed information. For this reason, at the time of frequent alarms, the corresponding EMS server notifies the NMS server 31 of aggregate information instead of the detailed information of the alarms collected from each subordinate NE, thereby preventing processing congestion in the NMS server 31; In addition, it becomes possible to monitor the occurrence of a failure in real time using the aggregate information.

次に、上記ネットワーク監視システム1の動作について説明する。
図7は、警報が多発していない定常状態においてネットワーク監視システム1で実施される処理を時間軸に沿って表したシーケンス図である。ここでは、具体的な一例として、EMSサーバ21Aの配下にあるNE10Aが障害の発生を検知して警報情報を送出した場合の一連の処理について詳しく説明することにする。なお、他のNE10A,10A,10B〜10Bが警報情報を送出した場合の動作についてもNE10Aの場合と同様であるため具体的な説明は省略する。
Next, the operation of the network monitoring system 1 will be described.
FIG. 7 is a sequence diagram showing processing performed in the network monitoring system 1 along a time axis in a steady state in which alarms are not frequently generated. Here, as a specific example, a series of processes when the NE 10A 1 under the control of the EMS server 21A detects the occurrence of a failure and transmits alarm information will be described in detail. The specific description is the same as the case of NE10A 1 Operation when other NE10A 2, 10A 3, 10B 1 ~10B 3 raises an alarm information will be omitted.

図7に示すシーケンスにおいて、NE10Aから警報情報が送出されると(図7中のS101)、該NE10Aに通信線23Aを介して接続されたEMSサーバ21Aが、NE10Aからの警報情報を受信する。EMSサーバ21Aでは、受信した警報情報がNE通信部211を介して警報管理部215に与えられ(図2参照)、該警報情報に含まれる全ての詳細情報がデータベースDB(図5参照)に記録される(S102)。また、EMSサーバ21Aの警報管理部215では、NE群10Aから単位時間あたりに受信した警報数が第1閾値を超過しているか否かの判定が行われる(S103)。ここでは警報数の閾値超過なしが判定されることにより定常状態にあることが判断され、NE10Aからの警報情報に含まれる全ての詳細情報が、クライアント通信部212を介してEMSクライアント22Aに通知される(S104)と共に、NMS通信部213を介してNMSサーバ31に通知される(S105)。 In the sequence shown in FIG. 7, when alarm information is sent from the NE 10A 1 (S101 in FIG. 7), the EMS server 21A connected to the NE 10A 1 via the communication line 23A displays the alarm information from the NE 10A 1. Receive. In the EMS server 21A, the received alarm information is given to the alarm management unit 215 via the NE communication unit 211 (see FIG. 2), and all the detailed information included in the alarm information is stored in the database DB A (see FIG. 5). It is recorded (S102). Further, the alarm management unit 215 of the EMS server 21A determines whether or not the number of alarms received per unit time from the NE group 10A exceeds the first threshold (S103). Here, it is determined that the alarm number is not exceeding the threshold value, so that it is in a steady state, and all the detailed information included in the alarm information from the NE 10A 1 is notified to the EMS client 22A via the client communication unit 212. At the same time (S104), the NMS server 31 is notified via the NMS communication unit 213 (S105).

NMSサーバ31では、EMSサーバ21Aから通知される警報の詳細情報が、EMS通信部311を介して警報管理部314に与えられ(図3参照)、該詳細情報がデータベースDBに記録される(S106)。また、NMSサーバ31の警報管理部314では、各EMSサーバ21A,21Bから単位時間あたりに通知される警報情報量が第2閾値を超過しているか否かの判定が行われる(S107)。ここでは警報情報量の閾値超過なしが判定されることにより定常状態にあることが判断され、EMSサーバ21Aからの警報の詳細情報が、クライアント通信部312を介してNMSクライアント32に通知される(S108)。NMSクライアント32では、NMSサーバ31から通知される警報の詳細情報がモニタ画面等に表示出力され(S109)、ネットワーク全体の管理者が当該出力情報を確認することにより、ネットワーク上での障害の発生状況がリアルタイムで監視される。   In the NMS server 31, detailed information on the alarm notified from the EMS server 21A is given to the alarm management unit 314 via the EMS communication unit 311 (see FIG. 3), and the detailed information is recorded in the database DB (S106). ). Further, the alarm management unit 314 of the NMS server 31 determines whether or not the alarm information amount notified per unit time from each EMS server 21A, 21B exceeds the second threshold (S107). Here, it is determined that the alarm information amount is not exceeding the threshold value, so that it is in a steady state, and detailed information of the alarm from the EMS server 21A is notified to the NMS client 32 via the client communication unit 312 ( S108). In the NMS client 32, detailed information of the alarm notified from the NMS server 31 is displayed and output on a monitor screen or the like (S109), and the administrator of the entire network confirms the output information, so that a failure on the network occurs. The situation is monitored in real time.

続いて、NE群10Aから大量の警報情報が送出される警報多発状態での動作について説明する。図8は、上記警報多発状態においてネットワーク監視システム1で実施される処理の流れを示すシーケンス図である。   Next, the operation in the alarm frequent occurrence state in which a large amount of alarm information is transmitted from the NE group 10A will be described. FIG. 8 is a sequence diagram showing a flow of processing performed in the network monitoring system 1 in the alarm frequent occurrence state.

図8のシーケンスにおいて、前述した定常状態における具体的な一例と同様に、NE10Aから警報情報が送出されると(図8中のS201)、EMSサーバ21Aの警報管理部215により、該NE10Aからの警報情報に含まれる全ての詳細情報がデータベースDBに記録される(S202)と共に、NE群10Aから単位時間あたりに受信した警報数が第1閾値を超過しているか否かの判定が行われる(S203)。ここでは警報数の閾値超過ありが判定されることにより警報多発状態にあることが判断され、上記NE10Aからの警報情報について集約情報(図6参照)が生成され、上記データベースDBの該当する警報情報に対応した集約通知フラグがONに設定される(S204)。そして、EMSクライアント22Aに対しては、NE10Aからの警報の詳細情報がクライアント通信部212を介して通知され(S205)、NMSサーバ31に対しては、NE10Aからの警報の集約情報がNMS通信部213を介して通知される(S206)。 In the sequence of FIG. 8, similarly to the specific example in the steady state as described above, when the alarm information is sent from NE10A 1 (S201 in FIG. 8), the alarm management unit 215 of the EMS server 21A, the NE10A 1 All the detailed information included in the alarm information from is recorded in the database DB A (S202), and whether or not the number of alarms received from the NE group 10A per unit time exceeds the first threshold is determined. Performed (S203). Here, it is determined that there is an alarm frequent occurrence state by determining that the number of alarms exceeds the threshold value, and aggregated information (see FIG. 6) is generated for the alarm information from the NE 10A 1 and corresponds to the database DB A. The aggregation notification flag corresponding to the alarm information is set to ON (S204). The detailed information of the alarm from the NE 10A 1 is notified to the EMS client 22A via the client communication unit 212 (S205), and the aggregate information of the alarm from the NE 10A 1 is transmitted to the NMS server 31. Notification is made via the communication unit 213 (S206).

NMSサーバ31では、EMSサーバ21Aから通知される警報の集約情報が、EMS通信部311を介して警報管理部314に与えられ、該集約情報がデータベースDBに記録される(S207)と共に、各EMSサーバ21A,21Bから単位時間あたりに通知される警報情報量が第2閾値を超過しているか否かの判定が行われる(S208)。ここでは、NE群10Aが警報多発状態にあるものの、EMSサーバ21AからNMSサーバ31には、警報の詳細情報に比べて情報量が大幅に削減された集約情報が通知されるため、警報情報量の閾値超過なしが判定される。そして、EMSサーバ21Aからの警報の集約情報が、クライアント通信部312を介してNMSクライアント32に通知され(S209)、該NMSクライアント32のモニタ画面等に表示出力される(S210)。ネットワーク全体の管理者は、当該出力情報により、ネットワーク上での障害の発生状況を監視するのに最低限必要な情報(識別子、部位Aおよび重要度)を取得することができるため、警報多発時であっても障害の発生状況をリアルタイムで監視することが可能である。   In the NMS server 31, the alarm aggregation information notified from the EMS server 21A is given to the alarm management unit 314 via the EMS communication unit 311 and the aggregation information is recorded in the database DB (S207) and each EMS. It is determined whether or not the alarm information amount notified per unit time from the servers 21A and 21B exceeds the second threshold (S208). Here, although the NE group 10A is in an alarm-prone state, the EMS server 21A is notified from the EMS server 21A to the NMS server 31 of the aggregate information in which the information amount is significantly reduced compared to the detailed information of the alarm. It is determined that the threshold value is not exceeded. Then, the alarm aggregation information from the EMS server 21A is notified to the NMS client 32 via the client communication unit 312 (S209), and is displayed and output on the monitor screen of the NMS client 32 (S210). Since the administrator of the entire network can acquire the minimum information (identifier, part A, and importance) necessary to monitor the occurrence of a failure on the network from the output information, when an alarm occurs frequently Even so, it is possible to monitor the occurrence of a failure in real time.

続いて、NE群10Aの警報多発状態が解消されて定常状態に復帰するときの動作について説明する。図9は、上記警報多発状態からの復帰の際にネットワーク監視システム1で実施される処理の流れを示すシーケンス図である。   Next, an operation when the frequent alarm state of the NE group 10A is canceled and the state returns to the steady state will be described. FIG. 9 is a sequence diagram showing a flow of processing performed in the network monitoring system 1 when returning from the alarm frequent occurrence state.

図9のシーケンスにおいて、EMSサーバ21Aでは、前述した図8のS203で警報数の閾値超過ありが判定された後、所要の時間周期で閾値超過判定が繰り返し行われる。そして、NE群10Aの警報多発状態が解消され、EMSサーバ21Aの警報管理部215において警報数の閾値超過なしが判定されると(図9中のS301)、警報管理部215によりデータベースDBが参照され、集約通知フラグがONに設定されている警報情報(詳細情報)が取得された後に、該集約通知フラグの設定がONからOFFに切り替えられる(S302)。そして、取得された詳細情報より、警報多発時にNMSサーバ31へ未通知であった情報が抽出され、該抽出情報が該当する識別子と一緒に未通知情報として、NMS通信部213を介してNMSサーバ31に通知される(S303)。図10は、上記未通知情報の一例を示している。この例では、識別子、検知時刻、部位B、警報種別、警報名称およびその他の情報が、未通知情報に該当している。 In the sequence of FIG. 9, the EMS server 21 </ b> A repeatedly performs the threshold excess determination in a required time period after it is determined in S <b> 203 of FIG. 8 that the number of alarms exceeds the threshold. When the alarm frequent occurrence state of the NE group 10A is resolved and the alarm management unit 215 of the EMS server 21A determines that the threshold number of alarms has not been exceeded (S301 in FIG. 9), the database DB A is created by the alarm management unit 215. After the alarm information (detailed information) that is referred to and the aggregation notification flag is set to ON is acquired, the setting of the aggregation notification flag is switched from ON to OFF (S302). Then, information that has not been notified to the NMS server 31 at the time of frequent alarms is extracted from the acquired detailed information, and the extracted information together with the corresponding identifier as unnotified information is sent via the NMS communication unit 213 to the NMS server. 31 is notified (S303). FIG. 10 shows an example of the unreported information. In this example, the identifier, detection time, part B, alarm type, alarm name, and other information correspond to unreported information.

NMSサーバ31では、EMSサーバ21Aからの未通知情報がEMS通信部311を介して警報管理部314に与えられ、該未通知情報がデータベースDBの該当する警報情報(集約情報)に追記される(S304)。そして、該未通知情報が追記された警報の詳細情報が、クライアント通信部312を介してNMSクライアント32に通知され(S305)、該NMSクライアント32のモニタ画面等に表示出力される(S306)。ネットワーク全体の管理者は、当該出力情報により、NE群10Aの警報多発時に発生していた障害のより具体的な状況を確認することができる。   In the NMS server 31, unreported information from the EMS server 21A is given to the alarm management unit 314 via the EMS communication unit 311 and the unreported information is added to the corresponding alarm information (aggregated information) in the database DB ( S304). Then, the detailed information of the alarm to which the unreported information is added is notified to the NMS client 32 via the client communication unit 312 (S305), and is displayed and output on the monitor screen of the NMS client 32 (S306). The administrator of the entire network can confirm the more specific situation of the failure that occurred when the alarm frequently occurred in the NE group 10A by the output information.

次に、各EMSサーバ21A,21BからNMSサーバ31に通知される警報情報が集中して警報情報量が第2閾値を超過するような警報多発状態での動作について説明する。図11は、上記警報多発状態においてネットワーク監視システム1で実施される処理の流れを示すシーケンス図である。   Next, the operation in the alarm occurrence state where alarm information notified from each EMS server 21A, 21B to the NMS server 31 is concentrated and the alarm information amount exceeds the second threshold will be described. FIG. 11 is a sequence diagram showing a flow of processing performed in the network monitoring system 1 in the alarm frequent occurrence state.

図11のシーケンスにおいて、任意のNE(ここでも前述した定常状態における具体的な一例と同様にNE10Aを想定して説明を行う)から警報情報が送出されると(図11中のS401)、EMSサーバ21Aの警報管理部215により、該NE10Aからの警報情報に含まれる全ての詳細情報がデータベースDBに記録される(S402)と共に、NE群10Aから単位時間あたりに受信した警報数が第1閾値を超過しているか否かの判定が行われる(S403)。ここでは警報数の閾値超過なしが判定されることにより、NE10Aからの警報情報に含まれる全ての詳細情報が、クライアント通信部212を介してEMSクライアント22Aに通知される(S404)と共に、NMS通信部213を介してNMSサーバ31に通知される(S405)。 In the sequence of FIG. 11, when the alarm information is sent from any NE (a description assumes Similarly the NE10A 1 and specific example in the steady state as described above here) (S401 in FIG. 11), The alarm management unit 215 of the EMS server 21A records all the detailed information included in the alarm information from the NE 10A 1 in the database DB A (S402), and the number of alarms received from the NE group 10A per unit time is It is determined whether or not the first threshold is exceeded (S403). Here, when it is determined that the number of alarms does not exceed the threshold, all the detailed information included in the alarm information from the NE 10A 1 is notified to the EMS client 22A via the client communication unit 212 (S404) and NMS The NMS server 31 is notified via the communication unit 213 (S405).

NMSサーバ31では、EMSサーバ21Aから通知される警報の詳細情報が、EMS通信部311を介して警報管理部314に与えられ、該詳細情報がデータベースDBに記録される(S406)と共に、各EMSサーバ21A,21Bから単位時間あたりに通知される警報情報量が第2閾値を超過しているか否かの判定が行われる(S407)。ここでは、各EMSサーバ21A,21Bからの警報情報(詳細情報)の通知が集中することにより、警報情報量の閾値超過ありが判定される。この場合、今回EMSサーバ21Aから通知された警報情報(詳細情報)は、クライアント通信部312を介してNMSクライアント32に通知され(S408)、該NMSクライアント32のモニタ画面等に表示出力される(S409)。   In the NMS server 31, detailed information on the alarm notified from the EMS server 21A is given to the alarm management unit 314 via the EMS communication unit 311, and the detailed information is recorded in the database DB (S406), and each EMS It is determined whether or not the alarm information amount notified per unit time from the servers 21A and 21B exceeds the second threshold (S407). Here, the alarm information amount threshold is determined to be exceeded by the concentration of the notification of alarm information (detailed information) from the EMS servers 21A and 21B. In this case, the alarm information (detailed information) notified from the EMS server 21A this time is notified to the NMS client 32 via the client communication unit 312 (S408), and is displayed and output on the monitor screen of the NMS client 32 ( S409).

そして、NMSサーバ31では、警報管理部314における警報情報量の閾値超過ありの判定を受けて、制御部313(図3参照)が、各EMSサーバ21A,21Bに対して警報情報の集約化を要求する(S410)。この警報情報の集約化要求は、NMSサーバ31のEMS通信311および通信線33を介して各EMSサーバ21A,21Bで受信される。各EMSサーバ21A,21Bでは、NMSサーバ31からの警報情報の集約化要求が、NMS通信部213を介して制御部214および警報管理部215(図2参照)に伝達される。そして、該警報情報の集約化要求を受けた後に、EMSサーバが配下のNEからの警報情報を受信すると(S411)、該警報情報に含まれる全ての詳細情報がデータベースに記録される(S412)。また、上記NEからの警報情報を受信したEMSサーバの警報管理部215では、NMSサーバ31からの集約化要求に応じて、受信した警報情報について集約情報が生成され、上記データベースの該当する警報情報に対応した集約通知フラグがONに設定される(S413)。そして、EMSクライアントに対しては、NEからの警報の詳細情報がクライアント通信部212を介して通知され(S414)、NMSサーバ31に対しては、NEからの警報の集約情報がNMS通信部213を介して通知される(S415)。これにより、EMSサーバからNMSサーバ31には、警報の詳細情報に比べて情報量が大幅に削減された集約情報が通知されるため、警報通知が集中してもNMSサーバ31の処理能力を超える輻輳状態が回避される。   The NMS server 31 receives the judgment that the alarm information amount exceeds the threshold value in the alarm management unit 314, and the control unit 313 (see FIG. 3) aggregates the alarm information for the EMS servers 21A and 21B. A request is made (S410). This alarm information aggregation request is received by the EMS servers 21A and 21B via the EMS communication 311 and the communication line 33 of the NMS server 31. In each EMS server 21A, 21B, an alarm information aggregation request from the NMS server 31 is transmitted to the control unit 214 and the alarm management unit 215 (see FIG. 2) via the NMS communication unit 213. Then, after receiving the alarm information aggregation request, when the EMS server receives the alarm information from the subordinate NE (S411), all the detailed information included in the alarm information is recorded in the database (S412). . The alarm management unit 215 of the EMS server that has received the alarm information from the NE generates aggregate information for the received alarm information in response to the aggregation request from the NMS server 31, and the corresponding alarm information in the database. Is set to ON (S413). The detailed information of the alarm from the NE is notified to the EMS client via the client communication unit 212 (S414), and the aggregated information of the alarm from the NE is transmitted to the NMS server 31 to the NMS communication unit 213. (S415). As a result, the EMS server notifies the NMS server 31 of the aggregated information whose amount of information is significantly reduced compared to the detailed information of the alarm, and thus exceeds the processing capability of the NMS server 31 even if the alarm notification is concentrated. Congestion is avoided.

NMSサーバ31では、EMSサーバから通知される警報の集約情報が、EMS通信部311を介して警報管理部314に与えられ、該集約情報がデータベースDBに記録される(S416)と共に、該集約情報がクライアント通信部312を介してNMSクライアント32に通知され(S417)、該NMSクライアント32のモニタ画面等に表示出力される(S418)。ネットワーク全体の管理者は、当該出力情報により、ネットワーク上での障害の発生状況を監視するのに最低限必要な情報(識別子、部位Aおよび重要度)を取得することができるため、警報多発時であっても障害発生状況のリアルタイム監視を行うことが可能である。   In the NMS server 31, the alarm aggregation information notified from the EMS server is given to the alarm management unit 314 via the EMS communication unit 311 and the aggregation information is recorded in the database DB (S416), and the aggregation information Is notified to the NMS client 32 via the client communication unit 312 (S417) and displayed on the monitor screen of the NMS client 32 (S418). Since the administrator of the entire network can acquire the minimum information (identifier, part A, and importance) necessary to monitor the occurrence of a failure on the network from the output information, when an alarm occurs frequently Even so, it is possible to perform real-time monitoring of the failure occurrence status.

続いて、各EMSサーバ21A,21BからNMSサーバ31への警報通知の集中が解消されて定常状態に復帰するときの動作について説明する。図12は、上記復帰の際にネットワーク監視システム1で実施される処理の流れを示すシーケンス図である。   Subsequently, an operation when the concentration of alarm notifications from each EMS server 21A, 21B to the NMS server 31 is canceled and the steady state is restored will be described. FIG. 12 is a sequence diagram showing a flow of processing performed in the network monitoring system 1 at the time of the return.

図12のシーケンスにおいて、NMSサーバ31では、前述した図11のS407で警報情報量の閾値超過ありが判定された後、所要の時間周期で閾値超過判定が繰り返し行われる。そして、各EMSサーバ21A,21Bからの警報通知の集中が解消され、NMSサーバ31の警報管理部314において警報情報量の閾値超過なしが判定されると(図12中のS501)、その判定結果を受けた制御部313が、各EMSサーバ21A,21Bに対して警報情報の集約化解除を要求する(S502)。この警報情報の集約化解除要求は、NMSサーバ31のEMS通信311および通信線33を介して各EMSサーバ21A,21Bで受信される。各EMSサーバ21A,21Bでは、制御部214によりデータベースDB,DBが参照され、集約通知フラグがONに設定されている警報情報(詳細情報)が取得された後に、該集約通知フラグの設定がONからOFFに切り替えられる(S503)。そして、取得された詳細情報より、警報多発時にNMSサーバ31へ未通知であった情報が抽出され、該抽出情報が該当する識別子と一緒に未通知情報(図10参照)として、NMS通信部213を介してNMSサーバ31に応答通知される(S504)。 In the sequence of FIG. 12, the NMS server 31 repeatedly performs the threshold excess determination at a required time period after it is determined in S407 of FIG. Then, when the concentration of alarm notifications from the EMS servers 21A and 21B is canceled and the alarm management unit 314 of the NMS server 31 determines that the alarm information amount does not exceed the threshold (S501 in FIG. 12), the determination result The control unit 313 that has received the request requests the EMS servers 21A and 21B to cancel alarm information aggregation (S502). This alarm information aggregation release request is received by each EMS server 21A, 21B via the EMS communication 311 and the communication line 33 of the NMS server 31. In each EMS server 21A, 21B, the database DB A , DB B is referred to by the control unit 214, and after the alarm information (detailed information) with the aggregation notification flag set to ON is acquired, the aggregation notification flag is set. Is switched from ON to OFF (S503). Then, from the acquired detailed information, information that has not been notified to the NMS server 31 at the time of frequent alarms is extracted, and the extracted information together with the corresponding identifier is used as unnotified information (see FIG. 10) as the NMS communication unit 213. The NMS server 31 is notified of the response via (step S504).

NMSサーバ31では、EMSサーバからの未通知情報がEMS通信部311を介して警報管理部314に与えられ、該未通知情報がデータベースDBの該当する警報情報(集約情報)に追記される(S505)。そして、該未通知情報が追記された警報の詳細情報が、クライアント通信部312を介してNMSクライアント32に通知され(S506)、該NMSクライアント32のモニタ画面等に表示出力される(S507)。ネットワーク全体の管理者は、当該出力情報により、各EMSサーバ21A,21Bからの警報通知の集中時に発生していた障害のより具体的な状況を確認することができる。   In the NMS server 31, unreported information from the EMS server is given to the alarm management unit 314 via the EMS communication unit 311, and the unreported information is added to the corresponding alarm information (aggregated information) in the database DB (S505). ). Then, the detailed information of the alarm to which the unreported information is added is notified to the NMS client 32 via the client communication unit 312 (S506), and is displayed and output on the monitor screen of the NMS client 32 (S507). The administrator of the entire network can confirm a more specific situation of the failure that has occurred at the time of concentration of the alarm notifications from the EMS servers 21A and 21B by the output information.

上述の図9および図12に示したシーケンスでは、警報多発状態におけるNMSサーバ31へ未通知情報が、警報多発状態の解消を待ってNMSサーバ31に通知される例を説明したが、警報多発状態が解消される前に管理者が障害の具体的な状況を知りたい場合、管理者がNMSクライアント32を操作して、集約情報が表示出力されている警報に関する未通知情報の取得を要求するようにしてもよい。図13は、警報多発状態の解消前に未通知情報の取得要求を行う場合にネットワーク監視システム1で実施される処理の流れを示すシーケンス図である。   In the sequence shown in FIG. 9 and FIG. 12 described above, an example in which unreported information to the NMS server 31 in the alarm frequent occurrence state is notified to the NMS server 31 after the alarm frequent occurrence state is resolved is described. If the administrator wants to know the specific situation of the failure before the problem is resolved, the administrator operates the NMS client 32 to request acquisition of unreported information regarding the alarm on which the aggregated information is displayed and output. It may be. FIG. 13 is a sequence diagram showing a flow of processing performed in the network monitoring system 1 when a request for acquisition of unreported information is made before cancellation of the alarm frequent occurrence state.

図13のシーケンスにおいて、NMSクライアント32では、NMSサーバ31から通知された警報の集約情報の表示出力が行われており(図13中のS601)、当該出力情報を確認した管理者がNMSクライアント32を操作することにより、上記警報に関する未通知情報の取得要求を実行する(S602)。このとき、取得対象の警報情報を一意に特定するために、集約情報に含まれる識別子を利用して取得要求が行われる。上記未通知情報の取得要求は、NMSクライアント32からNMSサーバ31のクライアント通信部312を介して制御部313に伝達される(S603)。   In the sequence of FIG. 13, the NMS client 32 displays and outputs the alarm aggregation information notified from the NMS server 31 (S <b> 601 in FIG. 13), and the administrator who has confirmed the output information displays the NMS client 32. To execute an acquisition request for unreported information related to the alarm (S602). At this time, in order to uniquely identify the alarm information to be acquired, an acquisition request is made using an identifier included in the aggregate information. The unreported information acquisition request is transmitted from the NMS client 32 to the control unit 313 via the client communication unit 312 of the NMS server 31 (S603).

NMSサーバ31の制御部313では、NMSクライアント32からの未通知情報の取得要求を受けて、該当するEMSサーバに対して未通知情報の取得要求を転送する処理が行われる。EMSサーバでは、NMSクライアント32から転送されてきた未通知情報の取得要求がNMS通信部213を介して制御部214で受信される。制御部214では、該未通知情報の取得要求に含まれる識別子を基に、データベースDB(若しくはDB)から該当する警報の詳細情報が取得された後に、該警報に対応する集約通知フラグの設定がONからOFFに切り替えられる(S604)。そして、取得された詳細情報より抽出した未通知情報がNMS通信部213を介してNMSサーバ31に応答通知される(S605)。 The control unit 313 of the NMS server 31 receives an unnotified information acquisition request from the NMS client 32 and performs a process of transferring the unnotified information acquisition request to the corresponding EMS server. In the EMS server, the control unit 214 receives the unreported information acquisition request transferred from the NMS client 32 via the NMS communication unit 213. Based on the identifier included in the unreported information acquisition request, the control unit 214 acquires detailed information on the corresponding alarm from the database DB A (or DB B ), and then sets the aggregate notification flag corresponding to the alarm. The setting is switched from ON to OFF (S604). Then, unnotified information extracted from the acquired detailed information is notified to the NMS server 31 through the NMS communication unit 213 (S605).

NMSサーバ31では、EMSサーバからの未通知情報がEMS通信部311を介して警報管理部314に与えられ、該未通知情報がデータベースDBの該当する警報情報(集約情報)に追記される(S606)。そして、該未通知情報が追記された警報の詳細情報が、クライアント通信部312を介してNMSクライアント32に通知され(S607)、該NMSクライアント32のモニタ画面等に表示出力される(S608)。ネットワーク全体の管理者は、当該出力情報により、警報多発状態の解消前であっても自身が知りたい障害の具体的な発生状況を確認することができる。   In the NMS server 31, unreported information from the EMS server is given to the alarm management unit 314 via the EMS communication unit 311, and the unreported information is added to the corresponding alarm information (aggregated information) in the database DB (S606). ). Then, the detailed information of the alarm to which the unreported information is added is notified to the NMS client 32 via the client communication unit 312 (S607), and is displayed and output on the monitor screen of the NMS client 32 (S608). The administrator of the entire network can confirm the specific occurrence status of the fault that he / she wants to know even before the occurrence of the alarm frequent occurrence state by the output information.

上述したように本実施形態のネットワーク監視システム1によれば、警報多発状態に各EMSサーバ21A,21BからNMSサーバ31に通知する警報情報を、障害の発生状況を監視するのに必要最低限度の情報のみを含む集約情報としたことにより、NMSサーバ31の処理輻輳を招くことなく、障害の発生状況をリアルタイムで監視することが可能になる。このようなネットワーク監視システム1は、NMSサーバ31の処理能力を高めるために冗長構成を採用する必要もないので、簡略で低コストのシステム構成により実現することができる。   As described above, according to the network monitoring system 1 of the present embodiment, the alarm information to be notified from the EMS servers 21A and 21B to the NMS server 31 in the alarm frequent occurrence state is the minimum necessary to monitor the failure occurrence status. By using aggregated information including only information, it is possible to monitor the occurrence of a failure in real time without causing processing congestion of the NMS server 31. Such a network monitoring system 1 does not need to adopt a redundant configuration in order to increase the processing capability of the NMS server 31, and thus can be realized with a simple and low-cost system configuration.

なお、上述した実施形態では、1つのEMSサーバの配下に3台のNEが接続され、2つのEMSサーバで収集された警報情報がNMSサーバに通知される構成例を説明したが、1つのEMSサーバに接続されるNEの台数やEMSサーバの設置数は任意に設定することが可能である。また、各NEから送出される警報情報に含まれる全ての詳細情報のうち、識別子、部位Aおよび重要度を集約情報とする一例を示したが、本発明における集約情報は上記の一例に限定されるものではなく、警報多発時にNMSサーバへ通知される警報情報量を考慮し、障害の発生状況を監視するのに必要な最低限の情報を適宜に選択して集約情報を生成することが可能である。   In the above-described embodiment, a configuration example has been described in which three NEs are connected to one EMS server, and alarm information collected by the two EMS servers is notified to the NMS server. The number of NEs connected to the server and the number of installed EMS servers can be arbitrarily set. In addition, although an example in which the identifier, the part A, and the importance are aggregated information among all the detailed information included in the alarm information transmitted from each NE is shown, the aggregated information in the present invention is limited to the above example. Considering the amount of alarm information notified to the NMS server when an alarm occurs frequently, it is possible to generate aggregate information by selecting the minimum information necessary to monitor the occurrence of a failure as appropriate. It is.

以上の実施形態に関して、さらに以下の付記を開示する。   Regarding the above embodiment, the following additional notes are disclosed.

(付記1) 通信ネットワークに接続する複数のネットワーク要素が障害検知時に送出する警報情報を収集する複数の警報情報収集装置と、
前記複数の警報情報収集装置で収集された警報情報を基に、前記通信ネットワーク上における障害の発生状況を監視する障害監視装置と、を備えたネットワーク監視システムであって、
前記複数の警報情報収集装置から前記障害監視装置に一定量を超える警報情報が通知される警報多発状態にあるか否かを判断する警報判断手段を備え、
前記複数の警報情報収集装置は、それぞれ、前記警報判断手段で警報多発状態にあると判断されたとき、受信した前記ネットワーク要素からの警報情報に含まれる全ての情報のうちの一部の情報のみを含む集約情報を生成し、該集約情報を前記障害監視装置に通知し、
前記障害監視装置は、前記警報判断手段で警報多発状態にあると判断されたとき、前記複数の警報情報収集装置から通知される前記集約情報を用いて、前記通信ネットワーク上における障害の発生状況をリアルタイムで監視することを特徴とするネットワーク監視システム。
(Supplementary note 1) A plurality of alarm information collecting devices for collecting alarm information transmitted when a plurality of network elements connected to a communication network detect a failure;
A network monitoring system comprising a failure monitoring device that monitors the occurrence of a failure on the communication network based on the warning information collected by the plurality of warning information collection devices,
Comprising a warning judgment means for judging whether or not the fault monitoring apparatus is in a state of frequent occurrence of alarms in which warning information exceeding a certain amount is notified from the plurality of warning information collecting devices to the fault monitoring device;
Each of the plurality of alarm information collection devices is only a part of all information included in the received alarm information from the network element when the alarm determination unit determines that the alarm is frequently generated. Is generated, and the failure monitoring device is notified of the aggregate information,
The failure monitoring device uses the aggregate information notified from the plurality of alarm information collection devices when the alarm determination means determines that the alarm is frequently occurring, and indicates the occurrence status of the failure on the communication network. A network monitoring system characterized by real-time monitoring.

(付記2) 付記1に記載のネットワーク監視システムであって、
前記警報判断手段は、前記複数の警報情報収集装置のいずれかにおいて、単位時間あたりに受信される前記ネットワーク要素からの警報情報の総数が第1閾値を超過しているときに警報多発状態にあると判断することを特徴とするネットワーク監視システム。
(Supplementary note 2) The network monitoring system according to supplementary note 1, wherein
The alarm determination means is in an alarm frequent state when the total number of alarm information received from the network element per unit time exceeds a first threshold in any one of the plurality of alarm information collection devices. A network monitoring system characterized in that

(付記3) 付記2に記載のネットワーク監視システムであって、
前記複数の警報情報収集装置は、それぞれ、受信した前記ネットワーク要素からの警報情報に含まれる全ての情報をデータベースに保存し、前記警報判断手段で警報多発状態にあると判断されて前記集約情報を前記障害監視装置に通知するとき、前記データベースの該当する警報情報に対応させて集約通知フラグを記録し、その後に前記警報判断手段で警報多発状態にないと判断されたとき、前記データベースの前記集約通知フラグが記録された警報情報について、該警報情報に含まれる全ての情報のうちの前記集約情報以外の未通知情報を前記障害監視装置に通知することを特徴とするネットワーク監視システム。
(Supplementary note 3) The network monitoring system according to supplementary note 2, wherein
Each of the plurality of alarm information collection devices stores all the information included in the received alarm information from the network element in a database, and determines that the alarm determination unit is in an alarm-prone state and outputs the aggregated information. When notifying the failure monitoring device, an aggregation notification flag is recorded in correspondence with the corresponding alarm information in the database, and when it is determined by the alarm determination means that the alarm is not frequently generated, the aggregation of the database is performed. A network monitoring system characterized by notifying the fault monitoring device of unreported information other than the aggregated information among all information included in the alarm information for alarm information in which a notification flag is recorded.

(付記4) 付記1〜3のいずれか1つに記載のネットワーク監視システムであって、
前記警報判断手段は、前記障害監視装置において、前記複数の警報情報収集装置から単位時間あたりに通知される警報情報の総情報量が第2閾値を超過しているときに警報多発状態にあると判断することを特徴とするネットワーク監視システム。
(Supplementary note 4) The network monitoring system according to any one of supplementary notes 1 to 3,
In the failure monitoring apparatus, the alarm determination means is in an alarm-prone state when a total information amount of alarm information notified per unit time from the plurality of alarm information collection devices exceeds a second threshold. A network monitoring system characterized by judging.

(付記5) 付記4に記載のネットワーク監視システムであって、
前記障害監視装置は、前記警報判断手段で警報多発状態にあると判断されたとき、前記複数の警報情報収集装置に対して、前記障害監視装置に通知する警報情報の集約化を要求し、その後に前記警報判断手段で警報多発状態にないと判断されたとき、前記複数の警報情報収集装置に対して、前記障害監視装置に通知する警報情報の集約化解除を要求し、
前記複数の警報情報収集装置は、それぞれ、受信した前記ネットワーク要素からの警報情報に含まれる全ての情報をデータベースに保存し、前記障害監視装置からの前記警報情報の集約化の要求を受けて、前記集約情報を前記障害監視装置に応答通知し、かつ、前記データベースの該当する警報情報に対応させて集約通知フラグを記録し、その後に前記障害監視装置からの前記警報情報の集約化解除の要求を受けて、前記データベースの前記集約通知フラグが記録された警報情報について、該警報情報に含まれる全ての情報のうちの前記集約情報以外の未通知情報を前記障害監視装置に応答通知することを特徴とするネットワーク監視システム。
(Supplementary note 5) The network monitoring system according to supplementary note 4, wherein
The fault monitoring device requests the alarm information collection device to aggregate alarm information to be notified to the fault monitoring device when the alarm determination means determines that the alarm is frequently occurring, and thereafter When the alarm determination means determines that the alarm is not frequently generated, the alarm information collection device is requested to cancel the centralization of alarm information to be notified to the failure monitoring device,
Each of the plurality of alarm information collection devices stores all information included in the received alarm information from the network element in a database, and receives a request for aggregation of the alarm information from the failure monitoring device, The aggregated information is notified to the failure monitoring apparatus in response, and an aggregation notification flag is recorded corresponding to the corresponding alarm information in the database, and then the alarm information aggregation request from the failure monitoring apparatus is issued. In response to the alarm information in which the aggregation notification flag of the database is recorded, the failure monitoring device is notified of unreported information other than the aggregate information among all information included in the alarm information. A featured network monitoring system.

(付記6) 付記1〜5のいずれか1つに記載のネットワーク監視システムであって、
前記障害監視装置は、前記複数の警報情報収集装置から前記集約情報が通知されているとき、前記複数の警報情報収集装置に対して、前記集約情報以外の未通知情報の取得を要求し、
前記複数の警報情報収集装置は、前記障害監視装置からの前記未通知情報の取得の要求を受けて、前記集約情報以外の未通知情報を前記障害監視装置に応答通知することを特徴とするネットワーク監視システム。
(Supplementary note 6) The network monitoring system according to any one of supplementary notes 1 to 5,
When the aggregate information is notified from the plurality of alarm information collection devices, the failure monitoring device requests the plurality of alarm information collection devices to acquire unreported information other than the aggregate information,
The plurality of alarm information collection devices receive a request for acquisition of the unreported information from the failure monitoring device, and notify the failure monitoring device of unreported information other than the aggregated information. Monitoring system.

(付記7) 付記1〜6のいずれか1つに記載のネットワーク監視システムであって、
前記複数のネットワーク要素は、障害検知時に、警報の識別子、種別および名称、並びに、障害の検知時刻、発生部位および重要度に関する情報を含んだ警報情報を送出し、
前記複数の警報情報収集装置は、前記複数のネットワーク要素から送出される前記警報情報に含まれる全ての情報のうち、警報の識別子、並びに、障害の発生部位および重要度に関する情報のみを含んだ集約情報を生成することを特徴とするネットワーク監視システム。
(Supplementary note 7) The network monitoring system according to any one of supplementary notes 1 to 6,
The plurality of network elements, when a failure is detected, send out alarm information including information on the alarm identifier, type and name, and the detection time, occurrence location, and importance of the failure,
The plurality of alarm information collecting devices are aggregates including only information relating to an alarm identifier, a fault occurrence site, and an importance among all information included in the alarm information transmitted from the plurality of network elements. A network monitoring system characterized by generating information.

1…ネットワーク監視システム
10A〜10A,10B〜10B…ネットワーク要素(NE)
10A,10B…NE群
20A,20B…エレメント管理系(EMS)
21A,21B…EMSサーバ
22A,22B…EMSクライアント
23A,23B,33…通信線
24A,24B,34…記憶装置
30…ネットワーク管理系(NMS)
31…NMSサーバ
32…NMSクライアント
211…NE通信部
212,312…クライアント通信部
213…NMS通信部
214,313…制御部
215,314…警報管理部
DB,DB,DB…データベース
NW,NW…通信ネットワーク
1 ... network monitoring system 10A 1 ~10A 3, 10B 1 ~10B 3 ... network element (NE)
10A, 10B ... NE group 20A, 20B ... Element management system (EMS)
21A, 21B ... EMS server 22A, 22B ... EMS client 23A, 23B, 33 ... Communication line 24A, 24B, 34 ... Storage device 30 ... Network management system (NMS)
31 ... NMS server 32 ... NMS client 211 ... NE communication unit 212, 312 ... client communication unit 213 ... NMS communication unit 214, 313 ... control unit 215, 314 ... alarm management unit DB A , DB B , DB ... database NW A , NW B ... Communication network

Claims (5)

通信ネットワークに接続する複数のネットワーク要素が障害検知時に送出する警報情報を収集する複数の警報情報収集装置と、
前記複数の警報情報収集装置で収集された警報情報を基に、前記通信ネットワーク上における障害の発生状況を監視する障害監視装置と、を備えたネットワーク監視システムであって、
前記複数の警報情報収集装置から前記障害監視装置に一定量を超える警報情報が通知される警報多発状態にあるか否かを判断する警報判断手段を備え、
前記複数の警報情報収集装置は、それぞれ、前記警報判断手段で警報多発状態にあると判断されたとき、受信した前記ネットワーク要素からの警報情報に含まれる全ての情報のうちの一部の情報のみを含む集約情報を生成し、該集約情報を前記障害監視装置に通知し、
前記障害監視装置は、前記警報判断手段で警報多発状態にあると判断されたとき、前記複数の警報情報収集装置から通知される前記集約情報を用いて、前記通信ネットワーク上における障害の発生状況をリアルタイムで監視することを特徴とするネットワーク監視システム。
A plurality of alarm information collecting devices for collecting alarm information to be transmitted when a plurality of network elements connected to the communication network detect a failure;
A network monitoring system comprising a failure monitoring device that monitors the occurrence of a failure on the communication network based on the warning information collected by the plurality of warning information collection devices,
Comprising a warning judgment means for judging whether or not the fault monitoring apparatus is in a state of frequent occurrence of alarms in which warning information exceeding a certain amount is notified from the plurality of warning information collecting devices to the fault monitoring device;
Each of the plurality of alarm information collection devices is only a part of all information included in the received alarm information from the network element when the alarm determination unit determines that the alarm is frequently generated. Is generated, and the failure monitoring device is notified of the aggregate information,
The failure monitoring device uses the aggregate information notified from the plurality of alarm information collection devices when the alarm determination means determines that the alarm is frequently occurring, and indicates the occurrence status of the failure on the communication network. A network monitoring system characterized by real-time monitoring.
請求項1に記載のネットワーク監視システムであって、
前記警報判断手段は、前記複数の警報情報収集装置のいずれかにおいて、単位時間あたりに受信される前記ネットワーク要素からの警報情報の総数が第1閾値を超過しているときに警報多発状態にあると判断することを特徴とするネットワーク監視システム。
The network monitoring system according to claim 1,
The alarm determination means is in an alarm frequent state when the total number of alarm information received from the network element per unit time exceeds a first threshold in any one of the plurality of alarm information collection devices. A network monitoring system characterized in that
請求項2に記載のネットワーク監視システムであって、
前記複数の警報情報収集装置は、それぞれ、受信した前記ネットワーク要素からの警報情報に含まれる全ての情報をデータベースに保存し、前記警報判断手段で警報多発状態にあると判断されて前記集約情報を前記障害監視装置に通知するとき、前記データベースの該当する警報情報に対応させて集約通知フラグを記録し、その後に前記警報判断手段で警報多発状態にないと判断されたとき、前記データベースの前記集約通知フラグが記録された警報情報について、該警報情報に含まれる全ての情報のうちの前記集約情報以外の未通知情報を前記障害監視装置に通知することを特徴とするネットワーク監視システム。
The network monitoring system according to claim 2,
Each of the plurality of alarm information collection devices stores all the information included in the received alarm information from the network element in a database, and determines that the alarm determination unit is in an alarm-prone state and outputs the aggregated information. When notifying the failure monitoring device, an aggregation notification flag is recorded in correspondence with the corresponding alarm information in the database, and when it is determined by the alarm determination means that the alarm is not frequently generated, the aggregation of the database is performed. A network monitoring system characterized by notifying the fault monitoring device of unreported information other than the aggregated information among all information included in the alarm information for alarm information in which a notification flag is recorded.
請求項1〜3のいずれか1つに記載のネットワーク監視システムであって、
前記警報判断手段は、前記障害監視装置において、前記複数の警報情報収集装置から単位時間あたりに通知される警報情報の総情報量が第2閾値を超過しているときに警報多発状態にあると判断することを特徴とするネットワーク監視システム。
The network monitoring system according to any one of claims 1 to 3,
In the failure monitoring apparatus, the alarm determination means is in an alarm-prone state when a total information amount of alarm information notified per unit time from the plurality of alarm information collection devices exceeds a second threshold. A network monitoring system characterized by judging.
請求項4に記載のネットワーク監視システムであって、
前記障害監視装置は、前記警報判断手段で警報多発状態にあると判断されたとき、前記複数の警報情報収集装置に対して、前記障害監視装置に通知する警報情報の集約化を要求し、その後に前記警報判断手段で警報多発状態にないと判断されたとき、前記複数の警報情報収集装置に対して、前記障害監視装置に通知する警報情報の集約化解除を要求し、
前記複数の警報情報収集装置は、それぞれ、受信した前記ネットワーク要素からの警報情報に含まれる全ての情報をデータベースに保存し、前記障害監視装置からの前記警報情報の集約化の要求を受けて、前記集約情報を前記障害監視装置に応答通知し、かつ、前記データベースの該当する警報情報に対応させて集約通知フラグを記録し、その後に前記障害監視装置からの前記警報情報の集約化解除の要求を受けて、前記データベースの前記集約通知フラグが記録された警報情報について、該警報情報に含まれる全ての情報のうちの前記集約情報以外の未通知情報を前記障害監視装置に応答通知することを特徴とするネットワーク監視システム。
The network monitoring system according to claim 4,
The fault monitoring device requests the alarm information collection device to aggregate alarm information to be notified to the fault monitoring device when the alarm determination means determines that the alarm is frequently occurring, and thereafter When the alarm determination means determines that the alarm is not frequently generated, the alarm information collection device is requested to cancel the centralization of alarm information to be notified to the failure monitoring device,
Each of the plurality of alarm information collection devices stores all information included in the received alarm information from the network element in a database, and receives a request for aggregation of the alarm information from the failure monitoring device, The aggregated information is notified to the failure monitoring apparatus in response, and an aggregation notification flag is recorded corresponding to the corresponding alarm information in the database, and then the alarm information aggregation request from the failure monitoring apparatus is issued. In response to the alarm information in which the aggregation notification flag of the database is recorded, the failure monitoring device is notified of unreported information other than the aggregate information among all information included in the alarm information. A featured network monitoring system.
JP2012006885A 2012-01-17 2012-01-17 Network monitoring system Pending JP2013150042A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012006885A JP2013150042A (en) 2012-01-17 2012-01-17 Network monitoring system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012006885A JP2013150042A (en) 2012-01-17 2012-01-17 Network monitoring system

Publications (1)

Publication Number Publication Date
JP2013150042A true JP2013150042A (en) 2013-08-01

Family

ID=49047165

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012006885A Pending JP2013150042A (en) 2012-01-17 2012-01-17 Network monitoring system

Country Status (1)

Country Link
JP (1) JP2013150042A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017184071A (en) * 2016-03-31 2017-10-05 日本電信電話株式会社 Monitoring system, monitoring method, monitoring device, and monitored device
JP2017536636A (en) * 2014-11-06 2017-12-07 華為技術有限公司Huawei Technologies Co.,Ltd. Information transmission method, managed system, and management system
WO2018003785A1 (en) * 2016-07-01 2018-01-04 日本電気株式会社 Communication device, communication system, communication method, and non-transitory computer-readable medium
JP2018196021A (en) * 2017-05-18 2018-12-06 日本電気株式会社 Fault management device, fault management system and processing method
JP2020053912A (en) * 2018-09-28 2020-04-02 株式会社東芝 Network system, integrated monitoring system, monitoring control system, and monitoring method

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017536636A (en) * 2014-11-06 2017-12-07 華為技術有限公司Huawei Technologies Co.,Ltd. Information transmission method, managed system, and management system
JP2017184071A (en) * 2016-03-31 2017-10-05 日本電信電話株式会社 Monitoring system, monitoring method, monitoring device, and monitored device
WO2018003785A1 (en) * 2016-07-01 2018-01-04 日本電気株式会社 Communication device, communication system, communication method, and non-transitory computer-readable medium
JP2018196021A (en) * 2017-05-18 2018-12-06 日本電気株式会社 Fault management device, fault management system and processing method
JP2020053912A (en) * 2018-09-28 2020-04-02 株式会社東芝 Network system, integrated monitoring system, monitoring control system, and monitoring method

Similar Documents

Publication Publication Date Title
JP5418250B2 (en) Abnormality detection apparatus, program, and abnormality detection method
JP2013150042A (en) Network monitoring system
JP2012054622A (en) Network system, management server and oam test management method
JP6115148B2 (en) Alarm management device, communication device, alarm control device, alarm management method, communication method, alarm control method, alarm management program, communication program, and alarm control program
EP3203684B1 (en) Method, apparatus and system for network operations, administration and maintenance
CN114710445A (en) Voice soft switching service method, device, system, electronic equipment and storage medium
CN111106970A (en) Data monitoring method and device, electronic equipment and readable storage medium
CN112671813A (en) Server determination method, device, equipment and storage medium
EP1820359B1 (en) Service alarm correlation
JPWO2012004891A1 (en) Computer monitoring program, monitoring method and monitoring apparatus
CN113824595A (en) Link switching control method and device and gateway equipment
JP5308399B2 (en) Monitoring server system, communication device, and monitoring control network connection device
JP4651126B2 (en) Incident management system, management method, and management program
JP6542538B2 (en) Network monitoring system, monitoring device and monitoring method
JP2006065619A (en) Apparatus and program for determine cause of fault in network application
JP2009171476A (en) Server management system and its construction method
JP4687519B2 (en) Call center system for broadcast distribution of event notifications
CN113890850A (en) Route disaster tolerance system and method
JP5029697B2 (en) Server system of operation system
JP2014164628A (en) Information processing device, information processing method, information processing program, integrated monitoring server and monitoring system
JP5712725B2 (en) Management apparatus and method
WO2014019464A1 (en) Alarm management method and network management system
JP5126138B2 (en) Network management system and program
JP2017195450A (en) Communication device and communication method
EP2445144A1 (en) Service flux allocation method and equipment thereof