JP4437416B2 - Network maintenance system - Google Patents

Network maintenance system Download PDF

Info

Publication number
JP4437416B2
JP4437416B2 JP2004061839A JP2004061839A JP4437416B2 JP 4437416 B2 JP4437416 B2 JP 4437416B2 JP 2004061839 A JP2004061839 A JP 2004061839A JP 2004061839 A JP2004061839 A JP 2004061839A JP 4437416 B2 JP4437416 B2 JP 4437416B2
Authority
JP
Japan
Prior art keywords
alarm
information
information communication
communication device
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004061839A
Other languages
Japanese (ja)
Other versions
JP2005252765A (en
Inventor
直人 宮内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2004061839A priority Critical patent/JP4437416B2/en
Publication of JP2005252765A publication Critical patent/JP2005252765A/en
Application granted granted Critical
Publication of JP4437416B2 publication Critical patent/JP4437416B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Description

この発明は、情報通信機器から構成されるネットワークの障害原因を自動的に判定するネットワーク故障判定装置に関するものである。   The present invention relates to a network failure determination apparatus that automatically determines the cause of a failure in a network composed of information communication devices.

ネットワークの障害から主原因を判定するために、例えば特開平10−200527「ネットワークサービス故障診断方法及びその装置」に示される方法が考案されている。   In order to determine the main cause from a network failure, a method disclosed in, for example, Japanese Patent Laid-Open No. 10-200257 “Network service failure diagnosis method and apparatus” has been devised.

図15は、従来のネットワーク故障判定装置の構成図であり、61は入力装置を、71は設備情報データベースを、72は設計情報データベースを、62は記憶装置を、63は表示装置を、81は設備モデル生成手段を、82は通信シーケンス生成手段を、83は故障サービス構成要素推定手段を、64は管理装置を表す。   FIG. 15 is a block diagram of a conventional network failure determination device, in which 61 is an input device, 71 is an equipment information database, 72 is a design information database, 62 is a storage device, 63 is a display device, and 81 is a display device. An equipment model generation means, 82 a communication sequence generation means, 83 a failure service component estimation means, and 64 a management device.

次に、背景技術の動作について説明する。設備モデル生成手段81は、故障を申告したユーザのユーザ名及び利用サービス名をもとに設備情報データベース71を検索し、該ユーザが該当サービスを利用する際にその端末と情報ソースとの間に配置される複数の通信機器からなる設備モデルを生成する。また、故障と推定された通信機器を使用しているユーザ名及び利用サービス名を設備情報データベース21から検索し、故障を申告したユーザの他の利用サービスもしくは他のユーザの利用サービスが含まれている場合、該ユーザが該当サービスを利用する際にその端末と情報ソースとの間に配置される複数の通信機器からなる設備モデルを生成する。   Next, the operation of the background art will be described. The equipment model generation means 81 searches the equipment information database 71 based on the user name and service name of the user who has reported the failure, and when the user uses the corresponding service, between the terminal and the information source. A facility model composed of a plurality of communication devices to be arranged is generated. In addition, a user name and a use service name using a communication device estimated to be out of order are searched from the facility information database 21, and other use services or use services of other users who have reported the failure are included. When the user uses the corresponding service, an equipment model including a plurality of communication devices arranged between the terminal and the information source is generated.

通信シーケンス生成手段82は、設計情報データベース22を検索し、設備モデルを構成する全ての通信機器が正常な時の通信シーケンスとともに、各通信機器がそれぞれ故障した時の通信シーケンスを生成する。   The communication sequence generation unit 82 searches the design information database 22 and generates a communication sequence when each communication device has failed together with a communication sequence when all communication devices constituting the equipment model are normal.

故障通信機器推定手段83は、生成した複数の通信シーケンスと前記故障申告時における観測情報とを比較し、どの通信シーケンスが発生しているのかを推定し、これより故障した通信機器を推定する。また、故障を申告したユーザの他の利用サービスもしくは他のユーザの利用サービスにおいて推定されたユーザ端末の事象と、該当ユーザの故障申告時の事象とが一致する場合は同一の通信機器の故障によると推定する。
特開平10−200527号公報
The failure communication device estimation means 83 compares the generated plurality of communication sequences with the observation information at the time of the failure report, estimates which communication sequence is occurring, and estimates the communication device that has failed. In addition, if the event of the user terminal estimated in the other usage service of the user who has reported the failure or the usage service of the other user matches the event at the time of the failure notification of the corresponding user, it is due to the failure of the same communication device. Estimated.
Japanese Patent Laid-Open No. 10-200527

従来のネットワーク故障判定装置は、上記のように構成されているため、次のような課題があった。   Since the conventional network failure determination apparatus is configured as described above, it has the following problems.

(課題1)故障原因を判定するトリガは、ユーザから管理センターに対する故障申告であるため、ユーザからの申告が無いと正確に故障原因を判定できない。   (Problem 1) Since the trigger for determining the cause of failure is a failure report from the user to the management center, the cause of the failure cannot be accurately determined without a report from the user.

(課題2)End−to−Endの通信経路を通信モデルとして生成し、End−to−Endの正常時の通信シーケンスと、故障時の通信シーケンスを生成し、ユーザが申告した観測情報と生成した通信シーケンスを比較することによって、故障した通信機器を推定している。従来例では末端の通信機器が特定されると一意な通信経路が決まることを前提としているが、動的に通信経路が決まる場合や二重伝送しているネットワークの場合、従来例では故障原因を特定できない。   (Problem 2) An end-to-end communication path is generated as a communication model, an end-to-end normal communication sequence and a fault communication sequence are generated, and the observation information reported by the user is generated. By comparing the communication sequences, the failed communication device is estimated. In the conventional example, it is assumed that a unique communication path is determined when a terminal communication device is specified. However, in the case of a dynamically determined communication path or a dual transmission network, in the conventional example, the cause of failure is determined. It can not be identified.

(課題3)ネットワークの障害によって大量の警報が発生した場合の処理が存在しないため、管理装置が大量の警報を受信した場合、それらの中から主原因となる警報を特定する時間が膨大になる。   (Problem 3) Since there is no processing when a large number of alarms are generated due to a network failure, when the management device receives a large number of alarms, it takes a lot of time to identify the main cause alarm from them. .

(課題4)情報通信機器を保守点検するために停止する際に、事前にどの程度の回線が停止するかをネットワーク故障判定装置が自動的に判断することが出来ない。   (Problem 4) When the information communication device is stopped for maintenance and inspection, the network failure determination device cannot automatically determine how much the line is stopped in advance.

(課題5)情報通信機器を保守点検して停止することによって、大量の警報が発生する場合があるが、保守点検によって発生した警報と障害によって発生した警報を同じように扱っているため、障害によって発生した警報を判別するのに時間が掛かる。   (Problem 5) A large number of alarms may be generated when maintenance and inspection of information and communication equipment is stopped. However, since alarms generated by maintenance and alarms are handled in the same way, It takes time to determine the alarm generated by.

本発明に係るネットワーク故障判定装置は、
複数の情報通信機器が接続されたネットワークの故障を判定するネットワーク故障判定装置であって、以下の要素を有することを特徴とする
(1)発信側である自側情報通信機器が発生させた自側警報の警報種別と、受信側である相手側情報通信機器が発生させた相手側警報の警報種別とからなる警報発生パターンと、これらの警報の原因を対応付けて格納する警報発生パターンテーブル
(2)情報通信機器の物理的な接続関係と、当該情報通信機器を収容する論理回線を対応付けて格納する設備情報テーブル
(3)情報通信機器について、健全か否かの最新の状態を格納する設備状態テーブル
(4)前記複数の情報通信機器と通信し、警報を収集する警報収集部
(5)収集した警報と、警報発生パターンテーブルの前記警報発生パターンを比較し、一致する当該警報発生パターンに対応する警報の原因を、主原因と判定する主原因判定部
(6)主原因となった情報通信機器の接続関係を、設備情報テーブルから特定し、当該接続関係に基づいて、主原因となった情報通信機器と所定の関係にある情報通信機器を通信不能と判断し、当該通信不能な情報通信機器を収容する論理回線を抽出し、抽出した論理回線のルート上の情報通信機器についての最新の状態を、設備状態テーブルから取得し、最新の状態が健全でない場合に、当該論理回線を通信不能と判断する通信回線状態判定部
(7)主原因となった警報と、通信不能な論理回線とを通報する故障通報部。
The network failure determination apparatus according to the present invention is
A network failure determination apparatus that determines a failure of a network to which a plurality of information communication devices are connected, and includes the following elements: (1) a self-generated information communication device that is a sender side Alarm generation pattern table (corresponding to the alarm generation pattern consisting of the alarm type of the side alarm and the alarm type of the other party alarm generated by the other party information communication device on the receiving side) 2) Facility information table that stores the physical connection relationship of the information communication device and the logical line that accommodates the information communication device in association with each other. (3) For the information communication device, stores the latest state as to whether the information communication device is healthy. Equipment status table (4) Alarm collection unit that communicates with the plurality of information communication devices and collects alarms (5) Collected alarms and the alarm generation patterns in the alarm generation pattern table The main cause determination unit that determines the cause of the alarm corresponding to the corresponding alarm occurrence pattern as the main cause (6) specifies the connection relation of the information communication device that is the main cause from the facility information table, and Based on the connection relationship, the information communication device having a predetermined relationship with the information communication device that has caused the main cause is determined to be incapable of communication, the logical line that accommodates the information communication device incapable of communication is extracted, and the extracted logical line The latest state of the information communication device on the route of the communication line is acquired from the equipment state table, and when the latest state is not healthy, the communication line state determination unit (7) determines that the logical line is incapable of communication. A fault reporting unit that reports alarms that have become unusable and logical lines that cannot communicate.

以上のように、この発明によれば、ユーザの申告情報を使わずに、情報通信機器の発生する警報だけを利用してネットワークの障害原因を特定することができる。   As described above, according to the present invention, it is possible to specify the cause of a network failure using only the alarm generated by the information communication device without using the user report information.

また、情報通信機器が発生させる警報を、情報通信設備の伝送速度に応じて並べ替えることによって、障害原因を高速に特定することが出来る。   Moreover, the cause of the failure can be identified at high speed by rearranging the alarms generated by the information communication device according to the transmission speed of the information communication facility.

また、End−to−Endの通信経路が固定されているネットワークにおいて、障害の発生原因によって停止する論理回線を特定することが出来る。   Further, in a network in which an end-to-end communication path is fixed, it is possible to specify a logical line that stops due to the cause of the failure.

また、End−to−Endの通信経路が固定されて居らず、複数の通信経路が設定されたネットワークにおいて、ネットワークの故障原因を正確に特定することができる。   Further, the end-to-end communication path is not fixed, and the network failure cause can be accurately specified in a network in which a plurality of communication paths are set.

また、保守作業によって通信不能となる論理回線を、保守作業前に予想することができる。   In addition, a logical line that cannot be communicated by maintenance work can be predicted before the maintenance work.

実施の形態1.
図1は、実施の形態1に係る構成図である。図において、1はパソコンやルータなどの情報通信機器を、2は記憶装置を、3は表示装置を、4は管理装置を表す。
Embodiment 1 FIG.
FIG. 1 is a configuration diagram according to the first embodiment. In the figure, 1 is an information communication device such as a personal computer or a router, 2 is a storage device, 3 is a display device, and 4 is a management device.

21は情報通信機器が発生する警報の種類とフォーマットを格納する警報定義データベースを、22は警報優先度データベースを、23は警報発生パターン・データベースを、24は設備情報データベースを、25は経路情報データベースを、41は警報収集部を、42は警報整列部を、43は主原因判定部を、44は通信回線状態判定部を、45は故障通報部を、46は警報ログを、47は設備状態データベースを表す。   21 is an alarm definition database for storing types and formats of alarms generated by information communication devices, 22 is an alarm priority database, 23 is an alarm generation pattern database, 24 is an equipment information database, and 25 is a route information database. 41 is an alarm collection unit, 42 is an alarm alignment unit, 43 is a main cause determination unit, 44 is a communication line state determination unit, 45 is a failure notification unit, 46 is an alarm log, and 47 is an equipment state. Represents a database.

図2は、警報定義テーブルであり、情報通信機器の種別201とそれらが発生させる警報の種別202、及び警報の重要度203を関連づけたテーブル情報である。記憶装置2の警報優先度データベース22に格納されている。   FIG. 2 is an alarm definition table, which is table information in which information communication device types 201, alarm types 202 generated by them, and alarm importance 203 are associated with each other. It is stored in the alarm priority database 22 of the storage device 2.

ここで、情報通信機器の種別201は、情報通信機器の種別や機種名を表す。警報種別202は、情報通信機器が管理装置に送信し得る警報の種別を表す。また、警報重要度は、管理装置が故障判定に使うべき故障か否かを判別するパラメタであり、Major(大)またはMinor(小)の値を取り得る。ただし、警報重要度は、2値に限定する必要はなく、3値以上でも良い。   Here, the information communication device type 201 represents the type and model name of the information communication device. The alarm type 202 represents the type of alarm that the information communication device can transmit to the management device. The alarm importance is a parameter for determining whether or not the management apparatus is a failure to be used for failure determination, and can take a value of Major (large) or Minor (small). However, the alarm importance need not be limited to two values, and may be three or more.

図3は、警報整列規則テーブルであり、管理装置4が情報通信機器1から受信した警報を並べ替えるために参照する警報の整列規則である。記憶装置2の警報優先度データベース22に格納される。図において、機器別優先度301は優先順位の高低を表す。機器別優先度の数字が少ない方が優先度が高い。警報発生機器種別302は、警報の発生元である情報通信機器の種別を表す。伝送速度303は、警報の発生元である情報通信機器の伝送速度を表す。   FIG. 3 is an alarm alignment rule table, which is an alarm alignment rule referred to by the management device 4 for rearranging alarms received from the information communication device 1. It is stored in the alarm priority database 22 of the storage device 2. In the figure, the device priority 301 indicates the level of priority. The lower the device priority number, the higher the priority. The alarm generating device type 302 represents the type of the information communication device that is the source of the alarm. The transmission rate 303 represents the transmission rate of the information communication device that is the source of the alarm.

図4は、管理装置4が情報通信機器1から受信した警報の発生パターンと照合するために警報発生判定パターンテーブルである。記憶装置2の警報発生パターン・データベース23に予め格納されている。図において、パターン番号401は警報発生パターンの識別子を表し、自側警報402は、自側で発生する警報種別を表し、相手側警報403は相手側で発生する警報種別を表す。また、原因403はパターンに一致した場合に原因となる警報の種別と警報の発生元となる情報通信機器(自側か相手側か)を表す。   FIG. 4 is an alarm generation determination pattern table for collating with the alarm generation pattern received from the information communication device 1 by the management device 4. The alarm generation pattern database 23 of the storage device 2 is stored in advance. In the figure, a pattern number 401 represents an identifier of an alarm generation pattern, an own side alarm 402 represents an alarm type generated on the own side, and an opponent side alarm 403 represents an alarm type generated on the other side. The cause 403 represents the type of alarm that causes the alarm when it matches the pattern and the information communication device (local side or partner side) that is the source of the alarm.

図5は、情報通信機器同士の物理的な接続関係を格納する設備情報テーブルである。記憶装置2の設備情報データベース24に予め格納されている。図において、情報通信機器名501は、情報通信機器を識別する名称である。上位接続装置名リスト502は当該情報通信機器に接続する情報通信機器の名称リストである。また、下位接続装置名リスト503は、当該情報通信機器に接続する情報通信機器の名称リストである。なお、当該情報通信機器よりも伝送速度の大きい情報通信機器は、上位接続装置名リスト502に格納され、伝送速度の小さい情報通信機器は、下位接続装置名リスト503に格納される。同じ伝送速度を持つ情報通信機器は、上位接続装置名リスト502または下位接続装置名リスト503に格納される。論理回線名リスト504は、当該情報通信機器を始端・終端とする論理回線のリストである。   FIG. 5 is a facility information table that stores physical connection relationships between information communication devices. The information is stored in advance in the facility information database 24 of the storage device 2. In the figure, an information communication device name 501 is a name for identifying an information communication device. The host device name list 502 is a name list of information communication devices connected to the information communication device. The lower connection device name list 503 is a name list of information communication devices connected to the information communication device. An information communication device having a transmission speed higher than that of the information communication device is stored in the upper connection apparatus name list 502, and an information communication apparatus having a lower transmission speed is stored in the lower connection apparatus name list 503. Information communication devices having the same transmission rate are stored in the upper connection device name list 502 or the lower connection device name list 503. The logical line name list 504 is a list of logical lines having the information communication device as a start / end.

図6は、2つの情報通信機器間の論理的な通信経路を表す通信経路情報テーブルであり、記憶装置2の経路情報データベース25に予め格納されている。   FIG. 6 is a communication path information table representing a logical communication path between two information communication devices, and is stored in advance in the path information database 25 of the storage device 2.

論理回線名601は、論理回線を識別する名前である。自側情報通信機器名602は自側(発信側)の情報通信機器を識別する名称を表し、相手側情報通信機器名603は相手側(受信側)の情報通信機器を識別する名称を表す。また、通信経路1は自側情報通信機器名602と相手側情報通信機器名603間の通信経路上に存在する情報通信機器の名称リストである。通信経路2(604b)や通信経路n(n=3,4,...)(604c)は通信経路1(604a)と同様である。   The logical line name 601 is a name for identifying a logical line. The local information communication device name 602 represents a name for identifying the local (communication side) information communication device, and the counterpart information communication device name 603 represents a name for identifying the counterpart (reception side) information communication device. Communication path 1 is a name list of information communication apparatuses existing on the communication path between the local information communication apparatus name 602 and the counterpart information communication apparatus name 603. Communication path 2 (604b) and communication path n (n = 3, 4,...) (604c) are the same as communication path 1 (604a).

次に、この発明の故障判定装置がネットワーク障害の主原因を抽出する動作を説明する。図7〜9を使って、ネットワークを例にして動作を説明する。図7は、ネットワークの物理的な接続構成を示す。図において、情報通信装置1dで故障が発生した場合、情報通信装置1a,1b,1c,1d,1g,1h,1j,1kから管理装置4に様々な警報が送信される。図8は、受信した警報の例を示す図である。   Next, the operation of the failure determination apparatus of the present invention for extracting the main cause of network failure will be described. The operation will be described with reference to FIGS. FIG. 7 shows a physical connection configuration of the network. In the figure, when a failure occurs in the information communication apparatus 1d, various alarms are transmitted from the information communication apparatuses 1a, 1b, 1c, 1d, 1g, 1h, 1j, and 1k to the management apparatus 4. FIG. 8 is a diagram illustrating an example of a received alarm.

この例では、管理装置4は、図8に示すような警報を情報通信機器1から受信したと仮定する。なお、図において、警報受信時刻801は管理装置4が警報を受信した日時を表し、警報発生機器名802は警報発生元の情報通信機器を識別する名前を表す。警報発生機器種別803は警報発生元の情報通信機器の種別を、警報種別804は警報の種類を表す。   In this example, it is assumed that the management device 4 has received an alarm as shown in FIG. In the figure, the alarm reception time 801 represents the date and time when the management apparatus 4 received the alarm, and the alarm generation device name 802 represents a name for identifying the information communication device that is the alarm generation source. The alarm generation device type 803 indicates the type of the information communication device that is the alarm generation source, and the alarm type 804 indicates the type of alarm.

また、図9は、故障判定装置の動作フローを示す。管理装置4は、情報通信機器からの警報を待ち続けている(S1)。   FIG. 9 shows an operation flow of the failure determination apparatus. The management device 4 continues to wait for an alarm from the information communication device (S1).

情報通信機器aにおいて故障を検出すると、警報を管理装置4に送信する(S2)。   When a failure is detected in the information communication device a, an alarm is transmitted to the management device 4 (S2).

管理装置4の警報収集部41は、情報通信機器1aから警報を受信する(S3)。   The alarm collection unit 41 of the management device 4 receives an alarm from the information communication device 1a (S3).

警報収集部41は、受信した警報の警報種別を、警報定義データベース21内の警報定義テーブル(図2)と比較する(S4)。   The alarm collection unit 41 compares the alarm type of the received alarm with the alarm definition table (FIG. 2) in the alarm definition database 21 (S4).

受信した警報がMinor(小)で有る場合は、管理装置は警報をログとして保存し、警報の受信待ち状態に戻る(S5)。   If the received alarm is Minor (small), the management device stores the alarm as a log and returns to the alarm reception waiting state (S5).

受信した警報がMajor(大)で有る場合は、警報収集部41は予め決められた警報収集時間(たとえば10秒)のタイマーを作動し、その他の警報を警報収集時間だけ待ち続ける(S6)。この警報収集時間の間に情報通信機器1bが故障を検出した場合は、情報通信機器1bは管理装置4に警報を送信する。   When the received alarm is Major (large), the alarm collection unit 41 operates a timer for a predetermined alarm collection time (for example, 10 seconds) and continues to wait for other alarms for the alarm collection time (S6). If the information communication device 1b detects a failure during the alarm collection time, the information communication device 1b transmits an alarm to the management device 4.

管理装置4の警報整列部42は、警報優先度データベース22の警報整列規則テーブル(図3)を参照しながら、収集した警報を並べ替える。並べ替える基準は、警報の発生元である情報通信機器の伝送速度が最大の警報を1番目に、最小の伝送速度を持つ情報通信機器の警報を最後にする(S7)。   The alarm alignment unit 42 of the management device 4 rearranges the collected alarms while referring to the alarm alignment rule table (FIG. 3) of the alarm priority database 22. The criteria for rearrangement are that the alarm with the highest transmission rate of the information communication device that is the source of the alarm is the first, and the alarm with the lowest transmission rate is the last (S7).

管理装置4の主原因判定部43は、S7で1番目に位置づけられた警報の発生元を調べ、発生元の情報通信機器に対応する警報発生パターンファイル(図4)を警報発生パターン・データベース(23)から取り出す。発生している警報と警報発生パターンを比較する(S8)。   The main cause determination unit 43 of the management device 4 checks the first alarm generation source in S7, and generates an alarm generation pattern database (FIG. 4) corresponding to the information communication device of the generation source as an alarm generation pattern database ( 23). The generated alarm is compared with the alarm generation pattern (S8).

一致したパターンが有れば、警報発生パターンファイルに記載された主原因警報に対応する警報を主原因と判断する(S10)。   If there is a matched pattern, the alarm corresponding to the main cause alarm described in the alarm generation pattern file is determined as the main cause (S10).

もし、比較の結果、警報発生パターンファイルと一致しない場合は、抽出した全ての警報を主原因と判断する(S11)。   If the comparison does not match the alarm generation pattern file, all extracted alarms are determined as the main cause (S11).

管理装置4の通信回線状態判定部44は、S10またはS11で主原因と判断した警報の発生元の名称を設備情報テーブル(図5)から検索し、情報通信機器の物理的な接続構成図を作成する。接続構成図において、主原因となる情報通信機器の下位に接続する情報通信機器と、主原因となる情報通信機器とEnd−to−Endの関係にある情報通信機器に下位接続する情報通信機器を通信不能な情報通信機器と判断する。そして、通信不能な各情報通信機器に登録されている論理回線のリストを抽出する。図10は、設備状態テーブルを示す図である。   The communication line state determination unit 44 of the management device 4 searches the facility information table (FIG. 5) for the name of the alarm source determined to be the main cause in S10 or S11, and displays the physical connection configuration diagram of the information communication device. create. In the connection configuration diagram, an information communication device that is connected to a lower level of the information communication device that is the main cause, and an information communication device that is connected to the information communication device that is in an end-to-end relationship with the information communication device that is the main cause It is determined that the information communication device cannot communicate. Then, a list of logical lines registered in each information communication device that cannot communicate is extracted. FIG. 10 is a diagram showing an equipment state table.

次に、通信回線状態判定部44は、経路情報データベース25を参照し、上記で抽出した論理回線について、通信経路が複数有るか否かを調べる。設備状態データベース47に格納される設備状態テーブル(図10)を参照して、各ルート上の情報通信機器の状態を調べ、もし健全な通信経路が一つでも存在していれば、論理回線としては健全と判断し、全ての通信経路が通信不能であれば、論理回線が通信不能と判断する(S12)。   Next, the communication line state determination unit 44 refers to the path information database 25 and checks whether there are a plurality of communication paths for the logical lines extracted above. Referring to the equipment state table (FIG. 10) stored in the equipment state database 47, the state of the information communication device on each route is checked. If there is even one healthy communication path, the logical line is Is determined to be sound, and if all communication paths are incapable of communication, it is determined that the logical line is incapable of communication (S12).

管理装置4の故障通報部45は、主原因となる警報と、その影響で通信不能となる論理回線を表示装置3に表示し、警報の待ち状態S1に戻る。   The failure notification unit 45 of the management device 4 displays the alarm as the main cause and the logical line that cannot be communicated due to the alarm on the display device 3, and returns to the alarm waiting state S1.

以上のように、管理装置4が警報定義データベース21と警報優先度データベース22と警報発生パターン・データベースと設備情報データベース24と経路情報データベース25を持ち、これらのデータベースを参照しながら警報整列部42と主原因判定部43と通信回線状態判定部44が情報通信機器の警報を解析することによって、自動的にネットワーク障害の主原因を判定することが出来る。   As described above, the management device 4 has the alarm definition database 21, the alarm priority database 22, the alarm generation pattern database, the facility information database 24, and the route information database 25, and the alarm alignment unit 42 while referring to these databases. The main cause determination unit 43 and the communication line state determination unit 44 can automatically determine the main cause of the network failure by analyzing the alarm of the information communication device.

実施の形態2.
実施の形態1では、記憶装置2の中に、警報定義データベース21と、警報優先度データベース22と、警報発生パターン・データベース23と、設備情報データベース24と、経路情報データベース25を、格納するように構成したが、記憶装置の代わりに、管理装置4の中に、警報定義データベース21と、警報優先度データベース22と、警報発生パターン・データベース23と、設備情報データベース24と、経路情報データベース25を、格納するように構成しても、同じ効果が得られる。図11は、実施の形態2に係る構成図である。
Embodiment 2. FIG.
In the first embodiment, the storage device 2 stores an alarm definition database 21, an alarm priority database 22, an alarm generation pattern database 23, an equipment information database 24, and a route information database 25. Although configured, the alarm definition database 21, the alarm priority database 22, the alarm generation pattern database 23, the facility information database 24, and the route information database 25 are included in the management device 4 instead of the storage device. Even if it is configured to store, the same effect can be obtained. FIG. 11 is a configuration diagram according to the second embodiment.

実施の形態3.
図12は、実施の形態3に係る構成図である。図において、1から47は、実施の形態1と同じである。50は保守端末装置を、51は保守端末インタフェース部を、52は疑似警報発生部を表す。また、保守端末装置50は、疑似警報送信部53、通信不能回線通知受信部54、通信不能回線表示部55を有している。
Embodiment 3 FIG.
FIG. 12 is a configuration diagram according to the third embodiment. In the figure, 1 to 47 are the same as those in the first embodiment. 50 represents a maintenance terminal device, 51 represents a maintenance terminal interface unit, and 52 represents a pseudo alarm generation unit. Further, the maintenance terminal device 50 includes a pseudo alarm transmission unit 53, a communication impossible line notification receiving unit 54, and a communication impossible line display unit 55.

図13は、実施の形態3の動作を説明する動作フローである。図13に基づいて、動作を説明する。   FIG. 13 is an operation flow for explaining the operation of the third embodiment. The operation will be described with reference to FIG.

保守端末装置50は、保守作業によって停止する情報通信装置の警報を擬似的に発生させ、管理装置4に疑似警報を送信する(S101)。   The maintenance terminal device 50 pseudo-generates an alarm of the information communication device that stops due to maintenance work, and transmits the pseudo-alarm to the management device 4 (S101).

管理装置4の保守端末インタフェース部51は、疑似警報を受信し(S2)、実施の形態1と同様に警報を処理し、通信不能となる論理回線を判定する(S2〜S12)。管理装置4の保守端末インタフェース51を介して、通信不能となる論理回線を保守端末装置50に通知する。   The maintenance terminal interface unit 51 of the management device 4 receives the pseudo alarm (S2), processes the alarm in the same manner as in the first embodiment, and determines a logical line that cannot communicate (S2 to S12). Via the maintenance terminal interface 51 of the management device 4, the maintenance terminal device 50 is notified of the logical line that cannot communicate.

保守端末装置50は、保守によって通信不能と予想される論理回線を保守端末に表示する(S102)。   The maintenance terminal device 50 displays on the maintenance terminal a logical line that is expected to be unable to communicate due to maintenance (S102).

以上のように、保守端末装置50を備え、管理装置4が保守端末インタフェース部と疑似警報発生部を備えることによって、保守作業によって情報通信機器を停止する際に通信不能となる論理回線を事前に予測することが出来る。   As described above, since the maintenance terminal device 50 is provided, and the management device 4 includes the maintenance terminal interface unit and the pseudo alarm generation unit, a logical line that cannot be communicated when the information communication device is stopped by the maintenance work is provided in advance. Can be predicted.

図14は、ネットワーク故障判定装置のハードウエア構成例を示す図である。バスに、演算装置1401、データ記憶装置1402、メモリ1403、通信インターフェース1404が接続されている。データ記憶装置1402は、例えばROM(Read Only Memory)やハードディスクである。メモリ1403は、通常RAM(Random Access Memory)である。   FIG. 14 is a diagram illustrating a hardware configuration example of the network failure determination apparatus. An arithmetic device 1401, a data storage device 1402, a memory 1403, and a communication interface 1404 are connected to the bus. The data storage device 1402 is, for example, a ROM (Read Only Memory) or a hard disk. The memory 1403 is a normal RAM (Random Access Memory).

プログラムは、通常データ記憶装置1402に記憶されており、メモリ1403にロードされた状態で、順次演算装置1401に読み込まれ処理を行う。   The program is normally stored in the data storage device 1402, and is loaded in the memory 1403 and sequentially read into the arithmetic device 1401 for processing.

実施の形態1に係る構成図である。1 is a configuration diagram according to Embodiment 1. FIG. 警報定義テーブルを示す図である。It is a figure which shows an alarm definition table. 警報整列規則テーブルを示す図である。It is a figure which shows an alarm alignment rule table. 警報発生判定パターンテーブルを示す図である。It is a figure which shows an alarm generation determination pattern table. 設備情報テーブルを示す図である。It is a figure which shows an equipment information table. 通信経路情報テーブルを示す図である。It is a figure which shows a communication path information table. ネットワークの物理的な接続構成を示す図である。It is a figure which shows the physical connection structure of a network. 受信した警報の例を示す図である。It is a figure which shows the example of the received alarm. 故障判定装置の動作フローを示す図である。It is a figure which shows the operation | movement flow of a failure determination apparatus. 設備状態テーブルを示す図である。It is a figure which shows an equipment state table. 実施の形態2に係る構成図である。6 is a configuration diagram according to Embodiment 2. FIG. 実施の形態3に係る構成図である。FIG. 6 is a configuration diagram according to a third embodiment. 実施の形態3の動作を説明する動作フローである。10 is an operation flow for explaining the operation of the third embodiment. ネットワーク故障判定装置のハードウェア構成例を示す図である。It is a figure which shows the hardware structural example of a network failure determination apparatus. 従来のネットワーク故障判定装置の構成図である。It is a block diagram of the conventional network failure determination apparatus.

符号の説明Explanation of symbols

1 情報通信機器、2 記憶装置、3 表示装置、4 管理装置、21 警報定義データベース、22 警報優先度データベース、23 警報発生パターン・データベース、24 設備情報データベース、25 経路情報データベース、41 警報収集部、42 警報整列部、43 主原因判定部、44 通信回線状態判定部、45 故障通報部、46 警報ログ、47 設備状態データベース。   DESCRIPTION OF SYMBOLS 1 Information communication apparatus, 2 Storage device, 3 Display apparatus, 4 Management apparatus, 21 Alarm definition database, 22 Alarm priority database, 23 Alarm generation pattern database, 24 Equipment information database, 25 Path information database, 41 Alarm collection part, 42 Alarm alignment unit, 43 Main cause determination unit, 44 Communication line state determination unit, 45 Fault notification unit, 46 Alarm log, 47 Equipment status database.

Claims (1)

複数の情報通信機器が接続されたネットワークの故障を判定するネットワーク故障判定装置を有するネットワーク保守システムにおいて、
ネットワーク故障判定装置は、
(1)発信側である自側情報通信機器が発生させた自側警報の警報種別と、受信側である相手側情報通信機器が発生させた相手側警報の警報種別とからなる警報発生パターンと、これらの警報の原因を対応付けて格納する警報発生パターンテーブル
(2)情報通信機器の物理的な接続関係と、当該情報通信機器を収容する論理回線を対応付けて格納する設備情報テーブル
(3)情報通信機器について、健全か否かの最新の状態を格納する設備状態テーブル
(4)警報種別と、前記警報種別に対応して警報の重要度を示す情報として重要度大と重要度小とのいずれかをあらかじめ格納する警報定義テーブル
(5)警報をログとして記憶するログ記憶部
(6)前記複数の情報通信機器と通信し、警報種別を有する警報を収集し、収集した警報が有する警報種別と前記警報定義テーブルに格納された警報種別とを比較して収集した警報が有する警報種別に対応する警報の重要度を示す情報を前記警報定義テーブルから取得し、取得した警報の重要度を示す情報が重要度小である場合に、収集した警報をログとして前記ログ記憶部に記憶し、取得した警報の重要度を示す情報が重要度大である場合に、収集した警報を出力する警報収集部
(7)前記警報収集部が出力した警報と、警報発生パターンテーブルの前記警報発生パターンを比較し、一致する当該警報発生パターンに対応する警報の原因を、主原因と判定する主原因判定部
(8)主原因となった情報通信機器の接続関係を、設備情報テーブルから特定し、当該接続関係に基づいて、主原因となった情報通信機器と所定の関係にある情報通信機器を通信不能と判断し、当該通信不能な情報通信機器を収容する論理回線を抽出し、抽出した論理回線のルート上の情報通信機器についての最新の状態を、設備状態テーブルから取得し、最新の状態が健全でない場合に、当該論理回線を通信不能と判断する通信回線状態判定部
(9)主原因となった警報と、通信不能な論理回線とを通報する故障通報部
を備え
前記ネットワーク保守システムは、さらに、前記情報通信装置の警報を擬似的に発生させる保守端末を備え、
前記ネットワーク故障判定装置の警報収集部は、前記保守端末が擬似的に発生させた警報を前記複数の情報通信機器との通信によって収集する警報として収集し、
前記ネットワーク故障判定装置は、前記通信不能な論理回線を特定する情報を前記保守端末に通報する保守端末インタフェース部を備え、
保守端末は、通信不能な論理回線を特定する情報を受信し、当該論理回線を表示する
ことを特徴とするネットワーク保守システム。
In a network maintenance system having a network failure determination device for determining a failure of a network to which a plurality of information communication devices are connected,
Network failure judgment device
(1) An alarm generation pattern comprising an alarm type of the local alarm generated by the local information communication device that is the transmission side and an alarm type of the remote side alarm generated by the counterpart information communication device that is the reception side; , An alarm generation pattern table (2) for storing the cause of these alarms in association with each other, and a facility information table (3) for storing the physical connection relationship of the information communication equipment and the logical line accommodating the information communication equipment in association with each other ) Equipment status table for storing the latest state of information communication equipment, whether healthy or not (4) Alarm type, and information indicating the importance level of the alarm corresponding to the alarm type, high importance and low importance (5) Log storage unit for storing alarms as a log (6) Communicating with the plurality of information communication devices, collecting alarms having alarm types, and having collected alarms The information indicating the importance of the alarm corresponding to the alarm type included in the alarm collected by comparing the alarm type stored in the alarm definition table with the alarm type stored in the alarm definition table is acquired from the alarm definition table, and the importance of the acquired alarm When the information indicating the degree of importance is low, the collected alarm is stored as a log in the log storage unit, and when the information indicating the degree of importance of the acquired alarm is high in importance, the collected alarm is output. The alarm collecting unit (7) compares the alarm output from the alarm collecting unit with the alarm generation pattern in the alarm generation pattern table, and determines the cause of the alarm corresponding to the corresponding alarm generation pattern as the main cause. Cause determination unit (8) The connection relationship of the information communication device that is the main cause is identified from the equipment information table, and information that has a predetermined relationship with the information communication device that is the main cause is identified based on the connection relationship. The communication device is determined to be incapable of communication, the logical line accommodating the information communication device that is incapable of communication is extracted, and the latest state of the information communication device on the route of the extracted logical line is acquired from the equipment state table. When the latest state is not healthy, a communication line state determination unit that determines that the logical line is not communicable (9) A failure notification unit that reports an alarm that is the main cause and a logical line that is not communicable ,
The network maintenance system further includes a maintenance terminal that artificially generates an alarm of the information communication device,
The alarm collection unit of the network failure determination device collects alarms generated by the maintenance terminal in a pseudo manner as alarms collected by communication with the plurality of information communication devices,
The network failure determination device includes a maintenance terminal interface unit that notifies the maintenance terminal of information specifying the incommunicable logical line,
A network maintenance system , wherein the maintenance terminal receives information specifying a logical line that cannot communicate and displays the logical line .
JP2004061839A 2004-03-05 2004-03-05 Network maintenance system Expired - Fee Related JP4437416B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004061839A JP4437416B2 (en) 2004-03-05 2004-03-05 Network maintenance system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004061839A JP4437416B2 (en) 2004-03-05 2004-03-05 Network maintenance system

Publications (2)

Publication Number Publication Date
JP2005252765A JP2005252765A (en) 2005-09-15
JP4437416B2 true JP4437416B2 (en) 2010-03-24

Family

ID=35032820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004061839A Expired - Fee Related JP4437416B2 (en) 2004-03-05 2004-03-05 Network maintenance system

Country Status (1)

Country Link
JP (1) JP4437416B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5454235B2 (en) 2010-03-05 2014-03-26 富士通株式会社 Monitoring program, monitoring device, and monitoring method
KR102216574B1 (en) * 2018-07-20 2021-02-16 주식회사 케이티 Apparatus and method for deciding failure domain using failure alarm
CN112887119B (en) * 2019-11-30 2022-09-16 华为技术有限公司 Fault root cause determination method and device and computer storage medium
US11695617B2 (en) 2020-02-05 2023-07-04 Nippon Telegraph And Telephone Corporation Alarm monitoring system, alarm monitoring method, and program
KR102488984B1 (en) * 2021-11-19 2023-01-13 한국항공우주연구원 Real-time failure detection method and system for satellite ground station based on artificial intelligence

Also Published As

Publication number Publication date
JP2005252765A (en) 2005-09-15

Similar Documents

Publication Publication Date Title
EP1405187B1 (en) Method and system for correlating and determining root causes of system and enterprise events
US20070177523A1 (en) System and method for network monitoring
US8245079B2 (en) Correlation of network alarm messages based on alarm time
EP3327637A1 (en) On-demand fault reduction framework
JPH0793624B2 (en) Device and method for isolating and analyzing faults in link coupling systems
JP4412031B2 (en) Network monitoring system and method, and program
KR101443071B1 (en) Error Check System of Webpage
US20050038888A1 (en) Method of and apparatus for monitoring event logs
JP4616020B2 (en) Network monitoring program and network system
JP4437416B2 (en) Network maintenance system
JP2009296531A (en) Monitoring device
CN110609761B (en) Method and device for determining fault source, storage medium and electronic equipment
JP2007228421A (en) Ip network route diagnosis apparatus and ip network route diagnosis system
US7502447B2 (en) Call failure recording
JPH10229396A (en) Service management method and system
JP4485344B2 (en) Server apparatus, failure path diagnosis method, and failure path diagnosis program
KR100450415B1 (en) A Network Management Method using Availability Prediction
JP2008005118A (en) Network monitor system
JP2015114731A (en) Monitoring support program, monitoring support method, and monitoring support device
JP2003092571A (en) Network service monitoring device, its method, network monitoring program and recording medium
JP3941942B2 (en) Message correlation system and message correlation method
CN112636944B (en) OLT equipment offline intelligent diagnosis method and system
JP2018142092A (en) Operation checking device, operation checking program, operation checking method, and operation checking system
CN115733726A (en) Network group fault determination method and device, storage medium and electronic device
JPH04252533A (en) Fault notice system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090414

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090825

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091001

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20091203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091222

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091222

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130115

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4437416

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130115

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees