JP2007233858A - Failure monitoring system and failure monitoring method - Google Patents

Failure monitoring system and failure monitoring method Download PDF

Info

Publication number
JP2007233858A
JP2007233858A JP2006056689A JP2006056689A JP2007233858A JP 2007233858 A JP2007233858 A JP 2007233858A JP 2006056689 A JP2006056689 A JP 2006056689A JP 2006056689 A JP2006056689 A JP 2006056689A JP 2007233858 A JP2007233858 A JP 2007233858A
Authority
JP
Japan
Prior art keywords
monitoring
failure
failure information
recorded
monitoring device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006056689A
Other languages
Japanese (ja)
Inventor
Shigeru Yamazaki
茂 山崎
Hironori Hirata
裕規 平田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2006056689A priority Critical patent/JP2007233858A/en
Publication of JP2007233858A publication Critical patent/JP2007233858A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a failure monitoring system and a failure monitoring method, capable of collecting failure information without causing increase of overhead even if failures simultaneously occur, and sequentially obtaining the occurrence of the failures. <P>SOLUTION: Record contents of the failure information in sub-monitors 1-1 to 1-N are monitored, it is decided whether the failure information different from the failure information at preceding monitoring time is recorded or not, and a failure information collection part 23 of an integrated monitor 4 collects the failure information different from the failure information at preceding monitoring time when the failure information different from the failure information at preceding monitoring time is recorded. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

この発明は、標準制御/監視プロトコルであるSNMP(Simple Network Management Protocol RFC1157)を用いて、ネットワーク機器を監視する障害監視システム及び障害監視方法に関するものである。   The present invention relates to a failure monitoring system and a failure monitoring method for monitoring a network device using SNMP (Simple Network Management Protocol RFC1157) which is a standard control / monitoring protocol.

従来の障害監視システムを構成しているサブ監視装置は、例えば、都道府県単位に設置され、LAN(Local Area Network)に接続されているネットワーク機器の状態を監視して、そのネットワーク機器の障害を検出すると、TRAPと呼ばれる信号を用いて、そのネットワーク機器の監視項目(例えば、送信1−1号高周波部障害)を示すOID(Object ID)を統合監視装置に送信することにより、その監視項目に障害が発生していることを統合監視装置に通知する。
一方、従来の障害監視システムを構成している統合監視装置は、いずれかのサブ監視装置からTRAPを受信すると、ネットワーク機器の監視項目に障害が発生していることを認識する。
The sub-monitoring device constituting the conventional failure monitoring system is installed in each prefecture, for example, and monitors the status of the network device connected to the LAN (Local Area Network), and detects the failure of the network device. Upon detection, a signal called TRAP is used to send an OID (Object ID) indicating a monitoring item of the network device (for example, transmission 1-1 high-frequency unit failure) to the integrated monitoring device. Notify the integrated monitoring device that a failure has occurred.
On the other hand, when the integrated monitoring device constituting the conventional failure monitoring system receives TRAP from any of the sub-monitoring devices, it recognizes that a failure has occurred in the monitoring item of the network device.

統合監視装置は、ネットワーク機器の監視項目に障害が発生していることを認識すると、その監視項目における障害の内容を知るために、GetRequestと呼ばれる信号を用いて、その障害情報(OIDの内容)の送信をサブ監視装置に要求する。
サブ監視装置は、統合監視装置からGetRequestを受信すると、GetResponseと呼ばれる信号を用いて、障害情報(OIDの内容)を統合監視装置に送信する(例えば、特許文献1参照)。
When the integrated monitoring device recognizes that a failure has occurred in the monitoring item of the network device, the failure information (OID content) is obtained using a signal called GetRequest in order to know the content of the failure in the monitoring item. Is requested to the sub-monitoring device.
When the sub monitoring device receives a GetRequest from the integrated monitoring device, the sub monitoring device transmits failure information (contents of the OID) to the integrated monitoring device using a signal called GetResponse (see, for example, Patent Document 1).

特開2004−280592号公報(段落番号[0013]から[0027]、図1)JP 2004-280592 A (paragraph numbers [0013] to [0027], FIG. 1)

従来の障害監視システムは以上のように構成されているので、LANに接続されているネットワーク機器に障害が発生すると、サブ監視装置がTRAPと呼ばれる信号を用いて、そのネットワーク機器の監視項目に障害が発生していることを統合監視装置に通知するが、障害が同時多発的に発生すると、その障害の発生数分だけTRAPと呼ばれる信号を統合監視装置に送信する必要があるため、統合監視装置がサブ監視装置から障害情報を収集するまでのオーバヘッドが大きくなる課題があった。
また、ネットワーク上でIPパケットの追い越しや欠落などが発生すると、障害の発生を時系列的に把握することができなくなることがある課題もあった。
Since the conventional failure monitoring system is configured as described above, when a failure occurs in a network device connected to the LAN, the sub monitoring device uses a signal called TRAP to cause a failure in the monitoring item of the network device. However, if a failure occurs at the same time, it is necessary to transmit a signal called TRAP to the integrated monitoring device as many times as the number of failures. However, there is a problem that the overhead until the failure information is collected from the sub-monitoring device becomes large.
In addition, when an IP packet is overtaken or dropped on the network, there is a problem that it may not be possible to grasp the occurrence of a failure in time series.

この発明は上記のような課題を解決するためになされたもので、障害が同時多発的に発生しても、オーバヘッドの増大を招くことなく、障害情報を収集することができるとともに、障害の発生を時系列的に把握することができる障害監視システム及び障害監視方法を得ることを目的とする。   The present invention has been made to solve the above-described problems. Even when failures occur at the same time, failure information can be collected without causing an increase in overhead and the occurrence of failures. It is an object of the present invention to obtain a fault monitoring system and a fault monitoring method that can grasp the above in time series.

この発明に係る障害監視システムは、サブ監視装置における障害情報記録手段の記録内容を監視して、前回の監視時と異なる障害情報が記録されているか否かを判定する判定手段を統合監視装置に設け、その判定手段の判定結果が前回の監視時と異なる障害情報が記録されている旨を示している場合、統合監視装置の障害情報収集手段が前回の監視時と異なる障害情報を収集するようにしたものである。   The failure monitoring system according to the present invention monitors the recording contents of the failure information recording means in the sub-monitoring device, and determines in the integrated monitoring device whether or not failure information different from the previous monitoring time is recorded. If the judgment result of the judgment means indicates that fault information different from the previous monitoring is recorded, the fault information collecting means of the integrated monitoring device collects fault information different from the previous monitoring. It is a thing.

この発明によれば、サブ監視装置における障害情報記録手段の記録内容を監視して、前回の監視時と異なる障害情報が記録されているか否かを判定する判定手段を統合監視装置に設け、その判定手段の判定結果が前回の監視時と異なる障害情報が記録されている旨を示している場合、統合監視装置の障害情報収集手段が前回の監視時と異なる障害情報を収集するように構成したので、障害が同時多発的に発生しても、オーバヘッドの増大を招くことなく、障害情報を収集することができる効果がある。
また、サブ監視装置の障害情報記録手段には、障害情報が時系列で記録されているので、障害の発生を時系列的に把握することができる効果がある。
According to this invention, the integrated monitoring device is provided with the determining means for monitoring the recorded contents of the failure information recording means in the sub-monitoring device and determining whether or not the failure information different from the previous monitoring is recorded, Configured so that the fault information collection means of the integrated monitoring device collects fault information different from the previous monitoring when the judgment result of the judgment means indicates that fault information different from the previous monitoring is recorded Therefore, even if failures occur at the same time, failure information can be collected without causing an increase in overhead.
Further, since the failure information is recorded in the failure information recording means of the sub-monitoring device in time series, it is possible to grasp the occurrence of the failure in time series.

実施の形態1.
図1はこの発明の実施の形態1による障害監視システムを示す構成図であり、図において、サブ監視装置1−1〜1−Nは、例えば都道府県単位に設置され、SNMPエージェントを実装している。
サブ監視装置1−1〜1−NのSNMPエージェントはLAN2−1〜2−Nに接続されているネットワーク機器3の状態を監視して、そのネットワーク機器3における監視項目の障害を検出すると、その障害の内容を示す障害情報を時系列で記録する処理を実施する。
統合監視装置4はネットワーク回線5を介してサブ監視装置1−1〜1−Nと接続され、SNMPマネージャを実装している。
統合監視装置4のSNMPマネージャは標準制御/監視プロトコルであるSNMPを用いて、サブ監視装置1−1〜1−NとMIB(Management Information Base RFC1213)と呼ばれる管理情報をメッセージ交換することにより、ネットワーク機器3を管理している。
Embodiment 1 FIG.
FIG. 1 is a block diagram showing a failure monitoring system according to Embodiment 1 of the present invention. In the figure, sub-monitoring devices 1-1 to 1-N are installed in units of prefectures, for example, and implement an SNMP agent. Yes.
When the SNMP agent of the sub-monitoring device 1-1 to 1-N monitors the state of the network device 3 connected to the LAN 2-1 to 2-N and detects a failure of the monitoring item in the network device 3, A process of recording failure information indicating the content of the failure in time series is performed.
The integrated monitoring device 4 is connected to the sub-monitoring devices 1-1 to 1-N via the network line 5, and implements an SNMP manager.
The SNMP manager of the integrated monitoring device 4 uses the standard control / monitoring protocol SNMP to exchange messages between the sub-monitoring devices 1-1 to 1-N and management information called MIB (Management Information Base RFC 1213). The device 3 is managed.

図2はこの発明の実施の形態1による障害監視システムにおけるサブ監視装置1−1〜1−N及び統合監視装置4の内部を示す構成図である。
図において、サブ監視装置1−1〜1−Nの障害検出部11はLAN2−1〜2−Nに接続されているネットワーク機器3の状態を監視して、そのネットワーク機器3における監視項目の障害を検出する処理を実施する。なお、障害検出部11は障害検出手段を構成している。
FIG. 2 is a configuration diagram showing the inside of the sub-monitoring devices 1-1 to 1-N and the integrated monitoring device 4 in the fault monitoring system according to the first embodiment of the present invention.
In the figure, the failure detection unit 11 of the sub-monitoring devices 1-1 to 1-N monitors the status of the network device 3 connected to the LANs 2-1 to 2-N, and the monitoring item failure in the network device 3 is detected. Execute the process to detect. The failure detection unit 11 constitutes a failure detection unit.

サブ監視装置1−1〜1−Nの障害情報記録処理部12は障害検出部11が監視項目の障害を検出すると、その障害の内容を示す障害情報を時系列で障害情報記録メモリ13に記録するとともに、最新の障害情報を指し示すポインタ(障害情報管理ロールメモリ14に管理されているポインタ)を更新する処理を実施する。
障害情報記録メモリ13は障害検出部11により検出された障害の内容を示す障害情報を時系列で記録するロールメモリである。
障害情報管理ロールメモリ14は最新の障害情報を指し示すポインタを管理しているメモリである。
なお、障害情報記録処理部12、障害情報記録メモリ13及び障害情報管理ロールメモリ14から障害情報記録手段が構成されている。
When the failure detection unit 11 detects a failure of the monitoring item, the failure information recording processing unit 12 of the sub monitoring devices 1-1 to 1-N records failure information indicating the content of the failure in the failure information recording memory 13 in time series. At the same time, a process of updating a pointer indicating the latest failure information (a pointer managed in the failure information management roll memory 14) is performed.
The failure information recording memory 13 is a roll memory that records failure information indicating the content of the failure detected by the failure detection unit 11 in time series.
The failure information management role memory 14 is a memory that manages a pointer that points to the latest failure information.
The failure information recording processing unit 12, the failure information recording memory 13, and the failure information management roll memory 14 constitute a failure information recording means.

統合監視装置4のネットワークI/F部21はネットワーク回線5に対するインタフェース処理を実施する。
統合監視装置4の記録内容監視部22はネットワークI/F部21を介して、サブ監視装置1−1〜1−Nの障害情報管理ロールメモリ14により管理されているポインタの変化を監視して、前回の監視時とポインタの位置が異なっているか否かを判定し、前回の監視時とポインタの位置が異なっていれば、異なる障害情報が障害情報記録メモリ13に記録されていると判断する処理を実施する。なお、記録内容監視部22は判定手段を構成している。
The network I / F unit 21 of the integrated monitoring device 4 performs interface processing for the network line 5.
The recorded content monitoring unit 22 of the integrated monitoring device 4 monitors the change of the pointer managed by the failure information management role memory 14 of the sub monitoring devices 1-1 to 1-N via the network I / F unit 21. It is determined whether the pointer position is different from the previous monitoring time. If the pointer position is different from the previous monitoring time, it is determined that different failure information is recorded in the failure information recording memory 13. Perform the process. The recorded content monitoring unit 22 constitutes a determination unit.

統合監視装置4の障害情報収集部23は記録内容監視部22により異なる障害情報が障害情報記録メモリ13に記録されていると判断されると、ネットワークI/F部21を介して、サブ監視装置1−1〜1−Nの障害情報記録メモリ13から前回の監視時と異なる障害情報を収集する処理を実施する。
即ち、障害情報収集部23は前回の監視時においてポインタが指し示している障害情報の次の障害情報から、今回の監視時においてポインタが指し示している最新の障害情報までを収集する処理を実施する。なお、障害情報収集部23は障害情報収集手段を構成している。
統合監視装置4の障害情報記録メモリ24は障害情報収集部23により収集された障害情報を記録するメモリである。
図3はこの発明の実施の形態1による障害監視システムの処理内容を示すシーケンス図である。
When the failure information collecting unit 23 of the integrated monitoring device 4 determines that different failure information is recorded in the failure information recording memory 13 by the recorded content monitoring unit 22, the sub-monitoring device is connected via the network I / F unit 21. A process of collecting failure information different from the previous monitoring time from the failure information recording memory 13 of 1-1 to 1-N is performed.
That is, the failure information collection unit 23 performs a process of collecting from the failure information next to the failure information indicated by the pointer at the previous monitoring to the latest failure information indicated by the pointer at the current monitoring. The failure information collection unit 23 constitutes failure information collection means.
The failure information recording memory 24 of the integrated monitoring device 4 is a memory that records failure information collected by the failure information collection unit 23.
FIG. 3 is a sequence diagram showing the processing contents of the failure monitoring system according to Embodiment 1 of the present invention.

なお、図2の例では、サブ監視装置1−1〜1−Nの構成要素(障害検出部11、障害情報記録処理部12)が専用のハードウェア(例えば、MPUが実装されている半導体回路基板)で構成され、また、統合監視装置4の構成要素(ネットワークI/F部21、記録内容監視部22、障害情報収集部23)が専用のハードウェア(例えば、MPUが実装されている半導体回路基板)で構成されていることを想定しているが、サブ監視装置1−1〜1−N及び統合監視装置4がそれぞれコンピュータで構成されている場合、予め、サブ監視装置1−1〜1−N及び統合監視装置4の構成要素の処理内容が記述されているプログラムをコンピュータのメモリに格納し、コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。   In the example of FIG. 2, the components (the failure detection unit 11 and the failure information recording processing unit 12) of the sub monitoring devices 1-1 to 1-N are dedicated hardware (for example, a semiconductor circuit in which an MPU is mounted). Circuit board, and the components (network I / F unit 21, recorded content monitoring unit 22, failure information collecting unit 23) of the integrated monitoring device 4 are dedicated hardware (for example, a semiconductor on which an MPU is mounted). In the case where the sub monitoring devices 1-1 to 1-N and the integrated monitoring device 4 are each configured by a computer, the sub monitoring devices 1-1 to 1-1 are preliminarily configured. 1-N and the program in which the processing contents of the components of the integrated monitoring device 4 are described are stored in the memory of the computer, and the CPU of the computer executes the program stored in the memory Unishi may be.

次に動作について説明する。
SNMPは、機器やメーカに依存せずに、一元的に情報を管理することができるようにすることを目的にして策定されたものであり、例えば、IPアドレスや、エラーIPパケットの数などの通信情報を機器やメーカに依存せずに管理できるようにしている仕組みである。
例えば、移動通信システムの基地局の障害など、システムやメーカに固有の特定情報を管理する必要がある場合、MIBを拡張する(例えば、管理情報として、ユニークな名前(番号)を追加で定義する)ことにより、システムやメーカに固有の特定情報の管理を可能にしている。
Next, the operation will be described.
SNMP was developed for the purpose of centrally managing information without depending on the device or manufacturer. For example, the IP address, the number of error IP packets, etc. This is a mechanism that allows communication information to be managed without depending on equipment or manufacturers.
For example, when it is necessary to manage specific information unique to a system or a manufacturer, such as a base station failure in a mobile communication system, the MIB is extended (for example, a unique name (number) is additionally defined as management information) This enables management of specific information unique to the system or manufacturer.

ここで、図4は拡張MIBの構成例を示す説明図であり、図4の例では、障害情報を記録している障害情報記録メモリ13(ロールメモリ)上のインデックスであるポインタ、即ち、最新の障害情報を指し示すポインタ(almReadPoint/almWrightPoint)を定義している。また、図4の例では、1〜480個の障害情報をOIDとして定義している。
図5は障害情報管理ロールメモリ14に管理されているポインタを示す説明図である。
Here, FIG. 4 is an explanatory diagram showing a configuration example of the extended MIB. In the example of FIG. 4, a pointer which is an index on the failure information recording memory 13 (roll memory) in which failure information is recorded, that is, the latest A pointer (almReadPoint / almWrightPoint) pointing to the failure information is defined. In the example of FIG. 4, 1 to 480 pieces of failure information are defined as OIDs.
FIG. 5 is an explanatory diagram showing pointers managed in the failure information management role memory 14.

サブ監視装置1−1〜1−Nの障害検出部11は、LAN2−1〜2−Nに接続されているネットワーク機器3の状態を定期的に監視して、そのネットワーク機器3における監視項目の障害を検出する。
監視項目の障害検出方法は、SNMPを使う必然はないが、例えば、何らかのリクエストをネットワーク機器に送信しても、そのネットワーク機器からリクエストに対する応答が得られない場合には、障害が発生しているものと判断する。
The failure detection unit 11 of the sub monitoring devices 1-1 to 1-N periodically monitors the state of the network device 3 connected to the LANs 2-1 to 2-N, Detect failure.
Although the monitoring item failure detection method does not necessarily use SNMP, for example, if a response to a request is not obtained from the network device even if a request is transmitted to the network device, a failure has occurred. Judge that.

サブ監視装置1−1〜1−Nの障害情報記録処理部12は、障害検出部11が監視項目の障害を検出すると、その障害の内容を示す障害情報を時系列で障害情報記録メモリ13に記録する。
即ち、障害情報記録処理部12は、障害検出部11が1以上の障害を検出すると、障害の発生順に、新たな障害の内容を示す障害情報を障害情報記録メモリ13に追加し、障害情報管理ロールメモリ14に管理されているポインタが、最新の障害情報を指し示すように更新する。
例えば、10個の障害情報が障害情報記録メモリ13に記録されているとき、新たに2個の障害が検出されると、障害情報管理ロールメモリ14に管理されているポインタが、12個目の障害情報を指し示すように更新する。
When the failure detection unit 11 detects a failure of the monitoring item, the failure information recording processing unit 12 of the sub monitoring devices 1-1 to 1-N stores failure information indicating the content of the failure in the failure information recording memory 13 in time series. Record.
That is, when the failure detection unit 11 detects one or more failures, the failure information recording processing unit 12 adds failure information indicating new failure contents to the failure information recording memory 13 in the order of occurrence of the failure, and manages the failure information management. The pointer managed in the roll memory 14 is updated so as to point to the latest failure information.
For example, when 10 pieces of failure information are recorded in the failure information recording memory 13 and two new failures are detected, the pointer managed in the failure information management roll memory 14 is changed to the twelfth piece. Update to point to failure information.

統合監視装置4の記録内容監視部22は、図3に示すように、予め設定された監視周期になると、GetRequestと呼ばれる信号を用いて、サブ監視装置1−1〜1−Nの障害情報管理ロールメモリ14により管理されているポインタの位置を示す情報の送信要求をサブ監視装置1−1〜1−Nに送信する。
サブ監視装置1−1〜1−Nの障害情報記録処理部12は、統合監視装置4からGetRequestを受信すると、GetResponseと呼ばれる信号を用いて、障害情報管理ロールメモリ14により管理されているポインタの位置を示す情報を統合監視装置4に送信する。
As shown in FIG. 3, the recorded content monitoring unit 22 of the integrated monitoring device 4 uses a signal called GetRequest to manage the failure information of the sub-monitoring devices 1-1 to 1-N when a preset monitoring cycle is reached. A transmission request for information indicating the position of the pointer managed by the roll memory 14 is transmitted to the sub monitoring devices 1-1 to 1-N.
Upon receiving a GetRequest from the integrated monitoring device 4, the failure information recording processing unit 12 of the sub-monitoring device 1-1 to 1-N uses a signal called GetResponse to update the pointers managed by the failure information management role memory 14. Information indicating the position is transmitted to the integrated monitoring device 4.

統合監視装置4の記録内容監視部22は、ネットワークI/F部21がポインタの位置を示す情報を受信すると、前回の監視時におけるポインタの位置と今回の監視時におけるポインタの位置とを比較することにより、障害情報管理ロールメモリ14により管理されているポインタの変化を監視する。
統合監視装置4の記録内容監視部22は、前回の監視時におけるポインタの位置と今回の監視時におけるポインタの位置が一致している場合、新たな障害が発生していないものと判断する。
図3の場合、1回目の監視周期では、前回の監視時におけるポインタの位置と今回の監視時におけるポインタの位置が一致しており、新たな障害が発生していないものと判断される。
When the network I / F unit 21 receives information indicating the position of the pointer, the recorded content monitoring unit 22 of the integrated monitoring apparatus 4 compares the pointer position at the previous monitoring time with the pointer position at the current monitoring time. Thus, the change of the pointer managed by the failure information management roll memory 14 is monitored.
The recorded content monitoring unit 22 of the integrated monitoring device 4 determines that a new failure has not occurred when the position of the pointer at the previous monitoring matches the position of the pointer at the current monitoring.
In the case of FIG. 3, in the first monitoring cycle, the position of the pointer at the previous monitoring and the position of the pointer at the current monitoring match, and it is determined that no new failure has occurred.

統合監視装置4の記録内容監視部22は、前回の監視時におけるポインタの位置と今回の監視時におけるポインタの位置が異なる場合、新たな障害が発生しているものと判断する。
図3の場合、2,3回目の監視周期では、前回の監視時におけるポインタの位置と今回の監視時におけるポインタの位置が異なっており、新たな障害が発生しているものと判断される。
The recorded content monitoring unit 22 of the integrated monitoring device 4 determines that a new failure has occurred when the position of the pointer at the previous monitoring is different from the position of the pointer at the current monitoring.
In the case of FIG. 3, in the second and third monitoring cycles, the position of the pointer at the previous monitoring is different from the position of the pointer at the current monitoring, and it is determined that a new failure has occurred.

統合監視装置4の障害情報収集部23は、記録内容監視部22が新たな障害が発生しているものと判断すると、GetRequestと呼ばれる信号を用いて、障害情報記録メモリ13に記録されている新たな障害情報の送信要求をサブ監視装置1−1〜1−Nに送信する。
即ち、障害情報収集部23は、前回の監視時においてポインタが指し示している障害情報の次の障害情報から、今回の監視時においてポインタが指し示している最新の障害情報までの送信をサブ監視装置1−1〜1−Nに要求する。
図3の場合、2回目の監視周期では、ポインタが0→5に進んでいるので、ポインタ1,2,3,4,5に対応する障害情報の送信要求をサブ監視装置1−1〜1−Nに送信する(図5を参照)。
また、3回目の監視周期では、ポインタが5→8に進んでいるので、ポインタ6,7,8に対応する障害情報の送信要求をサブ監視装置1−1〜1−Nに送信する(図5を参照)。
When the failure information collection unit 23 of the integrated monitoring device 4 determines that the new content has occurred, the new recorded content is recorded in the failure information recording memory 13 using a signal called GetRequest. A failure information transmission request is transmitted to the sub monitoring devices 1-1 to 1-N.
That is, the failure information collection unit 23 transmits the transmission from the failure information next to the failure information indicated by the pointer at the previous monitoring to the latest failure information indicated by the pointer at the current monitoring. -1 to 1-N are requested.
In the case of FIG. 3, in the second monitoring cycle, since the pointer advances from 0 to 5, the transmission request for the failure information corresponding to the pointers 1, 2, 3, 4, and 5 is sent to the sub monitoring devices 1-1 to 1. -N (see FIG. 5).
In the third monitoring cycle, since the pointer advances from 5 to 8, a failure information transmission request corresponding to the pointers 6, 7, and 8 is transmitted to the sub monitoring devices 1-1 to 1-N (FIG. 5).

サブ監視装置1−1〜1−Nの障害情報記録処理部12は、統合監視装置4からGetRequestを受信すると、GetResponseと呼ばれる信号を用いて、障害情報記録メモリ13に時系列で記録されている障害情報を統合監視装置4に送信する。
図3の場合、2回目の監視周期では、ポインタ1,2,3,4,5に対応する障害情報を統合監視装置4に送信する。
また、3回目の監視周期では、ポインタ6,7,8に対応する障害情報を統合監視装置4に送信する。
統合監視装置4の障害情報収集部23は、ネットワークI/F部21がサブ監視装置1−1〜1−Nから送信された障害情報を受信すると、その障害情報を障害情報記録メモリ24に記録する。
When the failure information recording processing unit 12 of the sub monitoring devices 1-1 to 1-N receives the GetRequest from the integrated monitoring device 4, it is recorded in the failure information recording memory 13 in time series using a signal called GetResponse. The failure information is transmitted to the integrated monitoring device 4.
In the case of FIG. 3, failure information corresponding to the pointers 1, 2, 3, 4, and 5 is transmitted to the integrated monitoring device 4 in the second monitoring cycle.
In the third monitoring cycle, failure information corresponding to the pointers 6, 7, and 8 is transmitted to the integrated monitoring device 4.
When the network I / F unit 21 receives the failure information transmitted from the sub monitoring devices 1-1 to 1-N, the failure information collection unit 23 of the integrated monitoring device 4 records the failure information in the failure information recording memory 24. To do.

以上で明らかなように、この実施の形態1によれば、サブ監視装置1−1〜1−Nにおける障害情報の記録内容を監視して、前回の監視時と異なる障害情報が記録されているか否かを判定し、前回の監視時と異なる障害情報が記録されている場合、統合監視装置4の障害情報収集部23が前回の監視時と異なる障害情報を収集するように構成したので、障害が同時多発的に発生しても、オーバヘッドの増大を招くことなく、障害情報を収集することができる効果を奏する。
即ち、サブ監視装置1−1〜1−Nが障害の発生を検出しても、従来例のように、TRAPと呼ばれる信号を統合監視装置4に送信する必要がないので、同時多発的に障害が発生しても、統合監視装置における障害情報の収集のオーバヘッドの増大を抑制することができる。
また、この実施の形態1によれば、サブ監視装置1−1〜1−Nの障害情報記録メモリ13には、障害情報が時系列で記録されているので、障害の発生を時系列的に把握することができる効果も奏する。
As is apparent from the above, according to the first embodiment, whether the failure monitoring information recorded in the sub monitoring devices 1-1 to 1-N is monitored and failure information different from the previous monitoring time is recorded. If failure information different from the previous monitoring is recorded, the failure information collection unit 23 of the integrated monitoring device 4 is configured to collect failure information different from the previous monitoring. Even if multiple occurrences occur simultaneously, the failure information can be collected without increasing the overhead.
That is, even if the sub-monitoring devices 1-1 to 1-N detect the occurrence of a failure, it is not necessary to transmit a signal called TRAP to the integrated monitoring device 4 as in the conventional example. Even if this occurs, an increase in the overhead of collecting fault information in the integrated monitoring apparatus can be suppressed.
Further, according to the first embodiment, since the failure information is recorded in the failure information recording memory 13 of the sub-monitoring devices 1-1 to 1-N in time series, occurrence of the failure is detected in time series. There is also an effect that can be grasped.

また、この実施の形態1によれば、サブ監視装置1−1〜1−Nの障害情報記録処理部12が障害検出部11により検出された障害の内容を示す障害情報を時系列で記録する際、最新の障害情報を指し示すポインタを更新し、統合監視装置4の記録内容監視部22が上記ポインタの変化を監視して、前回の監視時と異なる障害情報が記録されているか否かを判定するように構成したので、データ量が多い障害情報の内容自体を比較しないでも、簡単に、前回の監視時と異なる障害情報が記録されているか否かを判別することができる効果を奏する。   Further, according to the first embodiment, the failure information recording processing unit 12 of the sub monitoring devices 1-1 to 1-N records failure information indicating the content of the failure detected by the failure detection unit 11 in time series. At this time, the pointer indicating the latest failure information is updated, and the recording content monitoring unit 22 of the integrated monitoring device 4 monitors the change of the pointer to determine whether or not failure information different from the previous monitoring time is recorded. Thus, it is possible to easily determine whether or not failure information different from the previous monitoring time is recorded without comparing the contents of failure information having a large amount of data.

さらに、この実施の形態1によれば、統合監視装置4の障害情報収集部23が、前回の監視時においてポインタが指し示している障害情報の次の障害情報から、今回の監視時においてポインタが指し示している最新の障害情報までを収集するように構成したので、障害情報の収集のオーバヘッドの増大を招くことなく、全ての障害情報を収集することができる効果を奏する。   Further, according to the first embodiment, the failure information collection unit 23 of the integrated monitoring device 4 indicates that the pointer points at the current monitoring time from the failure information next to the failure information pointed to by the pointer at the previous monitoring time. Therefore, it is possible to collect all the failure information without increasing the overhead of collecting the failure information.

この発明の実施の形態1による障害監視システムを示す構成図である。BRIEF DESCRIPTION OF THE DRAWINGS It is a block diagram which shows the failure monitoring system by Embodiment 1 of this invention. この発明の実施の形態1による障害監視システムにおけるサブ監視装置及び統合監視装置の内部を示す構成図である。It is a block diagram which shows the inside of the sub monitoring apparatus and integrated monitoring apparatus in the failure monitoring system by Embodiment 1 of this invention. この発明の実施の形態1による障害監視システムの処理内容を示すシーケンス図である。It is a sequence diagram which shows the processing content of the failure monitoring system by Embodiment 1 of this invention. 拡張MIBの構成例を示す説明図である。It is explanatory drawing which shows the structural example of extended MIB. 障害情報管理ロールメモリに管理されているポインタを示す説明図である。It is explanatory drawing which shows the pointer managed by the failure information management roll memory.

符号の説明Explanation of symbols

1−1〜1−N サブ監視装置、2−1〜2−N LAN、3 ネットワーク機器、4 統合監視装置、5 ネットワーク回線、11 障害検出部(障害検出手段)、12 障害情報記録処理部(障害情報記録手段)、13 障害情報記録メモリ(障害情報記録手段)、14 障害情報管理ロールメモリ(障害情報記録手段)、21 ネットワークI/F部、22 記録内容監視部(判定手段)、23 障害情報収集部(障害情報収集手段)、24 障害情報記録メモリ。
1-1 to 1-N sub-monitoring device, 2-1 to 2-N LAN, 3 network equipment, 4 integrated monitoring device, 5 network line, 11 failure detection unit (failure detection means), 12 failure information recording processing unit ( Fault information recording means), 13 Fault information recording memory (failure information recording means), 14 Fault information management role memory (failure information recording means), 21 Network I / F section, 22 Recorded content monitoring section (determination means), 23 Fault Information collecting unit (fault information collecting means), 24 fault information recording memory.

Claims (4)

予め設定されている監視項目の状態を監視して、上記監視項目の障害を検出する障害検出手段と、上記障害検出手段により検出された障害の内容を示す障害情報を時系列で記録する障害情報記録手段とを有するサブ監視装置と、上記サブ監視装置における障害情報記録手段の記録内容を監視して、前回の監視時と異なる障害情報が記録されているか否かを判定する判定手段と、上記判定手段の判定結果が前回の監視時と異なる障害情報が記録されている旨を示している場合、前回の監視時と異なる障害情報を収集する障害情報収集手段とを有する統合監視装置とを備えた障害監視システム。   Fault detection means for monitoring the status of preset monitoring items and detecting faults of the monitoring items, and fault information for recording fault information indicating the contents of faults detected by the fault detection means in time series A sub-monitoring device having a recording unit, a determination unit that monitors the recording contents of the fault information recording unit in the sub-monitoring device, and determines whether or not fault information different from the previous monitoring time is recorded, and An integrated monitoring device having fault information collecting means for collecting fault information different from the previous monitoring time when the judgment result of the judgment means indicates that fault information different from the previous monitoring time is recorded Fault monitoring system. サブ監視装置の障害情報記録手段が障害検出手段により検出された障害の内容を示す障害情報を時系列で記録する際、最新の障害情報を指し示すポインタを更新し、統合監視装置の判定手段が上記ポインタの変化を監視して、前回の監視時と異なる障害情報が記録されているか否かを判定することを特徴とする請求項1記載の障害監視システム。   When the failure information recording unit of the sub-monitoring device records the failure information indicating the content of the failure detected by the failure detection unit in time series, the pointer indicating the latest failure information is updated, and the determination unit of the integrated monitoring device 2. The failure monitoring system according to claim 1, wherein a change in pointer is monitored to determine whether or not failure information different from the previous monitoring is recorded. 統合監視装置の障害情報収集手段は、前回の監視時においてポインタが指し示している障害情報の次の障害情報から、今回の監視時においてポインタが指し示している最新の障害情報までを収集することを特徴とする請求項2記載の障害監視システム。   The failure information collection means of the integrated monitoring device collects from the failure information next to the failure information pointed to by the pointer during the previous monitoring to the latest failure information pointed to by the pointer during the current monitoring. The failure monitoring system according to claim 2. サブ監視装置が予め設定されている監視項目の状態を監視して、上記監視項目の障害を検出すると、障害の内容を示す障害情報を時系列で記録する一方、統合監視装置が上記サブ監視装置における障害情報の記録内容を監視して、前回の監視時と異なる障害情報が記録されているか否かを判定し、前回の監視時と異なる障害情報が記録されている場合、前回の監視時と異なる障害情報を収集する障害監視方法。
When the sub-monitoring device monitors the state of the monitoring item set in advance and detects a failure in the monitoring item, failure information indicating the content of the failure is recorded in time series, while the integrated monitoring device records the failure in the sub-monitoring device. The content of the failure information recorded in is monitored and it is determined whether or not failure information different from the previous monitoring time is recorded. If failure information different from the previous monitoring time is recorded, A fault monitoring method that collects different fault information.
JP2006056689A 2006-03-02 2006-03-02 Failure monitoring system and failure monitoring method Pending JP2007233858A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006056689A JP2007233858A (en) 2006-03-02 2006-03-02 Failure monitoring system and failure monitoring method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006056689A JP2007233858A (en) 2006-03-02 2006-03-02 Failure monitoring system and failure monitoring method

Publications (1)

Publication Number Publication Date
JP2007233858A true JP2007233858A (en) 2007-09-13

Family

ID=38554369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006056689A Pending JP2007233858A (en) 2006-03-02 2006-03-02 Failure monitoring system and failure monitoring method

Country Status (1)

Country Link
JP (1) JP2007233858A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009122820A (en) * 2007-11-13 2009-06-04 Yamatake Corp Remote monitoring information collection system, remote monitoring information collection device, monitoring terminal, and remote monitoring information collection method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08286984A (en) * 1995-04-19 1996-11-01 Fuji Xerox Co Ltd Fault information notifying system
JPH11122244A (en) * 1997-10-20 1999-04-30 Fujitsu Ltd Managing device for large scaled network
JP2005115724A (en) * 2003-10-09 2005-04-28 Yamatake Corp Data collection device, method and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08286984A (en) * 1995-04-19 1996-11-01 Fuji Xerox Co Ltd Fault information notifying system
JPH11122244A (en) * 1997-10-20 1999-04-30 Fujitsu Ltd Managing device for large scaled network
JP2005115724A (en) * 2003-10-09 2005-04-28 Yamatake Corp Data collection device, method and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009122820A (en) * 2007-11-13 2009-06-04 Yamatake Corp Remote monitoring information collection system, remote monitoring information collection device, monitoring terminal, and remote monitoring information collection method

Similar Documents

Publication Publication Date Title
JP4576249B2 (en) Network management apparatus and method
CN110661669B (en) Network topology automatic discovery method of network equipment based on ICMP, TCP and UDP protocols
AU2003257943B2 (en) Method and apparatus for outage measurement
JP2007235897A (en) Apparatus and method for network monitoring
US11509552B2 (en) Application aware device monitoring correlation and visualization
JP4412031B2 (en) Network monitoring system and method, and program
US20160119181A1 (en) Network state monitoring system
JP2010063058A (en) Device, method and program for monitoring network
US11032124B1 (en) Application aware device monitoring
JP2009117920A (en) Communication apparatus and method and communication program
JP2005072723A (en) Apparatus for detecting fault in communication network
US8467301B2 (en) Router misconfiguration diagnosis
CN113810238A (en) Network monitoring method, electronic device and storage medium
JP2010041604A (en) Network management method
WO2012070274A1 (en) Communication system and network malfunction detection method
JP2007233858A (en) Failure monitoring system and failure monitoring method
JP2007228421A (en) Ip network route diagnosis apparatus and ip network route diagnosis system
US8873433B2 (en) Method of determining immediate topology of a network connection
JP6542538B2 (en) Network monitoring system, monitoring device and monitoring method
JP2004104540A (en) Support system for analyzing network performance fault
JP2010204850A (en) Failure monitoring system
JP2008005118A (en) Network monitor system
JP2003070081A (en) Monitor system
JP2006279281A (en) Network supervisory system, supervisory office, and supervisory object device
JPH09247146A (en) Network management system

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070926

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080627

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110816

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111011

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111207

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120104