JP2014053658A - Failure site estimation system and failure site estimation program - Google Patents
Failure site estimation system and failure site estimation program Download PDFInfo
- Publication number
- JP2014053658A JP2014053658A JP2012194743A JP2012194743A JP2014053658A JP 2014053658 A JP2014053658 A JP 2014053658A JP 2012194743 A JP2012194743 A JP 2012194743A JP 2012194743 A JP2012194743 A JP 2012194743A JP 2014053658 A JP2014053658 A JP 2014053658A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- interface
- site
- node
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、ネットワークの管理技術に関し、特に、ネットワーク障害の際に障害部位を推定する障害部位推定システムおよび障害部位推定プログラムに適用して有効な技術に関するものである。 The present invention relates to a network management technique, and more particularly to a technique effective when applied to a failure part estimation system and a failure part estimation program for estimating a failure part in the event of a network failure.
通常、ネットワークシステムを運用・管理する際には、例えばネットワーク監視システム等により障害の監視・検知と障害部位の特定などが行われる。一般的に、ネットワーク監視システムは、例えば、ベンダー等から提供・市販されているソフトウェアやシステム、装置等により構成される。 Normally, when operating and managing a network system, for example, a network monitoring system or the like monitors and detects a fault and identifies a faulty part. In general, a network monitoring system is configured by software, a system, a device, or the like provided / marketed by a vendor or the like, for example.
しかしながら、大規模なネットワークシステムでは、例えば、コアとなるネットワーク機器に障害が発生したような場合には、他の機器にも影響が及び、ネットワーク監視システムで障害として検知されるネットワーク機器が一時的に膨大な数となる場合も多く、正確な障害部位を特定することが困難な場合がある。特に、障害となったネットワーク機器がハードウェア障害等により完全に停止等してしまったような状態ではなく、正常な処理とエラー処理とが繰り返されるような「半死」の状態の場合は、ネットワーク監視システムにより障害部位を特定することはさらに困難となる。 However, in a large-scale network system, for example, when a failure occurs in a core network device, other devices are affected, and the network device detected as a failure by the network monitoring system is temporarily In many cases, it is difficult to specify an exact fault site. In particular, if the network device that has failed is not in a state where it has been completely stopped due to a hardware failure, etc., but in a “half-dead” state in which normal processing and error processing are repeated, the network It becomes more difficult to identify the faulty part by the monitoring system.
通常このような場合は、SE(System Engineer)等の当該ネットワークシステムに精通した技術者や開発者が手動で障害を解析し切り分けて、障害部位を特定することになる。しかしながら、このような障害解析や障害部位の特定手法は属人的であり、また、効率も悪く、対応策(例えば、特定のネットワーク機器の再起動など)の実施までに長時間を要する結果となる場合も多い。 Usually, in such a case, an engineer or developer who is familiar with the network system such as SE (System Engineer) manually analyzes and isolates the fault to identify the fault site. However, such failure analysis and failure location identification methods are personal, inefficient, and take a long time to implement countermeasures (for example, restarting specific network devices). There are many cases.
これに対し、ネットワークシステムにおける障害部位の特定を効率的に行う仕組みとして、例えば、特開2006−229421号公報(特許文献1)には、分岐と端末で構成されたツリー型のネットワークのトポロジを、ツリーの根本側が上層側で先端側が下層側であり、各分岐にて1つ下の層が現れ、各分岐とその下層側の端末が関連づけられた階層構造で表現する階層構造テーブルを用い、ある分岐からツリー先端に向かうすべての下層側端末の故障が検出されたときに、当該分岐部分を推定故障箇所として求めることで、ネットワークの端末以外の故障を容易に診断する技術が記載されている。 On the other hand, as a mechanism for efficiently identifying a faulty part in a network system, for example, Japanese Patent Laying-Open No. 2006-229421 (Patent Document 1) describes a tree-type network topology composed of branches and terminals. , Using a hierarchical structure table in which the root side of the tree is the upper layer side and the tip side is the lower layer side, the next lower layer appears in each branch, and each branch and its lower layer side are associated with each other in a hierarchical structure. Describes a technique for easily diagnosing failures other than network terminals by finding the branch portion as an estimated failure location when failures in all lower-layer terminals from a certain branch toward the top of the tree are detected .
また、特開2006−238052号公報(特許文献2)には、ネットワークの利用者が流しているフローの送信者アドレス、受信者アドレス及び通信品質を含むフロー品質情報を収集するフロー品質情報収集部と、ネットワークの構成情報を収集する経路情報収集手段と、収集されたフロー品質情報及びネットワークの構成情報とに基づき、フローが経由するリンクを求め、かつフローの品質劣化の有無を判定し、その結果をテーブルとして管理するフロー品質/経由リンクテーブル管理部及びテーブル記憶部と、管理されているテーブルにおいて、1つ以上のフローに品質劣化があった場合、その品質劣化を起こした任意のフローの集合が経由するリンクの集合の部分集合の中で、品質劣化を起こした任意のフローが経由しているリンクを含む部分集合であって、かつ、最小の要素数をもつ部分集合を、品質劣化箇所として出力する品質劣化箇所推定部とを有することで、精度高くかつ高速な品質劣化箇所推定を可能にする技術が記載されている。 Japanese Patent Laying-Open No. 2006-238052 (Patent Document 2) discloses a flow quality information collection unit that collects flow quality information including a sender address, a receiver address, and communication quality of a flow that is being flowed by a network user. And a route information collection means for collecting network configuration information, and a link through which the flow passes is determined based on the collected flow quality information and the network configuration information, and the presence / absence of flow quality degradation is determined. In the flow quality / routed link table management unit and table storage unit that manage the results as a table, and in the managed table, if there is quality degradation in one or more flows, the flow of any flow that caused the quality degradation A link through which an arbitrary flow that has degraded quality is in a subset of the set of links through which the set passes Technology that enables high-precision and high-speed quality degradation location estimation by having a quality degradation location estimation unit that outputs a subset that includes a minimum number of elements as a quality degradation location. Is described.
また、特開2010−147595号公報(特許文献3)には、管理対象装置とその装置への経路上の管理対象装置を示す経路情報とを対応づけて保持するネットワーク構成DB記憶部と、送達確認に対する応答がなかった場合は、その応答がなかった管理対象装置の経路情報を保持している情報から抽出して、その経路情報の管理対象装置に対する送達確認を実施し、その送達確認に対する応答のなかった管理対象装置を障害発生装置として特定するネットワーク管理部とを備えることで、ネットワーク層における障害監視を送達確認により実施し、ネットワーク障害の原因装置を迅速に切り分ける技術が記載されている。 Japanese Patent Laid-Open No. 2010-147595 (Patent Document 3) discloses a network configuration DB storage unit that holds a management target device and path information indicating a management target device on a path to the device, and a delivery If there is no response to the confirmation, it is extracted from the information holding the route information of the managed device that has not responded, the delivery confirmation of the route information to the managed device is performed, and the response to the delivery confirmation A technology is described that includes a network management unit that identifies a management target device that has not been detected as a failure generation device so that failure monitoring in the network layer is performed by confirmation of delivery, and a device that causes a network failure is quickly identified.
特許文献1に記載されたような技術では、ツリー型のネットワークトポロジから故障箇所の分岐部分を推定することができる。しかしながら、そのためには、例えばCAD等により予めネットワークのトポロジに係る情報を作成しておく必要があり、ネットワークの構成変更などを考慮すると、簡潔性や柔軟性に欠ける場合がある。また、ポーリングに対する応答の有無によって故障を判断しており、ネットワーク機器が論理障害等による「半死」の状態では的確に障害を判断することができない場合も生じ得る。
With the technique described in
また、特許文献2に記載されたような技術では、パケットロスや遅延などの通信品質に基づいてフローの品質劣化を判断し、品質劣化を起こしたフローの集合が経由しているリンクの集合の情報に基づいて品質劣化箇所を推定することができる。しかしながら、ネットワークの障害により末端部分の機器等からは品質情報自体が収集できない場合も想定され、障害の態様によっては推定の精度が維持できない場合も生じ得る。
Further, in the technique as described in
また、特許文献3に記載されたような技術では、管理対象装置への送達確認に対する応答がなかった場合は、その経路上の管理対象装置への送達確認を行うことで、障害の原因装置を特定することができるが、やはり、送達確認に対する応答の有無によって障害を判断しているため、ネットワーク機器が論理障害等による「半死」の状態では的確に障害を判断することができない場合も生じ得る。
In addition, in the technology as described in
そこで本発明の目的は、大規模なネットワークシステムにおける障害の際に、障害原因となったネットワーク機器が論理障害の場合も含めて、障害の被疑部位を迅速に推定して絞り込むことを可能とする障害部位推定システムおよび障害部位推定プログラムを提供することにある。本発明の前記ならびにその他の目的と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。 Accordingly, an object of the present invention is to quickly estimate and narrow down a suspected part of a failure in the case of a failure in a large-scale network system, including the case where the network device that caused the failure is a logical failure. An object of the present invention is to provide an obstacle site estimation system and an obstacle site estimation program. The above and other objects and novel features of the present invention will be apparent from the description of this specification and the accompanying drawings.
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、以下のとおりである。 Of the inventions disclosed in this application, the outline of typical ones will be briefly described as follows.
本発明の代表的な実施の形態による障害部位推定システムは、ネットワーク機器からなるノードがツリー型に接続された構成を有する監視対象ネットワークにおいて障害が発生した場合に障害被疑部位を推定する障害部位推定システムであって、以下の特徴を有するものである。 A failure site estimation system according to a representative embodiment of the present invention estimates a failure site when a failure occurs in a monitored network having a configuration in which nodes composed of network devices are connected in a tree shape. A system having the following characteristics.
すなわち、前記監視対象ネットワークの正常時に、前記監視対象ネットワーク内の各ノードについて、当該ノードに至る通信経路上の各ノードのインタフェースからなる経路情報を取得して、経路情報記録手段に記録する経路情報取得部と、前記監視対象ネットワークの障害時に、障害となっている各ノードに至る経路情報を前記経路情報記録手段からそれぞれ取得し、当該経路情報に含まれる各インタフェースに対して逐次ポーリングを行って、OKもしくはNGの結果を収集する逐次ポーリング部と、経路情報に含まれる各インタフェースにおいて、前記ポーリングの結果がNGとなった最も手前のインタフェースと、その1つ手前の前記ポーリングの結果がOKとなったインタフェースとを被疑ペアとし、障害となっている各ノードについて被疑ペアを抽出して被疑ペア集合を取得する被疑ペア抽出部と、前記被疑ペア集合と前記経路情報記録手段に記録された経路情報とに基いて、障害被疑部位を抽出して出力する障害部位出力部とを有することを特徴とする。 That is, when the monitoring target network is normal, for each node in the monitoring target network, route information including the interface of each node on the communication route to the node is acquired and recorded in the route information recording unit In the event of a failure of the monitoring target network, the acquisition unit acquires route information from the route information recording unit to each of the failed nodes, and sequentially polls each interface included in the route information. , A sequential polling unit that collects OK or NG results, and the interface that is included in the path information, the interface that is closest to the polling result is NG, and the polling result that is immediately before that is OK The failed interface to each failed node. A suspicious pair extraction unit that extracts a suspicious pair and obtains a suspicious pair set, and a failure that extracts and outputs a suspicious part based on the suspected pair set and the route information recorded in the route information recording means It has the site | part output part, It is characterized by the above-mentioned.
また、本発明は、コンピュータを上記のような障害部位推定システムとして動作させるプログラムにも適用することができる。 The present invention can also be applied to a program that causes a computer to operate as the above-described failure site estimation system.
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。 Among the inventions disclosed in the present application, effects obtained by typical ones will be briefly described as follows.
すなわち、本発明の代表的な実施の形態によれば、大規模なネットワークシステムにおける障害の際に、障害原因となったネットワーク機器が論理障害の場合も含めて、障害の被疑部位を迅速に推定して絞り込むことが可能となる。 That is, according to the representative embodiment of the present invention, in the event of a failure in a large-scale network system, the suspected site of failure is quickly estimated, including the case where the network device that caused the failure is a logical failure. It becomes possible to narrow down.
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一部には原則として同一の符号を付し、その繰り返しの説明は省略する。また、以下においては、本発明の特徴を分かり易くするために、従来の技術と比較して説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Note that components having the same function are denoted by the same reference symbols throughout the drawings for describing the embodiment, and the repetitive description thereof will be omitted. In the following, in order to make the features of the present invention easier to understand, the description will be made in comparison with the prior art.
<概要>
図10は、従来技術におけるネットワーク監視の例について概要を示した図である。図10では、複数のルータ等のネットワーク(NW)機器310により構成されるツリー型の監視対象ネットワーク(NW)300に対して、ベンダー各社から提供される市販のツール等により構成される障害監視システム200が接続され、監視対象NW300での障害発生を常時監視する構成を示している。ここでは、障害監視システム200は、各NW機器310に対して、例えば、ICMP(Internet Control Message Protocol)/SNMP(Simple Network Management Protocol)ポーリングにより死活監視を行う。
<Overview>
FIG. 10 is a diagram showing an overview of an example of network monitoring in the prior art. In FIG. 10, a fault monitoring system configured by a commercially available tool or the like provided by each vendor for a tree-type monitored network (NW) 300 configured by a network (NW)
ここで例えば、NW機器310aで障害が発生した場合、一般的な障害監視システム200では、ネットワーク構成上で配下の各機器(図中の網掛けされたNW機器310)についても、オペレータが確認する監視画面上で障害として表示してしまう。特に、NW機器310aが論理障害等による「半死」状態のような場合には、障害監視システム200による死活監視のポーリングのタイミングによって、障害機器がランダムかつ大量に表示され、監視画面上では、どの部位が障害の根本原因となっているのかを判別することが困難となる。
Here, for example, when a failure occurs in the
このような場合には、SE等の技術者が呼ばれて障害解析・切り分け等を行い、障害部位をNW機器310aであると特定することになる。しかしながら、ハードウェア障害ではなく論理障害の場合には、機器のログ等を参照しても障害の発生状況が不明である場合もあり、このような人手による手法では、障害部位を特定するまでに数十分から数時間という長時間を要してしまう場合がほとんどである。特に大規模システムでは、より迅速な障害部位の特定と対応策の実施が望まれる。
In such a case, an engineer such as SE is called to perform failure analysis, isolation, etc., and specify the failure site as the
障害部位の正確な特定をシステムで自動的に行うには、これに応じた大掛かりな監視システムや解析システム等が必要となる。一方で、より低コストで簡易的に行うには、例えば、障害の被疑部位をある程度絞り込んで通知するところまでを自動化し、その後は絞り込まれた対象のNW機器310の全部、もしくはそこから人手によりさらに絞り込んだ一部の機器に対して対応策を実施することで、迅速に復旧を図ることが可能となる場合もある。
In order to automatically identify the faulty part automatically in the system, a large-scale monitoring system or analysis system corresponding to this is required. On the other hand, in order to perform simply and at a lower cost, for example, automate the process of narrowing down the suspected part of the failure to some extent, and then manually or manually from the narrowed-down
論理障害(例えば、ルーティングテーブルの異常など)の場合には、一般的な傾向として、例えば、NW機器310からエラーや異常なログなどは出力されず、一見して正常に稼働しているように見える場合がある。また、pingが通らなくなるケースの他にpingが通ったり通らなかったりするケースがあること、ショートフレームのpingは通るがロングフレームのpingは通らなかったりするケースがあることなどから、pingのやり方を工夫することで論理障害を把握することが可能である。また、論理障害の迅速な復旧のためには障害部位を特定して切り離す(電源断や再起動など)ことが効果的である。
In the case of a logical failure (for example, an abnormality in a routing table), as a general tendency, for example, an error or an abnormal log is not output from the
そこで、本発明の一実施の形態である障害部位推定システムは、例えば、ハードウェア障害で障害監視システム200に大量に障害メッセージ等が表示されるような場合であっても、迅速に障害部位を特定して効率的にログの確認などが行えるようにするとともに、論理障害の場合にも迅速に障害の被疑部位を推定して絞り込み、対応策の実施を可能とする。
In view of this, the failure site estimation system according to an embodiment of the present invention can quickly identify a failure site even when a large number of failure messages are displayed on the
簡易的に迅速に障害部位を推定して絞り込むことを可能とするために、本実施の形態では、正常時に定期的に監視対象NW300における経路情報と品質情報を収集して記録しておき、障害時・異常時(障害監視システム200で障害を検知した場合)に、正常時に取得しておいた通信経路に従ってホップバイホップでpingによるポーリングを行う。このポーリングの成否(死活情報)に基づいて障害部位の集合を抽出し、そこから所定のロジックにより原因となる障害被疑部位を推定して抽出する。ここで、ポーリングの成否は、応答の有無だけに限らず、正常時の品質情報との比較に基づいて一定以上品質の劣化があった場合に障害部位と判断することで、論理障害のような「半死」の場合でも障害部位の推定を可能とする。
In this embodiment, in order to enable easy and quick estimation and narrowing down of a faulty part, in this embodiment, route information and quality information in the
図2は、本発明の一実施の形態におけるネットワーク監視の例について概要を示した図である。ここでは、従来の障害監視システム200に加えて、障害部位の推定を行う障害部位推定システム100を有し、障害監視システム200等においてNW機器310aが原因の障害を検知した場合に(図10の場合と同様に、配下のNW機器310が障害状態として検知される)、障害部位推定システム100において、障害となっている各NW機器310への経路情報と、通信経路上の死活情報とを分析して、NW機器310aが障害の被疑部位であると推定することを可能とするものである。
FIG. 2 is a diagram showing an overview of an example of network monitoring according to an embodiment of the present invention. Here, in addition to the conventional
<システム構成>
図1は、本発明の一実施の形態である障害部位推定システム100を有するネットワーク監視システムの構成例について概要を示した図である。ネットワーク監視システムは、上述の図2において示したように、監視対象NW300に対して、障害監視システム200と障害部位推定システム100が接続される構成を有している。
<System configuration>
FIG. 1 is a diagram showing an outline of a configuration example of a network monitoring system having a failure
監視対象NW300は、ルータ等の多数のNW機器310から構成されるツリー型のネットワークであり、各NW機器310は必要に応じて経路情報を保持するルーティングテーブル311を有している。また、障害監視システム200は、上述したような、ベンダー各社から提供される市販のツール等により構成され、監視対象NW300の各NW機器310に対して、例えば、ICMP/SNMPポーリングにより死活監視を行って障害を検知し、これをネットワークトポロジを表現したマップ上に表示したり、障害通知メッセージとして表示したりして通知する情報処理システムである。
The
障害部位推定システム100は、障害監視システム200において監視対象NW300内の複数のノード(NW機器310)での障害を検知した場合に、各ノードへの経路情報と通信経路上の各ノードにおける死活情報とに基づいて、各ノード障害の原因となる通信経路上の共通部位を特定して障害部位として推定するシステムである。なお、本実施の形態では、障害部位推定システム100を障害監視システム200とは別個のシステムとして構成する例を示しているが、これらを1つのシステムとして構成することも当然可能である。
When the
この障害部位推定システム100は、例えば、PC(Personal Computer)やサーバ機器などにより構成される情報処理システムであり、ソフトウェアとして実装される経路情報取得部110および障害部位推定部120と、データベースやファイルテーブル等として実装される経路情報データベース(DB)130などを有する。
The fault
経路情報取得部110は、監視対象NW300が正常時に、監視対象NW300内の全ノード(NW機器310)に対してping/tracerouteおよびSNMPによる経路探索を実行して正常時の経路情報を取得し、経路情報DB130に記録する機能を有する。経路情報の取得処理の内容については後述する。
The route
障害部位推定部120は、監視対象NW300が障害時・異常時(障害監視システム200等によって障害を検知した場合)に、障害が検知されているNW機器310から原因となる障害の被疑部位を推定して出力する機能を有し、例えば、ホップバイホップ(逐次)ポーリング部121、被疑ペア抽出部122および障害部位出力部123などの各部を有する。ホップバイホップポーリング部121は、障害が検知されているIPアドレスに対して、経路情報DB130から正常時の経路情報を取得し、当該通信経路上にある全てのIPアドレス(ホップバイホップリスト)に対して逐次(ホップバイホップで)pingによるポーリングを行なって、結果(OK/NG)を収集することにより各ノードの状態を把握する機能を有する。
The fault
被疑ペア抽出部122は、ホップバイホップポーリング部121によるポーリングにおいて、pingの結果に異常があったIPアドレスのうち、通信経路上最も手前の(障害部位推定システム100に最も近い)IPアドレスと、通信経路上その1つ手前のホップのIPアドレス(pingの結果は正常)とを被疑ペアとして抽出し、これを障害が検知されている各IPアドレスに対して行なって、被疑ペア集合を得る機能を有する。障害部位出力部123は、被疑ペア抽出部122により抽出された被疑ペア集合をユニーク処理し、その結果に基づいて所定のロジックにより障害被疑部位を抽出して出力する機能を有する。障害被疑部位を推定する処理の内容についても後述する。
The suspicious
<経路情報取得処理>
以下では、まず、正常時における経路情報取得部110による経路情報の取得処理の内容について説明する。ここでは、監視対象NW300における全ての監視対象のノード(NW機器310)に至る正常時の通信経路上の完全なIPアドレスのリストを作成して経路情報とするとともに、当該通信経路(監視対象のノード)における正常時の品質情報を取得して経路情報DB130に記録する。なお、この処理は正常時に定期的に実行するか、少なくとも通信経路や通信品質に影響を与え得るシステムやネットワークの構成変更があった場合に実行するのが望ましい。
<Route information acquisition processing>
Below, the content of the route information acquisition process by the route
図3〜図5は、経路情報および品質情報を取得する処理の例について概要を示した図である。ここでは、障害部位推定システム100をノード“n00”とし、監視対象NW300内のルータ等の各NW機器310をノード“n01”、“n21”、“n22”、“n41”、“n42”、“n43”として表したツリー型のネットワーク構成の例を示している(レイヤー2スイッチ等の機器については省略している)。また、各ノードは、それぞれ、“i00”〜“i43”として表したインタフェース(IF)312を有していることを示している。なお、図3〜図5の例では、“i41”のインタフェース312(IPアドレス)についての経路情報および品質情報を取得する場合を例として説明している。
3 to 5 are diagrams showing an outline of an example of processing for acquiring route information and quality information. Here, the failure
まず、正常時の品質情報を取得するため、図3に示すように、障害部位推定システム100(ノード“n00”)の経路情報取得部110は、監視対象のインタフェース312(“i41”)に対してpingコマンドを発行し、その応答からパケットロス率(loss rate)および平均遅延時間を取得する。図3の例では、pingによる“i41”のインタフェース312に対するechoパケットに対して応答としてecho−replyパケットを受け取る状態を矢印で示している。なお、取得した品質情報は、対象のインタフェース312と関連付けて経路情報DB130に記録する。なお、この品質情報を一定期間蓄積しておき、これに対して所定の統計処理を施すことで品質のベースラインを得るようにしてもよい。
First, in order to acquire normal quality information, as shown in FIG. 3, the path
次に、正常時の経路情報を取得するため、図4に示すように、監視対象のインタフェース312(“i41”)に対してtracerouteコマンドを発行し、当該インタフェース312に至るまでに経由するノードの情報を取得する。図4の例では、通信経路上のノード“n01”、“n21”、“n41”に対して順次echoパケットを送信し、応答としてtime−exceededパケットを受け取る状態を矢印で示している。
Next, in order to obtain the normal path information, as shown in FIG. 4, a traceroute command is issued to the monitored interface 312 (“i41”), and the node that has passed through to the
次に、tracerouteにより取得した各経由ノードに対して、それぞれSNMPによる経路探索を実行し、ホップするノード毎の入力のインタフェース312と出力のインタフェース312を全て取得する。図5の例では、宛先のノード“n41”に対する経由ノード“n01”、“n21”のそれぞれについて、snmpgetコマンドを発行した状態を矢印で示している。当該コマンドにより、各ノードのルーティングテーブル311等に基づいて得られるMIB(Management Information Base)の管理情報から、入力および出力のインタフェース312の情報を取得することができる。
Next, a route search by SNMP is executed for each transit node acquired by traceroute, and all
上記の図4の例に示す処理により取得した経由ノードの情報と、図5の例に示す処理により取得した各経由ノードでの入力および出力のインタフェース312の情報とに基づいて、図5の下段の表に示すように、障害部位推定システム100(ノード“n00”)のインタフェース312(“i00”)から監視対象のNW機器310(ノード“n41”)のインタフェース312(“i41”)に至る通信経路上におけるインタフェース312のリスト(ホップバイホップリスト131)を作成する。作成したホップバイホップリスト131の情報は、監視対象のインタフェース312と関連付けて経路情報DB130に記録する。なお、品質情報と経路情報を取得する順序は上記の順に限らず、経路情報を先に取得してもよい。
Based on the information on the transit node acquired by the process shown in the example of FIG. 4 and the information on the input and
図6は、ホップバイホップリスト131を得るためのソースコードの例を参考情報として示した図である。上段の図では、対象のネットワーク構成例として、障害部位推定システム100(ノード“n00”)およびそのインタフェース312のIPアドレスと、ターゲットのノード(NW機器310)およびインタフェース312、中継するノード(NW機器310)およびその入力と出力のインタフェース312とルーティングテーブル311を示している。また、下段の図では、上段の図に示したような構成において、ターゲットのインタフェース312に至るまでのインタフェース312のリストを得るためのソースコード111の一例を示している。
FIG. 6 is a diagram showing an example of source code for obtaining the hop-by-
<障害部位推定処理>
以下では、障害時・異常時における障害部位推定部120による障害部位の推定処理の内容について説明する。障害監視システム200もしくは障害部位推定システム100が、例えば、監視対象NW300内の各ノードに対して定期的にpingによるポーリングを行う等して監視することによりネットワーク障害を検知した場合、障害部位推定部120のホップバイホップポーリング部121は、障害が検知された各インタフェース312(IPアドレス)に対してホップバイホップでpingを実行する。すなわち、対象のインタフェース312に至る経路情報(ホップバイホップリスト131)を経路情報DB130から取得し、リストに含まれる各インタフェース312のIPアドレスに対してそれぞれpingによるポーリングを行なって、通信のOK/NGを判定する。
<Injury site estimation process>
Below, the content of the fault site estimation processing by the fault
なお、pingによるポーリングにおける障害の検知や、通信のOK/NGの判定の際は、pingの応答を受信したか否かのみで判定するのではなく、パケットロス率や平均遅延などの品質情報の値について、経路情報DB130に記録された正常時の品質情報(ベースライン)と比較することで判定する。例えば、現在の各品質情報の値がベースラインから所定の閾値以上低下しているか否かにより判定してもよいし、統計的な手法を利用して障害か否かを推測するようにしてもよい。
When detecting a failure in polling by ping or determining whether communication is OK / NG, it is not determined only by whether or not a ping response is received, but quality information such as packet loss rate and average delay is not determined. The value is determined by comparing with normal quality information (baseline) recorded in the
さらに、障害部位推定部120の被疑ペア抽出部122が、上記のポーリングの結果がNGであったインタフェース312のうち、通信経路上最も手前のインタフェース312と、通信経路上その1つ手前のホップのインタフェース312とを被疑ペアとして抽出する。これを障害が検知されている各インタフェース312に対して行なって、被疑ペア集合132を取得する。
Further, the suspicious
図7は、障害が検知されたノードに対して被疑ペア集合132を取得する処理の例について概要を示した図である。ここでは、図の上段左側に示した監視対象NW300の構成(図3〜図5の例で示したものと同様)において、“i21”のインタフェース312が障害となった場合を例としている。
FIG. 7 is a diagram showing an overview of an example of processing for acquiring the suspected pair set 132 for a node in which a failure is detected. Here, a case where the
このとき、障害監視システム200において障害が検知される(pingによるポーリングがNGとなる)各ノード(“n21”、“n41”、“n42”)に対して、ホップバイホップポーリング部121が、通信経路上の各インタフェース312に対してホップバイホップでpingによるポーリングを行う。このとき、図7の例では、例えば、“i21”、“i31”、“i32”、“i41”、“i42”の各インタフェース312(上段左側の図中で網掛けで示したもの)ではポーリングがNGとなり、他のインタフェース312ではOKとなる。このポーリングの結果をホップバイホップリスト131の表に追記・反映させたものが図7の上段右側の表である。表中のOK/NGの値は、対象のインタフェース312に対するpingによるポーリングの結果を示している。
At this time, the hop-by-
ここで、各インタフェース312に対するホップバイホップでのポーリングの結果がNGであった経路上のインタフェース312のうち、最も手前のインタフェース312と、その1つ手前のホップのインタフェース312とを被疑ペアとして抽出する。すなわち、ホップバイホップリスト131において、ポーリングの結果がOKからNGに変わる境界部分のインタフェース312を被疑ペアとして抽出し、被疑ペア集合132(図7の下段の表)を作成する。
Here, among the
被疑ペア集合132において、“NG”の項目は境界部分におけるポーリング結果がNGのインタフェース312を示し、“PREV”の項目はその手前のホップのポーリング結果がOKのインタフェース312を示している。図7の例では、全ての監視対象のインタフェース312において、“PREV”が“i11”、“NG”が“i21”となっている。
In the suspicious pair set 132, an item “NG” indicates an
次に、障害部位推定部120の障害部位出力部123が、被疑ペア集合132および経路情報DB130に記録された経路情報に基いて、障害被疑部位を推定して出力する。図8は、障害被疑部位を推定して出力する処理の例について概要を示したフローチャートである。まず、被疑ペア集合132の各エントリのNG項目のインタフェース312に対してユニーク処理(重複するものを排除)する(S01)。次に、ユニーク処理した結果のエントリ数(NG項目のインタフェース312の数)が1であるか否かを判定する(S02)。エントリ数が1である場合は、当該エントリのNG項目のインタフェース312を障害被疑部位として出力する(パターン1)(S03)。すなわち、図示するように、OKとNGの境界におけるNGのインタフェース312(1つだけ存在する)を障害被疑部位として出力する。
Next, the failure
ステップS02においてNG項目のエントリが複数ある場合は、さらに、被疑ペア集合132の各エントリ(NG項目についてユニーク処理済み)のPREV項目のインタフェース312に対してユニーク処理する(S04)。次に、ユニーク処理した結果のエントリ数(PREV項目のインタフェース312の数)が1であるか否かを判定する(S05)。エントリ数が1である場合は、当該エントリのPREV項目のインタフェース312と、NG項目のインタフェース312との間の区間を障害被疑部位として出力する(パターン2)(S06)。すなわち、図示するように、OKとNGの境界部分の区間(図示するようにこの部分にプロバイダ等により提供されるネットワークを含む場合もある)を障害被疑部位として出力する。
If there are a plurality of NG item entries in step S02, the unique processing is further performed on the
ステップS05においてPREV項目のエントリが複数ある場合は、これらのインタフェース312のユニーク集合を障害被疑部位として出力する(パターン3)(S07)。すなわち、図示するように、OKとNGの境界におけるOKのインタフェース312(複数存在する)を障害被疑部位として出力する。
If there are a plurality of entries in the PREV item in step S05, the unique set of these
図9は、被疑ペア集合132に基いて障害被疑部位を推定する処理の例について概要を示した図である。ここでは、図7に示した例において取得した被疑ペア集合132に基いて、図8に示した障害被疑部位の推定手法の例によって障害被疑部位を推定する場合を示している。図9の例では、被疑ペア集合132に対して、図8のステップS01の処理によりNG項目のインタフェース312についてユニーク処理を行った結果、NG項目のエントリは“i21”の1レコードのみとなるため、パターン1により、当該インタフェース“i21”を障害被疑部位と推定して出力する。
FIG. 9 is a diagram showing an outline of an example of processing for estimating a suspected fault site based on the suspected pair set 132. Here, based on the suspected pair set 132 acquired in the example shown in FIG. 7, the case where the suspected failure site is estimated by the example of the suspected failure site estimation method shown in FIG. 8 is shown. In the example of FIG. 9, as a result of performing the unique process for the
出力の態様は特に限定されず、例えば、障害監視システム200などの画面における監視対象NW300のトポロジを表したマップ上に障害被疑部位を特定可能なように強調表示してもよい。また、障害被疑部位に該当するIPアドレスやインタフェース312、NW機器310の識別情報などをメッセージとして表示する構成であってもよい。ここで出力される障害被疑部位は、障害の原因部位であると疑われる部位であり、正確な原因部位以外の構成要素を含む場合もあり得るが、迅速な障害対応という観点では非常に重要な情報となるものである。
The mode of output is not particularly limited. For example, the output may be highlighted on the map representing the topology of the
以上に説明したように、本発明の一実施の形態である障害部位推定システム100によれば、正常時に定期的に監視対象NW300における経路情報と品質情報を収集して記録しておき、障害時・異常時(障害監視システム200で障害を検知した場合)に、正常時に取得した通信経路に従ってホップバイホップでpingによるポーリングを行う。このポーリングの成否(死活情報)に基づいて障害部位の集合を抽出し、そこから所定のロジックにより原因となる障害被疑部位を推定して抽出する。ここで、ポーリングの成否は、応答の有無だけに限らず、正常時の品質情報との比較に基づいて一定以上品質の劣化があった場合に障害部位と判断することで、論理障害のような「半死」の場合でも障害部位の推定を可能とする。
As described above, according to the failure
これにより、大規模なネットワーク障害の場合でも、障害部位推定システム100において、障害となっている各ノード(NW機器310)への経路情報と、通信経路上の死活情報とを分析して、簡易的に迅速に障害被疑部位を推定して絞り込むことが可能となる。また、難しい操作を必要とせず、オペレータ等でも容易に障害被疑部位の推定を行うことが可能であるため、早期に障害被疑部位を絞り込み、状況によっては即時に対応策をとることも可能となる。
Thus, even in the case of a large-scale network failure, the failure
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。例えば、上記の実施の形態は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、実施の形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。また、上記の各図において、制御線や情報線は説明上必要と考えられるものを示しており、必ずしも実装上の全ての制御線や情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。 As mentioned above, the invention made by the present inventor has been specifically described based on the embodiment. However, the present invention is not limited to the embodiment, and various modifications can be made without departing from the scope of the invention. Needless to say. For example, the above-described embodiment has been described in detail for easy understanding of the present invention, and is not necessarily limited to the one having all the configurations described. In addition, it is possible to add, delete, and replace other configurations for a part of the configuration of the embodiment. Moreover, in each said figure, the control line and the information line have shown what is considered necessary for description, and do not necessarily show all the control lines and information lines on mounting. Actually, it may be considered that almost all the components are connected to each other.
本発明は、ネットワーク障害の際に障害部位を推定する障害部位推定システムおよび障害部位推定プログラムに利用可能である。 INDUSTRIAL APPLICABILITY The present invention can be used for a failure site estimation system and a failure site estimation program for estimating a failure site in the event of a network failure.
1…ネットワーク(NW)監視システム、
100…障害部位推定システム、110…経路情報取得部、111…ソースコード、120…障害部位推定部、121…ホップバイホップ(逐次)ポーリング部、122…被疑ペア抽出部、123…障害部位出力部、130…経路情報データベース(DB)、131…ホップバイホップリスト、132…被疑ペア集合、
200…障害監視システム、
300…監視対象ネットワーク(NW)、310、310a…ネットワーク(NW)機器、311…ルーティングテーブル、312…インタフェース。
1 ... Network (NW) monitoring system,
DESCRIPTION OF
200 ... Fault monitoring system,
300: Network to be monitored (NW), 310, 310a ... Network (NW) device, 311 ... Routing table, 312 ... Interface.
Claims (8)
前記監視対象ネットワークの正常時に、前記監視対象ネットワーク内の各ノードについて、当該ノードに至る通信経路上の各ノードのインタフェースからなる経路情報を取得して、経路情報記録手段に記録する経路情報取得部と、
前記監視対象ネットワークの障害時に、障害となっている各ノードに至る経路情報を前記経路情報記録手段からそれぞれ取得し、当該経路情報に含まれる各インタフェースに対して逐次ポーリングを行って、OKもしくはNGの結果を収集する逐次ポーリング部と、
経路情報に含まれる各インタフェースにおいて、前記ポーリングの結果がNGとなった最も手前のインタフェースと、その1つ手前の前記ポーリングの結果がOKとなったインタフェースとを被疑ペアとし、障害となっている各ノードについて被疑ペアを抽出して被疑ペア集合を取得する被疑ペア抽出部と、
前記被疑ペア集合と前記経路情報記録手段に記録された経路情報とに基いて、障害被疑部位を抽出して出力する障害部位出力部とを有することを特徴とする障害部位推定システム。 A failure location estimation system that estimates a suspected failure location when a failure occurs in a monitored network having a configuration in which nodes composed of network devices are connected in a tree shape,
A path information acquisition unit that acquires, for each node in the monitoring target network, path information including an interface of each node on a communication path leading to the node when the monitoring target network is normal, and records the path information in a path information recording unit When,
When a failure occurs in the monitored network, route information to each failed node is obtained from the route information recording means, and each interface included in the route information is sequentially polled, and OK or NG A sequential polling unit that collects the results of
In each interface included in the path information, the most recent interface in which the polling result is NG and the interface in which the previous polling result is OK are used as suspected pairs, resulting in a failure. A suspicious pair extraction unit that extracts a suspicious pair for each node and obtains a suspicious pair set; and
A fault site estimation system comprising: a fault site output unit that extracts and outputs a fault site based on the suspected pair set and the path information recorded in the path information recording means.
前記経路情報取得部は、前記監視対象ネットワークの正常時に、前記監視対象ネットワーク内の各ノードに至る通信経路についての品質情報を取得して前記経路情報記録手段に記録し、
前記逐次ポーリング部は、前記逐次ポーリングの際に取得した品質情報と、前記経路情報記録手段に記録された対応する通信経路についての正常時の品質情報との比較に基いて、前記逐次ポーリングの結果がOKもしくはNGであるかを判断することを特徴とする障害部位推定システム。 In the failure site estimation system according to claim 1,
The path information acquisition unit acquires quality information about a communication path that reaches each node in the monitored network when the monitored network is normal, and records the quality information in the path information recording unit,
The sequential polling unit is a result of the sequential polling based on the comparison between the quality information acquired at the time of the sequential polling and the quality information at the normal time for the corresponding communication path recorded in the path information recording unit. It is determined whether or not is OK or NG.
前記経路情報記録手段に記録する品質情報は、pingコマンドに対する応答に含まれるパケットロス率および/または平均遅延時間の情報であることを特徴とする障害部位推定システム。 In the failure site estimation system according to claim 2,
The fault location estimation system, wherein the quality information recorded in the route information recording means is information on a packet loss rate and / or an average delay time included in a response to the ping command.
前記経路情報取得部は、前記監視対象ネットワーク内の各ノードに対してtracerouteコマンドを発行して通信経路上のノードの情報を取得し、取得した通信経路上の各ノードに対してSNMPによる経路探索を行なって、入力および/または出力のインタフェースの情報を取得することによって経理情報を取得することを特徴とする障害部位推定システム。 In the failure site estimation system according to any one of claims 1 to 3,
The route information acquisition unit issues a traceroute command to each node in the monitored network to acquire information on a node on the communication route, and searches for a route by SNMP for each node on the acquired communication route. And acquiring the accounting information by acquiring the input and / or output interface information.
前記障害部位出力部は、前記被疑ペア集合における、前記ポーリングの結果がNGとなったインタフェースについて重複を排除したエントリの数が1の場合は、当該エントリに係る前記ポーリングの結果がNGとなったインタフェースを障害被疑部位として出力することを特徴とする障害部位推定システム。 In the failure site estimation system according to any one of claims 1 to 4,
When the number of entries from which duplication is eliminated is 1 for the interface in which the polling result is NG in the suspected pair set, the failure part output unit determines that the polling result for the entry is NG. A fault site estimation system that outputs an interface as a fault suspected site.
前記障害部位出力部は、前記被疑ペア集合における、前記ポーリングの結果がNGとなったインタフェースについて重複を排除したエントリの数が複数であり、かつ、これらのエントリにおいて、前記ポーリングの結果がOKとなったインタフェースについて重複を排除したエントリの数が1の場合は、当該エントリに係る前記ポーリングの結果がOKとなったインタフェースと、前記ポーリングの結果がNGとなったインタフェースとの間の区間を障害被疑部位として出力することを特徴とする障害部位推定システム。 In the failure site estimation system according to any one of claims 1 to 5,
The failure part output unit has a plurality of entries in which the duplication is eliminated for the interface in which the polling result is NG in the suspect pair set, and the polling result is OK in these entries. If the number of entries from which duplication is eliminated is 1 for the interface that has become an error, the section between the interface whose polling result is OK and the interface whose polling result is NG is faulty. A fault site estimation system characterized by outputting as a suspected site.
前記障害部位出力部は、前記被疑ペア集合における、前記ポーリングの結果がNGとなったインタフェースについて重複を排除したエントリの数が複数であり、かつ、これらのエントリにおいて、前記ポーリングの結果がOKとなったインタフェースについて重複を排除したエントリの数が複数である場合は、当該エントリに係る前記ポーリングの結果がOKとなったインタフェースを障害被疑部位として出力することを特徴とする障害部位推定システム。 In the failure site estimation system according to any one of claims 1 to 6,
The failure part output unit has a plurality of entries in which the duplication is eliminated for the interface in which the polling result is NG in the suspect pair set, and the polling result is OK in these entries. When there are a plurality of entries whose duplication has been eliminated for a given interface, the interface for which the polling result relating to the entry is OK is output as a suspected fault site.
前記監視対象ネットワークの正常時に、前記監視対象ネットワーク内の各ノードについて、当該ノードに至る通信経路上の各ノードのインタフェースからなる経路情報を取得して、経路情報記録手段に記録する経路情報取得処理と、
前記監視対象ネットワークの障害時に、障害となっている各ノードに至る経路情報を前記経路情報記録手段からそれぞれ取得し、当該経路情報に含まれる各インタフェースに対して逐次ポーリングを行って、OKもしくはNGの結果を収集する逐次ポーリング処理と、
経路情報に含まれる各インタフェースにおいて、前記ポーリングの結果がNGとなった最も手前のインタフェースと、その1つ手前の前記ポーリングの結果がOKとなったインタフェースとを被疑ペアとし、障害となっている各ノードについて被疑ペアを抽出して被疑ペア集合を取得する被疑ペア抽出処理と、
前記被疑ペア集合と前記経路情報記録手段に記録された経路情報とに基いて、障害被疑部位を抽出して出力する障害部位出力処理とをコンピュータに実行させることを特徴とする障害部位推定プログラム。 A failure site estimation program for operating a computer as a failure site estimation system for estimating a failure site when a failure occurs in a monitored network having a configuration in which nodes composed of network devices are connected in a tree shape,
A path information acquisition process for acquiring path information composed of interfaces of nodes on a communication path leading to the node for each node in the monitored network when the monitored network is normal and recording the path information in a path information recording unit When,
When a failure occurs in the monitored network, route information to each failed node is obtained from the route information recording means, and each interface included in the route information is sequentially polled, and OK or NG A sequential polling process to collect the results of
In each interface included in the path information, the most recent interface in which the polling result is NG and the interface in which the previous polling result is OK are used as suspected pairs, resulting in a failure. A suspicious pair extraction process for extracting a suspicious pair for each node and obtaining a suspicious pair set;
A faulty part estimation program for causing a computer to execute a faulty part output process for extracting and outputting a faulty suspected part based on the suspected pair set and the route information recorded in the route information recording means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012194743A JP2014053658A (en) | 2012-09-05 | 2012-09-05 | Failure site estimation system and failure site estimation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012194743A JP2014053658A (en) | 2012-09-05 | 2012-09-05 | Failure site estimation system and failure site estimation program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014053658A true JP2014053658A (en) | 2014-03-20 |
Family
ID=50611760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012194743A Pending JP2014053658A (en) | 2012-09-05 | 2012-09-05 | Failure site estimation system and failure site estimation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014053658A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018151290A1 (en) * | 2017-02-20 | 2018-08-23 | 日本電気株式会社 | Information processing device, information processing method, and storage medium |
WO2020075587A1 (en) * | 2018-10-11 | 2020-04-16 | 日本電信電話株式会社 | Fault location estimation method and fault location estimation device |
WO2020085050A1 (en) * | 2018-10-26 | 2020-04-30 | 日本電信電話株式会社 | Inference method, inference device, and inference program |
JPWO2020179704A1 (en) * | 2019-03-01 | 2020-09-10 |
-
2012
- 2012-09-05 JP JP2012194743A patent/JP2014053658A/en active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018151290A1 (en) * | 2017-02-20 | 2018-08-23 | 日本電気株式会社 | Information processing device, information processing method, and storage medium |
JPWO2018151290A1 (en) * | 2017-02-20 | 2019-12-19 | 日本電気株式会社 | Information processing apparatus, information processing method, and storage medium |
JP7110990B2 (en) | 2017-02-20 | 2022-08-02 | 日本電気株式会社 | Information processing device, information processing method and storage medium |
WO2020075587A1 (en) * | 2018-10-11 | 2020-04-16 | 日本電信電話株式会社 | Fault location estimation method and fault location estimation device |
JP2020061685A (en) * | 2018-10-11 | 2020-04-16 | 日本電信電話株式会社 | Failure location estimation method and failure location estimation device |
US11516073B2 (en) | 2018-10-11 | 2022-11-29 | Nippon Telegraph And Telephone Corporation | Malfunction point estimation method and malfunction point estimation apparatus |
WO2020085050A1 (en) * | 2018-10-26 | 2020-04-30 | 日本電信電話株式会社 | Inference method, inference device, and inference program |
JP2020068510A (en) * | 2018-10-26 | 2020-04-30 | 日本電信電話株式会社 | Estimation method, estimation device, and estimation program |
US11902137B2 (en) | 2018-10-26 | 2024-02-13 | Nippon Telegraph And Telephone Corporation | Service path failure location estimation method, apparatus, and program |
JPWO2020179704A1 (en) * | 2019-03-01 | 2020-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11038744B2 (en) | Triggered in-band operations, administration, and maintenance in a network environment | |
US10560311B2 (en) | Management apparatus, management method, and recording medium | |
Yan et al. | G-rca: a generic root cause analysis platform for service quality management in large ip networks | |
JP4758259B2 (en) | Network monitoring apparatus and method | |
EP3882773A1 (en) | Method and system for automatic real-time causality analysis of end user impacting system anomalies using causality rules and topological understanding of the system to effectively filter relevant monitoring data | |
CN104798341B (en) | Service level is characterized on electric network | |
US20110270957A1 (en) | Method and system for logging trace events of a network device | |
EP2081321A2 (en) | Sampling apparatus distinguishing a failure in a network even by using a single sampling and a method therefor | |
JP4412031B2 (en) | Network monitoring system and method, and program | |
US8245079B2 (en) | Correlation of network alarm messages based on alarm time | |
EP3326330A1 (en) | Methods, systems, and apparatus to generate information transmission performance alerts | |
EP2795841B1 (en) | Method and arrangement for fault analysis in a multi-layer network | |
JP5342082B1 (en) | Network failure analysis system and network failure analysis program | |
JP2014053658A (en) | Failure site estimation system and failure site estimation program | |
US7564796B2 (en) | Method and system for managing a network slowdown | |
CN110113205B (en) | Network troubleshooting system based on software defined network technology and working method thereof | |
CN109218050B (en) | Domain name system fault processing method and system | |
JP4464256B2 (en) | Network host monitoring device | |
JP2007228421A (en) | Ip network route diagnosis apparatus and ip network route diagnosis system | |
CN113037564B (en) | Network fault diagnosis method and device | |
KR100887874B1 (en) | System for managing fault of internet and method thereof | |
JP2012249250A (en) | Monitoring device and program | |
CN112994910A (en) | Method and device for processing network port alarm information | |
JP2014036310A (en) | Apparatus and method for evaluating effect | |
Park et al. | RCV: Network Monitoring and Diagnostic System with Interactive User Interface |