JP2006186633A - System, method, and program for fault path diagnosis - Google Patents

System, method, and program for fault path diagnosis Download PDF

Info

Publication number
JP2006186633A
JP2006186633A JP2004377704A JP2004377704A JP2006186633A JP 2006186633 A JP2006186633 A JP 2006186633A JP 2004377704 A JP2004377704 A JP 2004377704A JP 2004377704 A JP2004377704 A JP 2004377704A JP 2006186633 A JP2006186633 A JP 2006186633A
Authority
JP
Japan
Prior art keywords
failure
monitoring
communication
pattern
route
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004377704A
Other languages
Japanese (ja)
Other versions
JP4485344B2 (en
Inventor
Takako Akimasa
貴子 秋政
Taku Moriya
卓 守屋
Akira Kido
顯 木戸
Takako Takeshima
貴子 竹島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004377704A priority Critical patent/JP4485344B2/en
Publication of JP2006186633A publication Critical patent/JP2006186633A/en
Application granted granted Critical
Publication of JP4485344B2 publication Critical patent/JP4485344B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To surely specify faulty equipment by eliminating an omission of fault detection. <P>SOLUTION: A system comprises a fault information database 16 in which a traffic path pattern between a monitor agent 110 and equipment 120 to be monitored and a fault pattern assumed to be on the traffic path are stored while made to correspond to each other, a network monitor section 12 which collates a traffic confirmation result gathered from the monitor agent 110 against traffic path patterns in the fault information database 16, a network monitor section 12 which generates a traffic monitor information table 17 wherein traffic confirmation results and traffic path patterns are made to correspond to each other, and a fault decision section 13 which collates the traffic monitor information table 17 with the fault information database 16 to detect a fault pattern which matches a traffic confirmation result with the same traffic path pattern and designates fault equipment corresponding to the fault pattern as fault-occurring equipment. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、障害経路診断システム、障害経路診断方法、および障害経路診断プログラムに関し、特に自動監視でもって監視ネットワーク上にて検出した障害経路を自動診断する方法に関する。   The present invention relates to a failure path diagnosis system, a failure path diagnosis method, and a failure path diagnosis program, and more particularly to a method for automatically diagnosing a failure path detected on a monitoring network by automatic monitoring.

ネットワークの自動監視方法は、複数の監視対象機器に対して1つの監視マネージャを設け、監視マネージャと情報を送受信する監視エージェントを設け、監視マネージャから監視エージェントに対して一定の周期でポーリングを行ない、そのポーリングの疎通により生存と判断する方法が一般的である。ここで監視エージェントは監視対象機器でもあり、ルータ・スイッチ等の情報収集手段を持たない機器との疎通を監視するサーバでもある。 ポーリングがタイムアウトした場合、すなわち障害が発生した場合には障害個所を速やかに特定する必要があるが、従来はシステムの管理者や管理オペレータが、監視画面に表示されたネットワーク監視の結果の警報情報を見て、障害を検知した後、障害情報を収集し、保守マニュアルに従い障害個所の診断を実施していた。   In the network automatic monitoring method, one monitoring manager is provided for a plurality of devices to be monitored, a monitoring agent that transmits and receives information to and from the monitoring manager is provided, and the monitoring agent polls the monitoring agent at a certain period. A method of determining the existence by the communication of the polling is common. Here, the monitoring agent is also a monitoring target device and a server that monitors communication with a device that does not have information collection means such as a router and a switch. When polling times out, that is, when a failure occurs, it is necessary to quickly identify the location of the failure. Conventionally, the system administrator or management operator has displayed alarm information on the results of network monitoring displayed on the monitoring screen. After the failure was detected, failure information was collected and the failure location was diagnosed according to the maintenance manual.

この障害個所の診断を自動化する方法として、例えば、複数のネットワーク機器にて構成されるネットワークを監視するネットワーク監視装置において、ネットワークを構成する各機器を物理的な接続関係で階層的に管理する手段と、その階層情報を基に、ある機器が障害となった場合の実障害と擬似障害(上位の機器が障害である為にそれ以下の機器を障害とみなされる障害)を判別する手段を設けたことを特徴とするネットワーク監視方式(特許文献1参照)などが提案されている。
特開2001−86117号公報
As a method for automating the diagnosis of the fault location, for example, in a network monitoring apparatus that monitors a network constituted by a plurality of network devices, means for hierarchically managing each device constituting the network in a physical connection relationship And, based on the hierarchy information, there is a means to discriminate between actual faults and pseudo faults when a certain device fails (failures where lower devices are considered as faults because the host device is faulty) A network monitoring system (see Patent Document 1) characterized by the above has been proposed.
JP 2001-86117 A

従来技術においては、一つの監視マネージャから全ての監視エージェントに対して疎通確認を行なうという一対全の経路監視が前提であり、監視マネージャと監視エージェントとの間の経路監視のみが対象で、監視エージェント相互間の経路は監視対象にしていない。このため、この経路で障害が発生した場合には検知が難しいという問題があった。   In the prior art, one-to-all route monitoring in which communication confirmation is performed from one monitoring manager to all monitoring agents is premised, and only the route monitoring between the monitoring manager and the monitoring agent is targeted. The routes between each other are not monitored. For this reason, there is a problem that it is difficult to detect when a failure occurs in this route.

また、従来技術においては、機器が完全にダウンした障害を想定しており、障害時の経路監視情報に整合性があることが前提である。しかし実際には障害機器を絞り込むための経路監視情報に整合性がとれない障害、例えば機器がダウンに至らず不安定になっている等で一時的に疎通不可が発生するような不整合障害が多く発生しており、従来技術においてはこれらを検出することが難しいという問題があった。   The prior art assumes a failure in which the device is completely down, and assumes that the route monitoring information at the time of the failure is consistent. However, in reality, there is a failure that is inconsistent with the route monitoring information for narrowing down the faulty device, such as a mismatch failure that temporarily disables communication because the device is not down and unstable. Many have occurred, and the conventional technique has a problem that it is difficult to detect them.

そこで本発明は上記課題を鑑みてなされたものであり、障害検出の漏れを無くして障害機器の確実な特定を可能とする、障害経路診断システム、障害経路診断方法、および障害経路診断プログラムを提供することを主たる目的とする。   Therefore, the present invention has been made in view of the above problems, and provides a failure path diagnosis system, a failure path diagnosis method, and a failure path diagnosis program that enable the reliable identification of a faulty device without omission of fault detection. The main purpose is to do.

上記課題を解決する本発明の障害経路診断システムは、複数のネットワーク機器から構成されるネットワークの監視を行うシステムであって、監視エージェントと監視対象機器との間の疎通経路パターンと、前記疎通経路において発生が想定される障害パターンとを対応付けて格納した障害情報データベースと、監視エージェントから収集した疎通確認結果を、前記障害情報データベースにおける疎通経路パターンに照合し、疎通確認結果と疎通経路パターンとを対応づけた経路監視情報テーブルを生成する、ネットワーク監視部と、前記経路監視情報テーブルを前記障害情報データベースに照合して、同一の疎通経路パターンにおいて疎通確認結果と一致する障害パターンを検出し、当該障害パターンに対応する障害機器を障害発生機器として特定する、障害判定部と、を備えることを特徴とする(第1の発明)。   A failure path diagnosis system of the present invention that solves the above problems is a system that monitors a network composed of a plurality of network devices, and includes a communication route pattern between a monitoring agent and a monitoring target device, and the communication route. The failure information database storing the failure patterns associated with the failure patterns that are expected to occur and the communication confirmation results collected from the monitoring agent with the communication route patterns in the failure information database, and the communication confirmation results and the communication route patterns A path monitoring information table that associates the path monitoring information table with the fault information database, and detects a failure pattern that matches the communication confirmation result in the same communication path pattern; A faulty device corresponding to the fault pattern is referred to as a faulty device. Identifying Te, characterized in that it comprises a fault determining unit, the (first invention).

第2の発明は、第1の発明において、前記障害判定部は、同一の疎通経路パターンにおいて疎通確認結果と一致する障害パターンが検出できない場合、前記障害情報データベースと経路監視情報テーブルとの一致度を算定して当該一致度が所定値以上となった障害パターンを検出し、当該障害パターンに対応する障害機器を障害発生機器候補として特定することを特徴とする。   According to a second invention, in the first invention, when the failure determination unit cannot detect a failure pattern that matches the communication confirmation result in the same communication route pattern, the degree of coincidence between the failure information database and the route monitoring information table , And a failure pattern in which the degree of coincidence exceeds a predetermined value is detected, and a faulty device corresponding to the fault pattern is identified as a faulty device candidate.

第3の発明は、第1または第2の発明において、前記ネットワーク監視部が、前記監視エージェントに対して、監視対象機器との疎通確認の実行を指示することを特徴とする。   According to a third invention, in the first or second invention, the network monitoring unit instructs the monitoring agent to execute communication confirmation with the monitoring target device.

第4の発明は、第1〜第3のいずれかの発明において、前記監視対象機器に向けて疎通確認を行なう疎通確認実行部と、疎通結果の収集処理を行なう経路監視情報収集部と、
を備えるものであることを特徴とする。
According to a fourth invention, in any one of the first to third inventions, a communication confirmation execution unit that performs communication confirmation toward the monitoring target device, a route monitoring information collection unit that performs communication result collection processing,
It is characterized by comprising.

第5の発明は、第1〜第4のいずれかの発明において、前記監視エージェントが、前記監視対象機器に向けて疎通確認を行なう疎通確認実行部と、疎通結果の収集処理を行なう経路監視情報収集部と、を備えることを特徴とする。   According to a fifth invention, in any one of the first to fourth inventions, the monitoring agent performs a communication confirmation execution unit for performing communication confirmation toward the monitoring target device, and path monitoring information for performing a communication result collecting process. And a collection unit.

第6の発明は、複数のネットワーク機器から構成されるネットワークの監視を、監視エージェントと監視対象機器との間の疎通経路パターンと、前記疎通経路において発生が想定される障害パターンとを対応付けて格納した障害情報データベースを備えたコンピュータにより行う方法であって、監視エージェントから収集した疎通確認結果を、前記障害情報データベースにおける疎通経路パターンに照合し、疎通確認結果と疎通経路パターンとを対応づけた経路監視情報テーブルを生成し、前記経路監視情報テーブルを前記障害情報データベースに照合して、同一の疎通経路パターンにおいて疎通確認結果と一致する障害パターンを検出し、当該障害パターンに対応する障害機器を障害発生機器として特定する、ことを特徴とする。   In a sixth aspect of the present invention, monitoring of a network composed of a plurality of network devices is performed by associating a communication route pattern between a monitoring agent and a monitoring target device with a failure pattern assumed to occur in the communication route. This method is performed by a computer having a stored failure information database. The communication confirmation result collected from the monitoring agent is collated with the communication route pattern in the failure information database, and the communication confirmation result is associated with the communication route pattern. A route monitoring information table is generated, the route monitoring information table is collated with the failure information database, a failure pattern that matches a communication confirmation result is detected in the same communication route pattern, and a faulty device corresponding to the fault pattern is detected. It is characterized as being identified as a faulty device.

第7の発明は、複数のネットワーク機器から構成されるネットワークの監視方法を、監視エージェントと監視対象機器との間の疎通経路パターンと、前記疎通経路において発生が想定される障害パターンとを対応付けて格納した障害情報データベースを備えたコンピュータに実行させるプログラムであって、監視エージェントから収集した疎通確認結果を、前記障害情報データベースにおける疎通経路パターンに照合し、疎通確認結果と疎通経路パターンとを対応づけた経路監視情報テーブルを生成するステップと、前記経路監視情報テーブルを前記障害情報データベースに照合して、同一の疎通経路パターンにおいて疎通確認結果と一致する障害パターンを検出し、当該障害パターンに対応する障害機器を障害発生機器として特定するステップと、を含むことを特徴とする。   A seventh invention relates to a monitoring method for a network composed of a plurality of network devices by associating a communication route pattern between a monitoring agent and a device to be monitored with a failure pattern assumed to occur in the communication route. The communication confirmation result collected from the monitoring agent is compared with the communication route pattern in the failure information database, and the communication confirmation result corresponds to the communication route pattern. Generating a route monitoring information table, and comparing the route monitoring information table with the failure information database to detect a failure pattern that matches a communication confirmation result in the same communication route pattern and corresponding to the failure pattern Steps to identify the faulty device as the faulty device Characterized in that it comprises a flop, a.

その他、本願が開示する課題、及びその解決方法は、発明の実施の形態の欄、及び図面により明らかにされる。   In addition, the problems disclosed by the present application and the solutions thereof will be clarified by the embodiments of the present invention and the drawings.

本発明によれば、障害検出の漏れを無くして障害機器の確実な特定が可能となる。   According to the present invention, it is possible to reliably identify a faulty device without omission of fault detection.

−−−システム構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。
図1は本実施形態における障害経路診断システムを含むネットワーク構成図である。本実施形態においては、障害経路診断システム100としての機能を備えたサーバ装置を監視マネージャと称している。また、監視対象機器120としては、監視エージェント110とその間を結ぶスイッチやルータ類をも含むものとできる。図1の例では、各機器が3台のスイッチSa、Sb、Sc(106〜108)と、1台のルータRa(109)とで介して接続されている。
--- System configuration ---
Embodiments of the present invention will be described below in detail with reference to the drawings.
FIG. 1 is a network configuration diagram including a failure path diagnosis system in the present embodiment. In the present embodiment, a server device having a function as the failure path diagnosis system 100 is referred to as a monitoring manager. Further, the monitoring target device 120 may include a monitoring agent 110 and switches and routers connecting the monitoring agent 110. In the example of FIG. 1, each device is connected through three switches Sa, Sb, Sc (106 to 108) and one router Ra (109).

本発明の障害経路診断システム100(以下、システム100)は、本発明の障害経路診断方法を実行する機能を実現すべく書き換え可能メモリなどのプログラムデータベース31に格納されたプログラム32をメモリ33に読み出し、演算装置たるCPU34により実行する。   The fault path diagnosis system 100 (hereinafter, system 100) of the present invention reads a program 32 stored in a program database 31 such as a rewritable memory to the memory 33 so as to realize a function for executing the fault path diagnosis method of the present invention. It is executed by the CPU 34 which is an arithmetic unit.

また、前記システム100は、コンピュータ装置が一般に備えている各種キーボードやボタン類などの入出力インターフェイス35、ならびに監視エージェント110や監視対象機器120との間のデータ授受を担う通信手段36などを有している。   Further, the system 100 includes an input / output interface 35 such as various keyboards and buttons generally provided in a computer device, and a communication means 36 for transferring data to and from the monitoring agent 110 and the monitoring target device 120. ing.

システム100は、前記通信手段36により、前記監視エージェント110や監視対象機器120らと例えばインターネットやLAN、シリアル・インターフェース通信線などのネットワーク130を介して接続し、疎通結果の情報を受信したり、疎通確認の指示を送信したりする。システム100の各種機能部と通信手段36との間ではI/O部37がデータのバッファリングや各種仲介処理を実行している。   The system 100 is connected to the monitoring agent 110 and the monitoring target device 120 and the like via the network 130 such as the Internet, a LAN, and a serial interface communication line by the communication unit 36 and receives communication result information. Send communication confirmation instructions. Between the various function units of the system 100 and the communication means 36, the I / O unit 37 executes data buffering and various mediation processes.

続いて、前記システム100が例えばプログラム102に基づき構成・保持する機能部につき説明を行う。なお、前記システム100は、監視エージェント120と監視対象機器130との間の疎通経路パターンと、前記疎通経路において発生が想定される障害パターンとを対応付けて格納した障害情報データベース16を備えるものとする。なお、前記疎通経路パターンは、監視エージェント120と監視対象機器130との間の全ての疎通経路パターンであることが好ましい。   Next, functional units that are configured and held by the system 100 based on the program 102 will be described. The system 100 includes a failure information database 16 in which a communication route pattern between the monitoring agent 120 and the monitoring target device 130 and a failure pattern expected to occur in the communication route are stored in association with each other. To do. The communication path pattern is preferably all the communication path patterns between the monitoring agent 120 and the monitoring target device 130.

システム100は、監視エージェントから収集した疎通確認結果を、前記障害情報データベース16における疎通経路パターンに照合し、疎通確認結果と疎通経路パターンとを対応づけた経路監視情報テーブル17を生成する、ネットワーク監視部12を備える。   The system 100 collates the communication confirmation result collected from the monitoring agent with the communication route pattern in the failure information database 16 and generates a route monitoring information table 17 that associates the communication confirmation result with the communication route pattern. The unit 12 is provided.

なお、前記ネットワーク監視部12が、前記監視エージェント110に対して、監視対象機器120との疎通確認の実行を指示することとすれば好適である。   It is preferable that the network monitoring unit 12 instructs the monitoring agent 110 to execute communication confirmation with the monitoring target device 120.

また、システム100は、前記経路監視情報テーブル17を前記障害情報データベース16に照合して、同一の疎通経路パターンにおいて疎通確認結果と一致する障害パターンを検出し、当該障害パターンに対応する障害機器を障害発生機器として特定する、障害判定部13を備える。   Further, the system 100 compares the route monitoring information table 17 with the failure information database 16 to detect a failure pattern that matches the communication confirmation result in the same communication route pattern, and selects a failure device corresponding to the failure pattern. A failure determination unit 13 is provided that is identified as a failure occurrence device.

なお、前記障害判定部13は、同一の疎通経路パターンにおいて疎通確認結果と一致する障害パターンが検出できない場合、前記障害情報データベース16と経路監視情報テーブル17との一致度を算定して当該一致度が所定値以上となった障害パターンを検出し、当該障害パターンに対応する障害機器を障害発生機器候補として特定することとすれば好適である。   The failure determination unit 13 calculates the degree of coincidence between the failure information database 16 and the route monitoring information table 17 when a failure pattern that matches the communication confirmation result cannot be detected in the same communication route pattern. It is preferable to detect a failure pattern having a value equal to or greater than a predetermined value and specify a faulty device corresponding to the fault pattern as a faulty device candidate.

また、システム100は、前記監視対象機器120に向けて疎通確認を行なう疎通確認実行部14と、疎通結果の収集処理を行なう経路監視情報収集部15とを備えるものとできる。   In addition, the system 100 can include a communication confirmation execution unit 14 that performs communication confirmation toward the monitoring target device 120 and a route monitoring information collection unit 15 that performs processing for collecting communication results.

また、システム100は、ネットワーク監視開始時に必要な情報を構築する初期設定部11を備えるものとできる。この初期設定部11は、ネットワーク監視開始前に、ネットワーク監視に際し障害機器の特定や経路監視情報テーブル17を作成する処理に必要な初期情報を設定するものである。   In addition, the system 100 can include an initial setting unit 11 that constructs information necessary when starting network monitoring. The initial setting unit 11 sets initial information necessary for processing for identifying a faulty device and creating the route monitoring information table 17 during network monitoring before starting network monitoring.

前記初期設定部11は、ネットワークシステム上の機器ごとに(監視対象機器だけでなく、その間を介するスイッチやルータ等も含む)、障害時に、各監視エージェント110と通信相手先の監視対象機器120との間において想定される疎通確認の結果をまとめた障害パターンを作成し、各想定障害機器と障害パターンを対応付け、各障害パターンの集合体を図5や図6に示すような障害情報データベース16として保持する処理を行なう。また、全疎通経路パターンである経路監視情報テーブル17の初期情報を作成する。   For each device on the network system (including not only the monitoring target device but also a switch, a router, or the like between them), the initial setting unit 11 includes each monitoring agent 110 and the communication target monitoring target device 120 at the time of failure. A failure pattern that summarizes the results of communication confirmation assumed between the devices is created, each assumed failure device is associated with a failure pattern, and a failure information database 16 as shown in FIGS. As a holding process. In addition, initial information of the route monitoring information table 17 that is a total communication route pattern is created.

なお、本実施形態では、単一の機器障害に対する障害パターン作成を想定しているが、複数機器障害時の障害パターンを作成しても良い。また、障害パターンの形式は、テキスト形式やテーブル形式等さまざまな形式を用いてもよいが、本例ではテーブル形式を想定する。   In the present embodiment, it is assumed that a failure pattern is created for a single device failure, but a failure pattern for a plurality of device failures may be created. In addition, as the failure pattern format, various formats such as a text format and a table format may be used. In this example, a table format is assumed.

また、前記監視エージェント110は、前記監視対象機器120に向けて疎通確認を行なう疎通確認実行部21と、疎通結果の収集処理を行なう経路監視情報収集部22と、を備えることとする。図1における監視エージェント110たる、サーバB、サーバC、サーバD、サーバE(102〜105)は、通信相手先の監視対象機器120に向けてポーリング等を用いて疎通確認を行なう疎通確認実行部21と、疎通結果の収集処理を行なう経路監視情報収集部22とを備えている。図1ではサーバB(102)の機能構成のみ示しているが、サーバC(103)、サーバD(104)、サーバE(105)も同様の構成を持つものとする。   In addition, the monitoring agent 110 includes a communication confirmation execution unit 21 that performs communication confirmation toward the monitoring target device 120 and a route monitoring information collection unit 22 that performs communication result collection processing. The server B, the server C, the server D, and the server E (102 to 105), which are the monitoring agents 110 in FIG. 1, perform communication confirmation using polling or the like toward the monitoring target device 120 of the communication partner. 21 and a route monitoring information collecting unit 22 for collecting communication results. Although only the functional configuration of the server B (102) is shown in FIG. 1, it is assumed that the server C (103), the server D (104), and the server E (105) have the same configuration.

また、システム100たる監視マネージャは、監視エージェント110と同様、疎通確認実行部及び経路監視情報収集部を備えることも可能であり、図1の例では、、疎通確認実行部14と経路監視情報収集部15を備えることとしている。   In addition, the monitoring manager as the system 100 can include a communication confirmation execution unit and a route monitoring information collection unit similarly to the monitoring agent 110. In the example of FIG. The unit 15 is provided.

なお、これまで示した システム100における各機能部11〜15は、ハードウェアとして実現してもよいし、メモリやHDD(Hard Disk Drive)などの適宜な記憶装置に格納したプログラムとして実現するとしてもよい。この場合、前記CPU34がプログラム実行に合わせて記憶装置より該当プログラムをメモリ33に読み出して、これを実行することとなる。   Note that each of the functional units 11 to 15 in the system 100 described so far may be realized as hardware, or may be realized as a program stored in an appropriate storage device such as a memory or an HDD (Hard Disk Drive). Good. In this case, the CPU 34 reads the corresponding program from the storage device to the memory 33 in accordance with the program execution, and executes it.

また、前記ネットワーク130に関しては、インターネット、LANの他、ATM回線や専用回線、WAN(Wide Area Network)、電灯線ネットワーク、無線ネットワーク、公衆回線網、携帯電話網、シリアル・インターフェース通信線など様々なネットワークを採用することも出来る。また、VPN(Virtual Private Network)など仮想専用ネットワーク技術を用いれば、インターネットを採用した際にセキュリティ性を高めた通信が確立され好適である。なお、前記シリアル・インターフェイスは、単一の信号線を用いて1ビットずつ順次データを送るシリアル伝送で、外部機器と接続するためのインターフェースを指し、通信方式としてはRS-232C、RS-422、IrDA、USB、IEEE1394、ファイバ・チャネルなどが想定できる。   The network 130 is not limited to the Internet, LAN, ATM line, dedicated line, WAN (Wide Area Network), power line network, wireless network, public line network, mobile phone network, serial interface communication line, etc. A network can also be adopted. If a virtual private network technology such as VPN (Virtual Private Network) is used, communication with improved security is established when the Internet is adopted. The serial interface is a serial transmission that sends data one bit at a time using a single signal line, and refers to an interface for connecting to external devices. Communication methods include RS-232C, RS-422, IrDA, USB, IEEE1394, fiber channel, etc. can be assumed.

−−−経路監視情報の収集及び編集処理−−−
以下、障害経路診断方法の実際手順について、図に基づき説明する。なお、以下で説明する障害経路診断方法に対応する各種動作は、前記システム100がメモリ33に読み出して実行するプログラム32によって実現される。そして、このプログラム32は、以下に説明される各種の動作を行うためのコードから構成されている。
--- Collecting and editing route monitoring information ---
Hereinafter, the actual procedure of the failure path diagnosis method will be described with reference to the drawings. Various operations corresponding to the failure path diagnosis method described below are realized by a program 32 that the system 100 reads into the memory 33 and executes. And this program 32 is comprised from the code | cord | chord for performing the various operation | movement demonstrated below.

以下に、経路監視情報の収集及び編集の処理手順を説明する。図2は、本実施形態における経路監視情報の収集・編集処理の手順を示すフロー図である。まず、システム100たる監視マネージャにおけるネットワーク監視部12が起動されると、監視マネージャは、各監視エージェント110に対して、経路監視情報収集の信号を送る(ステップ1210)。 前記ネットワーク監視部12は、従来のネットワーク監視方法同様、所定周期で起動するものとしたり、ユーザあるいはシステム管理者がコマンド実行により起動するものとしてもよい。   Hereinafter, a procedure for collecting and editing route monitoring information will be described. FIG. 2 is a flowchart showing the procedure of the route monitoring information collection / editing process in this embodiment. First, when the network monitoring unit 12 in the monitoring manager which is the system 100 is activated, the monitoring manager sends a route monitoring information collection signal to each monitoring agent 110 (step 1210). The network monitoring unit 12 may be activated at a predetermined cycle as in the conventional network monitoring method, or may be activated by a user or system administrator by executing a command.

監視エージェント110であるサーバB(102)、サーバC(103)、サーバD(104)、サーバE(105)は前記信号を受け取ると、疎通確認実行部21を機能させ、通信相手先の監視対象機器120に向けてポーリング等を用いた疎通確認を行なう(ステップ1220)。ここではサーバB(102)での処理を説明するが、サーバC(103)、サーバD(104)、サーバE(105)での処理も同様である。   When the server B (102), the server C (103), the server D (104), and the server E (105), which are the monitoring agents 110, receive the signal, the communication check execution unit 21 functions to monitor the communication partner. Communication confirmation using polling or the like is performed toward the device 120 (step 1220). Here, the processing in the server B (102) will be described, but the processing in the server C (103), the server D (104), and the server E (105) is the same.

監視エージェント110における経路監視情報収集部22では、疎通確認の結果を収集する(ステップ1230)。前記ステップ1220とステップ1230の処理は、通信相手先の監視対象機器120の全てに対して実施するまで繰り返すものとする。これにより全疎通経路の疎通確認結果を得ることとなる。   The route monitoring information collection unit 22 in the monitoring agent 110 collects the result of the communication confirmation (step 1230). The processing in step 1220 and step 1230 is repeated until it is executed for all the monitoring target devices 120 of the communication partner. As a result, the communication confirmation result of all communication paths is obtained.

なお、本実施形態で用いる疎通確認の結果とは、ポーリング等を用い通信相手先の監視対象機器120に向けた応答に対して、前記監視対象機器120が返信を返した場合を疎通確認ができたこととし、返信を返さず無応答やタイムアウトとなった場合を疎通確認できないこととする。また、本実施形態では、疎通確認ができた場合の疎通結果を「0」、一方、疎通確認が出来なかった場合の疎通結果を「1」の記号として象徴する。   The communication confirmation result used in the present embodiment can be a communication confirmation when the monitoring target device 120 returns a response to the response to the monitoring target device 120 of the communication partner using polling or the like. It is assumed that communication cannot be confirmed when no response is returned and no response is received or a timeout occurs. In this embodiment, the communication result is symbolized as “0” when the communication is confirmed, and the communication result when the communication is not confirmed as “1”.

サーバB(102)の経路監視情報の収集完了を確認後(ステップ1240)、監視マネージャのサーバAは、サーバB(102)の疎通結果、及び同様にサーバC(103)、サーバD(104)、サーバE(105)の疎通結果を収集する(ステップ1250)。   After confirming the completion of collection of the route monitoring information of the server B (102) (step 1240), the monitoring manager server A communicates with the server B (102), and similarly, the server C (103) and the server D (104). The communication result of the server E (105) is collected (step 1250).

前記サーバAは、収集した疎通結果をまとめ、経路監視情報テーブル17を作成する(ステップ1260)。この経路監視情報テーブル17は、テーブル形式だけでなくテキスト形式等さまざまな形式を用いてもよいが、本実施形態においては、図4や図7に示すようなテーブル形式をもつこととする。以上の処理により、現時点での、ネットワークシステム上の経路監視情報を採取することができる。   The server A collects the collected communication results and creates the route monitoring information table 17 (step 1260). The route monitoring information table 17 may use not only a table format but also various formats such as a text format. In this embodiment, the route monitoring information table 17 has a table format as shown in FIGS. Through the above processing, the current route monitoring information on the network system can be collected.

−−−経路監視情報から障害判定を行なう処理−−−
図3は、本実施形態における経路監視情報から障害判定を行なう処理手順を示すフロー図である。次に、経路監視情報から障害判定を行なう処理手順を説明する。監視マネージャのサーバAのネットワーク監視部12での処理終了後、障害判定部13が起動する。
--- Processing to determine failure from route monitoring information ---
FIG. 3 is a flowchart showing a processing procedure for determining a failure from the route monitoring information in the present embodiment. Next, a processing procedure for determining a failure from the route monitoring information will be described. After the process in the network monitoring unit 12 of the monitoring manager server A is completed, the failure determination unit 13 is activated.

この障害判定部13は、各監視エージェント110から採取した経路監視情報から、障害の有無を判定し、障害発生時は、障害機器の絞込みを行なう。まず経路監視情報テーブル17の疎通結果より、障害が発生しているか否かの判定を行なう(ステップ1310)。 経路監視情報テーブル17に疎通確認ができなかった結果である「1」がない場合は(ステップ1310:NO)、システムは正常に稼動していると判定し(ステップ1311)、障害判定部13での処理は終了する。   The failure determination unit 13 determines the presence / absence of a failure from the route monitoring information collected from each monitoring agent 110, and narrows down failure devices when a failure occurs. First, it is determined from the communication result of the route monitoring information table 17 whether or not a failure has occurred (step 1310). If there is no “1” in the route monitoring information table 17 as a result of the failure to confirm communication (step 1310: NO), it is determined that the system is operating normally (step 1311), and the failure determination unit 13 This process ends.

他方、前記経路監視情報テーブル17に「1」がある場合は、ネットワークシステム上の機器において障害が発生していると判定し(ステップ1310:YES)、次に処理を進める。この場合、前記障害判定部13は、経路監視情報テーブル17に関し、障害情報データベース16の障害パターンと疎通結果が一致するものがあるかどうか逐一チェックをする(ステップ1320)。   On the other hand, if “1” is present in the route monitoring information table 17, it is determined that a failure has occurred in the device on the network system (step 1310: YES), and the processing proceeds next. In this case, the failure determination unit 13 checks the route monitoring information table 17 every time whether there is a match between the failure pattern in the failure information database 16 and the communication result (step 1320).

この処理において、障害パターンと疎通結果とが一致している場合(ステップ1330:YES)は、一致した障害パターンに対応づけられている想定障害機器において、障害が発生している可能性が高いと判定し(ステップ1331)、この判定結果をシステム管理者に通知する(ステップ1360)。通知方法としては、システム100または所定端末のディスプレイ画面に判定結果を表示したり、或いは所定端末にメール送信したりする。他方、前記判定において、障害パターンと疎通結果とが一致していないとした場合(ステップ1330:NO)、次に処理を進める。   In this process, if the failure pattern matches the communication result (step 1330: YES), it is highly likely that a failure has occurred in the assumed failure device associated with the matched failure pattern. A determination is made (step 1331), and the determination result is notified to the system administrator (step 1360). As a notification method, a determination result is displayed on the display screen of the system 100 or a predetermined terminal, or an e-mail is transmitted to the predetermined terminal. On the other hand, if it is determined in the determination that the failure pattern does not match the communication result (step 1330: NO), the process proceeds next.

この場合、障害判定部13は、経路監視情報テーブル17と障害情報データベース16の各障害パターンとの疎通結果の一致度を算出する(ステップ1340)。この一致度は障害情報データベース16の障害パターンごとに一つずつ算出する。ここでは、一致度に閾値を設けることとする。障害情報データベース16の各障害パターンで求められた一致度において閾値を超えたものがあれば(ステップ1350:YES)、障害判定部13は障害が発生している可能性が高い機器と判定して(ステップ1352)、この判定結果をシステム管理者に通知する(ステップ1360)。   In this case, the failure determination unit 13 calculates the degree of coincidence of communication results between the route monitoring information table 17 and each failure pattern in the failure information database 16 (step 1340). This degree of coincidence is calculated for each failure pattern in the failure information database 16. Here, a threshold value is provided for the degree of coincidence. If there is a degree of coincidence obtained for each failure pattern in the failure information database 16 that exceeds the threshold (step 1350: YES), the failure determination unit 13 determines that the device is likely to have a failure. (Step 1352), the determination result is notified to the system administrator (Step 1360).

他方、前記判定において全て閾値以下の場合(ステップ1350:NO)、問題になるほどの障害が発生していないものと判定し(ステップ1351)、システム管理者への通知は行なわずに処理を終了する。   On the other hand, if all of the determinations are equal to or less than the threshold (step 1350: NO), it is determined that no trouble has occurred (step 1351), and the process is terminated without notifying the system administrator. .

−−−障害判定処理の具体例−−−
続いて、上記の障害判定処理を障害パターン例を用いて具体的に説明する。
図4は、本実施形態における経路監視情報テーブル17の設定内容例1を示す図であり、スイッチSb(107)が障害になった場合の経路監視情報テーブル17の構成例である。この経路監視情報テーブル17では、横軸が各監視エージェント(本障害例では、サーバA(101)を含む)を、縦軸にその監視エージェントが疎通確認を行った通信相手先の監視対象機器を示している。
--- Specific examples of failure determination processing ---
Subsequently, the above-described failure determination process will be specifically described using a failure pattern example.
FIG. 4 is a diagram showing a setting content example 1 of the route monitoring information table 17 in the present embodiment, and is a configuration example of the route monitoring information table 17 when the switch Sb (107) becomes a failure. In this route monitoring information table 17, the horizontal axis indicates each monitoring agent (including server A (101) in this failure example), and the vertical axis indicates the communication target monitoring target device with which the monitoring agent has confirmed communication. Show.

例えば、サーバB(102)の場合、監視エージェントBが通信している監視対象機器はサーバA(101)、サーバC、サーバD、サーバE(103〜105)の4台であり、各々の通信相手先の監視対象機器へ疎通確認を行なったものとする。   For example, in the case of the server B (102), the monitoring target devices with which the monitoring agent B communicates are four servers, a server A (101), a server C, a server D, and a server E (103 to 105). Assume that communication with the monitoring target device of the other party has been confirmed.

スイッチSb(107)において障害が発生した場合、スイッチSb(107)を経由する、(1)サーバB(102)から監視エージェントC(103)へ、(2)サーバC(103)からサーバB(102)への疎通確認ができない。また、他の経路では、Sb(107)を経由しないため疎通確認ができる。前に述べたように本障害例では、疎通確認ができた通信相手先には応答フラグ「0」を、疎通確認できない通信相手先には無応答フラグ「1」を設定するものとする。   When a failure occurs in the switch Sb (107), (1) from the server B (102) to the monitoring agent C (103) and (2) from the server C (103) to the server B (via the switch Sb (107) 102) Cannot confirm communication. In addition, since communication does not pass through Sb (107) on other routes, communication can be confirmed. As described above, in this failure example, it is assumed that the response flag “0” is set for the communication partner whose communication has been confirmed, and the no-response flag “1” is set for the communication partner whose communication has not been confirmed.

図5及び図6は、本実施形態における障害パターンの設定内容例1を示す図であり、図5はスイッチSb(107)の障害パターン、図6はスイッチSc(108)の障害パターンである。このような、図5、図6に示す障害情報データベース16と、図4に示す経路監視情報テーブル17とを用いて、互いの疎通結果を比較すると、図5に示すSb障害パターンと経路監視情報テーブル17における疎通確認結果とが一致することがわかる。したがって、前記障害判定部13はスイッチSb(107)において障害が発生していると判定する。   5 and 6 are diagrams showing a failure pattern setting content example 1 in the present embodiment. FIG. 5 shows a failure pattern of the switch Sb (107), and FIG. 6 shows a failure pattern of the switch Sc (108). Using the failure information database 16 shown in FIGS. 5 and 6 and the route monitoring information table 17 shown in FIG. 4, when the mutual communication results are compared, the Sb failure pattern and the route monitoring information shown in FIG. It can be seen that the communication confirmation result in the table 17 matches. Therefore, the failure determination unit 13 determines that a failure has occurred in the switch Sb (107).

図7は、本実施形態における経路監視情報テーブルの設定内容例2を示す図であり、スイッチSc(108)において経路監視情報の不整合障害が発生した場合の経路監視情報テーブルの構成例である。   FIG. 7 is a diagram showing a setting example 2 of the route monitoring information table in the present embodiment, and is a configuration example of the route monitoring information table when a mismatch in the route monitoring information occurs in the switch Sc (108). .

このような障害の場合、障害機器が機器のダウンまでに至らない等の理由のために、一時的に障害機器経由の疎通確認が可能となり、障害機器を絞り込むための経路情報に整合性が取れなくなる。本障害例では、スイッチSc(108)を経由する(1)サーバD(104)からサーバE(105)へ、(2)サーバE(105)からサーバD(104)へのみ一時的に疎通確認ができるが、他のスイッチSc(108)を経由する経路では、疎通確認ができないものとする。   In the case of such a failure, it is possible to temporarily check the communication via the faulty device because the faulty device does not lead to the device being down, and the route information for narrowing down the faulty device can be consistent. Disappear. In this failure example, the communication is temporarily confirmed only from (1) Server D (104) to Server E (105) and (2) Server E (105) to Server D (104) via switch Sc (108). However, it is assumed that communication cannot be confirmed on a route that passes through another switch Sc (108).

図5、図6に示す障害情報データベース16において、破線で囲っている部分が、スイッチSc(108)の経路監視情報の不整合障害時に得られた経路監視情報テーブル17と障害パターンの疎通結果フラグの設定が一致している部分である。本例では、結果の一致数(図5、図6の破線で囲っている分のセルの数)を経路監視組み合わせ数で割ることにより求められた数値を当該障害パターンの一致度として定義することができる。この場合、前記一致度は、各々、図5の障害情報データベース16に対応するものが30%、図6の障害情報データベース16に対応するものが90%となる。   In the failure information database 16 shown in FIGS. 5 and 6, the portion surrounded by a broken line is the route monitoring information table 17 obtained when the route monitoring information inconsistency failure of the switch Sc (108) and the failure pattern communication result flag This is where the settings match. In this example, a numerical value obtained by dividing the number of matching results (the number of cells surrounded by broken lines in FIGS. 5 and 6) by the number of route monitoring combinations is defined as the degree of matching of the failure pattern. Can do. In this case, the degree of coincidence is 30% corresponding to the failure information database 16 in FIG. 5 and 90% corresponding to the failure information database 16 in FIG.

これにより、図7に示した経路監視情報テーブル17は、図6の障害パターンであるスイッチSc(108)障害パターンとの一致度が最も高いことが分かり、障害判定部13は、スイッチSc(108)が障害である可能性が高いと判定し、判定結果をシステム管理者に通知することとなる。   Accordingly, it can be seen that the route monitoring information table 17 shown in FIG. 7 has the highest degree of coincidence with the failure pattern of the switch Sc (108), which is the failure pattern of FIG. ) Is likely to be a failure, and the determination result is notified to the system administrator.

本発明によれば、監視マネージャが直接検知しえない監視エージェント間の経路を含めたネットワーク経路の監視を行なうことが可能になる。これにより、ネットワークにおいてほぼ漏れなく障害機器を検知することができる。
また障害機器を絞りこむための経路情報の整合性がとれないような複雑な障害の場合でも、障害パターンとの一致度を比較することにより効率的に障害機器を推定し検知することが出来る。このため、実際に機器がダウンする前に予防措置を講じることが可能となり、影響範囲を最小限にすることができる。
したがって、障害検出の漏れを無くして障害機器の確実な特定が可能となる。
According to the present invention, it is possible to monitor a network path including a path between monitoring agents that cannot be directly detected by the monitoring manager. Thereby, it is possible to detect a faulty device in the network with almost no leakage.
Further, even in the case of a complicated failure where the consistency of the path information for narrowing down the failure device cannot be obtained, the failure device can be efficiently estimated and detected by comparing the degree of coincidence with the failure pattern. For this reason, it is possible to take preventive measures before the device actually goes down, and the influence range can be minimized.
Accordingly, it is possible to reliably identify the faulty device without missing the fault detection.

以上、本発明の実施の形態について、その実施の形態に基づき具体的に説明したが、これに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。   As mentioned above, although embodiment of this invention was described concretely based on the embodiment, it is not limited to this and can be variously changed in the range which does not deviate from the summary.

本実施形態における障害経路診断システムを含むネットワーク構成図である。It is a network block diagram including the failure path | route diagnostic system in this embodiment. 本実施形態における経路監視情報の収集・編集処理の手順を示すフロー図である。It is a flowchart which shows the procedure of collection / edit processing of the route monitoring information in this embodiment. 本実施形態における経路監視情報から障害判定を行なう処理手順を示すフロー図である。It is a flowchart which shows the process sequence which performs a failure determination from the route monitoring information in this embodiment. 本実施形態における経路監視情報テーブルの設定内容例1を示す図である。It is a figure which shows the example 1 of a setting content of the path | route monitoring information table in this embodiment. 本実施形態における障害パターンの設定内容例1を示す図である。It is a figure which shows the setting content example 1 of the failure pattern in this embodiment. 本実施形態における障害パターンの設定内容例2を示す図である。It is a figure which shows the setting content example 2 of the failure pattern in this embodiment. 本実施形態における経路監視情報テーブルの設定内容例2を示す図である。It is a figure which shows the setting content example 2 of the path | route monitoring information table in this embodiment.

符号の説明Explanation of symbols

11 監視マネージャの初期設定部
12 監視マネージャのネットワーク監視部
13 監視マネージャの障害判定部
14 監視マネージャの疎通確認実行部
15 監視マネージャの経路監視情報収集部
16 障害情報データベース
17 経路監視情報テーブル
21 監視エージェント(サーバB)の疎通確認実行部
22 監視エージェント(サーバB)の経路監視情報収集部
31 プログラムデータベース
32 プログラム
33 メモリ
34 CPU
35 入出力インターフェイス
36 通信手段
37 I/O部
100 障害経路診断システム、システム、監視マネージャ
102 監視エージェント(サーバB)
103 監視エージェント(サーバC)
104 監視エージェント(サーバD)
105 監視エージェント(サーバE)
106 スイッチSa
107 スイッチSb
108 スイッチSc
109 ルータRa
110 監視エージェント
120 監視対象機器
130 ネットワーク
11 Monitoring Manager Initial Setting Unit 12 Monitoring Manager Network Monitoring Unit 13 Monitoring Manager Fault Determination Unit 14 Monitoring Manager Communication Confirmation Execution Unit 15 Monitoring Manager Route Monitoring Information Collection Unit 16 Fault Information Database 17 Path Monitoring Information Table 21 Monitoring Agent (Server B) Communication Confirmation Execution Unit 22 Route Monitoring Information Collection Unit 31 of Monitoring Agent (Server B) Program Database 32 Program 33 Memory 34 CPU
35 I / O interface 36 Communication means 37 I / O unit 100 Fault path diagnosis system, system, monitoring manager 102 Monitoring agent (server B)
103 Monitoring agent (Server C)
104 Monitoring agent (Server D)
105 Monitoring agent (Server E)
106 Switch Sa
107 Switch Sb
108 Switch Sc
109 Router Ra
110 monitoring agent 120 monitored device 130 network

Claims (7)

複数のネットワーク機器から構成されるネットワークの監視を行うシステムであって、
監視エージェントと監視対象機器との間の疎通経路パターンと、前記疎通経路において発生が想定される障害パターンとを対応付けて格納した障害情報データベースと、
監視エージェントから収集した疎通確認結果を、前記障害情報データベースにおける疎通経路パターンに照合し、疎通確認結果と疎通経路パターンとを対応づけた経路監視情報テーブルを生成する、ネットワーク監視部と、
前記経路監視情報テーブルを前記障害情報データベースに照合して、同一の疎通経路パターンにおいて疎通確認結果と一致する障害パターンを検出し、当該障害パターンに対応する障害機器を障害発生機器として特定する、障害判定部と、
を備えることを特徴とする障害経路診断システム。
A system for monitoring a network composed of a plurality of network devices,
A failure information database in which a communication route pattern between a monitoring agent and a monitoring target device and a failure pattern expected to occur in the communication route are stored in association with each other;
A network monitoring unit that collates the communication confirmation result collected from the monitoring agent with the communication path pattern in the failure information database and generates a path monitoring information table in which the communication confirmation result and the communication path pattern are associated;
A failure that collates the route monitoring information table with the failure information database, detects a failure pattern that matches a communication confirmation result in the same communication route pattern, and identifies a failed device corresponding to the failure pattern as a failed device A determination unit;
A failure path diagnosis system comprising:
請求項1において、
前記障害判定部は、同一の疎通経路パターンにおいて疎通確認結果と一致する障害パターンが検出できない場合、前記障害情報データベースと経路監視情報テーブルとの一致度を算定して当該一致度が所定値以上となった障害パターンを検出し、当該障害パターンに対応する障害機器を障害発生機器候補として特定することを特徴とする障害経路診断システム。
In claim 1,
When the failure determination unit cannot detect a failure pattern that matches the communication confirmation result in the same communication route pattern, the failure determination unit calculates a matching degree between the failure information database and the route monitoring information table, and the matching degree is equal to or greater than a predetermined value. A fault path diagnosis system that detects a fault pattern that has become a fault and identifies a faulty device corresponding to the fault pattern as a faulty device candidate.
請求項1または2において、
前記ネットワーク監視部が、前記監視エージェントに対して、監視対象機器との疎通確認の実行を指示することを特徴とする障害経路診断システム。
In claim 1 or 2,
The fault path diagnosis system, wherein the network monitoring unit instructs the monitoring agent to execute communication confirmation with a monitoring target device.
請求項1〜3のいずれかにおいて、
前記監視対象機器に向けて疎通確認を行なう疎通確認実行部と、
疎通結果の収集処理を行なう経路監視情報収集部と、
を備えるものであることを特徴とする障害経路診断システム。
In any one of Claims 1-3,
A communication confirmation execution unit that performs communication confirmation toward the monitoring target device;
A route monitoring information collection unit for collecting communication results;
A failure path diagnosis system comprising:
請求項1〜4のいずれかにおいて、
前記監視エージェントが、前記監視対象機器に向けて疎通確認を行なう疎通確認実行部と、疎通結果の収集処理を行なう経路監視情報収集部と、を備えることを特徴とする障害経路診断システム。
In any one of Claims 1-4,
A failure path diagnosis system, wherein the monitoring agent includes a communication confirmation execution unit that performs communication confirmation toward the monitoring target device, and a path monitoring information collection unit that performs processing for collecting communication results.
複数のネットワーク機器から構成されるネットワークの監視を、
監視エージェントと監視対象機器との間の疎通経路パターンと、前記疎通経路において発生が想定される障害パターンとを対応付けて格納した障害情報データベースを備えたコンピュータにより行う方法であって、
監視エージェントから収集した疎通確認結果を、前記障害情報データベースにおける疎通経路パターンに照合し、疎通確認結果と疎通経路パターンとを対応づけた経路監視情報テーブルを生成し、
前記経路監視情報テーブルを前記障害情報データベースに照合して、同一の疎通経路パターンにおいて疎通確認結果と一致する障害パターンを検出し、当該障害パターンに対応する障害機器を障害発生機器として特定する、ことを特徴とする障害経路診断方法。
Network monitoring consisting of multiple network devices
It is a method performed by a computer having a failure information database in which a communication route pattern between a monitoring agent and a monitoring target device and a failure pattern expected to occur in the communication route are stored in association with each other,
The communication confirmation result collected from the monitoring agent is collated with the communication route pattern in the failure information database, and a route monitoring information table in which the communication confirmation result is associated with the communication route pattern is generated.
Collating the route monitoring information table with the failure information database, detecting a failure pattern that matches a communication confirmation result in the same communication route pattern, and identifying a failure device corresponding to the failure pattern as a failure occurrence device; A failure path diagnosis method characterized by
複数のネットワーク機器から構成されるネットワークの監視方法を、
監視エージェントと監視対象機器との間の疎通経路パターンと、前記疎通経路において発生が想定される障害パターンとを対応付けて格納した障害情報データベースを備えたコンピュータに実行させるプログラムであって、
監視エージェントから収集した疎通確認結果を、前記障害情報データベースにおける疎通経路パターンに照合し、疎通確認結果と疎通経路パターンとを対応づけた経路監視情報テーブルを生成するステップと、
前記経路監視情報テーブルを前記障害情報データベースに照合して、同一の疎通経路パターンにおいて疎通確認結果と一致する障害パターンを検出し、当該障害パターンに対応する障害機器を障害発生機器として特定するステップと、を含むことを特徴とする障害経路診断プログラム。
A network monitoring method consisting of multiple network devices
A program to be executed by a computer having a failure information database in which a communication route pattern between a monitoring agent and a monitoring target device and a failure pattern expected to occur in the communication route are stored in association with each other,
Collating the communication confirmation result collected from the monitoring agent with the communication route pattern in the failure information database, and generating a route monitoring information table in which the communication confirmation result is associated with the communication route pattern;
Collating the route monitoring information table with the failure information database, detecting a failure pattern that matches a communication confirmation result in the same communication route pattern, and identifying a faulty device corresponding to the fault pattern as a faulty device; And a failure path diagnosis program.
JP2004377704A 2004-12-27 2004-12-27 Server apparatus, failure path diagnosis method, and failure path diagnosis program Expired - Fee Related JP4485344B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004377704A JP4485344B2 (en) 2004-12-27 2004-12-27 Server apparatus, failure path diagnosis method, and failure path diagnosis program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004377704A JP4485344B2 (en) 2004-12-27 2004-12-27 Server apparatus, failure path diagnosis method, and failure path diagnosis program

Publications (2)

Publication Number Publication Date
JP2006186633A true JP2006186633A (en) 2006-07-13
JP4485344B2 JP4485344B2 (en) 2010-06-23

Family

ID=36739410

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004377704A Expired - Fee Related JP4485344B2 (en) 2004-12-27 2004-12-27 Server apparatus, failure path diagnosis method, and failure path diagnosis program

Country Status (1)

Country Link
JP (1) JP4485344B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008032403A1 (en) * 2006-09-15 2008-03-20 Fujitsu Limited Path confirmation method and device
JP2011097466A (en) * 2009-10-30 2011-05-12 Ntt Docomo Inc Monitoring system, monitoring method, and program for monitoring
JP2015198386A (en) * 2014-04-02 2015-11-09 Necフィールディング株式会社 Fault detector, fault detection system, fault detection method and program
WO2020085050A1 (en) * 2018-10-26 2020-04-30 日本電信電話株式会社 Inference method, inference device, and inference program
CN112583640A (en) * 2020-12-02 2021-03-30 厦门渊亭信息科技有限公司 Service fault detection method and device based on knowledge graph
JP7440747B2 (en) 2020-01-27 2024-02-29 富士通株式会社 Information processing equipment, information processing system, and network communication confirmation method

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03153140A (en) * 1989-11-09 1991-07-01 Fujitsu Ltd Fault discrimination system by pattern bit map
JPH03262346A (en) * 1990-03-13 1991-11-22 Nec Corp Fault discrimination system
JPH05260050A (en) * 1992-03-13 1993-10-08 Hitachi Ltd Network fault diagnostic system
JPH08223251A (en) * 1995-02-08 1996-08-30 Fujitsu Ltd Method for estimating deteriorated line quality block
JPH08288944A (en) * 1995-04-18 1996-11-01 Hitachi Ltd Communication installation management system
JPH10164060A (en) * 1996-11-28 1998-06-19 Fujitsu Ltd Monitoring system in data communication equipment
JP2000349753A (en) * 1999-06-03 2000-12-15 Nec Corp Maintenance device for transmission terminating device
JP2001244946A (en) * 2000-03-01 2001-09-07 Mitsubishi Electric Corp Network monitoring device
JP2001251300A (en) * 2000-03-08 2001-09-14 Nec Eng Ltd Network maintenance system
JP2001333063A (en) * 2000-05-24 2001-11-30 Nec Corp Network management system and alarm management method used for it
JP2004208235A (en) * 2002-12-26 2004-07-22 Matsushita Electric Ind Co Ltd Remote monitoring control system, device under monitor, monitoring device, and data collecting method for device information

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03153140A (en) * 1989-11-09 1991-07-01 Fujitsu Ltd Fault discrimination system by pattern bit map
JPH03262346A (en) * 1990-03-13 1991-11-22 Nec Corp Fault discrimination system
JPH05260050A (en) * 1992-03-13 1993-10-08 Hitachi Ltd Network fault diagnostic system
JPH08223251A (en) * 1995-02-08 1996-08-30 Fujitsu Ltd Method for estimating deteriorated line quality block
JPH08288944A (en) * 1995-04-18 1996-11-01 Hitachi Ltd Communication installation management system
JPH10164060A (en) * 1996-11-28 1998-06-19 Fujitsu Ltd Monitoring system in data communication equipment
JP2000349753A (en) * 1999-06-03 2000-12-15 Nec Corp Maintenance device for transmission terminating device
JP2001244946A (en) * 2000-03-01 2001-09-07 Mitsubishi Electric Corp Network monitoring device
JP2001251300A (en) * 2000-03-08 2001-09-14 Nec Eng Ltd Network maintenance system
JP2001333063A (en) * 2000-05-24 2001-11-30 Nec Corp Network management system and alarm management method used for it
JP2004208235A (en) * 2002-12-26 2004-07-22 Matsushita Electric Ind Co Ltd Remote monitoring control system, device under monitor, monitoring device, and data collecting method for device information

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008032403A1 (en) * 2006-09-15 2008-03-20 Fujitsu Limited Path confirmation method and device
JPWO2008032403A1 (en) * 2006-09-15 2010-01-21 富士通株式会社 Route confirmation method and apparatus
JP4536142B2 (en) * 2006-09-15 2010-09-01 富士通株式会社 Route confirmation method and apparatus
US8018836B2 (en) 2006-09-15 2011-09-13 Fujitsu Limited Route confirmation method and device
JP2011097466A (en) * 2009-10-30 2011-05-12 Ntt Docomo Inc Monitoring system, monitoring method, and program for monitoring
JP2015198386A (en) * 2014-04-02 2015-11-09 Necフィールディング株式会社 Fault detector, fault detection system, fault detection method and program
WO2020085050A1 (en) * 2018-10-26 2020-04-30 日本電信電話株式会社 Inference method, inference device, and inference program
JP2020068510A (en) * 2018-10-26 2020-04-30 日本電信電話株式会社 Estimation method, estimation device, and estimation program
JP6997378B2 (en) 2018-10-26 2022-01-17 日本電信電話株式会社 Estimating method, estimation device and estimation program
JP7440747B2 (en) 2020-01-27 2024-02-29 富士通株式会社 Information processing equipment, information processing system, and network communication confirmation method
CN112583640A (en) * 2020-12-02 2021-03-30 厦门渊亭信息科技有限公司 Service fault detection method and device based on knowledge graph

Also Published As

Publication number Publication date
JP4485344B2 (en) 2010-06-23

Similar Documents

Publication Publication Date Title
JP4758259B2 (en) Network monitoring apparatus and method
US7281040B1 (en) Diagnostic/remote monitoring by email
US9319284B2 (en) Operation delay monitoring method, operation management apparatus, and operation management program
US20070274234A1 (en) Network management method
CN106789306B (en) Method and system for detecting, collecting and recovering software fault of communication equipment
JP7423942B2 (en) information processing system
JP2006211173A (en) Network monitoring program and network system
JP2013130901A (en) Monitoring server and network device recovery system using the same
JP4485344B2 (en) Server apparatus, failure path diagnosis method, and failure path diagnosis program
US20130090760A1 (en) Apparatus and method for managing robot components
JPH09205429A (en) Network fault diagnostic device, fault prediction device, and its diagnostic and prediction method
JP2014053658A (en) Failure site estimation system and failure site estimation program
JP6317074B2 (en) Failure notification device, failure notification program, and failure notification method
JP2003345620A (en) Process monitoring method for multi-node cluster system
JP4668117B2 (en) Network management system and method
JP2010009127A (en) Management program and management device
JP4437416B2 (en) Network maintenance system
JP4775894B2 (en) Intermediary device for remote diagnosis
JP2007264907A (en) Fault notification system, fault notification method, and fault notification program
US10432451B2 (en) Systems and methods for managing network health
CN113079059A (en) Network state monitoring method and device, electronic equipment and readable storage medium
JP6819357B2 (en) Operation confirmation device, operation confirmation program, operation confirmation method, and operation confirmation system
CN109450712A (en) A kind of fault detection method of communication equipment
JP2007156869A (en) Alarm management apparatus and alarm management method
JP6351076B2 (en) Maintenance device, network system and maintenance method thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090414

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100323

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100324

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130402

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140402

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees