JP2004258942A - Method for reporting failure of network equipment - Google Patents

Method for reporting failure of network equipment Download PDF

Info

Publication number
JP2004258942A
JP2004258942A JP2003048474A JP2003048474A JP2004258942A JP 2004258942 A JP2004258942 A JP 2004258942A JP 2003048474 A JP2003048474 A JP 2003048474A JP 2003048474 A JP2003048474 A JP 2003048474A JP 2004258942 A JP2004258942 A JP 2004258942A
Authority
JP
Japan
Prior art keywords
failure
information
network
network device
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003048474A
Other languages
Japanese (ja)
Inventor
Shiyunki Kobayashi
春輝 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003048474A priority Critical patent/JP2004258942A/en
Publication of JP2004258942A publication Critical patent/JP2004258942A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Computer And Data Communications (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a method making it possible to integrally manage measures against failures as an applied technique of SNMP (Simple Network Management Protocol). <P>SOLUTION: A report of network failure information is sent to not only a network supervising device but also other network devices to specify a failed part and investigate the cause. To specify the time of the failure, the "cumulative time at the occurrence of the failure" and the "cumulative time at the request of failure information" are sent to an information requester. Because the location, cause and time of the failure can be investigated, the method has the effect of specifying the cause of the failure. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、ネットワーク障害時に使用されているプロトコルSNMP(Simple Network Management Protocol)に関する応用技術を搭載したネットワーク装置による障害通知方法に関する。
【0002】
【従来の技術】
従来のネットワーク障害通知方法としては、特開平8−237249号公報のような方法が提案されている。ここでは、障害監視端末がネットワークの最上位または外部に設定されており、各端末への障害情報の通知は使用可能なネットワークに接続された端末にしか通知出来ない。
【0003】
【特許文献1】
特開平8−237249号公報
【0004】
【発明が解決しようとする課題】
上記従来の方法では、障害の発生した端末から監視端末に対してのみ障害情報を通知しており、通信路の障害について配慮していないため、障害端末と監視端末の間で障害が発生すると、障害発生端末の上流に接続されているネットワーク装置で特定の通信路が使用出来なくなったことのみ検知可能であり、監視端末で詳細な障害内容を検知することが出来なかった。また、装置を再起動すると障害ログがなくなり原因調査が出来なくなるという問題があった。さらに、ログ情報がネットワーク装置の起動時間からの累積時間で表示されていることが多いため、障害発生時刻を知ることが難しいという問題があった。
【0005】
本発明の目的は、これらの問題を解決し障害対策の一元管理を可能とする方法を提供することにある。
【0006】
【課題を解決するための手段】
上記目的を達成するために、本発明のネットワーク機器の障害通知方法は、下記の方法で障害の監視と通知を行なう。
【0007】
まず、障害を検知したネットワーク装置が装置名、障害箇所、障害内容、障害時刻などの障害情報を確認し、監視端末から見て障害が発生したネットワーク装置より先の部分に接続されている他のネットワーク装置には検知したネットワーク装置から障害情報の通知を行なう。通知されたネットワーク装置は、障害情報をログエリアに登録する。障害回復後、監視端末からの情報取得要求に対し、障害が発生した際に障害情報をログエリアに登録した装置が障害情報を監視装置に送信する。監視装置でログ情報を受信する際、情報を送信するネットワーク装置で以前に発生しているログ情報の発生時刻との時間差を送信することにより、障害発生時刻を確認することが可能となる。
【0008】
この機能により、監視端末が障害が発生したネットワーク装置から障害情報を取得出来なかった場合においても、障害情報ログを取得することができ、詳細な障害原因を調査することが可能となる。また、以前に発生しているログ情報との時間差を取得することにより、障害発生時刻を正確に把握することができる。
【0009】
【発明の実施の形態】
以下、本発明の実施の形態について図面により詳細に説明する。
【0010】
従来の障害通知の流れと、本発明での障害通知の流れを図1に示す。
【0011】
図1において、10、20、30、40、50、60はそれぞれネットワーク装置、80はネットワークを監視するための監視端末、70は障害情報を取得するための情報取得端末、23、41は各ネットワーク装置を接続するための接続部位である。ネットワーク装置10、20、30、40、50、60は、全て予め障害が発生した時に障害情報を通知する装置を設定しており、他の装置に対しネットワーク装置の状態を送信することが出来る。ここでは通信する際に使用するプロトコルはSNMP(Simple Network Management Protocol)である。なお、障害部位の詳細情報については障害が発生した装置でのみ取得することが可能である。このプロトコルを搭載していることにより、各インタフェースのエラー回数情報、データの送受信量、装置名などを監視端末80から入手することが可能となる。
【0012】
図1により従来の障害通知方法のうち、障害部位が障害端末と監視端末間に存在しない場合の障害通知の流れを説明する。ここでは障害発生部位がネットワーク装置20とネットワーク装置30の間である接続部位23で発生したこととする。ネットワーク装置40に接続するためのネットワーク装置20の接続部位23において障害が発生した際、監視端末80へ障害情報をネットワーク装置10経由で送信する。接続部位23で障害が発生した場合は、障害部位を通知するための通信ルートが確保されていたため、監視端末80へ詳細な障害情報を通知することが出来る。
【0013】
しかし、従来の障害通知方法では、障害部位が障害端末と監視端末間に存在する場合、例えばネットワーク装置20に接続するためのネットワーク装置40の接続部位41において障害が発生した場合、監視端末80へ障害情報を通知するための通信ルートを確保することが出来ない。このため従来の障害通知方法では、ネットワーク装置40で発生した情報を監視端末80へ送信することが出来ない。監視端末80へ送信される情報は、ネットワーク装置40で障害発生後、ネットワーク装置20側で、ネットワーク装置40と通信出来ないことを検知した「ネットワーク装置40と通信が出来ない」旨のみである。この場合、通信出来ない原因が、接続部位41、ネットワーク装置20とネットワーク装置40間の通信路、接続部位23の3種類の可能性があるため、調査する箇所が多くなるという問題がある。
【0014】
次に、本発明による障害通知方法を図1により説明する。図1では、障害部位が障害端末と監視端末間に存在する場合、すなわちネットワーク装置20に接続するためのネットワーク装置40の接続部位41において障害が発生した場合について説明する。ここでは図1の従来の処理と同様にネットワーク装置20は「ネットワーク装置40と通信出来ない」旨を監視端末80へ通知する。一方、ネットワーク装置40は、障害時の障害情報を通知する装置を従来設定している監視端末80に加え、ネットワーク装置50、60を通知先として定義しており、障害発生時に複数装置に対して障害情報を通知する。ここでは監視端末80への通信は障害のために不可であるが、ネットワーク装置50、60へ障害情報を送信することができる。ネットワーク装置50、60では、受信した障害情報をログ情報として登録する。
【0015】
障害の回復後の障害情報取得方法を図1に示す。ネットワーク装置40で発生した障害情報は、ネットワーク装置50、60に保存されている。障害情報の送信要求を可能とする装置は、監視端末80とネットワーク装置50または60に直接接続した情報取得端末70である。監視端末80で情報を取得する場合は、監視端末80からネットワーク装置10、20、40を経由して、ネットワーク装置50または60へ障害情報を送信する要求を行う。要求を受けた装置(ネットワーク装置50または60)は、ネットワーク装置40で発生した障害情報と、以前に監視端末80へ送信した障害発生時間との時間差を送付する。このことにより、ネットワーク装置40で発生した障害が、接続部位41で発生したことを検知することが可能である。また、接続部位41で発生した障害が何時発生したのかについても検知することが可能である。
【0016】
次に、ネットワーク装置50または60に直接、情報取得端末70を接続した場合の流れを説明する。情報取得端末70をネットワーク装置50または60に接続し、情報取得端末70から障害情報を送信する要求を、ネットワーク装置50または60に送信することにより障害情報を返信する。情報取得端末70で取得した情報を解析し、障害原因を特定する。
【0017】
以上、本発明の実施の形態では、ネットワーク構成が4層の基本的な例を示したが、これ以上の多層ネットワークや分岐が複雑なネットワークにも同様に適用可能である。
【0018】
【発明の効果】
本発明によれば、障害部位が障害端末と監視端末間に存在する場合でも障害発生部位、原因および時刻を調査することが可能となるので、障害原因を迅速に特定することができるという効果がある。
【図面の簡単な説明】
【図1】ネットワーク構成図。
【符号の説明】
10、20、30、40、50、60…ネットワーク装置、80…監視端末、23、41…接続部位、70…情報取得端末。
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a failure notification method by a network device equipped with an application technology related to a protocol SNMP (Simple Network Management Protocol) used at the time of a network failure.
[0002]
[Prior art]
As a conventional network failure notification method, a method as disclosed in Japanese Patent Application Laid-Open No. 8-237249 has been proposed. Here, the fault monitoring terminal is set at the top of the network or outside the network, and notification of fault information to each terminal can be notified only to terminals connected to an available network.
[0003]
[Patent Document 1]
JP-A-8-237249
[Problems to be solved by the invention]
In the above-mentioned conventional method, the fault information is notified only from the faulty terminal to the monitoring terminal, and the fault of the communication path is not considered. Therefore, when a fault occurs between the faulty terminal and the monitoring terminal, The network device connected upstream of the faulty terminal can only detect that a specific communication path has become unusable, and the monitoring terminal cannot detect the details of the fault. Further, when the apparatus is restarted, there is a problem that the failure log is lost and the cause cannot be investigated. Further, there is a problem that it is difficult to know the failure occurrence time because the log information is often displayed by the accumulated time from the activation time of the network device.
[0005]
An object of the present invention is to provide a method that solves these problems and enables unified management of troubleshooting.
[0006]
[Means for Solving the Problems]
In order to achieve the above object, a failure notification method for a network device according to the present invention monitors and reports a failure by the following method.
[0007]
First, the network device that has detected the failure checks failure information such as the device name, failure location, failure content, and failure time, and other network devices connected to the part ahead of the failed network device as viewed from the monitoring terminal. The network device is notified of the failure information from the detected network device. The notified network device registers the failure information in the log area. After recovery from the failure, in response to an information acquisition request from the monitoring terminal, when a failure occurs, the device that has registered the failure information in the log area transmits the failure information to the monitoring device. When the monitoring apparatus receives the log information, the network apparatus transmitting the information transmits the time difference from the occurrence time of the previously generated log information, thereby making it possible to confirm the failure occurrence time.
[0008]
With this function, even when the monitoring terminal cannot acquire the failure information from the network device in which the failure has occurred, the failure information log can be acquired, and the detailed cause of the failure can be investigated. In addition, by acquiring the time difference from the log information that has occurred before, the failure occurrence time can be accurately grasped.
[0009]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0010]
FIG. 1 shows a flow of a conventional fault notification and a flow of a fault notification according to the present invention.
[0011]
In FIG. 1, 10, 20, 30, 40, 50, and 60 are network devices, 80 is a monitoring terminal for monitoring a network, 70 is an information acquisition terminal for acquiring failure information, and 23 and 41 are each network. It is a connection part for connecting the device. The network devices 10, 20, 30, 40, 50, and 60 all have a device for notifying failure information when a failure has occurred in advance, and can transmit the status of the network device to other devices. Here, the protocol used for communication is SNMP (Simple Network Management Protocol). It should be noted that the detailed information of the failed part can be obtained only by the device in which the failure has occurred. By installing this protocol, it is possible to obtain information on the number of errors of each interface, data transmission / reception amounts, device names, and the like from the monitoring terminal 80.
[0012]
With reference to FIG. 1, a flow of a failure notification when a failure part does not exist between a failure terminal and a monitoring terminal in the conventional failure notification method will be described. Here, it is assumed that the failure occurrence part has occurred at the connection part 23 between the network device 20 and the network device 30. When a failure occurs in the connection part 23 of the network device 20 for connecting to the network device 40, the failure information is transmitted to the monitoring terminal 80 via the network device 10. When a failure occurs in the connection part 23, the communication route for notifying the failure part is secured, so that detailed failure information can be notified to the monitoring terminal 80.
[0013]
However, in the conventional failure notification method, when a failure part exists between the failure terminal and the monitoring terminal, for example, when a failure occurs in the connection part 41 of the network device 40 for connecting to the network device 20, the monitoring terminal 80 A communication route for notifying failure information cannot be secured. Therefore, in the conventional failure notification method, information generated in the network device 40 cannot be transmitted to the monitoring terminal 80. The information transmitted to the monitoring terminal 80 is only that, after the occurrence of a failure in the network device 40, the network device 20 detects that communication with the network device 40 is not possible. In this case, there are three possible causes of communication failure: the connection site 41, the communication path between the network device 20 and the network device 40, and the connection site 23. Therefore, there is a problem that the number of locations to be investigated increases.
[0014]
Next, a failure notification method according to the present invention will be described with reference to FIG. FIG. 1 illustrates a case where a failure part exists between a failure terminal and a monitoring terminal, that is, a case where a failure occurs in a connection part 41 of a network device 40 for connecting to the network device 20. Here, similarly to the conventional processing of FIG. 1, the network device 20 notifies the monitoring terminal 80 that "communication with the network device 40 cannot be performed". On the other hand, the network device 40 defines network devices 50 and 60 as notification destinations in addition to the monitoring terminal 80 which has conventionally set a device for notifying fault information at the time of a fault. Notify failure information. Here, communication to the monitoring terminal 80 is impossible due to a failure, but failure information can be transmitted to the network devices 50 and 60. The network devices 50 and 60 register the received failure information as log information.
[0015]
FIG. 1 shows a method for acquiring failure information after recovery from a failure. The failure information generated in the network device 40 is stored in the network devices 50 and 60. The device that can request transmission of the fault information is the monitoring terminal 80 and the information acquisition terminal 70 directly connected to the network device 50 or 60. When information is acquired by the monitoring terminal 80, a request for transmitting fault information from the monitoring terminal 80 to the network device 50 or 60 via the network device 10, 20, 40 is made. The device (network device 50 or 60) that has received the request sends the time difference between the failure information generated in the network device 40 and the failure occurrence time previously transmitted to the monitoring terminal 80. Thus, it is possible to detect that a failure that has occurred in the network device 40 has occurred in the connection part 41. Further, it is also possible to detect when a failure occurred in the connection part 41 occurred.
[0016]
Next, a flow when the information acquisition terminal 70 is directly connected to the network device 50 or 60 will be described. The information acquisition terminal 70 is connected to the network device 50 or 60, and a failure information transmission request is transmitted from the information acquisition terminal 70 to the network device 50 or 60 to return the failure information. The information acquired by the information acquisition terminal 70 is analyzed, and the cause of the failure is specified.
[0017]
As described above, in the embodiment of the present invention, a basic example in which the network configuration has four layers has been described.
[0018]
【The invention's effect】
According to the present invention, even when a failure site exists between the failure terminal and the monitoring terminal, it is possible to investigate the failure occurrence site, the cause, and the time, so that the effect that the cause of the failure can be quickly identified is provided. is there.
[Brief description of the drawings]
FIG. 1 is a network configuration diagram.
[Explanation of symbols]
10, 20, 30, 40, 50, 60: network device, 80: monitoring terminal, 23, 41: connection site, 70: information acquisition terminal.

Claims (1)

ネットワーク上のハードウェア及び/またはソフトウェア障害を検知し通知する方法において、障害検知装置を備え、障害が発生した際ネットワークを監視している端末へ通信するルート以外に位置するネットワーク装置に障害情報を送り、障害回復後、監視端末から障害内容と発生時間を採取することを特徴とするネットワーク機器の障害通知方法。A method for detecting and notifying a hardware and / or software failure on a network, comprising a failure detection device, and transmitting failure information to a network device located at a position other than a route for communicating to a terminal monitoring the network when a failure occurs. A fault notification method for a network device, comprising: collecting a fault content and an occurrence time from a monitoring terminal after sending and recovering from the fault.
JP2003048474A 2003-02-26 2003-02-26 Method for reporting failure of network equipment Pending JP2004258942A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003048474A JP2004258942A (en) 2003-02-26 2003-02-26 Method for reporting failure of network equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003048474A JP2004258942A (en) 2003-02-26 2003-02-26 Method for reporting failure of network equipment

Publications (1)

Publication Number Publication Date
JP2004258942A true JP2004258942A (en) 2004-09-16

Family

ID=33114425

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003048474A Pending JP2004258942A (en) 2003-02-26 2003-02-26 Method for reporting failure of network equipment

Country Status (1)

Country Link
JP (1) JP2004258942A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7840137B2 (en) 2007-05-09 2010-11-23 Hitachi, Ltd. Optical line terminal and optical network unit capable of alarm transmission scheme for passive optical network system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7840137B2 (en) 2007-05-09 2010-11-23 Hitachi, Ltd. Optical line terminal and optical network unit capable of alarm transmission scheme for passive optical network system

Similar Documents

Publication Publication Date Title
US7486625B2 (en) Communications network tap with link fault detector
US7599301B2 (en) Communications network tap with heartbeat monitor
US7397385B1 (en) Predicting cable failure through remote failure detection of error signatures
US20150009861A1 (en) Technique for Handling a Status Change in an Interconnect Node
CN107517117B (en) IP layer OAM (operation administration and maintenance) alarm method and device and network node
US5923840A (en) Method of reporting errors by a hardware element of a distributed computer system
US9203719B2 (en) Communicating alarms between devices of a network
JP2013130901A (en) Monitoring server and network device recovery system using the same
CN103684818A (en) Method and device for detecting failures of network channel
JP2009117920A (en) Communication apparatus and method and communication program
US8111625B2 (en) Method for detecting a message interface fault in a communication device
JP2004258942A (en) Method for reporting failure of network equipment
JP4775894B2 (en) Intermediary device for remote diagnosis
JP4692419B2 (en) Network device, redundant switching method used therefor, and program thereof
KR101831165B1 (en) Device for monitoring and analyzing time synchronization state between ntp sever and ntp client
JP4705904B2 (en) Network monitoring system
JP6149549B2 (en) Monitoring system and monitoring program
JP2005109679A (en) Path fault detecting method and detecting apparatus, and program thereof
KR20070080182A (en) Status information reporting method of high speed internet customer premise equipment and high speed internet customer subscriber equipment therefor
JP2891135B2 (en) Software failure detection device and software failure detection method
JP3567873B2 (en) Wireless communication network and fault detection method used therefor
KR100535310B1 (en) Fault management method in network management system
JP2003323361A (en) Network device monitoring system, management device, network device and network device monitoring method
JPH11355274A (en) Device fault information transfer method and connection device between device fault information transfer function packaging networks
JP2001094584A (en) Loop transmission device capable of specifying failure position