JP2007274282A - Network monitoring program, network monitoring method and network monitoring device - Google Patents

Network monitoring program, network monitoring method and network monitoring device Download PDF

Info

Publication number
JP2007274282A
JP2007274282A JP2006096632A JP2006096632A JP2007274282A JP 2007274282 A JP2007274282 A JP 2007274282A JP 2006096632 A JP2006096632 A JP 2006096632A JP 2006096632 A JP2006096632 A JP 2006096632A JP 2007274282 A JP2007274282 A JP 2007274282A
Authority
JP
Japan
Prior art keywords
communication
network
router
failure
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006096632A
Other languages
Japanese (ja)
Other versions
JP4570582B2 (en
Inventor
Osamu Nakajima
修 中島
Masahiro Chiba
正博 千葉
Toru Takeuchi
亨 竹内
Kei Nakada
慶 中田
Hideyuki Kametani
英之 亀谷
Hisato Teguri
寿人 手操
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006096632A priority Critical patent/JP4570582B2/en
Publication of JP2007274282A publication Critical patent/JP2007274282A/en
Application granted granted Critical
Publication of JP4570582B2 publication Critical patent/JP4570582B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To highly accurately and automatically discriminate a fault generation part on a network regardless of the number of connections. <P>SOLUTION: An address storage means 14 stores the physical address of a router 30 relaying transmission/reception data between the network 21 to which an own device 1 is connected and an external network 22. A communication condition monitoring means 16 monitors communication conditions with other equipment. An abnormality detection means 17 detects the abnormality of communication from communication contents detected in the communication condition monitoring means 16. A fault part judgement means 18 refers to the address storage means 14, and when the physical address of communication opposite equipment for which the abnormality is detected in the abnormality detection means 17 does not match with the physical address of the router 30 stored in the address storage means 14, judges that the fault is generated in the communication with the equipment connected to the network 21 other than the router 30. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、ネットワークの運用状態を監視するためのネットワーク監視プログラム、ネットワーク監視方法、およびネットワーク監視装置に関し、特に、ネットワーク上で発生した障害を検出するネットワーク監視プログラム、ネットワーク監視方法、およびネットワーク監視装置に関する。   The present invention relates to a network monitoring program, a network monitoring method, and a network monitoring apparatus for monitoring an operation state of a network, and more particularly to a network monitoring program, a network monitoring method, and a network monitoring apparatus that detect a failure occurring on the network. About.

情報技術の発達に伴い、多くの企業では、コンピュータシステムを使用した業務の効率化が図られている。コンピュータシステムは、ネットワークを介して複数のコンピュータやスイッチ等の複数の通信機器が接続される。そして、コンピュータで行うことができる業務範囲の拡大に伴って、ネットワークが年々大規模化している。   With the development of information technology, many companies are trying to improve the efficiency of operations using computer systems. In the computer system, a plurality of communication devices such as a plurality of computers and switches are connected via a network. And with the expansion of the scope of work that can be performed by computers, networks are becoming larger year by year.

また、システムのアーキテクチャ等のオープン化や規格化に伴って、異なるメーカ製の機器を組み合わせて、ネットワークを構築することが可能となっている。さらに、ネットワーク上の機器のインテリジェント化も進められている。その結果、ネットワークの構成が複雑化している。   In addition, with the opening and standardization of the system architecture and the like, it is possible to construct a network by combining devices from different manufacturers. In addition, intelligent devices on the network are being promoted. As a result, the network configuration is complicated.

このように、大規模で且つ複雑な構成のネットワークでトラブルが発生した場合、個々の装置の動作状況が確認される。ところで、ネットワークにおける障害は、個々の装置の動作状況だけでは判断できない場合が多く存在する。そのため、ネットワーク上の故障箇所や原因を特定するのは、非常に困難な作業である。故障箇所や原因が長期間判明しなければ、ネットワークを利用する顧客の業務が長時間停止してしまう。   As described above, when a trouble occurs in a large-scale and complicated network, the operation status of each device is confirmed. By the way, there are many cases where a failure in the network cannot be determined only by the operation status of each device. Therefore, it is a very difficult task to identify the fault location and cause on the network. If the location and cause of failure are not known for a long time, the business of the customer who uses the network will be stopped for a long time.

そこで、ネットワーク上の障害発生箇所やその原因を、システム管理者が判断することなく自動的に検出できることが要望されている。このために、ネットワーク上で障害の発生原因となり得る要素と通信の異常を示す事象とを対応付けたテーブルを用意しておき、他の機器との通信中に異常を示す事象を検出したとき、テーブルを参照してその事象に対応する障害発生原因を判定する技術が考えられている(たとえば、特許文献1参照)。   Therefore, there is a demand for automatically detecting the location of failure on the network and its cause without the system administrator's judgment. For this reason, when a table that correlates elements that can cause failures on the network and events that indicate communication abnormalities is prepared and an event that indicates abnormalities is detected during communication with other devices, A technique for determining a cause of a failure corresponding to the event with reference to a table is considered (for example, see Patent Document 1).

この特許文献1に記載された技術では、主に、ネットワーク層およびトランスポート層のプロトコルでの通信の監視を行うことで、自装置側、隣接伝送路側、非隣接伝送路側(たとえば、ルータを介した先の伝送路側)のうちのどこで障害が発生しているかを判別できるようになっていた。具体的には、再生パケットの有無、重複受信パケットの有無、データの欠落の有無、Ack(確認応答)の応答時間、リセット信号などをモニタすることで通信の異常を検出し、どの異常事象がどのコネクションで発生しているかを上記のテーブルに照らし合わせることにより、障害発生箇所を判別している。
特開2005−167347号公報(段落番号〔0021〕〜〔0031〕、図1)
In the technique described in Patent Document 1, communication is mainly monitored by the protocol of the network layer and the transport layer, so that the own apparatus side, the adjacent transmission path side, and the non-adjacent transmission path side (for example, via a router). It was possible to determine where the failure occurred on the previous transmission line side). Specifically, by monitoring the presence or absence of playback packets, the presence or absence of duplicate received packets, the presence or absence of data loss, the Ack (acknowledgment response) response time, the reset signal, etc., communication abnormalities are detected and which abnormal events are detected. The location of the failure is determined by checking which connection is occurring in the above table.
Japanese Patent Laying-Open No. 2005-167347 (paragraph numbers [0021] to [0031], FIG. 1)

しかし、特許文献1に記載された技術では、コネクションのそれぞれにおいて検出された、異常を示す事象の違いを基に、障害発生箇所を判別していたために、通信相手の機器やコネクションの数が少ない場合には、障害発生箇所を正確に判別できなくなるという問題があった。たとえば、特定のIP(Internet Protocol)アドレスおよびポートにおいて通信の異常が検出された場合には、通信相手機器において障害が発生したと判定できるが、監視対象のコネクションが1つしか存在しないときには、その機器がルータを介した外部のネットワークに接続された機器か、あるいはルータの手前のネットワークに接続された機器かを判別することができなかった。   However, in the technique described in Patent Document 1, since the failure location is determined based on the difference between events detected in each connection and indicating an abnormality, the number of communication counterpart devices and connections is small. In such a case, there is a problem that it is impossible to accurately determine the location of the failure. For example, when a communication abnormality is detected at a specific IP (Internet Protocol) address and port, it can be determined that a failure has occurred in the communication partner device, but when there is only one monitored connection, It was not possible to determine whether the device was connected to an external network via a router or connected to a network in front of the router.

本発明はこのような点に鑑みてなされたものであり、コネクションの数に関係なく、ネットワーク上での障害発生箇所を高精度、且つ自動的に判別できるネットワーク監視プログラム、ネットワーク監視方法、およびネットワーク監視装置を提供することを目的とする。   The present invention has been made in view of such points, and a network monitoring program, a network monitoring method, and a network capable of automatically and accurately determining a failure occurrence location on a network regardless of the number of connections An object is to provide a monitoring device.

本発明の第1の態様では上記課題を解決するために、図1に示すような機能をコンピュータに実行させるネットワーク監視プログラムが提供される。このネットワーク監視プログラムは、ネットワーク上の障害発生箇所を検出するためのものであり、コンピュータに以下の機能を実行させることができる。   In the first aspect of the present invention, a network monitoring program for causing a computer to execute the functions shown in FIG. 1 is provided in order to solve the above problems. This network monitoring program is for detecting a failure occurrence location on the network, and can cause a computer to execute the following functions.

ネットワーク監視プログラムに基づいて動作するコンピュータは、アドレス記憶手段14、通信状況監視手段16、異常検出手段17および障害箇所判定手段18の機能を有する。アドレス記憶手段14は、このコンピュータが接続された内部ネットワークと外部ネットワークとの間で送受信データを中継するルータ30の物理アドレスを記憶する。通信状況監視手段16は、他の機器との間の通信状況を監視する。異常検出手段17は、通信状況監視手段16で検出された通信内容から通信の異常を検出する。障害箇所判定手段18は、アドレス記憶手段14を参照し、異常検出手段17で異常が検出された通信相手機器の物理アドレスが、アドレス記憶手段14に記憶されたルータ30の物理アドレスと一致しないとき、そのルータ30以外の内部ネットワークに接続された機器との間の通信において障害が発生したと判定する。   A computer that operates based on the network monitoring program has functions of an address storage unit 14, a communication status monitoring unit 16, an abnormality detection unit 17, and a failure location determination unit 18. The address storage unit 14 stores the physical address of the router 30 that relays transmission / reception data between the internal network to which the computer is connected and the external network. The communication status monitoring unit 16 monitors the communication status with other devices. The abnormality detection unit 17 detects a communication abnormality from the communication content detected by the communication status monitoring unit 16. The failure location determination unit 18 refers to the address storage unit 14, and the physical address of the communication counterpart device whose abnormality is detected by the abnormality detection unit 17 does not match the physical address of the router 30 stored in the address storage unit 14. It is determined that a failure has occurred in communication with a device connected to the internal network other than the router 30.

このようなネットワーク監視プログラムをコンピュータに実行させると、アドレス記憶手段14により、このコンピュータが接続された内部ネットワークと外部ネットワークとの間で送受信データを中継するルータ30の物理アドレスが記憶される。また、通信状況監視手段16により、他の機器との間の通信状況が監視され、異常検出手段17により、通信状況監視手段16で検出された通信内容から通信の異常が検出される。すると、障害箇所判定手段18により、アドレス記憶手段14が参照され、異常検出手段17で異常が検出された通信相手機器の物理アドレスが、アドレス記憶手段14に記憶されたルータ30の物理アドレスと一致しないとき、そのルータ30以外の内部ネットワークに接続された機器との間の通信において障害が発生したと判定される。   When the computer executes such a network monitoring program, the address storage unit 14 stores the physical address of the router 30 that relays transmission / reception data between the internal network and the external network to which the computer is connected. In addition, the communication status monitoring unit 16 monitors the communication status with other devices, and the abnormality detection unit 17 detects a communication abnormality from the communication content detected by the communication status monitoring unit 16. Then, the failure location determination unit 18 refers to the address storage unit 14, and the physical address of the communication counterpart device whose abnormality is detected by the abnormality detection unit 17 matches the physical address of the router 30 stored in the address storage unit 14. If not, it is determined that a failure has occurred in communication with a device connected to the internal network other than the router 30.

また、本発明の第2の態様では上記課題を解決するために、情報処理装置に接続されたネットワーク上の障害発生箇所を検出するためのネットワーク監視方法において、アドレス記憶手段が、前記情報処理装置が接続された内部ネットワークと外部ネットワークとの間で送受信データを中継するルータの物理アドレスを記憶し、通信状況監視手段が、他の機器との間の通信状況を監視し、異常検出手段が、前記通信状況監視手段で検出された通信内容から通信の異常を検出し、障害箇所判定手段が、前記アドレス記憶手段を参照し、前記異常検出手段で異常が検出された通信相手機器の物理アドレスが、前記アドレス記憶手段に記憶された前記ルータの物理アドレスと一致しないとき、当該ルータ以外の前記内部ネットワークに接続された機器との間の通信において障害が発生したと判定することを特徴とするネットワーク監視方法が提供される。   According to a second aspect of the present invention, there is provided a network monitoring method for detecting a fault occurrence location on a network connected to an information processing apparatus, in order to solve the above problem, wherein the address storage means includes the information processing apparatus. Stores the physical address of the router that relays transmission / reception data between the internal network and the external network to which the network is connected, the communication status monitoring means monitors the communication status with other devices, and the abnormality detection means A communication abnormality is detected from the communication content detected by the communication status monitoring means, the failure location determination means refers to the address storage means, and the physical address of the communication counterpart device where the abnormality is detected by the abnormality detection means is When the physical address of the router stored in the address storage means does not match, the device connected to the internal network other than the router Network monitoring method characterized by determining that a failure has occurred is provided in the communication between.

このようなネットワーク監視プログラムによれば、上記第1の態様に係るネットワーク監視プログラムを実行するコンピュータと同様の処理が行われる。
さらに、本発明の第3の態様では上記課題を解決するために、ネットワーク上の障害発生箇所を検出するためのネットワーク監視装置において、前記ネットワーク監視装置が接続された内部ネットワークと外部ネットワークとの間で送受信データを中継するルータの物理アドレスを記憶するアドレス記憶手段と、他の機器との間の通信状況を監視する通信状況監視手段と、前記通信状況監視手段で検出された通信内容から通信の異常を検出する異常検出手段と、前記アドレス記憶手段を参照し、前記異常検出手段で異常が検出された通信相手機器の物理アドレスが、前記アドレス記憶手段に記憶された前記ルータの物理アドレスと一致しないとき、当該ルータ以外の前記内部ネットワークに接続された機器との間の通信において障害が発生したと判定する障害箇所判定手段とを有することを特徴とするネットワーク監視装置が提供される。
According to such a network monitoring program, the same processing as that of the computer executing the network monitoring program according to the first aspect is performed.
Furthermore, in the third aspect of the present invention, in order to solve the above-mentioned problem, in a network monitoring apparatus for detecting a fault occurrence location on a network, between the internal network and the external network to which the network monitoring apparatus is connected. The address storage means for storing the physical address of the router that relays the transmitted / received data in the communication, the communication status monitoring means for monitoring the communication status between other devices, and the communication contents detected by the communication status monitoring means An anomaly detection means for detecting an anomaly and an address storage means, and the physical address of the communication counterpart device in which the anomaly is detected by the anomaly detection means matches the physical address of the router stored in the address storage means Otherwise, a failure occurs in communication with devices connected to the internal network other than the router. Network monitoring apparatus is provided, characterized in that it comprises a fault location determining means for determining a.

このようなネットワーク監視装置によれば、上記第1の態様に係るネットワーク監視プログラムを実行するコンピュータと同様の処理が行われる。   According to such a network monitoring apparatus, processing similar to that of a computer that executes the network monitoring program according to the first aspect is performed.

本発明によれば、ネットワークを監視している装置が接続された内部ネットワークと外部ネットワークとの間のルータの物理アドレスをアドレス記憶手段が記憶するとともに、他の機器との間の通信状況を監視し、その監視により検出された通信内容から通信の異常を検出すると、アドレス記憶手段を参照して、異常が検出された通信相手機器の物理アドレスが、アドレス記憶手段に記憶されたルータの物理アドレスと一致しないとき、そのルータ以外の内部ネットワークに接続された機器との間の通信において障害が発生したと判定する。従って、ルータ以外の内部ネットワークに接続された機器との間の通信において障害が発生したときに、通信相手機器が少ない場合でも、障害の発生箇所を自動的、且つ確実に判定でき、その結果、障害の自動回避や早期復旧が可能となる。   According to the present invention, the address storage unit stores the physical address of the router between the internal network to which the device monitoring the network is connected and the external network, and also monitors the communication status with other devices. When a communication abnormality is detected from the communication content detected by the monitoring, the physical address of the communication partner device in which the abnormality is detected is referred to the address storage means, and the physical address of the router stored in the address storage means If it does not match, it is determined that a failure has occurred in communication with a device connected to the internal network other than the router. Therefore, when a failure occurs in communication with a device connected to an internal network other than the router, even when there are few communication partner devices, the location of the failure can be automatically and reliably determined. Automatic failure avoidance and early recovery are possible.

以下、本発明の実施の形態を図面を参照して説明する。
まず、実施の形態に適用される発明の概要について図1を用いて説明し、その後、実施の形態の具体的な内容を説明する。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
First, the outline of the invention applied to the embodiment will be described with reference to FIG. 1, and then the specific contents of the embodiment will be described.

図1は、本発明に係るネットワーク監視機能の概要を説明するための図である。
図1では、例として、本発明に係るネットワーク監視機能が実装された自装置1と、この自装置1の通信相手となる2つの相手装置2および3とを示している。自装置1と相手装置2は、ともにネットワーク21に接続されている。また、ネットワーク21は、ルータ30を介して、他のネットワーク22に接続されており、相手装置3は、ネットワーク22に接続されている。
FIG. 1 is a diagram for explaining an overview of a network monitoring function according to the present invention.
In FIG. 1, as an example, an own device 1 in which the network monitoring function according to the present invention is implemented, and two other devices 2 and 3 that are communication partners of the own device 1 are shown. The own device 1 and the partner device 2 are both connected to the network 21. The network 21 is connected to another network 22 via the router 30, and the counterpart apparatus 3 is connected to the network 22.

自装置1、相手装置2および3には、それぞれネットワークアドレス(たとえば、IPアドレス)と物理アドレス(たとえば、MAC(Media Access Control address)アドレス)とが付与されている。ルータ30は、ネットワーク21および22の間でパケットを中継し、その中継時には、パケットのヘッダに付加された送信側ネットワーク上のネットワークアドレスを、受信側ネットワーク上のネットワークアドレスに変換する。このような中継装置としては、ルータ30の代わりにゲートウェイなどを適用してもよい。   A network address (for example, an IP address) and a physical address (for example, a MAC (Media Access Control address) address) are assigned to the own device 1 and the counterpart devices 2 and 3, respectively. The router 30 relays the packet between the networks 21 and 22, and converts the network address on the transmission side network added to the header of the packet into the network address on the reception side network at the time of the relay. As such a relay device, a gateway or the like may be applied instead of the router 30.

自装置1は、アプリケーション11、通信手段12、通信インタフェース13、アドレス記憶手段14、物理アドレス取得手段15、通信状況監視手段16、異常検出手段17、障害箇所判定手段18および障害情報出力手段19を備えている。   The own apparatus 1 includes an application 11, a communication unit 12, a communication interface 13, an address storage unit 14, a physical address acquisition unit 15, a communication status monitoring unit 16, an abnormality detection unit 17, a failure location determination unit 18, and a failure information output unit 19. I have.

アプリケーション11は、自装置1内で動作する処理機能である。たとえば、アプリケーション11として、Webサーバ機能などのサーバ機能を実装することができる。通信手段12は、アプリケーション11と通信相手装置との間のデータ通信を制御する。通信インタフェース13は、接続された伝送路を介した通信を行う。   The application 11 is a processing function that operates in the device 1. For example, a server function such as a Web server function can be implemented as the application 11. The communication unit 12 controls data communication between the application 11 and the communication partner apparatus. The communication interface 13 performs communication via the connected transmission path.

アドレス記憶手段14は、自装置1と通信した相手機器のネットワーク21におけるネットワークアドレスと、その機器の物理アドレスとを対応付けて記憶している。従って、アドレス記憶手段14は、ルータ30の物理アドレスも記憶している。   The address storage means 14 stores a network address in the network 21 of the counterpart device that communicated with the device 1 and a physical address of the device in association with each other. Therefore, the address storage unit 14 also stores the physical address of the router 30.

アドレス記憶手段14に記憶される情報は、物理アドレス取得手段15により取得される。物理アドレス取得手段15は、たとえば、通信相手機器のネットワークアドレスを基に、ネットワーク21を通じてその通信相手機器から物理アドレスを取得する。このような物理アドレスの取得手順として、たとえば、TCP(Transmission Control Protocol)/IPにおけるARP(Address Resolution Protocol)というプロトコルで規定された手順を利用でき、この場合、アドレス記憶手段14は、IPアドレスとMACアドレスとが対応付けられたARPテーブルを記憶する。   Information stored in the address storage unit 14 is acquired by the physical address acquisition unit 15. The physical address acquisition unit 15 acquires a physical address from the communication partner device via the network 21 based on the network address of the communication partner device, for example. As a procedure for acquiring such a physical address, for example, a procedure defined by a protocol called ARP (Address Resolution Protocol) in TCP (Transmission Control Protocol) / IP can be used. An ARP table associated with the MAC address is stored.

通信状況監視手段16は、通信インタフェース13を通じた他の機器との間の通信状況を監視する。たとえば、通信状況監視手段16は、通信手段12と通信インタフェース13との間で受け渡されるパケットを取得して、その内容を解析する。なお、通信状況の監視は、たとえば、コネクション毎に監視することができる。また、通信状況の監視は、異常な通信に限らず、正常な通信も含めて監視する。たとえば、異常な通信と同時期に行われた正常な通信を監視し、その履歴を記録しておく。このような正常な通信の履歴も障害原因の特定に有効に利用できる。   The communication status monitoring unit 16 monitors the communication status with other devices via the communication interface 13. For example, the communication status monitoring unit 16 acquires a packet passed between the communication unit 12 and the communication interface 13 and analyzes the content. The communication status can be monitored for each connection, for example. The communication status is monitored not only for abnormal communication but also for normal communication. For example, normal communication performed at the same time as abnormal communication is monitored, and the history is recorded. Such a normal communication history can also be effectively used to identify the cause of the failure.

異常検出手段17は、通信状況監視手段16で検出された通信内容から、通信の異常を検出する。たとえば、応答遅延、パケットの再送、パケットの重複受信などの異常を示す事象が検出される。なお、異常を示す事象と同時に、その事象と同時期に発生した正常な事象も検出してもよい。   The abnormality detection unit 17 detects a communication abnormality from the communication content detected by the communication status monitoring unit 16. For example, an event indicating an abnormality such as a response delay, packet retransmission, or duplicate packet reception is detected. A normal event that occurs at the same time as the event may be detected at the same time as the event indicating the abnormality.

障害箇所判定手段18は、異常検出手段17により通信の異常が検出されたときに、通信障害の発生箇所を判定する。この障害箇所判定手段18は、まず、異常が検出された通信相手機器の物理アドレスと、アドレス記憶手段14に記憶されたルータ30の物理アドレスとの比較結果を基に、障害発生箇所を判定する。   The failure location determination unit 18 determines a location where a communication failure has occurred when a communication abnormality is detected by the abnormality detection unit 17. The failure location determination means 18 first determines the location where a failure has occurred based on the comparison result between the physical address of the communication counterpart device in which an abnormality has been detected and the physical address of the router 30 stored in the address storage means 14. .

ここで、障害箇所判定手段18は、たとえば、異常が検出された相手機器の物理アドレスを、通信状況監視手段16で検出された通信内容の情報から取得することができる。たとえば、通信状況監視手段16が、通信内容の検出結果をその通信相手機器の物理アドレスなどのアドレス情報とともに記憶するようにし、障害箇所判定手段18は、通信状況監視手段16の記憶情報から物理アドレスを取得する。   Here, the failure location determination means 18 can acquire, for example, the physical address of the counterpart device in which an abnormality has been detected from the information of the communication content detected by the communication status monitoring means 16. For example, the communication status monitoring unit 16 stores the communication content detection result together with address information such as the physical address of the communication counterpart device, and the failure location determination unit 18 uses the physical address from the storage information of the communication status monitoring unit 16. To get.

物理アドレスを取得すると、障害箇所判定手段18は、アドレス記憶手段14を参照してルータ30の物理アドレスを抽出し、ルータ30の物理アドレスと、異常が検出された通信相手機器の物理アドレスとを比較する。この比較により、各物理アドレスが一致しないときは、ルータ30を介した外部のネットワーク22上の機器(たとえば、相手装置3)との通信において障害が発生したのではないことがわかるので、障害箇所判定手段18は、ルータ30を除くネットワーク21上の機器との間の通信において障害が発生したと判定する。図1の例では、相手装置2との通信において障害が発生したと判定できる。   When the physical address is acquired, the failure location determination unit 18 refers to the address storage unit 14 to extract the physical address of the router 30 and obtains the physical address of the router 30 and the physical address of the communication partner device in which the abnormality is detected. Compare. From this comparison, when the physical addresses do not match, it can be seen that a failure has not occurred in communication with the device (for example, the counterpart device 3) on the external network 22 via the router 30, The determination unit 18 determines that a failure has occurred in communication with devices on the network 21 excluding the router 30. In the example of FIG. 1, it can be determined that a failure has occurred in communication with the counterpart device 2.

一方、上記の比較により物理アドレスが一致した場合には、障害箇所判定手段18はさらに、通信インタフェース13を介して、物理アドレスが一致したルータ30との接続を確認するための処理を実行する。たとえば、ping(Packet INternet Groper)コマンドなど、ルータ30に対して何らかの応答を要求するコマンドを発行し、その応答状況から接続の有無を確認する。   On the other hand, when the physical addresses match by the above comparison, the failure location determination means 18 further executes a process for confirming the connection with the router 30 with the matched physical address via the communication interface 13. For example, a command for requesting some response to the router 30 such as a ping (Packet Internet Groper) command is issued, and the presence or absence of connection is confirmed from the response status.

ルータ30との接続が確認された場合には、自装置1からルータ30までの通信が正常であることがわかるので、障害箇所判定手段18は、外部のネットワーク22(たとえば、相手装置3や、相手装置3とルータ30との間の伝送路)において通信の障害が発生したと判定する。また、ルータ30との接続が確認されなかった場合には、障害箇所判定手段18は、このルータ30との間のネットワーク21における通信において障害が発生したと判定する。   When the connection with the router 30 is confirmed, it can be seen that the communication from the own device 1 to the router 30 is normal, so the failure location determination means 18 is connected to the external network 22 (for example, the partner device 3 or It is determined that a communication failure has occurred in the transmission path between the partner apparatus 3 and the router 30. If the connection with the router 30 is not confirmed, the failure location determination means 18 determines that a failure has occurred in the communication in the network 21 with the router 30.

このような障害箇所の判定手順によれば、物理アドレスを用いたことで、異常が検出された通信相手機器がルータ30であるか否かを識別できるので、少なくとも、通信相手機器がネットワーク21に接続されている場合には、その機器との間の通信障害を確実に検出できる。また、ルータ30を介した通信での異常発生時にも、上記のようにルータ30との接続を確認することで、障害発生箇所がネットワーク21あるいは22のどちらであるかを確実に判別できる。そして、このような障害箇所の判別を、通信状況監視手段16によって監視されているコネクションが少ない場合(たとえば、通信相手機器が1つのみの場合)でも確実に行うことができるようになる。   According to such a failure location determination procedure, by using the physical address, it is possible to identify whether or not the communication partner device in which an abnormality has been detected is the router 30, so that at least the communication partner device is connected to the network 21. When connected, it is possible to reliably detect a communication failure with the device. Further, even when an abnormality occurs in communication via the router 30, it is possible to surely determine whether the failure occurs in the network 21 or 22 by checking the connection with the router 30 as described above. Such a failure location can be reliably determined even when the number of connections monitored by the communication status monitoring unit 16 is small (for example, when there is only one communication partner device).

障害情報出力手段19は、障害箇所判定手段18による障害箇所の判定結果を示す障害情報19aを出力する。この障害情報19aを参照することで、障害発生箇所を正確に識別できるので、障害を自動的に回避させたり、早期に復旧させることが可能となる。   The failure information output means 19 outputs failure information 19a indicating the failure location determination result by the failure location determination means 18. By referring to the failure information 19a, the location where the failure has occurred can be accurately identified, so that the failure can be automatically avoided or recovered early.

次に、本発明に係るネットワーク監視機能を適用したシステムについて、より具体的に説明する。
図2は、本発明の実施の形態に係るネットワークシステムの構成例を示す図である。
Next, a system to which the network monitoring function according to the present invention is applied will be described more specifically.
FIG. 2 is a diagram showing a configuration example of the network system according to the embodiment of the present invention.

図2では、例として、サーバ100,201,202およびクライアント301〜304が、スイッチ401〜403およびルータ500を介して相互に接続されたシステムを示している。サーバ100,201および202は、それぞれスイッチ401を介してルータ500に接続し、これらの機器により1つのセグメントが構成されている。クライアント301および302は、スイッチ402を介してルータ500に接続し、クライアント303および304は、スイッチ403を介してルータ500に接続しており、これらの機器により1つのセグメントが構成されている。   In FIG. 2, as an example, a system in which servers 100, 201, 202 and clients 301 to 304 are connected to each other via switches 401 to 403 and a router 500 is shown. The servers 100, 201 and 202 are each connected to the router 500 via the switch 401, and one segment is constituted by these devices. The clients 301 and 302 are connected to the router 500 via the switch 402, and the clients 303 and 304 are connected to the router 500 via the switch 403, and one segment is constituted by these devices.

スイッチ401〜403は、OSI(Open Systems Interconnection)参照モデルのネットワーク層でパケットの送信先を判断して転送する。ルータ500は、セグメント間で送受信されるパケットを中継し、その中継時には、パケットのヘッダに付加された送信側セグメント上のIPアドレスを、受信側セグメント上のIPアドレスに変換する。   The switches 401 to 403 determine the packet transmission destination in the network layer of the OSI (Open Systems Interconnection) reference model and transfer the packet. The router 500 relays packets transmitted and received between segments, and at the time of relaying, converts the IP address on the transmission side segment added to the header of the packet into the IP address on the reception side segment.

このネットワークシステムにおいて、ネットワーク監視機能はサーバ100に実装されている。なお、同様なネットワーク監視機能を、他のサーバやクライアントに実装させることもできる。   In this network system, the network monitoring function is implemented in the server 100. A similar network monitoring function can be implemented in other servers and clients.

図3は、ネットワーク監視機能が搭載されたサーバのハードウェア構成例を示す図である。
サーバ100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、RAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、および通信インタフェース106が、バス107を介して接続されている。
FIG. 3 is a diagram illustrating a hardware configuration example of a server equipped with a network monitoring function.
The server 100 is entirely controlled by a CPU (Central Processing Unit) 101. A random access memory (RAM) 102, a hard disk drive (HDD) 103, a graphic processing device 104, an input interface 105, and a communication interface 106 are connected to the CPU 101 via a bus 107.

RAM102には、CPU101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM102には、CPU101による処理に必要な各種データが格納される。HDD103には、OSやアプリケーションプログラムが格納される。   The RAM 102 temporarily stores at least part of an OS (Operating System) program and application programs to be executed by the CPU 101. The RAM 102 stores various data necessary for processing by the CPU 101. The HDD 103 stores an OS and application programs.

グラフィック処理装置104には、モニタ104aが接続されている。グラフィック処理装置104は、CPU101からの命令に従って、画像をモニタ104aの画面に表示させる。入力インタフェース105には、キーボード105aと105bとが接続されている。入力インタフェース105は、キーボード105aやマウス105bから送られてくる信号を、バス107を介してCPU101に送信する。   A monitor 104 a is connected to the graphic processing device 104. The graphic processing device 104 displays an image on the screen of the monitor 104a in accordance with a command from the CPU 101. Keyboards 105 a and 105 b are connected to the input interface 105. The input interface 105 transmits a signal sent from the keyboard 105 a or the mouse 105 b to the CPU 101 via the bus 107.

通信インタフェース106は、ネットワークケーブルを介してスイッチ401に接続されており、このスイッチ401を介して、他のコンピュータとの間でデータの送受信を行う。   The communication interface 106 is connected to the switch 401 via a network cable, and transmits / receives data to / from another computer via the switch 401.

以上のようなハードウェア構成によって、本実施の形態の処理機能を実現することができる。なお、図3には、サーバ100のハードウェア構成を示したが、他のサーバやクライアントも同様のハードウェア構成で実現することができる。   With the hardware configuration as described above, the processing functions of the present embodiment can be realized. Although FIG. 3 shows the hardware configuration of the server 100, other servers and clients can be realized with the same hardware configuration.

次に、サーバ100に実装されたネットワーク監視機能について具体的に説明する。はじめに、このネットワーク監視機能を実現するソフトウェアの構成について説明する。
図4は、ネットワーク監視機能が実装されたサーバのソフトウェア構成例を示す図である。
Next, the network monitoring function implemented in the server 100 will be specifically described. First, the configuration of software that realizes this network monitoring function will be described.
FIG. 4 is a diagram illustrating a software configuration example of a server in which the network monitoring function is implemented.

ネットワーク監視機能は、OSのカーネル部分で動作する機能と、カーネルより上位のユーザ部分で動作する機能とに分かれる。図4において、前者の機能をネットワーク監視部100aが司り、後者の機能をネットワーク監視部100bが司っている。   The network monitoring function is divided into a function that operates in the kernel part of the OS and a function that operates in a user part higher than the kernel. In FIG. 4, the network monitoring unit 100a controls the former function, and the network monitoring unit 100b controls the latter function.

カーネル内に配置されたネットワーク監視部100aは、通信インタフェース106とIP/ARP100cとの間のドライバ部分に設けられる。すなわち、通信インタフェース106とIP/ARP100cとの間で受け渡されるパケットは、常にネットワーク監視部100aを経由する。また、ネットワーク監視部100aは、IP/ARP100cなどのレイヤ3レベル(ネットワーク層)の情報を監視すると共に、TCP100dなどのレイヤ4レベル(トランスポート層)のプロトコルでの通信の監視も行う。   The network monitoring unit 100a arranged in the kernel is provided in a driver portion between the communication interface 106 and the IP / ARP 100c. That is, a packet passed between the communication interface 106 and the IP / ARP 100c always passes through the network monitoring unit 100a. Further, the network monitoring unit 100a monitors information at a layer 3 level (network layer) such as the IP / ARP 100c, and also monitors communication using a protocol at a layer 4 level (transport layer) such as the TCP 100d.

ユーザ部分(カーネル以外の部分)に配置されたネットワーク監視部100bは、障害情報収集機能を行うデーモン(バックグラウンドサービス)である。具体的には、ネットワーク監視部100bは、カーネルに配置されたネットワーク監視部100aから異常検出通知を受け取って、障害情報110に蓄積する。障害情報110は、たとえば、HDD103内の記憶領域に格納される。また、異常検出通知を受け取った際に、その異常検出通知を障害情報110に蓄積すると共に、たとえば外部に設けられた管理サーバなどに通知することもできる。   The network monitoring unit 100b arranged in the user part (part other than the kernel) is a daemon (background service) that performs a failure information collection function. Specifically, the network monitoring unit 100b receives an abnormality detection notification from the network monitoring unit 100a arranged in the kernel and accumulates it in the failure information 110. The failure information 110 is stored in a storage area in the HDD 103, for example. Further, when the abnormality detection notification is received, the abnormality detection notification can be accumulated in the failure information 110 and also notified to, for example, a management server provided outside.

ところで、IP/ARP100cには、ARPテーブル100eおよびルーティングテーブル100fが接続されている。
図5は、ARPテーブルに記憶された情報の例を示す図である。
Incidentally, the ARP table 100e and the routing table 100f are connected to the IP / ARP 100c.
FIG. 5 is a diagram illustrating an example of information stored in the ARP table.

ARPテーブル100eには、同一セグメント内で通信を行った相手先のIPアドレスとMACアドレスとが対応付けられて記憶されている。IP/ARP100cは、ARPのプロトコルに従って、通信相手機器のIPアドレスをセットしたARPパケットを、通信インタフェース106を通じてネットワーク(同一セグメント)にブロードキャストし、その応答パケットから通信相手機器のMACアドレスを取得して、ARPテーブル100eに格納する。これにより、パケットの送信の際に、ARPテーブル100eを参照することで、宛先IPアドレスに対応するMACアドレスを抽出してパケットのヘッダに格納することが可能になる。   In the ARP table 100e, the IP address and MAC address of the other party that communicated in the same segment are stored in association with each other. The IP / ARP 100c broadcasts the ARP packet in which the IP address of the communication partner device is set to the network (same segment) through the communication interface 106 according to the ARP protocol, and acquires the MAC address of the communication partner device from the response packet. And stored in the ARP table 100e. As a result, the MAC address corresponding to the destination IP address can be extracted and stored in the packet header by referring to the ARP table 100e when transmitting the packet.

図6は、ルーティングテーブルに記憶された情報の例を示す図である。
ルーティングテーブル100fには、パケットの送信経路を示すIPアドレスが記憶されている。IP/ARP100cは、パケットの送信の際に、ルーティングテーブル100fを参照することで、上位層から指定された宛先IPアドレスに対応するパケットの送信経路を決定することが可能になる。ルーティングテーブル100fは、IP/ARP100cにより所定のルーティングプロトコルに従った手順で作成される。また、ルーティングテーブル100fには、“Default Gateway”としてルータ500のIPアドレスが設定される。
FIG. 6 is a diagram illustrating an example of information stored in the routing table.
The routing table 100f stores an IP address indicating a packet transmission route. The IP / ARP 100c can determine the transmission path of the packet corresponding to the destination IP address designated by the upper layer by referring to the routing table 100f when transmitting the packet. The routing table 100f is created by the IP / ARP 100c according to a procedure according to a predetermined routing protocol. In the routing table 100f, the IP address of the router 500 is set as “Default Gateway”.

図7は、ネットワーク監視部の機能を示すブロック図である。
ネットワーク監視部100a,100bは、通信状態を監視するために、図7に示すような機能を備えている。カーネル側のネットワーク監視部100aは、パケット解析部120とコネクション監視部130とを有する。
FIG. 7 is a block diagram illustrating functions of the network monitoring unit.
The network monitoring units 100a and 100b have functions as shown in FIG. 7 in order to monitor the communication state. The network monitoring unit 100a on the kernel side includes a packet analysis unit 120 and a connection monitoring unit 130.

パケット解析部120は、通信パケットの内容を解析する。解析結果は、コネクション監視部130に渡される。
コネクション監視部130は、パケット解析部120から渡された解析結果に基づいて、コネクションの状態を監視し、コネクションの異常等を検出する。コネクションの監視には、コネクション毎のコネクションテーブル140,140a,140b,・・・が利用される。コネクションテーブル140,140a,140b,・・・には、現在のコネクションの状態やエラー等の発生状況が記録される。
The packet analysis unit 120 analyzes the content of the communication packet. The analysis result is passed to the connection monitoring unit 130.
The connection monitoring unit 130 monitors the connection state based on the analysis result passed from the packet analysis unit 120 and detects a connection abnormality or the like. For connection monitoring, connection tables 140, 140a, 140b,... For each connection are used. In the connection tables 140, 140a, 140b,..., The current connection status and the occurrence status of errors are recorded.

たとえば、コネクションテーブル140には、コネクション管理テーブル141、送信監視テーブル142、受信監視テーブル143が設けられる。コネクション管理テーブル141は、コネクションの接続相手機器を示す情報や、そのコネクションでの異常の発生状況などが登録される。送信監視テーブル142には、サーバ100から送信されるパケットの異常の有無を監視するための情報が逐次登録される。受信監視テーブル143には、サーバ100が受信したパケットの異常の有無を監視するための情報が逐次登録される。   For example, the connection table 140 includes a connection management table 141, a transmission monitoring table 142, and a reception monitoring table 143. In the connection management table 141, information indicating a connection partner device of a connection, an occurrence state of an abnormality in the connection, and the like are registered. In the transmission monitoring table 142, information for monitoring whether there is an abnormality in a packet transmitted from the server 100 is sequentially registered. In the reception monitoring table 143, information for monitoring whether there is an abnormality in the packet received by the server 100 is sequentially registered.

このコネクション監視部130は、パケット解析部120からの情報から、レイヤ2(データリンク層)〜レイヤ4(トランスポート層)レベルの情報を監視する。具体的には、たとえば、自分側の通信インタフェース、IPアドレス、ポート番号、相手側の通信インタフェース、IPアドレス、ポート番号、MACアドレスなどをモニタする。そして、コネクションの有無(確立状態)の情報を取得する。さらに、レイヤ4のプロトコル(TCP)に基づく再送パケットの有無、重複受信パケットの有無、データの欠落の有無、Ack(確認応答)の応答時間、およびリセット信号をモニタし、統計的に処理する。   The connection monitoring unit 130 monitors layer 2 (data link layer) to layer 4 (transport layer) level information from the information from the packet analysis unit 120. Specifically, for example, its own communication interface, IP address, port number, counterpart communication interface, IP address, port number, MAC address, etc. are monitored. And the information of the presence or absence (establishment state) of a connection is acquired. Further, the presence / absence of a retransmission packet based on the layer 4 protocol (TCP), the presence / absence of a duplicate received packet, the presence / absence of data loss, the response time of Ack (acknowledgment response), and the reset signal are monitored and statistically processed.

ユーザ部分に配置されたネットワーク監視部100bは、障害判定部150を有する。障害判定部150は、コネクションテーブル140,140a,140b,・・・を参照し、エラー等の異常発生を検出する。この障害判定部150は、ARPテーブル100eおよびルーティングテーブル100fを参照して、通信相手機器がルータ500であるか否かを判定する機能や、通信相手機器に対してpingコマンドを発行して、その機器との接続の有無を確認する機能を備える。そして、これらの機能を用いて、通信障害の発生箇所を判定し、その判定結果を障害情報110に設定して出力する。   The network monitoring unit 100b arranged in the user part includes a failure determination unit 150. The failure determination unit 150 refers to the connection tables 140, 140a, 140b,... And detects an abnormality such as an error. The failure determination unit 150 refers to the ARP table 100e and the routing table 100f, issues a function for determining whether or not the communication partner device is the router 500, and issues a ping command to the communication partner device. It has a function to confirm the presence or absence of connection with equipment. Then, using these functions, the location where a communication failure has occurred is determined, and the determination result is set in the failure information 110 and output.

この障害判定部150は、コネクションテーブル140,140a,140b,・・・に格納された情報を基に、レイヤ4レベルにおける異常発生を検出する。また、これとともに、一般的に障害と認識される前の段階の予兆を検出することもできる。たとえば、ネットワークは自立制御されているために、TCPレベルで問題(再送等)が起こっていても自動復旧してしまい、障害は検知されない。ところが、障害発生の予兆として、TCPレベルで問題(再送等)が頻発する場合もある。従来は、TCPレベルで問題(再送等)に基づく障害検出が行われていないため、通常管理者は重大な問題が発生するまでシステムに異常があることを認識できなかった。   The failure determination unit 150 detects an occurrence of an abnormality at the layer 4 level based on information stored in the connection tables 140, 140a, 140b,. Along with this, it is also possible to detect a sign of a stage before it is generally recognized as a failure. For example, since the network is autonomously controlled, even if a problem (retransmission or the like) occurs at the TCP level, it is automatically recovered and no failure is detected. However, as a sign of the occurrence of a failure, a problem (such as retransmission) often occurs at the TCP level. Conventionally, failure detection based on a problem (retransmission or the like) has not been performed at the TCP level, and thus an administrator usually cannot recognize that there is an abnormality in the system until a serious problem occurs.

そこで、本実施の形態に係るコネクション監視部130は、TCPレベルで自動復旧(再送等)しているような、通常では確認することのできない情報をモニタする。そして、障害判定部150は、モニタされた情報に基づいてトラブルの予兆推定を行う。   Therefore, the connection monitoring unit 130 according to the present embodiment monitors information that cannot be normally confirmed, such as automatic recovery (retransmission or the like) at the TCP level. Then, the failure determination unit 150 performs a trouble sign estimation based on the monitored information.

図8は、トラブル予兆推定例を示す図である。ここでは例として、サーバ100からサーバ201に対して送信されるパケットが一度で届かずに再送された場合を考える。
通常、サーバ100からサーバ201への再送が発生していても、異常が発生していないと考えられている。しかし、サーバ100からサーバ201へのパケットの再送が発生しているということは、伝送路またはサーバでパケットが失われたことを意味している。この頻度が高くなると重大なトラブルに発展してしまう。たとえば、サーバ100からサーバ201へ頻繁に再送パケットが送られていれば、サーバ201でCPU等の能力不足などが発生し始めている場合が考えられる。このようなトラブルの予兆を検出して障害情報として管理者に通知すれば、重大なトラブルが発生する前に対処が可能となる。
FIG. 8 is a diagram illustrating a trouble sign estimation example. Here, as an example, consider a case where a packet transmitted from the server 100 to the server 201 is retransmitted without reaching at once.
Normally, even if retransmission from the server 100 to the server 201 occurs, it is considered that no abnormality has occurred. However, retransmission of a packet from the server 100 to the server 201 means that the packet has been lost on the transmission path or the server. If this frequency becomes high, it will develop into a serious trouble. For example, if retransmitted packets are frequently sent from the server 100 to the server 201, it may be considered that the server 201 is starting to have insufficient capabilities such as a CPU. If such a sign of trouble is detected and notified to the administrator as failure information, it is possible to cope with it before a serious trouble occurs.

以下、障害やその予兆を検出して、障害箇所を判定するための処理手順について説明する。
図9は、ネットワーク監視処理手順を示すフローチャートである。以下、図9に示す処理をステップ番号に沿って説明する。なお、以下の処理は、他の装置との間の通信が行われる毎に実行される。
In the following, a processing procedure for detecting a failure and its precursor and determining the failure location will be described.
FIG. 9 is a flowchart showing a network monitoring process procedure. In the following, the process illustrated in FIG. 9 will be described in order of step number. The following processing is executed every time communication is performed with another device.

[ステップS11]パケット解析部120は、コネクションをキャプチャする。すなわち、他の装置との間でのコネクション確立から、そのコネクションを介して伝送されたパケットを取得する。   [Step S11] The packet analysis unit 120 captures a connection. That is, a packet transmitted through the connection is acquired from the establishment of a connection with another device.

[ステップS12]パケット解析部120は、キャプチャしたパケットのTCPやIP、データリンク層のヘッダを抽出する。
[ステップS13]パケット解析部120は、抽出したヘッダ情報を解析する。この処理の詳細は後述する。
[Step S12] The packet analysis unit 120 extracts the TCP, IP, and data link layer header of the captured packet.
[Step S13] The packet analysis unit 120 analyzes the extracted header information. Details of this processing will be described later.

[ステップS14]コネクション監視部130は、初回のイベントか否かを判断する。該当コネクションに対応する更新中のコネクションテーブルが設けられていなければ、初回のイベントであると判断できる。初回のイベントの場合、処理がステップS15に進められる。そうでなければ、処理がステップS16に進められる。   [Step S14] The connection monitoring unit 130 determines whether the event is the first event. If the connection table being updated corresponding to the connection is not provided, it can be determined that this is the first event. In the case of the first event, the process proceeds to step S15. Otherwise, the process proceeds to step S16.

[ステップS15]コネクション監視部130は、コネクションテーブルの内容に基づいて検出される障害情報を、一定時間後に障害情報110にマージ(追加統合)するように、該当するコネクションテーブルの状態を設定する。   [Step S15] The connection monitoring unit 130 sets the state of the corresponding connection table so that the failure information detected based on the contents of the connection table is merged (additionally integrated) into the failure information 110 after a predetermined time.

[ステップS16]障害判定部150は、コネクションテーブル140に基づいて障害を検出して、障害発生箇所を判定する。そして、その判定結果に基づいて障害情報110を更新(マージ)する。この処理の詳細は後述する。   [Step S16] The failure determination unit 150 detects a failure based on the connection table 140 and determines the location where the failure has occurred. Then, the failure information 110 is updated (merged) based on the determination result. Details of this processing will be described later.

次に、ヘッダ情報の解析処理について詳細に説明する。
図10は、ヘッダ情報解析処理の手順を示すフローチャートである。以下、図10に示す処理をステップ番号に沿って説明する。
Next, header information analysis processing will be described in detail.
FIG. 10 is a flowchart showing a procedure of header information analysis processing. In the following, the process illustrated in FIG. 10 will be described in order of step number.

[ステップS21]コネクション監視部130は、取得したパケットに対応するコネクションテーブルが存在するか否かを判断する。コネクションテーブルが存在すれば、処理がステップS23に進められる。コネクションテーブルが存在しなければ、処理がステップS22に進められる。   [Step S21] The connection monitoring unit 130 determines whether a connection table corresponding to the acquired packet exists. If the connection table exists, the process proceeds to step S23. If the connection table does not exist, the process proceeds to step S22.

[ステップS22]コネクション監視部130は、IPアドレス、ポート番号の組み合わせに対応付けたコネクションテーブルを生成する。生成されたコネクションテーブルは、たとえば、RAM102内の記憶領域に格納される。   [Step S22] The connection monitoring unit 130 generates a connection table associated with a combination of an IP address and a port number. The generated connection table is stored in a storage area in the RAM 102, for example.

[ステップS23]コネクション監視部130は、応答(Ack)の番号、シーケンス番号、およびデータ長より、再送、重複受信、遅延、およびパケットロストを検出する。検出した結果は、コネクションテーブルに登録される。その後、図9に示す処理に戻り、ステップS14に処理が進められる。   [Step S23] The connection monitoring unit 130 detects retransmission, duplicate reception, delay, and packet lost based on the response (Ack) number, sequence number, and data length. The detected result is registered in the connection table. Thereafter, the process returns to the process shown in FIG. 9, and the process proceeds to step S14.

次に、特定のコネクションによって送受信されるパケットに基づいたコネクションテーブルの作成例を具体的に説明する。
図11は、コネクション上での通信例を示す図である。
Next, an example of creating a connection table based on a packet transmitted / received by a specific connection will be specifically described.
FIG. 11 is a diagram illustrating an example of communication over a connection.

図11は、サーバ100に実装されたネットワーク監視機能によって、サーバ201との間で確立したコネクションを監視した場合の例を示している。この図11では例として、サーバ100をWebサーバ、サーバ201をアプリケーション(AP)サーバとしている。サーバ100のIPアドレスは「192.168.10.10」であり、Webサーバとして機能を提供するアプリケーションのポート番号は「80」である。また、サーバ201のIPアドレスは「192.168.10.20」であり、処理機能を提供するアプリケーションのポート番号は「10000」である。   FIG. 11 shows an example in which a connection established with the server 201 is monitored by a network monitoring function implemented in the server 100. In FIG. 11, as an example, the server 100 is a Web server and the server 201 is an application (AP) server. The IP address of the server 100 is “192.168.10.10”, and the port number of the application that provides the function as the Web server is “80”. The IP address of the server 201 is “192.168.10.20”, and the port number of the application that provides the processing function is “10000”.

ここで、サーバ100とサーバ201との間で受け渡されるパケット40〜45に着目する。ここで、パケット40〜45の内容について、図12を参照して説明する。なお、パケット44は、何らかの障害により正しく伝送されなかったものとする。   Here, attention is focused on the packets 40 to 45 passed between the server 100 and the server 201. Here, the contents of the packets 40 to 45 will be described with reference to FIG. It is assumed that the packet 44 has not been transmitted correctly due to some kind of failure.

図12は、Webサーバ側のパケットの内容を示す図である。
この図12には、パケット40〜45について、サーバ100が認識した通信状態(正常か異常か)、サーバ100におけるパケットの送受信の時間(監視開始からの時間)、SRC−IP(送信元のIPアドレス)、SRC−Port(送信元のポート番号)、DST−IP(宛先のIPアドレス)、DST−Port(宛先のポート番号)、Sequence no(シーケンス番号)、Ack no(応答番号)、Data Len(データ長)が示されている。
FIG. 12 is a diagram showing the contents of the packet on the Web server side.
In FIG. 12, the communication state (normal or abnormal) recognized by the server 100 for the packets 40 to 45, the packet transmission / reception time (time from the start of monitoring), SRC-IP (transmission source IP) Address), SRC-Port (source port number), DST-IP (destination IP address), DST-Port (destination port number), Sequence no (sequence number), Ack no (response number), Data Len (Data length) is shown.

パケット40は、状態が正常、時間が0.5秒、SRC−IPが「192.168.10.20」、SRC−Portが「10000」、DST−IPが「192.168.10.10」、DST−Portが「80」、Sequence noが「1900」、Ack noが「1000」、Data Lenが100バイトである。   The packet 40 is in a normal state, time is 0.5 seconds, SRC-IP is “192.168.10.20”, SRC-Port is “10000”, DST-IP is “192.168.10.10”, and DST-Port is “80”. , Sequence no is “1900”, Ack no is “1000”, and Data Len is 100 bytes.

パケット41は、状態が正常、時間が1.0秒、SRC−IPが「192.168.10.10」、SRC−Portが「80」、DST−IPが「192.168.10.20」、DST−Portが「10000」、Sequence noが「1000」、Ack noが「2000」、Data Lenが10バイトである。   The packet 41 is in a normal state, time is 1.0 second, SRC-IP is “192.168.10.10”, SRC-Port is “80”, DST-IP is “192.168.10.20”, and DST-Port is “10000”. , Sequence no is “1000”, Ack no is “2000”, and Data Len is 10 bytes.

パケット42は、状態が正常、時間が2.5秒、SRC−IPが「192.168.10.20」、SRC−Portが「10000」、DST−IPが「192.168.10.10」、DST−Portが「80」、Sequence noが「2000」、Ack noが「1010」、Data Lenが0バイトである。   The packet 42 is in the normal state, the time is 2.5 seconds, the SRC-IP is “192.168.10.20”, the SRC-Port is “10000”, the DST-IP is “192.168.10.10”, and the DST-Port is “80”. , Sequence no is “2000”, Ack no is “1010”, and Data Len is 0 byte.

パケット43は、状態が正常、時間が3.0秒、SRC−IPが「192.168.10.10」、SRC−Portが「80」、DST−IPが「192.168.10.20」、DST−Portが「10000」、Sequence noが「1010」、Ack noが「2000」、Data Lenが20バイトである。   The packet 43 is in a normal state, time is 3.0 seconds, SRC-IP is “192.168.10.10”, SRC-Port is “80”, DST-IP is “192.168.10.20”, and DST-Port is “10000”. , Sequence no is “1010”, Ack no is “2000”, and Data Len is 20 bytes.

パケット44は、何らかの理由でサーバ100に到達できなかったパケットである。そのため、図12では状態と時間との欄が空欄となっている。パケット44の内容はSRC−IPが「192.168.10.20」、SRC−Portが「10000」、DST−IPが「192.168.10.10」、DST−Portが「80」、Sequence noが「2000」、Ack noが「1030」、Data Lenが100バイトであるが、このパケット44はサーバ100に到達しない。そのため、サーバ100側では、TCPプロトコルの機能により、パケット43と同様の内容のパケット45が再送される。   The packet 44 is a packet that could not reach the server 100 for some reason. Therefore, in FIG. 12, the status and time fields are blank. The contents of the packet 44 are “192.168.10.20” for SRC-IP, “10000” for SRC-Port, “192.168.10.10” for DST-IP, “80” for DST-Port, “2000” for Sequence no, Ack no Is “1030” and Data Len is 100 bytes, but this packet 44 does not reach the server 100. Therefore, on the server 100 side, the packet 45 having the same content as the packet 43 is retransmitted by the function of the TCP protocol.

パケット45は、状態が異常、時間が6.0秒、SRC−IPが「192.168.10.10」、SRC−Portが「80」、DST−IPが「192.168.10.20」、DST−Portが「10000」、Sequence noが「1010」、Ack noが「2000」、Data Lenが20バイトである。   The packet 45 has an abnormal state, a time of 6.0 seconds, SRC-IP “192.168.10.10”, SRC-Port “80”, DST-IP “192.168.10.20”, and DST-Port “10000”. , Sequence no is “1010”, Ack no is “2000”, and Data Len is 20 bytes.

サーバ100のパケット解析部120は、実際に入出力されたパケット41〜43,45のヘッダ情報を解析して、それらの情報(図12に示す情報)をコネクション監視部130に渡す。コネクション監視部130は、受け取った情報に基づいてコネクションテーブル140を作成する。コネクションテーブル140は、図7に示すようにコネクション管理テーブル141、送信監視テーブル142、および受信監視テーブル143で構成される。これらのテーブルのデータ構造例を以下に示す。   The packet analysis unit 120 of the server 100 analyzes header information of the packets 41 to 43 and 45 that are actually input / output, and passes the information (information shown in FIG. 12) to the connection monitoring unit 130. The connection monitoring unit 130 creates the connection table 140 based on the received information. As shown in FIG. 7, the connection table 140 includes a connection management table 141, a transmission monitoring table 142, and a reception monitoring table 143. Examples of the data structure of these tables are shown below.

図13は、コネクション管理テーブルのデータ構造例を示す図である。
コネクション管理テーブル141には、インタフェース名、自側IP、自側Port、相手側IP、相手側Port、相手側MAC、再送カウンタ、重複受信カウンタ、パケットロストカウンタ、応答遅延カウンタ、パケットサイズカウンタ、パケット数カウンタ、相手側応答時間基準、および自側応答時間基準が登録されている。
FIG. 13 is a diagram illustrating an example of the data structure of the connection management table.
The connection management table 141 includes an interface name, a local IP, a local Port, a partner IP, a partner Port, a partner MAC, a retransmission counter, a duplicate reception counter, a packet lost counter, a response delay counter, a packet size counter, a packet A number counter, a counterpart response time criterion, and a local response time criterion are registered.

インタフェース名は、コネクションを確立した通信インタフェースの識別情報である。図13の例では、インタフェース名は「hme0」である。自側IPは、自分のIPアドレスである。図13の例では、IPアドレスは「192.168.10.10」である。自側Portは、コネクション使用するアプリケーションのポート番号である。図13の例では、ポート番号は「80」である。   The interface name is identification information of a communication interface that has established a connection. In the example of FIG. 13, the interface name is “hme0”. The local IP is its own IP address. In the example of FIG. 13, the IP address is “192.168.10.10”. The local port is the port number of the application that uses the connection. In the example of FIG. 13, the port number is “80”.

相手側IPは、通信相手側の装置のIPアドレスである。図13の例では、相手側のIPアドレスは「192.168.10.20」である。相手側Portは、コネクションを使用して通信する相手側のアプリケーションのポート番号である。図13の例では、相手側アプリケーションのポート番号は「10000」である。相手側MACは、通信相手側装置のMACアドレスである。図13の例では、相手側のMACアドレスは「00:80:91:a2:b3:c4」である。   The partner IP is the IP address of the communication partner device. In the example of FIG. 13, the IP address of the other party is “192.168.10.20”. The partner port is the port number of the partner application that communicates using the connection. In the example of FIG. 13, the port number of the partner application is “10000”. The partner MAC is the MAC address of the communication partner device. In the example of FIG. 13, the other party's MAC address is “00: 80: 91: a2: b3: c4”.

再送カウンタは、パケットの再送を行った回数である。図13の例では、パケットの再送を1回行っている。重複受信カウンタは、同一パケットを重複して受け取った回数である。図13の例では、パケットの重複受信は発生していない。パケットロストカウンタは、パケットを紛失した回数である。図13の例では、パケットロストは発生していない。   The retransmission counter is the number of times the packet has been retransmitted. In the example of FIG. 13, the packet is retransmitted once. The duplicate reception counter is the number of times the same packet has been received twice. In the example of FIG. 13, duplicate reception of packets has not occurred. The packet lost counter is the number of times a packet is lost. In the example of FIG. 13, no packet loss has occurred.

応答遅延カウンタは、自装置においてパケットを受信してから通信相手に応答を返すまでの時間が基準値を超えてしまった回数である。自装置の処理負荷が過大である場合に、応答の遅延が発生する。そのために応答遅延の発生回数をカウントすることで、自装置の処理負荷の増大による障害の発生を検知できる。図13の例では、応答遅延は発生していない。   The response delay counter is the number of times that the time from when the packet is received by the own device until the response is returned to the communication partner exceeds the reference value. A response delay occurs when the processing load of the own apparatus is excessive. Therefore, by counting the number of response delay occurrences, it is possible to detect the occurrence of a failure due to an increase in the processing load of the own apparatus. In the example of FIG. 13, no response delay occurs.

パケットサイズカウンタは、受信したパケットサイズのトータルを示している。図13の例では、パケットサイズカウンタの値は「0」である。パケット数カウンタは、送受信したパケットの総数を示すカウンタである。図13の例では、パケット数カウンタの値は「0」である。   The packet size counter indicates the total received packet size. In the example of FIG. 13, the value of the packet size counter is “0”. The packet number counter is a counter indicating the total number of packets transmitted and received. In the example of FIG. 13, the value of the packet number counter is “0”.

相手側応答時間基準は、相手側から応答の待ち時間である。この時間だけ待っても応答がない場合、応答遅延と判定され、応答遅延カウンタをカウントアップする。図13の例では、相手側応答時間基準は、「1.5秒」である。自側応答時間基準は、自分が相手に応答を返すときの許容時間である。この時間内に応答が返せない場合、応答遅延が検出される。図13の例では、自側応答時間基準は、「0.5秒」である。   The counterpart response time reference is a response waiting time from the counterpart. If there is no response after waiting for this time, it is determined as a response delay, and the response delay counter is counted up. In the example of FIG. 13, the counterpart response time reference is “1.5 seconds”. The self-side response time reference is an allowable time when the self returns a response to the other party. If a response cannot be returned within this time, a response delay is detected. In the example of FIG. 13, the local response time reference is “0.5 seconds”.

図14は、送信監視テーブルのデータ構造例を示す図である。
送信監視テーブル142には、シーケンス番号予測、時間、相手側応答時間の欄が設けられている。
FIG. 14 is a diagram illustrating an exemplary data structure of the transmission monitoring table.
The transmission monitoring table 142 has columns for sequence number prediction, time, and counterparty response time.

シーケンス番号予測の欄には、相手装置に対して次に送信されるパケットのシーケンス番号の予測値が設定される。前回送信されたパケットのシーケンス番号にデータ長を加えた値がシーケンス番号の予測値となる。次に送信されたパケットのシーケンス番号がシーケンス番号予測値より小さければ、パケットの再送が行われたことが分かる。   In the sequence number prediction column, a predicted value of the sequence number of the next packet to be transmitted to the partner apparatus is set. A value obtained by adding the data length to the sequence number of the previously transmitted packet is the predicted value of the sequence number. If the sequence number of the next transmitted packet is smaller than the predicted sequence number value, it is known that the packet has been retransmitted.

時間は、自側でパケットを送信した時間(コネクションの監視を開始してからの経過時間)である。相手側応答時間は、パケットを送信した時刻から、そのパケットに対する通信相手からの応答を受け取った時刻までの経過時間である。   The time is the time when the packet is transmitted on the own side (elapsed time since the start of connection monitoring). The partner side response time is the elapsed time from the time when the packet is transmitted to the time when the response from the communication partner for the packet is received.

図15は、受信監視テーブルのデータ構造例を示す図である。
受信監視テーブル143には、シーケンス番号予測、時間、および自側応答時間の欄が設けられている。
FIG. 15 is a diagram illustrating an example of the data structure of the reception monitoring table.
The reception monitoring table 143 has columns for sequence number prediction, time, and own side response time.

シーケンス番号予測の欄には、相手装置から次に受信するパケットのシーケンス番号の予測値が設定される。前回受信したパケットのシーケンス番号にデータ長を加えた値がシーケンス番号の予測値となる。次に受信したパケットのシーケンス番号がシーケンス番号予測値より小さければ、パケットの重複受信であることが分かる。   In the sequence number prediction column, the predicted value of the sequence number of the next packet received from the partner apparatus is set. A value obtained by adding the data length to the sequence number of the packet received last time is the predicted value of the sequence number. Next, if the sequence number of the received packet is smaller than the predicted sequence number value, it is understood that the packet is duplicated.

時間は、相手側からパケットを受信した時間(コネクションの監視を開始してからの経過時間)である。自側応答時間は、パケットを受信した時刻から、そのパケットに対して自側の装置が応答するまでの経過時間である。   The time is the time when a packet is received from the other side (the elapsed time since the start of connection monitoring). The own side response time is an elapsed time from the time when the packet is received until the own device responds to the packet.

次に、図11に示す通信(パケットの内容は図12に示す)が行われたときの送信監視テーブル142と受信監視テーブル143との状態遷移について説明する。
図16は、送信監視テーブルと受信監視テーブルとの状態遷移を示す第1の図である。
Next, state transition between the transmission monitoring table 142 and the reception monitoring table 143 when the communication shown in FIG. 11 (the contents of the packet are shown in FIG. 12) is performed will be described.
FIG. 16 is a first diagram illustrating state transition between the transmission monitoring table and the reception monitoring table.

状態ST1は、図11に示すパケット40の受信直後(時間0.5)の状態である。サーバ100がパケット40を受信すると、コネクション監視部130が受信側のシーケンス番号を予測し、受信監視テーブル143にレコードを追加する。   State ST1 is a state immediately after reception of packet 40 shown in FIG. 11 (time 0.5). When the server 100 receives the packet 40, the connection monitoring unit 130 predicts the sequence number on the receiving side and adds a record to the reception monitoring table 143.

図16の例では、シーケンス番号予測の欄に「2000」(パケット40のシーケンス番号「1900」にデータ長「100」を加えた値)が設定され、時間の欄に「0.5」が設定されている。   In the example of FIG. 16, “2000” (a value obtained by adding the data length “100” to the sequence number “1900” of the packet 40) is set in the sequence number prediction column, and “0.5” is set in the time column. Has been.

状態ST2は、図11に示すパケット41の送信直後(時間1.0)の状態である。サーバ100がパケット41を送信すると、コネクション監視部130が送信側のシーケンス番号を予測し、送信監視テーブル142にレコードを追加する。同時に、コネクション監視部130は、受信監視テーブル143の自側応答時間の欄に値を設定する。   State ST2 is a state immediately after transmission of packet 41 shown in FIG. 11 (time 1.0). When the server 100 transmits the packet 41, the connection monitoring unit 130 predicts the transmission-side sequence number and adds a record to the transmission monitoring table 142. At the same time, the connection monitoring unit 130 sets a value in the own response time field of the reception monitoring table 143.

図16の例では、送信監視テーブル142のシーケンス番号予測の欄に「1010」(パケット41のシーケンス番号「1000」にデータ長「10」を加えた値)が設定され、時間の欄に「1.0」が設定されている。また、受信監視テーブル143の自側応答時間の欄に、「0.5」(送信監視テーブル142の時間「1.0」から受信監視テーブル143の時間「0.5」を減算した値)が設定されている。   In the example of FIG. 16, “1010” (a value obtained by adding the data length “10” to the sequence number “1000” of the packet 41) is set in the sequence number prediction column of the transmission monitoring table 142, and “1” is set in the time column. .0 "is set. Also, “0.5” (the value obtained by subtracting the time “0.5” of the reception monitoring table 143 from the time “1.0” of the transmission monitoring table 142) is entered in the own response time column of the reception monitoring table 143. Is set.

状態ST3は、図11に示すパケット42の受信直後(時間2.5)の状態である。サーバ100がパケット42を受信すると、コネクション監視部130が受信側のシーケンス番号を予測し、受信監視テーブル143を更新する。同時にコネクション監視部130は、送信監視テーブル142の相手側応答時間の欄に値を設定する。   State ST3 is a state immediately after reception of packet 42 shown in FIG. 11 (time 2.5). When the server 100 receives the packet 42, the connection monitoring unit 130 predicts the receiving sequence number and updates the reception monitoring table 143. At the same time, the connection monitoring unit 130 sets a value in the other party response time column of the transmission monitoring table 142.

図16の例では、受信監視テーブル143のシーケンス番号予測の欄に「2000」(パケット42のシーケンス番号「2000」にデータ長「0」を加えた値)が設定され、時間の欄に「2.5」が設定されている。また、送信監視テーブル142の相手側応答時間の欄に「1.5」(受信監視テーブル143の時間「2.5」から送信監視テーブルの時間「1.0」を減算した値)が設定されている。   In the example of FIG. 16, “2000” (a value obtained by adding the data length “0” to the sequence number “2000” of the packet 42) is set in the sequence number prediction column of the reception monitoring table 143, and “2” is set in the time column. .5 "is set. Further, “1.5” (a value obtained by subtracting the time “1.0” of the transmission monitoring table from the time “2.5” of the reception monitoring table 143) is set in the column of the other party response time of the transmission monitoring table 142. ing.

なお、パケット42のシーケンス番号は、事前に予測されていたシーケンス番号と一致するため、異常が起こっていないと判断される。
図17は、送信監視テーブルと受信監視テーブルとの状態遷移を示す第2の図である。
Since the sequence number of the packet 42 matches the sequence number predicted in advance, it is determined that no abnormality has occurred.
FIG. 17 is a second diagram illustrating state transition between the transmission monitoring table and the reception monitoring table.

状態ST4は、図11に示すパケット43の送信直後(時間3.0)の状態である。サーバ100がパケット43を送信すると、コネクション監視部130が送信側のシーケンス番号を予測し、送信監視テーブル142を更新する。同時に、コネクション監視部130は、受信監視テーブル143の自側応答時間の欄に値を設定する。   State ST4 is a state immediately after transmission of packet 43 shown in FIG. 11 (time 3.0). When the server 100 transmits the packet 43, the connection monitoring unit 130 predicts the transmission-side sequence number and updates the transmission monitoring table 142. At the same time, the connection monitoring unit 130 sets a value in the own response time field of the reception monitoring table 143.

図17の例では、送信監視テーブル142の新たなレコードとして、シーケンス番号予測の欄に「1030」(パケット43のシーケンス番号「1010」にデータ長「20」を加えた値)が設定され、時間の欄に「3.0」が設定されている。また、受信監視テーブル143の自側応答時間の欄に、「0.5」(送信監視テーブル142に新たに設定された時間「3.0」から受信監視テーブル143の時間「2.5」を減算した値)が設定されている。   In the example of FIG. 17, “1030” (a value obtained by adding the data length “20” to the sequence number “1010” of the packet 43) is set in the sequence number prediction column as a new record in the transmission monitoring table 142. "3.0" is set in the column of. In addition, in the own response time column of the reception monitoring table 143, “0.5” (from the time “3.0” newly set in the transmission monitoring table 142 to the time “2.5” of the reception monitoring table 143). Subtracted value) is set.

なお、パケット43のシーケンス番号は、事前に予測されていたシーケンス番号と一致するため、異常が起こっていないと判断される。
状態ST5は、図11に示すパケット45の送信直後(時間6.0)の状態である。サーバ100がパケット45を送信すると、コネクション監視部130が送信側のシーケンス番号を予測し、送信監視テーブル142を更新する。
Note that the sequence number of the packet 43 matches the sequence number predicted in advance, so it is determined that no abnormality has occurred.
State ST5 is a state immediately after transmission of packet 45 shown in FIG. 11 (time 6.0). When the server 100 transmits the packet 45, the connection monitoring unit 130 predicts the transmission-side sequence number and updates the transmission monitoring table 142.

図17の例では、送信監視テーブル142のシーケンス番号予測の欄に「1030」(パケット45のシーケンス番号「1010」にデータ長「20」を加えた値)が設定され、時間の欄に「6.0」が設定されている。   In the example of FIG. 17, “1030” (a value obtained by adding the data length “20” to the sequence number “1010” of the packet 45) is set in the sequence number prediction column of the transmission monitoring table 142, and “6” is set in the time column. .0 "is set.

ここで、パケット45の送信を検出したコネクション監視部130は、パケット45のシーケンス番号「1010」が、送信監視テーブル142に既に設定されていたシーケンス番号予測「1030」よりも小さいことを検出する。これにより、コネクション監視部130はパケット45が再送用のパケットであると判断する。すると、コネクション監視部130は、コネクション管理テーブル141の再送カウンタの値をカウントアップする。   Here, the connection monitoring unit 130 that has detected the transmission of the packet 45 detects that the sequence number “1010” of the packet 45 is smaller than the sequence number prediction “1030” already set in the transmission monitoring table 142. Accordingly, the connection monitoring unit 130 determines that the packet 45 is a retransmission packet. Then, the connection monitoring unit 130 increments the value of the retransmission counter in the connection management table 141.

このようにしてコネクションテーブル140が更新される。そして、障害判定部150は、コネクションテーブル140内の情報に基づいて、各コネクションでの障害の発生の有無を判断する。そして、障害判定部150は、障害を検出すると、その障害の発生箇所を判定し、障害情報を更新する。   In this way, the connection table 140 is updated. Then, the failure determination unit 150 determines whether or not a failure has occurred in each connection based on the information in the connection table 140. When the failure determination unit 150 detects a failure, the failure determination unit 150 determines a location where the failure has occurred and updates the failure information.

ここで、参考のために、上記の特許文献1(特許公開番号「特開2005−167347号」の公開特許公報)に開示された従来の障害箇所判定手法について説明する。この従来手法では、上記のように作成されたコネクションテーブル140を基に異常を検出すると、その検出した異常を示す事象に対して以下のような判定条件を適用することで、障害発生箇所を判定していた。   Here, for reference, a conventional failure location determination method disclosed in Patent Document 1 (published patent publication of Japanese Patent Publication No. 2005-167347) will be described. In this conventional method, when an abnormality is detected based on the connection table 140 created as described above, a failure occurrence location is determined by applying the following determination condition to the event indicating the detected abnormality. Was.

判定条件1:自装置側(すなわちサーバ100)におけるAckの応答時間が基準値より大きかった場合、異常事象として応答遅延を検出し、自装置に何らかの問題があると判定する。   Determination condition 1: When the response time of Ack on the own device side (that is, the server 100) is longer than the reference value, a response delay is detected as an abnormal event, and it is determined that there is some problem in the own device.

判定条件2:自装置の通信インタフェースに対するコネクションすべてに異常(再送パケット、重複受信パケット、データの欠落、または応答遅延)があるとき、異常事象としてコネクション異常を検出し、隣接している伝送路(すなわち、サーバ100とルータ500との間の伝送路)が故障していると判断する。   Judgment condition 2: When there is an abnormality (retransmission packet, duplicate received packet, missing data, or response delay) in all connections to the communication interface of the own device, the connection abnormality is detected as an abnormal event, and the adjacent transmission line ( That is, it is determined that the transmission path between the server 100 and the router 500 has failed.

判定条件3:一部のコネクションにおいて、不特定のIPアドレス、ポートで異常が発生した場合、異常事象としてコネクション異常を検出し、隣接していない伝送路中(すなわち、サーバ100から見てルータ500より外側の伝送路)にエラーが発生したとして判断する。   Judgment condition 3: When an abnormality occurs in an unspecified IP address or port in some connections, a connection abnormality is detected as an abnormal event, and the router 500 is not in the adjacent transmission path (that is, viewed from the server 100). It is determined that an error has occurred in the outer transmission line).

判定条件4:コネクション確立時に、特定相手IPアドレス、ポートで障害が発生している場合、異常事象としてコネクション異常を検出し、通信相手機器が故障していると判断する。   Judgment condition 4: When a failure has occurred in a specific partner IP address and port at the time of establishing a connection, a connection abnormality is detected as an abnormal event, and it is determined that a communication partner device has failed.

以上の判定条件により、通信の障害が自装置側、隣接伝送路、非隣接伝送路、通信相手機器のどこで発生しているかを判定していた。しかし、本実施の形態のように、ルータやゲートウェイを介して通信可能なシステムでは、接続相手機器が少ない場合、すなわちコネクション監視部130で監視されているコネクションが少ない場合には、上記のような判定条件を適用すると、障害発生箇所を正確に特定できないことがあった。   Based on the above determination conditions, it is determined where the communication failure occurs on the own apparatus side, adjacent transmission path, non-adjacent transmission path, or communication counterpart device. However, in a system capable of communicating via a router or gateway as in the present embodiment, when the number of connection partner devices is small, that is, when the number of connections monitored by the connection monitoring unit 130 is small, as described above When applying the judgment conditions, the location where the failure occurred could not be identified accurately.

たとえば、監視対象のコネクションが1つしか存在しない状況下で、判定条件4に合致する異常事象が検出された場合には、サーバ100と同一セグメント内の通信相手機器(たとえばサーバ201あるいは202)において障害が発生している場合と、ルータ500の外部のネットワークにおいて(たとえばクライアント301〜304のいずれかにおいて)障害が発生している場合の両方が考えられる。すなわち、従来の障害箇所判定手法では、ハードウェア的な障害箇所の切り分けをレイヤ3および4のレベルでしか行っていなかったために、ルータやゲートウェイが存在した場合には、障害箇所がそれより内側であるか外側であるかを区別できなかった。   For example, in a situation where there is only one connection to be monitored, if an abnormal event that matches the determination condition 4 is detected, the communication partner device (for example, the server 201 or 202) in the same segment as the server 100 Both a case where a failure has occurred and a case where a failure has occurred in a network outside the router 500 (for example, in any of the clients 301 to 304) can be considered. That is, in the conventional failure location determination method, the hardware failure location is determined only at the level of layers 3 and 4, and therefore, if there is a router or gateway, the failure location is on the inner side. I couldn't tell whether it was outside or outside.

そこで、本実施の形態では、MACアドレスを用いて、同一セグメント内の通信相手機器がルータであるか否かを判別することで、監視対象のコネクション数に関係なく、障害発生箇所を正確に特定できるようにする。ルータのMACアドレスは、TCP/IPの通信手順において従来からすでにサーバ201自身が保持している情報(ARPテーブル)から取得することができるので、本実施の形態の判定手法により、通信のためのプログラムの構造や必要な情報記憶領域を大きく変更することなく、正確な障害箇所判定を行うことができる。   Therefore, in this embodiment, by using the MAC address, it is determined whether or not the communication partner device in the same segment is a router, so that the location where a failure has occurred can be accurately identified regardless of the number of connections to be monitored. It can be so. Since the MAC address of the router can be acquired from information (ARP table) already held by the server 201 itself in the TCP / IP communication procedure, the determination method according to the present embodiment can be used for communication. Accurate fault location determination can be performed without significantly changing the program structure or the necessary information storage area.

図18は、本実施の形態で適用される障害箇所判定処理の手順を示すフローチャートである。以下、図18に示す処理をステップ番号に沿って説明する。
[ステップS31]障害判定部150は、コネクションテーブル140を参照してコネクション情報を解析し、発生した全コネクションのイベントを集計する。
FIG. 18 is a flowchart showing a procedure of failure location determination processing applied in the present embodiment. Hereinafter, the process illustrated in FIG. 18 will be described in order of step number.
[Step S31] The failure determination unit 150 refers to the connection table 140, analyzes the connection information, and totals the events of all the connections that have occurred.

[ステップS32]障害判定部150は、イベントの集計結果に基づき、障害が発生しているか否かを検出する。障害が発生していた場合は、処理がステップS33に進められる。障害が発生していない場合は、処理が終了される。   [Step S32] The failure determination unit 150 detects whether or not a failure has occurred based on the result of counting events. If a failure has occurred, the process proceeds to step S33. If no failure has occurred, the process is terminated.

[ステップS33]障害判定部150は、ルーティングテーブル100fを参照し、ルータのIPアドレスを取得する。この処理は、たとえば、netstatコマンド、あるいはrouteコマンドを実行して、ルーティングテーブル100fの内容を取得し、その中に記載されたゲートウェイのIPアドレスを抽出することで実行できる。   [Step S33] The failure determination unit 150 refers to the routing table 100f and acquires the IP address of the router. This process can be executed, for example, by executing the netstat command or the route command to acquire the contents of the routing table 100f and extracting the IP address of the gateway described therein.

[ステップS34]障害判定部150は、ARPテーブル100eを参照し、ステップS33で取得したルータのIPアドレスに対応するMACアドレスを取得する。
[ステップS35]障害判定部150は、ステップS32で障害を検出したコネクションにおける通信相手機器のIPアドレスを、コネクションテーブル140から取得し、このIPアドレスに対応するMACアドレスをARPテーブル100eから取得する。
[Step S34] The failure determination unit 150 refers to the ARP table 100e and acquires a MAC address corresponding to the IP address of the router acquired in Step S33.
[Step S35] The failure determination unit 150 acquires the IP address of the communication counterpart device in the connection in which the failure is detected in Step S32 from the connection table 140, and acquires the MAC address corresponding to the IP address from the ARP table 100e.

[ステップS36]障害判定部150は、ステップS35で取得した通信相手機器のMACアドレスが、ステップS34で取得したいずれかのルータのMACアドレスと一致するか否かを判定する。一致するルータがあった場合は、処理がステップS38に進められ、一致するルータがなかった場合は、処理がステップS37に進められる。   [Step S36] The failure determination unit 150 determines whether or not the MAC address of the communication partner device acquired in step S35 matches the MAC address of any router acquired in step S34. If there is a matching router, the process proceeds to step S38. If there is no matching router, the process proceeds to step S37.

[ステップS37]このステップでは、サーバ100から見てルータの外側のネットワーク上の機器との通信において障害が発生したのではないことがわかる。このため、障害判定部150は、ルータより内側の同一セグメントに属するネットワークに接続された、ルータ以外の機器、またはそのネットワーク上の伝送路において、障害が発生したと判定する。図2の構成では、たとえば、サーバ100,201,202,スイッチ401のいずれか、あるいはこれらに接続された伝送路を、障害発生箇所と判定する。その後、処理がステップS42に進められる。   [Step S37] In this step, it is understood that a failure has not occurred in communication with a device on the network outside the router as viewed from the server 100. Therefore, the failure determination unit 150 determines that a failure has occurred in a device other than the router connected to the network belonging to the same segment inside the router or a transmission path on the network. In the configuration of FIG. 2, for example, any of the servers 100, 201, 202, the switch 401, or a transmission path connected to these is determined as a failure occurrence location. Thereafter, the process proceeds to step S42.

[ステップS38]障害判定部150は、ステップS36でMACアドレスが一致したルータに対して、pingコマンドを発行する。
[ステップS39]障害判定部150は、pingコマンドに対する応答動作が正常に終了したか否かを判定する。具体的には、ルータからの応答が所定時間内にあった場合に、正常終了と判定する。正常に終了した場合には、処理がステップS40に進められる。正常に終了しなかった場合には、処理がステップS41に進められる。
[Step S38] The failure determination unit 150 issues a ping command to the router whose MAC address matches in step S36.
[Step S39] The failure determination unit 150 determines whether or not the response operation to the ping command has ended normally. Specifically, when the response from the router is within a predetermined time, it is determined that the process is normally completed. If the process has ended normally, the process proceeds to Step S40. If not completed normally, the process proceeds to step S41.

[ステップS40]このステップでは、サーバ100から見てルータの外側のネットワーク上の機器との通信において障害が発生し、そのルータが正常に動作していることがわかる。このため、障害判定部150は、ステップS36でMACアドレスが一致したサーバから見てルータより外側のセグメントに属するネットワークに接続された機器、またはそのセグメントの伝送路において、障害が発生したと判定する。図2の構成では、たとえば、クライアント301〜304、スイッチ402,403、ルータ500のいずれか、あるいはこれらの機器間の伝送路を、障害発生箇所と判定する。その後、処理がステップS42に進められる。   [Step S40] In this step, it can be seen that a failure has occurred in communication with a device on the network outside the router as viewed from the server 100, and that the router is operating normally. For this reason, the failure determination unit 150 determines that a failure has occurred in a device connected to a network belonging to a segment outside the router as viewed from the server whose MAC address matches in step S36 or the transmission path of the segment. . In the configuration of FIG. 2, for example, any of the clients 301 to 304, the switches 402 and 403, the router 500, or a transmission path between these devices is determined as a failure occurrence location. Thereafter, the process proceeds to step S42.

[ステップS41]このステップでは、サーバ100から見てルータの外側のネットワーク上の機器との通信において障害が発生しており、且つ、そのルータとの接続が確認できない状態となる。このため、障害判定部150は、ステップS36でMACアドレスが一致したルータとサーバ100との間の通信において、障害が発生したと判定する。図2の構成では、たとえば、サーバ100またはスイッチ401、またはサーバ100とルータ500との間の伝送路を、障害発生箇所と判定する。その後、処理がステップS42に進められる。   [Step S41] In this step, a failure has occurred in communication with a device on the network outside the router as viewed from the server 100, and the connection with the router cannot be confirmed. Therefore, the failure determination unit 150 determines that a failure has occurred in the communication between the router and the server 100 whose MAC addresses match in step S36. In the configuration of FIG. 2, for example, the transmission path between the server 100 or the switch 401 or between the server 100 and the router 500 is determined as a failure occurrence location. Thereafter, the process proceeds to step S42.

[ステップS42]障害判定部150は、障害推定結果を障害情報に登録する。
以上の処理手順によれば、障害発生箇所が、同一セグメント内のルータ以外の機器であるか、サーバ100とルータとの経路上の機器であるか、ルータより外側のネットワークであるかを、監視対象のコネクション数に関係なく、常に確実に判定することができる。また、この判定結果が登録された障害情報110をネットワーク管理者が参照することで、通信障害を未然に回避するための、あるいは早期に復旧させるための迅速、且つ的確な操作を、ネットワーク管理者の経験に頼ることなく実行できるようになる。また、障害情報110に基づいて、通信障害を自動的に回避させることも可能になる。
[Step S42] The failure determination unit 150 registers the failure estimation result in the failure information.
According to the above processing procedure, it is monitored whether the failure location is a device other than the router in the same segment, a device on the path between the server 100 and the router, or a network outside the router. Regardless of the number of target connections, it can always be determined reliably. In addition, the network administrator refers to the failure information 110 in which the determination result is registered, so that the network administrator can perform a quick and accurate operation for avoiding a communication failure in advance or for quick recovery. Will be able to run without relying on the experience of In addition, it is possible to automatically avoid a communication failure based on the failure information 110.

なお、以上の図18に示した判定手順に対して、上述した従来の判定条件1〜4を併用することで、障害発生箇所をより細かく特定することもできる。たとえば、ステップS37あるいはS41の状態では、判定条件1を適用することで、障害発生箇所がサーバ100自身であるか否かを判別することができる。   Note that, by using the above-described conventional determination conditions 1 to 4 together with the determination procedure shown in FIG. For example, in the state of step S37 or S41, it is possible to determine whether or not the failure occurrence location is the server 100 itself by applying the determination condition 1.

次に、上記実施の形態で用いた障害発生箇所の判定手法を、より大規模なネットワークシステムに適用した場合の例について説明する。
図19は、本発明の別の実施の形態に係るネットワークシステムの構成例である。
Next, an example in which the failure location determination method used in the above embodiment is applied to a larger-scale network system will be described.
FIG. 19 is a configuration example of a network system according to another embodiment of the present invention.

図19では、各種機能および通信路が2重化されたネットワークの例を示している。この例では、インターネット610に、ルータ621,622が接続されている。ルータ621,622には、ファイアウォール631,632が接続されている。ファイアウォール631,632には、スイッチ641,642を介して、Webサーバ701,702が接続されている。Webサーバ701,702には、スイッチ(SW)643,644を介して、アプリケーション(AP)サーバ711,712が接続されている。APサーバ711,712には、スイッチ(SW)645,646を介して、データベース(DB)サーバ721,722が接続されている。   FIG. 19 shows an example of a network in which various functions and communication paths are duplicated. In this example, routers 621 and 622 are connected to the Internet 610. Firewalls 631 and 632 are connected to the routers 621 and 622. Web servers 701 and 702 are connected to the firewalls 631 and 632 via switches 641 and 642, respectively. Application (AP) servers 711 and 712 are connected to the Web servers 701 and 702 via switches (SW) 643 and 644. Database servers (DB) servers 721 and 722 are connected to the AP servers 711 and 712 via switches (SW) 645 and 646.

また、スイッチ641,643,645には、管理サーバ730が接続されている。このネットワークシステムでは、Webサーバ701,702、APサーバ711,712、およびDBサーバ721,722のそれぞれに、上述した判定条件1〜4を利用した従来のネットワーク監視機能が実装されているものとする。そして、各ネットワーク監視機能が検出した障害情報は、管理サーバ730で収集され、管理サーバ730において、収集した障害情報を解析することで、障害箇所を特定できるようになっている。   A management server 730 is connected to the switches 641, 643, 645. In this network system, it is assumed that a conventional network monitoring function using the determination conditions 1 to 4 described above is implemented in each of the Web servers 701 and 702, the AP servers 711 and 712, and the DB servers 721 and 722. . The failure information detected by each network monitoring function is collected by the management server 730, and the failure location can be identified by analyzing the collected failure information in the management server 730.

たとえば、スイッチ643で障害が発生した場合を考える。この場合、Webサーバ701において、スイッチ643を経由した通信路での異常を検出できる。また、APサーバ711も同様に、スイッチ643を経由した通信路での異常を検出できる。さらに、DBサーバ721において、スイッチ645,646を経由した隣接しない通信路での異常を検出できる。各サーバで検出された異常を示す障害情報は、管理サーバ730に通知される。   For example, consider a case where a failure occurs in the switch 643. In this case, the Web server 701 can detect an abnormality in the communication path via the switch 643. Similarly, the AP server 711 can detect an abnormality in the communication path via the switch 643. Further, the DB server 721 can detect an abnormality in a non-adjacent communication path via the switches 645 and 646. Fault information indicating an abnormality detected in each server is notified to the management server 730.

管理サーバ730は、各サーバから通知された障害情報に基づいて、障害箇所を特定する。具体的には、各サーバから収集した障害情報で示される障害発生要素のうち、重複する要素に障害があると判断することができる。この例では、スイッチ643で障害が発生していると判断される。このように、各サーバに従来のネットワーク監視機能を実装することで、的確な障害解析を迅速、且つ的確に行うことが可能となる。   The management server 730 identifies the failure location based on the failure information notified from each server. Specifically, it can be determined that there is a failure in the overlapping elements among the failure occurrence elements indicated by the failure information collected from each server. In this example, it is determined that a failure has occurred in the switch 643. Thus, by implementing the conventional network monitoring function in each server, it is possible to perform accurate failure analysis quickly and accurately.

しかし、このような管理サーバ730を含むシステムにおいて、従来のネットワーク監視機能を実装した場合でも、Webサーバ701とインターネット610との間の通信に障害が発生した場合には、監視対象のコネクション数が少ないときには、障害箇所を細かく特定することはできなかった。たとえば、障害発生箇所が、ファイアウォール631,632であるのか、あるいはルータ621,622の外側のインターネット610上であるのかを判定できないことがある。   However, in a system including such a management server 730, even when the conventional network monitoring function is implemented, if a failure occurs in communication between the Web server 701 and the Internet 610, the number of connections to be monitored is reduced. When there were few, it was not possible to pinpoint the fault. For example, it may not be possible to determine whether the failure location is on the firewall 631 632 or on the Internet 610 outside the routers 621 622.

そこで、本発明を適用したネットワーク監視機能をWebサーバ701に実装する。Webサーバ701は、上記図18に示した手順に従い、スイッチ641または642を通じた通信時に異常を検出したとき、自身が保持しているARPテーブルを参照してルータ621および622のMACアドレスを取得し、異常を検出したコネクションにおける通信相手機器のMACアドレスと比較する。そして、それらのMACアドレスとの比較結果や、ルータ621または622との接続の有無に基づいて、障害発生箇所がWebサーバ701とルータ621または622との間のネットワークか、あるいはルータ621または622より外側のインターネット610であるかを判定する。この判定結果が管理サーバ730に送信されることで、管理サーバ730は、ネットワーク上の障害発生箇所をより正確に特定できるようになる。   Therefore, a network monitoring function to which the present invention is applied is installed in the Web server 701. When the Web server 701 detects an abnormality during communication through the switch 641 or 642 according to the procedure shown in FIG. 18, the Web server 701 refers to the ARP table held by itself and acquires the MAC addresses of the routers 621 and 622. Compare with the MAC address of the communication partner device in the connection where the abnormality is detected. Based on the comparison result with those MAC addresses and the presence / absence of connection to the router 621 or 622, the location of the failure is the network between the Web server 701 and the router 621 or 622, or the router 621 or 622. It is determined whether the Internet 610 is outside. By transmitting the determination result to the management server 730, the management server 730 can more accurately identify the location where the failure has occurred on the network.

なお、上述したネットワーク監視部や管理サーバが有すべき機能の処理内容を記述したプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現できる。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD)、磁気テープなどがある。光ディスクには、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。光磁気記録媒体には、MO(Magneto-Optical disk)などがある。   Note that the above processing functions can be realized on a computer by executing on the computer a program that describes the processing contents of the functions that the network monitoring unit and the management server should have. The program describing the processing contents can be recorded on a computer-readable recording medium. Examples of the computer-readable recording medium include a magnetic recording device, an optical disk, a magneto-optical recording medium, and a semiconductor memory. Examples of the magnetic recording device include a hard disk device (HDD), a flexible disk (FD), and a magnetic tape. Examples of the optical disc include a DVD (Digital Versatile Disc), a DVD-RAM (Random Access Memory), a CD-ROM (Compact Disc Read Only Memory), and a CD-R (Recordable) / RW (ReWritable). Magneto-optical recording media include MO (Magneto-Optical disk).

プログラムを流通させる場合には、たとえば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。   When distributing the program, for example, portable recording media such as a DVD and a CD-ROM in which the program is recorded are sold. It is also possible to store the program in a storage device of a server computer and transfer the program from the server computer to another computer via a network.

プログラムを実行するコンピュータは、たとえば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムに従った処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送される毎に、逐次、受け取ったプログラムに従った処理を実行することもできる。   The computer that executes the program stores, for example, the program recorded on the portable recording medium or the program transferred from the server computer in its own storage device. Then, the computer reads the program from its own storage device and executes processing according to the program. The computer can also read the program directly from the portable recording medium and execute processing according to the program. In addition, each time the program is transferred from the server computer, the computer can sequentially execute processing according to the received program.

(付記1) ネットワーク上の障害発生箇所を検出するためのネットワーク監視プログラムにおいて、
コンピュータを、
前記コンピュータが接続された内部ネットワークと外部ネットワークとの間で送受信データを中継するルータの物理アドレスを記憶するアドレス記憶手段、
他の機器との間の通信状況を監視する通信状況監視手段、
前記通信状況監視手段で検出された通信内容から通信の異常を検出する異常検出手段、
前記アドレス記憶手段を参照し、前記異常検出手段で異常が検出された通信相手機器の物理アドレスが、前記アドレス記憶手段に記憶された前記ルータの物理アドレスと一致しないとき、当該ルータ以外の前記内部ネットワークに接続された機器との間の通信において障害が発生したと判定する障害箇所判定手段、
として機能させることを特徴とするネットワーク監視プログラム。
(Supplementary note 1) In a network monitoring program for detecting a fault occurrence location on a network,
Computer
Address storage means for storing a physical address of a router that relays transmission / reception data between an internal network to which the computer is connected and an external network;
Communication status monitoring means for monitoring the communication status with other devices;
An anomaly detection means for detecting an anomaly in communication from the communication content detected by the communication status monitoring means;
When the physical address of the communication counterpart device in which the abnormality is detected by the abnormality detection unit does not match the physical address of the router stored in the address storage unit with reference to the address storage unit, the internal device other than the router Failure location determination means for determining that a failure has occurred in communication with a device connected to the network;
Network monitoring program characterized by functioning as

(付記2) 前記障害箇所判定手段は、異常が検出された通信相手機器の物理アドレスが前記アドレス記憶手段に記憶された前記ルータの物理アドレスと一致したとき、当該ルータとの接続を確認し、接続が確認された場合には、当該ルータに接続された前記外部ネットワークにおいて通信の障害が発生したと判定し、接続が確認されなかった場合には、前記内部ネットワークを通じた当該ルータとの間の通信において障害が発生したと判定することを特徴とする付記1記載のネットワーク監視プログラム。   (Additional remark 2) When the physical address of the communication counterpart device in which the abnormality is detected matches the physical address of the router stored in the address storage unit, the failure location determination unit confirms the connection with the router, When the connection is confirmed, it is determined that a communication failure has occurred in the external network connected to the router. When the connection is not confirmed, the communication with the router through the internal network is determined. The network monitoring program according to appendix 1, wherein it is determined that a failure has occurred in communication.

(付記3) 前記障害箇所判定手段は、前記ルータとの接続の確認を、当該ルータに対して応答を要求するコマンドを発行し、所定時間以内に当該コマンドに対する応答があったか否かによって判定することを特徴とする付記2記載のネットワーク監視プログラム。   (Additional remark 3) The said fault location determination means issues the command which requests | requires a response with respect to the said router, and confirms the connection confirmation with the said router, and determines whether there was a response with respect to the said command within predetermined time. The network monitoring program according to supplementary note 2, characterized by:

(付記4) 前記異常検出手段は、前記通信状況監視手段で検出された通信内容のうち、トランスポート層に対応する送受信パケットのヘッダの内容から、通信の異常を検出することを特徴とする付記1記載のネットワーク監視プログラム。   (Additional remark 4) The said abnormality detection means detects communication abnormality from the content of the header of the transmission / reception packet corresponding to a transport layer among the communication contents detected by the said communication condition monitoring means. 1. The network monitoring program according to 1.

(付記5) 前記異常検出手段は、前記通信状況監視手段で検出された通信内容のうち、再送パケットの有無、重複受信パケットの有無、送信データの欠落の有無、および、自装置側または相手装置側の応答遅延の有無の少なくとも1つから、通信の異常を検出することを特徴とする付記4記載のネットワーク監視プログラム。   (Additional remark 5) The said abnormality detection means is the presence or absence of a retransmission packet, the presence or absence of a duplicate received packet, the presence or absence of a lack of transmission data among the communication contents detected by the said communication condition monitoring means, and the own apparatus side or a partner apparatus The network monitoring program according to appendix 4, wherein a communication abnormality is detected from at least one of the presence or absence of a response delay on the side.

(付記6) 前記通信状況監視手段は、新たなコネクションの確立毎に、トランスポート層に対応する送受信パケットのヘッダから抽出した情報を、当該通信相手機器の前記内部ネットワーク上におけるネットワークアドレス、および当該通信相手機器の物理アドレスとともにコネクション管理テーブルとして記憶し、
前記異常検出手段は、前記コネクション管理テーブルから通信の異常を検出することを特徴とする付記4記載のネットワーク監視プログラム。
(Additional remark 6) The said communication condition monitoring means is the network address on the said internal network of the said communicating party apparatus, and the said information extracted from the header of the transmission / reception packet corresponding to a transport layer every time a new connection is established, and the said Store it as a connection management table together with the physical address of the communication partner device,
The network monitoring program according to appendix 4, wherein the abnormality detecting means detects a communication abnormality from the connection management table.

(付記7) 前記アドレス記憶手段は、前記コンピュータと通信を行った通信相手機器の前記内部ネットワークにおけるネットワークアドレスと、当該通信相手機器の物理アドレスとを対応づけたアドレステーブルを記憶することを特徴とする付記1記載のネットワーク監視プログラム。   (Additional remark 7) The said address memory | storage means memorize | stores the address table which matched the network address in the said internal network of the communicating party apparatus which communicated with the said computer, and the physical address of the said communicating party apparatus, It is characterized by the above-mentioned. The network monitoring program according to appendix 1.

(付記8) 前記コンピュータが前記内部ネットワークを通じて通信するときに、通信相手機器の前記内部ネットワークにおける前記ネットワークアドレスをセットしたアドレス要求パケットを前記内部ネットワーク上にブロードキャストし、その応答パケットから当該通信相手機器の物理アドレスを取得して、前記アドレステーブルに格納するアドレス取得手段をさらに有することを特徴とする付記7記載のネットワーク監視プログラム。   (Appendix 8) When the computer communicates through the internal network, an address request packet in which the network address of the communication partner device in the internal network is set is broadcast on the internal network, and the communication partner device is transmitted from the response packet. The network monitoring program according to claim 7, further comprising: an address acquisition unit that acquires the physical address of the address and stores the acquired physical address in the address table.

(付記9) 前記障害箇所判定手段は、前記異常検出手段で異常が検出されると、前記コンピュータが前記内部ネットワークを通じて他の機器と通信するための経路情報から前記ルータの前記内部ネットワークにおけるネットワークアドレスを抽出し、当該ネットワークアドレスに対応する物理アドレスを前記アドレステーブルから抽出して、抽出した物理アドレスと、異常が検出された通信相手機器の物理アドレスとの比較結果から障害発生箇所を判定することを特徴とする付記7記載のネットワーク監視プログラム。   (Supplementary Note 9) When an abnormality is detected by the abnormality detection unit, the failure location determination unit determines a network address in the internal network of the router from path information for the computer to communicate with another device through the internal network. The physical address corresponding to the network address is extracted from the address table, and the failure location is determined from the comparison result between the extracted physical address and the physical address of the communication counterpart device in which the abnormality is detected. The network monitoring program according to appendix 7, characterized by:

(付記10) 情報処理装置に接続されたネットワーク上の障害発生箇所を検出するためのネットワーク監視方法において、
アドレス記憶手段が、前記情報処理装置が接続された内部ネットワークと外部ネットワークとの間で送受信データを中継するルータの物理アドレスを記憶し、
通信状況監視手段が、他の機器との間の通信状況を監視し、
異常検出手段が、前記通信状況監視手段で検出された通信内容から通信の異常を検出し、
障害箇所判定手段が、前記アドレス記憶手段を参照し、前記異常検出手段で異常が検出された通信相手機器の物理アドレスが、前記アドレス記憶手段に記憶された前記ルータの物理アドレスと一致しないとき、当該ルータ以外の前記内部ネットワークに接続された機器との間の通信において障害が発生したと判定する、
ことを特徴とするネットワーク監視方法。
(Supplementary Note 10) In a network monitoring method for detecting a failure occurrence location on a network connected to an information processing device,
Address storage means stores a physical address of a router that relays transmission / reception data between an internal network to which the information processing apparatus is connected and an external network;
The communication status monitoring means monitors the communication status with other devices,
The abnormality detection means detects a communication abnormality from the communication content detected by the communication status monitoring means,
When the failure location determination means refers to the address storage means, and the physical address of the communication counterpart device whose abnormality is detected by the abnormality detection means does not match the physical address of the router stored in the address storage means, Determining that a failure has occurred in communication with a device connected to the internal network other than the router;
A network monitoring method characterized by the above.

(付記11) ネットワーク上の障害発生箇所を検出するためのネットワーク監視装置において、
前記ネットワーク監視装置が接続された内部ネットワークと外部ネットワークとの間で送受信データを中継するルータの物理アドレスを記憶するアドレス記憶手段と、
他の機器との間の通信状況を監視する通信状況監視手段と、
前記通信状況監視手段で検出された通信内容から通信の異常を検出する異常検出手段と、
前記アドレス記憶手段を参照し、前記異常検出手段で異常が検出された通信相手機器の物理アドレスが、前記アドレス記憶手段に記憶された前記ルータの物理アドレスと一致しないとき、当該ルータ以外の前記内部ネットワークに接続された機器との間の通信において障害が発生したと判定する障害箇所判定手段と、
を有することを特徴とするネットワーク監視装置。
(Additional remark 11) In the network monitoring apparatus for detecting the failure location on the network,
Address storage means for storing a physical address of a router that relays transmission / reception data between an internal network and an external network to which the network monitoring device is connected;
Communication status monitoring means for monitoring the communication status with other devices;
An anomaly detection means for detecting an anomaly in communication from the communication content detected by the communication status monitoring means;
When the physical address of the communication counterpart device in which the abnormality is detected by the abnormality detection unit does not match the physical address of the router stored in the address storage unit with reference to the address storage unit, the internal device other than the router A failure location determination means for determining that a failure has occurred in communication with a device connected to the network;
A network monitoring apparatus comprising:

本発明に係るネットワーク監視機能の概要を説明するための図である。It is a figure for demonstrating the outline | summary of the network monitoring function which concerns on this invention. 本発明の実施の形態に係るネットワークシステムの構成例を示す図である。It is a figure which shows the structural example of the network system which concerns on embodiment of this invention. ネットワーク監視機能が搭載されたサーバのハードウェア構成例を示す図である。It is a figure which shows the hardware structural example of the server by which the network monitoring function is mounted. ネットワーク監視機能が実装されたサーバのソフトウェア構成例を示す図である。It is a figure which shows the software structural example of the server by which the network monitoring function was mounted. ARPテーブルに記憶された情報の例を示す図である。It is a figure which shows the example of the information memorize | stored in the ARP table. ルーティングテーブルに記憶された情報の例を示す図である。It is a figure which shows the example of the information memorize | stored in the routing table. ネットワーク監視部の機能を示すブロック図である。It is a block diagram which shows the function of a network monitoring part. トラブル予兆推定例を示す図である。It is a figure which shows the trouble sign estimation example. ネットワーク監視処理手順を示すフローチャートである。It is a flowchart which shows a network monitoring process procedure. ヘッダ情報解析処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of a header information analysis process. コネクション上での通信例を示す図である。It is a figure which shows the example of communication on a connection. Webサーバ側のパケットの内容を示す図である。It is a figure which shows the content of the packet by the side of a Web server. コネクション管理テーブルのデータ構造例を示す図である。It is a figure which shows the example of a data structure of a connection management table. 送信監視テーブルのデータ構造例を示す図である。It is a figure which shows the example of a data structure of a transmission monitoring table. 受信監視テーブルのデータ構造例を示す図である。It is a figure which shows the example of a data structure of a reception monitoring table. 送信監視テーブルと受信監視テーブルとの状態遷移を示す第1の図である。It is a 1st figure which shows the state transition of a transmission monitoring table and a reception monitoring table. 送信監視テーブルと受信監視テーブルとの状態遷移を示す第2の図である。It is a 2nd figure which shows the state transition of a transmission monitoring table and a reception monitoring table. 本実施の形態で適用される障害箇所判定処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the fault location determination process applied in this Embodiment. 本発明の別の実施の形態に係るネットワークシステムの構成例である。It is a structural example of the network system which concerns on another embodiment of this invention.

符号の説明Explanation of symbols

1 自装置
2,3 相手装置
11 アプリケーション
12 通信手段
13 通信インタフェース
14 アドレス記憶手段
15 物理アドレス取得手段
16 通信状況監視手段
17 異常検出手段
18 障害箇所判定手段
19 障害情報出力手段
19a 障害情報
21,22 ネットワーク
30 ルータ
DESCRIPTION OF SYMBOLS 1 Self-device 2, 3 Counterpart device 11 Application 12 Communication means 13 Communication interface 14 Address storage means 15 Physical address acquisition means 16 Communication status monitoring means 17 Abnormality detection means 18 Fault location judgment means 19 Fault information output means 19a Fault information 21, 22 Network 30 router

Claims (5)

ネットワーク上の障害発生箇所を検出するためのネットワーク監視プログラムにおいて、
コンピュータを、
前記コンピュータが接続された内部ネットワークと外部ネットワークとの間で送受信データを中継するルータの物理アドレスを記憶するアドレス記憶手段、
他の機器との間の通信状況を監視する通信状況監視手段、
前記通信状況監視手段で検出された通信内容から通信の異常を検出する異常検出手段、
前記アドレス記憶手段を参照し、前記異常検出手段で異常が検出された通信相手機器の物理アドレスが、前記アドレス記憶手段に記憶された前記ルータの物理アドレスと一致しないとき、当該ルータ以外の前記内部ネットワークに接続された機器との間の通信において障害が発生したと判定する障害箇所判定手段、
として機能させることを特徴とするネットワーク監視プログラム。
In a network monitoring program for detecting fault locations on the network,
Computer
Address storage means for storing a physical address of a router that relays transmission / reception data between an internal network to which the computer is connected and an external network;
Communication status monitoring means for monitoring the communication status with other devices;
An anomaly detection means for detecting an anomaly in communication from the communication content detected by the communication status monitoring means;
When the physical address of the communication counterpart device in which the abnormality is detected by the abnormality detection unit does not match the physical address of the router stored in the address storage unit with reference to the address storage unit, the internal device other than the router Failure location determination means for determining that a failure has occurred in communication with a device connected to the network;
Network monitoring program characterized by functioning as
前記障害箇所判定手段は、異常が検出された通信相手機器の物理アドレスが前記アドレス記憶手段に記憶された前記ルータの物理アドレスと一致したとき、当該ルータとの接続を確認し、接続が確認された場合には、当該ルータに接続された前記外部ネットワークにおいて通信の障害が発生したと判定し、接続が確認されなかった場合には、前記内部ネットワークを通じた当該ルータとの間の通信において障害が発生したと判定することを特徴とする請求項1記載のネットワーク監視プログラム。   When the physical address of the communication partner device in which the abnormality is detected matches the physical address of the router stored in the address storage unit, the failure location determination unit confirms the connection with the router and the connection is confirmed. If a communication failure has occurred in the external network connected to the router and the connection has not been confirmed, a failure has occurred in communication with the router through the internal network. The network monitoring program according to claim 1, wherein the network monitoring program is determined to have occurred. 前記異常検出手段は、前記通信状況監視手段で検出された通信内容のうち、トランスポート層に対応する送受信パケットのヘッダの内容から、通信の異常を検出することを特徴とする請求項1記載のネットワーク監視プログラム。   The abnormality detection unit detects a communication abnormality from the content of a header of a transmission / reception packet corresponding to a transport layer among communication contents detected by the communication status monitoring unit. Network monitoring program. 情報処理装置に接続されたネットワーク上の障害発生箇所を検出するためのネットワーク監視方法において、
アドレス記憶手段が、前記情報処理装置が接続された内部ネットワークと外部ネットワークとの間で送受信データを中継するルータの物理アドレスを記憶し、
通信状況監視手段が、他の機器との間の通信状況を監視し、
異常検出手段が、前記通信状況監視手段で検出された通信内容から通信の異常を検出し、
障害箇所判定手段が、前記アドレス記憶手段を参照し、前記異常検出手段で異常が検出された通信相手機器の物理アドレスが、前記アドレス記憶手段に記憶された前記ルータの物理アドレスと一致しないとき、当該ルータ以外の前記内部ネットワークに接続された機器との間の通信において障害が発生したと判定する、
ことを特徴とするネットワーク監視方法。
In a network monitoring method for detecting a fault occurrence location on a network connected to an information processing device,
Address storage means stores a physical address of a router that relays transmission / reception data between an internal network to which the information processing apparatus is connected and an external network;
The communication status monitoring means monitors the communication status with other devices,
The abnormality detection means detects a communication abnormality from the communication content detected by the communication status monitoring means,
When the failure location determination means refers to the address storage means, and the physical address of the communication counterpart device whose abnormality is detected by the abnormality detection means does not match the physical address of the router stored in the address storage means, Determining that a failure has occurred in communication with a device connected to the internal network other than the router;
A network monitoring method characterized by the above.
ネットワーク上の障害発生箇所を検出するためのネットワーク監視装置において、
前記ネットワーク監視装置が接続された内部ネットワークと外部ネットワークとの間で送受信データを中継するルータの物理アドレスを記憶するアドレス記憶手段と、
他の機器との間の通信状況を監視する通信状況監視手段と、
前記通信状況監視手段で検出された通信内容から通信の異常を検出する異常検出手段と、
前記アドレス記憶手段を参照し、前記異常検出手段で異常が検出された通信相手機器の物理アドレスが、前記アドレス記憶手段に記憶された前記ルータの物理アドレスと一致しないとき、当該ルータ以外の前記内部ネットワークに接続された機器との間の通信において障害が発生したと判定する障害箇所判定手段と、
を有することを特徴とするネットワーク監視装置。
In a network monitoring device for detecting fault locations on the network,
Address storage means for storing a physical address of a router that relays transmission / reception data between an internal network and an external network to which the network monitoring device is connected;
Communication status monitoring means for monitoring the communication status with other devices;
An anomaly detection means for detecting an anomaly in communication from the communication content detected by the communication status monitoring means;
When the physical address of the communication counterpart device in which the abnormality is detected by the abnormality detection unit does not match the physical address of the router stored in the address storage unit with reference to the address storage unit, the internal device other than the router A failure location determination means for determining that a failure has occurred in communication with a device connected to the network;
A network monitoring apparatus comprising:
JP2006096632A 2006-03-31 2006-03-31 Network monitoring program, network monitoring method, and network monitoring apparatus Expired - Fee Related JP4570582B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006096632A JP4570582B2 (en) 2006-03-31 2006-03-31 Network monitoring program, network monitoring method, and network monitoring apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006096632A JP4570582B2 (en) 2006-03-31 2006-03-31 Network monitoring program, network monitoring method, and network monitoring apparatus

Publications (2)

Publication Number Publication Date
JP2007274282A true JP2007274282A (en) 2007-10-18
JP4570582B2 JP4570582B2 (en) 2010-10-27

Family

ID=38676626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006096632A Expired - Fee Related JP4570582B2 (en) 2006-03-31 2006-03-31 Network monitoring program, network monitoring method, and network monitoring apparatus

Country Status (1)

Country Link
JP (1) JP4570582B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010119053A (en) * 2008-11-14 2010-05-27 Fujitsu Ltd Non-communication detection apparatus, method and program
JP4570582B2 (en) * 2006-03-31 2010-10-27 富士通株式会社 Network monitoring program, network monitoring method, and network monitoring apparatus
JP2014155072A (en) * 2013-02-08 2014-08-25 Canon Inc Communication device, control method therefor and program
JP2014179791A (en) * 2013-03-14 2014-09-25 Fujitsu Telecom Networks Ltd Transmission system and transmitter and transmission quality detection method
JP2016503602A (en) * 2012-10-31 2016-02-04 中興通訊股▲ふん▼有限公司 Method and apparatus for evaluating wireless network capillary performance
JP2017108470A (en) * 2017-03-24 2017-06-15 キヤノン株式会社 Communication device, control method therefor and program

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004336618A (en) * 2003-05-12 2004-11-25 Sony Corp System and method for inter-apparatus authentication, communication equipment, and computer program
JP2005167347A (en) * 2003-11-28 2005-06-23 Fujitsu Ltd Network monitoring program, network monitoring method, and network monitor

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4570582B2 (en) * 2006-03-31 2010-10-27 富士通株式会社 Network monitoring program, network monitoring method, and network monitoring apparatus

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004336618A (en) * 2003-05-12 2004-11-25 Sony Corp System and method for inter-apparatus authentication, communication equipment, and computer program
JP2005167347A (en) * 2003-11-28 2005-06-23 Fujitsu Ltd Network monitoring program, network monitoring method, and network monitor

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4570582B2 (en) * 2006-03-31 2010-10-27 富士通株式会社 Network monitoring program, network monitoring method, and network monitoring apparatus
JP2010119053A (en) * 2008-11-14 2010-05-27 Fujitsu Ltd Non-communication detection apparatus, method and program
JP2016503602A (en) * 2012-10-31 2016-02-04 中興通訊股▲ふん▼有限公司 Method and apparatus for evaluating wireless network capillary performance
US9544215B2 (en) 2012-10-31 2017-01-10 Zte Corporation Method and apparatus for evaluating performance of wireless network capillary channel
JP2014155072A (en) * 2013-02-08 2014-08-25 Canon Inc Communication device, control method therefor and program
JP2014179791A (en) * 2013-03-14 2014-09-25 Fujitsu Telecom Networks Ltd Transmission system and transmitter and transmission quality detection method
JP2017108470A (en) * 2017-03-24 2017-06-15 キヤノン株式会社 Communication device, control method therefor and program

Also Published As

Publication number Publication date
JP4570582B2 (en) 2010-10-27

Similar Documents

Publication Publication Date Title
JP4255366B2 (en) Network monitoring program, network monitoring method, and network monitoring apparatus
US7936743B2 (en) Method and system for determining a path between two points of an IP network over which datagrams are transmitted
US7743274B2 (en) Administering correlated error logs in a computer system
JP5018663B2 (en) Delay time measuring device, delay time measuring program, and delay time measuring method
CN112866004B (en) Control plane equipment switching method and device and transfer control separation system
JP4371905B2 (en) Unauthorized access detection device, unauthorized access detection method, unauthorized access detection program, and distributed service disablement attack detection device
JP4570582B2 (en) Network monitoring program, network monitoring method, and network monitoring apparatus
JP4516439B2 (en) Relay program, relay method, and relay device
JP5560936B2 (en) Configuration information acquisition method, virtual probe, and configuration information acquisition control device
JP5782925B2 (en) Information processing apparatus, program, and control method
JP5742958B2 (en) Program, information processing apparatus, and route setting method
JP2008217735A (en) Fault analysis system, method and program
JP2008225911A (en) Method for detecting change in it resource configuration
JP2009205364A (en) Life-and-death monitoring method, monitored device, monitor and life-and-death monitoring program
JP3416604B2 (en) Network monitoring equipment
CN100421381C (en) Method and device for obtaining information of operation and failure state for network equipment
US20080310314A1 (en) Method for Detecting a Message Interface Fault in a Communication Device
JP2006180223A (en) Communication system
US20060039288A1 (en) Network status monitoring and warning method
CA2402872A1 (en) Non-fault tolerant network nodes in a multiple fault tolerant network
US20180102835A1 (en) Transmission device and network system
AU2001249114A1 (en) Non-fault tolerant network nodes in a multiple fault tolerant network
CN115426250B (en) Dual-machine hot standby switching method and device for target range command
JP2751861B2 (en) Network system fault detection processing circuit
JP7119957B2 (en) Switch device and failure detection program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100518

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100810

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100810

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130820

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4570582

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees