JP5177246B2 - Network failure detection apparatus and network failure detection method - Google Patents

Network failure detection apparatus and network failure detection method Download PDF

Info

Publication number
JP5177246B2
JP5177246B2 JP2011034366A JP2011034366A JP5177246B2 JP 5177246 B2 JP5177246 B2 JP 5177246B2 JP 2011034366 A JP2011034366 A JP 2011034366A JP 2011034366 A JP2011034366 A JP 2011034366A JP 5177246 B2 JP5177246 B2 JP 5177246B2
Authority
JP
Japan
Prior art keywords
loop
switch
communication
port
failure detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011034366A
Other languages
Japanese (ja)
Other versions
JP2011130493A (en
Inventor
武 安家
祐士 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2011034366A priority Critical patent/JP5177246B2/en
Publication of JP2011130493A publication Critical patent/JP2011130493A/en
Application granted granted Critical
Publication of JP5177246B2 publication Critical patent/JP5177246B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Small-Scale Networks (AREA)

Description

本発明は,ネットワーク上で発生する障害を検出するネットワーク障害検出装置及びネットワーク障害検出方法に関し,特に,ネットワークを構成する中継装置で発生する障害であるレイヤ2ループを検出するネットワーク障害検出装置及びネットワーク障害検出方法に関する。   The present invention relates to a network failure detection device and a network failure detection method for detecting a failure that occurs on a network, and more particularly to a network failure detection device and a network for detecting a layer 2 loop that is a failure that occurs in a relay device that constitutes a network. The present invention relates to a failure detection method.

LANなどのネットワークを構成するレイヤ2(L2)スイッチと呼ばれる中継装置は,ネットワークの中継装置の一つで,OSI参照モデルのデータリンク層(第2層)のデータでパケットの行き先を判断して転送を行なう機能を有する。データリンク層のプロトコルには,Ethernet(登録商標)などにおけるMAC (メディアアクセス制御)があり,MACアドレスを見てデータの行き先を決定するEthernet(登録商標)の中継装置はスイッチングハブとも呼ばれる。IPやTCP,HTTPなどのプロトコルはネットワーク層(第3層)以上に位置するため,レイヤ2スイッチは第3層以上のプロトコルが異なる場合であってもパケットの転送が可能である。   A relay device called a layer 2 (L2) switch that constitutes a network such as a LAN is one of the network relay devices, and determines the destination of a packet from data in the data link layer (second layer) of the OSI reference model. It has a function to perform transfer. The data link layer protocol includes MAC (Media Access Control) in Ethernet (registered trademark) and the like, and the Ethernet (registered trademark) relay device that determines the destination of data by looking at the MAC address is also called a switching hub. Since protocols such as IP, TCP, and HTTP are located above the network layer (third layer), the layer 2 switch can transfer packets even when the protocols of the third layer and higher are different.

複数の端末がレイヤ2スイッチにより接続されるネットワークにおいては,ケーブルの誤接続やレイヤ2スイッチの故障などにより,ネットワーク全域において,レイヤ2ループと呼ばれる障害が発生する。レイヤ2ループの発生により,ネットワーク全域において,端末の高負荷状態を招き,また,ネットワーク通信不能状態に陥る。   In a network in which a plurality of terminals are connected by a layer 2 switch, a failure called a layer 2 loop occurs in the entire network due to an erroneous connection of a cable or a failure of a layer 2 switch. Due to the occurrence of the layer 2 loop, the high load state of the terminal is caused in the entire network, and the network communication is disabled.

図1乃至図3は,レイヤ2ループによるネットワーク障害を説明する図である。図1において,ネットワークは,レイヤ2スイッチ(以下,「スイッチ」と称す)SW1の配下にスイッチSW2,SW3,SW4が接続され,スイッチSW2,SW3,SW4の配下にそれぞれスイッチSW5,SW6,SW7が接続し,スイッチSW5,SW6,SW7にそれぞれ端末Y1,Y2,Xが接続して構成される。そして,スイッチSW2におけるケーブル誤接続により,スイッチSW2はループ接続され,ここでレイヤ2ループが発生するものとする。   1 to 3 are diagrams for explaining a network failure due to a layer 2 loop. In FIG. 1, the network includes switches SW2, SW3, and SW4 connected under the layer 2 switch (hereinafter referred to as “switch”) SW1, and switches SW5, SW6, and SW7 under the switches SW2, SW3, and SW4, respectively. The terminals Y1, Y2, and X are connected to the switches SW5, SW6, and SW7, respectively. Then, it is assumed that the switch SW2 is loop-connected due to a cable misconnection in the switch SW2, and a layer 2 loop is generated here.

端末Xがブロードキャストパケットを送信する場合を例について説明する。端末Xからブロードキャストパケットが送信されると,ブロードキャストパケットは,スイッチSW7,SW4,SW1を経由して,L2ループが発生しているスイッチSW2に到達する。ブロードキャストパケットは,スイッチSW2でループを周回するたびに,ネットワーク(サブネット)全域に送出される。ループ周回は,ワイヤースピードで行われるため,結果として,スイッチSW2からネットワーク全域にワイヤースピードでブロードキャストパケットが送出され続け(ブロードキャストストームと呼ばれる),ネットワーク内の端末は高負荷状態となってしまう。   An example where terminal X transmits a broadcast packet will be described. When a broadcast packet is transmitted from the terminal X, the broadcast packet reaches the switch SW2 where the L2 loop is generated via the switches SW7, SW4, and SW1. The broadcast packet is sent to the entire network (subnet) every time it circulates in the loop with the switch SW2. Since loop wrapping is performed at wire speed, as a result, broadcast packets continue to be transmitted from the switch SW2 to the entire network at wire speed (referred to as broadcast storm), and terminals in the network are in a high load state.

また,各スイッチの複数のポートのうちの一つにブロードキャストパケットが入力されると,スイッチは,そのブロードキャストパケットに含まれる発信元端末のMACアドレスを記憶するとともに,ブロードキャストパケットの発信端末が存在する方向をその入力ポートの方向であると認識する(以下,これを「アドレスを学習する」と表現する場合がある)するため,上記ブロードキャストストームにより,発信元端末のアドレスを誤学習するスイッチが現れる。すなわち,各スイッチは,ブロードキャストパケットの発信元アドレスがL2ループ発生箇所(スイッチSW2)の方向にあると認識するため,端末XとL2ループ発生箇所間の経路上の各スイッチにおいて,発信元端末のアドレスの誤学習が発生する。具体的には,L2ループが発生しているスイッチSW2にあたかもブロードキャストパケットを送出した端末Xの虚像があるように端末Xがアドレスを学習するため,図中,端末XとL2ループ発生箇所間の経路上にあるスイッチSW7,SW4,SW1,SW2において,端末Xのアドレスを誤学習する。このように,L2ループが発生している状態で,端末からブロードキャストパケットが送信されると,その端末とL2ループが発生している箇所までの経路上のスイッチは,その端末のアドレスを誤学習する。   When a broadcast packet is input to one of the ports of each switch, the switch stores the MAC address of the source terminal included in the broadcast packet, and there is a source terminal for the broadcast packet. In order to recognize the direction as the direction of the input port (hereinafter, this may be expressed as “learning the address”), a switch that mislearns the address of the source terminal appears by the broadcast storm. . In other words, each switch recognizes that the source address of the broadcast packet is in the direction of the L2 loop occurrence point (switch SW2), and therefore, in each switch on the route between the terminal X and the L2 loop occurrence point, Incorrect address learning occurs. Specifically, since the terminal X learns the address as if there is a virtual image of the terminal X that sent the broadcast packet to the switch SW2 where the L2 loop has occurred, in the figure, between the terminal X and the location where the L2 loop occurred In the switches SW7, SW4, SW1, and SW2 on the route, the address of the terminal X is erroneously learned. In this way, when a broadcast packet is transmitted from a terminal while an L2 loop is occurring, the switch on the route to the location where the terminal and the L2 loop are generated mislearns the address of the terminal. To do.

スイッチSW3,SW5,SW6については,実在の端末Xからパケットが送信された場合とL2ループ発生箇所からパケットが送信された場合におけるパケット受信方向が一致するため,結果的に誤学習しなかったに過ぎない。   For switches SW3, SW5, and SW6, the packet reception direction when the packet was transmitted from the actual terminal X and that when the packet was transmitted from the location where the L2 loop occurred matched, and as a result, there was no mislearning Not too much.

上述のように端末Xのアドレスが誤学習された状態において,図2に示すように,端末Y1が端末X宛てにユニキャストパケットを送信する。ユニキャストパケットは,スイッチSW5を経由してスイッチSW2に到達する。スイッチSW2は,端末Xのアドレスを誤学習しており,ユニキャストパケットは,スイッチSW2で発生しているL2ループ内を周回し続け,端末Xまで到達せず,端末Xとの通信が不能となる。また,スイッチSW2は,あたかもL2ループ内に端末Y1が存在するかのように,端末Y1のアドレスを誤学習してしまう。このように,L2ループ発生箇所に到達するように誤学習されたアドレスへユニキャストパケットが送信されると,L2ループ発生スイッチSW2において,ユニキャストパケットの発信元端末のアドレスは,L2ループ方向に誤学習される。なお,他のスイッチSW5は,端末Y1のアドレスを正常に学習する。   In the state where the address of the terminal X is erroneously learned as described above, the terminal Y1 transmits a unicast packet to the terminal X as shown in FIG. The unicast packet reaches the switch SW2 via the switch SW5. Switch SW2 mis-learns the address of terminal X, and the unicast packet continues to circulate in the L2 loop generated in switch SW2, does not reach terminal X, and cannot communicate with terminal X. Become. Also, the switch SW2 mislearns the address of the terminal Y1 as if the terminal Y1 exists in the L2 loop. Thus, when a unicast packet is sent to an address that has been mislearned to reach the L2 loop occurrence location, the address of the source terminal of the unicast packet is set in the L2 loop direction at the L2 loop generation switch SW2. Mislearned. The other switch SW5 normally learns the address of the terminal Y1.

同様に,端末Xのアドレスが上述のように誤学習された状態において,図3に示すように,端末Y2が端末X宛てにユニキャストパケットを送信する。ユニキャストパケットは,スイッチSW6,SW3,SW1を経由してスイッチSW2に到達する。スイッチSW2は,端末Xのアドレスを誤学習しており,ユニキャストパケットは,スイッチSW2で発生しているL2ループ内を周回し続け,端末Xまで到達せず,端末Xとの通信が不能となる。また,スイッチSW2は,あたかもL2ループ内に端末Y2が存在するかのように,端末Y2のアドレスを誤学習してしまう。なお,他のスイッチSW6,SW3,SW1は,端末Y2のアドレスを正常に学習する。   Similarly, in a state where the address of the terminal X is mislearned as described above, the terminal Y2 transmits a unicast packet to the terminal X as shown in FIG. The unicast packet reaches the switch SW2 via the switches SW6, SW3, and SW1. Switch SW2 mis-learns the address of terminal X, and the unicast packet continues to circulate in the L2 loop generated in switch SW2, does not reach terminal X, and cannot communicate with terminal X. Become. In addition, the switch SW2 erroneously learns the address of the terminal Y2 as if the terminal Y2 exists in the L2 loop. The other switches SW6, SW3, and SW1 normally learn the address of the terminal Y2.

ネットワーク障害を引き起こすレイヤ2ループを検出する技術として,例えば,下記特許文献1は,受信フレームの解析によりフレームの無限ループを判断し,L2ループを検出する方法について開示している。   As a technique for detecting a layer 2 loop that causes a network failure, for example, Patent Document 1 below discloses a method for determining an infinite loop of a frame by analyzing a received frame and detecting an L2 loop.

特開2001−197114号公報JP 2001-197114 A

L2ループが発生した場合,従来,人手によりレイヤ2スイッチのケーブルの抜き差しを行う,あるいは,被疑スイッチから接続状態に関する情報を取得する手順を繰り返し行うことにより,L2ループ発生箇所を絞りこんでいた。そのため,L2ループ箇所の発見に至るまでに,多くの時間(数時間〜数日)と労力が必要であった。   Conventionally, when an L2 loop occurs, the location of the L2 loop has been narrowed down by manually connecting / disconnecting the cable of the layer 2 switch or repeating the procedure for obtaining information on the connection status from the suspect switch. Therefore, it took a lot of time (several hours to several days) and labor to find the L2 loop.

また,上記特許文献1によれば,ネットワーク(サブネット)内のどこかでL2ループが発生していることは検出することができるが,サブネット内のどこでL2ループが発生しているかまでは特定することができない。   Further, according to the above-mentioned Patent Document 1, it is possible to detect that an L2 loop has occurred somewhere in the network (subnet), but specify where the L2 loop has occurred in the subnet. I can't.

そこで,本発明の目的は,L2ループの発生及びその発生箇所を素早く且つ容易に検出することができるネットワーク障害検出装置及びネットワーク障害検出方法を提供することにある。   Accordingly, an object of the present invention is to provide a network failure detection apparatus and a network failure detection method capable of quickly and easily detecting the occurrence of an L2 loop and the occurrence location thereof.

上記目的を達成するための本発明のネットワーク障害検出装置の第一の構成は,複数の端末のうちの第一の端末であって,各端末は複数の中継装置のうちの少なくとも一つの中継装置を介して別の端末と接続するネットワークの障害を検出するネットワーク障害検出装置において,前記複数の中継装置のうちの第一の中継装置から,前記第一の中継装置の複数のポートそれぞれで受信するデータに関する統計情報を取得する通信部と,前記統計情報に基づいて,前記第一の中継装置で所定のネットワーク障害を引き起こすループが発生しているか否か,又は当該ループが発生している別の中継装置の前記第一の中継装置からの方向を判定する判定部とを備えることを特徴とする。   In order to achieve the above object, a first configuration of a network failure detection apparatus of the present invention is a first terminal among a plurality of terminals, each terminal being at least one relay apparatus among a plurality of relay apparatuses. In a network failure detection device for detecting a failure of a network connected to another terminal via a network, reception from each of the plurality of ports of the first relay device from the first relay device of the plurality of relay devices A communication unit that acquires statistical information about data, and whether or not a loop causing a predetermined network failure has occurred in the first relay device based on the statistical information, or another loop in which the loop has occurred And a determination unit that determines a direction of the relay device from the first relay device.

本発明のネットワーク障害検出装置の第二の構成は,上記第一の構成において,前記統計情報は,前記第一の中継装置の各ポートごとの受信データ量又は受信データ数であることを特徴とする。   A second configuration of the network failure detection device according to the present invention is characterized in that, in the first configuration, the statistical information is a received data amount or a received data number for each port of the first relay device. To do.

本発明のネットワーク障害検出装置の第三の構成は,上記第二の構成において,前記判定部が,前記第一の中継装置の複数のポートのうち,単位時間当たりの受信データ量又は受信データ数が所定のしきい値以上であるポートが2つである場合,前記第一の中継装置で前記ループが発生していると判定し,単位時間当たりの受信データ量が所定のしきい値以上であるポートが1つである場合,当該ポートの下流方向に,当該ループが発生している別の中継装置が存在すると判定することを特徴とする。   According to a third configuration of the network failure detection apparatus of the present invention, in the second configuration, the determination unit receives the amount of received data or the number of received data per unit time among the plurality of ports of the first relay apparatus. If there are two ports having a threshold equal to or greater than a predetermined threshold, it is determined that the loop has occurred in the first relay device, and the received data amount per unit time is equal to or greater than the predetermined threshold. When there is one port, it is determined that there is another relay device in which the loop occurs in the downstream direction of the port.

本発明のネットワーク障害検出装置の第四の構成は,上記第三の構成において,前記しきい値が,前記ネットワーク障害検出装置における単位時間当たりの受信データ量又は受信データ数に基づいて設定されることを特徴とする。   According to a fourth configuration of the network failure detection apparatus of the present invention, in the third configuration, the threshold is set based on the amount of received data or the number of received data per unit time in the network failure detection device. It is characterized by that.

本発明のネットワーク障害検出装置の第五の構成は,上記第三の構成において,前記しきい値が,前記第一の中継装置の各ポートの単位時間当たりの受信データ量又は受信データ数のうちの最大値に基づいて設定されることを特徴とする。   According to a fifth configuration of the network failure detection device of the present invention, in the third configuration, the threshold value is a received data amount or a received data number per unit time of each port of the first relay device. It is set based on the maximum value of.

本発明のネットワーク障害検出装置の第六の構成は,上記第一の構成において,前記通信部が,前記統計情報を取得する前に,所定のデータ長を有する所定の要求データを複数ブロードキャスト送信し,当該所定のデータ長は,前記所定の要求データに対する応答データのデータ長よりも長いことを特徴とする。   According to a sixth configuration of the network failure detection apparatus of the present invention, in the first configuration, the communication unit broadcasts a plurality of predetermined request data having a predetermined data length before acquiring the statistical information. The predetermined data length is longer than the data length of response data to the predetermined request data.

本発明のネットワーク障害検出装置の第七の構成は,上記第一の構成において,前記通信部が,第一の中継装置の全てポートのうち,前記ループに関連するインターフェースタイプの複数のポートそれぞれで受信するデータに関する統計情報を取得することを特徴とする。   According to a seventh configuration of the network fault detection apparatus of the present invention, in the first configuration, the communication unit includes a plurality of ports of the interface type related to the loop among all the ports of the first relay device. It is characterized by acquiring statistical information about received data.

本発明のネットワーク障害検出装置の第八の構成は,上記第一の構成において,前記通信部が,前記第一の中継装置における単位時間当たりの受信データ量が所定のしきい値以上であるポートに対して,遮断要求を送信することを特徴とする。   According to an eighth configuration of the network failure detection apparatus of the present invention, in the first configuration, the communication unit is a port whose received data amount per unit time in the first relay device is a predetermined threshold value or more. In response to this, a blocking request is transmitted.

本発明のネットワーク障害検出装置の第九の構成は,上記第一の構成において,前記ネットワーク障害検出装置以外のアドレスを発信元アドレスとする複数のデータをブロードキャスト送信する通信回復処理部を備え,前記通信回復処理部は,前記通信部が前記統計情報を取得する前に,前記複数のデータをブロードキャスト送信することを特徴とする。   According to a ninth configuration of the network failure detection device of the present invention, in the first configuration described above, the network failure detection device includes a communication recovery processing unit that broadcast-transmits a plurality of data having a source address other than the network failure detection device, The communication recovery processing unit broadcasts the plurality of data before the communication unit acquires the statistical information.

本発明のネットワーク障害検出装置の第十の構成は,上記第一の構成において,前記ループ発生時において前記ループ内を周回するデータのデータ長よりも長いデータ長を有する複数のデータをブロードキャスト送信する負荷低減処理部を備え,前記負荷低減処理部は,前記通信部が前記統計情報を取得する前に,前記複数のデータをブロードキャスト送信することを特徴とする。   According to a tenth configuration of the network fault detection apparatus of the present invention, in the first configuration, a plurality of data having a data length longer than a data length of data circulating in the loop is broadcasted when the loop occurs. A load reduction processing unit is provided, and the load reduction processing unit broadcasts the plurality of data before the communication unit acquires the statistical information.

本発明のネットワーク障害検出装置の第十一の構成は,上記第一の構成において,前記ネットワーク障害が,前記ループを周回するデータが前記ループからブロードキャスト送信され続けるレイヤ2ループ障害であることを特徴とする。   According to an eleventh configuration of the network failure detection apparatus of the present invention, in the first configuration, the network failure is a layer 2 loop failure in which data circulating around the loop is continuously transmitted from the loop. And

本発明の第一のネットワーク障害検出方法は,複数の端末のうちの第一の端末により実施され,各端末は複数の中継装置のうちの少なくとも一つの中継装置を介して別の端末と接続するネットワークの障害を検出するネットワーク障害検出方法において,前記複数の中継装置のうちの第一の中継装置から,前記第一の中継装置の複数のポートそれぞれで受信するデータに関する統計情報を取得する取得ステップと,前記統計情報に基づいて,前記第一の中継装置で所定のネットワーク障害を引き起こすループが発生しているか否か,又は当該ループが発生している別の中継装置の前記第一の中継装置からの方向を判定する判定ステップとを備えることを特徴とする。   The first network failure detection method of the present invention is implemented by a first terminal among a plurality of terminals, and each terminal is connected to another terminal via at least one relay apparatus among the plurality of relay apparatuses. In the network failure detection method for detecting a network failure, an acquisition step of acquiring statistical information about data received at each of a plurality of ports of the first relay device from a first relay device of the plurality of relay devices. Whether or not a loop causing a predetermined network failure has occurred in the first relay device based on the statistical information, or the first relay device of another relay device in which the loop has occurred And a determination step of determining a direction from.

本発明の第二のネットワーク障害検出方法は,上記第一の方法において,前記統計情報が,前記第一の中継装置の各ポートごとの受信データ量又は受信データ数であることを特徴とする。   The second network failure detection method of the present invention is characterized in that, in the first method, the statistical information is a received data amount or a received data number for each port of the first relay device.

本発明の第三のネットワーク障害検出方法は,上記第二の方法において,前記判定ステップでは,前記第一の中継装置の複数のポートのうち,単位時間当たりの受信データ量又は受信データ数が所定のしきい値以上であるポートが2つである場合,前記第一の中継装置で前記ループが発生していると判定し,単位時間当たりの受信データ量が所定のしきい値以上であるポートが1つである場合,当該ポートの下流方向に,当該ループが発生している別の中継装置が存在すると判定することを特徴とする。   According to a third network failure detection method of the present invention, in the second method, in the determination step, a reception data amount or a reception data number per unit time is predetermined among the plurality of ports of the first relay device. If there are two ports that are equal to or greater than the threshold value, it is determined that the loop has occurred in the first relay device, and the amount of received data per unit time is equal to or greater than the predetermined threshold value Is one, it is determined that there is another relay apparatus in which the loop is generated in the downstream direction of the port.

本発明の第四のネットワーク障害検出方法は,上記第三の方法において,前記取得ステップの前に,前記ネットワーク障害検出装置における単位時間当たりの受信データ量又は受信データ数に基づいて前記しきい値を設定する設定ステップを備えることを特徴とする。   According to a fourth network failure detection method of the present invention, in the third method, the threshold value is based on the amount of received data or the number of received data per unit time in the network failure detection device before the obtaining step. It is characterized by comprising a setting step for setting.

本発明の第五のネットワーク障害検出方法は,上記第三の方法において,前記判定ステップの前に,前記取得ステップで取得された前記第一の中継装置の各ポートの単位時間当たりの受信データ量又は受信データ数のうちの最大値に基づいて前記しきい値を設定する設定ステップを備えることを特徴とする。   According to a fifth network failure detection method of the present invention, in the third method, the received data amount per unit time of each port of the first relay device acquired in the acquisition step before the determination step. Alternatively, a setting step of setting the threshold value based on a maximum value among the number of received data is provided.

本発明の第六のネットワーク障害検出方法は,上記第一の方法において,前記取得ステップの前に,所定のデータ長を有する所定の要求データを複数ブロードキャスト送信する送信ステップを備え,当該所定のデータ長は,前記所定の要求データに対する応答データのデータ長よりも長いことを特徴とする。   According to a sixth network failure detection method of the present invention, in the first method, before the obtaining step, a transmission step of broadcasting a plurality of predetermined request data having a predetermined data length is provided, and the predetermined data The length is longer than the data length of response data to the predetermined request data.

本発明の第七のネットワーク障害検出方法は,上記第一の方法において,前記取得ステップでは,第一の中継装置の全てポートのうち,前記ループに関連するインターフェースタイプの複数のポートそれぞれで受信するデータに関する統計情報を取得することを特徴とする。   According to a seventh network failure detection method of the present invention, in the first method, in the acquisition step, reception is performed at each of the plurality of ports of the interface type related to the loop among all the ports of the first relay device. It is characterized by acquiring statistical information about data.

本発明の第八のネットワーク障害検出方法は,上記第一の方法において,前記第一の中継装置における単位時間当たりの受信データ量が所定のしきい値以上であるポートに対して,遮断要求を送信する送信ステップを備えることを特徴とする。   According to an eighth network failure detection method of the present invention, in the first method, a blocking request is made to a port whose received data amount per unit time in the first relay device is a predetermined threshold value or more. A transmission step of transmitting is provided.

本発明の第九のネットワーク障害検出方法は,上記第一の方法において,前記取得ステップの前に,前記第一の端末以外のアドレスを発信元アドレスとする複数のデータをブロードキャスト送信する通信回復処理ステップを備えることを特徴とする。   According to a ninth network failure detection method of the present invention, in the first method, a communication recovery process in which a plurality of data having an address other than the first terminal as a transmission source address is broadcast before the acquisition step. It is characterized by comprising a step.

本発明の第十のネットワーク障害検出方法は,上記第一の方法において,前記取得ステップの前に,前記ループ発生時において前記ループ内を周回するデータのデータ長よりも長いデータ長を有する複数のデータをブロードキャスト送信する負荷低減処理ステップを備えることを特徴とする。   In a tenth network failure detection method of the present invention, in the first method, before the acquisition step, a plurality of data lengths having a data length longer than a data length of data circulating in the loop when the loop occurs A load reduction processing step of broadcasting data is provided.

本発明の第十一のネットワーク障害検出方法は,上記第一の方法において,前記ネットワーク障害が,前記ループを周回するデータが前記ループからブロードキャスト送信され続けるレイヤ2ループ障害であることを特徴とする。   The eleventh network failure detection method of the present invention is characterized in that, in the first method, the network failure is a layer 2 loop failure in which data circulating around the loop is continuously broadcast from the loop. .

本発明によれば,ネットワーク内に障害を引き起こすループの発生及びその発生箇所を検出することができる。   According to the present invention, it is possible to detect the occurrence of a loop that causes a failure in the network and the location of the occurrence.

また,ネットワークを構成する端末の処理によりループを検出することができ,ネットワークを構成する中継装置の処理を必要とせずにループを検出することができる。すなわち,中継装置に新たな機能を実装させるには比較的大きな労力と時間がかかるが,本発明はそれを必要とせず,アプリケーションプログラムをインストールするだけで容易に新たな機能を付加できる端末で実行する処理であるので,端末に本発明の処理を実施するためのアプリケーションプログラムをインストールし,それを実行することで容易,簡便,汎用的に本発明を実現することができる。   In addition, the loop can be detected by the processing of the terminals constituting the network, and the loop can be detected without requiring the processing of the relay device constituting the network. In other words, it takes a relatively large amount of labor and time to implement a new function in the relay device, but the present invention does not require it and can be executed on a terminal that can easily add a new function simply by installing an application program. Therefore, by installing an application program for executing the processing of the present invention on a terminal and executing it, the present invention can be realized easily, simply, and universally.

レイヤ2ループによるネットワーク障害を説明する図である。It is a figure explaining the network failure by a layer 2 loop. レイヤ2ループによるネットワーク障害を説明する図である。It is a figure explaining the network failure by a layer 2 loop. レイヤ2ループによるネットワーク障害を説明する図である。It is a figure explaining the network failure by a layer 2 loop. 本発明の実施の形態におけるネットワーク障害検出装置の原理構成図である。It is a principle block diagram of the network failure detection apparatus in embodiment of this invention. 本発明の実施の形態におけるネットワーク障害検出装置の概略処理フローチャートである。It is a general | schematic process flowchart of the network failure detection apparatus in embodiment of this invention. 本発明の第一の実施の形態例におけるネットワーク障害検出装置の処理フローチャートである。It is a processing flowchart of the network failure detection apparatus in the first embodiment of the present invention. 本発明の第一の実施の形態例の処理を説明する図である。It is a figure explaining the process of the 1st embodiment of this invention. 本発明の第一の実施の形態例の処理を説明する図である。It is a figure explaining the process of the 1st embodiment of this invention. しきい値を動的に設定する第一の方法を示すフローチャートである。It is a flowchart which shows the 1st method of setting a threshold value dynamically. しきい値を動的に設定する第二の方法を説明する図である。It is a figure explaining the 2nd method of setting a threshold dynamically. しきい値を動的に設定する第二の方法を説明する図である。It is a figure explaining the 2nd method of setting a threshold dynamically. 本発明の第二の実施の形態例におけるネットワーク障害検出装置の処理フローチャートである。It is a process flowchart of the network failure detection apparatus in the 2nd embodiment of this invention. 本発明の第二の実施の形態例の処理を説明する図である。It is a figure explaining the process of the 2nd embodiment of this invention. 本発明の第二の実施の形態例の処理を説明する図である。It is a figure explaining the process of the 2nd embodiment of this invention. パケットサイズの大きいブロードキャストリクエストを送信する例を説明する図である。It is a figure explaining the example which transmits the broadcast request with a large packet size. 探索対象スイッチのポートからL2ループに関連するポートを抽出する処理のフローチャートである。It is a flowchart of the process which extracts the port relevant to a L2 loop from the port of a search object switch. 探索対象スイッチのポートからL2ループに関連するポートを抽出する処理を説明する図である。It is a figure explaining the process which extracts the port relevant to a L2 loop from the port of a search object switch. 探索対象スイッチのアドレスを取得するための処理フローチャートである。It is a process flowchart for acquiring the address of a search object switch.

以下,図面を参照して本発明の実施の形態について説明する。しかしながら,かかる実施の形態例が,本発明の技術的範囲を限定するものではない。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. However, this embodiment does not limit the technical scope of the present invention.

ネットワーク障害であるレイヤ2(L2)ループが発生すると,同一ネットワーク(サブネット)内から送出されたブロードキャストパケットは,L2ループを構成する中継装置に到達し,ループを周回するたびに,同一サブネット内全域に送出される。ループ内の周回は,ワイヤースピードで行われるため,結果として,ループを構成する中継装置から同一サブネット内にワイヤースピードでブロードキャストパケットが送出される。このループトラフィックに着目すると,L2ループ発生時は,ループを構成している中継装置がある方向の1ポートから大量にパケットを受信することになる。特に,ループを構成している中継装置では,ループの右回りと左回りが存在するため,2ポートで大量のパケットを受信することになる。   When a layer 2 (L2) loop, which is a network failure, occurs, broadcast packets sent from within the same network (subnet) reach the relay device that makes up the L2 loop, and every time the loop circulates, the entire area within the same subnet Is sent out. Since the loop in the loop is performed at the wire speed, as a result, a broadcast packet is transmitted at the wire speed from the relay apparatus constituting the loop to the same subnet. Paying attention to this loop traffic, when an L2 loop occurs, a large amount of packets are received from one port in the direction of the relay device constituting the loop. In particular, in a relay device that forms a loop, there are clockwise and counterclockwise loops, and a large amount of packets are received by two ports.

そこで,中継装置のポートごとのパケット受信統計情報を取得し,単位時間あたりのパケット受信量が大きいポートを抽出することで,ループ箇所を特定,又はループ箇所の範囲を限定することが可能となる。具体的には,ある中継装置に大量受信ポートが一つある場合,そのポートの下流方向でL2ループが発生している判断することができる。また,ある中継装置に大量受信ポートが二つある場合,その2つのポートでループが構成され,L2ループが発生していると判断することができる。   Therefore, it is possible to specify the loop location or limit the range of the loop location by acquiring the packet reception statistical information for each port of the relay device and extracting the port with a large amount of received packets per unit time. . Specifically, when a certain relay device has one mass reception port, it can be determined that an L2 loop has occurred in the downstream direction of the port. Also, if a relay device has two mass reception ports, it can be determined that a loop is formed by these two ports and an L2 loop has occurred.

図4は,本発明の実施の形態におけるネットワーク障害検出装置の原理構成図である。図4において,ネットワークは,レイヤ2スイッチSW1の配下にレイヤ2スイッチSW2,SW3,SW4が接続され,スイッチSW2,SW3,SW4にそれぞれ端末10,20,30が接続して構成される。端末10がネットワーク障害検出装置であって,ネットワーク障害検出装置の機能として,統計情報取得部11,データ解析部12,通信回復処理部13及び負荷低減処理部14を備える。通信回復処理部13及び負荷低減処理部14の処理については,後述する。図4の例では,スイッチSW2のポート1とポート3でL2ループが発生しており,L2ループよりブロードキャストパケットがワイヤースピードで送出され続け,スイッチSW2では,L2ループを構成するポート1とポート3が大量受信ポートとなり,スイッチSW1,SW3,SW4では,スイッチSW2の方向の各ポート1が大量受信ポートとなる。すなわち,大量受信ポートは,スイッチSW1,SW3,SW4では,一つであり,スイッチSW2では,二つある。   FIG. 4 is a principle configuration diagram of the network failure detection apparatus according to the embodiment of the present invention. In FIG. 4, the network is configured by connecting layer 2 switches SW2, SW3, and SW4 under the layer 2 switch SW1, and connecting terminals 10, 20, and 30 to the switches SW2, SW3, and SW4, respectively. The terminal 10 is a network failure detection device, and includes a statistical information acquisition unit 11, a data analysis unit 12, a communication recovery processing unit 13, and a load reduction processing unit 14 as functions of the network failure detection device. The processing of the communication recovery processing unit 13 and the load reduction processing unit 14 will be described later. In the example of FIG. 4, an L2 loop has occurred at port 1 and port 3 of switch SW2, and broadcast packets continue to be sent out at wire speed from the L2 loop. In switch SW2, port 1 and port 3 that make up the L2 loop Becomes a mass reception port, and in the switches SW1, SW3 and SW4, each port 1 in the direction of the switch SW2 becomes a mass reception port. That is, there is one mass reception port for the switches SW1, SW3, and SW4, and two for the switch SW2.

図5は,本発明の実施の形態におけるネットワーク障害検出装置の概略処理フローチャートである。ネットワーク障害検出装置10の統計情報取得部11は,パケット(データ)の送受信機能を有する通信手段であって,探索対象スイッチに各ポートのパケット受信統計情報の送信を要求する統計情報要求を送信し,探索対象スイッチからの応答である統計情報(パケット受信数情報)を取得する(S10)。このとき,統計情報取得部11は,異なる時刻における2つの統計情報を取得し,それらを差分することにより,各ポートにおける単位時間当たりのパケット受信数を求める。   FIG. 5 is a schematic process flowchart of the network failure detection apparatus according to the embodiment of the present invention. The statistical information acquisition unit 11 of the network failure detection apparatus 10 is a communication means having a packet (data) transmission / reception function, and transmits a statistical information request for requesting transmission of packet reception statistical information of each port to the search target switch. Then, statistical information (packet reception number information) that is a response from the search target switch is acquired (S10). At this time, the statistical information acquisition unit 11 acquires two pieces of statistical information at different times, and obtains the number of packets received per unit time at each port by subtracting them.

データ解析部12は,探索対象スイッチの各ポートの単位時間当たりのパケット受信数を所定のしきい値と比較して,所定のしきい値以上のパケットを受信するポートの数を判定する(S11)。そして,該当ポートの数が2つの場合は,探索対象スイッチでL2ループが発生していると判断し(S12),該当ポートの数が一つの場合は,探索対象スイッチのさらに下流方向でL2ループが発生していると判断する(S13)。また,本発明では該当ポートが0の場合は,L2ループは発生しないと判断する(S14)。なお,本実施の形態例では,ネットワーク(サブネット)内に1つのL2ループが発生する場合を想定しており,この場合,しきい値以上のパケットを受信するポート数の上限は2つである。1つのサブネット内に複数のL2ループが発生する可能性はきわめて低く,L2ループ検出処理において,その可能性を考慮しなくてもよい。   The data analysis unit 12 compares the number of received packets per unit time of each port of the search target switch with a predetermined threshold value, and determines the number of ports that receive packets equal to or greater than the predetermined threshold value (S11). ). If the number of corresponding ports is two, it is determined that an L2 loop has occurred in the search target switch (S12). If the number of corresponding ports is one, the L2 loop further downstream of the search target switch. Is determined to occur (S13). In the present invention, if the corresponding port is 0, it is determined that no L2 loop occurs (S14). In this embodiment, it is assumed that one L2 loop occurs in the network (subnet). In this case, the upper limit of the number of ports that receive packets exceeding the threshold is two. . The possibility that a plurality of L2 loops are generated in one subnet is extremely low, and it is not necessary to consider the possibility in the L2 loop detection process.

なお,統計情報は,各スイッチが保有する自己の管理情報データベース(MIB:Management Information Database)である。MIBは,SNMP(Simple Network Management Protocol)で管理されるネットワーク機器(本実施の形態例における各スイッチ,端末を含む)それぞれの状態を示す情報であり,各ポートで受信するパケット数を有する。なお,MIBは,RFC 1156やRFC 1213で定義されている。以下,本発明の実施の形態例についてさらに詳しく説明する。   The statistical information is a management information database (MIB) owned by each switch. The MIB is information indicating the state of each network device (including each switch and terminal in this embodiment) managed by SNMP (Simple Network Management Protocol), and has the number of packets received at each port. The MIB is defined in RFC 1156 and RFC 1213. Hereinafter, embodiments of the present invention will be described in more detail.

図6は,本発明の第一の実施の形態例におけるネットワーク障害検出装置の処理フローチャートである。第一の形態例では,各ポートで受信するデータ量をあらかじめ設定されたしきい値と比較し,データ量がしきい値以上のポートの数に基づいて,L2ループの発生及びその発生箇所を検出する。   FIG. 6 is a process flowchart of the network failure detection apparatus in the first embodiment of the present invention. In the first example, the amount of data received at each port is compared with a preset threshold value, and the occurrence of the L2 loop and its occurrence location are determined based on the number of ports whose data amount is equal to or greater than the threshold value. To detect.

ステップS100において,パケットの大量受信を判定するためのデータ量のしきい値があらかじめ設定される。統計情報取得部11は,対象探索スイッチに対して,各ポートの受信データ量を有する統計情報の送信を要求し,対象探索スイッチは当該要求に対して,各ポートの受信データ量を有する統計情報を送信し,統計情報取得部11はそれを取得する(S101)。各ポートの受信データ量を有する統計情報は,ifInOctetsMIBである。   In step S100, a threshold for the amount of data for determining whether a large amount of packets are received is set in advance. The statistical information acquisition unit 11 requests the target search switch to transmit statistical information having the received data amount of each port, and the target search switch receives the statistical information having the received data amount of each port in response to the request. And the statistical information acquisition unit 11 acquires it (S101). The statistical information having the received data amount of each port is ifInOctetsMIB.

統計情報取得部11は,1回目の統計情報を取得してから所定期間(例えば,1秒)経過すると(S102),再度,対象探索スイッチに対して,各ポートの受信データ量を有する統計情報の送信を要求し,対象探索スイッチは当該要求に対して,2回目の各ポートの受信データ量を有する統計情報(ifInOctetsMIB)を送信し,統計情報取得部11はそれを取得する(S103)。   When a predetermined period (for example, 1 second) has elapsed after acquiring the first statistical information (S102), the statistical information acquisition unit 11 again receives the statistical information having the received data amount of each port for the target search switch. In response to the request, the target search switch transmits statistical information (ifInOctetsMIB) having the received data amount of each port for the second time, and the statistical information acquisition unit 11 acquires it (S103).

データ解析部12は,2回目の統計情報(増分値)から1回目の統計情報(基準値)を差分することにより,各ポートの単位時間当たりの受信データ量を算出する(S104)。統計情報は,ある時刻でのデータ量であるので,時刻の異なる2つの統計情報の差分により,単位時間当たりの受信データ量を求めることができる。   The data analysis unit 12 calculates the received data amount per unit time of each port by subtracting the first statistical information (reference value) from the second statistical information (increment value) (S104). Since the statistical information is the amount of data at a certain time, the received data amount per unit time can be obtained from the difference between two pieces of statistical information at different times.

データ解析部12は,各ポートの単位時間当たりの受信データ量を,ステップS100で設定したしきい値と比較し,当該しきい値以上のデータ量を受信するポートの数を判定する(S105)。当該ポートの数が一つの場合は,探索対象スイッチのそのポートの下流方向にL2ループがあると判定する(S106)。当該ポートの数が2つの場合は,探索対象スイッチのそのポート対でL2ループが発生していると判断する(S107)。また,当該ポートの数が0の場合は,L2ループは発生していないと判断する(S108)。   The data analysis unit 12 compares the received data amount per unit time of each port with the threshold value set in step S100, and determines the number of ports that receive the data amount equal to or greater than the threshold value (S105). . If the number of ports is one, it is determined that there is an L2 loop in the downstream direction of that port of the search target switch (S106). If the number of ports is two, it is determined that an L2 loop has occurred in the port pair of the search target switch (S107). If the number of ports is 0, it is determined that no L2 loop has occurred (S108).

図7及び図8は,本発明の第一の実施の形態例の処理を説明する図である。図7は,ネットワーク障害検出装置10がスイッチSW1の統計情報を取得する例であり,図8は,ネットワーク障害検出装置10がスイッチSW2の統計情報を取得する例である。L2ループの有無を判定するしきい値は,それぞれ80Mbpsに設定されている。   7 and 8 are diagrams for explaining the processing of the first embodiment of the present invention. FIG. 7 is an example in which the network failure detection device 10 acquires the statistical information of the switch SW1, and FIG. 8 is an example in which the network failure detection device 10 acquires the statistical information of the switch SW2. The thresholds for determining the presence or absence of the L2 loop are each set to 80 Mbps.

図7では,スイッチSW1の各ポート1,2,3における1回目の統計情報(基準値)と2回目の統計情報(増分値)とが取得され,これらの差分値と,単位時間当たりの受信データ量が算出される。図7から明らかなように,しきい値を超えるデータ量を受信するポート数は,1つであり,そのポートはポート1である。従って,ネットワーク障害検出装置10側からスイッチSW1のポート1の下流方向に,L2ループが発生していると判断される。   In FIG. 7, the first statistical information (reference value) and the second statistical information (increment value) at each port 1, 2, and 3 of the switch SW1 are acquired, and the difference value and reception per unit time are obtained. The amount of data is calculated. As is apparent from FIG. 7, the number of ports that receive a data amount exceeding the threshold is one, and that port is port 1. Therefore, it is determined that an L2 loop has occurred in the downstream direction of the port 1 of the switch SW1 from the network failure detection apparatus 10 side.

図8では,同様に,スイッチSW2の各ポート1,2,3における1回目の統計情報(基準値)と2回目の統計情報(増分値)とが取得され,これらの差分値と,単位時間当たりの受信データ量が算出される。図8に示されるように,しきい値を超えるデータ量を受信するポート数は,2つであり,そのポートはポート1とポート3である。従って,スイッチSW2のポート1とポート3でL2ループが発生していると判断される。   In FIG. 8, similarly, the first statistical information (reference value) and the second statistical information (increment value) at each port 1, 2, and 3 of the switch SW2 are acquired, and the difference value and unit time are obtained. The amount of received data per hit is calculated. As shown in FIG. 8, the number of ports that receive the data amount exceeding the threshold is two, and the ports are port 1 and port 3. Therefore, it is determined that an L2 loop has occurred at port 1 and port 3 of switch SW2.

しきい値は,上記図6のステップS100のようにあらかじめ設定されてもよいが,ネットワークの通信状況に応じて動的に設定されてもよい。   The threshold value may be set in advance as in step S100 of FIG. 6, but may be set dynamically according to the communication status of the network.

図9は,しきい値を動的に設定する第一の方法を示すフローチャートである。ネットワーク障害検出装置10は,自己が受信するブロードキャストパケットのデータ量をカウントし,単位時間あたりの受信データ量を計測する(S201)。そして,算出されたデータ量に基づいてしきい値を設定する(202)。例えば,算出された単位時間当たりの受信データ量の一定倍率がしきい値に設定される。具体的には,単位時間当たりの受信データ量が95Mbps,一定倍率が0.8とすると,しきい値は,76Mbpsとなる。   FIG. 9 is a flowchart showing a first method for dynamically setting the threshold value. The network failure detection apparatus 10 counts the data amount of broadcast packets received by itself, and measures the amount of received data per unit time (S201). Then, a threshold value is set based on the calculated data amount (202). For example, a constant magnification of the calculated received data amount per unit time is set as the threshold value. Specifically, if the amount of received data per unit time is 95 Mbps and the constant magnification is 0.8, the threshold value is 76 Mbps.

図10及び図11は,しきい値を動的に設定する第二の方法を説明する図である。第二の方法では,取得した統計情報に含まれる各ポートの受信データ量(又は受信パケット数)のうちの最大値の一定倍率がしきい値に設定される。図10は,スイッチSW1の統計情報及びそれから算出される各ポートの単位時間当たりデータ受信量を示す表である。図10に示されるとおり,単位時間当たりのデータ受信量の最大値は,ポート1の96Mbpsである。一定倍率を0.8とすると,しきい値は,76.8Mbpsとなる。スイッチSW1において,しきい値76.8Mbpsを超えるポートは,ポート1のみであり,図7と同様の判定結果となる。   10 and 11 are diagrams for explaining a second method for dynamically setting the threshold value. In the second method, a constant multiple of the maximum value of the received data amount (or the number of received packets) of each port included in the acquired statistical information is set as the threshold value. FIG. 10 is a table showing the statistical information of the switch SW1 and the data reception amount per unit time calculated from each port. As shown in FIG. 10, the maximum value of the data reception amount per unit time is 96 Mbps of port 1. If the constant magnification is 0.8, the threshold is 76.8Mbps. In the switch SW1, the port exceeding the threshold of 76.8 Mbps is only the port 1, and the determination result is the same as in FIG.

一定倍率を乗じて求められるしきい値には,下限値が設定されてもよい。いずれのポートも大量受信ポートでない場合があり得るからである。算出されたしきい値が下限値を下回る場合は,下限値がしきい値に設定される。図10及び図11の例の場合,下限値は,例えば8Mbpsである。   A lower limit value may be set as a threshold value obtained by multiplying by a constant magnification. This is because none of the ports may be a mass reception port. If the calculated threshold is below the lower limit, the lower limit is set as the threshold. In the example of FIGS. 10 and 11, the lower limit value is, for example, 8 Mbps.

図11は,スイッチSW2の統計情報及びそれから算出される各ポートの単位時間当たりのデータ受信量を示す表である。図11に示されるように,単位時間当たりのデータ受信量の最大値は,ポート1の96Mbpsである。一定倍率を0.8とすると,しきい値は,76.8Mbpsとなる。スイッチSW2において,しきい値76.8Mbpsを超えるポートは,ポート1及びポート3であり,図8と同様の判定結果となる。   FIG. 11 is a table showing the statistical information of the switch SW2 and the data reception amount per unit time of each port calculated from the statistical information. As shown in FIG. 11, the maximum value of the data reception amount per unit time is 96 Mbps of port 1. If the constant magnification is 0.8, the threshold is 76.8Mbps. In the switch SW2, the ports exceeding the threshold of 76.8 Mbps are the port 1 and the port 3, and the determination result is the same as in FIG.

図12は,本発明の第二の実施の形態例におけるネットワーク障害検出装置の処理フローチャートである。第二の形態例では,第一の実施の形態例におけるデータ量に代わって,各ポートで受信するパケット数をあらかじめ設定されたしきい値と比較し,パケット数がしきい値以上のポートの数に基づいて,L2ループの発生及びその発生箇所を検出する。   FIG. 12 is a process flowchart of the network failure detection apparatus according to the second embodiment of the present invention. In the second embodiment, instead of the amount of data in the first embodiment, the number of packets received at each port is compared with a preset threshold value. Based on the number, the occurrence of the L2 loop and its location are detected.

ステップS300において,パケットの大量受信を判定するための受信パケット数のしきい値があらかじめ設定される。統計情報取得部11は,対象探索スイッチに対して,各ポートの受信パケット数を有する統計情報の送信を要求し,対象探索スイッチは当該要求に対して,各ポートの受信パケット数を有する統計情報を送信し,統計情報取得部11はそれを取得する(S301)。各ポートの受信パケット数を有する統計情報は,ifInNUCastPacketsMIBである。   In step S300, a threshold value for the number of received packets for determining whether a large number of packets have been received is set in advance. The statistical information acquisition unit 11 requests the target search switch to transmit statistical information having the number of received packets of each port, and the target search switch has statistical information having the number of received packets of each port in response to the request. And the statistical information acquisition unit 11 acquires it (S301). The statistical information having the number of received packets at each port is ifInNUCastPacketsMIB.

統計情報取得部11は,1回目の統計情報を取得してから所定期間(例えば,1秒)経過すると(S302),再度,対象探索スイッチに対して,各ポートの受信パケット数を有する統計情報の送信を要求し,対象探索スイッチは当該要求に対して,2回目の各ポートの受信パケット数を有する統計情報(ifInNUCastPacketsMIB)を送信し,統計情報取得部11はそれを取得する(S303)。   When a predetermined period (for example, 1 second) has elapsed after acquiring the first statistical information (S302), the statistical information acquisition unit 11 again receives the statistical information having the number of received packets at each port with respect to the target search switch. In response to the request, the target search switch transmits statistical information (ifInNUCastPacketsMIB) having the number of received packets of each port for the second time, and the statistical information acquisition unit 11 acquires it (S303).

データ解析部12は,2回目の統計情報(増分値)から1回目の統計情報(基準値)を差分することにより,各ポートの単位時間当たりの受信パケット数を算出する(S304)。統計情報は,ある時刻での受信パケット数であるので,時刻の異なる2つの統計情報の差分により,単位時間当たりの受信パケット数を求めることができる。   The data analysis unit 12 calculates the number of received packets per unit time of each port by subtracting the first statistical information (reference value) from the second statistical information (increment value) (S304). Since the statistical information is the number of received packets at a certain time, the number of received packets per unit time can be obtained from the difference between two statistical information at different times.

データ解析部12は,各ポートの単位時間当たりの受信パケット数を,ステップS100で設定したしきい値と比較し,当該しきい値以上のパケット数を受信するポートの数を判定する(S305)。当該ポートの数が一つの場合は,探索対象スイッチのそのポートの下流方向にL2ループがあると判定する(S306)。当該ポートの数が2つの場合は,探索対象スイッチのそのポート対でL2ループが発生していると判断する(S307)。また,当該ポートの数が0の場合は,L2ループは発生していないと判断する(S308)。   The data analysis unit 12 compares the number of received packets per unit time of each port with the threshold set in step S100, and determines the number of ports that receive the number of packets equal to or greater than the threshold (S305). . If the number of ports is one, it is determined that there is an L2 loop in the downstream direction of the port of the search target switch (S306). If the number of ports is two, it is determined that an L2 loop has occurred in the port pair of the search target switch (S307). If the number of ports is 0, it is determined that no L2 loop has occurred (S308).

図13及び図14は,本発明の第二の実施の形態例の処理を説明する図である。図13は,ネットワーク障害検出装置10がスイッチSW1の統計情報を取得する例であり,図14は,ネットワーク障害検出装置10がスイッチSW2の統計情報を取得する例である。L2ループの有無を判定するしきい値は,それぞれ8000ppsに設定されている。   13 and 14 are diagrams for explaining the processing of the second embodiment of the present invention. FIG. 13 is an example in which the network failure detection apparatus 10 acquires the statistical information of the switch SW1, and FIG. 14 is an example in which the network failure detection apparatus 10 acquires the statistical information of the switch SW2. The thresholds for determining the presence or absence of the L2 loop are each set to 8000 pps.

図13では,スイッチSW1の各ポート1,2,3における1回目の統計情報(基準値)と2回目の統計情報(増分値)とが取得され,これらの差分値と,単位時間当たりの受信パケット数が算出される。図13に示されるように,しきい値を超えるパケット数を受信するポート数は,1つであり,そのポートはポート1である。従って,ネットワーク障害検出装置10側からスイッチSW1のポート1の下流方向に,L2ループが発生していると判断される。   In FIG. 13, the first statistical information (reference value) and the second statistical information (increment value) at each port 1, 2, and 3 of the switch SW1 are acquired, and these difference values are received per unit time. The number of packets is calculated. As shown in FIG. 13, the number of ports that receive the number of packets exceeding the threshold is one, and that port is port 1. Therefore, it is determined that an L2 loop has occurred in the downstream direction of the port 1 of the switch SW1 from the network failure detection apparatus 10 side.

図14では,同様に,スイッチSW2の各ポート1,2,3における1回目の統計情報(基準値)と2回目の統計情報(増分値)とが取得され,これらの差分値と,単位時間当たりの受信パケット数が算出される。図14に示されるように,しきい値を超えるパケット数を受信するポート数は,2つであり,そのポートはポート1とポート3である。従って,スイッチSW2のポート1とポート3でL2ループが発生していると判断される。   In FIG. 14, similarly, the first statistical information (reference value) and the second statistical information (increment value) at each port 1, 2, and 3 of the switch SW2 are acquired, and the difference value and unit time are obtained. The number of received packets is calculated. As shown in FIG. 14, the number of ports that receive the number of packets exceeding the threshold is two, and the ports are port 1 and port 3. Therefore, it is determined that an L2 loop has occurred at port 1 and port 3 of switch SW2.

第二の実施の形態例においても,パケット数に関するしきい値は,図9,図10(又は図11)に示したように,ネットワークの通信状況に応じて動的に設定されてもよい。例えば,算出された単位時間当たりの受信パケット数が12000pps,一定倍率が0.8とすると,しきい値は,9600ppsとなる。または,しきい値を,各ポートの受信パケット数のうちの最大値に一定倍率を乗じて算出してもよい。   Also in the second embodiment, the threshold regarding the number of packets may be dynamically set according to the communication status of the network, as shown in FIGS. 9 and 10 (or FIG. 11). For example, if the calculated number of received packets per unit time is 12000 pps and the constant magnification is 0.8, the threshold value is 9600 pps. Alternatively, the threshold value may be calculated by multiplying the maximum value of the number of received packets at each port by a fixed magnification.

ところで,L2ループが発生し,L2ループから大量のブロードキャストパケットが送出される場合,そのブロードキャストパケットが宛先からの応答を要求するパケットである場合,ブロードキャストパケットの応答パケットがブロードキャストパケットの送出方向と反対方向に大量に伝送する可能性がある。そうすると,L2ループからのブロードキャストパケットを受信するポートに加えて,応答パケットを受信するポートも大量のパケットを受信することとなり,L2ループの発生箇所又は発生方向を特定できない。   By the way, when an L2 loop occurs and a large number of broadcast packets are sent from the L2 loop, if the broadcast packet is a packet requesting a response from the destination, the response packet of the broadcast packet is opposite to the broadcast packet sending direction. There is a possibility to transmit a large amount in the direction. Then, in addition to the port that receives the broadcast packet from the L2 loop, the port that receives the response packet also receives a large amount of packets, and the location or direction of occurrence of the L2 loop cannot be specified.

この問題を回避するために,ネットワーク障害検出装置10は,例えば,あらかじめ,パケットサイズが大きいブロードキャストリクエストを大量に送信する。なお,このブロードキャストリクエストの応答パケットのサイズが,ブロードキャストリクエストのパケットサイズよりも十分に小さくなるようなブロードキャストリクエストが選択され,送信される。   In order to avoid this problem, for example, the network failure detection apparatus 10 transmits a large number of broadcast requests having a large packet size in advance. A broadcast request is selected and transmitted so that the response packet size of the broadcast request is sufficiently smaller than the packet size of the broadcast request.

図15は,パケットサイズの大きいブロードキャストリクエストを送信する例を説明する図である。アドレス「A」が与えられているネットワーク障害検出装置10は,送信元アドレス「Any」(任意のアドレスであって,存在しない架空のアドレスであってもよい)とし,自己のアドレス「A」を解決するためのブロードキャストARP(Address resolution Protocol)要求をロングサイズ(例えば,1500バイト)で大量(例えば1000個)送信する(Step.1)。ARP要求は,L2ループに達し,それを周回し続けながら(Step.2),L2ループから送出され(Step.3),ネットワーク障害検出装置10に返ってくる。ネットワーク障害検出装置10は,受信したARP要求が自己のアドレスの解決を求めるパケットであるため,ARP要求に対して,アドレス「Any」宛てへARP応答をユニキャスト送信する(Step.4)。このARP応答は,64バイトであり,ARP要求のパケットサイズと比較して1/20であり十分に小さい。ARP応答は,L2ループに達し,周回する。   FIG. 15 is a diagram illustrating an example of transmitting a broadcast request having a large packet size. The network failure detection apparatus 10 to which the address “A” is given has a transmission source address “Any” (which may be an arbitrary address and may be a fictitious address that does not exist), and uses its own address “A”. Broadcast ARP (Address Resolution Protocol) requests for resolution are transmitted in a long size (for example, 1500 bytes) in large quantities (for example, 1000) (Step 1). The ARP request reaches the L2 loop and is sent out from the L2 loop (Step 3) while continuing to circulate around the L2 loop (Step 3), and returns to the network failure detection apparatus 10. Since the received ARP request is a packet for resolving its own address, the network failure detection device 10 unicasts an ARP response to the address “Any” in response to the ARP request (Step 4). This ARP response is 64 bytes, which is 1/20 compared with the packet size of the ARP request, and is sufficiently small. The ARP response reaches the L2 loop and circulates.

このように,L2ループから送出されるパケットのサイズを,L2ループへ向かうパケットのサイズより十分大きくすることで,L2ループから送出されるパケット受信するポートのみを大量受信ポートとして判断することができるようになる。図15では,スイッチSWPのポート1はARP応答を大量受信するポートであるが,ARP応答のサイズが十分に小さいため,大量受信ポートとは判断されず,スイッチSWQのポート1は,パケットサイズの大きいARP要求を大量に受信するポートなので,大量受信ポートと判断される。   In this way, by making the size of the packet sent from the L2 loop sufficiently larger than the size of the packet going to the L2 loop, only the port that receives the packet sent from the L2 loop can be judged as a mass receiving port. It becomes like this. In FIG. 15, port 1 of the switch SWP is a port that receives a large amount of ARP responses, but since the size of the ARP response is sufficiently small, it is not determined as a mass reception port, and port 1 of the switch SWQ has a packet size of Since this is a port that receives a large amount of large ARP requests, it is judged as a mass reception port.

また,ネットワーク障害検出装置は,探索対象スイッチの各ポートのインターフェースをあらかじめ取得し,L2ループに関連するインターフェースのポートのみを探索対象とするようにしてもよい。L2ループは,ethernet(登録商標)で識別できる障害であり,ネットワーク障害検出装置は,ethernet(登録商標)に関連するインターフェースのポートのみから,統計情報を取得する。   In addition, the network failure detection apparatus may acquire the interface of each port of the search target switch in advance and search only the port of the interface related to the L2 loop. The L2 loop is a failure that can be identified by ethernet (registered trademark), and the network failure detection device acquires statistical information only from the port of the interface related to ethernet (registered trademark).

図16は,探索対象スイッチのポートからL2ループに関連するポートを抽出する処理のフローチャートである。また,図17は,当該処理を説明する図である。ネットワーク障害検出装置は,L2ループ検出に利用するポートのインターフェース(IF)タイプ情報のテーブルをあらかじめ保持している(S400)。図17(a)は,当該IFタイプテーブルの例であり,IFタイプテーブルは,ethernet(登録商標)に関連するインターフェースタイプ情報を有する。   FIG. 16 is a flowchart of processing for extracting ports related to the L2 loop from the ports of the search target switch. FIG. 17 is a diagram for explaining the processing. The network failure detection apparatus holds in advance a table of interface (IF) type information of ports used for L2 loop detection (S400). FIG. 17A is an example of the IF type table, and the IF type table includes interface type information related to ethernet (registered trademark).

ネットワーク障害検出装置10は,探索対象スイッチに対して,各ポートのインターフェースの通知要求を送信し,あらかじめ探索対象スイッチから各ポートのインターフェースタイプ情報を取得する(S401)。図17(b)は,取得した各ポート(番号1−10)のインターフェースタイプ情報の例であり,ポート1−6はfastEther,ポート7−8はgigabitEthernet(登録商標),ポート9−10はATM(asynchronous Transfer Mode)である。 探索対象スイッチが送信する各ポートのインターフェースタイプ情報は,例えば,ifTypeMIBである。ネットワーク障害検出装置10は,取得したインターフェースタイプ情報に基づき,上記IFタイプテーブルに含まれるインターフェースタイプのポートを抽出し(S402),それを探索対象スイッチにおける探索対象ポートに設定する(S403)。図17の例では,ポート1−8が探索対象ポートに設定される。   The network failure detection apparatus 10 transmits a notification request for the interface of each port to the search target switch, and acquires the interface type information of each port from the search target switch in advance (S401). FIG. 17B is an example of the acquired interface type information of each port (number 1-10). Port 1-6 is fastEther, port 7-8 is gigabitEthernet (registered trademark), and port 9-10 is ATM. (asynchronous Transfer Mode). The interface type information of each port transmitted by the search target switch is, for example, ifTypeMIB. The network failure detection apparatus 10 extracts an interface type port included in the IF type table based on the acquired interface type information (S402), and sets it as a search target port in the search target switch (S403). In the example of FIG. 17, ports 1-8 are set as search target ports.

上述した実施の形態例により,L2ループを構成しているスイッチが特定された場合,さらに,そのL2ループを回避する処理が行われてもよい。図4の例において,ネットワーク障害検出装置は,L2ループを構成するスイッチSW2のポート1又はポート3のいずれかに対して,ポートを遮断するコマンドをスイッチSW2に送信する。コマンドは,例えば,ポート1又はポート3のifAdminStatusMIBをダウンさせるSNMPsetコマンドである。これにより,L2ループの発生箇所の検出のみならず,L2ループの回避も可能となる。また,スイッチSW1のポート1を遮断することにより,その下流にあるL2ループが回避されてもよい。ネットワーク障害検出装置10は,スイッチSW1に対して,ポート1を遮断するコマンドを送信する。   When the switch constituting the L2 loop is specified by the above-described embodiment, processing for avoiding the L2 loop may be further performed. In the example of FIG. 4, the network failure detection device transmits a command for shutting down the port to either switch 1 or port 3 of the switch SW2 constituting the L2 loop to the switch SW2. The command is, for example, an SNMPset command for bringing down ifAdminStatusMIB of port 1 or port 3. This makes it possible not only to detect the occurrence location of the L2 loop but also to avoid the L2 loop. Further, by shutting off the port 1 of the switch SW1, the L2 loop downstream thereof may be avoided. The network failure detection apparatus 10 transmits a command for blocking the port 1 to the switch SW1.

また,本発明の実施の形態における処理を行う前に,探索対象スイッチから統計情報を取得するために,探索対象スイッチのアドレスを取得する必要がある。   In addition, before performing the processing according to the embodiment of the present invention, it is necessary to acquire the address of the search target switch in order to acquire statistical information from the search target switch.

図18は,探索対象スイッチのアドレスを取得するための処理フローチャートである。ネットワーク障害検出装置10は,探索対象ネットワークのブロードキャストアドレスに対して,所定のMIB取得要求であるSNMPgetコマンドを送信する(S500)。当該SNMPgetコマンドに応答可能なスイッチからの応答パケットをネットワーク障害検出装置10は受信し,その受信した応答パケットから送信元アドレスを抽出する(S501)。これにより,探索対象スイッチのアドレスを取得することができる。抽出したアドレスは探索対象スイッチのアドレスに設定される(S502)。   FIG. 18 is a process flowchart for acquiring the address of the search target switch. The network failure detection apparatus 10 transmits an SNMPget command, which is a predetermined MIB acquisition request, to the broadcast address of the search target network (S500). The network failure detection apparatus 10 receives a response packet from a switch that can respond to the SNMPget command, and extracts a source address from the received response packet (S501). As a result, the address of the search target switch can be acquired. The extracted address is set as the address of the search target switch (S502).

L2ループが発生していると,ネットワーク(サブネット)内のスイッチから応答パケットを受信できない可能性が高いので,例えば,ネットワーク内の通信が正常であることが明らかな場合(L2ループが発生していないことが明らかな場合)に,本アドレス取得処理が行われるのが好ましい。   If an L2 loop has occurred, there is a high possibility that a response packet cannot be received from a switch in the network (subnet). For example, when it is clear that communication within the network is normal (the L2 loop has occurred) This address acquisition processing is preferably performed when it is clear that there is not.

また,スイッチのアドレス(MACアドレス)の先頭3バイトは,スイッチのベンダを識別するOUI(Organizationally Unique Identifier)であり,ネットワーク障害検出装置は,探索対象スイッチのベンダ特性を考慮した処理を行ってもよい。   The first 3 bytes of the switch address (MAC address) is an OUI (Organizationally Unique Identifier) that identifies the switch vendor, and the network failure detection device can perform processing considering the vendor characteristics of the switch to be searched. Good.

例えば,あるベンダのスイッチは,受信パケット数に関する統計情報を有さず,受信データ量に関する統計情報のみを有している場合,受信データ量を利用する第一の実施の形態による処理を実施する必要がある。ネットワーク障害検出装置は,ベンダ識別情報(OUI)とそれに対応する処理のテーブルをあらかじめ保持しておき,ベンダ識別情報に基づいて,探索対象スイッチのベンダ特性に合った処理を実行する。   For example, when a switch of a certain vendor does not have statistical information about the number of received packets but has only statistical information about the amount of received data, the switch according to the first embodiment that uses the received data amount is executed. There is a need. The network failure detection apparatus holds in advance vendor identification information (OUI) and a table of processing corresponding to the vendor identification information (OUI), and executes processing according to the vendor characteristics of the search target switch based on the vendor identification information.

ところで,「背景技術」の項で説明したように,L2ループが発生している状態で,端末からブロードキャストパケットが送信されると,その端末とL2ループが発生している箇所までの経路上のスイッチは,その端末のアドレスを誤学習する。従って,例えば,スイッチSW2でL2ループが発生している状態で,本発明のL2ループ検出処理を行う前に,端末10(ネットワーク障害検出装置)からなんらかのブロードキャストパケットが送信されると,端末10のアドレスもL2ループ方向に誤学習されてしまう。そうすると,ネットワーク障害検出装置10からの統計情報要求に対して,探索対象スイッチが統計情報を送信する場合,誤学習された方向に統計情報が送信されてしまい,ネットワーク障害検出装置(端末10)は,統計情報を受信できないおそれがある。   By the way, as explained in the “Background Art” section, when a broadcast packet is transmitted from a terminal in a state where an L2 loop has occurred, it is on the route from that terminal to the location where the L2 loop has occurred. The switch mislearns the address of the terminal. Therefore, for example, if a broadcast packet is transmitted from the terminal 10 (network failure detection device) before performing the L2 loop detection processing of the present invention in a state where the L2 loop is generated in the switch SW2, the terminal 10 The address is also mislearned in the L2 loop direction. Then, in response to the statistical information request from the network failure detection device 10, when the search target switch transmits statistical information, the statistical information is transmitted in the mislearned direction, and the network failure detection device (terminal 10) However, statistical information may not be received.

そこで,本発明の実施の形態例では,ネットワーク障害検出装置が統計情報を取得できないという不都合な状況を回避するため,通信回復処理部13が探索対象スイッチとの通信をあらかじめ回復させるための処理(通信回復処理)を実施する。   Therefore, in the embodiment of the present invention, in order to avoid an inconvenient situation in which the network failure detection device cannot acquire statistical information, a process (in which the communication recovery processing unit 13 recovers communication with the search target switch in advance) ( Implement communication recovery processing.

ネットワーク障害検出装置の通信回復処理部13は,自己のMACアドレス以外のMACアドレスを送信元アドレスとするブロードキャストパケット(以下,ダミーパケットと称す)を連続的に複数送信する。ダミーパケットがブロードキャスト送信されると,L2ループに到達し,周回し始める。L2ループが発生しているスイッチSW2の入力ポートには,このダミーパケットが入力されるとともに,すでに周回し続けている既存のブロードキャストパケットも入力されるため,1出力2入力状態となる。そして,このダミーパケットを連続的且つ大量に送信することで,出力キュー又は入力キューが許容値を超え,パケットが廃棄されるようになり,さらに,ダミーパケットを送り続けることにより,ネットワーク障害装置を発信元とするブロードキャストパケットがダミーパケットに置き換えられていき,最終的に,周回するブロードキャストパケットは全てダミーパケットに置き換えられる。これにより,L2ループからネットワーク障害検出装置を発信元とするブロードキャストパケットが送信されなくなり,ネットワーク内の全スイッチにおける探索対象端末のアドレスの誤学習が解消し,探索対象スイッチとネットワーク障害検出装置との通信を回復することができる。   The communication recovery processing unit 13 of the network failure detection apparatus continuously transmits a plurality of broadcast packets (hereinafter referred to as dummy packets) having a MAC address other than its own MAC address as a transmission source address. When a dummy packet is broadcast, it reaches the L2 loop and starts to circulate. Since the dummy packet is input to the input port of the switch SW2 in which the L2 loop is generated, and the existing broadcast packet that has already been circulated is also input, a 1-output 2-input state is established. Then, by sending these dummy packets continuously and in large quantities, the output queue or input queue exceeds the allowable value, and the packets are discarded. The broadcast packet as the transmission source is replaced with a dummy packet, and finally, all the circulating broadcast packets are replaced with dummy packets. As a result, broadcast packets originating from the network failure detection device are no longer transmitted from the L2 loop, and mislearning of the address of the search target terminal in all switches in the network is resolved. Communication can be restored.

ダミーパケットの送信元アドレスは,ネットワーク障害検出装置のMACアドレス以外のMACアドレスであればよく,実在しない架空のアドレスでもよいし,他の実在する端末のMACアドレスでもよい。ただし,この場合,この実在する端末と通信する場合は,再度,上記通信回復処理を行う必要が生じる。   The source address of the dummy packet may be a MAC address other than the MAC address of the network failure detection device, may be a fictitious address that does not exist, or may be the MAC address of another existing terminal. However, in this case, when communicating with the actual terminal, it is necessary to perform the communication recovery process again.

ネットワーク障害検出装置は,上記通信回復処理を行った後,探索対象スイッチに対して統計情報要求を送信し,上述したL2ループを検出する処理を実施する。   After performing the above-described communication recovery processing, the network failure detection device transmits a statistical information request to the search target switch, and performs the above-described processing for detecting the L2 loop.

また,「背景技術」の項で説明したように,L2ループが発生すると,L2ループが発生しているスイッチからブロードキャストパケットが送信され続けるブロードキャストストーム現象が生じ,ネットワーク内の全ての端末は高負荷状態となる。高負荷状態において本実施の形態例におけるL2ループ検出処理を実施すると,ネットワーク障害検出装置及び探索対象スイッチそれぞれの処理速度が遅延し,又は処理が停止し,さらにパケットの伝送速度も遅延するおそれがある。   In addition, as described in the “Background” section, when an L2 loop occurs, a broadcast storm phenomenon occurs in which broadcast packets continue to be transmitted from the switch where the L2 loop occurs, and all terminals in the network are heavily loaded. It becomes a state. If the L2 loop detection processing in the present embodiment is performed in a high load state, the processing speed of each of the network failure detection device and the search target switch may be delayed or the processing may be stopped, and further the packet transmission speed may be delayed. is there.

ブロードキャストパケットの受信は,ネットワーク上の端末やスイッチで割り込み処理を発生させるため,CPU利用率が高負荷状態となり,他の処理が行われない又は処理速度が遅延するなどの重大な障害が発生する。特に,ブロードキャストパケットは,ARPのように,特定の端末からの応答を要求するパケットであることが多く,応答すべき端末に大量のブロードキャストパケットが到達すると,応答処理の負荷も加わるため,さらに高負荷状態になる。   Broadcast packet reception causes interrupt processing to occur at the terminal or switch on the network, causing a high load on the CPU utilization, causing serious failures such as other processing not being performed or processing speed being delayed. . In particular, a broadcast packet is often a packet that requests a response from a specific terminal, such as ARP, and if a large number of broadcast packets arrive at a terminal that should respond, the response processing load is also added, which further increases the response. Loaded.

そのため,例えば,統計情報要求に対する探索対象スイッチからの統計情報の送信処理が遅延したり,又は統計情報が送信されず,ネットワーク障害検出装置が正常に統計情報を受信できない可能性が生じる。   For this reason, for example, there is a possibility that the transmission process of the statistical information from the search target switch in response to the statistical information request is delayed, or the statistical information is not transmitted, and the network failure detection apparatus cannot normally receive the statistical information.

そこで,本発明の実施の形態例では,高負荷の影響により統計情報を受信できないという不都合な状況を回避するため,負荷低減処理部14がネットワークの負荷を低減させるための処理(負荷低減処理)を実施する。   Therefore, in the embodiment of the present invention, in order to avoid an inconvenient situation in which statistical information cannot be received due to the influence of a high load, a process (load reduction process) for the load reduction processing unit 14 to reduce the load on the network. To implement.

L2ループに伴うブロードキャストストームによるネットワーク内の機器(端末及びスイッチを含む)の高負荷の原因は,ブロードキャストパケットの単位時間あたりの受信数が,各端末の処理能力の限界に近い又は限界を超えるほど膨大となることが原因であり,単位時間あたりのブロードキャストパケットの受信数を減少させることで,各端末の負荷を低減させることができる。   The cause of the high load of devices (including terminals and switches) in the network due to the broadcast storm associated with the L2 loop is that the number of broadcast packets received per unit time is close to or exceeds the limit of the processing capacity of each terminal. This is due to the enormous volume, and the load on each terminal can be reduced by reducing the number of broadcast packets received per unit time.

そのために,ネットワーク障害検出装置の負荷低減処理部14は,パケット長が長いロングパケットをブロードキャストパケットとして連続的に送信し続ける。ネットワーク内では,ARP,RIP,NetBIOSなどのブロードキャストパケットが頻繁に送信されており,L2ループ発生にL2ループ内の周回するパケットも,これらのパケットが支配的である。特に,ARPは,パケット長64バイト程度,NetBIOSでもパケット長200バイト程度と短い。L2ループが発生すると,L2ループを構成している伝送路速度でこれらのショートパケットがネットワーク全域にブロードキャストされる。例えば,ARPパケットのみが100MbpsのL2ループで周回した場合,理論上1秒間に14万パケットがL2ループからネットワーク全域に対してブロードキャスト送信される。   Therefore, the load reduction processing unit 14 of the network failure detection device continuously transmits long packets having a long packet length as broadcast packets. In the network, broadcast packets such as ARP, RIP, and NetBIOS are frequently transmitted, and these packets are also dominant in packets that circulate in the L2 loop when an L2 loop occurs. In particular, ARP has a packet length of about 64 bytes, and NetBIOS has a packet length of about 200 bytes. When an L2 loop occurs, these short packets are broadcast throughout the network at the transmission line speed that forms the L2 loop. For example, when only ARP packets circulate in a 100 Mbps L2 loop, theoretically, 140,000 packets are broadcasted from the L2 loop to the entire network per second.

負荷低減処理部14は,例えば1500バイト程度のロングパケットを連続的に送信する。L2ループ内では,64バイト程度のパケットが入力されるとともに,1500バイトのパケットも入力され,これが連続的に入力されるため,入力キュー又は出力キューが許容値を超える。そうなると,64バイト程度のショートパケットが廃棄されていき,最終的に64バイトのパケット全てが廃棄され,1500バイトのパケットのみが周回する状態にすることができる。1500バイトのパケットのみが周回する状態では,L2ループからブロードキャスト送信されるパケットは,1秒間に8000パケットとなり,64バイトの場合と比べて,単位時間当たりのパケット受信数を約1/20程度に減少させることができる。この結果,各端末の負荷は低減され,疎通確認処理が行える程度に負荷状態を回復させることができる。   The load reduction processing unit 14 continuously transmits long packets of about 1500 bytes, for example. In the L2 loop, a packet of about 64 bytes is input, and a packet of 1500 bytes is also input, which is continuously input, so the input queue or output queue exceeds the allowable value. As a result, a short packet of about 64 bytes is discarded, and finally all the 64-byte packets are discarded, and only a 1500-byte packet can be circulated. In the state where only 1500-byte packets circulate, the packets transmitted from the L2 loop are 8000 packets per second, and the number of packets received per unit time is about 1/20 compared to 64 bytes. Can be reduced. As a result, the load on each terminal is reduced, and the load state can be recovered to such an extent that the communication confirmation process can be performed.

ネットワーク障害検出装置は,上記負荷低減処理を行った後,探索対象スイッチに対して統計情報要求を送信し,上述したL2ループを検出する処理を実施する。   After performing the load reduction process, the network failure detection apparatus transmits a statistical information request to the search target switch, and performs the above-described process of detecting the L2 loop.

さらに,上記通信回復処理と負荷低減処理とを同時に行うために,通信回復処理として用いるネットワーク障害検出装置のMACアドレス以外のMACアドレスを送信元アドレスとするブロードキャストパケット(ダミーパケット)をロングパケット化して連続的に複数送信することで,負荷低減処理も同時に行うことができる。   Furthermore, in order to perform the communication recovery processing and load reduction processing simultaneously, a broadcast packet (dummy packet) having a MAC address other than the MAC address of the network failure detection device used as the communication recovery processing is converted into a long packet. By continuously transmitting a plurality of data, load reduction processing can be performed simultaneously.

(付記1)
複数の端末のうちの第一の端末であって,各端末は複数の中継装置のうちの少なくとも一つの中継装置を介して別の端末と接続するネットワークの障害を検出するネットワーク障害検出装置において,
前記複数の中継装置のうちの第一の中継装置から,前記第一の中継装置の複数のポートそれぞれで受信するデータに関する統計情報を取得する通信部と,
前記統計情報に基づいて,前記第一の中継装置で所定のネットワーク障害を引き起こすループが発生しているか否か,又は当該ループが発生している別の中継装置の前記第一の中継装置からの方向を判定する判定部とを備えることを特徴とするネットワーク障害検出装置。
(Appendix 1)
In a network failure detection device that is a first terminal of a plurality of terminals, each terminal detecting a failure of a network connected to another terminal via at least one relay device of the plurality of relay devices,
A communication unit for obtaining statistical information on data received at each of a plurality of ports of the first relay device from a first relay device of the plurality of relay devices;
Based on the statistical information, whether or not a loop that causes a predetermined network failure has occurred in the first relay device, or from the first relay device of another relay device in which the loop has occurred A network failure detection apparatus comprising: a determination unit that determines a direction.

(付記2)
付記1において,
前記統計情報は,前記第一の中継装置の各ポートごとの受信データ量又は受信データ数であることを特徴とするネットワーク障害検出装置。
(Appendix 2)
In Appendix 1,
The network failure detection device, wherein the statistical information is a received data amount or a received data number for each port of the first relay device.

(付記3)
付記2において,
前記判定部は,前記第一の中継装置の複数のポートのうち,単位時間当たりの受信データ量又は受信データ数が所定のしきい値以上であるポートが2つである場合,前記第一の中継装置で前記ループが発生していると判定し,単位時間当たりの受信データ量が所定のしきい値以上であるポートが1つである場合,当該ポートの下流方向に,当該ループが発生している別の中継装置が存在すると判定することを特徴とするネットワーク障害検出装置。
(Appendix 3)
In Appendix 2,
The determination unit, when there are two ports whose received data amount or received data number per unit time is equal to or greater than a predetermined threshold among the plurality of ports of the first relay device, When it is determined that the loop has occurred in the relay device and there is one port whose received data amount per unit time is equal to or greater than a predetermined threshold, the loop is generated in the downstream direction of the port. A network failure detection apparatus, characterized in that it is determined that another relay apparatus exists.

(付記4)
付記3において,
前記しきい値は,前記ネットワーク障害検出装置における単位時間当たりの受信データ量又は受信データ数に基づいて設定されることを特徴とするネットワーク障害検出装置。
(Appendix 4)
In Appendix 3,
The network failure detection device, wherein the threshold value is set based on the amount of received data or the number of received data per unit time in the network failure detection device.

(付記5)
付記3において,
前記しきい値は,前記第一の中継装置の各ポートの単位時間当たりの受信データ量又は受信データ数のうちの最大値に基づいて設定されることを特徴とするネットワーク障害検出装置。
(Appendix 5)
In Appendix 3,
The network failure detection device, wherein the threshold value is set based on a maximum value of received data amount or received data number per unit time of each port of the first relay device.

(付記6)
付記1において,
前記通信部は,前記統計情報を取得する前に,所定のデータ長を有する所定の要求データを複数ブロードキャスト送信し,当該所定のデータ長は,前記所定の要求データに対する応答データのデータ長よりも長いことを特徴とするネットワーク障害検出装置。
(Appendix 6)
In Appendix 1,
The communication unit broadcasts a plurality of predetermined request data having a predetermined data length before acquiring the statistical information, and the predetermined data length is longer than a data length of response data to the predetermined request data. A network failure detection device characterized by its long length.

(付記7)
付記1において,
前記通信部は,第一の中継装置の全てポートのうち,前記ループに関連するインターフェースタイプの複数のポートそれぞれで受信するデータに関する統計情報を取得することを特徴とするネットワーク障害検出装置。
(Appendix 7)
In Appendix 1,
The communication unit acquires statistical information about data received at each of a plurality of ports of an interface type related to the loop among all ports of the first relay device.

(付記8)
付記1において,
前記通信部は,前記第一の中継装置における単位時間当たりの受信データ量が所定のしきい値以上であるポートに対して,遮断要求を送信することを特徴とするネットワーク障害検出装置。
(Appendix 8)
In Appendix 1,
The network failure detection device, wherein the communication unit transmits a blocking request to a port whose received data amount per unit time in the first relay device is a predetermined threshold value or more.

(付記9)
付記1において,
前記ネットワーク障害検出装置以外のアドレスを発信元アドレスとする複数のデータをブロードキャスト送信する通信回復処理部を備え,
前記通信回復処理部は,前記通信部が前記統計情報を取得する前に,前記複数のデータをブロードキャスト送信することを特徴とするネットワーク障害検出装置。
(Appendix 9)
In Appendix 1,
A communication recovery processing unit that broadcast-transmits a plurality of data having a source address other than the network failure detection device;
The network failure detection apparatus, wherein the communication recovery processing unit broadcasts the plurality of data before the communication unit acquires the statistical information.

(付記10)
付記1において,
前記ループ発生時において前記ループ内を周回するデータのデータ長よりも長いデータ長を有する複数のデータをブロードキャスト送信する負荷低減処理部を備え,
前記負荷低減処理部は,前記通信部が前記統計情報を取得する前に,前記複数のデータをブロードキャスト送信することを特徴とするネットワーク障害検出装置。
(Appendix 10)
In Appendix 1,
A load reduction processing unit that broadcast-transmits a plurality of data having a data length longer than a data length of data that circulates in the loop when the loop occurs
The network failure detection apparatus, wherein the load reduction processing unit broadcasts the plurality of data before the communication unit acquires the statistical information.

(付記11)
付記1において,
前記ネットワーク障害は,前記ループを周回するデータが前記ループからブロードキャスト送信され続けるレイヤ2ループ障害であることを特徴とするネットワーク障害検出装置。
(Appendix 11)
In Appendix 1,
The network failure detection apparatus according to claim 1, wherein the network failure is a layer 2 loop failure in which data circulating around the loop is continuously broadcast from the loop.

(付記12)
複数の端末のうちの第一の端末により実施され,各端末は複数の中継装置のうちの少なくとも一つの中継装置を介して別の端末と接続するネットワークの障害を検出するネットワーク障害検出方法において,
前記複数の中継装置のうちの第一の中継装置から,前記第一の中継装置の複数のポートそれぞれで受信するデータに関する統計情報を取得する取得ステップと,
前記統計情報に基づいて,前記第一の中継装置で所定のネットワーク障害を引き起こすループが発生しているか否か,又は当該ループが発生している別の中継装置の前記第一の中継装置からの方向を判定する判定ステップとを備えることを特徴とするネットワーク障害検出方法。
(Appendix 12)
In a network failure detection method implemented by a first terminal of a plurality of terminals, each terminal detecting a failure of a network connected to another terminal via at least one relay device of the plurality of relay devices,
An acquisition step of acquiring statistical information about data received at each of a plurality of ports of the first relay device from a first relay device of the plurality of relay devices;
Based on the statistical information, whether or not a loop that causes a predetermined network failure has occurred in the first relay device, or from the first relay device of another relay device in which the loop has occurred A network failure detection method comprising: a determination step of determining a direction.

(付記13)
付記12において,
前記統計情報は,前記第一の中継装置の各ポートごとの受信データ量又は受信データ数であることを特徴とするネットワーク障害検出方法。
(Appendix 13)
In Appendix 12,
The network failure detection method, wherein the statistical information is a received data amount or a received data number for each port of the first relay device.

(付記14)
付記13において,
前記判定ステップでは,前記第一の中継装置の複数のポートのうち,単位時間当たりの受信データ量又は受信データ数が所定のしきい値以上であるポートが2つである場合,前記第一の中継装置で前記ループが発生していると判定し,単位時間当たりの受信データ量が所定のしきい値以上であるポートが1つである場合,当該ポートの下流方向に,当該ループが発生している別の中継装置が存在すると判定することを特徴とするネットワーク障害検出方法。
(Appendix 14)
In Appendix 13,
In the determination step, when there are two ports having a received data amount or received data number per unit time equal to or greater than a predetermined threshold among a plurality of ports of the first relay device, When it is determined that the loop has occurred in the relay device and there is one port whose received data amount per unit time is equal to or greater than a predetermined threshold, the loop is generated in the downstream direction of the port. A network failure detection method comprising determining that another relay device is present.

(付記15)
付記14において,
前記取得ステップの前に,前記ネットワーク障害検出装置における単位時間当たりの受信データ量又は受信データ数に基づいて前記しきい値を設定する設定ステップを備えることを特徴とするネットワーク障害検出方法。
(Appendix 15)
In Appendix 14,
A network failure detection method comprising: a setting step of setting the threshold value based on the amount of received data or the number of received data per unit time in the network failure detection device before the obtaining step.

(付記16)
付記14において,
前記判定ステップの前に,前記取得ステップで取得された前記第一の中継装置の各ポートの単位時間当たりの受信データ量又は受信データ数のうちの最大値に基づいて前記しきい値を設定する設定ステップを備えることを特徴とするネットワーク障害検出方法。
(Appendix 16)
In Appendix 14,
Prior to the determination step, the threshold is set based on the maximum value of the received data amount or the received data number per unit time of each port of the first relay device acquired in the acquiring step. A network failure detection method comprising a setting step.

(付記17)
付記12において,
前記取得ステップの前に,所定のデータ長を有する所定の要求データを複数ブロードキャスト送信する送信ステップを備え,当該所定のデータ長は,前記所定の要求データに対する応答データのデータ長よりも長いことを特徴とするネットワーク障害検出方法。
(Appendix 17)
In Appendix 12,
Before the obtaining step, a transmission step of broadcasting a plurality of predetermined request data having a predetermined data length is provided, and the predetermined data length is longer than the data length of response data for the predetermined request data. A characteristic network failure detection method.

(付記18)
付記12において,
前記取得ステップでは,第一の中継装置の全てポートのうち,前記ループに関連するインターフェースタイプの複数のポートそれぞれで受信するデータに関する統計情報を取得することを特徴とするネットワーク障害検出装置。
(Appendix 18)
In Appendix 12,
In the obtaining step, statistical information regarding data received at each of a plurality of ports of an interface type related to the loop among all the ports of the first relay device is obtained.

(付記19)
付記12において,
前記第一の中継装置における単位時間当たりの受信データ量が所定のしきい値以上であるポートに対して,遮断要求を送信する送信ステップを備えることを特徴とするネットワーク障害検出方法。
(Appendix 19)
In Appendix 12,
A network failure detection method comprising: a transmission step of transmitting a blocking request to a port whose received data amount per unit time in the first relay device is equal to or greater than a predetermined threshold value.

(付記20)
付記12において,
前記取得ステップの前に,前記第一の端末以外のアドレスを発信元アドレスとする複数のデータをブロードキャスト送信する通信回復処理ステップを備えることを特徴とするネットワーク障害検出方法。
(Appendix 20)
In Appendix 12,
A network failure detection method comprising a communication recovery processing step of broadcasting a plurality of data having a source address other than the first terminal as the source address before the obtaining step.

(付記21)
付記12において,
前記取得ステップの前に,前記ループ発生時において前記ループ内を周回するデータのデータ長よりも長いデータ長を有する複数のデータをブロードキャスト送信する負荷低減処理ステップを備えることを特徴とするネットワーク障害検出方法。
(Appendix 21)
In Appendix 12,
Before the obtaining step, a network failure detection step comprising a load reduction processing step of broadcasting a plurality of data having a data length longer than the data length of the data circulating in the loop when the loop occurs Method.

(付記22)
付記12において,
前記ネットワーク障害は,前記ループを周回するデータが前記ループからブロードキャスト送信され続けるレイヤ2ループ障害であることを特徴とするネットワーク障害検出方法。
(Appendix 22)
In Appendix 12,
The network failure detection method according to claim 1, wherein the network failure is a layer 2 loop failure in which data circulating around the loop is continuously broadcast from the loop.

10:ネットワーク障害検出装置,20,30:端末,SW1〜SW7:レイヤ2スイッチ,11:統計情報取得部,12:データ解析部,13:通信回復処理部,14:負荷低減処理部   DESCRIPTION OF SYMBOLS 10: Network failure detection apparatus, 20, 30: Terminal, SW1-SW7: Layer 2 switch, 11: Statistical information acquisition part, 12: Data analysis part, 13: Communication recovery process part, 14: Load reduction process part

Claims (4)

レイヤ2スイッチと、該レイヤ2スイッチを介して通信を行う複数の通信装置と、を備えた通信システムにおける通信装置において、
該通信装置に固有のMACアドレス以外のMACアドレスを送信元アドレスとするブロードキャストパケットの連続的な所定量の送信を行う手段と、
前記送信の後に、前記通信システムにおける前記複数の通信装置のいずれかとの間で通信を行う手段と、
を備えたことを特徴とする通信装置。
In a communication apparatus in a communication system including a layer 2 switch and a plurality of communication apparatuses that perform communication via the layer 2 switch,
Means for continuously transmitting a predetermined amount of broadcast packets having a MAC address other than the MAC address unique to the communication device as a transmission source address;
Means for communicating with any of the plurality of communication devices in the communication system after the transmission;
A communication apparatus comprising:
レイヤ2スイッチと、該レイヤ2スイッチを介して通信を行う複数の通信装置と、を備えた通信システムにおける通信装置において、
該通信装置に固有のMACアドレス以外のMACアドレスを送信元アドレスとし、RIP、NetBIOSよりも長いデータ長を有するロングパケットの連続的な送信を行う手段と、
前記送信の後に、前記通信システムにおける前記複数の通信装置のいずれかとの間で通信を行う手段と、
を備えたことを特徴とする通信装置。
In a communication apparatus in a communication system including a layer 2 switch and a plurality of communication apparatuses that perform communication via the layer 2 switch,
Means for transmitting a source address, R IP, continuous transmission of long packets having a data length not long than NetBIOS a MAC address other than the MAC address unique to the communication device,
Means for communicating with any of the plurality of communication devices in the communication system after the transmission;
A communication apparatus comprising:
レイヤ2スイッチと、該レイヤ2スイッチを介して通信を行う複数の通信装置と、を備えた通信システムにおける通信方法において、
前記複数の通信装置のうちの第一の通信装置によって、該第一の通信装置に固有のMACアドレス以外のMACアドレスを送信元アドレスとするブロードキャストパケットの連続的な所定量の送信を行い、
前記送信の後に、該第一の通信装置と、前記通信システムにおける前記複数の通信装置のうちの第二の通信装置との間で通信を行う、
ことを備えたことを特徴とする通信方法。
In a communication method in a communication system including a layer 2 switch and a plurality of communication devices that perform communication via the layer 2 switch,
The first communication device of the plurality of communication devices performs a continuous predetermined amount of transmission of a broadcast packet with a MAC address other than the MAC address unique to the first communication device as a source address,
After the transmission, communication is performed between the first communication device and a second communication device of the plurality of communication devices in the communication system.
A communication method comprising the above.
レイヤ2スイッチと、該レイヤ2スイッチを介して通信を行う複数の通信装置と、を備えた通信システムにおける通信方法において、
前記複数の通信装置のうちの第一の通信装置によって、該第一の通信装置に固有のMACアドレス以外のMACアドレスを送信元アドレスとし、RIP、NetBIOSよりも長いデータ長を有するロングパケットの連続的な送信を行い、
前記送信の後に、該第一の通信装置と、前記通信システムにおける前記複数の通信装置のうちの第二の通信装置との間で通信を行う、
ことを備えたことを特徴とする通信方法。
In a communication method in a communication system including a layer 2 switch and a plurality of communication devices that perform communication via the layer 2 switch,
The first communication device among the plurality of communication devices, the source address of the MAC address other than the MAC address unique to said first communication device, R IP, long packet having a data length not long than NetBIOS Send continuously,
After the transmission, communication is performed between the first communication device and a second communication device of the plurality of communication devices in the communication system.
A communication method comprising the above.
JP2011034366A 2011-02-21 2011-02-21 Network failure detection apparatus and network failure detection method Expired - Fee Related JP5177246B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011034366A JP5177246B2 (en) 2011-02-21 2011-02-21 Network failure detection apparatus and network failure detection method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011034366A JP5177246B2 (en) 2011-02-21 2011-02-21 Network failure detection apparatus and network failure detection method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2005179294A Division JP4794917B2 (en) 2005-06-20 2005-06-20 Network failure detection apparatus and network failure detection method

Publications (2)

Publication Number Publication Date
JP2011130493A JP2011130493A (en) 2011-06-30
JP5177246B2 true JP5177246B2 (en) 2013-04-03

Family

ID=44292462

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011034366A Expired - Fee Related JP5177246B2 (en) 2011-02-21 2011-02-21 Network failure detection apparatus and network failure detection method

Country Status (1)

Country Link
JP (1) JP5177246B2 (en)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05136785A (en) * 1991-11-12 1993-06-01 Toshiba Corp Fault packet prevention device
JP2000106559A (en) * 1998-09-28 2000-04-11 Fujitsu Ltd Broadcast communication method and device, and recording medium
JP2001197114A (en) * 2000-01-14 2001-07-19 Fujitsu Ltd Frame repeater
JP2002111682A (en) * 2000-09-29 2002-04-12 Yamatake Corp Communication apparatus and broadcasting system
JP3641589B2 (en) * 2001-02-26 2005-04-20 日本電信電話株式会社 Network monitoring method and apparatus

Also Published As

Publication number Publication date
JP2011130493A (en) 2011-06-30

Similar Documents

Publication Publication Date Title
JP4794917B2 (en) Network failure detection apparatus and network failure detection method
JP4704120B2 (en) Network failure detection apparatus and network failure detection method
JP4619940B2 (en) Network fault location detection apparatus and network fault location detection method
JP5510687B2 (en) Network system and communication traffic control method
JP5846221B2 (en) Network system and topology management method
EP1906591B1 (en) Method, device, and system for detecting layer 2 loop
US8274911B2 (en) Network monitoring system and path extracting method
WO2006107133A1 (en) Ip management method and apparatus for protecting/blocking specific ip address or specific device on network
JP2005295209A (en) Layer 2 loop detection system
CN101286996A (en) Storm attack resisting method and apparatus
CN111682989B (en) Method, device and system for detecting port link state
CN114629822A (en) Link detection method and device, electronic equipment and storage medium
US10897481B2 (en) Relay device, method and non-transitory computer-readable storage medium
US20070127385A1 (en) Network fault detection apparatus
US20140211614A1 (en) Methods and systems for providing redundancy in data network communications
JP2007124184A (en) Loop detecting method and loop detection device
JP5177246B2 (en) Network failure detection apparatus and network failure detection method
US7870285B2 (en) Mitigating subscriber side attacks in a cable network
EP3258654B1 (en) Method and system for reducing pim protocol dr change
JP2009302611A (en) Band control method in communication network and communication device for executing the method
EP3687131A1 (en) Method, apparatus and system for rapidly restoring service during path switching
JP6497142B2 (en) Communication monitoring device, communication monitoring program, and communication monitoring method
CN112187676B (en) Method and equipment for recovering switch port
CN111970153A (en) Fault isolation method and device based on virtual gateway and related equipment
JP5093528B2 (en) COMMUNICATION DEVICE AND LINE STATUS INFORMATION PROVIDING METHOD

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121224

R150 Certificate of patent or registration of utility model

Ref document number: 5177246

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees