JP4794917B2 - ネットワーク障害検出装置及びネットワーク障害検出方法 - Google Patents

ネットワーク障害検出装置及びネットワーク障害検出方法 Download PDF

Info

Publication number
JP4794917B2
JP4794917B2 JP2005179294A JP2005179294A JP4794917B2 JP 4794917 B2 JP4794917 B2 JP 4794917B2 JP 2005179294 A JP2005179294 A JP 2005179294A JP 2005179294 A JP2005179294 A JP 2005179294A JP 4794917 B2 JP4794917 B2 JP 4794917B2
Authority
JP
Japan
Prior art keywords
loop
layer
switch
relay device
network failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005179294A
Other languages
English (en)
Other versions
JP2006352763A (ja
Inventor
武 安家
祐士 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005179294A priority Critical patent/JP4794917B2/ja
Priority to US11/229,689 priority patent/US7545750B2/en
Publication of JP2006352763A publication Critical patent/JP2006352763A/ja
Application granted granted Critical
Publication of JP4794917B2 publication Critical patent/JP4794917B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Small-Scale Networks (AREA)

Description

本発明は、ネットワーク上で発生する障害を検出するネットワーク障害検出装置及びネットワーク障害検出方法に関し、特に、ネットワークを構成する中継装置で発生する障害であるレイヤ2ループを検出するネットワーク障害検出装置及びネットワーク障害検出方法に関する。
LANなどのネットワークを構成するレイヤ2(L2)スイッチと呼ばれる中継装置は、ネットワークの中継装置の一つで、OSI参照モデルのデータリンク層(第2層)のデータでパケットの行き先を判断して転送を行なう機能を有する。データリンク層のプロトコルには、Ethernet(登録商標)などにおけるMAC (メディアアクセス制御)があり、MACアドレスを見てデータの行き先を決定するEthernet(登録商標)の中継装置はスイッチングハブとも呼ばれる。IPやTCP、HTTPなどのプロトコルはネットワーク層(第3層)以上に位置するため、レイヤ2スイッチは第3層以上のプロトコルが異なる場合であってもパケットの転送が可能である。
複数の端末がレイヤ2スイッチにより接続されるネットワークにおいては、ケーブルの誤接続やレイヤ2スイッチの故障などにより、ネットワーク全域において、レイヤ2ループと呼ばれる障害が発生する。レイヤ2ループの発生により、ネットワーク全域において、端末の高負荷状態を招き、また、ネットワーク通信不能状態に陥る。
図1乃至図3は、レイヤ2ループによるネットワーク障害を説明する図である。図1において、ネットワークは、レイヤ2スイッチ(以下、「スイッチ」と称す)SW1の配下にスイッチSW2、SW3、SW4が接続され、スイッチSW2、SW3、SW4の配下にそれぞれスイッチSW5、SW6、SW7が接続し、スイッチSW5、SW6、SW7にそれぞれ端末Y1、Y2、Xが接続して構成される。そして、スイッチSW2におけるケーブル誤接続により、スイッチSW2はループ接続され、ここでレイヤ2ループが発生するものとする。
端末Xがブロードキャストパケットを送信する場合を例について説明する。端末Xからブロードキャストパケットが送信されると、ブロードキャストパケットは、スイッチSW7、SW4、SW1を経由して、L2ループが発生しているスイッチSW2に到達する。ブロードキャストパケットは、スイッチSW2でループを周回するたびに、ネットワーク(サブネット)全域に送出される。ループ周回は、ワイヤースピードで行われるため、結果として、スイッチSW2からネットワーク全域にワイヤースピードでブロードキャストパケットが送出され続け(ブロードキャストストームと呼ばれる)、ネットワーク内の端末は高負荷状態となってしまう。
また、各スイッチの複数のポートのうちの一つにブロードキャストパケットが入力されると、スイッチは、そのブロードキャストパケットに含まれる発信元端末のMACアドレスを記憶するとともに、ブロードキャストパケットの発信端末が存在する方向をその入力ポートの方向であると認識する(以下、これを「アドレスを学習する」と表現する場合がある)するため、上記ブロードキャストストームにより、発信元端末のアドレスを誤学習するスイッチが現れる。すなわち、各スイッチは、ブロードキャストパケットの発信元アドレスがL2ループ発生箇所(スイッチSW2)の方向にあると認識するため、端末XとL2ループ発生箇所間の経路上の各スイッチにおいて、発信元端末のアドレスの誤学習が発生する。具体的には、L2ループが発生しているスイッチSW2にあたかもブロードキャストパケットを送出した端末Xの虚像があるように端末Xがアドレスを学習するため、図中、端末XとL2ループ発生箇所間の経路上にあるスイッチSW7、SW4、SW1、SW2において、端末Xのアドレスを誤学習する。このように、L2ループが発生している状態で、端末からブロードキャストパケットが送信されると、その端末とL2ループが発生している箇所までの経路上のスイッチは、その端末のアドレスを誤学習する。
スイッチSW3、SW5、SW6については、実在の端末Xからパケットが送信された場合とL2ループ発生箇所からパケットが送信された場合におけるパケット受信方向が一致するため、結果的に誤学習しなかったに過ぎない。
上述のように端末Xのアドレスが誤学習された状態において、図2に示すように、端末Y1が端末X宛てにユニキャストパケットを送信する。ユニキャストパケットは、スイッチSW5を経由してスイッチSW2に到達する。スイッチSW2は、端末Xのアドレスを誤学習しており、ユニキャストパケットは、スイッチSW2で発生しているL2ループ内を周回し続け、端末Xまで到達せず、端末Xとの通信が不能となる。また、スイッチSW2は、あたかもL2ループ内に端末Y1が存在するかのように、端末Y1のアドレスを誤学習してしまう。このように、L2ループ発生箇所に到達するように誤学習されたアドレスへユニキャストパケットが送信されると、L2ループ発生スイッチSW2において、ユニキャストパケットの発信元端末のアドレスは、L2ループ方向に誤学習される。なお、他のスイッチSW5は、端末Y1のアドレスを正常に学習する。
同様に、端末Xのアドレスが上述のように誤学習された状態において、図3に示すように、端末Y2が端末X宛てにユニキャストパケットを送信する。ユニキャストパケットは、スイッチSW6、SW3、SW1を経由してスイッチSW2に到達する。スイッチSW2は、端末Xのアドレスを誤学習しており、ユニキャストパケットは、スイッチSW2で発生しているL2ループ内を周回し続け、端末Xまで到達せず、端末Xとの通信が不能となる。また、スイッチSW2は、あたかもL2ループ内に端末Y2が存在するかのように、端末Y2のアドレスを誤学習してしまう。なお、他のスイッチSW6、SW3、SW1は、端末Y2のアドレスを正常に学習する。
ネットワーク障害を引き起こすレイヤ2ループを検出する技術として、例えば、下記特許文献1は、受信フレームの解析によりフレームの無限ループを判断し、L2ループを検出する方法について開示している。
特開2001−197114号公報
L2ループが発生した場合、従来、人手によりレイヤ2スイッチのケーブルの抜き差しを行う、あるいは、被疑スイッチから接続状態に関する情報を取得する手順を繰り返し行うことにより、L2ループ発生箇所を絞りこんでいた。そのため、L2ループ箇所の発見に至るまでに、多くの時間(数時間〜数日)と労力が必要であった。
また、上記特許文献1によれば、ネットワーク(サブネット)内のどこかでL2ループが発生していることは検出することができるが、サブネット内のどこでL2ループが発生しているかまでは特定することができない。
そこで、本発明の目的は、L2ループの発生及びその発生箇所を素早く且つ容易に検出することができるネットワーク障害検出装置及びネットワーク障害検出方法を提供することにある。
上記目的を達成するための本発明のネットワーク障害検出装置の第一の構成は,複数の端末のうちの第一の端末であって,各端末は複数の中継装置のうちの少なくとも一つの中継装置を介して別の端末と接続するネットワークの障害を検出するネットワーク障害検出装置において,前記複数の中継装置のうちの第一の中継装置から,前記第一の中継装置の複数のポートそれぞれで受信するデータに関する統計情報を取得する通信部と,前記統計情報に基づいて,前記第一の中継装置で所定のネットワーク障害を引き起こすループが発生しているか否か,又は当該ループが発生している別の中継装置の前記第一の中継装置からの方向を判定する判定部とを備え,前記統計情報は,前記第一の中継装置の各ポートごとの受信データ量又は受信データ数であり,前記判定部は,前記第一の中継装置の複数のポートのうち,単位時間当たりの受信データ量又は受信データ数が所定のしきい値以上であるポートが2つである場合,前記第一の中継装置で前記ループが発生していると判定し,単位時間当たりの受信データ量が所定のしきい値以上であるポートが1つである場合,当該ポートの下流方向に,当該ループが発生している別の中継装置が存在すると判定することを特徴とする。
本発明のネットワーク障害検出装置の第二の構成は,上記第一の構成において,前記しきい値が,前記ネットワーク障害検出装置における単位時間当たりの受信データ量又は受信データ数に基づいて設定されることを特徴とする。
本発明のネットワーク障害検出装置の第三の構成は,上記第一の構成において,前記しきい値が,前記第一の中継装置の各ポートの単位時間当たりの受信データ量又は受信データ数のうちの最大値に基づいて設定されることを特徴とする。
本発明のネットワーク障害検出装置の第四の構成は,複数の端末のうちの第一の端末であって,各端末は複数の中継装置のうちの少なくとも一つの中継装置を介して別の端末と接続するネットワークの障害を検出するネットワーク障害検出装置において,前記複数の中継装置のうちの第一の中継装置から,前記第一の中継装置の複数のポートそれぞれで受信するデータに関する統計情報を取得する通信部と,前記統計情報に基づいて,前記第一の中継装置で所定のネットワーク障害を引き起こすループが発生しているか否か,又は当該ループが発生している別の中継装置の前記第一の中継装置からの方向を判定する判定部とを備え,前記通信部が,前記統計情報を取得する前に,所定のデータ長を有する所定の要求データを複数ブロードキャスト送信し,当該所定のデータ長は,前記所定の要求データに対する応答データのデータ長よりも長いことを特徴とする。
本発明のネットワーク障害検出装置の第五の構成は,上記第一の構成において,前記通信部が,第一の中継装置の全てポートのうち,前記ループに関連するインターフェースタイプの複数のポートそれぞれで受信するデータに関する統計情報を取得することを特徴とする。
本発明のネットワーク障害検出装置の第六の構成は,上記第一の構成において,前記通信部が,前記第一の中継装置における単位時間当たりの受信データ量が所定のしきい値以上であるポートに対して,遮断要求を送信することを特徴とする。
本発明のネットワーク障害検出装置の第七の構成は,上記第一の構成において,前記ネットワーク障害検出装置以外のアドレスを発信元アドレスとする複数のデータをブロードキャスト送信する通信回復処理部を備え,前記通信回復処理部は,前記通信部が前記統計情報を取得する前に,前記複数のデータをブロードキャスト送信することを特徴とする。
本発明のネットワーク障害検出装置の第八の構成は,上記第一の構成において,前記ループ発生時において前記ループ内を周回するデータのデータ長よりも長いデータ長を有する複数のデータをブロードキャスト送信する負荷低減処理部を備え,前記負荷低減処理部は,前記通信部が前記統計情報を取得する前に,前記複数のデータをブロードキャスト送信することを特徴とする。
本発明のネットワーク障害検出装置の第九の構成は,上記第一の構成において,前記ネットワーク障害が,前記ループを周回するデータが前記ループからブロードキャスト送信され続けるレイヤ2ループ障害であることを特徴とする。
本発明の第一のネットワーク障害検出方法は,複数の端末のうちの第一の端末により実施され,各端末は複数の中継装置のうちの少なくとも一つの中継装置を介して別の端末と接続するネットワークの障害を検出するネットワーク障害検出方法において,前記複数の中継装置のうちの第一の中継装置から,前記第一の中継装置の複数のポートそれぞれで受信するデータに関する統計情報を取得する取得ステップと,前記統計情報に基づいて,前記第一の中継装置で所定のネットワーク障害を引き起こすループが発生しているか否か,又は当該ループが発生している別の中継装置の前記第一の中継装置からの方向を判定する判定ステップとを備え,前記統計情報が,前記第一の中継装置の各ポートごとの受信データ量又は受信データ数であり,前記判定ステップでは,前記第一の中継装置の複数のポートのうち,単位時間当たりの受信データ量又は受信データ数が所定のしきい値以上であるポートが2つである場合,前記第一の中継装置で前記ループが発生していると判定し,単位時間当たりの受信データ量が所定のしきい値以上であるポートが1つである場合,当該ポートの下流方向に,当該ループが発生している別の中継装置が存在すると判定することを特徴とする。
本発明の第二のネットワーク障害検出方法は,上記第一の方法において,前記取得ステップの前に,前記ネットワーク障害検出装置における単位時間当たりの受信データ量又は受信データ数に基づいて前記しきい値を設定する設定ステップを備えることを特徴とする。
本発明の第三のネットワーク障害検出方法は,上記第一の方法において,前記判定ステップの前に,前記取得ステップで取得された前記第一の中継装置の各ポートの単位時間当たりの受信データ量又は受信データ数のうちの最大値に基づいて前記しきい値を設定する設定ステップを備えることを特徴とする。
本発明の第四のネットワーク障害検出方法は,複数の端末のうちの第一の端末により実施され,各端末は複数の中継装置のうちの少なくとも一つの中継装置を介して別の端末と接続するネットワークの障害を検出するネットワーク障害検出方法において,前記複数の中継装置のうちの第一の中継装置から,前記第一の中継装置の複数のポートそれぞれで受信するデータに関する統計情報を取得する取得ステップと,前記統計情報に基づいて,前記第一の中継装置で所定のネットワーク障害を引き起こすループが発生しているか否か,又は当該ループが発生している別の中継装置の前記第一の中継装置からの方向を判定する判定ステップとを備え,前記取得ステップの前に,所定のデータ長を有する所定の要求データを複数ブロードキャスト送信する送信ステップを備え,当該所定のデータ長は,前記所定の要求データに対する応答データのデータ長よりも長いことを特徴とする。
本発明の第五のネットワーク障害検出方法は,上記第一の方法において,前記取得ステップでは,第一の中継装置の全てポートのうち,前記ループに関連するインターフェースタイプの複数のポートそれぞれで受信するデータに関する統計情報を取得することを特徴とする。
本発明の第六のネットワーク障害検出方法は,上記第一の方法において,前記第一の中継装置における単位時間当たりの受信データ量が所定のしきい値以上であるポートに対して,遮断要求を送信する送信ステップを備えることを特徴とする。
本発明の第七のネットワーク障害検出方法は,上記第一の方法において,前記取得ステップの前に,前記第一の端末以外のアドレスを発信元アドレスとする複数のデータをブロードキャスト送信する通信回復処理ステップを備えることを特徴とする。
本発明の第八のネットワーク障害検出方法は,上記第一の方法において,前記取得ステップの前に,前記ループ発生時において前記ループ内を周回するデータのデータ長よりも長いデータ長を有する複数のデータをブロードキャスト送信する負荷低減処理ステップを備えることを特徴とする。
本発明の第九のネットワーク障害検出方法は,上記第一の方法において,前記ネットワーク障害が,前記ループを周回するデータが前記ループからブロードキャスト送信され続けるレイヤ2ループ障害であることを特徴とする。
本発明によれば、ネットワーク内に障害を引き起こすループの発生及びその発生箇所を検出することができる。
また、ネットワークを構成する端末の処理によりループを検出することができ、ネットワークを構成する中継装置の処理を必要とせずにループを検出することができる。すなわち、中継装置に新たな機能を実装させるには比較的大きな労力と時間がかかるが、本発明はそれを必要とせず、アプリケーションプログラムをインストールするだけで容易に新たな機能を付加できる端末で実行する処理であるので、端末に本発明の処理を実施するためのアプリケーションプログラムをインストールし、それを実行することで容易、簡便、汎用的に本発明を実現することができる。
以下、図面を参照して本発明の実施の形態について説明する。しかしながら、かかる実施の形態例が、本発明の技術的範囲を限定するものではない。
ネットワーク障害であるレイヤ2(L2)ループが発生すると、同一ネットワーク(サブネット)内から送出されたブロードキャストパケットは、L2ループを構成する中継装置に到達し、ループを周回するたびに、同一サブネット内全域に送出される。ループ内の周回は、ワイヤースピードで行われるため、結果として、ループを構成する中継装置から同一サブネット内にワイヤースピードでブロードキャストパケットが送出される。このループトラフィックに着目すると、L2ループ発生時は、ループを構成している中継装置がある方向の1ポートから大量にパケットを受信することになる。特に、ループを構成している中継装置では、ループの右回りと左回りが存在するため、2ポートで大量のパケットを受信することになる。
そこで、中継装置のポートごとのパケット受信統計情報を取得し、単位時間あたりのパケット受信量が大きいポートを抽出することで、ループ箇所を特定、又はループ箇所の範囲を限定することが可能となる。具体的には、ある中継装置に大量受信ポートが一つある場合、そのポートの下流方向でL2ループが発生している判断することができる。また、ある中継装置に大量受信ポートが二つある場合、その2つのポートでループが構成され、L2ループが発生していると判断することができる。
図4は、本発明の実施の形態におけるネットワーク障害検出装置の原理構成図である。図4において、ネットワークは、レイヤ2スイッチSW1の配下にレイヤ2スイッチSW2、SW3、SW4が接続され、スイッチSW2、SW3、SW4にそれぞれ端末10、20、30が接続して構成される。端末10がネットワーク障害検出装置であって、ネットワーク障害検出装置の機能として、統計情報取得部11、データ解析部12、通信回復処理部13及び負荷低減処理部14を備える。通信回復処理部13及び負荷低減処理部14の処理については、後述する。図4の例では、スイッチSW2のポート1とポート3でL2ループが発生しており、L2ループよりブロードキャストパケットがワイヤースピードで送出され続け、スイッチSW2では、L2ループを構成するポート1とポート3が大量受信ポートとなり、スイッチSW1、SW3、SW4では、スイッチSW2の方向の各ポート1が大量受信ポートとなる。すなわち、大量受信ポートは、スイッチSW1、SW3、SW4では、一つであり、スイッチSW2では、二つある。
図5は、本発明の実施の形態におけるネットワーク障害検出装置の概略処理フローチャートである。ネットワーク障害検出装置10の統計情報取得部11は、パケット(データ)の送受信機能を有する通信手段であって、探索対象スイッチに各ポートのパケット受信統計情報の送信を要求する統計情報要求を送信し、探索対象スイッチからの応答である統計情報(パケット受信数情報)を取得する(S10)。このとき、統計情報取得部11は、異なる時刻における2つの統計情報を取得し、それらを差分することにより、各ポートにおける単位時間当たりのパケット受信数を求める。
データ解析部12は、探索対象スイッチの各ポートの単位時間当たりのパケット受信数を所定のしきい値と比較して、所定のしきい値以上のパケットを受信するポートの数を判定する(S11)。そして、該当ポートの数が2つの場合は、探索対象スイッチでL2ループが発生していると判断し(S12)、該当ポートの数が一つの場合は、探索対象スイッチのさらに下流方向でL2ループが発生していると判断する(S13)。また、本発明では該当ポートが0の場合は、L2ループは発生しないと判断する(S14)。なお、本実施の形態例では、ネットワーク(サブネット)内に1つのL2ループが発生する場合を想定しており、この場合、しきい値以上のパケットを受信するポート数の上限は2つである。1つのサブネット内に複数のL2ループが発生する可能性はきわめて低く、L2ループ検出処理において、その可能性を考慮しなくてもよい。
なお、統計情報は、各スイッチが保有する自己の管理情報データベース(MIB:Management Information Database)である。MIBは、SNMP(Simple Network Management Protocol)で管理されるネットワーク機器(本実施の形態例における各スイッチ、端末を含む)それぞれの状態を示す情報であり、各ポートで受信するパケット数を有する。なお、MIBは、RFC 1156やRFC 1213で定義されている。以下、本発明の実施の形態例についてさらに詳しく説明する。
図6は、本発明の第一の実施の形態例におけるネットワーク障害検出装置の処理フローチャートである。第一の形態例では、各ポートで受信するデータ量をあらかじめ設定されたしきい値と比較し、データ量がしきい値以上のポートの数に基づいて、L2ループの発生及びその発生箇所を検出する。
ステップS100において、パケットの大量受信を判定するためのデータ量のしきい値があらかじめ設定される。統計情報取得部11は、対象探索スイッチに対して、各ポートの受信データ量を有する統計情報の送信を要求し、対象探索スイッチは当該要求に対して、各ポートの受信データ量を有する統計情報を送信し、統計情報取得部11はそれを取得する(S101)。各ポートの受信データ量を有する統計情報は、ifInOctetsMIBである。
統計情報取得部11は、1回目の統計情報を取得してから所定期間(例えば、1秒)経過すると(S102)、再度、対象探索スイッチに対して、各ポートの受信データ量を有する統計情報の送信を要求し、対象探索スイッチは当該要求に対して、2回目の各ポートの受信データ量を有する統計情報(ifInOctetsMIB)を送信し、統計情報取得部11はそれを取得する(S103)。
データ解析部12は、2回目の統計情報(増分値)から1回目の統計情報(基準値)を差分することにより、各ポートの単位時間当たりの受信データ量を算出する(S104)。統計情報は、ある時刻でのデータ量であるので、時刻の異なる2つの統計情報の差分により、単位時間当たりの受信データ量を求めることができる。
データ解析部12は、各ポートの単位時間当たりの受信データ量を、ステップS100で設定したしきい値と比較し、当該しきい値以上のデータ量を受信するポートの数を判定する(S105)。当該ポートの数が一つの場合は、探索対象スイッチのそのポートの下流方向にL2ループがあると判定する(S106)。当該ポートの数が2つの場合は、探索対象スイッチのそのポート対でL2ループが発生していると判断する(S107)。また、当該ポートの数が0の場合は、L2ループは発生していないと判断する(S108)。
図7及び図8は、本発明の第一の実施の形態例の処理を説明する図である。図7は、ネットワーク障害検出装置10がスイッチSW1の統計情報を取得する例であり、図8は、ネットワーク障害検出装置10がスイッチSW2の統計情報を取得する例である。L2ループの有無を判定するしきい値は、それぞれ80Mbpsに設定されている。
図7では、スイッチSW1の各ポート1、2、3における1回目の統計情報(基準値)と2回目の統計情報(増分値)とが取得され、これらの差分値と、単位時間当たりの受信データ量が算出される。図7から明らかなように、しきい値を超えるデータ量を受信するポート数は、1つであり、そのポートはポート1である。従って、ネットワーク障害検出装置10側からスイッチSW1のポート1の下流方向に、L2ループが発生していると判断される。
図8では、同様に、スイッチSW2の各ポート1、2、3における1回目の統計情報(基準値)と2回目の統計情報(増分値)とが取得され、これらの差分値と、単位時間当たりの受信データ量が算出される。図8に示されるように、しきい値を超えるデータ量を受信するポート数は、2つであり、そのポートはポート1とポート3である。従って、スイッチSW2のポート1とポート3でL2ループが発生していると判断される。
しきい値は、上記図6のステップS100のようにあらかじめ設定されてもよいが、ネットワークの通信状況に応じて動的に設定されてもよい。
図9は、しきい値を動的に設定する第一の方法を示すフローチャートである。ネットワーク障害検出装置10は、自己が受信するブロードキャストパケットのデータ量をカウントし、単位時間あたりの受信データ量を計測する(S201)。そして、算出されたデータ量に基づいてしきい値を設定する(202)。例えば、算出された単位時間当たりの受信データ量の一定倍率がしきい値に設定される。具体的には、単位時間当たりの受信データ量が95Mbps、一定倍率が0.8とすると、しきい値は、76Mbpsとなる。
図10及び図11は、しきい値を動的に設定する第二の方法を説明する図である。第二の方法では、取得した統計情報に含まれる各ポートの受信データ量(又は受信パケット数)のうちの最大値の一定倍率がしきい値に設定される。図10は、スイッチSW1の統計情報及びそれから算出される各ポートの単位時間当たりデータ受信量を示す表である。図10に示されるとおり、単位時間当たりのデータ受信量の最大値は、ポート1の96Mbpsである。一定倍率を0.8とすると、しきい値は、76.8Mbpsとなる。スイッチSW1において、しきい値76.8Mbpsを超えるポートは、ポート1のみであり、図7と同様の判定結果となる。
一定倍率を乗じて求められるしきい値には、下限値が設定されてもよい。いずれのポートも大量受信ポートでない場合があり得るからである。算出されたしきい値が下限値を下回る場合は、下限値がしきい値に設定される。図10及び図11の例の場合、下限値は、例えば8Mbpsである。
図11は、スイッチSW2の統計情報及びそれから算出される各ポートの単位時間当たりのデータ受信量を示す表である。図11に示されるように、単位時間当たりのデータ受信量の最大値は、ポート1の96Mbpsである。一定倍率を0.8とすると、しきい値は、76.8Mbpsとなる。スイッチSW2において、しきい値76.8Mbpsを超えるポートは、ポート1及びポート3であり、図8と同様の判定結果となる。
図12は、本発明の第二の実施の形態例におけるネットワーク障害検出装置の処理フローチャートである。第二の形態例では、第一の実施の形態例におけるデータ量に代わって、各ポートで受信するパケット数をあらかじめ設定されたしきい値と比較し、パケット数がしきい値以上のポートの数に基づいて、L2ループの発生及びその発生箇所を検出する。
ステップS300において、パケットの大量受信を判定するための受信パケット数のしきい値があらかじめ設定される。統計情報取得部11は、対象探索スイッチに対して、各ポートの受信パケット数を有する統計情報の送信を要求し、対象探索スイッチは当該要求に対して、各ポートの受信パケット数を有する統計情報を送信し、統計情報取得部11はそれを取得する(S301)。各ポートの受信パケット数を有する統計情報は、ifInNUCastPacketsMIBである。
統計情報取得部11は、1回目の統計情報を取得してから所定期間(例えば、1秒)経過すると(S302)、再度、対象探索スイッチに対して、各ポートの受信パケット数を有する統計情報の送信を要求し、対象探索スイッチは当該要求に対して、2回目の各ポートの受信パケット数を有する統計情報(ifInNUCastPacketsMIB)を送信し、統計情報取得部11はそれを取得する(S303)。
データ解析部12は、2回目の統計情報(増分値)から1回目の統計情報(基準値)を差分することにより、各ポートの単位時間当たりの受信パケット数を算出する(S304)。統計情報は、ある時刻での受信パケット数であるので、時刻の異なる2つの統計情報の差分により、単位時間当たりの受信パケット数を求めることができる。
データ解析部12は、各ポートの単位時間当たりの受信パケット数を、ステップS100で設定したしきい値と比較し、当該しきい値以上のパケット数を受信するポートの数を判定する(S305)。当該ポートの数が一つの場合は、探索対象スイッチのそのポートの下流方向にL2ループがあると判定する(S306)。当該ポートの数が2つの場合は、探索対象スイッチのそのポート対でL2ループが発生していると判断する(S307)。また、当該ポートの数が0の場合は、L2ループは発生していないと判断する(S308)。
図13及び図14は、本発明の第二の実施の形態例の処理を説明する図である。図13は、ネットワーク障害検出装置10がスイッチSW1の統計情報を取得する例であり、図14は、ネットワーク障害検出装置10がスイッチSW2の統計情報を取得する例である。L2ループの有無を判定するしきい値は、それぞれ8000ppsに設定されている。
図13では、スイッチSW1の各ポート1、2、3における1回目の統計情報(基準値)と2回目の統計情報(増分値)とが取得され、これらの差分値と、単位時間当たりの受信パケット数が算出される。図13に示されるように、しきい値を超えるパケット数を受信するポート数は、1つであり、そのポートはポート1である。従って、ネットワーク障害検出装置10側からスイッチSW1のポート1の下流方向に、L2ループが発生していると判断される。
図14では、同様に、スイッチSW2の各ポート1、2、3における1回目の統計情報(基準値)と2回目の統計情報(増分値)とが取得され、これらの差分値と、単位時間当たりの受信パケット数が算出される。図14に示されるように、しきい値を超えるパケット数を受信するポート数は、2つであり、そのポートはポート1とポート3である。従って、スイッチSW2のポート1とポート3でL2ループが発生していると判断される。
第二の実施の形態例においても、パケット数に関するしきい値は、図9、図10(又は図11)に示したように、ネットワークの通信状況に応じて動的に設定されてもよい。例えば、算出された単位時間当たりの受信パケット数が12000pps、一定倍率が0.8とすると、しきい値は、9600ppsとなる。または、しきい値を、各ポートの受信パケット数のうちの最大値に一定倍率を乗じて算出してもよい。
ところで、L2ループが発生し、L2ループから大量のブロードキャストパケットが送出される場合、そのブロードキャストパケットが宛先からの応答を要求するパケットである場合、ブロードキャストパケットの応答パケットがブロードキャストパケットの送出方向と反対方向に大量に伝送する可能性がある。そうすると、L2ループからのブロードキャストパケットを受信するポートに加えて、応答パケットを受信するポートも大量のパケットを受信することとなり、L2ループの発生箇所又は発生方向を特定できない。
この問題を回避するために、ネットワーク障害検出装置10は、例えば、あらかじめ、パケットサイズが大きいブロードキャストリクエストを大量に送信する。なお、このブロードキャストリクエストの応答パケットのサイズが、ブロードキャストリクエストのパケットサイズよりも十分に小さくなるようなブロードキャストリクエストが選択され、送信される。
図15は、パケットサイズの大きいブロードキャストリクエストを送信する例を説明する図である。アドレス「A」が与えられているネットワーク障害検出装置10は、送信元アドレス「Any」(任意のアドレスであって、存在しない架空のアドレスであってもよい)とし、自己のアドレス「A」を解決するためのブロードキャストARP(Address resolution Protocol)要求をロングサイズ(例えば、1500バイト)で大量(例えば1000個)送信する(Step.1)。ARP要求は、L2ループに達し、それを周回し続けながら(Step.2)、L2ループから送出され(Step.3)、ネットワーク障害検出装置10に返ってくる。ネットワーク障害検出装置10は、受信したARP要求が自己のアドレスの解決を求めるパケットであるため、ARP要求に対して、アドレス「Any」宛てへARP応答をユニキャスト送信する(Step.4)。このARP応答は、64バイトであり、ARP要求のパケットサイズと比較して1/20であり十分に小さい。ARP応答は、L2ループに達し、周回する。
このように、L2ループから送出されるパケットのサイズを、L2ループへ向かうパケットのサイズより十分大きくすることで、L2ループから送出されるパケット受信するポートのみを大量受信ポートとして判断することができるようになる。図15では、スイッチSWPのポート1はARP応答を大量受信するポートであるが、ARP応答のサイズが十分に小さいため、大量受信ポートとは判断されず、スイッチSWQのポート1は、パケットサイズの大きいARP要求を大量に受信するポートなので、大量受信ポートと判断される。
また、ネットワーク障害検出装置は、探索対象スイッチの各ポートのインターフェースをあらかじめ取得し、L2ループに関連するインターフェースのポートのみを探索対象とするようにしてもよい。L2ループは、ethernet(登録商標)で識別できる障害であり、ネットワーク障害検出装置は、ethernet(登録商標)に関連するインターフェースのポートのみから、統計情報を取得する。
図16は、探索対象スイッチのポートからL2ループに関連するポートを抽出する処理のフローチャートである。また、図17は、当該処理を説明する図である。ネットワーク障害検出装置は、L2ループ検出に利用するポートのインターフェース(IF)タイプ情報のテーブルをあらかじめ保持している(S400)。図17(a)は、当該IFタイプテーブルの例であり、IFタイプテーブルは、ethernet(登録商標)に関連するインターフェースタイプ情報を有する。
ネットワーク障害検出装置10は、探索対象スイッチに対して、各ポートのインターフェースの通知要求を送信し、あらかじめ探索対象スイッチから各ポートのインターフェースタイプ情報を取得する(S401)。図17(b)は、取得した各ポート(番号1−10)のインターフェースタイプ情報の例であり、ポート1−6はfastEther、ポート7−8はgigabitEthernet(登録商標)、ポート9−10はATM(asynchronous Transfer Mode)である。 探索対象スイッチが送信する各ポートのインターフェースタイプ情報は、例えば、ifTypeMIBである。ネットワーク障害検出装置10は、取得したインターフェースタイプ情報に基づき、上記IFタイプテーブルに含まれるインターフェースタイプのポートを抽出し(S402)、それを探索対象スイッチにおける探索対象ポートに設定する(S403)。図17の例では、ポート1−8が探索対象ポートに設定される。
上述した実施の形態例により、L2ループを構成しているスイッチが特定された場合、さらに、そのL2ループを回避する処理が行われてもよい。図4の例において、ネットワーク障害検出装置は、L2ループを構成するスイッチSW2のポート1又はポート3のいずれかに対して、ポートを遮断するコマンドをスイッチSW2に送信する。コマンドは、例えば、ポート1又はポート3のifAdminStatusMIBをダウンさせるSNMPsetコマンドである。これにより、L2ループの発生箇所の検出のみならず、L2ループの回避も可能となる。また、スイッチSW1のポート1を遮断することにより、その下流にあるL2ループが回避されてもよい。ネットワーク障害検出装置10は、スイッチSW1に対して、ポート1を遮断するコマンドを送信する。
また、本発明の実施の形態における処理を行う前に、探索対象スイッチから統計情報を取得するために、探索対象スイッチのアドレスを取得する必要がある。
図18は、探索対象スイッチのアドレスを取得するための処理フローチャートである。ネットワーク障害検出装置10は、探索対象ネットワークのブロードキャストアドレスに対して、所定のMIB取得要求であるSNMPgetコマンドを送信する(S500)。当該SNMPgetコマンドに応答可能なスイッチからの応答パケットをネットワーク障害検出装置10は受信し、その受信した応答パケットから送信元アドレスを抽出する(S501)。これにより、探索対象スイッチのアドレスを取得することができる。抽出したアドレスは探索対象スイッチのアドレスに設定される(S502)。
L2ループが発生していると、ネットワーク(サブネット)内のスイッチから応答パケットを受信できない可能性が高いので、例えば、ネットワーク内の通信が正常であることが明らかな場合(L2ループが発生していないことが明らかな場合)に、本アドレス取得処理が行われるのが好ましい。
また、スイッチのアドレス(MACアドレス)の先頭3バイトは、スイッチのベンダを識別するOUI(Organizationally Unique Identifier)であり、ネットワーク障害検出装置は、探索対象スイッチのベンダ特性を考慮した処理を行ってもよい。
例えば、あるベンダのスイッチは、受信パケット数に関する統計情報を有さず、受信データ量に関する統計情報のみを有している場合、受信データ量を利用する第一の実施の形態による処理を実施する必要がある。ネットワーク障害検出装置は、ベンダ識別情報(OUI)とそれに対応する処理のテーブルをあらかじめ保持しておき、ベンダ識別情報に基づいて、探索対象スイッチのベンダ特性に合った処理を実行する。
ところで、「背景技術」の項で説明したように、L2ループが発生している状態で、端末からブロードキャストパケットが送信されると、その端末とL2ループが発生している箇所までの経路上のスイッチは、その端末のアドレスを誤学習する。従って、例えば、スイッチSW2でL2ループが発生している状態で、本発明のL2ループ検出処理を行う前に、端末10(ネットワーク障害検出装置)からなんらかのブロードキャストパケットが送信されると、端末10のアドレスもL2ループ方向に誤学習されてしまう。そうすると、ネットワーク障害検出装置10からの統計情報要求に対して、探索対象スイッチが統計情報を送信する場合、誤学習された方向に統計情報が送信されてしまい、ネットワーク障害検出装置(端末10)は、統計情報を受信できないおそれがある。
そこで、本発明の実施の形態例では、ネットワーク障害検出装置が統計情報を取得できないという不都合な状況を回避するため、通信回復処理部13が探索対象スイッチとの通信をあらかじめ回復させるための処理(通信回復処理)を実施する。
ネットワーク障害検出装置の通信回復処理部13は、自己のMACアドレス以外のMACアドレスを送信元アドレスとするブロードキャストパケット(以下、ダミーパケットと称す)を連続的に複数送信する。ダミーパケットがブロードキャスト送信されると、L2ループに到達し、周回し始める。L2ループが発生しているスイッチSW2の入力ポートには、このダミーパケットが入力されるとともに、すでに周回し続けている既存のブロードキャストパケットも入力されるため、1出力2入力状態となる。そして、このダミーパケットを連続的且つ大量に送信することで、出力キュー又は入力キューが許容値を超え、パケットが廃棄されるようになり、さらに、ダミーパケットを送り続けることにより、ネットワーク障害装置を発信元とするブロードキャストパケットがダミーパケットに置き換えられていき、最終的に、周回するブロードキャストパケットは全てダミーパケットに置き換えられる。これにより、L2ループからネットワーク障害検出装置を発信元とするブロードキャストパケットが送信されなくなり、ネットワーク内の全スイッチにおける探索対象端末のアドレスの誤学習が解消し、探索対象スイッチとネットワーク障害検出装置との通信を回復することができる。
ダミーパケットの送信元アドレスは、ネットワーク障害検出装置のMACアドレス以外のMACアドレスであればよく、実在しない架空のアドレスでもよいし、他の実在する端末のMACアドレスでもよい。ただし、この場合、この実在する端末と通信する場合は、再度、上記通信回復処理を行う必要が生じる。
ネットワーク障害検出装置は、上記通信回復処理を行った後、探索対象スイッチに対して統計情報要求を送信し、上述したL2ループを検出する処理を実施する。
また、「背景技術」の項で説明したように、L2ループが発生すると、L2ループが発生しているスイッチからブロードキャストパケットが送信され続けるブロードキャストストーム現象が生じ、ネットワーク内の全ての端末は高負荷状態となる。高負荷状態において本実施の形態例におけるL2ループ検出処理を実施すると、ネットワーク障害検出装置及び探索対象スイッチそれぞれの処理速度が遅延し、又は処理が停止し、さらにパケットの伝送速度も遅延するおそれがある。
ブロードキャストパケットの受信は、ネットワーク上の端末やスイッチで割り込み処理を発生させるため、CPU利用率が高負荷状態となり、他の処理が行われない又は処理速度が遅延するなどの重大な障害が発生する。特に、ブロードキャストパケットは、ARPのように、特定の端末からの応答を要求するパケットであることが多く、応答すべき端末に大量のブロードキャストパケットが到達すると、応答処理の負荷も加わるため、さらに高負荷状態になる。
そのため、例えば、統計情報要求に対する探索対象スイッチからの統計情報の送信処理が遅延したり、又は統計情報が送信されず、ネットワーク障害検出装置が正常に統計情報を受信できない可能性が生じる。
そこで、本発明の実施の形態例では、高負荷の影響により統計情報を受信できないという不都合な状況を回避するため、負荷低減処理部14がネットワークの負荷を低減させるための処理(負荷低減処理)を実施する。
L2ループに伴うブロードキャストストームによるネットワーク内の機器(端末及びスイッチを含む)の高負荷の原因は、ブロードキャストパケットの単位時間あたりの受信数が、各端末の処理能力の限界に近い又は限界を超えるほど膨大となることが原因であり、単位時間あたりのブロードキャストパケットの受信数を減少させることで、各端末の負荷を低減させることができる。
そのために、ネットワーク障害検出装置の負荷低減処理部14は、パケット長が長いロングパケットをブロードキャストパケットとして連続的に送信し続ける。ネットワーク内では、ARP、RIP、NetBIOSなどのブロードキャストパケットが頻繁に送信されており、L2ループ発生にL2ループ内の周回するパケットも、これらのパケットが支配的である。特に、ARPは、パケット長64バイト程度、NetBIOSでもパケット長200バイト程度と短い。L2ループが発生すると、L2ループを構成している伝送路速度でこれらのショートパケットがネットワーク全域にブロードキャストされる。例えば、ARPパケットのみが100MbpsのL2ループで周回した場合、理論上1秒間に14万パケットがL2ループからネットワーク全域に対してブロードキャスト送信される。
負荷低減処理部14は、例えば1500バイト程度のロングパケットを連続的に送信する。L2ループ内では、64バイト程度のパケットが入力されるとともに、1500バイトのパケットも入力され、これが連続的に入力されるため、入力キュー又は出力キューが許容値を超える。そうなると、64バイト程度のショートパケットが廃棄されていき、最終的に64バイトのパケット全てが廃棄され、1500バイトのパケットのみが周回する状態にすることができる。1500バイトのパケットのみが周回する状態では、L2ループからブロードキャスト送信されるパケットは、1秒間に8000パケットとなり、64バイトの場合と比べて、単位時間当たりのパケット受信数を約1/20程度に減少させることができる。この結果、各端末の負荷は低減され、疎通確認処理が行える程度に負荷状態を回復させることができる。
ネットワーク障害検出装置は、上記負荷低減処理を行った後、探索対象スイッチに対して統計情報要求を送信し、上述したL2ループを検出する処理を実施する。
さらに、上記通信回復処理と負荷低減処理とを同時に行うために、通信回復処理として用いるネットワーク障害検出装置のMACアドレス以外のMACアドレスを送信元アドレスとするブロードキャストパケット(ダミーパケット)をロングパケット化して連続的に複数送信することで、負荷低減処理も同時に行うことができる。
(付記1)
複数の端末のうちの第一の端末であって、各端末は複数の中継装置のうちの少なくとも一つの中継装置を介して別の端末と接続するネットワークの障害を検出するネットワーク障害検出装置において、
前記複数の中継装置のうちの第一の中継装置から、前記第一の中継装置の複数のポートそれぞれで受信するデータに関する統計情報を取得する通信部と、
前記統計情報に基づいて、前記第一の中継装置で所定のネットワーク障害を引き起こすループが発生しているか否か、又は当該ループが発生している別の中継装置の前記第一の中継装置からの方向を判定する判定部とを備えることを特徴とするネットワーク障害検出装置。
(付記2)
付記1において、
前記統計情報は、前記第一の中継装置の各ポートごとの受信データ量又は受信データ数であることを特徴とするネットワーク障害検出装置。
(付記3)
付記2において、
前記判定部は、前記第一の中継装置の複数のポートのうち、単位時間当たりの受信データ量又は受信データ数が所定のしきい値以上であるポートが2つである場合、前記第一の中継装置で前記ループが発生していると判定し、単位時間当たりの受信データ量が所定のしきい値以上であるポートが1つである場合、当該ポートの下流方向に、当該ループが発生している別の中継装置が存在すると判定することを特徴とするネットワーク障害検出装置。
(付記4)
付記3において、
前記しきい値は、前記ネットワーク障害検出装置における単位時間当たりの受信データ量又は受信データ数に基づいて設定されることを特徴とするネットワーク障害検出装置。
(付記5)
付記3において、
前記しきい値は、前記第一の中継装置の各ポートの単位時間当たりの受信データ量又は受信データ数のうちの最大値に基づいて設定されることを特徴とするネットワーク障害検出装置。
(付記6)
付記1において、
前記通信部は、前記統計情報を取得する前に、所定のデータ長を有する所定の要求データを複数ブロードキャスト送信し、当該所定のデータ長は、前記所定の要求データに対する応答データのデータ長よりも長いことを特徴とするネットワーク障害検出装置。
(付記7)
付記1において、
前記通信部は、第一の中継装置の全てポートのうち、前記ループに関連するインターフェースタイプの複数のポートそれぞれで受信するデータに関する統計情報を取得することを特徴とするネットワーク障害検出装置。
(付記8)
付記1において、
前記通信部は、前記第一の中継装置における単位時間当たりの受信データ量が所定のしきい値以上であるポートに対して、遮断要求を送信することを特徴とするネットワーク障害検出装置。
(付記9)
付記1において、
前記ネットワーク障害検出装置以外のアドレスを発信元アドレスとする複数のデータをブロードキャスト送信する通信回復処理部を備え、
前記通信回復処理部は、前記通信部が前記統計情報を取得する前に、前記複数のデータをブロードキャスト送信することを特徴とするネットワーク障害検出装置。
(付記10)
付記1において、
前記ループ発生時において前記ループ内を周回するデータのデータ長よりも長いデータ長を有する複数のデータをブロードキャスト送信する負荷低減処理部を備え、
前記負荷低減処理部は、前記通信部が前記統計情報を取得する前に、前記複数のデータをブロードキャスト送信することを特徴とするネットワーク障害検出装置。
(付記11)
付記1において、
前記ネットワーク障害は、前記ループを周回するデータが前記ループからブロードキャスト送信され続けるレイヤ2ループ障害であることを特徴とするネットワーク障害検出装置。
(付記12)
複数の端末のうちの第一の端末により実施され、各端末は複数の中継装置のうちの少なくとも一つの中継装置を介して別の端末と接続するネットワークの障害を検出するネットワーク障害検出方法において、
前記複数の中継装置のうちの第一の中継装置から、前記第一の中継装置の複数のポートそれぞれで受信するデータに関する統計情報を取得する取得ステップと、
前記統計情報に基づいて、前記第一の中継装置で所定のネットワーク障害を引き起こすループが発生しているか否か、又は当該ループが発生している別の中継装置の前記第一の中継装置からの方向を判定する判定ステップとを備えることを特徴とするネットワーク障害検出方法。
(付記13)
付記12において、
前記統計情報は、前記第一の中継装置の各ポートごとの受信データ量又は受信データ数であることを特徴とするネットワーク障害検出方法。
(付記14)
付記13において、
前記判定ステップでは、前記第一の中継装置の複数のポートのうち、単位時間当たりの受信データ量又は受信データ数が所定のしきい値以上であるポートが2つである場合、前記第一の中継装置で前記ループが発生していると判定し、単位時間当たりの受信データ量が所定のしきい値以上であるポートが1つである場合、当該ポートの下流方向に、当該ループが発生している別の中継装置が存在すると判定することを特徴とするネットワーク障害検出方法。
(付記15)
付記14において、
前記取得ステップの前に、前記ネットワーク障害検出装置における単位時間当たりの受信データ量又は受信データ数に基づいて前記しきい値を設定する設定ステップを備えることを特徴とするネットワーク障害検出方法。
(付記16)
付記14において、
前記判定ステップの前に、前記取得ステップで取得された前記第一の中継装置の各ポートの単位時間当たりの受信データ量又は受信データ数のうちの最大値に基づいて前記しきい値を設定する設定ステップを備えることを特徴とするネットワーク障害検出方法。
(付記17)
付記12において、
前記取得ステップの前に、所定のデータ長を有する所定の要求データを複数ブロードキャスト送信する送信ステップを備え、当該所定のデータ長は、前記所定の要求データに対する応答データのデータ長よりも長いことを特徴とするネットワーク障害検出方法。
(付記18)
付記12において、
前記取得ステップでは、第一の中継装置の全てポートのうち、前記ループに関連するインターフェースタイプの複数のポートそれぞれで受信するデータに関する統計情報を取得することを特徴とするネットワーク障害検出装置。
(付記19)
付記12において、
前記第一の中継装置における単位時間当たりの受信データ量が所定のしきい値以上であるポートに対して、遮断要求を送信する送信ステップを備えることを特徴とするネットワーク障害検出方法。
(付記20)
付記12において、
前記取得ステップの前に、前記第一の端末以外のアドレスを発信元アドレスとする複数のデータをブロードキャスト送信する通信回復処理ステップを備えることを特徴とするネットワーク障害検出方法。
(付記21)
付記12において、
前記取得ステップの前に、前記ループ発生時において前記ループ内を周回するデータのデータ長よりも長いデータ長を有する複数のデータをブロードキャスト送信する負荷低減処理ステップを備えることを特徴とするネットワーク障害検出方法。
(付記22)
付記12において、
前記ネットワーク障害は、前記ループを周回するデータが前記ループからブロードキャスト送信され続けるレイヤ2ループ障害であることを特徴とするネットワーク障害検出方法。
レイヤ2ループによるネットワーク障害を説明する図である。 レイヤ2ループによるネットワーク障害を説明する図である。 レイヤ2ループによるネットワーク障害を説明する図である。 本発明の実施の形態におけるネットワーク障害検出装置の原理構成図である。 本発明の実施の形態におけるネットワーク障害検出装置の概略処理フローチャートである。 本発明の第一の実施の形態例におけるネットワーク障害検出装置の処理フローチャートである。 本発明の第一の実施の形態例の処理を説明する図である。 本発明の第一の実施の形態例の処理を説明する図である。 しきい値を動的に設定する第一の方法を示すフローチャートである。 しきい値を動的に設定する第二の方法を説明する図である。 しきい値を動的に設定する第二の方法を説明する図である。 本発明の第二の実施の形態例におけるネットワーク障害検出装置の処理フローチャートである。 本発明の第二の実施の形態例の処理を説明する図である。 本発明の第二の実施の形態例の処理を説明する図である。 パケットサイズの大きいブロードキャストリクエストを送信する例を説明する図である。 探索対象スイッチのポートからL2ループに関連するポートを抽出する処理のフローチャートである。 探索対象スイッチのポートからL2ループに関連するポートを抽出する処理を説明する図である。 探索対象スイッチのアドレスを取得するための処理フローチャートである。
符号の説明
10:ネットワーク障害検出装置、20、30:端末、SW1〜SW7:レイヤ2スイッチ、11:統計情報取得部、12:データ解析部、13:通信回復処理部、14:負荷低減処理部

Claims (8)

  1. 複数の端末のうちの第一の端末であって,各端末は複数の中継装置のうちの少なくとも一つの中継装置を介して別の端末と接続するネットワークの障害を検出するネットワーク障害検出装置において,
    前記複数の中継装置のうちの第一の中継装置から,前記第一の中継装置の複数のポートそれぞれで受信するデータに関する統計情報を取得する通信部と,
    前記統計情報に基づいて,前記第一の中継装置で所定のネットワーク障害を引き起こすループが発生しているか否か,又は当該ループが発生している別の中継装置の前記第一の中継装置からの方向を判定する判定部とを備え,
    前記統計情報は,前記第一の中継装置の各ポートごとの受信データ量又は受信データ数であり,
    前記判定部は,前記第一の中継装置の複数のポートのうち,単位時間当たりの受信データ量又は受信データ数が所定のしきい値以上であるポートが2つである場合,前記第一の中継装置で前記ループが発生していると判定し,単位時間当たりの受信データ量が所定のしきい値以上であるポートが1つである場合,当該ポートの下流方向に,当該ループが発生している別の中継装置が存在すると判定することを特徴とするネットワーク障害検出装置。
  2. 複数の端末のうちの第一の端末であって,各端末は複数の中継装置のうちの少なくとも一つの中継装置を介して別の端末と接続するネットワークの障害を検出するネットワーク障害検出装置において,
    前記複数の中継装置のうちの第一の中継装置から,前記第一の中継装置の複数のポートそれぞれで受信するデータに関する統計情報を取得する通信部と,
    前記統計情報に基づいて,前記第一の中継装置で所定のネットワーク障害を引き起こすループが発生しているか否か,又は当該ループが発生している別の中継装置の前記第一の中継装置からの方向を判定する判定部とを備え,
    前記通信部は,前記統計情報を取得する前に,所定のデータ長を有する所定の要求データを複数ブロードキャスト送信し,当該所定のデータ長は,前記所定の要求データに対する応答データのデータ長よりも長いことを特徴とするネットワーク障害検出装置。
  3. 複数のレイヤ2スイッチと,該複数のレイヤ2スイッチの少なくとも一つを介して通信を行う複数の装置と,を備えた通信システムにおけるレイヤ2ループの発生箇所の探索を行う装置において,
    前記複数のレイヤ2スイッチのうちの1つのレイヤ2スイッチが備える2つのポートにおける受信データ数又は受信データ量が,閾値を超えることを検出した場合に,該1つのレイヤ2スイッチにおいてレイヤ2ループが発生していると判定する判定手段,
    を備えたことを特徴とするレイヤ2ループの発生箇所の探索を行う装置。
  4. 請求項3において,
    前記判定手段は,前記2つのポート間でレイヤ2ループが形成されていると判定する,ことを特徴とするレイヤ2ループの発生箇所の探索を行う装置。
  5. 複数のレイヤ2スイッチと,該複数のレイヤ2スイッチの少なくとも一つを介して通信を行う複数の装置と,を備えた通信システムにおけるレイヤ2ループの発生箇所の探索を行う装置において,
    前記複数のレイヤ2スイッチのうちの1つのレイヤ2スイッチが備える1以下のポートにおける受信データ数又は受信データ量が閾値を超えることを検出した場合に,前記複数のレイヤ2スイッチのうち,該1つのレイヤ2スイッチの下流側のレイヤ2スイッチにおいてレイヤ2ループが発生していると判定する判定手段,
    を備えたことを特徴とするレイヤ2ループの発生箇所の探索を行う装置。
  6. 複数のレイヤ2スイッチと,該複数のレイヤ2スイッチの少なくとも一つを介して通信を行う複数の装置と,を備えた通信システムにおけるレイヤ2ループの発生箇所の探索を行う方法において,
    前記複数の装置のうちのいずれか一つの装置によって,前記複数のレイヤ2スイッチのうちの1つのレイヤ2スイッチが備える2つのポートにおける受信データ数又は受信データ量が,閾値を超えることを検出した場合に,該一つのレイヤ2スイッチにおいてレイヤ2ループが発生していると該一つの装置によって判定する,
    ことを備えたことを特徴とするレイヤ2ループの発生箇所の探索を行う方法。
  7. 請求項において,
    前記判定手段は,前記2つのポート間でレイヤ2ループが形成されていると判定する,ことを特徴とするレイヤ2ループの発生箇所の探索を行う装置。
  8. 複数のレイヤ2スイッチと,該複数のレイヤ2スイッチの少なくとも一つを介して通信を行う複数の装置と,を備えた通信システムにおけるレイヤ2ループの発生箇所の探索を行う装置において,
    前記複数の装置のうちのいずれか一つの装置によって,前記複数のレイヤ2スイッチのうちの1つのレイヤ2スイッチが備える1以下のポートにおける受信データ数又は受信データ量が閾値を超えることを検出した場合に,前記複数のレイヤ2スイッチのうち,該1つのレイヤ2スイッチの下流側のレイヤ2スイッチにおいてレイヤ2ループが発生していると該一つの装置によって判定する,
    ことを備えたことを特徴とするレイヤ2ループの発生箇所の探索を行う方法。
JP2005179294A 2005-06-20 2005-06-20 ネットワーク障害検出装置及びネットワーク障害検出方法 Expired - Fee Related JP4794917B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005179294A JP4794917B2 (ja) 2005-06-20 2005-06-20 ネットワーク障害検出装置及びネットワーク障害検出方法
US11/229,689 US7545750B2 (en) 2005-06-20 2005-09-20 Apparatus and method for detecting network failure

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005179294A JP4794917B2 (ja) 2005-06-20 2005-06-20 ネットワーク障害検出装置及びネットワーク障害検出方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011034366A Division JP5177246B2 (ja) 2011-02-21 2011-02-21 ネットワーク障害検出装置及びネットワーク障害検出方法

Publications (2)

Publication Number Publication Date
JP2006352763A JP2006352763A (ja) 2006-12-28
JP4794917B2 true JP4794917B2 (ja) 2011-10-19

Family

ID=37573249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005179294A Expired - Fee Related JP4794917B2 (ja) 2005-06-20 2005-06-20 ネットワーク障害検出装置及びネットワーク障害検出方法

Country Status (2)

Country Link
US (1) US7545750B2 (ja)
JP (1) JP4794917B2 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006074286A (ja) * 2004-08-31 2006-03-16 Fujitsu Ltd 伝送装置
US8018835B1 (en) * 2005-12-30 2011-09-13 At&T Intellectual Property Ii, L.P. Method and apparatus for analyzing service disruptions in a communication network
JP4671288B2 (ja) * 2006-03-02 2011-04-13 Kddi株式会社 Macブリッジングネットワークにおけるループ発生方向判定方式およびループ切り離し方式
US8363805B2 (en) * 2006-06-22 2013-01-29 Burns Jr James M Media terminal adapter (MTA) initialization process display by use of an embedded caller name and caller identification
EP2039073A1 (en) * 2006-07-07 2009-03-25 Panasonic Corporation Apparatus for controlling tunneling loop detection
US8675856B2 (en) * 2006-08-01 2014-03-18 Cisco Technology, Inc. Media terminal adapter (MTA) routing of telephone calls based on caller identification information
US8233491B2 (en) * 2006-09-28 2012-07-31 Burns Jr James M Embedded media terminal adapter (EMTA) endpoint redirect mode
US8526583B2 (en) * 2006-09-29 2013-09-03 James M. Burns, JR. Media terminal adapter (MTA) local ringback option
US20080130503A1 (en) * 2006-12-01 2008-06-05 Gideon Kaempfer Method and system for forwarding ethernet frames over redundant networks with all links enabled
WO2008111212A1 (ja) * 2007-03-15 2008-09-18 Fujitsu Limited 情報処理装置、ノード位置取得方法およびプログラム
US7835297B2 (en) * 2007-06-29 2010-11-16 World Wide Packets, Inc. Determining the state of a tunnel with respect to a control protocol
US7773541B2 (en) * 2007-06-29 2010-08-10 World Wide Packets, Inc. Obtaining identification information for a neighboring network element
US7778201B2 (en) * 2007-06-29 2010-08-17 World Wide Packets, Inc. Determining a logical neighbor of a network element
US8805982B1 (en) 2007-06-29 2014-08-12 Ciena Corporation Progressively determining a network topology and using neighbor information to determine network topology
JP4973734B2 (ja) 2007-09-26 2012-07-11 富士通株式会社 ネットワーク監視システム、経路抽出方法、プログラム、及びプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5065941B2 (ja) * 2008-02-29 2012-11-07 アラクサラネットワークス株式会社 スイッチ装置およびネットワークシステム
US7865593B2 (en) * 2008-08-07 2011-01-04 At&T Intellectual Property I, L.P. Apparatus and method for managing a network
JP5322987B2 (ja) * 2010-03-29 2013-10-23 東日本電信電話株式会社 故障検出装置
CN102281171B (zh) * 2011-08-30 2013-09-11 北京华为数字技术有限公司 二层网络的环路检测方法及设备
US9621432B2 (en) * 2014-07-31 2017-04-11 Gci Communication Corp. Diagnostics of deployed devices based on network traffic
JP6388436B2 (ja) * 2014-08-29 2018-09-12 アライドテレシスホールディングス株式会社 ネットワーク機器、通信方法、プログラム、記録媒体
CN111431768B (zh) * 2020-03-27 2023-03-28 深圳市三旺通信股份有限公司 一种端口自环检测和保护的方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001197114A (ja) 2000-01-14 2001-07-19 Fujitsu Ltd フレーム中継装置
US6836462B1 (en) * 2000-08-30 2004-12-28 Cisco Technology, Inc. Distributed, rule based packet redirection
JP2004222106A (ja) * 2003-01-17 2004-08-05 Fujitsu Ltd スパニングツリープロトコル使用のlanにおけるループ発生の検出及び解除方法並びに中継装置
JP2004360305A (ja) 2003-06-05 2004-12-24 Mitsubishi Heavy Ind Ltd 浮消波堤
JP4137728B2 (ja) * 2003-07-09 2008-08-20 エスアイアイ・ネットワーク・システムズ株式会社 ブリッジ装置、及び該装置のブリッジ処理方法
JP4087319B2 (ja) * 2003-09-11 2008-05-21 富士通株式会社 ブリッジ装置
US20050099949A1 (en) * 2003-11-10 2005-05-12 Nortel Networks Limited Ethernet OAM domains and ethernet OAM frame format

Also Published As

Publication number Publication date
US20060285487A1 (en) 2006-12-21
JP2006352763A (ja) 2006-12-28
US7545750B2 (en) 2009-06-09

Similar Documents

Publication Publication Date Title
JP4794917B2 (ja) ネットワーク障害検出装置及びネットワーク障害検出方法
JP4704120B2 (ja) ネットワーク障害検出装置及びネットワーク障害検出方法
JP4619940B2 (ja) ネットワーク障害箇所検出装置及びネットワーク障害箇所検出方法
EP1906591B1 (en) Method, device, and system for detecting layer 2 loop
JP5510687B2 (ja) ネットワークシステム、及び通信トラフィック制御方法
US7496055B2 (en) Layer 2 loop detection system
US8274911B2 (en) Network monitoring system and path extracting method
WO2006107133A1 (en) Ip management method and apparatus for protecting/blocking specific ip address or specific device on network
CN111682989B (zh) 一种端口链路状态的检测方法、设备及系统
US10897481B2 (en) Relay device, method and non-transitory computer-readable storage medium
US7813303B2 (en) Network fault detection apparatus
CN114629822A (zh) 链路检测方法、装置、电子设备及存储介质
EP1710958B1 (en) Method and apparatus for detecting topology of network
JP4611863B2 (ja) ループ検出方法およびループ検出装置
JP4087319B2 (ja) ブリッジ装置
JP5177246B2 (ja) ネットワーク障害検出装置及びネットワーク障害検出方法
US20090316599A1 (en) Information processing apparatus
US7870285B2 (en) Mitigating subscriber side attacks in a cable network
Cisco Command Descriptions (A-Show Interfaces)
JP2009302611A (ja) 通信ネットワークにおける帯域制御方法及び該方法を実行するための通信装置
EP3687131A1 (en) Method, apparatus and system for rapidly restoring service during path switching
CN112187676B (zh) 一种交换机端口恢复的方法和设备
JP2009027438A (ja) フレーム転送装置
JP2003318984A (ja) Pdu観測方法、コネクションレス型データ通信装置、およびpdu観測装置
CN112887164A (zh) 广播风暴诊断方法、装置和计算机存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080523

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110726

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110727

R150 Certificate of patent or registration of utility model

Ref document number: 4794917

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140805

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees