JP5373042B2 - ネットワーク障害検知方法及びネットワーク装置 - Google Patents

ネットワーク障害検知方法及びネットワーク装置 Download PDF

Info

Publication number
JP5373042B2
JP5373042B2 JP2011264740A JP2011264740A JP5373042B2 JP 5373042 B2 JP5373042 B2 JP 5373042B2 JP 2011264740 A JP2011264740 A JP 2011264740A JP 2011264740 A JP2011264740 A JP 2011264740A JP 5373042 B2 JP5373042 B2 JP 5373042B2
Authority
JP
Japan
Prior art keywords
network
failure
fcs error
failure detection
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011264740A
Other languages
English (en)
Other versions
JP2013118489A (ja
Inventor
剛治 松下
義夫 梶山
史一 犬塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011264740A priority Critical patent/JP5373042B2/ja
Publication of JP2013118489A publication Critical patent/JP2013118489A/ja
Application granted granted Critical
Publication of JP5373042B2 publication Critical patent/JP5373042B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Detection And Prevention Of Errors In Transmission (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、通信ネットワークにおいて通信経路故障などの障害発生時にその障害を検知するネットワーク障害検知方法及びネットワーク装置に関する。
近年の急速な情報化社会の進展に伴い、通信ネットワークは社会を支えるインフラストラクチャとして重要な役割を担っている。このため、通信ネットワークサービスの通信断が与える社会への影響は大きなものとなってきており、通信事業者にとって、通信ネットワークサービスの障害発生時に、迅速に検知することが重要な課題となっている。一方で、ネットワークサービスの障害が発生していないにもかからず、ネットワークサービスの障害と検知する誤検知は、不要な障害対応の発生や冗長通信経路への切り替えの発生などを招くため、避ける必要がある。
通信事業者によるネットワークサービスの障害検知については、通信路のリンクダウン検出、通信経路状態を監視する検査フレームの到達有無により行うことができる。例えば、通信経路状態を監視する検査フレームの到達有無により、冗長通信経路へ切り替える手法については、イーサネット(登録商標)OAMを用いた切替制御方式(例えば、非特許文献2を参照。)等が挙げられる。
但し、これらの方式は、異常検知精度を高めようとした場合には、検査フレームの送出頻度を上げることにより帯域を圧迫する、逆に、検査フレームの送出頻度を低くした場合には、異常検知までに時間がかかるなどの課題がある。
このような課題を解決する方法として、イーサネット(登録商標)技術を用いた通信ネットワークでは、FCS(Frame Check Sequence)エラーフレームの発生有無を用いて、故障検知を行う方法があり、保守運用機能の故障監視機能として実現されている例がある(例えば、非特許文献3を参照。)。
IEEE802.3規格(非特許文献1を参照。)やDIX規格で規定されている、イーサネット(登録商標)における基本的なフレーム形式には、そのフレーム終端部分にFCSフィールドが設けてある。FCSとは、当該フレームデータの誤り検出、および訂正を行うために、フレーム内に付け加えられるチェックサム符号のことである。
イーサネット(登録商標)フレームを送信するネットワーク装置は、そのフレームのヘッダとペイロードデータからCRC(Cyclic Redundancy Check:巡回冗長検査)値を計算し、その計算結果をフレームのFCSフィールドに格納してから、フレームを送信する。FCSが付加されたフレームを受信したネットワーク装置は、同じアルゴリズムでCRC値を再計算し、フレームに格納されているCRC値と、受信時に再計算した結果が同値であるかを比較することによって、そのフレームデータの正常性(受信データに誤りがないか)を確認することができる。
但し、FCSエラーフレームは、IEEEで規定されている伝送路品質(例えば、BER<10−12)を満たす場合でも、一定の確率で自然発生する。FCSエラーフレームの発生有無を用いたネットワークサービスの障害発生検知方法としては、ある観測期間内において発生したFCSエラーフレーム数を計数しておき、この計数されたFCSエラーフレーム数とあらかじめ設定した閾値とを比較することで、ネットワークサービスの障害を検知することが可能である。
IEEE802.3 イーサネット(登録商標)ワークにおける切替制御方式の検討(信学技報:CS2004−79) 高信頼エッジルータType−X40(NTT技術ジャーナル:Vol.15, No.6)
現在のFCSエラーフレームの発生有無を用いた、ネットワークサービスの障害発生検知方法では、ある観測期間内において発生したFCSエラーフレーム数を計数し、あらかじめ設定した異常検出閾値と比較することで実現している。
イーサネット(登録商標)技術を用いた通信ネットワークにおいては、トラフィック量は常時大きく変動するため、トラフィック量に応じて、FCSエラーフレームの発生数が異なる。トラフィック量が少ない場合には、FCSエラーフレーム数が少なく、あらかじめ設定された異常検出閾値を超えないため、ネットワークサービスの障害が発生している時にその発生を検知しないという課題を生じる。一方、トラフィック量が少ない場合でも異常を検出できるように、設定する検出閾値を低く設定した場合、ネットワークサービスの障害が発生していない時に誤ってネットワークサービスの障害発生検知を行うという課題を生じる。この課題について、以下に図面を参照しながら詳細を示す。
まず、図7に、ある観測期間内において発生したFCSエラーフレーム数が、あらかじめ設定した閾値xを超えた場合に、ネットワークサービスの障害発生を検知する方法を用いた際のトラフィック量と誤った検知を行うケースの関係を示す。トラフィック量が少ないケースにおいては、自然発生するFCSエラーフレーム数が少ないことから少量のFCSエラーフレーム数でもネットワークサービス障害が発生している確率が高いため、ネットワークサービス障害が発生している時にその発生を検知しない可能性が高くなる。また、トラフィック量が多いケースにおいては、自然発生するFCSエラーフレーム量が多いことから多量のFCSエラーフレーム数でもネットワーク障害が発生していない確率が高いため、ネットワークサービス障害が発生していない時に誤ってネットワークサービス障害の発生検知を行う可能性が高くなる。
次に、図8に、ある観測期間内におけるFCSエラーフレーム発生率が、あらかじめ設定した閾値x’を超えた場合に、ネットワークサービスの障害発生を検知する方法を用いた際の観測期間と誤った検知を行うケースの関係を示す。トラフィック量が少ないケースにおいては、FCSエラーフレームの発生率のばらつきが大きくなる。観測時間が短い場合、たまたま転送されたフレームがFCSエラーフレームとなった場合、ネットワークサービス障害が発生していない時に誤ってネットワークサービス障害の発生検知を行う可能性が高くなる。
上述の課題により、ネットワークサービスの障害が発生している時にその発生を検知しない場合には、冗長通信経路への切り替えなど障害発生時の対処が行われず、通信サービスに過大な影響を与えることになる。また、ネットワークサービスの障害が発生していない時に誤ってネットワークサービスの障害発生検知を行うと、不要な故障対応が発生し、ネットワークサービスの運用に影響を与えることになる。
そこで、前記課題を解決するために、本発明は、通信ネットワークにおけるネットワークサービスの障害検知について、障害が発生しているにもかかわらず検知しない、また、障害が発生していない時に誤って障害発生検知を行うという事象を減少させることができるネットワーク障害検知方法及びネットワーク装置を提供することを目的とする。
前記目標を達成するため、本発明は、トラフィック量に依存せずにネットワークサービスの障害発生を検出するために、検出したFCSエラーフレーム数を補正する、または、FCSエラー発生率を補正することとした。
具体的には、本発明に係る第一のネットワーク障害検知方法は、観測期間内に受信した総フレーム数をネットワークの伝送速度と前記観測期間で定まる最大受信フレーム数で除算して補正係数を取得する補正係数取得ステップと、前記補正係数取得ステップで取得した前記補正係数を前記ネットワークに予め設定された基準閾値に乗算して補正閾値を算出する補正閾値算出ステップと、前記補正閾値算出ステップで算出した前記補正閾値と前記観測期間内に計測したFCSエラーフレーム数とを比較し、前記FCSエラーフレーム数が前記補正閾値より大きいときにネットワーク障害発生と判定し、前記FCSエラーフレーム数が前記補正閾値より大きいときにネットワーク障害発生無と判定する比較判定ステップと、を行う。
ネットワーク障害判定基準となるFCSエラーフレーム数の閾値をトラフィック量に応じて変更することでトラフィック量に依存せずに障害判定が行えることとなる。本発明は、この処理によりネットワーク障害を誤って判定することを避けることが可能となる。
従って、本発明は、通信ネットワークにおけるネットワークサービスの障害検知について、障害が発生しているにもかかわらず検知しない、また、障害が発生していない時に誤って障害発生検知を行うという事象を減少させることができるネットワーク障害検知方法を提供することができる。
また、本発明に係る第二のネットワーク障害検知方法は、観測期間内に計測したFCSエラーフレーム数と予め設定された所定閾値とを比較するFCSエラー発生判定ステップと、前記FCSエラー発生判定ステップで前記FCSエラーフレーム数が前記所定閾値より大きい場合にFCSエラー連続発生回数に1を加算するFCSエラーカウントステップと、前記FCSエラー発生判定ステップで前記FCSエラーフレーム数が前記所定閾値より小さい場合にFCSエラー連続発生回数を0とするFCSエラーリセットステップと、前記FCSエラーカウントステップでカウントされた前記FCSエラー連続発生回数が予め設定された判定閾値より大きいときにネットワーク障害発生と判定し、前記FCSエラー連続発生回数が前記判定閾値より小さいときにネットワーク障害発生無と判定する比較判定ステップと、を行う。
本発明は、ネットワーク障害判定基準となるFCSエラーフレーム数の閾値をFCSエラーフレーム数が連続して超過したことをもってネットワーク障害と判断する。本発明は、この処理によりFCSエラー発生率のばらつきに依存してネットワーク障害を誤って判定することを避けることが可能となる。
従って、本発明は、通信ネットワークにおけるネットワークサービスの障害検知について、障害が発生しているにもかかわらず検知しない、また、障害が発生していない時に誤って障害発生検知を行うという事象を減少させることができるネットワーク障害検知方法を提供することができる。
本発明に係る第三のネットワーク障害検知方法は、観測期間内に計測したFCSエラーフレーム数を前記観測期間内に受信した総フレーム数で除算したFCSエラー率を算出するFCSエラー率算出ステップと、複数の前記観測期間の前記FCSエラー率を比較し、前記FCSエラー率の推移と予め設定された上昇閾値とを比較するFCSエラー率上昇判定ステップと、前記FCSエラー率上昇判定ステップで前記FCSエラー率の推移が前記上昇閾値より大きい場合に、FCSエラー率連続上昇発生回数に1を加算するFCSエラー率連続上昇カウントステップと、前記FCSエラー率上昇判定ステップで前記FCSエラー率の推移が前記上昇閾値より小さい場合にFCSエラー率連続上昇発生回数を0とするFCSエラー率連続上昇リセットステップと、前記FCSエラー率連続上昇カウントステップでカウントされた前記FCSエラー率連続上昇発生回数が予め設定された判定閾値より大きいときにネットワーク障害発生と判定し、前記FCSエラー率連続上昇発生回数が前記判定閾値より小さいときにネットワーク障害発生無と判定する比較判定ステップと、を行う。
本発明は、FCSエラー率の上昇とその連続性でネットワーク障害と判断する。本発明は、この処理により通常の状態に基づいてネットワーク障害を判定することができ、ネットワーク障害を誤って判定することを避けることが可能となる。
従って、本発明は、通信ネットワークにおけるネットワークサービスの障害検知について、障害が発生しているにもかかわらず検知しない、また、障害が発生していない時に誤って障害発生検知を行うという事象を減少させることができるネットワーク障害検知方法を提供することができる。
本発明に係る第四のネットワーク障害検知方法は、観測期間内に受信した総フレーム数をネットワークの伝送速度と前記観測期間で定まる最大受信フレーム数で除算して輻輳係数を取得する輻輳係数取得ステップと、前記輻輳係数取得ステップで取得した前記輻輳係数と予め設定された輻輳閾値とを比較し、前記輻輳係数が前記輻輳閾値より大きいときにネットワーク障害発生の有無を検知するネットワーク障害検知処理を実施し、前記輻輳係数が前記輻輳閾値より小さいときに前記ネットワーク障害検知処理を不実施とする障害判定実施有効性判定ステップと、を行う。
本発明は、トラフィック量が少ないためにFCSエラーフレームを例えば1つ受信しただけでネットワーク障害と判定することを避けることが可能となる。
従って、本発明は、通信ネットワークにおけるネットワークサービスの障害検知について、障害が発生しているにもかかわらず検知しない、また、障害が発生していない時に誤って障害発生検知を行うという事象を減少させることができるネットワーク障害検知方法を提供することができる。
本発明に係る第五のネットワーク障害検知方法は、第四のネットワーク障害検知方法を行い、前記障害判定実施有効性判定ステップで前記輻輳係数が前記輻輳閾値より大きいときに実施する前記ネットワーク障害検知処理として第一から第三のいずれかのネットワーク障害検知方法を実施することを特徴とする。
本発明は、トラフィック量が少ないためにFCSエラーフレームを例えば1つ受信しただけでネットワーク障害判定を実施することを避けることが可能となる。
本発明に係るネットワーク障害検知方法は、前記障害判定実施有効性判定ステップで行った前記ネットワーク障害検知処理の結果、ネットワーク障害発生と判定された場合、障害検出連続発生回数に1を加算する障害検出連続発生カウントステップと、前記障害判定実施有効性判定ステップで行った前記ネットワーク障害検知処理の結果、ネットワーク障害発生無と判定された場合あるいは前記障害判定実施有効性判定ステップで前記ネットワーク検知処理を不実施とした場合、障害検出連続発生回数を0とする障害検出連続発生リセットステップと、前記障害検出連続発生カウントステップでカウントされた前記障害検出連続発生回数が予め設定された障害通知閾値より大きいときにネットワークに障害が発生したことをネットワークに接続するネットワーク装置に通知し、前記障害検出連続発生回数が前記障害通知閾値より大きいときにネットワークに異常がないことを前記ネットワーク装置に通知する通知ステップと、を行う第一及び第四のネットワーク障害検知方法を行う第五のネットワーク障害検知方法。
観測期間が短いため、FCSエラー発生率のばらつきが大きく、誤ったネットワーク障害判定を行う可能性が高いケースにおいても、FCSエラー発生率のばらつきに依存せずに障害判定が行える。
本発明に係るネットワーク装置は、ネットワークから転送されるフレームの受信処理を行うフレーム受信処理部と、前記フレーム受信処理部で受信したフレームのFCSエラーの発生有無を確認するFCSエラー監視機能部と、前記FCSエラー監視機能部でFCSエラー発生有とされたFCSエラーフレームを廃棄し、かつ、前記FCSエラーフレームの数と前記FCSエラー監視機能部でFCSエラー発生無とされた正常フレームの数をカウントするフレームカウンタ/廃棄処理部と、前記FCSエラー監視機能部で確認するFCSエラーの発生有無の情報及び前記フレームカウンタ/廃棄処理部でカウントされたフレーム数の情報を受信し、上記ネットワーク障害検知方法を実施するネットワークサービス障害判定機能部と、を備える。
本ネットワーク装置は、上述のネットワーク障害検知方法を実施するため、通信ネットワークにおけるネットワークサービスの障害検知について、障害が発生しているにもかかわらず検知しない、また、障害が発生していない時に誤って障害発生検知を行うという事象を減少させることができる。
本発明は、通信ネットワークにおけるネットワークサービスの障害検知について、障害が発生しているにもかかわらず検知しない、また、障害が発生していない時に誤って障害発生検知を行うという事象を減少させることができるネットワーク障害検知方法及びネットワーク装置を提供することができる。
本発明に係るネットワーク装置の構成を説明する図である。 本発明に係るネットワーク障害検知方法を説明する図である。 本発明に係るネットワーク障害検知方法を説明する図である。 本発明に係るネットワーク障害検知方法を説明する図である。 本発明に係るネットワーク障害検知方法を説明する図である。 本発明に係るネットワーク障害検知方法を説明する図である。 FCSエラーフレーム数を用いて、ネットワーク障害を検知する手法を説明する図である。 FCSエラーフレーム率を用いて、ネットワーク障害を検知する手法を説明する図である。
添付の図面を参照して本発明の実施形態を説明する。以下に説明する実施形態は本発明の実施例であり、本発明は、以下の実施形態に制限されるものではない。なお、本明細書及び図面において符号が同じ構成要素は、相互に同一のものを示すものとする。
(実施形態1)
実施形態1では、図1のネットワーク装置10において、図2で説明する方法を用いてネットワークサービス障害を検出する方法を説明する。
ネットワーク装置10は、ネットワークから転送されるフレームの受信処理を行うフレーム受信処理部101と、フレーム受信処理部101で受信したフレームのFCSエラーの発生有無を確認するFCSエラー監視機能部102と、FCSエラー監視機能部102でFCSエラー発生有とされたFCSエラーフレームを廃棄し、かつ、前記FCSエラーフレームの数と前記FCSエラー監視機能部でFCSエラー発生無とされた正常フレームの数をカウントするフレームカウンタ/廃棄処理部103と、FCSエラー監視機能部102で確認するFCSエラーの発生有無の情報及びフレームカウンタ/廃棄処理部103でカウントされたフレーム数の情報を受信し、図2で説明するネットワーク障害検知方法を実施するネットワークサービス障害判定機能部106と、を備える。
ネットワーク装置10は、さらに、正常なフレームを定められた優先順位に転送するフレーム転送処理部104と、ネットワークへ送出するために定められた送信処理を行う送信処理部105とを備える。ネットワークサービス障害判定機能部106は、FCSエラーフレーム数と通過フレーム数と観測時間を補正して計算処理を行いネットワークサービス障害の発生も検出する。
図1のネットワークサービス障害判定機能部106は、FCSエラー監視機能部102から観測期間のデータと、フレームカウンタ/廃棄処理部103から受信フレーム数及びFCSエラーフレーム数のデータと、を受け取り、観測期間内にカウントされたFCSエラーフレーム数を補正し、ネットワークサービス障害が発生していないか判定する処理を行う判定処理手順を行う。図2は、この判定処理手順であるネットワークサービス障害発生検出アルゴリズムを採用するネットワーク障害検知方法を説明する図である。すなわち、ネットワークサービス障害判定機能部106は、図2のネットワーク障害検知方法を用いて、観測期間内におけるFCSエラーフレーム数と一定間隔毎に算出された補正済み閾値を用いてネットワークサービスの障害発生有無を判定する。
図2のネットワーク障害検知方法は、観測期間T内に受信した総フレーム数Nをネットワークの伝送速度と観測期間Tで定まる最大受信フレーム数Mで除算して補正係数Cを取得する補正係数取得ステップ210と、補正係数取得ステップ210で取得した補正係数Cをネットワークに予め設定された基準閾値Vthに乗算して補正閾値を算出する補正閾値算出ステップ203と、補正閾値算出ステップ203で算出した補正閾値と観測期間T内に計測したFCSエラーフレーム数Eとを比較し、FCSエラーフレーム数Eが補正閾値より大きいときにネットワーク障害発生と判定し、FCSエラーフレーム数Eが補正閾値より大きいときにネットワーク障害発生無と判定する比較判定ステップ211と、を行う。
図2のネットワーク障害検知方法は、ネットワークサービス障害発生有無を判定する処理手順であり、最初に観測期間において観測された観測データを受け取る観測データの受信処理(201)を行い、つぎに、観測データをもとに補正係数Cを算出する補正係数の算出処理(202)を行い、つぎに、基準閾値Vthの補正処理を行う基準閾値の補正処理(203)を行い、つぎに、補正閾値と観測されたFCSエラーフレーム数Eとの比較を行い異常が発生しているかを判定するネットワークサービス障害判定処理(204)を実行し、つぎに、補正閾値よりも観測されたFCSエラーフレーム数が大きい場合に障害通知を行い、小さい場合にはネットワークサービスには異常がないとして何も通知しない障害通知処理(205)を実行する。
観測データの受信処理(201)と補正係数の算出処理(202)は補正係数取得ステップ210に含まれ、ネットワークサービス障害判定処理(204)と障害通知処理(205)は比較判定ステップ211に含まれる。補正係数Cは観測期間T内に受信した総フレーム数Nを最大受信フレーム数Mで除算して得る。最大受信フレーム数Mはネットワークの伝送速度で定まるフレーム数を観測期間Tで除算して得られる。なお、基準閾値Vthは、ネットワークエラーと判断するための観測期間内に含まれるFCSエラーフレーム数の率であり、ネットワークに予め設定されている。
図2のネットワーク障害検知方法のように、補正された閾値によりネットワークサービス障害判定を実行することで、トラフィック量が少なく観測されるFCSエラーフレーム数が少ない場合に閾値を小さく減少させ、トラフィック量が大きく観測されるFCSエラーフレーム数が大きい場合に閾値を大きく増加させることで、トラフィック量に依存せずに障害判定が行えることとなる。図2のネットワーク障害検知方法により、ネットワークサービス障害を誤って判定することを避けることが可能となる。
(実施形態2)
実施形態2では、図1のネットワーク装置10において、図3で説明する方法を用いてネットワークサービス障害を検出する方法を説明する。
図1のネットワークサービス障害判定機能部(106)は、観測期間内における受信フレーム数と一定間隔毎に算出された係数を用いて、ネットワークサービスの障害判定実施の有効性を判定することにより実現する、判定処理手順である図3のネットワーク障害検知方法を行う。
図3のネットワーク障害検知方法は、観測期間T内に受信した総フレーム数Nをネットワークの伝送速度と観測期間Tで定まる最大受信フレーム数Mで除算して輻輳係数C’を取得する輻輳係数取得ステップ310と、輻輳係数取得ステップ310で取得した輻輳係数C’と予め設定された輻輳閾値xとを比較し、輻輳係数C’が輻輳閾値xより大きいときにネットワーク障害発生の有無を検知するネットワーク障害検知処理を実施し、輻輳係数C’が輻輳閾値xより小さいときにネットワーク障害検知処理を不実施とする障害判定実施有効性判定ステップ311と、を行う。
図3のネットワーク障害検知方法は、ネットワークサービス障害判定実施の有効性の判定を処理する手順であり、最初に観測期間において観測された観測データを受け取る観測データの受信処理(301)を行い、つぎに、観測データをもとに輻輳係数C’を算出する輻輳係数の算出処理(302)を行い、つぎに、輻輳係数C’とあらかじめ定められた輻輳閾値xとの比較を行いネットワークサービス障害の判定実施が有効であるかを判定する処理(303)を実施し、つぎに、輻輳係数C’よりも輻輳閾値xが大きい場合にネットワークサービス障害判定を行い、小さい場合にはネットワークサービス障害判定を実施しないという、障害判定実施の有効性判定処理(304)を実行する。
観測データの受信処理(301)と輻輳係数の算出処理(302)は輻輳係数取得ステップ310に含まれ、ネットワークサービス障害の判定実施が有効であるかを判定する処理(303)と障害判定実施の有効性判定処理(304)は障害判定実施有効性判定ステップ311に含まれる。輻輳係数C’は観測期間T内に受信した総フレーム数Nを最大受信フレーム数Mで除算して得る。最大受信フレーム数Mはネットワークの伝送速度で定まるフレーム数を観測期間Tで除算して得られる。なお、輻輳閾値xは、ネットワークサービス障害の判定実施が有効か否かを判断するための観測期間T内に含まれるFCSエラーフレーム数Eの率であり、ネットワークに予め設定されている。
図3のネットワーク障害検知方法のように、観測期間T内に受信した総フレーム数Nから算出される係数を用いてネットワークサービス障害判定実施の有効性判定を実行することで、トラフィック量が少ないためにFCSエラーフレームを例えば1つ受信しただけで、障害判定を行ってしまい、ネットワークサービス障害を誤って判定することを避けることが可能となる。
(実施形態3)
実施形態3では、図1のネットワーク装置10において、図4で説明する方法を用いてネットワークサービス障害を検出する方法を説明する。
図1のネットワークサービス障害判定機能部(106)は、図2で説明したネットワークサービス障害が発生していないか判定する処理と、図3で説明した障害判定実施の有効性判定処理と、を行うネットワークサービス障害を検出する判定処理手順である図4のネットワーク障害検知方法を行う。さらに、障害検出連続発生回数を用いて判断してもよい。
図4のネットワーク障害検知方法は、図3のネットワーク障害検知方法を行い、障害判定実施有効性判定ステップ311で輻輳係数C’が輻輳閾値xより大きいときに実施するネットワーク障害検知処理として図2のネットワーク障害検知方法を実施することを特徴とする。
さらに、図4のネットワーク障害検知方法は、障害判定実施有効性判定ステップ311で行ったネットワーク障害検知処理(図2のネットワーク障害検知方法)の結果、ネットワーク障害発生と判定された場合、障害検出連続発生回数jに1を加算する障害検出連続発生カウントステップ403と、障害判定実施有効性判定ステップ311で行ったネットワーク障害検知処理(図3のネットワーク障害検知方法)の結果、ネットワーク障害発生無と判定された場合あるいは障害判定実施有効性判定ステップ311でネットワーク検知処理を不実施とした場合、障害検出連続発生回数jを0とする障害検出連続発生リセットステップ406と、障害検出連続発生カウントステップ403でカウントされた障害検出連続発生回数jが予め設定された障害通知閾値yより大きいときにネットワークに障害が発生したことをネットワークに接続するネットワーク装置に通知し、障害検出連続発生回数jが障害通知閾値yより大きいときにネットワークに異常がないことをネットワーク装置に通知する通知ステップ411と、を行う。
図4のネットワーク障害検知方法は、ネットワークサービス障害発生有無を判定する処理手順であり、最初に図3のネットワーク障害検知方法である障害判定実施の有効性を判定する処理(401)を行い、つぎに、障害判定実施と判定された場合、図2のネットワーク障害検知方法であるネットワークサービスの障害発生有無の判定処理(402)を行い、つぎに、障害検出された場合、障害検出連続発生回数jの更新処理(障害検出連続発生カウントステップ403)を行い、つぎに、障害検出連続発生回数jとあらかじめ定められた障害通知閾値yとの比較を行い、ネットワークサービス異常が継続して発生しているかを判定するネットワークサービス障害判定処理(404)を実行し、つぎに、障害検出連続発生回数jが障害通知閾値yよりも大きい場合に障害通知を行い、小さい場合にはネットワークサービスには異常がないとして何も通知しないという障害通知処理(405)を実行する。なお、障害判定実施の有効性を判定する処理(401)を行った際、障害判定しないと判定された場合、及びネットワークサービスの障害発生有無の判定処理(402)を行った際に異常なしと判定された場合、障害検出連続発生回数jの初期化処理(障害検出連続発生リセットステップ406)を行い、処理を終了する。
図3で説明したネットワーク障害検知方法が障害判定実施の有効性を判定する処理(401)に相当し、図2で説明したネットワーク障害検知方法がネットワークサービスの障害発生有無の判定処理(402)に相当する。ネットワークサービス障害判定処理(404)と障害通知処理(405)は通知ステップ411に含まれる。なお、障害通知閾値yは、ネットワークに予め設定されている。
図4のネットワーク障害検知方法のように、観測期間T内における受信フレーム数Nから算出される輻輳係数C’を用いたネットワークサービス障害判定実施の有効性判定と、補正閾値Cによるネットワークサービス障害判定、及びその連続性を用いて、ネットワークサービス障害判定を実施することで次のような効果がある。図4のネットワーク障害検知方法は、観測期間Tが短いためFCSエラー発生率のばらつきが大きく、誤ったネットワーク障害判定を行う可能性が高いケースにおいても、FCSエラー発生率のばらつきに依存せずに障害判定が行えるという効果を有する。図4のネットワーク障害検知方法により、ネットワークサービス障害を誤って判定することを避けることが可能となる。
(実施形態4)
実施形態4では、図1のネットワーク装置10において、図5で説明する方法を用いてネットワークサービス障害を検出する方法を説明する。
図1のネットワークサービス障害判定機能部(106)は、FCSエラー監視機能部(102)から観測期間Tのデータと、フレームカウンタ/廃棄処理部(103)からFCSエラーフレーム数Eのデータと、を受け取り、観測期間T内における一定数を超えるFCSエラーの発生有無とその発生の連続回数を用いて、ネットワークサービス障害が発生していないか判定する判定処理手順を行う。図5は、この判定処理手順であるネットワークサービス障害発生検出アルゴリズムを採用するネットワーク障害検知方法を説明する図である。すなわち、図1のネットワークサービス障害判定機能部(106)は、所定数以上のFCSエラーフレーム数である観測期間がある程度連続したときにネットワークサービスの障害発生有無を判定する。
図5のネットワーク障害検知方法は、観測期間T内に計測したFCSエラーフレーム数Eと予め設定された所定閾値zとを比較するFCSエラー発生判定ステップ510と、FCSエラー発生判定ステップ510でFCSエラーフレーム数Eが所定閾値zより大きい場合にFCSエラー連続発生回数iに1を加算するFCSエラーカウントステップ503と、FCSエラー発生判定ステップ510でFCSエラーフレーム数Eが所定閾値zより小さい場合にFCSエラー連続発生回数iを0とするFCSエラーリセットステップ506と、FCSエラーカウントステップ503でカウントされたFCSエラー連続発生回数iが予め設定された判定閾値Wより大きいときにネットワーク障害発生と判定し、FCSエラー連続発生回数iが判定閾値Wより小さいときにネットワーク障害発生無と判定する比較判定ステップ511と、を行う。
図5のネットワーク障害検知方法は、ネットワークサービス障害発生有無を判定する処理手順であり、最初に観測期間Tにおいて観測された観測データ(FCSエラーフレーム数E)を受け取る観測データの受信処理(501)を行い、つぎに、観測データをもとにあらかじめ定められた所定閾値zとの比較を行い、一定数を超えるFCSエラーの発生有無の判定処理(502)を行い、つぎに、FCSエラーフレーム数Eが所定閾値zよりも大きい場合、FCSエラー連続発生回数iの更新処理(FCSエラーカウントステップ503)を行い、つぎに、FCSエラー連続発生回数iとあらかじめ定められた判定閾値Wとの比較を行い異常が発生しているかを判定するネットワークサービス障害判定処理(504)を実行し、つぎに、FCSエラー連続発生回数iが判定閾値Wよりも大きい場合に障害通知を行い、小さい場合にはネットワークサービスには異常がないとして何も通知しないという、障害通知処理(505)を実行する。なお、観測データをもとにあらかじめ定められた所定閾値zとの比較を行い、一定数を超えるFCSエラーの発生有無の判定処理(502)を行った際、受信FCSエラーフレーム数Eが所定閾値zより小さい場合は、FCSエラー連続発生回数iの初期化処理(FCSエラーリセットステップ506)を行い、処理を終了する。
観測データの受信処理(501)と一定数を超えるFCSエラーの発生有無の判定処理(502)はFCSエラー発生判定ステップ510に含まれ、ネットワークサービス障害判定処理(504)と障害通知処理(505)は比較判定ステップ511に含まれる。なお、所定閾値z及び判定閾値Wは、ネットワークに予め設定されている。
図5のネットワーク障害検知方法のように、一定期間内におけるFCSエラー発生の継続性を用いてネットワークサービス障害判定を実行することで次のような効果が得られる。図5のネットワーク障害検知方法は、観測期間Tが短いため、FCSエラー発生率のばらつきが大きく、誤ったネットワーク障害判定を行う可能性が高いケースにおいても、FCSエラー発生率のばらつきに依存せずに障害判定が行える。図5のネットワーク障害検知方法は、ネットワークサービス障害を誤って判定することを避けることが可能である。
(実施形態5)
実施形態5では、図1のネットワーク装置10において、図6で説明する方法を用いてネットワークサービス障害を検出する方法を説明する。
図1のネットワークサービス障害判定機能部(106)は、FCSエラー監視機能部(102)から観測期間(T、T’)のデータと、フレームカウンタ/廃棄処理部(103)から総フレーム数(N,N’)とFCSエラーフレーム数(E,E’)のデータと、を受け取り、観測期間内のFCSエラー発生率がある観測期間T内のFCSエラー発生率に比べ一定数以上上昇しているか判定し、その発生の連続回数を用いて、ネットワークサービス障害が発生していないか判定する判定処理手順を行う。図6は、この判定処理手順であるネットワークサービス障害発生検出アルゴリズムを採用するネットワーク障害検知方法を説明する図である。すなわち、図1のネットワークサービス障害判定機能部(106)は、FCSエラーフレーム数の上昇率がある程度連続したときにネットワークサービスの障害発生有無を判定する。
図6のネットワーク障害検知方法は、観測期間(T、T’)内に計測したFCSエラーフレーム数(E,E’)を観測期間(T、T’)内に受信した総フレーム数(N,N’)で除算したFCSエラー率(A、A’)を算出するFCSエラー率算出ステップ610と、観測期間(T、T’)のFCSエラー率(A、A’)を比較し、FCSエラー率(A、A’)の推移と予め設定された上昇閾値Pとを比較するFCSエラー率上昇判定ステップ603と、FCSエラー率上昇判定ステップ603でFCSエラー率(A、A’)の推移が上昇閾値Pより大きい場合に、FCSエラー率連続上昇発生回数hに1を加算するFCSエラー率連続上昇カウントステップ604と、FCSエラー率上昇判定ステップ603でFCSエラー率(A、A’)の推移が上昇閾値Pより小さい場合にFCSエラー率連続上昇発生回数hを0とするFCSエラー率連続上昇リセットステップ607と、FCSエラー率連続上昇カウントステップ604でカウントされたFCSエラー率連続上昇発生回数hが予め設定された判定閾値Qより大きいときにネットワーク障害発生と判定し、FCSエラー率連続上昇発生回数hが判定閾値Qより小さいときにネットワーク障害発生無と判定する比較判定ステップ611と、を行う。
図6のネットワーク障害検知方法は、ネットワークサービス障害発生有無を判定する処理手順であり、最初に、観測期間(T,T’)において観測された観測データを受け取る観測データの受信処理(601)を行い、つぎに、観測期間(T,T’)それぞれにおけるFCSエラー率(A,A’)の算出処理(602)を行い、つぎに、観測期間T内のFCSエラー発生率Aがある観測期間T’内のFCSエラー発生率A’に比べ一定数(上昇閾値)P以上上昇しているか判定するFCSエラー率上昇判定処理(FCSエラー率上昇判定ステップ603)を行い、つぎに、観測期間T内のFCSエラー発生率Aがある観測期間T’内のFCSエラー発生率A’に比べ一定数以上上昇している場合、FCSエラー率上昇連続発生回数hの更新処理(FCSエラー率連続上昇カウントステップ604)を行い、つぎに、FCSエラー率上昇連続回数hとあらかじめ定められた判定閾値Qとの比較を行い異常が発生しているかを判定するネットワークサービス障害判定処理(605)を実行し、つぎに、FCSエラー率上昇連続回数hが判定閾値Qよりも大きい場合に障害通知を行い、小さい場合にはネットワークサービスには異常がないとして何も通知しないという障害通知処理(606)を実行する。なお、観測期間T内のFCSエラー発生率Aがある観測期間T’内のFCSエラー発生率A’に比べ一定数P以上上昇していない場合、FCSエラー率上昇連続発生回数hの初期化処理(FCSエラー率連続上昇リセットステップ607)を行い、処理を終了する。
観測データの受信処理(601)と観測期間それぞれにおけるFCSエラー率の算出処理(602)はFCSエラー率算出ステップ610に含まれ、ネットワークサービス障害判定処理(605)と障害通知処理(606)は比較判定ステップ611に含まれる。なお、上昇閾値P及び判定閾値Qは、ネットワークに予め設定されている。
図6のネットワーク障害検知方法のように、観測期間内のFCSエラー発生率がある観測期間T内のFCSエラー発生率に比べ一定数以上上昇しているか判定するFCSエラー率上昇判定処理と、その連続性を用いて、ネットワークサービス障害判定を実施することで次のような効果が得られる。図6のネットワーク障害検知方法は、正常時にFCSエラー率が低いネットワークにおいて、異常が発生しFCSエラー率が上昇しても閾値を超えることなく、異常と判定されない可能性が高いケースにおいても、そのネットワークの従来品質を考慮した障害判定が行える。図6のネットワーク障害検知方法は、ネットワークサービス障害を誤って判定することを避けることが可能である。
(その他の実施形態)
図4のネットワーク障害検知方法において、ネットワークサービスの障害発生有無の判定処理(402)が図2のネットワーク障害検知方法であると説明したが、図5及び図6のネットワーク障害検知方法であってもよい。
以下は、図1から図6のネットワーク装置及びネットワーク障害検知方法をまとめたものである。
(1)
フレーム通信装置において、観測期間内におけるFCSエラーフレーム数と一定間隔毎に算出された補正済み閾値を用いてネットワークサービスの障害発生有無を判定する方法を用いてネットワークサービス障害を検出する装置であって、
前記委フレーム通信装置は、ネットワークサービスの障害を検知した時に、ネットワークサービスの障害を検知した情報をsyslog及びTrap機能を用いて通知する機能と、
観測期間と伝送速度で決まるフレーム数から最大受信フレーム数を算出し、その算出した最大受信フレーム数と実受信フレーム数を用いて補正値を算出する機能と、
観測期間内における受信フレーム数と一定間隔毎に算出された係数を用いてネットワークサービス障害判定実施の有効性を判定する機能と、
を有したことを特徴とするネットワーク障害検知装置。
(2)
前記ネットワークサービス障害判定実施の有効性を検知する方法を用いて、ネットワークサービス障害判定実施の有効性を検知した時に、ネットワークサービス障害判定実施の有効性を検知した情報をsyslog及びTrap機能を用いて通知を行う機能とを有したことを特徴とする(1)に記載のネットワーク障害検知装置。
(3)
フレーム通信装置において、観測期間内におけるFCSエラーフレーム数と一定間隔毎に算出された補正済み閾値を用いてネットワークサービスの障害発生有無を判定する方法を用いてネットワークサービス障害を検出する方法であって、
前記フレーム通信装置は、ネットワークサービスの障害を検知した時に、ネットワークサービスの障害を検知した情報をsyslog及びTrap機能を用いて通知するステップと、
観測期間と伝送速度で決まるフレーム数から最大受信フレーム数を算出し、その算出した最大受信フレーム数と実受信フレーム数を用いて補正値を算出するステップと、
観測期間内における受信フレーム数と一定間隔毎に算出された係数を用いてネットワークサービス障害判定実施の有効性を判定するステップからなるネットワーク障害検知方法。
(4)
前記ネットワークサービス障害判定実施の有効性を検知する方法を用いて、ネットワークサービス障害判定実施の有効性を検知した時に、ネットワークサービス障害判定実施の有効性を検知した情報をsyslog及びTrap機能を用いて通知を行うステップとを有したことを特徴とする(3)に記載のネットワーク障害検知方法。
このようなネットワーク装置及びネットワーク障害検知方法は、通信ネットワークにおけるネットワークサービスの障害検知について、障害が発生しているにもかかわらず検知しない、また、障害が発生していない時に誤って障害発生検知を行うという事象を、障害検知に用いる閾値をトラフィック状況に応じて動的に制御することで減少させ、通信サービスおよび通信サービス運用に関わる人的稼働に与える影響を抑えることが可能である。
10:ネットワーク装置
101:フレーム受信処理部
102:FCSエラー監視機能部
103:フレームカウンタ/廃棄処理部
104:フレーム転送処理部
105:送信処理部
106:ネットワークサービス障害判定機能部

Claims (4)

  1. 観測期間内に受信した総フレーム数をネットワークの伝送速度と前記観測期間で定まる最大受信フレーム数で除算して補正係数を取得する補正係数取得ステップと、
    前記補正係数取得ステップで取得した前記補正係数を前記ネットワークに予め設定された基準閾値に乗算して補正閾値を算出する補正閾値算出ステップと、
    前記補正閾値算出ステップで算出した前記補正閾値と前記観測期間内に計測したFCSエラーフレーム数とを比較し、前記FCSエラーフレーム数が前記補正閾値より大きいときにネットワーク障害発生と判定し、前記FCSエラーフレーム数が前記補正閾値より小さいときにネットワーク障害発生無と判定する比較判定ステップと、
    を行うネットワーク障害検知方法。
  2. 観測期間内に受信した総フレーム数をネットワークの伝送速度と前記観測期間で定まる最大受信フレーム数で除算して輻輳係数を取得する輻輳係数取得ステップと、
    前記輻輳係数取得ステップで取得した前記輻輳係数と予め設定された輻輳閾値とを比較し、前記輻輳係数が前記輻輳閾値より大きいときにネットワーク障害発生の有無を検知するネットワーク障害検知処理を実施し、前記輻輳係数が前記輻輳閾値より小さいときに前記ネットワーク障害検知処理を不実施とする障害判定実施有効性判定ステップと、
    を行い、
    前記障害判定実施有効性判定ステップでは、
    前記輻輳係数が前記輻輳閾値より大きいときに実施する前記ネットワーク障害検知処理として、請求項1に記載のネットワーク障害検知方法を実施する
    ことを特徴とするネットワーク障害検知方法。
  3. 前記障害判定実施有効性判定ステップで行った前記ネットワーク障害検知処理の結果、ネットワーク障害発生と判定された場合、障害検出連続発生回数に1を加算する障害検出連続発生カウントステップと、
    前記障害判定実施有効性判定ステップで行った前記ネットワーク障害検知処理の結果、ネットワーク障害発生無と判定された場合あるいは前記障害判定実施有効性判定ステップで前記ネットワーク検知処理を不実施とした場合、障害検出連続発生回数を0とする障害検出連続発生リセットステップと、
    前記障害検出連続発生カウントステップでカウントされた前記障害検出連続発生回数が予め設定された障害通知閾値より大きいときにネットワークに障害が発生したことをネットワークに接続するネットワーク装置に通知し、前記障害検出連続発生回数が前記障害通知閾値より小さいときにネットワークに異常がないことを前記ネットワーク装置に通知する通知ステップと、
    を行う請求項2に記載のネットワーク障害検知方法。
  4. ネットワークから転送されるフレームの受信処理を行うフレーム受信処理部と、
    前記フレーム受信処理部で受信したフレームのFCSエラーの発生有無を確認するFCSエラー監視機能部と、
    前記FCSエラー監視機能部でFCSエラー発生有とされたFCSエラーフレームを廃棄し、かつ、前記FCSエラーフレームの数と前記FCSエラー監視機能部でFCSエラー発生無とされた正常フレームの数をカウントするフレームカウンタ/廃棄処理部と、
    前記FCSエラー監視機能部で確認するFCSエラーの発生有無の情報及び前記フレームカウンタ/廃棄処理部でカウントされたフレーム数の情報を受信し、請求項1からのいずれかに記載のネットワーク障害検知方法を実施するネットワークサービス障害判定機能部と、
    を備えるネットワーク装置。
JP2011264740A 2011-12-02 2011-12-02 ネットワーク障害検知方法及びネットワーク装置 Active JP5373042B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011264740A JP5373042B2 (ja) 2011-12-02 2011-12-02 ネットワーク障害検知方法及びネットワーク装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011264740A JP5373042B2 (ja) 2011-12-02 2011-12-02 ネットワーク障害検知方法及びネットワーク装置

Publications (2)

Publication Number Publication Date
JP2013118489A JP2013118489A (ja) 2013-06-13
JP5373042B2 true JP5373042B2 (ja) 2013-12-18

Family

ID=48712768

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011264740A Active JP5373042B2 (ja) 2011-12-02 2011-12-02 ネットワーク障害検知方法及びネットワーク装置

Country Status (1)

Country Link
JP (1) JP5373042B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111352929A (zh) * 2020-04-13 2020-06-30 猫岐智能科技(上海)有限公司 一种数据处理方法
CN113595778B (zh) * 2021-07-23 2023-08-01 宁波三星医疗电气股份有限公司 模组终端抄表业务异常自恢复处理方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005268889A (ja) * 2004-03-16 2005-09-29 Fujitsu Access Ltd 伝送路切替システムおよび伝送路切替システムの動作方法
US20060015639A1 (en) * 2004-07-13 2006-01-19 Taylor Benjamin F Method for managing inter-zone bandwidth in a two-way messaging network
KR100922028B1 (ko) * 2004-10-27 2009-10-19 메시네트웍스, 인코포레이티드 무선 통신 네트워크에서 서비스 품질 제공 및 폭주 제어를제공하기 위한 시스템 및 방법

Also Published As

Publication number Publication date
JP2013118489A (ja) 2013-06-13

Similar Documents

Publication Publication Date Title
US9094163B2 (en) Assessment and correction of transmitted data
US9876727B2 (en) Physical-layer signaling of flow control updates
WO2012167667A1 (zh) 一种信号劣化处理方法、装置及节点设备
EP2692080B1 (en) Error handling in a passive optical network
JP5373042B2 (ja) ネットワーク障害検知方法及びネットワーク装置
JP2007274613A (ja) 信号劣化検出方法、信号復旧検出方法及びそれらの装置並びにトラフィック伝送システム
WO2022180670A1 (ja) Ru装置、du装置、通信システム、通信方法、及び非一時的なコンピュータ可読媒体
JP5113124B2 (ja) パケットネットワークにおける障害監視システム
US7561524B2 (en) Method for measuring performance of MPLS LSP
EP2784965A2 (en) Data communication method and apparatus using forward error correction
US20120250536A1 (en) Ethernet-dual-ended loss measurement calculation
JP2019033504A (ja) 受信装置、送受信装置、受信方法及び送受信方法
CN112866187B (zh) 路径切换方法及路径切换装置
US20170155457A1 (en) Synchronization detection method and transmission apparatus
WO2012155653A1 (zh) 分组路径信号劣化的检测方法、装置及系统
JP5542730B2 (ja) 通信システムおよび切替装置
JP6007138B2 (ja) 伝送システムおよび伝送装置並びに伝送品質検出方法
WO2016061943A1 (zh) 实现生成树协议保护倒换的方法、装置及计算机存储介质
JP2010118894A (ja) パケット生成装置、パケット生成方法及びパケット生成プログラム
JP2009302875A (ja) 受信側ネットワーク装置、中継装置、送信側ネットワーク装置および通信システム
JP2004228973A (ja) 高速ber測定装置およびそれを用いて構成した自動モニタ装置
US20240214113A1 (en) Management of message transmission using forward error correction
JP2011160374A (ja) 伝送装置及びネットワークの診断方法
US11563658B2 (en) Cable modem termination system
US11558760B2 (en) Protection switching using performance metrics

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130611

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130917

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130918

R150 Certificate of patent or registration of utility model

Ref document number: 5373042

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350