JP5779522B2 - 通信装置、故障判定方法、及びプログラム - Google Patents

通信装置、故障判定方法、及びプログラム Download PDF

Info

Publication number
JP5779522B2
JP5779522B2 JP2012037975A JP2012037975A JP5779522B2 JP 5779522 B2 JP5779522 B2 JP 5779522B2 JP 2012037975 A JP2012037975 A JP 2012037975A JP 2012037975 A JP2012037975 A JP 2012037975A JP 5779522 B2 JP5779522 B2 JP 5779522B2
Authority
JP
Japan
Prior art keywords
statistical information
unit
rate
functional unit
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012037975A
Other languages
English (en)
Other versions
JP2013175837A (ja
Inventor
儀秀 渡邊
儀秀 渡邊
尚 石塚
尚 石塚
智行 浦畑
智行 浦畑
淳也 小坂
淳也 小坂
幸二 池田
幸二 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
NTT Communications Corp
Original Assignee
Hitachi Ltd
NTT Communications Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, NTT Communications Corp filed Critical Hitachi Ltd
Priority to JP2012037975A priority Critical patent/JP5779522B2/ja
Publication of JP2013175837A publication Critical patent/JP2013175837A/ja
Application granted granted Critical
Publication of JP5779522B2 publication Critical patent/JP5779522B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Description

本発明は、通信装置における故障を検出するための技術に関連するものである。
従来から、パケット交換網やATM網などを構成するための通信装置の内部におけるインタフェース(IF)間、あるいはIF内の故障を検出する方法として、例えば、フレームチェックシーケンス(FCS)を用いる方法がある。
この方法では、データ送信側で各フレームのチェックサムを計算し、FCS情報としてデータ本体とともに送信し、受信側では送信側で用いられたアルゴリズムと同じアルゴリズムを用いてフレームのチェックサムを計算し、受信したFCS情報と計算結果とを比較することよって、フレームのデータに損失があったかどうかを検出することができる。データに損失があったことを検出することによって、故障を検出することができる。
通信装置の内部のインタフェース(IF)間、あるいはIF内の故障を検出する他の方法としては、例えば、パリティやECC(誤り訂正符号)を付加したメモリを用いて、パリティやECCをチェックすることによってエラーを検出し、故障を検出する方法がある。
特開平09−247160号公報
しかし、FCSによる場合、FCS情報が付与されたフレームを検出することによって故障を発見するので、フレームの疎通が前提となっている。そのため、フレームの疎通が無い場合は、故障を発見することができなかった。また、フレーム伝送のためのパスが未設定の状態では、当然、フレームの疎通が無いため、故障を発見することができなかった。
更に、FCSによる場合、メモリパリティによる場合のいずれも、専用の検出機能を持ったハードウェアを追加する必要があり、コスト増につながるとともに、新たなハードウェアの追加によって、逆に故障率の増加や誤検出(検出機能自体の故障)を招くという問題があった。
本発明は上記の点に鑑みてなされたものであり、特別なハードウェアを追加することなく、通信装置内の故障を検出することを可能とした技術を提供することを目的とする。
上記の課題を解決するために、本発明は、パケット通信を行う通信装置であって、パケットを送出する第1の機能部と、前記第1の機能部から送出されたパケットを受信する第2の機能部と、
所定の周期で、前記第1の機能部から送出されたパケットの数の統計情報と、前記第2の機能部が受信したパケットの数の統計情報とを収集する統計情報収集手段と、
前記統計情報収集手段により収集された前記第1の機能部の統計情報と前記第2の機能部の統計情報とを比較することにより、異常が発生しているか否かを判定する統計情報比較手段と、
前記所定の周期で連続して異常であると判定された回数に基づき、前記第1の機能部と前記第2の機能部との間における装置故障が発生したか否かを判定する故障判定手段と、を備えることを特徴とする通信装置として構成される。
前記通信装置は、前記第1の機能部から収集された統計情報に基づいて、前記パケットの伝送レートが高レートであるか低レートであるかを判定するレート判定手段を更に備え、前記故障判定手段は、前記レート判定手段により判定されたレートに応じて、前記回数を変更するように構成してもよい。
前記故障判定手段は、前記レート判定手段により高レートであると判定された場合の前記回数を、前記レート判定手段により低レートであると判定された場合の回数よりも少なくするようにしてもよい。
前記第1の機能部から前記第2の機能部へ、前記パケットとしての試験パケットを伝送させる手段を更に備えてもよい。また、前記統計情報は、前記所定の周期の期間におけるパケットの個数でとしてもよいし、前記所定の周期の期間におけるパケットの個数を所定期間にわたり累積した値としてもよい。
前記第1の機能部と前記第2の機能部はそれぞれ、前記通信装置のインタフェース部内のチップであり、前記統計情報収集手段、前記統計情報比較手段、及び前記故障判定手段は、前記インタフェース部内のIF制御部で実行されるプログラムにより実現されるものとしてもよいし、前記第1の機能部と前記第2の機能部はそれぞれ、前記通信装置のインタフェース部であり、前記統計情報収集手段、前記統計情報比較手段、及び前記故障判定手段は、前記通信装置内の装置制御部で実行されるプログラムにより実現されるものとしてもよい。
また、前記通信装置は、パケット伝送装置に搭載して使用されるインタフェースカードであってもよい。
また、本発明は、パケットを送出する第1の機能部と、前記第1の機能部から送出されたパケットを受信する第2の機能部とを備える通信装置における故障判定方法であって、
所定の周期で、前記第1の機能部から送出されたパケットの数の統計情報と、前記第2の機能部が受信したパケットの数の統計情報とを収集する統計情報収集ステップと、
前記統計情報収集ステップにより収集された前記第1の機能部の統計情報と前記第2の機能部の統計情報とを比較することにより、異常が発生しているか否かを判定する統計情報比較ステップと、
前記所定の周期で連続して異常であると判定された回数に基づき、前記第1の機能部と前記第2の機能部との間における装置故障が発生したか否かを判定する故障判定ステップと、を備えることを特徴とする故障判定方法として構成してもよい。
更に、本発明は、パケットを送出する第1の機能部と、前記第1の機能部から送出されたパケットを受信する第2の機能部とを備える通信装置内のコンピュータを、
所定の周期で、前記第1の機能部から送出されたパケットの数の統計情報と、前記第2の機能部が受信したパケットの数の統計情報とを収集する統計情報収集手段、
前記統計情報収集手段により収集された前記第1の機能部の統計情報と前記第2の機能部の統計情報とを比較することにより、異常が発生しているか否かを判定する統計情報比較手段、
前記所定の周期で連続して異常であると判定された回数に基づき、前記第1の機能部と前記第2の機能部との間における装置故障が発生したか否かを判定する故障判定手段、として機能させるためのプログラムとして構成してもよい。
本発明によれば、パケットの個数に係る統計情報のみによって、故障を検出することが可能となるので、特殊な故障検出機能が不要で、特別なハードウェアを追加する必要がなくなる。
また、パケットのレートに応じて故障判定ロジックを変えることが可能なので、非同期動作に起因した故障判定誤りを回避することが可能である。
更に、機能部間(例えば、チップ間、IF間)に試験フレームを流すことが可能なので、ユーザ信号の疎通がなくても故障検出が可能であるとともに、パスが未設定であっても故障検出が可能である。
本発明の実施の形態におけるシステム構成図である。 インタフェース部内の故障検出に係る構成を示す図である。 インタフェース部間の故障検出に係る構成を示す図である。 IF制御部の機能構成図である。 故障検出の手順を示すフローチャートである。 状態遷移の例を説明するための図である。 状態遷移及び故障判定の例を説明するための図である。 状態遷移及び故障判定の例を説明するための図である。 冗長構成における故障検出の例を説明するための図である。
以下、図面を参照して本発明の実施の形態を説明する。なお、以下で説明する実施の形態は一例に過ぎず、本発明が適用される実施の形態は、以下の実施の形態に限られるわけではない。
(システム構成)
図1に、本発明の実施の形態に係る通信システムの全体構成図を示す。図1に示すように、本実施の形態に係る通信システムは、通信装置10が運用監視用のネットワーク20を介してオペレーションシステム30(運用監視装置と称してもよい)と接続された構成を有する。
本実施の形態における通信装置10は、伝送路に接続される複数のインタフェース部11、パケットのスイッチ(パケット出力方路の選択)を行うスイッチ部12、通信装置10の制御を行う装置制御部13を有する。このような構成は、現在普及しているパケット伝送装置(ルータ、スイッチ等)が共通に有する一般的な構成である。なお、本明細書及び特許請求の範囲において、"パケット"の用語は"フレーム"や"セル"等を含む広い意味で使用している。
実際には通信装置10が伝送路を介して複数接続されることにより、ユーザ信号を伝送する通信ネットワークが構成されるが、図1では1つの通信装置10のみを示している。
通信装置10における各インタフェース部11は、インタフェースカード等とも呼ばれる通信装置であり、例えば通信プロトコルの階層に対応したチップ(ICチップ)を複数備えて構成されている。イーサの通信を行うインタフェース部11を例にとれば、当該インタフェース部11は、例えば、イーサフレームの生成等を行うMACチップ、物理層の処理等を行うPHYチップ等を備えている。
また、各インタフェース部11は、故障監視や各種の制御を行うIF制御部14を備えている。一例として、IF制御部14は、CPU及びメモリを含むコンピュータの構成を有し、プログラム(ファームウェア)が実行されることによりその機能を発揮する。ただし、IF制御部14はこの構成に限定されるわけではなく、ハードウェア論理回路により機能を実現することとしてもよい。
通信装置10における装置制御部13は、通信装置10全体の故障監視(装置内の各部の故障情報をオペレーションシステム30に通知する機能を含む)や各種の制御を行う機能部であり、上記と同様に、一例として、CPU及びメモリを含むコンピュータの構成を有し、プログラム(ファームウェア)が実行されることによりその機能を発揮する。ただし、装置制御部13はこの構成に限定されるわけではなく、ハードウェア論理回路により機能を実現することとしてもよい。
上記のIF制御部14、及び装置制御部13により、本発明に係る故障検出処理が実行される。図2A、図2Bは、故障検出処理に関係する構成をより詳しく示した図である。図2Aはインタフェース部11内(具体的にはチップ間)の故障を検出する場合を示しており、代表として1つのインタフェース部11を示し、スイッチ部12の図示を省略している。図2Bは、インタフェース部間の故障を検出する場合を示しており、故障検出に関わる2つのインタフェース部(インタフェース部A、インタフェース部B)が示されている。
図2Aに示すように、インタフェース部10内の故障検出の場合、2つのチップ(チップA、チップB)から統計情報を収集し、これらの統計情報に基づいて故障判定を行う。図2Bに示すように、インタフェース部間の故障検出の場合、2つのインタフェース部(インタフェース部A、インタフェース部B)から統計情報を収集し、これらの統計情報に基づいて故障判定を行う。図2A、及び図2Bの場合において、故障判定の処理内容自体は基本的に同じなので、以下では、図2Aに示すインタフェース部内の故障判定を例にとって詳細に説明する。
図2Aにおいて、統計情報の収集の対象とする2つのチップは予め定めたものである。どのチップ間での故障判定を行うかを外部からの設定により変更可能としてもよい。また、複数の組(2つのチップからなる組)のそれぞれで故障検出を行ってもよい。図2Aでは、一例として、1つの組(チップAとチップB)についての故障検出を示している。
2つのチップのうち、一方がパケットの流れる方向の上流側であり、他方が下流側である。つまり、一方のチップからパケットが送出され、他方がそのパケットを受信する。パケットを送出するほうを始点(図2AではチップA)、パケットを受信するほうを終点(図2AではチップB)と呼ぶことにする。
図3に、IF制御部14の機能構成図を示す。装置制御部13もこの構成を有する。図3に示すように、IF制御部14は、統計情報収集部141、レート判定部142、統計情報比較部143、故障判定部144、故障通知部145、試験パケット送出指示部146、データ記憶部147を備える。
統計情報収集部141は、各チップから統計情報を収集する機能部である。本実施の形態における統計情報は、所定の時間の間にチップを通過したパケット数(パケットのカウント値)である。つまり、始点側のチップにおいては、所定の時間の間にチップから送出されたパケット数であり、終点側のチップにおいては、所定の時間の間に始点から受信したパケット数である。
本実施の形態では、各チップが、通過したパケットの数をカウントする機能を備えており、統計情報収集部141は、所定の時間毎に、チップから統計情報を取得することにより、所定の時間毎に、所定の時間の間にチップを通過したパケット数を得ることができる。もしくは、IF制御部14が、各チップから入出力されるパケットを監視することで、所定の時間の間にチップを通過したパケット数をカウントし、統計情報として取得することとしてもよい。
所定の時間とは、予め定めた時間である。この時間は、所定の監視周期から得られる時間としてもよい。また、所定の伝送速度の下で、予め定めた数のパケット(例えば100個)が通過する時間を所定の時間として定めてもよい。
レート判定部142は、所定の時間での始点の統計情報(パケット数)に基づいて、パケットの伝送レートが、高レートか低レートかを判定する機能部である。本実施の形態では、低レートとは、監視の周期(つまり、上記の所定の時間)内で通過(送信)するパケット数が例えば1以下の場合である。高レートとは、低レート以外の場合であって、例えば、監視の周期の間に通過するパケット数が1より多い場合である。
より具体的には、例えば、監視の周期が1.0秒である場合において、始点のパケット数が1パケット/秒以下(監視の周期の1周期で2パケット未満)の状態が、低レート状態である。それ以外の状態が、高レート状態である。
統計情報比較部143は、統計情報収集部141により収集された始点と終点の統計情報を比較することにより、異常が発生しているかどうかを判定する機能部である。本実施の形態では、統計情報比較部143は、始点と終点の2つの統計情報を比較し、不一致の場合に異常と判定する。
例えば、図2Aにおいて、チップAにおける統計情報a(始点カウンタ値)が1以上、チップBにおける統計情報b(終点カウンタ)が0の場合には異常と判定する。図2Bの場合では、インタフェース部Aの統計情報c(始点カウンタ値)が1以上、インタフェース部Bの統計情報d(終点カウンタ値)が0の場合には異常と判定する。
ただし、高レートの場合、始点側統計情報と終点側統計情報は、タイムラグにより、正常な状態であっても、フレーム数が完全に一致しない場合がある。そこで、統計情報比較部143は、以下の2種類の判定のいずれかを実行することとしてもよい。
(1)始点パケットありの場合に、終点パケットの有無で異常かどうか判断する。つまり、始点パケット数が1以上、かつ終点パケット数が0である場合に異常と判定する。これにより「疎通断」であることが判定される。
(2)始点パケット数、終点パケット数を積分し(すなわち、累積をとり)、その差分がある程度の範囲内に収まっているかで判断する。例えば、始点パケット数、終点パケット数のそれぞれについて、現在までの所定回数分の統計情報の和をとり、始点での和から終点での和を引いた値が、予め定めた閾値以上であれば異常であると判定し、閾値未満であれば正常と判定する。これにより、「疎通断」に加えて、「信号劣化」を判定できる。なお、これらはいずれも「異常」である。
例えば、低レート、高レートいずれの場合も一律に(1)の方法で異常を検出することとしてもよいし、低レート、高レートいずれの場合も一律に(2)の方法で異常を検出することとしてもよい。
故障判定部144は、統計情報比較部143による異常判定の結果、異常判定が所定の回数連続して検出された時に、装置故障と判定する。このとき、レート判定部142により判定されたレートに応じて判定の条件(上記の連続回数)が変更される。この装置故障と判定する検出ロジック(判定条件)については、後に詳細に説明する。
故障通知部145は、故障判定部144により故障と判定された場合に、故障情報を装置制御部13に通知する機能部である。故障情報を受信した装置制御部13は、オペレーションシステム30に故障情報を通知する。
試験パケット送出指示部146は、各チップにパケット(ユーザ信号)が流れていない場合や、通信のパスが設定されていない場合に、パケットを流して故障判定を行うために、チップ間で試験パケットを送受信するように各チップへ指示する機能部である。本実施の形態では、各チップは、IF制御部14等からの指示により、試験パケット伝送用のパスを設定して、試験パケットを送受信する機能を備えているものとする。もしくは、インタフェース部11内あるいはインタフェース部外の通信装置10内に、試験パケットを生成及び送信する機能を備え、当該機能により、IF制御部14もしくは装置制御部13からの指示に応じて、チップ間もしくはインタフェース部間の所望のパス経由での試験パケットの送受信を行うこととしてもよい。
データ記憶部147は、メモリ等の記憶手段であり、処理に必要な情報を予め格納するとともに、各処理における処理対象の情報(統計情報等)が格納される。各機能部は、データ記憶部147を参照しながら処理を実行する。
前述したように、IF制御部14は、コンピュータ(CPU及びメモリを含む構成)に、本実施の形態で説明する処理内容を記述したプログラムを実行させることにより実現可能である。すなわち、IF制御部14の各部が有する機能は、IF制御部14を構成するコンピュータに内蔵されるCPUやメモリなどのハードウェア資源を用いて、各部で実施される処理に対応するプログラムを実行することによって実現することが可能である。また、上記プログラムは、コンピュータが読み取り可能な記録媒体(可搬メモリ等)に記録して、保存したり、配布したりすることが可能である。また、上記プログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。装置制御部13についても同様である。
(故障判定の動作)
次に、図4のフローチャートを参照して、故障判定に係る処理動作について説明する。
ステップ1)IF制御部14の統計情報収集部141は、監視の周期毎(言い換えると、所定の時間が経過するたび)に、始点と終点の統計情報収集を実行する。
ステップ2)次に、IF制御部14のレート判定部142は、始点の統計情報(パケット数)に応じて、現時点のレートが高レートであるか低レートであるかを判定する。
ステップ3)次に、IF制御部14の統計情報比較部143は、始点のパケット数と終点のパケット数の比較を行う。
ステップ4)そして、IF制御部14の統計情報比較部143は、ステップ3での比較結果に基づいて、統計情報に異常が発生しているかどうかを判定する。より詳細には、前述したように、判定方法に応じて、疎通断もしくは信号劣化が発生しているかどうかが判定される。
ステップ5)次に、IF制御部14の故障判定部144は、ステップ2でのレート判定の結果、及びステップ4での異常判定の結果に基づいて、高レートと低レートとでは異なる検出ロジックによって、装置(インタフェース部内、インタフェース部間など)に故障が有るかどうかの判定を実行する。
低レートの場合は、所定の時間に通過するパケットの数が少ないため、ある程度の時間(複数の監視周期の繰り返し)を監視しなければ、適確に故障の判定ができない。そのため、故障の判定は、高レートと低レートとでは異なる検出ロジックを用いる必要があり、レートに応じて検出ロジック(判定条件)を切り替えている。検出ロジック(判定条件)の詳細については、図5〜図8を用いて後に詳細に説明する。
ステップ6)故障が検出された場合、IF制御部14の故障通知部145は故障情報を装置制御部13に通知する。これにより、装置制御部13が、インタフェース部11での故障情報を検出する。ここでの故障情報には、例えば、インタフェース部11を識別する識別情報が含まれる。更に、故障情報の中に、インタフェース部11内で監視を行った2つのチップの識別情報を含めてもよい。
ステップ7)装置制御部13は、オペレーショシステム30に故障情報を通知する。ここでの故障情報には、例えば、通信装置10の識別情報、及びインタフェース部11の識別情報が含まれる。これにより、オペレーショシステム30を使用するシステム管理者等は、どの通信装置のどのインタフェース部で故障が発生したかを把握できる。ここでの故障情報にも、更に、インタフェース部11内で監視を行った2つのチップの識別情報を含めてもよい。
(故障判定時の状態遷移と判定ロジックの切り替えについて)
以下、IF制御部14の故障判定部144における故障判定時の状態遷移と判定ロジックの切り替えについて説明する。
前述したように、本実施の形態では、統計情報比較部143が、始点と終点の2つの統計情報を比較し、所定の条件を満たした場合(例えば、始点パケット数が1以上、終点パケット数が0)に、その監視周期の回に関して異常と判定する。
本例において、高レート状態での判定条件は、原則として、始点と終点の統計情報であるパケット数を比較して判定された結果が、3回連続異常である場合に装置故障と判定するものである。3回連続正常で装置故障状態から装置正常状態に回復させる。なお、状態情報は、故障判定部144がデータ記憶部147に記憶することにより、故障判定に用いる。
一方、低レート状態での判定条件は、誤検出を避けるために、原則として、始点と終点の統計情報であるパケット数を比較して判定された結果が、10回連続異常である場合に装置故障と判定するものである。また、例えば3回連続正常の場合に回復させる。
高レート状態にある場合において、2周期連続で低レートと判定された場合、その2周期目で低レート状態に遷移する。また、低レート状態にある場合は、1周期でも高レートと判定された場合に、その時点で高レート状態に遷移する。
装置故障の判定条件については、高レート状態から低レート状態に遷移した場合、「10回連続異常」に変更される。低レート状態から高レート状態に遷移した場合は、「3回連続異常」に変更される。ただし、低レート状態において、異常判定中の場合には、判定条件の変更は行わない。つまり、例えば、低レート状態で2回の異常判定が継続しているその2回目以降が高レートであった場合でも、異常が連続する限り、低レート状態の判定条件が適用され、例えばその後、8回連続で異常判定となった場合(合計で10回連続)に故障と判定される。
以下、図5、図6、図7を参照して、状態遷移と故障判定の具体例を説明する。
図5(a)は、高レート状態から低レート状態への遷移を示している。図5(a)において、●は高レートと判定された周期(つまり、1回の周期で得られた統計情報に基づき高レートと判定した時点)を示し、▲は低レートと判定された周期を示す。図5(b)及び図6、図7においても同様である。
図5(a)では、まず、高レート状態にあり、2周期連続で低レート状態になったので、その2周期目に低レート状態に遷移している。図5(a)には、判定条件も、低レート状態のものに切り替えられたことが示されている。
図5(b)は、低レート状態から高レート状態への遷移を示している。図5(b)では、まず、低レート状態にあり、高レートと判定された時点で高レート状態に遷移している。ただし、前述のように、低レート状態で、異常判定中の時には、判定条件の変更は行わない。
図6(a)は、高レートで異常検出中の状態遷移の第1の例を示す。なお、図6、図7において、網掛けの部分は、異常と判定されている期間を示す。図6(a)に示すように、高レートで異常判定中の3周期目の統計情報が低レートであっても、異常の場合は、低レート遷移前の3周期連続異常のため、装置故障(図では、Fail判定と記述)と判定する。
図6(b)は、高レートで異常検出中の状態遷移の第2の例を示す。図6(b)に示すように、高レートで異常判定中の1周期目と2周期目の統計情報が低レートの場合は、2周期連続で低レート状態であるので、低レート状態の判定条件の10連続異常に変更する。図6(b)では、10未満で異常状態が回復したため、装置故障とは判定しない。
図6(c)は、高レートで異常検出中の状態遷移の第3の例を示す。図6(c)に示すように、高レートで異常判定中の1周期目と2周期目の2周期連続で低レート状態であるので、低レート状態の判定条件の10連続異常に変更し、3周期目から10周期目まで低レート状態で異常が続いたので、装置故障と判定する。
図7(a)は、低レートで異常検出中の状態遷移の第1の例を示す。図7(a)に示すように、低レートでの異常検出中の3周期目以降が高レート状態に変化した場合であるが、異常が継続しているため低レート状態の判定条件を継続し、10周期目で装置故障と判定する。
図7(b)は、低レートで異常検出中の状態遷移の第2の例を示す。図7(b)に示すように、低レートでの異常検出中の3周期目以降が高レート状態に変化した場合で、10周期未満で異常が回復したため、直ちに高レート状態に遷移し、判定条件を3連続異常に変更する。
図7(c)は、低レート異常検出中の状態遷移の第3の例を示す。低レートでの異常検出中の3周期目以降が高レート状態に変化し、かつ10周期未満で異常が回復したため、直ちに判定条件を高レート状態の3連続異常に変更し、3連続異常が検出されたため、装置故障と判定する。
(インタフェース部間での故障検出について)
以上、主に図2Aに示したインタフェース部内での故障検出について詳細に説明したが、図2Bに示したインタフェース部間での故障検出についても故障検出のための処理手順や状態遷移、検出条件はインタフェース部内での故障検出と同じである。
図2Bの場合、装置制御部13が、図4に示すIF制御部14と同様の機能構成を備える。図2Bの場合、装置制御部13は、始点及び終点となる2つのインタフェース部の各々(具体的には、インタフェース部におけるチップ)から統計情報を収集してこれまでに説明したロジックで故障判定を行う。2つのインタフェース部におけるどのチップから統計情報を取得するかは、予め設定により定めることができる。
各インタフェース部から統計情報を取得する際には、例えば、各インタフェース部のIF制御部14に統計情報取得命令を出して、各IF制御部14から統計情報を取得してもよいし、直接にチップから統計情報を取得してもよい。
また、IF制御部14と同様に、装置制御部13は、試験パケットの送受信を行う指示を監視対象の各インタフェース部のチップやスイッチ部12に行うことができる。これにより、ユーザ信号がない場合や、パス未設定であっても、試験パケットを所望のインタフェース部間(つまり、インタフェース部のチップ間)に流すことができ、統計情報に基づく故障判定を実施できる。
図8は、インタフェース部(カード)冗長時のIF間故障検出を説明するための図である。図8に示す例では、カード#0〜#3のうち、カード#1が非選択系になっており、カード#1にはユーザ信号が流れていないことを示している。非選択系カードと隣接カード間ではユーザ信号は疎通しない。
そこで、本例では、カード#1から故障検出用の試験パケットを図8の点線に示すように送信することにより、カード#1とカード#2との間、及びカード#1とカード#3との間において、故障検出を行うことができる。また、カード#1内で所定のチップ間で試験パケットを送受信させることで、カード#1内での故障判定を行うこともできる。
すなわち、本実施の形態によれば、ATM等でパスが未設定でも故障を検出することができる。パスが未設定の場合でも、チップ間もしくはインタフェース部間に試験フレームを流すことで、ユーザ信号の疎通がない状態でも故障の検出が可能となる。これにより、今までパス設定をした上でユーザ通信を行なわないと判らなかった故障の検出が、可能となる。
以上、本発明の実施の形態を説明したが、説明した実施の形態は一例に過ぎない。例えば、上記の例では、チップから統計情報(通過パケット数)を取得することとしたが、統計情報を取得する元はチップでなくてもよい。すなわち、パケットを送出する機能部、及び、当該機能部から送出されたパケットを全て受信する機能部であって、統計情報を取得可能な機能部であれば、チップ以外の機能部であっても、統計情報を取得する元としてよい。
また、上記の例では、インタフェース部内のチップ間の故障判定の場合は、インタフェース部内のIF制御部14が故障判定を行うこととしたが、インタフェース部内のチップ間の故障判定の場合でも、装置制御部13が統計情報を各チップからもしくはIF制御部14から収集することにより、装置制御部13が故障判定を行うこととしてもよい。
また、本実施の形態は、インタフェース部の種別によらず、どれにでも適用可能である。更に、本実施の形態によれば、故障による通信影響の方向の特定が可能である。例えば、機能部Aから機能部Bへパケットを流すことによる故障判定1と、機能部Bから機能部Aへパケットを流すことによる故障判定2とを行い、故障判定1では故障が検出されないが、故障判定2で故障が検出された場合、機能部Bから機能部Aへの通信に影響を与えることが分かる。なお、ここでの機能部とは、チップでもよいし、インタフェース部でもよいし、統計情報を取得できるその他の機能部でもよい。
(実施の形態のまとめ、効果)
上述したとおり、本発明の実施の形態によれば、検出機能を備えたハードウェアを追加するのではなく、インタフェース部のファームウェア上で動作させることが可能な新たな検出ロジックを提供することによって、通信装置10の内部のインタフェース部間、あるいはインタフェース部内の故障の検出が可能となる。具体的な特徴をまとめると、以下の通りである。
第一に、パケットの個数を計測した統計情報を用いて、故障の検出を行うことを特徴とする。従来から、インタフェース部のステイタスを表示するために、インタフェース部のファームウェアにより、通過するパケットの個数を計測することは行われている。しかしながら、このパケットの個数を計測した統計情報を、故障の検出に用いることはなかった。また、単にパケットの個数を計測しただけでは、故障を検出することは出来なかった。本実施の形態では、新たな検出ロジックを提供することよって、統計情報を用いて故障の検出を行うことが実現される。
第二に、パケットのレートに応じて、故障判定ロジックを変えることを特徴とする。高レートと低レートとで、故障判定ロジックを変えることによって、非同期動作に起因した故障判定誤りを回避して、正しい故障判定を可能とするものである。
判定ロジックとしては、上述したとおり、送信パケットはあるが受信パケットがゼロの場合に異常とする判断や、送信パケット数、受信パケット数を一定時間積分した上でその差分量で判断する等の方法がある。また、高レートと低レートとで、故障判定のための異常の連続回数を変えている。
第三に、パスが未設定の場合は、チップ間もしくはインタフェース部間に試験パケットを流すことを特徴とする。これにより、ユーザ信号の疎通がない状態でも、故障の検出が可能となる。可能とするものである。第四に、カード冗長構成時の非選択系カード故障も検出可能であることを特徴とする。すなわち、非選択系カードにおいてもチップ間もしくはIF間に試験フレームを流す等で故障検出可能となる。
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
10 通信装置
20 ネットワーク
30 オペレーションシステム
11 インタフェース部
12 スイッチ部
13 装置制御部
14 IF制御部
141 統計情報収集部
142 レート判定部
143 統計情報比較部
144 故障判定部
145 故障通知部
146 試験パケット送出指示部
147 データ記憶部

Claims (10)

  1. パケット通信を行う通信装置であって、
    パケットを送出する第1の機能部と、
    前記第1の機能部から送出されたパケットを受信する第2の機能部と、
    所定の周期で、前記第1の機能部から送出されたパケットの数の統計情報と、前記第2の機能部が受信したパケットの数の統計情報とを収集する統計情報収集手段と、
    前記統計情報収集手段により収集された前記第1の機能部の統計情報と前記第2の機能部の統計情報とを比較することにより、異常が発生しているか否かを判定する統計情報比較手段と、
    前記所定の周期で連続して異常であると判定された回数に基づき、前記第1の機能部と前記第2の機能部との間における装置故障が発生したか否かを判定する故障判定手段とを備える通信装置であり、
    前記通信装置は、前記第1の機能部から収集された統計情報に基づいて、前記パケットの伝送レートが高レートであるか低レートであるかを判定するレート判定手段を更に備え、
    前記故障判定手段は、前記レート判定手段により判定されたレートに応じて、前記回数を変更する
    ことを特徴とする通信装置
  2. 前記故障判定手段は、前記レート判定手段により高レートであると判定された場合の前記回数を、前記レート判定手段により低レートであると判定された場合の回数よりも少なくする
    ことを特徴とする請求項1に記載の通信装置。
  3. 前記第1の機能部から前記第2の機能部へ、前記パケットとしての試験パケットを伝送させる手段を更に備えたことを特徴とする請求項1又は2に記載の通信装置。
  4. 前記統計情報は、前記所定の周期の期間におけるパケットの個数であることを特徴とする請求項1ないしのうちいずれか1項に記載の通信装置。
  5. 前記統計情報は、前記所定の周期の期間におけるパケットの個数を所定期間にわたり累積した値であることを特徴とする請求項1ないしのうちいずれか1項に記載の通信装置。
  6. 前記第1の機能部と前記第2の機能部はそれぞれ、前記通信装置のインタフェース部内のチップであり、前記統計情報収集手段、前記統計情報比較手段、及び前記故障判定手段は、前記インタフェース部内のIF制御部で実行されるプログラムにより実現される
    ことを特徴とする請求項1ないしのうちいずれか1項に記載の通信装置。
  7. 前記第1の機能部と前記第2の機能部はそれぞれ、前記通信装置のインタフェース部であり、前記統計情報収集手段、前記統計情報比較手段、及び前記故障判定手段は、前記通信装置内の装置制御部で実行されるプログラムにより実現される
    ことを特徴とする請求項1ないしのうちいずれか1項に記載の通信装置。
  8. 前記通信装置は、パケット伝送装置に搭載して使用されるインタフェースカードであることを特徴とする請求項1ないしのうちいずれか1項に記載の通信装置。
  9. パケットを送出する第1の機能部と、前記第1の機能部から送出されたパケットを受信する第2の機能部とを備える通信装置における故障判定方法であって、
    所定の周期で、前記第1の機能部から送出されたパケットの数の統計情報と、前記第2の機能部が受信したパケットの数の統計情報とを収集する統計情報収集ステップと、
    前記統計情報収集ステップにより収集された前記第1の機能部の統計情報と前記第2の機能部の統計情報とを比較することにより、異常が発生しているか否かを判定する統計情報比較ステップと、
    前記所定の周期で連続して異常であると判定された回数に基づき、前記第1の機能部と前記第2の機能部との間における装置故障が発生したか否かを判定する故障判定ステップとを備える故障判定方法であり、
    前記故障判定方法は、前記第1の機能部から収集された統計情報に基づいて、前記パケットの伝送レートが高レートであるか低レートであるかを判定するレート判定ステップを更に備え、
    前記故障判定ステップにおいて、前記通信装置は、前記レート判定ステップにより判定されたレートに応じて、前記回数を変更する
    ことを特徴とする故障判定方法
  10. パケットを送出する第1の機能部と、前記第1の機能部から送出されたパケットを受信する第2の機能部とを備える通信装置内のコンピュータを、
    所定の周期で、前記第1の機能部から送出されたパケットの数の統計情報と、前記第2の機能部が受信したパケットの数の統計情報とを収集する統計情報収集手段、
    前記統計情報収集手段により収集された前記第1の機能部の統計情報と前記第2の機能部の統計情報とを比較することにより、異常が発生しているか否かを判定する統計情報比較手段、
    前記所定の周期で連続して異常であると判定された回数に基づき、前記第1の機能部と前記第2の機能部との間における装置故障が発生したか否かを判定する故障判定手段、
    前記第1の機能部から収集された統計情報に基づいて、前記パケットの伝送レートが高レートであるか低レートであるかを判定するレート判定手段、として機能させるためのプログラムであり、
    前記故障判定手段は、前記レート判定手段により判定されたレートに応じて、前記回数を変更する
    ことを特徴とするプログラム。
JP2012037975A 2012-02-23 2012-02-23 通信装置、故障判定方法、及びプログラム Active JP5779522B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012037975A JP5779522B2 (ja) 2012-02-23 2012-02-23 通信装置、故障判定方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012037975A JP5779522B2 (ja) 2012-02-23 2012-02-23 通信装置、故障判定方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2013175837A JP2013175837A (ja) 2013-09-05
JP5779522B2 true JP5779522B2 (ja) 2015-09-16

Family

ID=49268398

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012037975A Active JP5779522B2 (ja) 2012-02-23 2012-02-23 通信装置、故障判定方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5779522B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5904140B2 (ja) * 2013-02-27 2016-04-13 富士通株式会社 伝送装置および異常検出方法
DE102014206053A1 (de) 2014-03-31 2015-10-01 Siemens Aktiengesellschaft Erhöhen einer Dienstgüte in einem Netzwerk
JP7147601B2 (ja) * 2019-01-31 2022-10-05 富士通株式会社 検査方法および検査システム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08274778A (ja) * 1995-03-30 1996-10-18 Fujitsu Ltd 通信路診断方式
JPH11127155A (ja) * 1997-10-20 1999-05-11 Fujitsu Ltd 交換機
JP2008109249A (ja) * 2006-10-24 2008-05-08 Mitsubishi Electric Corp 通信装置の自己監視装置
JP4902440B2 (ja) * 2007-06-26 2012-03-21 株式会社日立製作所 ノード装置および障害検知方法
JP2009130786A (ja) * 2007-11-27 2009-06-11 Nec Corp 通信装置、通信システム、および、通信装置間の通信品質監視方法

Also Published As

Publication number Publication date
JP2013175837A (ja) 2013-09-05

Similar Documents

Publication Publication Date Title
US9100299B2 (en) Detecting error conditions in standby links
CN104468176B (zh) 用于控制器局域网络中的故障检测的方法和装置
US20140149801A1 (en) Method and apparatus for isolating a fault in a controller area network
US8670303B2 (en) Multiple-fault-tolerant ethernet network for industrial control
US6601210B1 (en) Data integrity verification in a switching network
CN112887126B (zh) 一种报文链路的诊断方法、装置及计算机存储介质
US7924737B2 (en) Signal degrade detecting method, signal restoration detecting method, devices for those methods, and traffic transmission system
WO2013127164A1 (zh) 一种触发旁路设备切换的方法、旁路设备切换方法及装置
JP5779522B2 (ja) 通信装置、故障判定方法、及びプログラム
JP2005210719A (ja) パケット交換ネットワークにおいて中断時間を求める方法
CN109889411A (zh) 一种数据传输的方法及装置
CN101667953B (zh) 一种快速环网物理链路状态的上报方法及装置
US8527815B2 (en) Method for detecting a failure in a SAS/SATA topology
JP5321347B2 (ja) ネットワーク保守管理システム、端点ノード、ネットワーク保守管理方法、及び、プログラム
US8169893B1 (en) Quick detection of problematic link to support fast failover
CN101406002B (zh) 用于检测通信系统中的差错的设备
CN113535618A (zh) 用于通过串行接口收发器进行故障检测和报告的系统和方法
US8917609B2 (en) Line monitoring apparatus and line monitoring method
JP5722167B2 (ja) 障害監視判定装置、障害監視判定方法、及びプログラム
JP5904140B2 (ja) 伝送装置および異常検出方法
JP6052150B2 (ja) 中継装置
KR102247167B1 (ko) 통신 네트워크 관리 방법 및 장치
JP2010028185A (ja) ネットワークノード、ネットワークシステムおよび輻輳検出方法
JP6984548B2 (ja) 組電池監視装置
JP2006285845A (ja) 耐障害性を有する情報通信システムおよび耐障害性を有する情報通信装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140508

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150623

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150713

R150 Certificate of patent or registration of utility model

Ref document number: 5779522

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250