JP6791660B2 - 障害検出装置及び障害検出方法 - Google Patents

障害検出装置及び障害検出方法 Download PDF

Info

Publication number
JP6791660B2
JP6791660B2 JP2016123772A JP2016123772A JP6791660B2 JP 6791660 B2 JP6791660 B2 JP 6791660B2 JP 2016123772 A JP2016123772 A JP 2016123772A JP 2016123772 A JP2016123772 A JP 2016123772A JP 6791660 B2 JP6791660 B2 JP 6791660B2
Authority
JP
Japan
Prior art keywords
alarm
failure
determined
count value
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016123772A
Other languages
English (en)
Other versions
JP2017228934A (ja
Inventor
薫 須藤
薫 須藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2016123772A priority Critical patent/JP6791660B2/ja
Publication of JP2017228934A publication Critical patent/JP2017228934A/ja
Application granted granted Critical
Publication of JP6791660B2 publication Critical patent/JP6791660B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Maintenance And Management Of Digital Transmission (AREA)

Description

本発明は、障害検出装置及び障害検出方法に関し、特に、間欠障害を検出するための障害検出装置及び障害検出方法に関する。
複数の通信カードを含んで構成される通信装置において、外的要因により、不特定の箇所でデータがビット化けし、一時的に通信カード間の通信でデータエラーが発生する間欠障害が発生することがある。データエラーを生じさせる外的要因には、例えば、外部から回路素子に照射される放射線や電磁波がある。このようなデータエラーが発生した場合には、通常、その都度エラー検出訂正処理や再送処理による救済が行われる。
しかし、間欠障害は、その程度により繰り返し発生し、その影響は装置の性能低下や接続回線品質劣化といった形で現れる。そして、間欠障害をそのまま放置すれば、間欠障害がいずれ固定障害に移行する場合もある。そうなると、該当通信装置と接続されている通信システム全体にまで、障害の影響が及ぶ可能性がある。固定障害は、間欠的ではなく時間的に固定的に、すなわち連続して発生し続ける障害である。
ケーブルの断線、電子部品の劣化故障や突発故障のような内部的な要因による固定障害は装置内で固定障害として検出される場合が多い。そして、このような固定障害は、被疑個所の特定も比較的容易である。しかし、間欠障害は、その発生が気づかれにくいため、障害個所や障害原因の特定に時間を要することが多い。
例えば、通信装置内に配置された複数の通信カード間の信号同期方式としてフレーム同期が採用される場合がある。そして、一般的に、通信カード間のフレーム同期障害の検出閾値に前方保護が設定され、障害検出後から復旧までの閾値に後方保護が設定される。前方保護及び後方保護により、障害の発生及び復旧の通知が過度に敏感に発出されることが抑制される。
一般的な前方保護では、フレーム同期状態からフレーム同期パターン照合結果がP回連続不一致を検出するまでの連続フレーム数が、アラーム発出の閾値(=前方保護段数)に達した時に障害検出が発報される。また、一般的な後方保護では、フレーム同期外れ状態からフレーム同期パターンの照合結果がQ回連続一致を検出するまでの連続フレーム数がアラーム停止の閾値(=後方保護段数)に達した時に、障害復旧が発報される。P及びQは自然数であり、フレーム同期が用いられる通信カードの仕様によって規定される。
本発明に関連して、特許文献1は、間欠障害を検知する技術を開示している。また、特許文献2は、正常なワードのダウンカウント時とエラーワードのアップカウントとで異なるカウント数を持つデータ伝送装置を開示している。
特開2012−080426号公報 特公昭58−040383号公報
前方保護段数及び後方保護段数は、いずれも、連続カウントによる累積値である。そのため、例えば、装置内の間欠障害が原因で、前方保護段数に達する前にわずか1フレームでもフレーム同期パターンが正常と判断された場合には、連続カウントによる累積値が「0」(ゼロ)にクリアされる。この場合には、累積カウント値は前方保護段数に達する前に0クリアされるため、間欠障害は発報されない。
フレーム同期外れが検出された場合には、通信システムが備えるパフォーマンスモニタ(Performance Monitor:PM)によって重大エラー秒数(Severely Errored Second:SES)や不稼働秒数(UnAvailable Second:UAS)として通知される場合がある。しかし、上述のような、フレーム同期外れと認識されない程度の間欠障害が発生していた場合、PMは間欠障害を障害として通知しないため、一般的なPMでは間欠障害を検出できない。
閾値超過アラート(Threshold Crossing Alert:TCA)では、例えば15分間隔又は24時間間隔でBIP(Bit Interleaved Parity)演算結果の閾値超過数がカウントされる。しかし、信号断及びフレーム同期外れが検出されている場合には、TCAのカウントは停止される。このため、フレーム同期外れと認識されない間欠障害が発生しても、TCAカウント数から間欠障害を知ることができない場合がある。
このように、フレーム信号を用いた一般的な通信装置では、間欠障害を認識できない場合があるという課題があった。一方、特許文献1に記載された発明は、間欠障害の検知にヘルスチェックパケットを用いているため、ヘルスチェックパケットの送受信回路が必要であり、通信装置に特許文献1の発明を適用した場合、通信装置の構成が複雑になるという課題がある。また、特許文献2は、間欠障害の検出のための技術への言及がない。
(発明の目的)
本発明は、簡単な構成で間欠障害を検出可能な技術を提供することを目的とする。
本発明の障害検出装置は、受信したフレーム信号から障害を検出するための情報を抽出するフレーム終端手段と、前記情報に基づいて、前記フレーム信号のアラームの有無を前記フレーム信号のフレーム毎に判断する障害監視手段と、前記判断の結果に基づいて、前記アラームがあると判断される毎にカウント値が累積され、前記アラームがないと判断される毎に前記カウント値が減算されるカウンタ手段とを備え、前記障害監視手段は、前記カウント値が所定の閾値に達すると障害発生と判断する信号を出力する。
本発明の障害検出方法は、受信したフレーム信号から障害を検出するための情報を抽出し、前記情報に基づいて、前記フレーム信号のアラームの有無を前記フレーム信号のフレーム毎に判断し、前記判断の結果に基づいて、前記アラームがあると判断される毎にカウント値を累積し、前記アラームがないと判断される毎に前記カウント値を減算し、前記カウント値が所定の閾値に達すると障害発生と判断する信号を出力する、ことを特徴とする。
本発明の障害検出プログラムは、障害検出装置のコンピュータに、受信したフレーム信号から障害を検出するための情報を抽出する手順、前記情報に基づいて、前記フレーム信号のアラームの有無を前記フレーム信号のフレーム毎に判断する手順、前記判断の結果に基づいて、アラームがあると判断される毎にカウント値を累積し、アラームがないと判断される毎に前記カウント値を減算する手順、前記カウント値が所定の閾値に達すると障害発生と判断する信号を出力する手順、を実行させる手順を備える。
本発明の障害検出装置及び障害検出方法は、簡単な構成で間欠障害を検出できる。
第1の実施形態の通信システム100及び回線インタフェース装置1の構成例を示すブロック図である。 装置内フレーム信号のフレームフォーマットの例を示す図である。 UP/DOWNカウンタ回路221のカウント数の遷移の例を示す図である。 カード2における間欠障害の検出動作手順の例を示すフローチャートである。 第2の実施形態の障害検出装置500の構成例を示すブロック図である。 障害検出装置500の動作手順の例を示すフローチャートである。
以下に、本発明の実施形態について説明する。各実施形態では、装置内に備えられた通信カード間のデータ伝送における間欠障害の検出について説明する。
(第1の実施形態)
本発明の第1の実施形態について、図面を参照し構成を説明する。図1は、第1の実施形態の通信システム100及び回線インタフェース装置1の構成例を示すブロック図である。通信システム100は、回線インタフェース装置1と、外部装置4とを備える。
回線インタフェース装置1は、外部回線インタフェース信号により、外部装置4との間で双方向のデータ伝送を行う。回線インタフェース装置1と外部装置4との間で伝送されるデータは、それぞれの装置の内部で生成されるデータでもよいし、他の装置からそれぞれの装置に通知されるデータでもよい。外部回線インタフェース信号の伝送媒体は、例えば光ケーブル、メタリックケーブルであるが、これらには限定されない。回線インタフェース装置1と外部装置4とは、無線通信により接続されてもよい。
回線インタフェース装置1は、カード2及びカード3を備える。カード2及びカード3は通信機能を備える通信カードであり、例えば、プリント配線基板上に形成された、信号処理機能を持つ電気回路である。カード2及びカード3は、それぞれ、回線インタフェース装置1の機能を実現するための機能を備える。カード2は、装置内フレーム終端部21、装置内障害監視部22、データ収集部23、障害発報部24、回線インタフェース終端部25、回線障害監視部26を備える。カード3は、装置内フレーム終端部31、装置内障害監視部32、データ収集部33、障害発報部34を備える。さらに、装置内障害監視部22はUP/DOWNカウンタ回路221を備え、装置内障害監視部32はUP/DOWNカウンタ回路321を備える。
カード2は、外部回線インタフェース信号を用いて外部装置4と通信するとともに、装置内フレーム信号を用いてカード3と通信する。回線インタフェース終端部25は、外部装置4との送受信インタフェースであり、外部回線インタフェース信号を終端する機能を備える。データ収集部23は、装置内フレーム終端部21及び回線インタフェース終端部25から入力される信号から、出力先で必要なデータを抽出する機能を備える。カード2は、回線障害監視部26によって、外部装置4との通信の障害及び外部回線とのインタフェースの障害を監視及び処理する機能を備える。
カード3は、装置内フレーム信号を用いてカード2と通信する。データ収集部33は、装置内フレーム終端部31から入力される信号から、カード3の内部あるいは図示されない他の通信カードで必要なデータを抽出する機能を備える。データ収集部33は、カード3の内部あるいは図示されない他の通信カードで生成されたデータを、装置内フレーム終端部31へ出力する機能を備えてもよい。
カード2とカード3とが備える装置内フレーム終端部21及び31は、カード間の通信の送受信インタフェースである。装置内フレーム終端部21及び31は、対向するカードへ装置内フレーム信号を送信するとともに、対向するカードから受信した装置内フレーム信号を終端する。カード2とカード3との間は、光ケーブル、メタリックケーブル、あるいはコネクタ等の物理的媒体で接続される。装置内フレーム終端部21及び31は、カード間の接続形態に合わせて、装置内フレーム信号の光信号から電気信号への変換や、異なる形式の電気信号間の変換などを行うインタフェース回路を備える。装置内フレーム終端部21及び31は、さらに、フレーム信号の多重及び分離を行う回路をも備えてもよい。このような構成により、カード2と外部装置4との間、及び、カード3と外部装置4との間でデータ伝送が可能となる。
回線インタフェース装置1は、カード2内の装置内障害監視部22とカード3の装置内障害監視部32によって、カード間の通信における間欠障害を検出する。装置内障害監視部22及び32は、装置内フレーム信号の異常に起因する障害を示す情報の発出の判断に必要とされる情報を監視する。これらの情報は、例えば装置内フレーム信号に格納されたフレーム同期パターンやBIP演算結果などであり、アラームの発出の判断に用いられる情報である。フレーム同期パターンは回線インタフェース装置1の仕様によって規定されたパターン及び長さを持つビット列である。これらの情報は、装置内フレーム終端部21及び31から、それぞれ装置内障害監視部22及び32に通知される。装置内障害監視部22及び32は、通知されたこれらの情報に基づいて異常の発生の有無を判断してアラーム情報として累積する。
装置内障害監視部22は、累積したアラーム情報が障害発報レベルに達すると、障害発報部24に障害発生を通知する。障害発報部24は、装置内障害監視部22から障害発生が通知された場合には、図示されない上位装置に装置内フレーム信号に関する障害の発生を発報する。同様に、装置内障害監視部32は、累積したアラーム情報が障害発報レベルに達すると、障害発報部34に障害発生を通知する。障害発報部34は、装置内障害監視部32から障害発生が通知された場合には、図示されない上位装置に装置内フレーム信号に関する障害の発生を発報する。
回線障害監視部26は、外部回線インタフェース信号の異常に起因するアラームの発出の判断に必要とされる情報を監視する。外部回線インタフェース信号の異常に関する情報は、回線インタフェース終端部25から回線障害監視部26に通知される。回線障害監視部26は、通知された情報に基づいて異常の発生の有無を判断してアラーム情報として累積する。回線障害監視部26は、累積したアラーム情報が障害発報レベルに達すると、障害発報部24に障害発生を通知する。障害発報部24は、回線障害監視部26から障害発生が通知された場合にも、図示されない上位装置に外部回線インタフェース信号に関する障害の発生を発報する。
図2は、カード2とカード3との間で送受信される装置内フレーム信号のフレームフォーマットの例を示す図である。装置内フレーム信号は、125μs(マイクロ秒)の長さを持つフレームの繰り返しで構成される。各フレームは、ペイロード(データ)、オーバーヘッド(OH)及びチャネルオーバーヘッド(COH)を含む。OHには、例えば、フレームの構成等に関する各種の情報が格納される。COHには、例えば、フレーム同期パターンやBIP演算結果が格納される。フレーム同期パターンは、受信されたフレーム信号のCOH、OH及びペイロードの位置を検出するために用いられる。
図2のフレームフォーマットは本実施形態で用いられるフレーム信号の構成の一例を示すものであり、ペイロード、OH、COHのデータ長やそれらの具体的な内容はカード2及び3の仕様に基づいて規定される。例えば、各ペイロード長が261バイト、OH長及びCOH長がいずれも9バイトであり、125μsの間に、261バイトのペイロードが9個、9バイトのOHが8個、9バイトのCOHが1個伝送されてもよい。この場合、装置内フレーム信号の伝送速度は155.52Mbps(メガビット毎秒)であり、ペイロードの伝送容量は150.336Mbpsである。もちろん、これらの数値は一例であり、実施形態のフレームフォーマットを限定しない。
(第1の実施形態の動作の説明)
第1の実施形態の回線インタフェース装置1の動作について、図面を参照して説明する。カード2は、図2に例示される装置内フレーム信号をカード3から受信し、受信した装置内フレーム信号を装置内フレーム終端部21において終端する。装置内障害監視部22には、装置内フレーム終端部21から入力された装置内フレーム信号のOH及びCOHのいずれかに格納された、アラームの発出の判断に用いられる情報が通知され、装置内障害監視部22は、これらの情報を監視する。後述するように、本実施形態では、COHに格納されたフレーム同期パターンが装置内フレーム終端部21から装置内障害監視部22へ通知される場合について説明する。
装置内障害監視部22内のUP/DOWNカウンタ回路221は、数値をカウントアップ又はカウントダウンするカウンタ回路である。UP/DOWNカウンタ回路221は、フレーム信号の異常の有無に応じてカウントアップ又はカウントダウンされる。カード3の装置内フレーム終端部31、装置内障害監視部32及びUP/DOWNカウンタ回路221は、カード2から装置内フレーム信号を受信すると、装置内フレーム終端部21、装置内障害監視部22及びUP/DOWNカウンタ回路321と同様に動作する。このため、カード3の動作に関する詳細な説明は省略する。
本実施形態では、一例として、フレーム同期パターンがCOHに格納され、装置内障害監視部22がフレーム同期パターンの異常によるアラームの有無を監視する場合を例として説明する。装置内フレーム終端部21は、COHに格納されたフレーム同期パターンを1フレーム(125μs)毎に装置内障害監視部22へ出力する。装置内障害監視部22は、装置内フレーム終端部21から入力されたフレーム同期パターンを監視し、フレーム同期パターンに異常がある場合は「アラームあり」と判断し、アラームビットを「1」に設定する。フレーム同期パターンが正常の場合は「アラームなし」と判断し、アラームビットを「0」(ゼロ)と設定する。
装置内障害監視部22は、装置内フレーム終端部21からフレーム同期パターンが通知されるたびに、上述のようにフレーム同期パターンの正常性を検査する。すなわち、装置内障害監視部22は、通知されたフレーム同期パターンと、規定されたフレーム同期パターンとが一致した場合には「アラームなし」と判断する。また、装置内障害監視部22は、通知されたフレーム同期パターンが1ビットでも誤っていた場合には「アラームあり」と判断する。ただし、「アラームあり/なし」の判断に他の基準が用いられてもよい。
アラームビットは、例えば、装置内障害監視部22において記憶される1ビットの変数である。UP/DOWNカウンタ回路221は、アラームビットの値(すなわち、アラームの有無)に基づき、1フレーム毎に以下の動作を行う。
(1)アラームあり(アラームビット=「1」)の場合には、カウント値をMだけカウントアップする。
(2)アラームなし(アラームビット=「0」)の場合には、カウント値をNだけカウントダウンする。
ここで、M及びNは、あらかじめ回線インタフェース装置1の仕様によって規定された自然数である。UP/DOWNカウンタ回路221においてカウント値は累積され、累積されたカウント値を以下ではTで表す。累積カウント値Tは、アラームビットが「0」である場合(すなわち、通知されたフレーム同期パターンが正常である場合)でも「0」にクリアされない。
上記の(1)、(2)の手順によるカウントアップ及びカウントダウンの結果、UP/DOWNカウンタ回路221の累積カウント値Tが障害検出閾値T0に達すると、装置内障害監視部22は、障害発生を障害発報部24に通知する。そして、当該通知を受けた障害発報部24は上位装置へ障害の発生を通知する。また、UP/DOWNカウンタ回路221の累積カウント値Tが障害復旧閾値T1に達すると、装置内障害監視部22は、障害復旧を障害発報部24に通知する。そして、当該通知を受けた障害発報部24は上位装置へ障害の復旧を通知する。ここで、T0及びT1はあらかじめ定められた閾値であり、T0>T1である。
上述のフレーム同期パターンの検査手順において、UP/DOWNカウンタ回路221におけるアラーム検出率Dを、D=M/(M+N)として定義することができる。アラーム検出率Dは、UP/DOWNカウンタ回路221における累積カウント値の増加率を示す指数である。アラーム検出率Dを高くすると、「アラームあり」の状態の比率(すなわち、発生確率)が変わらない場合でもUP/DOWNカウンタ回路221の累積カウント値Tの増加量を大きくでき、その結果、障害をより早期に検出できる。
ここで、「アラームあり」の場合のカウントアップ値Mと「アラームなし」の場合のカウントダウン値Nとを異なる値とする重み付けを行うことで、アラーム検出率Dの値を高くすることができる。例えば、アラーム検出時のカウントアップ値Mとアラーム非検出時のカウントダウン値Nとの関係をM>Nとしてもよい。M>Nとすることで、1回の「アラームなし」検出によるカウントダウンに対して1回の「アラームあり」検出によるカウントアップによる累積カウント値の増加を優越させることができる。
なお、障害発報条件(前方保護段数、すなわち、フレーム同期状態において、フレーム同期パターン照合結果が連続不一致を検出するまでの連続フレーム数)は、一般的な装置内フレーム同期外れ検出の仕様のままとしてもよい。ただし、1回の「アラームあり」に対するカウントアップ値Mを大きくすると、装置内障害監視部22が障害検出を障害発報部24に通知するまでの保護時間が短くなってしまう(すなわち、前方保護段数が小さくなる)。このため、本実施形態では、アラーム検出時のカウントアップ値Mを大きくすると同時に、障害検出閾値T0をカウントアップ値Mと同じ比率で増加させる。例えば、装置内フレーム信号の1フレームの長さが125μsであり、前方保護段数が224段である場合を考える。この場合、障害検出の閾値は125μs×224フレーム=28msである。
ここで、本実施形態では、カウントアップ値M=4、カウントダウン値N=1とする。すなわち、M:Nは4:1である。この場合には、フレーム同期パターンが監視される期間内においてフレーム毎のアラームの発生率が1/5(=20%)を超えていれば、カウントアップ量の期待値はカウントダウン量の期待値よりも大きい。従って、平均的にはカウントダウンに対してカウントアップが優越するため、間欠障害であっても障害として検出可能となる。より一般的には、一般的に、アラームの発生率をA、アラームがないと判断される場合の比率を1−Aとした場合に、M/N>(1−A)/AとなるようにM及びNを設定することで間欠障害を検出可能である、と表現できる。上述の例では、A>0.2、M=4、N=1である。「アラームの発生率」はアラームがあると判断される場合の比率である。また、0<A<1である。
また、障害検出閾値T0も4倍の値とすることで、障害検出下での保護時間を28msのまま(すなわち、前方保護されるフレームの数を224段)とすることができる。すなわち、最短で障害検出と判定されるまでの時間(障害検出閾値28ms)における前方保護段数は224段であるので、前方保護段数に達する累積カウント値Tは、224段×4倍=896段となる。つまり、障害検出閾値T0は、896カウントとなる。
また、障害の復旧を上位装置に通知する際の累積カウント値である障害復旧閾値T1を「0」カウントとした場合、累積カウント値Tが「0」になった時に障害復旧と判断される。そして、復旧と判定されるまでの時間は、896カウントから1カウントずつダウンするため、最短時間では以下の式1のように、112msとなる。
896(カウント)×125(μs)=112(ms) ・・・(式1)
なお、上述の例において、カウントアップ値Mに基づいて障害検出閾値T0を増加させない場合には、障害検出閾値T0は224カウントとなる。この場合、224÷4=56であるので、障害復旧(累積カウント値T=0)の後、56回の「アラームあり」によって累積カウント値Tは障害検出閾値T0に達するため、障害検出閾値T0を896カウントとする場合と比較して間欠障害を早期に発見できる。
図3は、UP/DOWNカウンタ回路221のカウント数の遷移の例を示す図である。図3には、上述した内容に基づいて、UP/DOWNカウンタ回路221のカウント数が変化する様子の例を示す。図3の縦軸は累積カウント値T、横軸は時間である。アラームビットの確認は装置内フレーム信号の1フレーム毎に行われるため、時刻は125μs単位で進行する。そして、UP/DOWNカウンタ回路221は、125μs毎にカウントUP/DOWN動作を行う。
初期状態ではUP/DOWNカウンタ回路221の累積カウント値Tは0であるとする。アラームビットが「1」である場合には、累積カウント値は4増加し(例えば図3の累積カウント値T=0→4→8→12)、アラームビットが「0」であると累積カウント値は1減少する(例えば図3のT=12→11→10)。このように累積カウント値の増減を繰り返しながら、累積カウント値Tが障害検出閾値T0(本実施形態では896)に達すると、装置内障害監視部22は、障害発報部24へ障害の発生を通知する。また、累積カウント値Tが障害検出閾値T0に達した後、累積カウント値Tが障害復旧閾値T1(本実施形態ではT1=0)まで減少すると、装置内障害監視部22は、障害発報部24へ、障害の復旧を通知する。
なお、M及びNの設定値によっては、累積カウント値Tがマイナスになる場合も起こりうる。このような場合は、T<0となった時点でT=0となったとみなして障害が復旧したと判断してもよい。一方、累積カウント値Tが障害検出閾値T0を超えた場合にも、装置内障害監視部22は、障害発生と判断してもよい。累積カウント値TがT≧T0となった場合には、カウントアップを停止してもよい。「アラームなし」の場合には累積カウント値は、1ずつカウントダウンする。累積カウント値Tが障害復旧閾値T1以下になると、障害復旧と判断される。上述した例では、障害復旧閾値T1を0としているが、必ずしもT1=0とする必要はない。障害復旧と判断された後、累積カウント値TはT=0にクリアされなくともよい。この場合は、T=T1からカウント動作が継続され、「アラームあり」である場合には再び累積カウント値TがMカウントアップされる。
図4は、カード2における間欠障害の検出動作手順の例を示すフローチャートである。装置内フレーム終端部21は、受信したフレーム信号から障害を検出するための情報、すなわちフレーム同期パターンを抽出し(図4のステップS11)、抽出された情報に基づいて、フレーム同期パターンの異常の有無をフレーム毎に判断する(ステップS12)。判断の結果、異常がある(「アラームあり」)と判断されると累積カウント値がMカウントアップされ(ステップS13)、異常がない(「アラームなし」)と判断されると累積カウント値がNカウントダウンされる(ステップS14)。そして、累積カウント値が障害検出閾値T0又は障害復旧閾値T1に達したかどうかが判断される(ステップS15)。累積カウント値TがT0以上に達した場合(T≧T0)には、装置内障害監視部22は、障害発生を障害発報部24に通知する(ステップS16)。累積カウント値TがT1以下まで減少した場合(T≦T1)には、装置内障害監視部22は、障害復旧を障害発報部24に通知する(ステップS17)。
以上説明した第1の実施形態の回線インタフェース装置1は、以下の効果を奏する。すなわち、回線インタフェース装置1は、PM(パフォーマンスモニタ)やTCA(閾値超過アラート)では検出が困難であった、フレーム信号を用いた通信における間欠障害を簡単な構成で検出できる。その理由は、回線インタフェース装置1は、受信したフレーム信号から抽出したフレーム同期パターンに基づいてアラームの有無を判断し、UP/DOWNカウンタ回路221において累積カウント値により障害発生を検出しているからである。そして、回線インタフェース装置1は、ヘルスチェックのための信号を生成することを要しない。
また、回線インタフェース装置1は、障害の検出感度を変更できる。その理由は、UP/DOWNカウンタ回路221において、アラームが発生した場合のカウントアップ値Mとアラームが発生しない場合のカウントダウン値Nとを独立に設定することで、これらの値の重みづけを可変としているからである。
このように、第1の実施形態の回線インタフェース装置1は、簡単な構成で間欠障害を検出できるという効果を奏する。対向する通信カードにおいて間欠障害の検出が容易となることで障害の早期発見が可能となり、障害に起因する運用サービスへの影響が抑制される。
(第1の実施形態の変形例)
回線インタフェース装置1は、以下のような第1の実施形態の変形例によっても、簡単な構成で間欠障害を検出できるという効果を奏する。
第1の実施形態では、カード2における、カード3から受信した装置内フレーム信号の間欠障害を検出する手順について説明した。図1に示すように、装置内フレーム信号の監視に関してはカード3もカード2と同様の機能を備える。従って、回線インタフェース装置1は、カード3で受信される装置内フレーム信号の間欠障害を検出してもよい。
さらに、回線インタフェース装置1がさらに他の通信カードを備える場合に、各カードが備える装置内フレーム信号のインタフェースの全てに、上述の間欠障害の検出手順が適用されてもよい。このような構成により、対向する通信カード間で互いに間欠障害の検出が可能となる。加えて、通信カードが備える障害監視のための構成が共通化されることにより、通信カードの製造コスト低減も可能となる。なお、装置内フレーム信号による通信が回線インタフェース装置1内の複数の箇所で行われており、特定の箇所で間欠障害の検出率を上げたい場合は、その箇所の通信におけるカウントアップ値Mとカウントダウン値Nの比率を調整すればよい。
さらに、装置内の通信カード間のインタフェースのみならず、外部回線とのインタフェースにも、ITU−T勧告などの公的規格に準拠した障害検出条件と併用して、第1の実施形態の間欠障害検出方法を適用してもよい。この場合には、外部回線とのインタフェースにおいても間欠障害の検出が可能となる。なお、ITU−Tは、International Telecommunication Union Telecommunication Standardization Sectorの略である。
さらに、他の通信カードと比較して故障率の高い部品を使用している通信カードにおいて、カウントアップ値M及びカウントダウン値Nの重みづけや障害検出閾値T0及び障害復旧閾値T1を他の通信カードと異なるものとしてもよい。このようにすることで、故障率の高い通信カードの間欠障害の検出をより容易とし、当該通信カードが実装された装置のより安定した運用が可能となる。
なお、本実施形態では、アラーム情報がフレーム同期パターンの不一致に基づく情報(すなわち、フレーム同期外れ)である場合について説明した。しかし、実際には、装置間フレーム信号のアラーム情報は複数存在するため、複数のアラーム情報を同時に監視することで、装置内フレーム信号に含まれる複数のアラーム情報に対する間欠障害検出が可能となる。
なお、カード2は、さらに、中央処理装置(central processing unit、CPU)及び記録媒体を備えてもよい。そして、回線インタフェース装置1の機能及び動作手順は、記録媒体に記録されたプログラムをCPUが実行することにより実現されてもよい。プログラムは、固定された、一時的でない記録媒体に記録される。記録媒体としては半導体メモリ又は固定磁気ディスク装置が用いられるが、これらには限定されない。
(第2の実施形態)
図5は、本発明の第2の実施形態の障害検出装置500の構成例を示すブロック図である。障害検出装置500は、フレーム終端部501、障害監視部502、カウンタ部503、を備える。
フレーム終端部501は、フレーム信号を受信し、受信したフレーム信号から障害を検出するための情報を抽出する。障害監視部502は、フレーム信号から抽出された、障害を検出するための情報に基づいて、フレーム信号のアラームの有無をフレーム信号のフレーム毎に判断する。フレーム信号のアラームの有無の判断は、例えば、障害を検出するための情報が正常である場合に「アラームあり」とし、当該情報に誤りがある場合に「アラームなし」とすることで行われてもよい。
カウンタ部503は障害監視部502に備えられる。カウンタ部503は、アラームの有無の判断結果に基づいて、「アラームあり」と判断される毎にカウント値を累積し、「アラームなし」と判断される毎にカウント値を減算する。そして、カウント値の累積の結果、カウンタ部503のカウント値が増加して所定の第1の閾値と等しくなると、障害監視部502は障害発生を示す信号を出力する。また、カウント値の減算の結果、カウンタ部503のカウント値が減少して所定の第2の閾値と等しくなると、障害監視部502は障害復旧を示す信号を出力する。ここで、第1の閾値は第2の閾値よりも大きい。
図6は、障害検出装置500の動作手順の例を示すフローチャートである。障害検出装置500は、受信したフレーム信号から障害を検出するための情報を抽出し(図6のステップS51)、抽出された情報に基づいて、フレーム信号のアラームの有無をフレーム信号のフレーム毎に判断する(ステップS52)。判断の結果、アラームがあると判断されるとカウント値が累積され(ステップS53)、アラームがないと判断されるとカウント値が減算される(ステップS54)。そして、カウント値が所定の第1の閾値及び第2の閾値の少なくとも一方に達したかどうかが判断される(ステップS55)。カウント値の累積の結果、カウント値が第1の閾値に達した場合には、障害検出装置500は、障害発生と判断する信号を出力する(ステップS56)。カウント値の減算の結果、カウント値が第2の閾値に達した場合には、障害検出装置500は、障害復旧と判断する信号を出力する(ステップS57)。
このような構成を備える障害検出装置500は、簡単な構成で間欠障害を検出できるという効果を奏する。その理由は、受信したフレーム信号から障害を検出するための情報を抽出し、カウンタ部503において累積カウント値により障害を検出しているからである。
第1の実施形態の回線インタフェース装置1の装置内フレーム終端部21、装置内障害監視部22及びUP/DOWNカウンタ回路221は、それぞれ、第2の実施形態の障害検出装置500が備えるフレーム終端部501、障害監視部502、カウンタ部503に対応する機能を備える。すなわち、第1の実施形態の回線インタフェース装置1も、第2の実施形態の障害検出装置500と同様の機能を備える。第1の実施形態の障害検出閾値T0及び障害復旧閾値T1は、それぞれ、第2の実施形態の第1の閾値及び第2の閾値に対応する。
第1の実施形態の回線インタフェース装置1と同様に、障害検出装置500は、さらに、CPU及び記録媒体を備えてもよい。そして、障害検出装置500の機能及び動作手順は、記録媒体に記録されたプログラムをCPUが実行することにより実現されてもよい。プログラムは、固定された、一時的でない記録媒体に記録される。記録媒体としては半導体メモリ又は固定磁気ディスク装置が用いられるが、これらには限定されない。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記の実施形態に限定されない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
また、それぞれの実施形態に記載された構成は、必ずしも互いに排他的なものではない。本発明の作用及び効果は、上述の実施形態の全部又は一部を組み合わせた構成によって実現されてもよい。
1 回線インタフェース装置
2、3 カード
4 外部装置
21、31 装置内フレーム終端部
22、32 装置内障害監視部
23、33 データ収集部
24、34 障害発報部
25 回線インタフェース終端部
26 回線障害監視部
100 通信システム
221、321 UP/DOWNカウンタ回路
500 障害検出装置
501 フレーム終端部
502 障害監視部
503 カウンタ部

Claims (6)

  1. 受信したフレーム信号から障害を検出するための情報を抽出するフレーム終端手段と、
    前記情報に基づいて、前記フレーム信号のアラームの有無を前記フレーム信号のフレーム毎に判断する障害監視手段と、
    前記判断の結果に基づいて、前記アラームがあると判断される毎にカウント値が累積され、前記アラームがないと判断される毎に前記カウント値が減算されるカウンタ手段とを備え、
    前記障害監視手段は、前記カウント値が所定の閾値に達すると障害発生と判断する信号を出力する、障害検出装置であって、
    前記アラームがあると判断された際に累積される前記カウント値をM、前記アラームがないと判断された際に減算される前記カウント値をNとすると、M及びNは自然数でありかつM>Nであり、
    前記アラームがあると判断される場合の比率をA、前記アラームがないと判断される場合の比率を1−A(ただし0<A<1)とした場合に、M/N>(1−A)/AとなるようにM及びNが設定される、
    障害検出装置
  2. 第1の通信カードと第2の通信カードとを備える回線インタフェース装置であって、
    前記第1の通信カードは、
    外部装置とのインタフェースである回線インタフェース終端手段と、
    前記第2の通信カードからフレーム信号を受信する請求項1に記載された障害検出装置と、
    前記回線インタフェース終端手段と前記障害検出装置との間でデータを送受信するテータ収集手段とを備え、
    前記第2の通信カードは、前記第1の通信カードとの間で前記フレーム信号を送受信するための他のフレーム終端手段を備える、
    回線インタフェース装置。
  3. 前記第2の通信カードは、前記他のフレーム終端手段に代えて請求項1に記載された障害検出装置を備える、
    請求項2に記載された回線インタフェース装置。
  4. 請求項2又は3に記載された回線インタフェース装置と、
    外部回線インタフェース信号を用いて前記回線インタフェース装置と通信する外部装置と、
    を備える通信システム。
  5. 受信したフレーム信号から障害を検出するための情報を抽出し、
    前記情報に基づいて、前記フレーム信号のアラームの有無を前記フレーム信号のフレーム毎に判断し、
    前記判断の結果に基づいて、前記アラームがあると判断される毎にカウント値を累積し、前記アラームがないと判断される毎に前記カウント値を減算し、
    前記カウント値が所定の閾値に達すると障害発生と判断する信号を出力する、
    障害検出方法であって、
    前記アラームがあると判断された際に累積される前記カウント値をM、前記アラームがないと判断された際に減算される前記カウント値をNとすると、M及びNは自然数でありかつM>Nであり、
    前記アラームがあると判断される場合の比率をA、前記アラームがないと判断される場合の比率を1−A(ただし0<A<1)とした場合に、M/N>(1−A)/AとなるようにM及びNが設定される、障害検出方法
  6. 障害検出装置のコンピュータに、
    受信したフレーム信号から障害を検出するための情報を抽出する手順、
    前記情報に基づいて、前記フレーム信号のアラームの有無を前記フレーム信号のフレーム毎に判断する手順、
    前記判断の結果に基づいて、アラームがあると判断される毎にカウント値を累積し、アラームがないと判断される毎に前記カウント値を減算する手順、
    前記カウント値が所定の閾値に達すると障害発生と判断する信号を出力する手順、
    前記アラームがあると判断された際に累積される前記カウント値をM、前記アラームがないと判断された際に減算される前記カウント値をNとすると、M及びNを自然数かつM>Nとする手順、
    前記アラームがあると判断される場合の比率をA、前記アラームがないと判断される場合の比率を1−A(ただし0<A<1)とした場合に、M/N>(1−A)/AとなるようにM及びNを設定する手順、
    を実行させるための障害検出プログラム。
JP2016123772A 2016-06-22 2016-06-22 障害検出装置及び障害検出方法 Active JP6791660B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016123772A JP6791660B2 (ja) 2016-06-22 2016-06-22 障害検出装置及び障害検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016123772A JP6791660B2 (ja) 2016-06-22 2016-06-22 障害検出装置及び障害検出方法

Publications (2)

Publication Number Publication Date
JP2017228934A JP2017228934A (ja) 2017-12-28
JP6791660B2 true JP6791660B2 (ja) 2020-11-25

Family

ID=60892129

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016123772A Active JP6791660B2 (ja) 2016-06-22 2016-06-22 障害検出装置及び障害検出方法

Country Status (1)

Country Link
JP (1) JP6791660B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7462431B2 (ja) 2020-02-28 2024-04-05 本田技研工業株式会社 不正信号検出装置
CN113033752B (zh) * 2021-03-22 2023-06-02 深圳市英威腾电气股份有限公司 通信故障检测方法、主机、从机

Also Published As

Publication number Publication date
JP2017228934A (ja) 2017-12-28

Similar Documents

Publication Publication Date Title
US7818634B2 (en) Detecting method and system for consistency of link scrambling configuration
US6983403B2 (en) Detecting bit errors in a communications system
JP2002101121A (ja) 特定帯域内における伝送データ種類を自動変更する伝送装置
US7924737B2 (en) Signal degrade detecting method, signal restoration detecting method, devices for those methods, and traffic transmission system
EP1573965A1 (en) Network tap module
US6775237B2 (en) Methods and apparatus for burst tolerant excessive bit error rate alarm detection and clearing
JP6791660B2 (ja) 障害検出装置及び障害検出方法
US6591383B1 (en) Bit error rate detection
US5696788A (en) Circuit for searching fault location in a device having a plurality of application specific integrated circuits
JP4413358B2 (ja) 障害監視システム及び障害通知方法
CN108337069B (zh) 一种改进的降低误码率的末端并行分组crc校验系统
EP2034657A1 (en) Communication device
JP2021508980A (ja) ビットエラー検出方法および装置
CA2159763C (en) Programmable jump window for sonet compliant bit error monitoring
JP2009231906A (ja) データ伝送システム、伝送装置、およびプロテクション制御方法
CN109039761B (zh) 集群控制通道中故障链路处理方法和装置
US7225366B2 (en) Transport systems and method of monitoring burst error
JP6508340B2 (ja) エラー監視装置、方法およびプログラム
CN112463521B (zh) 一种提升串行高速总线设备可靠性的容错方法、装置
JP6331263B2 (ja) 通信装置、通信システム、及び通信方法
JP2003348039A (ja) 冗長構成をとる通信システムおよび通信装置
KR0135213B1 (ko) 소네트(sonet)신호 전송중 프레임 에러 감지 회로
JP3530176B2 (ja) ノード装置および状態通知情報取得方法
JP3769375B2 (ja) 装置内データパリティ監視回路
JPH05308348A (ja) 伝送処理システムにおける誤り監視装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20170706

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200310

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201013

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201105

R150 Certificate of patent or registration of utility model

Ref document number: 6791660

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150