JP2017228934A - Fault detection device and fault detection method - Google Patents

Fault detection device and fault detection method Download PDF

Info

Publication number
JP2017228934A
JP2017228934A JP2016123772A JP2016123772A JP2017228934A JP 2017228934 A JP2017228934 A JP 2017228934A JP 2016123772 A JP2016123772 A JP 2016123772A JP 2016123772 A JP2016123772 A JP 2016123772A JP 2017228934 A JP2017228934 A JP 2017228934A
Authority
JP
Japan
Prior art keywords
failure
alarm
count value
frame
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016123772A
Other languages
Japanese (ja)
Other versions
JP6791660B2 (en
Inventor
薫 須藤
Kaoru Sudo
薫 須藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2016123772A priority Critical patent/JP6791660B2/en
Publication of JP2017228934A publication Critical patent/JP2017228934A/en
Application granted granted Critical
Publication of JP6791660B2 publication Critical patent/JP6791660B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a technique capable of detecting an intermittent fault with a simple configuration.SOLUTION: A fault detection device includes: a frame termination unit for extracting information to detect a fault from a received frame signal; a fault monitoring unit for determining if there is an alarm in the frame signal for each frame of the frame signal on the basis of the information; and a counter unit for increasing a count value by one every time it is determined that there is an alarm on the basis of its determination result and decreasing the count value by one every time it is determined that there is not an alarm. The fault monitoring unit outputs a signal to determine that a fault has occurred if the count value reaches a prescribed threshold value.SELECTED DRAWING: Figure 1

Description

本発明は、障害検出装置及び障害検出方法に関し、特に、間欠障害を検出するための障害検出装置及び障害検出方法に関する。   The present invention relates to a failure detection device and a failure detection method, and more particularly, to a failure detection device and a failure detection method for detecting an intermittent failure.

複数の通信カードを含んで構成される通信装置において、外的要因により、不特定の箇所でデータがビット化けし、一時的に通信カード間の通信でデータエラーが発生する間欠障害が発生することがある。データエラーを生じさせる外的要因には、例えば、外部から回路素子に照射される放射線や電磁波がある。このようなデータエラーが発生した場合には、通常、その都度エラー検出訂正処理や再送処理による救済が行われる。   In a communication device that includes multiple communication cards, due to external factors, data is garbled at unspecified locations, causing intermittent failures that temporarily cause data errors in communication between communication cards. There is. External factors that cause data errors include, for example, radiation and electromagnetic waves that are applied to circuit elements from the outside. When such a data error occurs, usually, relief is performed by error detection correction processing and retransmission processing each time.

しかし、間欠障害は、その程度により繰り返し発生し、その影響は装置の性能低下や接続回線品質劣化といった形で現れる。そして、間欠障害をそのまま放置すれば、間欠障害がいずれ固定障害に移行する場合もある。そうなると、該当通信装置と接続されている通信システム全体にまで、障害の影響が及ぶ可能性がある。固定障害は、間欠的ではなく時間的に固定的に、すなわち連続して発生し続ける障害である。   However, intermittent failures occur repeatedly depending on the degree, and the effect appears in the form of device performance degradation and connection line quality degradation. If the intermittent failure is left as it is, the intermittent failure may eventually shift to a fixed failure. If so, there is a possibility that the influence of the failure may reach the entire communication system connected to the communication device. A fixed failure is a failure that occurs not fixed intermittently but fixed in time, that is, continuously.

ケーブルの断線、電子部品の劣化故障や突発故障のような内部的な要因による固定障害は装置内で固定障害として検出される場合が多い。そして、このような固定障害は、被疑個所の特定も比較的容易である。しかし、間欠障害は、その発生が気づかれにくいため、障害個所や障害原因の特定に時間を要することが多い。   Fixed failures due to internal factors such as cable disconnection, electronic component deterioration failure or sudden failure are often detected as fixed failures in the apparatus. Such a fixed failure is relatively easy to identify the suspicious part. However, since the occurrence of intermittent failures is difficult to notice, it often takes time to identify the location of failure and the cause of failure.

例えば、通信装置内に配置された複数の通信カード間の信号同期方式としてフレーム同期が採用される場合がある。そして、一般的に、通信カード間のフレーム同期障害の検出閾値に前方保護が設定され、障害検出後から復旧までの閾値に後方保護が設定される。前方保護及び後方保護により、障害の発生及び復旧の通知が過度に敏感に発出されることが抑制される。   For example, frame synchronization may be employed as a signal synchronization method between a plurality of communication cards arranged in a communication device. In general, forward protection is set as a detection threshold value for a frame synchronization failure between communication cards, and backward protection is set as a threshold value after failure detection until recovery. Forward protection and backward protection suppress the occurrence of faults and recovery notifications that are overly sensitive.

一般的な前方保護では、フレーム同期状態からフレーム同期パターン照合結果がP回連続不一致を検出するまでの連続フレーム数が、アラーム発出の閾値(=前方保護段数)に達した時に障害検出が発報される。また、一般的な後方保護では、フレーム同期外れ状態からフレーム同期パターンの照合結果がQ回連続一致を検出するまでの連続フレーム数がアラーム停止の閾値(=後方保護段数)に達した時に、障害復旧が発報される。P及びQは自然数であり、フレーム同期が用いられる通信カードの仕様によって規定される。   In general forward protection, failure detection is triggered when the number of consecutive frames from the frame synchronization state until the frame synchronization pattern matching result detects P consecutive inconsistencies reaches the alarm generation threshold (= the number of forward protection stages). Is done. In general backward protection, a failure occurs when the number of consecutive frames from the out-of-frame synchronization state until the frame synchronization pattern matching result detects Q consecutive matches reaches the alarm stop threshold (= the number of backward protection stages). Recovery is reported. P and Q are natural numbers and are defined by the specifications of the communication card in which frame synchronization is used.

本発明に関連して、特許文献1は、間欠障害を検知する技術を開示している。また、特許文献2は、正常なワードのダウンカウント時とエラーワードのアップカウントとで異なるカウント数を持つデータ伝送装置を開示している。   In relation to the present invention, Patent Document 1 discloses a technique for detecting an intermittent failure. Patent Document 2 discloses a data transmission apparatus having different counts for normal word down-counting and error word up-counting.

特開2012−080426号公報JP2012-080426A 特公昭58−040383号公報Japanese Examined Patent Publication No. 58-040383

前方保護段数及び後方保護段数は、いずれも、連続カウントによる累積値である。そのため、例えば、装置内の間欠障害が原因で、前方保護段数に達する前にわずか1フレームでもフレーム同期パターンが正常と判断された場合には、連続カウントによる累積値が「0」(ゼロ)にクリアされる。この場合には、累積カウント値は前方保護段数に達する前に0クリアされるため、間欠障害は発報されない。   Both the number of front protection steps and the number of rear protection steps are cumulative values obtained by continuous counting. Therefore, for example, if the frame synchronization pattern is determined to be normal even for one frame before reaching the number of forward protection stages due to an intermittent failure in the apparatus, the cumulative value by the continuous count becomes “0” (zero). Cleared. In this case, since the cumulative count value is cleared to 0 before reaching the number of forward protection stages, an intermittent failure is not issued.

フレーム同期外れが検出された場合には、通信システムが備えるパフォーマンスモニタ(Performance Monitor:PM)によって重大エラー秒数(Severely Errored Second:SES)や不稼働秒数(UnAvailable Second:UAS)として通知される場合がある。しかし、上述のような、フレーム同期外れと認識されない程度の間欠障害が発生していた場合、PMは間欠障害を障害として通知しないため、一般的なPMでは間欠障害を検出できない。   When out-of-frame synchronization is detected, it is notified as severely errored second (SES) or non-available second (UAS) by a performance monitor (PM) provided in the communication system. There is a case. However, when an intermittent failure that is not recognized as out-of-frame synchronization as described above has occurred, the PM does not notify the intermittent failure as a failure, so a general PM cannot detect the intermittent failure.

閾値超過アラート(Threshold Crossing Alert:TCA)では、例えば15分間隔又は24時間間隔でBIP(Bit Interleaved Parity)演算結果の閾値超過数がカウントされる。しかし、信号断及びフレーム同期外れが検出されている場合には、TCAのカウントは停止される。このため、フレーム同期外れと認識されない間欠障害が発生しても、TCAカウント数から間欠障害を知ることができない場合がある。   In the threshold crossing alert (TCA), the number of BIP (Bit Interleaved Parity) calculation results exceeding the threshold is counted, for example, at intervals of 15 minutes or 24 hours. However, if signal loss and loss of frame synchronization are detected, the TCA count is stopped. For this reason, even if an intermittent failure that is not recognized as out of frame synchronization occurs, the intermittent failure may not be known from the TCA count.

このように、フレーム信号を用いた一般的な通信装置では、間欠障害を認識できない場合があるという課題があった。一方、特許文献1に記載された発明は、間欠障害の検知にヘルスチェックパケットを用いているため、ヘルスチェックパケットの送受信回路が必要であり、通信装置に特許文献1の発明を適用した場合、通信装置の構成が複雑になるという課題がある。また、特許文献2は、間欠障害の検出のための技術への言及がない。   As described above, a general communication device using a frame signal has a problem that an intermittent failure may not be recognized. On the other hand, since the invention described in Patent Document 1 uses a health check packet for detecting intermittent failures, a transmission / reception circuit for the health check packet is necessary. When the invention of Patent Document 1 is applied to a communication device, There exists a subject that the structure of a communication apparatus becomes complicated. Patent Document 2 does not mention a technique for detecting an intermittent failure.

(発明の目的)
本発明は、簡単な構成で間欠障害を検出可能な技術を提供することを目的とする。
(Object of invention)
An object of this invention is to provide the technique which can detect an intermittent failure with a simple structure.

本発明の障害検出装置は、受信したフレーム信号から障害を検出するための情報を抽出するフレーム終端手段と、前記情報に基づいて、前記フレーム信号のアラームの有無を前記フレーム信号のフレーム毎に判断する障害監視手段と、前記判断の結果に基づいて、前記アラームがあると判断される毎にカウント値が累積され、前記アラームがないと判断される毎に前記カウント値が減算されるカウンタ手段とを備え、前記障害監視手段は、前記カウント値が所定の閾値に達すると障害発生と判断する信号を出力する。   The failure detection apparatus of the present invention includes a frame termination unit that extracts information for detecting a failure from a received frame signal, and determines whether there is an alarm in the frame signal for each frame of the frame signal based on the information. And a counter means for accumulating a count value every time it is determined that there is an alarm based on a result of the determination, and subtracting the count value every time it is determined that there is no alarm. And the failure monitoring means outputs a signal for determining that a failure has occurred when the count value reaches a predetermined threshold value.

本発明の障害検出方法は、受信したフレーム信号から障害を検出するための情報を抽出し、前記情報に基づいて、前記フレーム信号のアラームの有無を前記フレーム信号のフレーム毎に判断し、前記判断の結果に基づいて、前記アラームがあると判断される毎にカウント値を累積し、前記アラームがないと判断される毎に前記カウント値を減算し、前記カウント値が所定の閾値に達すると障害発生と判断する信号を出力する、ことを特徴とする。   The failure detection method of the present invention extracts information for detecting a failure from a received frame signal, and determines the presence or absence of an alarm in the frame signal for each frame of the frame signal based on the information. The count value is accumulated every time it is determined that there is an alarm based on the result of the above, and the count value is subtracted every time it is determined that there is no alarm, and if the count value reaches a predetermined threshold value, a failure occurs. A signal for determining occurrence is output.

本発明の障害検出プログラムは、障害検出装置のコンピュータに、受信したフレーム信号から障害を検出するための情報を抽出する手順、前記情報に基づいて、前記フレーム信号のアラームの有無を前記フレーム信号のフレーム毎に判断する手順、前記判断の結果に基づいて、アラームがあると判断される毎にカウント値を累積し、アラームがないと判断される毎に前記カウント値を減算する手順、前記カウント値が所定の閾値に達すると障害発生と判断する信号を出力する手順、を実行させる手順を備える。   The fault detection program of the present invention is a procedure for extracting information for detecting a fault from a received frame signal to a computer of the fault detection apparatus, and based on the information, the presence or absence of an alarm of the frame signal is detected. A procedure for determining each frame, a procedure for accumulating a count value every time it is determined that there is an alarm based on a result of the determination, and a step for subtracting the count value every time it is determined that there is no alarm, the count value Includes a procedure for executing a procedure for outputting a signal for determining that a failure has occurred when the value reaches a predetermined threshold value.

本発明の障害検出装置及び障害検出方法は、簡単な構成で間欠障害を検出できる。   The fault detection apparatus and fault detection method of the present invention can detect intermittent faults with a simple configuration.

第1の実施形態の通信システム100及び回線インタフェース装置1の構成例を示すブロック図である。1 is a block diagram illustrating a configuration example of a communication system 100 and a line interface device 1 according to a first embodiment. 装置内フレーム信号のフレームフォーマットの例を示す図である。It is a figure which shows the example of the frame format of the frame signal in an apparatus. UP/DOWNカウンタ回路221のカウント数の遷移の例を示す図である。FIG. 10 is a diagram illustrating an example of transition of the count number of an UP / DOWN counter circuit 221. カード2における間欠障害の検出動作手順の例を示すフローチャートである。4 is a flowchart illustrating an example of an operation procedure for detecting an intermittent failure in a card 2. 第2の実施形態の障害検出装置500の構成例を示すブロック図である。It is a block diagram which shows the structural example of the failure detection apparatus 500 of 2nd Embodiment. 障害検出装置500の動作手順の例を示すフローチャートである。5 is a flowchart illustrating an example of an operation procedure of the failure detection apparatus 500.

以下に、本発明の実施形態について説明する。各実施形態では、装置内に備えられた通信カード間のデータ伝送における間欠障害の検出について説明する。   Hereinafter, embodiments of the present invention will be described. In each embodiment, detection of intermittent failure in data transmission between communication cards provided in the apparatus will be described.

(第1の実施形態)
本発明の第1の実施形態について、図面を参照し構成を説明する。図1は、第1の実施形態の通信システム100及び回線インタフェース装置1の構成例を示すブロック図である。通信システム100は、回線インタフェース装置1と、外部装置4とを備える。
(First embodiment)
The configuration of the first embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram illustrating a configuration example of the communication system 100 and the line interface device 1 according to the first embodiment. The communication system 100 includes a line interface device 1 and an external device 4.

回線インタフェース装置1は、外部回線インタフェース信号により、外部装置4との間で双方向のデータ伝送を行う。回線インタフェース装置1と外部装置4との間で伝送されるデータは、それぞれの装置の内部で生成されるデータでもよいし、他の装置からそれぞれの装置に通知されるデータでもよい。外部回線インタフェース信号の伝送媒体は、例えば光ケーブル、メタリックケーブルであるが、これらには限定されない。回線インタフェース装置1と外部装置4とは、無線通信により接続されてもよい。   The line interface device 1 performs bidirectional data transmission with the external device 4 in response to an external line interface signal. The data transmitted between the line interface device 1 and the external device 4 may be data generated inside each device or data notified from other devices to each device. The transmission medium for the external line interface signal is, for example, an optical cable or a metallic cable, but is not limited thereto. The line interface device 1 and the external device 4 may be connected by wireless communication.

回線インタフェース装置1は、カード2及びカード3を備える。カード2及びカード3は通信機能を備える通信カードであり、例えば、プリント配線基板上に形成された、信号処理機能を持つ電気回路である。カード2及びカード3は、それぞれ、回線インタフェース装置1の機能を実現するための機能を備える。カード2は、装置内フレーム終端部21、装置内障害監視部22、データ収集部23、障害発報部24、回線インタフェース終端部25、回線障害監視部26を備える。カード3は、装置内フレーム終端部31、装置内障害監視部32、データ収集部33、障害発報部34を備える。さらに、装置内障害監視部22はUP/DOWNカウンタ回路221を備え、装置内障害監視部32はUP/DOWNカウンタ回路321を備える。   The line interface device 1 includes a card 2 and a card 3. The cards 2 and 3 are communication cards having a communication function, and are, for example, electric circuits formed on a printed wiring board and having a signal processing function. Each of the card 2 and the card 3 has a function for realizing the function of the line interface device 1. The card 2 includes an intra-device frame termination unit 21, an intra-device fault monitoring unit 22, a data collection unit 23, a fault reporting unit 24, a line interface termination unit 25, and a line fault monitoring unit 26. The card 3 includes an in-device frame termination unit 31, an in-device failure monitoring unit 32, a data collection unit 33, and a failure notification unit 34. Further, the in-device failure monitoring unit 22 includes an UP / DOWN counter circuit 221, and the in-device failure monitoring unit 32 includes an UP / DOWN counter circuit 321.

カード2は、外部回線インタフェース信号を用いて外部装置4と通信するとともに、装置内フレーム信号を用いてカード3と通信する。回線インタフェース終端部25は、外部装置4との送受信インタフェースであり、外部回線インタフェース信号を終端する機能を備える。データ収集部23は、装置内フレーム終端部21及び回線インタフェース終端部25から入力される信号から、出力先で必要なデータを抽出する機能を備える。カード2は、回線障害監視部26によって、外部装置4との通信の障害及び外部回線とのインタフェースの障害を監視及び処理する機能を備える。   The card 2 communicates with the external device 4 using an external line interface signal, and communicates with the card 3 using an in-device frame signal. The line interface termination unit 25 is a transmission / reception interface with the external device 4 and has a function of terminating an external line interface signal. The data collection unit 23 has a function of extracting data required at the output destination from signals input from the in-device frame termination unit 21 and the line interface termination unit 25. The card 2 has a function of monitoring and processing a failure in communication with the external device 4 and a failure in an interface with the external line by the line failure monitoring unit 26.

カード3は、装置内フレーム信号を用いてカード2と通信する。データ収集部33は、装置内フレーム終端部31から入力される信号から、カード3の内部あるいは図示されない他の通信カードで必要なデータを抽出する機能を備える。データ収集部33は、カード3の内部あるいは図示されない他の通信カードで生成されたデータを、装置内フレーム終端部31へ出力する機能を備えてもよい。   The card 3 communicates with the card 2 using the in-device frame signal. The data collection unit 33 has a function of extracting data necessary for the inside of the card 3 or another communication card (not shown) from the signal input from the in-device frame termination unit 31. The data collection unit 33 may have a function of outputting data generated in the card 3 or another communication card (not shown) to the in-device frame termination unit 31.

カード2とカード3とが備える装置内フレーム終端部21及び31は、カード間の通信の送受信インタフェースである。装置内フレーム終端部21及び31は、対向するカードへ装置内フレーム信号を送信するとともに、対向するカードから受信した装置内フレーム信号を終端する。カード2とカード3との間は、光ケーブル、メタリックケーブル、あるいはコネクタ等の物理的媒体で接続される。装置内フレーム終端部21及び31は、カード間の接続形態に合わせて、装置内フレーム信号の光信号から電気信号への変換や、異なる形式の電気信号間の変換などを行うインタフェース回路を備える。装置内フレーム終端部21及び31は、さらに、フレーム信号の多重及び分離を行う回路をも備えてもよい。このような構成により、カード2と外部装置4との間、及び、カード3と外部装置4との間でデータ伝送が可能となる。   The in-device frame termination units 21 and 31 included in the card 2 and the card 3 are transmission / reception interfaces for communication between cards. The in-device frame terminators 21 and 31 transmit the in-device frame signal to the opposite card and terminate the in-device frame signal received from the opposite card. The card 2 and the card 3 are connected by a physical medium such as an optical cable, a metallic cable, or a connector. The in-device frame termination units 21 and 31 include an interface circuit that converts an in-device frame signal from an optical signal to an electric signal, conversion between different types of electric signals, and the like in accordance with the connection form between cards. The in-device frame termination units 21 and 31 may further include a circuit for multiplexing and demultiplexing the frame signal. Such a configuration enables data transmission between the card 2 and the external device 4 and between the card 3 and the external device 4.

回線インタフェース装置1は、カード2内の装置内障害監視部22とカード3の装置内障害監視部32によって、カード間の通信における間欠障害を検出する。装置内障害監視部22及び32は、装置内フレーム信号の異常に起因する障害を示す情報の発出の判断に必要とされる情報を監視する。これらの情報は、例えば装置内フレーム信号に格納されたフレーム同期パターンやBIP演算結果などであり、アラームの発出の判断に用いられる情報である。フレーム同期パターンは回線インタフェース装置1の仕様によって規定されたパターン及び長さを持つビット列である。これらの情報は、装置内フレーム終端部21及び31から、それぞれ装置内障害監視部22及び32に通知される。装置内障害監視部22及び32は、通知されたこれらの情報に基づいて異常の発生の有無を判断してアラーム情報として累積する。   The line interface device 1 detects an intermittent failure in communication between cards by the device failure monitoring unit 22 in the card 2 and the device failure monitoring unit 32 in the card 3. The in-device failure monitoring units 22 and 32 monitor information required for determining the generation of information indicating a failure due to an abnormality in the in-device frame signal. These pieces of information are, for example, a frame synchronization pattern stored in the in-device frame signal, a BIP calculation result, and the like, and are information used to determine whether an alarm is issued. The frame synchronization pattern is a bit string having a pattern and a length defined by the specifications of the line interface device 1. These pieces of information are notified from the in-device frame termination units 21 and 31 to the in-device failure monitoring units 22 and 32, respectively. The in-device failure monitoring units 22 and 32 determine whether or not an abnormality has occurred based on the notified information and accumulate the alarm information.

装置内障害監視部22は、累積したアラーム情報が障害発報レベルに達すると、障害発報部24に障害発生を通知する。障害発報部24は、装置内障害監視部22から障害発生が通知された場合には、図示されない上位装置に装置内フレーム信号に関する障害の発生を発報する。同様に、装置内障害監視部32は、累積したアラーム情報が障害発報レベルに達すると、障害発報部34に障害発生を通知する。障害発報部34は、装置内障害監視部32から障害発生が通知された場合には、図示されない上位装置に装置内フレーム信号に関する障害の発生を発報する。   When the accumulated alarm information reaches the failure reporting level, the in-device failure monitoring unit 22 notifies the failure reporting unit 24 of the occurrence of the failure. When the failure notification unit 24 is notified of the occurrence of a failure from the in-device failure monitoring unit 22, the failure notification unit 24 reports the occurrence of a failure related to the in-device frame signal to a higher-level device (not shown). Similarly, when the accumulated alarm information reaches the failure notification level, the in-device failure monitoring unit 32 notifies the failure notification unit 34 of the occurrence of the failure. When the failure notification unit 34 is notified of the occurrence of a failure from the device failure monitoring unit 32, the failure notification unit 34 reports the occurrence of a failure related to the device frame signal to a higher-level device (not shown).

回線障害監視部26は、外部回線インタフェース信号の異常に起因するアラームの発出の判断に必要とされる情報を監視する。外部回線インタフェース信号の異常に関する情報は、回線インタフェース終端部25から回線障害監視部26に通知される。回線障害監視部26は、通知された情報に基づいて異常の発生の有無を判断してアラーム情報として累積する。回線障害監視部26は、累積したアラーム情報が障害発報レベルに達すると、障害発報部24に障害発生を通知する。障害発報部24は、回線障害監視部26から障害発生が通知された場合にも、図示されない上位装置に外部回線インタフェース信号に関する障害の発生を発報する。   The line failure monitoring unit 26 monitors information required for determining the occurrence of an alarm caused by an abnormality in the external line interface signal. Information regarding the abnormality of the external line interface signal is notified from the line interface termination unit 25 to the line failure monitoring unit 26. The line failure monitoring unit 26 determines whether or not an abnormality has occurred based on the notified information and accumulates it as alarm information. When the accumulated alarm information reaches the failure notification level, the line failure monitoring unit 26 notifies the failure notification unit 24 of the occurrence of the failure. Even when a failure occurrence is notified from the line failure monitoring unit 26, the failure reporting unit 24 reports the occurrence of a failure related to the external line interface signal to a host device (not shown).

図2は、カード2とカード3との間で送受信される装置内フレーム信号のフレームフォーマットの例を示す図である。装置内フレーム信号は、125μs(マイクロ秒)の長さを持つフレームの繰り返しで構成される。各フレームは、ペイロード(データ)、オーバーヘッド(OH)及びチャネルオーバーヘッド(COH)を含む。OHには、例えば、フレームの構成等に関する各種の情報が格納される。COHには、例えば、フレーム同期パターンやBIP演算結果が格納される。フレーム同期パターンは、受信されたフレーム信号のCOH、OH及びペイロードの位置を検出するために用いられる。   FIG. 2 is a diagram illustrating an example of the frame format of the intra-device frame signal transmitted and received between the card 2 and the card 3. The in-device frame signal is composed of a repetition of a frame having a length of 125 μs (microseconds). Each frame includes payload (data), overhead (OH), and channel overhead (COH). In the OH, for example, various types of information regarding the frame configuration and the like are stored. For example, a frame synchronization pattern and a BIP calculation result are stored in COH. The frame synchronization pattern is used to detect the position of COH, OH and payload of the received frame signal.

図2のフレームフォーマットは本実施形態で用いられるフレーム信号の構成の一例を示すものであり、ペイロード、OH、COHのデータ長やそれらの具体的な内容はカード2及び3の仕様に基づいて規定される。例えば、各ペイロード長が261バイト、OH長及びCOH長がいずれも9バイトであり、125μsの間に、261バイトのペイロードが9個、9バイトのOHが8個、9バイトのCOHが1個伝送されてもよい。この場合、装置内フレーム信号の伝送速度は155.52Mbps(メガビット毎秒)であり、ペイロードの伝送容量は150.336Mbpsである。もちろん、これらの数値は一例であり、実施形態のフレームフォーマットを限定しない。   The frame format in FIG. 2 shows an example of the configuration of the frame signal used in this embodiment, and the data lengths of payload, OH, and COH and their specific contents are defined based on the specifications of the cards 2 and 3. Is done. For example, each payload length is 261 bytes, both OH length and COH length are 9 bytes, and 9 payloads of 261 bytes, 8 9-byte OHs, and 1 9-byte COH in 125 μs May be transmitted. In this case, the transmission rate of the in-device frame signal is 155.52 Mbps (megabits per second), and the payload transmission capacity is 150.336 Mbps. Of course, these numerical values are examples, and the frame format of the embodiment is not limited.

(第1の実施形態の動作の説明)
第1の実施形態の回線インタフェース装置1の動作について、図面を参照して説明する。カード2は、図2に例示される装置内フレーム信号をカード3から受信し、受信した装置内フレーム信号を装置内フレーム終端部21において終端する。装置内障害監視部22には、装置内フレーム終端部21から入力された装置内フレーム信号のOH及びCOHのいずれかに格納された、アラームの発出の判断に用いられる情報が通知され、装置内障害監視部22は、これらの情報を監視する。後述するように、本実施形態では、COHに格納されたフレーム同期パターンが装置内フレーム終端部21から装置内障害監視部22へ通知される場合について説明する。
(Description of operation of the first embodiment)
The operation of the line interface device 1 of the first embodiment will be described with reference to the drawings. The card 2 receives the in-device frame signal illustrated in FIG. 2 from the card 3 and terminates the received in-device frame signal in the in-device frame termination unit 21. The in-device failure monitoring unit 22 is notified of information used to determine the occurrence of an alarm stored in either the OH or COH of the in-device frame signal input from the in-device frame termination unit 21, The failure monitoring unit 22 monitors these pieces of information. As will be described later, in the present embodiment, a case will be described in which the frame synchronization pattern stored in the COH is notified from the in-device frame termination unit 21 to the in-device failure monitoring unit 22.

装置内障害監視部22内のUP/DOWNカウンタ回路221は、数値をカウントアップ又はカウントダウンするカウンタ回路である。UP/DOWNカウンタ回路221は、フレーム信号の異常の有無に応じてカウントアップ又はカウントダウンされる。カード3の装置内フレーム終端部31、装置内障害監視部32及びUP/DOWNカウンタ回路221は、カード2から装置内フレーム信号を受信すると、装置内フレーム終端部21、装置内障害監視部22及びUP/DOWNカウンタ回路321と同様に動作する。このため、カード3の動作に関する詳細な説明は省略する。   The UP / DOWN counter circuit 221 in the in-device failure monitoring unit 22 is a counter circuit that counts up or down a numerical value. The UP / DOWN counter circuit 221 counts up or down according to whether or not the frame signal is abnormal. When the in-device frame termination unit 31, the in-device fault monitoring unit 32, and the UP / DOWN counter circuit 221 of the card 3 receive the in-device frame signal from the card 2, the in-device frame termination unit 21, the in-device fault monitoring unit 22, and It operates in the same manner as the UP / DOWN counter circuit 321. For this reason, the detailed description regarding operation | movement of the card | curd 3 is abbreviate | omitted.

本実施形態では、一例として、フレーム同期パターンがCOHに格納され、装置内障害監視部22がフレーム同期パターンの異常によるアラームの有無を監視する場合を例として説明する。装置内フレーム終端部21は、COHに格納されたフレーム同期パターンを1フレーム(125μs)毎に装置内障害監視部22へ出力する。装置内障害監視部22は、装置内フレーム終端部21から入力されたフレーム同期パターンを監視し、フレーム同期パターンに異常がある場合は「アラームあり」と判断し、アラームビットを「1」に設定する。フレーム同期パターンが正常の場合は「アラームなし」と判断し、アラームビットを「0」(ゼロ)と設定する。   In the present embodiment, as an example, a case will be described in which the frame synchronization pattern is stored in the COH, and the in-device failure monitoring unit 22 monitors the presence or absence of an alarm due to an abnormality in the frame synchronization pattern. The in-device frame termination unit 21 outputs the frame synchronization pattern stored in the COH to the in-device failure monitoring unit 22 every frame (125 μs). The in-device failure monitoring unit 22 monitors the frame synchronization pattern input from the in-device frame termination unit 21, determines that there is an alarm if the frame synchronization pattern is abnormal, and sets the alarm bit to “1”. To do. If the frame synchronization pattern is normal, it is determined that there is no alarm, and the alarm bit is set to “0” (zero).

装置内障害監視部22は、装置内フレーム終端部21からフレーム同期パターンが通知されるたびに、上述のようにフレーム同期パターンの正常性を検査する。すなわち、装置内障害監視部22は、通知されたフレーム同期パターンと、規定されたフレーム同期パターンとが一致した場合には「アラームなし」と判断する。また、装置内障害監視部22は、通知されたフレーム同期パターンが1ビットでも誤っていた場合には「アラームあり」と判断する。ただし、「アラームあり/なし」の判断に他の基準が用いられてもよい。   The in-device failure monitoring unit 22 checks the normality of the frame synchronization pattern as described above every time the frame synchronization pattern is notified from the in-device frame termination unit 21. That is, the in-device failure monitoring unit 22 determines “no alarm” when the notified frame synchronization pattern matches the prescribed frame synchronization pattern. Further, the in-device failure monitoring unit 22 determines that “alarm is present” when the notified frame synchronization pattern is incorrect even in one bit. However, other criteria may be used to determine “with / without alarm”.

アラームビットは、例えば、装置内障害監視部22において記憶される1ビットの変数である。UP/DOWNカウンタ回路221は、アラームビットの値(すなわち、アラームの有無)に基づき、1フレーム毎に以下の動作を行う。   The alarm bit is, for example, a 1-bit variable stored in the in-device failure monitoring unit 22. The UP / DOWN counter circuit 221 performs the following operation for each frame based on the value of the alarm bit (that is, the presence or absence of an alarm).

(1)アラームあり(アラームビット=「1」)の場合には、カウント値をMだけカウントアップする。   (1) When there is an alarm (alarm bit = “1”), the count value is incremented by M.

(2)アラームなし(アラームビット=「0」)の場合には、カウント値をNだけカウントダウンする。   (2) When there is no alarm (alarm bit = “0”), the count value is counted down by N.

ここで、M及びNは、あらかじめ回線インタフェース装置1の仕様によって規定された自然数である。UP/DOWNカウンタ回路221においてカウント値は累積され、累積されたカウント値を以下ではTで表す。累積カウント値Tは、アラームビットが「0」である場合(すなわち、通知されたフレーム同期パターンが正常である場合)でも「0」にクリアされない。   Here, M and N are natural numbers defined in advance by the specifications of the line interface device 1. The count value is accumulated in the UP / DOWN counter circuit 221, and the accumulated count value is represented by T below. The cumulative count value T is not cleared to “0” even when the alarm bit is “0” (that is, when the notified frame synchronization pattern is normal).

上記の(1)、(2)の手順によるカウントアップ及びカウントダウンの結果、UP/DOWNカウンタ回路221の累積カウント値Tが障害検出閾値T0に達すると、装置内障害監視部22は、障害発生を障害発報部24に通知する。そして、当該通知を受けた障害発報部24は上位装置へ障害の発生を通知する。また、UP/DOWNカウンタ回路221の累積カウント値Tが障害復旧閾値T1に達すると、装置内障害監視部22は、障害復旧を障害発報部24に通知する。そして、当該通知を受けた障害発報部24は上位装置へ障害の復旧を通知する。ここで、T0及びT1はあらかじめ定められた閾値であり、T0>T1である。   When the cumulative count value T of the UP / DOWN counter circuit 221 reaches the failure detection threshold T0 as a result of the count-up and count-down according to the procedures (1) and (2) above, the in-device failure monitoring unit 22 detects the occurrence of a failure. The failure notification unit 24 is notified. Upon receiving the notification, the failure notification unit 24 notifies the host device of the occurrence of the failure. When the cumulative count value T of the UP / DOWN counter circuit 221 reaches the failure recovery threshold value T1, the in-device failure monitoring unit 22 notifies the failure reporting unit 24 of the failure recovery. Upon receiving the notification, the failure notification unit 24 notifies the host device of the failure recovery. Here, T0 and T1 are predetermined threshold values, and T0> T1.

上述のフレーム同期パターンの検査手順において、UP/DOWNカウンタ回路221におけるアラーム検出率Dを、D=M/(M+N)として定義することができる。アラーム検出率Dは、UP/DOWNカウンタ回路221における累積カウント値の増加率を示す指数である。アラーム検出率Dを高くすると、「アラームあり」の状態の比率(すなわち、発生確率)が変わらない場合でもUP/DOWNカウンタ回路221の累積カウント値Tの増加量を大きくでき、その結果、障害をより早期に検出できる。   In the frame synchronization pattern inspection procedure described above, the alarm detection rate D in the UP / DOWN counter circuit 221 can be defined as D = M / (M + N). The alarm detection rate D is an index indicating the increase rate of the accumulated count value in the UP / DOWN counter circuit 221. When the alarm detection rate D is increased, the increase amount of the cumulative count value T of the UP / DOWN counter circuit 221 can be increased even if the ratio of the “alarm exists” state (that is, the occurrence probability) does not change, and as a result It can be detected earlier.

ここで、「アラームあり」の場合のカウントアップ値Mと「アラームなし」の場合のカウントダウン値Nとを異なる値とする重み付けを行うことで、アラーム検出率Dの値を高くすることができる。例えば、アラーム検出時のカウントアップ値Mとアラーム非検出時のカウントダウン値Nとの関係をM>Nとしてもよい。M>Nとすることで、1回の「アラームなし」検出によるカウントダウンに対して1回の「アラームあり」検出によるカウントアップによる累積カウント値の増加を優越させることができる。   Here, the value of the alarm detection rate D can be increased by weighting the count-up value M for “with alarm” and the count-down value N for “without alarm” to be different values. For example, the relationship between the count-up value M when an alarm is detected and the count-down value N when no alarm is detected may be M> N. By setting M> N, the increase in the accumulated count value due to the count-up due to the detection of one “alarm” can be superior to the count-down due to the detection of “no alarm” once.

なお、障害発報条件(前方保護段数、すなわち、フレーム同期状態において、フレーム同期パターン照合結果が連続不一致を検出するまでの連続フレーム数)は、一般的な装置内フレーム同期外れ検出の仕様のままとしてもよい。ただし、1回の「アラームあり」に対するカウントアップ値Mを大きくすると、装置内障害監視部22が障害検出を障害発報部24に通知するまでの保護時間が短くなってしまう(すなわち、前方保護段数が小さくなる)。このため、本実施形態では、アラーム検出時のカウントアップ値Mを大きくすると同時に、障害検出閾値T0をカウントアップ値Mと同じ比率で増加させる。例えば、装置内フレーム信号の1フレームの長さが125μsであり、前方保護段数が224段である場合を考える。この場合、障害検出の閾値は125μs×224フレーム=28msである。   Note that the failure reporting condition (the number of forward protection stages, that is, the number of consecutive frames until the frame synchronization pattern matching result is detected in the frame synchronization state) remains the same as the specification for detecting out-of-frame synchronization within the device. It is good. However, if the count-up value M for one “alarm is present” is increased, the protection time until the in-device failure monitoring unit 22 notifies the failure reporting unit 24 of the failure detection is shortened (ie, forward protection). (The number of steps becomes smaller.) For this reason, in the present embodiment, the count-up value M at the time of alarm detection is increased, and at the same time, the failure detection threshold T0 is increased at the same ratio as the count-up value M. For example, consider a case where the length of one frame of the in-device frame signal is 125 μs and the number of forward protection stages is 224. In this case, the failure detection threshold is 125 μs × 224 frames = 28 ms.

ここで、本実施形態では、カウントアップ値M=4、カウントダウン値N=1とする。すなわち、M:Nは4:1である。この場合には、フレーム同期パターンが監視される期間内においてフレーム毎のアラームの発生率が1/5(=20%)を超えていれば、カウントアップ量の期待値はカウントダウン量の期待値よりも大きい。従って、平均的にはカウントダウンに対してカウントアップが優越するため、間欠障害であっても障害として検出可能となる。より一般的には、一般的に、アラームの発生率をA、アラームがないと判断される場合の比率を1−Aとした場合に、M/N>(1−A)/AとなるようにM及びNを設定することで間欠障害を検出可能である、と表現できる。上述の例では、A=0.2、M=4、N=1である。「アラームの発生率」はアラームがあると判断される場合の比率である。また、0<A<1である。   Here, in the present embodiment, it is assumed that the count-up value M = 4 and the count-down value N = 1. That is, M: N is 4: 1. In this case, if the alarm occurrence rate for each frame exceeds 1/5 (= 20%) within the period in which the frame synchronization pattern is monitored, the expected count-up amount is greater than the expected count-down amount. Is also big. Therefore, on average, the count-up prevails over the count-down, so that even an intermittent failure can be detected as a failure. More generally, in general, M / N> (1-A) / A, where A is the alarm occurrence rate and 1-A is the ratio when there is no alarm. It can be expressed that intermittent failure can be detected by setting M and N to. In the above example, A = 0.2, M = 4, and N = 1. “Alarm occurrence rate” is a ratio when it is determined that there is an alarm. Also, 0 <A <1.

また、障害検出閾値T0も4倍の値とすることで、障害検出下での保護時間を28msのまま(すなわち、前方保護されるフレームの数を224段)とすることができる。すなわち、最短で障害検出と判定されるまでの時間(障害検出閾値28ms)における前方保護段数は224段であるので、前方保護段数に達する累積カウント値Tは、224段×4倍=896段となる。つまり、障害検出閾値T0は、896カウントとなる。   Also, by setting the failure detection threshold T0 to a value four times, the protection time under failure detection can be kept at 28 ms (that is, the number of forward protected frames is 224). That is, since the number of forward protection stages in the time required to determine failure detection at the shortest (failure detection threshold 28 ms) is 224 stages, the cumulative count value T reaching the number of forward protection stages is 224 stages × 4 times = 896 stages. Become. That is, the failure detection threshold T0 is 896 counts.

また、障害の復旧を上位装置に通知する際の累積カウント値である障害復旧閾値T1を「0」カウントとした場合、累積カウント値Tが「0」になった時に障害復旧と判断される。そして、復旧と判定されるまでの時間は、896カウントから1カウントずつダウンするため、最短時間では以下の式1のように、112msとなる。   Further, when the failure recovery threshold T1 that is the cumulative count value when notifying the recovery of the failure to the host device is “0” count, it is determined that the failure is recovered when the cumulative count value T becomes “0”. Since the time until it is determined to be restored is decreased by 1 count from 896 counts, the shortest time is 112 ms as shown in the following formula 1.

896(カウント)×125(μs)=112(ms) ・・・(式1)
なお、上述の例において、カウントアップ値Mに基づいて障害検出閾値T0を増加させない場合には、障害検出閾値T0は224カウントとなる。この場合、224÷4=56であるので、障害復旧(累積カウント値T=0)の後、56回の「アラームあり」によって累積カウント値Tは障害検出閾値T0に達するため、障害検出閾値T0を896カウントとする場合と比較して間欠障害を早期に発見できる。
896 (counts) × 125 (μs) = 112 (ms) (Formula 1)
In the above example, when the failure detection threshold T0 is not increased based on the count-up value M, the failure detection threshold T0 is 224 counts. In this case, since 224 ÷ 4 = 56, after the failure recovery (accumulated count value T = 0), the accumulated count value T reaches the failure detection threshold value T0 by 56 “alarms”, so the failure detection threshold value T0. As compared with the case of setting 896 count, intermittent failure can be detected at an early stage.

図3は、UP/DOWNカウンタ回路221のカウント数の遷移の例を示す図である。図3には、上述した内容に基づいて、UP/DOWNカウンタ回路221のカウント数が変化する様子の例を示す。図3の縦軸は累積カウント値T、横軸は時間である。アラームビットの確認は装置内フレーム信号の1フレーム毎に行われるため、時刻は125μs単位で進行する。そして、UP/DOWNカウンタ回路221は、125μs毎にカウントUP/DOWN動作を行う。   FIG. 3 is a diagram illustrating an example of the transition of the count number of the UP / DOWN counter circuit 221. FIG. 3 shows an example of how the count number of the UP / DOWN counter circuit 221 changes based on the above-described contents. The vertical axis in FIG. 3 is the cumulative count value T, and the horizontal axis is time. Since the alarm bit is confirmed every frame of the in-device frame signal, the time advances in units of 125 μs. Then, the UP / DOWN counter circuit 221 performs a count UP / DOWN operation every 125 μs.

初期状態ではUP/DOWNカウンタ回路221の累積カウント値Tは0であるとする。アラームビットが「1」である場合には、累積カウント値は4増加し(例えば図3の累積カウント値T=0→4→8→12)、アラームビットが「0」であると累積カウント値は1減少する(例えば図3のT=12→11→10)。このように累積カウント値の増減を繰り返しながら、累積カウント値Tが障害検出閾値T0(本実施形態では896)に達すると、装置内障害監視部22は、障害発報部24へ障害の発生を通知する。また、累積カウント値Tが障害検出閾値T0に達した後、累積カウント値Tが障害復旧閾値T1(本実施形態ではT1=0)まで減少すると、装置内障害監視部22は、障害発報部24へ、障害の復旧を通知する。   It is assumed that the accumulated count value T of the UP / DOWN counter circuit 221 is 0 in the initial state. When the alarm bit is “1”, the cumulative count value is increased by 4 (for example, the cumulative count value T = 0 → 4 → 8 → 12 in FIG. 3), and when the alarm bit is “0”, the cumulative count value is increased. Decreases by 1 (for example, T = 12 → 11 → 10 in FIG. 3). When the cumulative count value T reaches the fault detection threshold T0 (896 in this embodiment) while repeating the increase / decrease of the cumulative count value in this way, the in-device fault monitoring unit 22 notifies the fault reporting unit 24 of the occurrence of the fault. Notice. Further, after the cumulative count value T reaches the failure detection threshold value T0, when the cumulative count value T decreases to the failure recovery threshold value T1 (T1 = 0 in the present embodiment), the in-device failure monitoring unit 22 24 is notified of failure recovery.

なお、M及びNの設定値によっては、累積カウント値Tがマイナスになる場合も起こりうる。このような場合は、T<0となった時点でT=0となったとみなして障害が復旧したと判断してもよい。一方、累積カウント値Tが障害検出閾値T0を超えた場合にも、装置内障害監視部22は、障害発生と判断してもよい。累積カウント値TがT≧T0となった場合には、カウントアップを停止してもよい。「アラームなし」の場合には累積カウント値は、1ずつカウントダウンする。累積カウント値Tが障害復旧閾値T1以下になると、障害復旧と判断される。上述した例では、障害復旧閾値T1を0としているが、必ずしもT1=0とする必要はない。障害復旧と判断された後、累積カウント値TはT=0にクリアされなくともよい。この場合は、T=T1からカウント動作が継続され、「アラームあり」である場合には再び累積カウント値TがMカウントアップされる。   Depending on the set values of M and N, the cumulative count value T may be negative. In such a case, it may be determined that the failure has been recovered by assuming that T = 0 when T <0. On the other hand, also when the cumulative count value T exceeds the failure detection threshold T0, the in-device failure monitoring unit 22 may determine that a failure has occurred. When the cumulative count value T becomes T ≧ T0, the count-up may be stopped. In the case of “no alarm”, the cumulative count value is counted down by one. When the accumulated count value T is equal to or less than the failure recovery threshold T1, it is determined that the failure is recovered. In the example described above, the failure recovery threshold T1 is set to 0, but it is not always necessary to set T1 = 0. The cumulative count value T may not be cleared to T = 0 after the failure recovery is determined. In this case, the count operation is continued from T = T1, and when “alarm is present”, the cumulative count value T is counted up again by M.

図4は、カード2における間欠障害の検出動作手順の例を示すフローチャートである。装置内フレーム終端部21は、受信したフレーム信号から障害を検出するための情報、すなわちフレーム同期パターンを抽出し(図4のステップS11)、抽出された情報に基づいて、フレーム同期パターンの異常の有無をフレーム毎に判断する(ステップS12)。判断の結果、異常がある(「アラームあり」)と判断されると累積カウント値がMカウントアップされ(ステップS13)、異常がない(「アラームなし」)と判断されると累積カウント値がNカウントダウンされる(ステップS14)。そして、累積カウント値が障害検出閾値T0又は障害復旧閾値T1に達したかどうかが判断される(ステップS15)。累積カウント値TがT0以上に達した場合(T≧T0)には、装置内障害監視部22は、障害発生を障害発報部24に通知する(ステップS16)。累積カウント値TがT1以下まで減少した場合(T≦T1)には、装置内障害監視部22は、障害復旧を障害発報部24に通知する(ステップS17)。   FIG. 4 is a flowchart showing an example of an intermittent failure detection operation procedure in the card 2. The intra-device frame termination unit 21 extracts information for detecting a failure from the received frame signal, that is, a frame synchronization pattern (step S11 in FIG. 4), and based on the extracted information, an error in the frame synchronization pattern is detected. Presence / absence is determined for each frame (step S12). As a result of the determination, if it is determined that there is an abnormality (“alarm present”), the cumulative count value is incremented by M (step S13), and if it is determined that there is no abnormality (“no alarm”), the cumulative count value is N. Countdown is performed (step S14). Then, it is determined whether or not the cumulative count value has reached the failure detection threshold value T0 or the failure recovery threshold value T1 (step S15). When the cumulative count value T reaches T0 or more (T ≧ T0), the in-device failure monitoring unit 22 notifies the failure reporting unit 24 of the occurrence of the failure (step S16). When the cumulative count value T has decreased to T1 or less (T ≦ T1), the in-device failure monitoring unit 22 notifies the failure reporting unit 24 of failure recovery (step S17).

以上説明した第1の実施形態の回線インタフェース装置1は、以下の効果を奏する。すなわち、回線インタフェース装置1は、PM(パフォーマンスモニタ)やTCA(閾値超過アラート)では検出が困難であった、フレーム信号を用いた通信における間欠障害を簡単な構成で検出できる。その理由は、回線インタフェース装置1は、受信したフレーム信号から抽出したフレーム同期パターンに基づいてアラームの有無を判断し、UP/DOWNカウンタ回路221において累積カウント値により障害発生を検出しているからである。そして、回線インタフェース装置1は、ヘルスチェックのための信号を生成することを要しない。   The line interface device 1 according to the first embodiment described above has the following effects. That is, the line interface device 1 can detect an intermittent failure in communication using a frame signal, which is difficult to detect by PM (performance monitor) or TCA (threshold excess alert), with a simple configuration. The reason is that the line interface device 1 determines the presence / absence of an alarm based on the frame synchronization pattern extracted from the received frame signal, and detects the occurrence of the failure by the accumulated count value in the UP / DOWN counter circuit 221. is there. The line interface device 1 does not need to generate a health check signal.

また、回線インタフェース装置1は、障害の検出感度を変更できる。その理由は、UP/DOWNカウンタ回路221において、アラームが発生した場合のカウントアップ値Mとアラームが発生しない場合のカウントダウン値Nとを独立に設定することで、これらの値の重みづけを可変としているからである。   Further, the line interface device 1 can change the failure detection sensitivity. The reason is that, in the UP / DOWN counter circuit 221, the count-up value M when the alarm is generated and the count-down value N when the alarm is not generated are set independently so that the weights of these values are variable. Because.

このように、第1の実施形態の回線インタフェース装置1は、簡単な構成で間欠障害を検出できるという効果を奏する。対向する通信カードにおいて間欠障害の検出が容易となることで障害の早期発見が可能となり、障害に起因する運用サービスへの影響が抑制される。   As described above, the line interface device 1 according to the first embodiment has an effect that an intermittent failure can be detected with a simple configuration. Since it becomes easy to detect an intermittent failure in the opposing communication card, the failure can be detected early, and the influence on the operation service due to the failure is suppressed.

(第1の実施形態の変形例)
回線インタフェース装置1は、以下のような第1の実施形態の変形例によっても、簡単な構成で間欠障害を検出できるという効果を奏する。
(Modification of the first embodiment)
The line interface apparatus 1 also has an effect that an intermittent failure can be detected with a simple configuration even by the following modification of the first embodiment.

第1の実施形態では、カード2における、カード3から受信した装置内フレーム信号の間欠障害を検出する手順について説明した。図1に示すように、装置内フレーム信号の監視に関してはカード3もカード2と同様の機能を備える。従って、回線インタフェース装置1は、カード3で受信される装置内フレーム信号の間欠障害を検出してもよい。   In the first embodiment, the procedure for detecting an intermittent failure of the in-device frame signal received from the card 3 in the card 2 has been described. As shown in FIG. 1, the card 3 has the same function as the card 2 for monitoring the in-device frame signal. Therefore, the line interface device 1 may detect an intermittent failure of the in-device frame signal received by the card 3.

さらに、回線インタフェース装置1がさらに他の通信カードを備える場合に、各カードが備える装置内フレーム信号のインタフェースの全てに、上述の間欠障害の検出手順が適用されてもよい。このような構成により、対向する通信カード間で互いに間欠障害の検出が可能となる。加えて、通信カードが備える障害監視のための構成が共通化されることにより、通信カードの製造コスト低減も可能となる。なお、装置内フレーム信号による通信が回線インタフェース装置1内の複数の箇所で行われており、特定の箇所で間欠障害の検出率を上げたい場合は、その箇所の通信におけるカウントアップ値Mとカウントダウン値Nの比率を調整すればよい。   Further, when the line interface device 1 further includes another communication card, the intermittent failure detection procedure described above may be applied to all the interfaces of the in-device frame signals included in each card. With such a configuration, it is possible to detect intermittent failures between opposing communication cards. In addition, since the configuration for fault monitoring provided in the communication card is shared, the manufacturing cost of the communication card can be reduced. In addition, when communication using the in-device frame signal is performed at a plurality of locations in the line interface device 1 and it is desired to increase the detection rate of intermittent failure at a specific location, the count-up value M and the count-down in the communication at that location The ratio of the value N may be adjusted.

さらに、装置内の通信カード間のインタフェースのみならず、外部回線とのインタフェースにも、ITU−T勧告などの公的規格に準拠した障害検出条件と併用して、第1の実施形態の間欠障害検出方法を適用してもよい。この場合には、外部回線とのインタフェースにおいても間欠障害の検出が可能となる。なお、ITU−Tは、International Telecommunication Union Telecommunication Standardization Sectorの略である。   Furthermore, not only an interface between communication cards in the apparatus but also an interface with an external line is used in combination with a failure detection condition based on an official standard such as ITU-T recommendation, and the intermittent failure of the first embodiment. A detection method may be applied. In this case, intermittent failure can be detected also at the interface with the external line. ITU-T is an abbreviation for International Telecommunication Union Telecommunication Standardization Sector.

さらに、他の通信カードと比較して故障率の高い部品を使用している通信カードにおいて、カウントアップ値M及びカウントダウン値Nの重みづけや障害検出閾値T0及び障害復旧閾値T1を他の通信カードと異なるものとしてもよい。このようにすることで、故障率の高い通信カードの間欠障害の検出をより容易とし、当該通信カードが実装された装置のより安定した運用が可能となる。   Further, in communication cards using parts with a higher failure rate than other communication cards, the weights of the count-up value M and the count-down value N, the failure detection threshold T0, and the failure recovery threshold T1 are set to other communication cards. And may be different. By doing in this way, it becomes easier to detect the intermittent failure of a communication card with a high failure rate, and a more stable operation of a device on which the communication card is mounted becomes possible.

なお、本実施形態では、アラーム情報がフレーム同期パターンの不一致に基づく情報(すなわち、フレーム同期外れ)である場合について説明した。しかし、実際には、装置間フレーム信号のアラーム情報は複数存在するため、複数のアラーム情報を同時に監視することで、装置内フレーム信号に含まれる複数のアラーム情報に対する間欠障害検出が可能となる。   In the present embodiment, the case where the alarm information is information based on the mismatch of the frame synchronization pattern (that is, loss of frame synchronization) has been described. However, in practice, there are a plurality of pieces of alarm information of inter-device frame signals, and by monitoring a plurality of alarm information at the same time, it is possible to detect intermittent faults for a plurality of alarm information included in the in-device frame signal.

なお、カード2は、さらに、中央処理装置(central processing unit、CPU)及び記録媒体を備えてもよい。そして、回線インタフェース装置1の機能及び動作手順は、記録媒体に記録されたプログラムをCPUが実行することにより実現されてもよい。プログラムは、固定された、一時的でない記録媒体に記録される。記録媒体としては半導体メモリ又は固定磁気ディスク装置が用いられるが、これらには限定されない。   The card 2 may further include a central processing unit (CPU) and a recording medium. The functions and operation procedures of the line interface device 1 may be realized by the CPU executing a program recorded on the recording medium. The program is recorded on a fixed, non-temporary recording medium. As the recording medium, a semiconductor memory or a fixed magnetic disk device is used, but is not limited thereto.

(第2の実施形態)
図5は、本発明の第2の実施形態の障害検出装置500の構成例を示すブロック図である。障害検出装置500は、フレーム終端部501、障害監視部502、カウンタ部503、を備える。
(Second Embodiment)
FIG. 5 is a block diagram illustrating a configuration example of the failure detection apparatus 500 according to the second embodiment of this invention. The failure detection apparatus 500 includes a frame termination unit 501, a failure monitoring unit 502, and a counter unit 503.

フレーム終端部501は、フレーム信号を受信し、受信したフレーム信号から障害を検出するための情報を抽出する。障害監視部502は、フレーム信号から抽出された、障害を検出するための情報に基づいて、フレーム信号のアラームの有無をフレーム信号のフレーム毎に判断する。フレーム信号のアラームの有無の判断は、例えば、障害を検出するための情報が正常である場合に「アラームあり」とし、当該情報に誤りがある場合に「アラームなし」とすることで行われてもよい。   The frame termination unit 501 receives a frame signal and extracts information for detecting a failure from the received frame signal. The failure monitoring unit 502 determines, for each frame signal frame, whether there is an alarm in the frame signal, based on information extracted from the frame signal for detecting a failure. The determination of the presence or absence of an alarm in the frame signal is performed, for example, by setting “alarm present” when information for detecting a failure is normal and “no alarm” when the information is incorrect. Also good.

カウンタ部503は障害監視部502に備えられる。カウンタ部503は、アラームの有無の判断結果に基づいて、「アラームあり」と判断される毎にカウント値を累積し、「アラームなし」と判断される毎にカウント値を減算する。そして、カウント値の累積の結果、カウンタ部503のカウント値が増加して所定の第1の閾値と等しくなると、障害監視部502は障害発生を示す信号を出力する。また、カウント値の減算の結果、カウンタ部503のカウント値が減少して所定の第2の閾値と等しくなると、障害監視部502は障害復旧を示す信号を出力する。ここで、第1の閾値は第2の閾値よりも大きい。   The counter unit 503 is provided in the failure monitoring unit 502. The counter unit 503 accumulates the count value every time it is determined that “alarm exists” based on the determination result of the presence or absence of an alarm, and subtracts the count value every time it is determined that “no alarm”. As a result of the accumulation of the count values, when the count value of the counter unit 503 increases and becomes equal to the predetermined first threshold value, the failure monitoring unit 502 outputs a signal indicating the occurrence of the failure. As a result of the subtraction of the count value, when the count value of the counter unit 503 decreases and becomes equal to the predetermined second threshold, the failure monitoring unit 502 outputs a signal indicating failure recovery. Here, the first threshold value is larger than the second threshold value.

図6は、障害検出装置500の動作手順の例を示すフローチャートである。障害検出装置500は、受信したフレーム信号から障害を検出するための情報を抽出し(図6のステップS51)、抽出された情報に基づいて、フレーム信号のアラームの有無をフレーム信号のフレーム毎に判断する(ステップS52)。判断の結果、アラームがあると判断されるとカウント値が累積され(ステップS53)、アラームがないと判断されるとカウント値が減算される(ステップS54)。そして、カウント値が所定の第1の閾値及び第2の閾値の少なくとも一方に達したかどうかが判断される(ステップS55)。カウント値の累積の結果、カウント値が第1の閾値に達した場合には、障害検出装置500は、障害発生と判断する信号を出力する(ステップS56)。カウント値の減算の結果、カウント値が第2の閾値に達した場合には、障害検出装置500は、障害復旧と判断する信号を出力する(ステップS57)。   FIG. 6 is a flowchart illustrating an example of an operation procedure of the failure detection apparatus 500. The failure detection apparatus 500 extracts information for detecting a failure from the received frame signal (step S51 in FIG. 6), and based on the extracted information, the presence / absence of an alarm in the frame signal is determined for each frame signal frame. Judgment is made (step S52). As a result of the determination, if it is determined that there is an alarm, the count value is accumulated (step S53), and if it is determined that there is no alarm, the count value is subtracted (step S54). Then, it is determined whether or not the count value has reached at least one of a predetermined first threshold value and a second threshold value (step S55). If the count value reaches the first threshold as a result of the accumulation of the count value, the failure detection device 500 outputs a signal for determining that a failure has occurred (step S56). If the count value reaches the second threshold value as a result of the subtraction of the count value, the failure detection device 500 outputs a signal for determining failure recovery (step S57).

このような構成を備える障害検出装置500は、簡単な構成で間欠障害を検出できるという効果を奏する。その理由は、受信したフレーム信号から障害を検出するための情報を抽出し、カウンタ部503において累積カウント値により障害を検出しているからである。   The failure detection apparatus 500 having such a configuration has an effect that an intermittent failure can be detected with a simple configuration. The reason is that information for detecting the failure is extracted from the received frame signal, and the failure is detected by the counter unit 503 based on the accumulated count value.

第1の実施形態の回線インタフェース装置1の装置内フレーム終端部21、装置内障害監視部22及びUP/DOWNカウンタ回路221は、それぞれ、第2の実施形態の障害検出装置500が備えるフレーム終端部501、障害監視部502、カウンタ部503に対応する機能を備える。すなわち、第1の実施形態の回線インタフェース装置1も、第2の実施形態の障害検出装置500と同様の機能を備える。第1の実施形態の障害検出閾値T0及び障害復旧閾値T1は、それぞれ、第2の実施形態の第1の閾値及び第2の閾値に対応する。   The in-device frame termination unit 21, the in-device failure monitoring unit 22, and the UP / DOWN counter circuit 221 of the line interface device 1 according to the first embodiment are each a frame termination unit included in the failure detection device 500 according to the second embodiment. 501, a function corresponding to the failure monitoring unit 502 and the counter unit 503 is provided. That is, the line interface device 1 of the first embodiment also has the same function as the failure detection device 500 of the second embodiment. The failure detection threshold T0 and the failure recovery threshold T1 of the first embodiment correspond to the first threshold and the second threshold of the second embodiment, respectively.

第1の実施形態の回線インタフェース装置1と同様に、障害検出装置500は、さらに、CPU及び記録媒体を備えてもよい。そして、障害検出装置500の機能及び動作手順は、記録媒体に記録されたプログラムをCPUが実行することにより実現されてもよい。プログラムは、固定された、一時的でない記録媒体に記録される。記録媒体としては半導体メモリ又は固定磁気ディスク装置が用いられるが、これらには限定されない。   Similar to the line interface device 1 of the first embodiment, the failure detection device 500 may further include a CPU and a recording medium. The functions and operation procedures of the failure detection apparatus 500 may be realized by the CPU executing a program recorded on the recording medium. The program is recorded on a fixed, non-temporary recording medium. As the recording medium, a semiconductor memory or a fixed magnetic disk device is used, but is not limited thereto.

以上、実施形態を参照して本願発明を説明したが、本願発明は上記の実施形態に限定されない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。   Although the present invention has been described with reference to the embodiments, the present invention is not limited to the above embodiments. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.

また、それぞれの実施形態に記載された構成は、必ずしも互いに排他的なものではない。本発明の作用及び効果は、上述の実施形態の全部又は一部を組み合わせた構成によって実現されてもよい。   Further, the configurations described in the respective embodiments are not necessarily mutually exclusive. The operation and effect of the present invention may be realized by a configuration in which all or part of the above-described embodiments are combined.

1 回線インタフェース装置
2、3 カード
4 外部装置
21、31 装置内フレーム終端部
22、32 装置内障害監視部
23、33 データ収集部
24、34 障害発報部
25 回線インタフェース終端部
26 回線障害監視部
100 通信システム
221、321 UP/DOWNカウンタ回路
500 障害検出装置
501 フレーム終端部
502 障害監視部
503 カウンタ部
1 Line interface device 2, 3 card 4 External device 21, 31 Intra-device frame termination unit 22, 32 In-device fault monitoring unit 23, 33 Data collection unit 24, 34 Fault reporting unit 25 Line interface termination unit 26 Line fault monitoring unit DESCRIPTION OF SYMBOLS 100 Communication system 221,321 UP / DOWN counter circuit 500 Fault detection apparatus 501 Frame termination part 502 Fault monitoring part 503 Counter part

Claims (10)

受信したフレーム信号から障害を検出するための情報を抽出するフレーム終端手段と、
前記情報に基づいて、前記フレーム信号のアラームの有無を前記フレーム信号のフレーム毎に判断する障害監視手段と、
前記判断の結果に基づいて、前記アラームがあると判断される毎にカウント値が累積され、前記アラームがないと判断される毎に前記カウント値が減算されるカウンタ手段とを備え、
前記障害監視手段は、前記カウント値が所定の閾値に達すると障害発生と判断する信号を出力する、障害検出装置。
Frame termination means for extracting information for detecting a failure from the received frame signal;
Fault monitoring means for determining the presence or absence of an alarm of the frame signal for each frame of the frame signal based on the information;
A counter means for accumulating a count value every time it is determined that there is an alarm based on a result of the determination, and subtracting the count value every time it is determined that there is no alarm;
The failure monitoring unit is a failure detection device that outputs a signal that determines that a failure has occurred when the count value reaches a predetermined threshold value.
前記アラームがあると判断された際に累積される前記カウント値をM、前記アラームがないと判断された際に減算される前記カウント値をNとすると、M及びNは自然数でありかつM>Nである、請求項1に記載された障害検出装置。   Assuming that the count value accumulated when it is determined that there is the alarm is M, and the count value that is subtracted when it is determined that there is no alarm is N, M and N are natural numbers and M> The failure detection apparatus according to claim 1, wherein N is N. 前記アラームがあると判断される場合の比率をA、前記アラームがないと判断される場合の比率を1−A(ただし0<A<1)とした場合に、M/N>(1−A)/AとなるようにM及びNが設定される、請求項2に記載された障害検出装置。   M / N> (1-A, where A is the ratio when it is determined that there is an alarm and 1-A (where 0 <A <1) is the ratio when it is determined that there is no alarm. 3) The fault detection apparatus according to claim 2, wherein M and N are set to be equal to / A. 第1の通信カードと第2の通信カードとを備える回線インタフェース装置であって、
前記第1の通信カードは、
外部装置とのインタフェースである回線インタフェース終端手段と、
前記第2の通信カードからフレーム信号を受信する請求項1乃至3のいずれか1項に記載された障害検出装置と、
前記回線インタフェース終端手段と前記障害検出装置との間でデータを送受信するテータ収集手段とを備え、
前記第2の通信カードは、前記第1の通信カードとの間で前記フレーム信号を送受信するための他のフレーム終端手段を備える、
回線インタフェース装置。
A line interface device comprising a first communication card and a second communication card,
The first communication card is
A line interface termination means that is an interface with an external device;
The failure detection device according to any one of claims 1 to 3, which receives a frame signal from the second communication card;
A data collection means for transmitting and receiving data between the line interface termination means and the failure detection device;
The second communication card includes other frame termination means for transmitting and receiving the frame signal to and from the first communication card.
Line interface device.
前記第2の通信カードは、前記他のフレーム終端手段に代えて請求項1乃至3のいずれか1項に記載された障害検出装置を備える、
請求項4に記載された回線インタフェース装置。
The second communication card includes the failure detection device according to any one of claims 1 to 3 instead of the other frame termination unit.
The line interface device according to claim 4.
請求項4又は5に記載された回線インタフェース装置と、
外部回線インタフェース信号を用いて前記回線インタフェース装置と通信する外部装置と、
を備える通信システム。
A line interface device according to claim 4 or 5,
An external device that communicates with the line interface device using an external line interface signal;
A communication system comprising:
受信したフレーム信号から障害を検出するための情報を抽出し、
前記情報に基づいて、前記フレーム信号のアラームの有無を前記フレーム信号のフレーム毎に判断し、
前記判断の結果に基づいて、前記アラームがあると判断される毎にカウント値を累積し、前記アラームがないと判断される毎に前記カウント値を減算し、
前記カウント値が所定の閾値に達すると障害発生と判断する信号を出力する、
障害検出方法。
Extract information to detect a failure from the received frame signal,
Based on the information, the presence or absence of an alarm of the frame signal is determined for each frame of the frame signal,
Based on the result of the determination, the count value is accumulated every time it is determined that there is an alarm, and the count value is subtracted every time it is determined that there is no alarm,
When the count value reaches a predetermined threshold, a signal that determines that a failure has occurred is output.
Fault detection method.
前記アラームがあると判断された際に累積される前記カウント値をM、前記アラームがないと判断された際に減算される前記カウント値をNとすると、M及びNは自然数でありかつM>Nである、請求項7に記載された障害検出方法。   Assuming that the count value accumulated when it is determined that there is the alarm is M, and the count value that is subtracted when it is determined that there is no alarm is N, M and N are natural numbers and M> The failure detection method according to claim 7, wherein N is N. 前記アラームがあると判断される場合の比率をA、前記アラームがないと判断される場合の比率を1−A(ただし0<A<1)とした場合に、M/N>(1−A)/AとなるようにM及びNが設定される、請求項8に記載された障害検出方法。   M / N> (1-A, where A is the ratio when it is determined that there is an alarm and 1-A (where 0 <A <1) is the ratio when it is determined that there is no alarm. 9) The failure detection method according to claim 8, wherein M and N are set to be / A. 障害検出装置のコンピュータに、
受信したフレーム信号から障害を検出するための情報を抽出する手順、
前記情報に基づいて、前記フレーム信号のアラームの有無を前記フレーム信号のフレーム毎に判断する手順、
前記判断の結果に基づいて、アラームがあると判断される毎にカウント値を累積し、アラームがないと判断される毎に前記カウント値を減算する手順、
前記カウント値が所定の閾値に達すると障害発生と判断する信号を出力する手順、
を実行させるための障害検出プログラム。
In the computer of the fault detection device,
A procedure for extracting information for detecting a failure from the received frame signal,
A procedure for determining the presence or absence of an alarm in the frame signal for each frame of the frame signal based on the information;
A procedure for accumulating the count value every time it is determined that there is an alarm based on the result of the determination, and subtracting the count value every time it is determined that there is no alarm;
A procedure for outputting a signal for determining that a failure has occurred when the count value reaches a predetermined threshold;
Fault detection program for executing
JP2016123772A 2016-06-22 2016-06-22 Fault detection device and fault detection method Active JP6791660B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016123772A JP6791660B2 (en) 2016-06-22 2016-06-22 Fault detection device and fault detection method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016123772A JP6791660B2 (en) 2016-06-22 2016-06-22 Fault detection device and fault detection method

Publications (2)

Publication Number Publication Date
JP2017228934A true JP2017228934A (en) 2017-12-28
JP6791660B2 JP6791660B2 (en) 2020-11-25

Family

ID=60892129

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016123772A Active JP6791660B2 (en) 2016-06-22 2016-06-22 Fault detection device and fault detection method

Country Status (1)

Country Link
JP (1) JP6791660B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113033752A (en) * 2021-03-22 2021-06-25 深圳市英威腾电气股份有限公司 Communication fault detection method, host and slave
JP7462431B2 (en) 2020-02-28 2024-04-05 本田技研工業株式会社 Rogue signal detector

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7462431B2 (en) 2020-02-28 2024-04-05 本田技研工業株式会社 Rogue signal detector
CN113033752A (en) * 2021-03-22 2021-06-25 深圳市英威腾电气股份有限公司 Communication fault detection method, host and slave

Also Published As

Publication number Publication date
JP6791660B2 (en) 2020-11-25

Similar Documents

Publication Publication Date Title
JP4308297B2 (en) Communication device and switch processing device
US6983403B2 (en) Detecting bit errors in a communications system
US7924737B2 (en) Signal degrade detecting method, signal restoration detecting method, devices for those methods, and traffic transmission system
US8356233B2 (en) Pseudo-noise insertion on unacceptable input data sequence in optical networks
JP7171732B2 (en) Bit error detection method and apparatus
US6775237B2 (en) Methods and apparatus for burst tolerant excessive bit error rate alarm detection and clearing
JP4413358B2 (en) Fault monitoring system and fault notification method
US6591383B1 (en) Bit error rate detection
JP2017228934A (en) Fault detection device and fault detection method
JP2009231906A (en) Data transmission system, transmission device and protection control method
CN109039761B (en) Method and device for processing fault link in cluster control channel
CN109347553B (en) Method and device for measuring attenuation value of optical fiber
JP4223302B2 (en) Transmission apparatus and burst error monitoring method
JP3827701B2 (en) Receive path trace detector
US8867923B2 (en) Transponder, repeater, and terminal equipment
JP6508340B2 (en) Error monitoring device, method and program
JP2009032066A (en) Method for detecting communication abnormality in digital control device
WO2020220231A1 (en) Submarine cable failure determination method and apparatus
EP4087164A1 (en) Service code stream processing apparatus and method
JP2003348039A (en) Communication system and communication apparatus employing redundancy configuration
JP3196978B2 (en) Transmission line error detection method and detection circuit
JPH037439A (en) Monitoring system for digital communication channel
KR0174669B1 (en) Failure Detection Device in Sept Transmission Equipment
CN112463521A (en) Fault-tolerant method and device for improving reliability of serial high-speed bus equipment
JPS63167537A (en) Signal multiplex transmission system

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20170706

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200310

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201013

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201105

R150 Certificate of patent or registration of utility model

Ref document number: 6791660

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150