JP5618792B2 - Error detection and repair device - Google Patents

Error detection and repair device Download PDF

Info

Publication number
JP5618792B2
JP5618792B2 JP2010267378A JP2010267378A JP5618792B2 JP 5618792 B2 JP5618792 B2 JP 5618792B2 JP 2010267378 A JP2010267378 A JP 2010267378A JP 2010267378 A JP2010267378 A JP 2010267378A JP 5618792 B2 JP5618792 B2 JP 5618792B2
Authority
JP
Japan
Prior art keywords
error
error detection
hard
circuit
signal line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010267378A
Other languages
Japanese (ja)
Other versions
JP2012118725A (en
Inventor
直之 星
直之 星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2010267378A priority Critical patent/JP5618792B2/en
Publication of JP2012118725A publication Critical patent/JP2012118725A/en
Application granted granted Critical
Publication of JP5618792B2 publication Critical patent/JP5618792B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Hardware Redundancy (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)

Description

本発明は、半導体集積回路の内部に実装する機能が故障した場合に、自律的に機能を復元する回路修復装置に関する。   The present invention relates to a circuit restoration device that autonomously restores a function when a function mounted inside a semiconductor integrated circuit fails.

半導体集積回路の微細化が進むにつれて、再構成可能な半導体集積回路の高集積化が進み、半導体集積回路が大規模なシステムに利用されるようになってきている。ところが、半導体プロセスの微細化および電源の低電圧化により、これまで問題にならなかった宇宙線が原因のソフトエラーによる問題も顕著になってきている。特に、社会基盤等のシステムにおいては、故障によるシステムダウンによって発生する経済的な損失は大きい。このため、故障発生時にもシステムを停止することなく、正常な状態に復旧する手段が求められている。   As miniaturization of semiconductor integrated circuits progresses, higher integration of reconfigurable semiconductor integrated circuits progresses, and semiconductor integrated circuits are being used in large-scale systems. However, with the miniaturization of semiconductor processes and the lowering of the power supply voltage, problems due to soft errors caused by cosmic rays, which have not been a problem until now, have become more prominent. In particular, in a system such as a social infrastructure, economic loss caused by a system failure due to a failure is large. For this reason, there is a demand for means for restoring a normal state without stopping the system even when a failure occurs.

さらに、高信頼性が要求されるシステムでは、チップ内部トランジスタの故障や配線の断線などの永久故障が発生した場合であっても、その影響を回避し運用を継続できるロバスト性が必須となっている。   Furthermore, in a system that requires high reliability, even when a permanent failure such as a failure of a transistor inside the chip or a disconnection of wiring occurs, robustness is required to avoid the influence and continue operation. Yes.

ソフトエラーによる一過性の故障に対しては、TMR(Triple Module Redundancy:3重多数決回路)などの多重系や、冗長符号を用いた誤り訂正などの手法にて修復が可能となる。一方、構成回路の中に永久故障が発生した場合、一過性故障を検出する機能が損なわれ、信頼性が低下する。例えば、TMRの場合、3重構成のモジュールの1系統に永久故障が発生すると、永久故障モジュールの出力が異常となるので、他の正常な2系統にソフトエラーが発生した場合、多数決回路の出力結果が異常になる。   A transient failure due to a soft error can be repaired by a multiplexing system such as TMR (Triple Module Redundancy) or a method such as error correction using a redundant code. On the other hand, when a permanent failure occurs in the constituent circuits, the function of detecting a transient failure is impaired and the reliability is lowered. For example, in the case of TMR, if a permanent failure occurs in one system of a three-layer module, the output of the permanent failure module becomes abnormal. If a soft error occurs in the other two normal systems, the output of the majority circuit The result is abnormal.

例えば、特許文献1に記載のコンピュータシステムでは、多数決回路によって、異常(障害)を検出し、異常検出回数を異常回数カウンタによってカウントしている。そして、カウント値が予め決められたしきい値を超えると、発生した障害が恒久性障害であると判定し、そうでない場合は、一過性障害であると判定している。   For example, in the computer system described in Patent Document 1, an abnormality (failure) is detected by a majority circuit, and the number of abnormality detections is counted by an abnormality number counter. When the count value exceeds a predetermined threshold value, it is determined that the failure that has occurred is a permanent failure, and otherwise, it is determined that it is a transient failure.

特開2004−133496号公報JP 2004-13396 A

しかしながら、上記従来の技術では、発生した障害が恒久性障害か一過性障害かの異常判定を、異常検出回数に基づいて行っているので、正確な異常判定を行うことができないという問題があった。また、恒久障害が発生したと判定された場合に、CPUモジュールの内部バスおよび制御信号を切り離しているに過ぎず、信頼性の高い動作を確保することはできないという問題があった。   However, the above-described conventional technique has a problem in that it cannot perform an accurate abnormality determination because the abnormality determination of whether the generated failure is a permanent failure or a transient failure is performed based on the number of abnormality detections. It was. Further, when it is determined that a permanent failure has occurred, the internal bus and control signal of the CPU module are merely disconnected, and there is a problem that a highly reliable operation cannot be ensured.

本発明は、上記に鑑みてなされたものであって、システムの高い信頼性を長期間に亘って維持することが可能なエラー検出修復装置を得ることを目的とする。   The present invention has been made in view of the above, and an object of the present invention is to obtain an error detection and repair device capable of maintaining high system reliability over a long period of time.

上述した課題を解決し、目的を達成するために、本発明は、エラー訂正可能な複数の論理ブロックを含む論理回路と、前記論理ブロック内に発生したエラーを検出するエラー検出部と、前記エラー検出部で検出されたエラーの中からハードエラーを検出すると、少なくとも1つのハードエラー情報出力するハードエラー検出部と、前記ハードエラー検出部から出力されるハードエラー情報の数を計数するとともに、計数結果に基づいて前記論理ブロックが永久故障であるか否かを判断し、前記論理ブロックが永久故障である場合には、永久故障と判断された論理ブロックを正常な論理ブロックに切り替える切り替え指示を送出するエラー計数部と、前記エラー計数部から前記切り替え指示が送出された場合に、永久故障と判断された論理ブロックを、正常な論理ブロックに切り替える再構成制御部と、を具備し、前記ハードエラー検出部は、前記エラー検出部から所定サイクル連続でエラーを検出した場合に前記ハードエラーが発生したと判定して少なくとも1つの前記ハードエラー情報を出力することを特徴とする。 In order to solve the above-described problems and achieve the object, the present invention provides a logic circuit including a plurality of error-correctable logic blocks, an error detection unit for detecting an error occurring in the logic block, and the error When a hard error is detected from the errors detected by the detection unit, a hard error detection unit that outputs at least one hard error information, and the number of hardware error information output from the hard error detection unit are counted, Based on the counting result, it is determined whether or not the logical block has a permanent failure. When the logical block has a permanent failure, a switching instruction to switch the logical block determined to be a permanent failure to a normal logical block is issued. An error counter to be transmitted, and a logic block determined to be a permanent failure when the switching instruction is transmitted from the error counter. The click, anda reconfiguration control unit to switch to normal logic blocks, determines that the hard error detection unit, the hard error occurs when an error is detected in predetermined cycles continuously from the error detection unit Then, at least one of the hard error information is output .

本発明によれば、システムの高い信頼性を長期間に亘って維持することが可能になるという効果を奏する。   According to the present invention, it is possible to maintain the high reliability of the system over a long period of time.

図1は、実施の形態1に係るエラー検出修復装置の構成を示す図である。FIG. 1 is a diagram illustrating the configuration of the error detection and repair apparatus according to the first embodiment. 図2は、実施の形態1に係る機能ブロックの構成を示す図である。FIG. 2 is a diagram illustrating a configuration of functional blocks according to the first embodiment. 図3は、実施の形態1に係るハードエラー検出回路の構成例を示す図である。FIG. 3 is a diagram illustrating a configuration example of the hard error detection circuit according to the first embodiment. 図4は、実施の形態1に係るハードエラー検出回路の他の構成例を示す図である。FIG. 4 is a diagram illustrating another configuration example of the hard error detection circuit according to the first embodiment. 図5は、永久故障判定方法の第1例を説明するための図である。FIG. 5 is a diagram for explaining a first example of a permanent failure determination method. 図6は、永久故障判定方法の第2例を説明するための図である。FIG. 6 is a diagram for explaining a second example of the permanent failure determination method. 図7は、永久故障判定方法の第3例を説明するための図である。FIG. 7 is a diagram for explaining a third example of the permanent failure determination method. 図8は、実施の形態3に係るエラー検出修復装置の構成を示す図である。FIG. 8 is a diagram illustrating the configuration of the error detection and repair apparatus according to the third embodiment. 図9は、実施の形態3に係る機能ブロックの構成を示す図である。FIG. 9 is a diagram illustrating a configuration of functional blocks according to the third embodiment. 図10は、実施の形態3に係るハードエラー検出回路の構成例を示す図である。FIG. 10 is a diagram illustrating a configuration example of a hard error detection circuit according to the third embodiment. 図11は、実施の形態3に係るテスト回路の動作手順を示すフローチャートである。FIG. 11 is a flowchart showing an operation procedure of the test circuit according to the third embodiment.

以下に、本発明の実施の形態に係るエラー検出修復装置を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。また、実施の形態の説明に用いる図では、フリップフロップのクロック端子への配線情報は省略している。   Hereinafter, an error detection and repair apparatus according to an embodiment of the present invention will be described in detail with reference to the drawings. Note that the present invention is not limited to the embodiments. Further, in the drawing used for description of the embodiment, the wiring information to the clock terminal of the flip-flop is omitted.

実施の形態1.
図1は、実施の形態1に係るエラー検出修復装置の構成を示す図である。エラー検出修復装置100は、エラー訂正可能な論理ブロックの何れかが故障した場合に、ソフトエラー(一過性故障)/ハードエラー(永久故障)の判別機能により、ハードエラーを検出する装置である。エラー検出修復装置100は、ハードエラーが発生した系統を他の系統から切り離し、ハードエラーした機能を正常な系統の予備回路によって復元(再構成)する。
Embodiment 1 FIG.
FIG. 1 is a diagram illustrating the configuration of the error detection and repair apparatus according to the first embodiment. The error detection / repair device 100 is a device that detects a hard error by a soft error (transient failure) / hard error (permanent failure) discrimination function when any one of error-correctable logic blocks fails. . The error detection / repair device 100 disconnects a system in which a hard error has occurred from other systems, and restores (reconfigures) the function in which the hard error has occurred with a normal system spare circuit.

エラー検出修復装置100は、再構成制御部6と、ハードエラー検出回路(ハードエラー検出部)4と、エラーカウンタ(エラー計数部)5と、複数の機能ブロックと、を含んで構成されている。ここでは、エラー検出修復装置100が、3つの機能ブロック1A〜1Cを備えている場合について説明する。   The error detection / repair device 100 includes a reconfiguration control unit 6, a hard error detection circuit (hard error detection unit) 4, an error counter (error counting unit) 5, and a plurality of functional blocks. . Here, a case where the error detection / repair device 100 includes three functional blocks 1A to 1C will be described.

機能ブロック1A〜1Cは、それぞれ後述する訂正可能論理ブロック11(エラー訂正が可能な機構を有する素子の集合)および後述するエラー検出回路15を含んで構成されている。また、機能ブロック1A〜1Cは、それぞれ信号入力線0A〜0C、通常動作で使用する通常信号線2A〜2Cおよびエラー報知信号線3A〜3Cと結線されている。   Each of the functional blocks 1A to 1C includes a correctable logic block 11 (a set of elements having a mechanism capable of error correction) and an error detection circuit 15 to be described later. The functional blocks 1A to 1C are connected to signal input lines 0A to 0C, normal signal lines 2A to 2C used in normal operation, and error notification signal lines 3A to 3C, respectively.

ハードエラー検出回路4は、エラー報知信号線3A〜3Cに接続されている。また、ハードエラー検出回路4とエラーカウンタ5とは、ハードエラー報知信号線7によって接続されている。また、エラーカウンタ5と再構成制御部6とは、再構成指示信号線9によって接続されている。また、再構成制御部6と前段回路(図示せず)とは、前段信号線10によって接続されている。   The hard error detection circuit 4 is connected to the error notification signal lines 3A to 3C. The hard error detection circuit 4 and the error counter 5 are connected by a hard error notification signal line 7. Further, the error counter 5 and the reconstruction control unit 6 are connected by a reconstruction instruction signal line 9. Further, the reconfiguration control unit 6 and the previous circuit (not shown) are connected by the previous signal line 10.

再構成制御部6は、前段信号線10を介して前段回路から送られてくる種々の入力情報(入力信号)を機能ブロック1A〜1Cに入力するとともに、機能ブロック1A〜1Cの再構成を制御する。   The reconfiguration controller 6 inputs various input information (input signals) sent from the previous circuit via the previous signal line 10 to the function blocks 1A to 1C and controls the reconfiguration of the function blocks 1A to 1C. To do.

前段信号線10は、前段回路から送られてくる種々の入力情報を再構成制御部6に送る信号線である。信号入力線0A〜0Cは、再構成制御部6から送られてくる入力信号を機能ブロック1A〜1Cに送る信号線である。また、通常信号線2A〜2Cは、機能ブロック1A〜1Cから送られてくる通常動作で使用する信号(通常信号)を他の機能ブロック(図示せず)や論理素子(図示せず)に送る信号線である。また、エラー報知信号線3A〜3Cは、機能ブロック1A〜1Cから送られてくるエラー情報(エラー判定情報)3a〜3c(図示せず)をハードエラー検出回路4に送る信号線である。   The pre-stage signal line 10 is a signal line for sending various input information sent from the pre-stage circuit to the reconstruction control unit 6. The signal input lines 0A to 0C are signal lines that send input signals sent from the reconfiguration control unit 6 to the function blocks 1A to 1C. Further, the normal signal lines 2A to 2C send signals (normal signals) used in normal operation sent from the functional blocks 1A to 1C to other functional blocks (not shown) and logic elements (not shown). It is a signal line. The error notification signal lines 3A to 3C are signal lines that send error information (error determination information) 3a to 3c (not shown) sent from the functional blocks 1A to 1C to the hard error detection circuit 4.

通常信号線2A〜2Cへ送出される通常信号は、他の機能ブロックや論理素子で通常のシステム動作に用いられる。機能ブロック1A〜1Cに内包されるエラー検出回路15は、論理回路内に存在するエラー訂正可能な論理ブロック(以下、訂正可能論理ブロック11という)内で発生したエラーを検出し、エラー情報3a〜3cとしてエラー報知信号線3A〜3Cを介してハードエラー検出回路4に報知する。   The normal signal sent to the normal signal lines 2A to 2C is used for normal system operation in other functional blocks and logic elements. The error detection circuit 15 included in the functional blocks 1A to 1C detects an error that has occurred in an error correctable logic block (hereinafter referred to as a correctable logic block 11) existing in the logic circuit, and error information 3a to 3c is notified to the hardware error detection circuit 4 via the error notification signal lines 3A to 3C.

エラー報知信号線3A〜3Cの何れかにエラー情報3a〜3cが報知されると、ハードエラー検出回路4は、エラー情報3a〜3cに基づいて、エラー情報3a〜3cがソフトエラーとハードエラーの何れによるものか(故障の種別)を解析する。ハードエラー検出回路4は、エラー情報3a〜3cがハードエラー(永久故障)である場合のみ、ハードエラー報知信号線7からエラーカウンタ5にハードエラーであることを示すハードエラー情報Xを報知する。   When the error information 3a to 3c is notified to any of the error notification signal lines 3A to 3C, the hardware error detection circuit 4 determines whether the error information 3a to 3c is a soft error or a hard error based on the error information 3a to 3c. Analyze the cause (failure type). The hardware error detection circuit 4 notifies the hardware error information X indicating the hardware error from the hardware error notification signal line 7 to the error counter 5 only when the error information 3a to 3c is a hardware error (permanent failure).

ハードエラー検出回路4からハードエラー報知信号線7にハードエラー情報Xが発行されると、エラーカウンタ5がハードエラー情報Xの発行回数を計数する。エラーカウンタ5は、パラメータ入力線8を介して送られてくるパラメータ入力情報と、エラーカウンタ5自体の計数値(計数結果)に基づいて、機能ブロック1A〜1Cを再構成するか否かを判定する。   When the hardware error information X is issued from the hardware error detection circuit 4 to the hardware error notification signal line 7, the error counter 5 counts the number of times the hardware error information X is issued. The error counter 5 determines whether to reconfigure the functional blocks 1A to 1C based on the parameter input information sent via the parameter input line 8 and the count value (counting result) of the error counter 5 itself. To do.

エラーカウンタ5は、再構成の必要条件が満たされると、再構成情報を更新し、再構成制御部6に再構成指示(再構成情報の送信)を行う。再構成情報は、永久故障と判断された論理ブロックを正常な論理ブロックに切り替える切り替え指示を含んでいる。エラーカウンタ5は、例えば、ハードエラー数(ハードエラー情報X)が所定数に達した場合に、再構成制御部6に再構成指示を行う。   When the reconfiguration requirements are satisfied, the error counter 5 updates the reconfiguration information and issues a reconfiguration instruction (transmission of reconfiguration information) to the reconfiguration control unit 6. The reconfiguration information includes a switching instruction for switching a logical block determined to be a permanent failure to a normal logical block. For example, when the number of hard errors (hardware error information X) reaches a predetermined number, the error counter 5 gives a reconfiguration instruction to the reconfiguration control unit 6.

再構成指示を受けた再構成制御部6は、再構成情報に基づいて、前段入力情報と出力(信号入力線0A〜0C)の接続関係、および機能ブロック1A〜1Cの内部状態を更新する。換言すると、再構成制御部6は、エラーカウンタ5から送られてくる再構成情報に基づいて、前段回路から送られてくる種々の入力情報を信号入力線0A〜0Cに分配する。   Upon receiving the reconfiguration instruction, the reconfiguration control unit 6 updates the connection relation between the previous stage input information and the output (signal input lines 0A to 0C) and the internal states of the functional blocks 1A to 1C based on the reconfiguration information. In other words, the reconfiguration control unit 6 distributes various input information sent from the preceding circuit to the signal input lines 0A to 0C based on the reconfiguration information sent from the error counter 5.

これにより、再構成制御部6は、再構成情報に基づいて、故障した訂正可能論理ブロック11を使用不可に設定し、正常なブロック(系)に切り替えさせる。別言すれば、ハードエラーが所定数に達した場合にエラー箇所が正常な系から切り離され、エラー箇所と等価な機能が復元される。   As a result, the reconfiguration control unit 6 sets the failed correctable logical block 11 to be unusable based on the reconfiguration information, and switches to a normal block (system). In other words, when the number of hard errors reaches a predetermined number, the error location is disconnected from the normal system, and the function equivalent to the error location is restored.

例えば、PLD(Programmable Logic Device)の1種であるFPGA(Field-Programmable Gate Array)を用いて動作系と待機系を構築しておく。そして、機能ブロック1A〜1Cの何れかに永久障害が発生した場合には、再構成制御部6が、永久障害の発生した機能ブロックを待機系へ切り替えることにより、永久障害の発生した機能ブロックの再構成を行う。なお、機能ブロック1A〜1Cの再構成は、何れの方法によって行ってもよく、上記方法に限定されない。   For example, an operation system and a standby system are constructed using an FPGA (Field-Programmable Gate Array) which is a kind of PLD (Programmable Logic Device). When a permanent failure occurs in any one of the functional blocks 1A to 1C, the reconfiguration control unit 6 switches the functional block in which the permanent failure has occurred to the standby system, so that the functional block in which the permanent failure has occurred. Perform reconfiguration. The reconfiguration of the functional blocks 1A to 1C may be performed by any method, and is not limited to the above method.

このように、エラー検出修復装置100は、ハードエラーの発生数を管理し、ハードエラーの発生数に基づいて機能ブロック1A〜1Cの再構成を行う。エラー検出修復装置100は、半導体集積回路の内部に実装する機能が永久故障した場合、システムの動作を止める事なく、自律的に機能を復元する。   As described above, the error detection and repair device 100 manages the number of occurrences of hard errors, and reconfigures the functional blocks 1A to 1C based on the number of occurrences of hard errors. The error detection / restoration apparatus 100 autonomously restores the function without stopping the operation of the system when the function mounted in the semiconductor integrated circuit has a permanent failure.

つぎに、機能ブロック1A〜1Cの構成について説明する。なお、機能ブロック1A〜1Cは、同様の構成を有しているので、ここでは機能ブロック1Aの構成について説明する。   Next, the configuration of the functional blocks 1A to 1C will be described. Since the functional blocks 1A to 1C have the same configuration, the configuration of the functional block 1A will be described here.

図2は、実施の形態1に係る機能ブロックの構成を示す図である。図2では、機能ブロック1Aの内部構成を示している。機能ブロック1Aは、訂正可能論理ブロック11およびエラー検出回路(エラー検出部)15を含んで構成されている。   FIG. 2 is a diagram illustrating a configuration of functional blocks according to the first embodiment. FIG. 2 shows the internal configuration of the functional block 1A. The functional block 1A includes a correctable logic block 11 and an error detection circuit (error detection unit) 15.

ここでは、訂正可能論理ブロック11の例として、訂正可能論理ブロック11が、TMR(Triple Module Redundancy:3重多数決回路)構成のフリップフロップを用いて動作する場合について説明する。   Here, as an example of the correctable logic block 11, a case where the correctable logic block 11 operates using a flip-flop having a TMR (Triple Module Redundancy) configuration will be described.

訂正可能論理ブロック11は、3系統のフリップフロップ12A〜12Cおよび多数決回路14を有している。フリップフロップ12A〜12Cへは、信号入力線0Aからの入力信号が入力される。また、フリップフロップ12A〜12Cは、それぞれ個別出力信号線13A〜13Cに接続されている。個別出力信号線13A〜13Cは、フリップフロップ12A〜12Cとエラー検出回路15とを接続するとともに、フリップフロップ12A〜12Cと多数決回路14とを接続する。   The correctable logic block 11 has three systems of flip-flops 12A to 12C and a majority circuit 14. Input signals from the signal input line 0A are input to the flip-flops 12A to 12C. The flip-flops 12A to 12C are connected to the individual output signal lines 13A to 13C, respectively. The individual output signal lines 13A to 13C connect the flip-flops 12A to 12C and the error detection circuit 15, and also connect the flip-flops 12A to 12C and the majority circuit 14.

エラー検出回路15は、入力側の信号線として個別出力信号線13A〜13Cに接続され、出力側の信号線としてエラー報知信号線3Aに接続されている。また、多数決回路14は、入力側の信号線として個別出力信号線13A〜13Cに接続され、出力側の信号線として通常信号線2Aに接続されている。   The error detection circuit 15 is connected to the individual output signal lines 13A to 13C as an input side signal line, and is connected to the error notification signal line 3A as an output side signal line. The majority circuit 14 is connected to the individual output signal lines 13A to 13C as input-side signal lines, and is connected to the normal signal line 2A as output-side signal lines.

フリップフロップ12A〜12Cの何れかで故障が発生し、出力値が反転した場合、多数決回路14で他の正常な2個のフリップフロップ出力が多数決により選択され、通常信号線2A(多数決回路出力)に出力される。通常信号線2Aに出力される出力信号は、通常動作にて使用される。   When a failure occurs in any of the flip-flops 12A to 12C and the output value is inverted, the other two normal flip-flop outputs are selected by majority in the majority circuit 14, and the normal signal line 2A (major circuit output) Is output. The output signal output to the normal signal line 2A is used in normal operation.

エラー検出回路15は、訂正可能論理ブロック11内の各フリップフロップ12A〜12Cからの出力(個別出力信号線13A〜13Cに送出される個別信号)を基に、エラー検出を行う。エラー検出回路15は、個別出力信号線13A〜13Cに送出される個別信号を入力とし、個別信号の全てが一致しない場合に、エラー報知信号線3Aからエラー情報3aを報知する。   The error detection circuit 15 performs error detection based on outputs from the flip-flops 12A to 12C in the correctable logic block 11 (individual signals sent to the individual output signal lines 13A to 13C). The error detection circuit 15 receives the individual signals sent to the individual output signal lines 13A to 13C, and notifies the error information 3a from the error notification signal line 3A when all of the individual signals do not match.

なお、ここでは機能ブロック1Aの構成がTMR構成のフリップフロップを有している場合について説明したが、機能ブロック1Aの構成はこの構成に限らない。例えば、機能ブロック1Aは、冗長符号を付与したECC回路によってエラー訂正を行うフリップフロップを有するものや、周辺論理回路やメモリを含む更に高機能なブロックでエラー訂正を行うものでもよい。また、これらの場合はエラー訂正方式に基づいてエラー訂正が行われた際にエラーを報知するものとする。   In addition, although the case where the structure of the functional block 1A has the flip-flop of TMR structure was demonstrated here, the structure of the functional block 1A is not restricted to this structure. For example, the functional block 1A may be one having a flip-flop that performs error correction by an ECC circuit to which a redundant code is assigned, or one that performs error correction by a more sophisticated block including peripheral logic circuits and memories. In these cases, an error is notified when error correction is performed based on the error correction method.

図3は、実施の形態1に係るハードエラー検出回路の構成例を示す図である。ソフトエラーが原因の故障は、エラー訂正機能や前段回路からの入力値(入力情報)によって、次の動作サイクルで正しい値に更新される。このため、本実施の形態では2サイクル連続でエラーを検出した場合にハードエラーと判定する。   FIG. 3 is a diagram illustrating a configuration example of the hard error detection circuit according to the first embodiment. A failure caused by a soft error is updated to a correct value in the next operation cycle by an error correction function or an input value (input information) from a preceding circuit. For this reason, in this embodiment, a hard error is determined when an error is detected for two consecutive cycles.

ハードエラー検出回路4は、OR回路21、フリップフロップ22,23、AND回路24を備えている。OR回路21は、エラー報知信号線3A〜3Cに接続されており、エラー報知信号線3A〜3Cからのエラー情報3a〜3cが入力される。また、OR回路21は、信号線25に接続されており、エラー情報3a〜3cの論理和を信号線25に出力する。   The hard error detection circuit 4 includes an OR circuit 21, flip-flops 22 and 23, and an AND circuit 24. The OR circuit 21 is connected to the error notification signal lines 3A to 3C, and receives error information 3a to 3c from the error notification signal lines 3A to 3C. The OR circuit 21 is connected to the signal line 25, and outputs a logical sum of the error information 3 a to 3 c to the signal line 25.

フリップフロップ22は、信号線25に接続されており、信号線25からフリップフロップ22へは、OR回路21からの信号(エラー情報3a〜3cの論理和)が入力される。また、フリップフロップ22は、信号線26に接続されており、信号線25からの信号を遅延させた信号を信号線26に出力する。   The flip-flop 22 is connected to the signal line 25, and a signal (logical sum of the error information 3 a to 3 c) from the OR circuit 21 is input from the signal line 25 to the flip-flop 22. The flip-flop 22 is connected to the signal line 26 and outputs a signal obtained by delaying the signal from the signal line 25 to the signal line 26.

AND回路24は、信号線25に接続されており、信号線25からの信号(エラー情報3a〜3cの論理和)が入力される。また、AND回路24は、信号線26に接続されており、信号線26からの信号が入力される。AND回路24は、信号線25からの信号と信号線26からの信号の論理積を算出することによって、2サイクル連続でエラーが発生した場合に、2サイクル連続でエラーであることを検出する。AND回路24は、信号線27を介してフリップフロップ23に接続されている。AND回路24は、2サイクル連続でエラーであることを検出した場合に、出力信号を信号線27に出力する。フリップフロップ23は、AND回路24からの出力信号を遅延/波形整形し、遅延/波形整形した信号を、ハードエラー報知信号線7にハードエラー情報Xとして出力する。   The AND circuit 24 is connected to the signal line 25 and receives a signal (logical sum of the error information 3a to 3c) from the signal line 25. The AND circuit 24 is connected to the signal line 26 and receives a signal from the signal line 26. The AND circuit 24 calculates the logical product of the signal from the signal line 25 and the signal from the signal line 26, and detects an error in two consecutive cycles when an error occurs in two consecutive cycles. The AND circuit 24 is connected to the flip-flop 23 via the signal line 27. The AND circuit 24 outputs an output signal to the signal line 27 when detecting an error for two consecutive cycles. The flip-flop 23 delays / waveforms the output signal from the AND circuit 24 and outputs the delayed / waveform-shaped signal to the hard error notification signal line 7 as hard error information X.

この構成により、ハードエラー検出回路4では、エラー報知信号線3A〜3Cの何れかを介してエラー情報3a〜3cが入力されると、AND回路24がエラー情報3a〜3cの論理和を算出する。この論理和の情報は、AND回路24から信号線25に出力され、フリップフロップ22およびAND回路24に送られる。   With this configuration, in the hard error detection circuit 4, when the error information 3a to 3c is input via any of the error notification signal lines 3A to 3C, the AND circuit 24 calculates the logical sum of the error information 3a to 3c. . This logical sum information is output from the AND circuit 24 to the signal line 25 and sent to the flip-flop 22 and the AND circuit 24.

そして、フリップフロップ22は、信号線25からの信号(エラー情報3a〜3cの論理和)を遅延させ、遅延させた信号を信号線26に出力する。AND回路24は、信号線25からの信号と信号線26からの信号の論理積を算出する。これにより、AND回路24は、2サイクル連続でエラーが発生した場合に、2サイクル連続でエラーであることを検出する。ソフトエラーの場合は、2サイクル連続でAND回路24にエラーが報知されることはないので、この場合、AND回路24でエラー情報3a〜3cがキャンセルされることとなる。フリップフロップ23は、AND回路24からの出力信号が遅延/波形整形し、ハードエラー報知信号線7にハードエラー情報Xとして出力する。   The flip-flop 22 delays the signal from the signal line 25 (logical sum of the error information 3 a to 3 c), and outputs the delayed signal to the signal line 26. The AND circuit 24 calculates the logical product of the signal from the signal line 25 and the signal from the signal line 26. As a result, when an error occurs in two consecutive cycles, the AND circuit 24 detects an error in two consecutive cycles. In the case of a soft error, the error is not notified to the AND circuit 24 for two consecutive cycles. In this case, the error information 3a to 3c is canceled by the AND circuit 24. The flip-flop 23 delays / shapes the output signal from the AND circuit 24 and outputs it as the hard error information X to the hard error notification signal line 7.

図4は、実施の形態1に係るハードエラー検出回路の他の構成例を示す図である。なお、図4の各構成要素のうち図3に示すハードエラー検出回路4と同一機能を達成する構成要素については同一番号を付しており、重複する説明は省略する。   FIG. 4 is a diagram illustrating another configuration example of the hard error detection circuit according to the first embodiment. 4 that have the same functions as those of the hard error detection circuit 4 shown in FIG. 3 are denoted by the same reference numerals, and redundant description thereof is omitted.

図3に示したハードエラー検出回路4は、エラー情報3a〜3cの論理和に対してハードエラーであるか否かを判定する構成である。一方、図4に示したハードエラー検出回路4’は、エラー情報3a〜3cのそれぞれに対してハードエラーであるか否かの判定を行い、その後に論理和(エラー判定の論理和)を取る構成である。   The hard error detection circuit 4 shown in FIG. 3 is configured to determine whether or not a hard error has occurred with respect to the logical sum of the error information 3a to 3c. On the other hand, the hard error detection circuit 4 ′ shown in FIG. 4 determines whether or not there is a hard error for each of the error information 3a to 3c, and then performs a logical sum (logical sum of error determination). It is a configuration.

ハードエラー検出回路4’は、OR回路21と、機能ブロック毎のハードエラー検出回路と、を備えている。ここでのハードエラー検出回路4’は、機能ブロック1A〜1Cに対し、ハードエラー検出部31A〜31Cを備えている。   The hard error detection circuit 4 ′ includes an OR circuit 21 and a hard error detection circuit for each functional block. The hard error detection circuit 4 'here includes hard error detection units 31A to 31C for the functional blocks 1A to 1C.

ハードエラー検出部31Aは、入力側の信号線としてエラー報知信号線3Aに接続され、出力側の信号線として信号線32Aに接続されている。また、ハードエラー検出部31Bは、入力側の信号線としてエラー報知信号線3Bに接続され、出力側の信号線として信号線32Bに接続されている。ハードエラー検出部31Cは、入力側の信号線としてエラー報知信号線3Cに接続され、出力側の信号線として信号線32Cに接続されている。OR回路21は、入力側の信号線として信号線32A〜32Cに接続され、出力側の信号線としてハードエラー報知信号線7に接続されている。   The hard error detection unit 31A is connected to the error notification signal line 3A as an input-side signal line, and is connected to the signal line 32A as an output-side signal line. The hard error detection unit 31B is connected to the error notification signal line 3B as an input-side signal line, and is connected to the signal line 32B as an output-side signal line. The hard error detection unit 31C is connected to the error notification signal line 3C as an input-side signal line, and is connected to the signal line 32C as an output-side signal line. The OR circuit 21 is connected to the signal lines 32A to 32C as input-side signal lines, and is connected to the hard error notification signal line 7 as output-side signal lines.

ハードエラー検出部31A〜31Cは、それぞれ図3に示したハードエラー検出回路4の構成からOR回路21を削除し、信号線25を直接エラー報知信号線3A〜3Bのうちの1つの信号線に接続した構成である。   The hard error detection units 31A to 31C delete the OR circuit 21 from the configuration of the hard error detection circuit 4 shown in FIG. 3, respectively, and the signal line 25 is directly used as one of the error notification signal lines 3A to 3B. It is a connected configuration.

なお、ハードエラー検出部31A〜31Cは、同様の構成を有しているので、ここではハードエラー検出部31Aの構成について説明する。ハードエラー検出部31Aは、フリップフロップ22A,23A、AND回路24Aを備えている。フリップフロップ22A,23Aは、フリップフロップ22,23と同様の機能を有し、AND回路24Aは、AND回路24と同様の機能を有している。また、信号線25A〜27Aは、信号線25〜27と同様の機能を有している。   Since the hard error detection units 31A to 31C have the same configuration, the configuration of the hard error detection unit 31A will be described here. The hard error detector 31A includes flip-flops 22A and 23A and an AND circuit 24A. The flip-flops 22A and 23A have the same function as the flip-flops 22 and 23, and the AND circuit 24A has the same function as the AND circuit 24. The signal lines 25A to 27A have the same function as the signal lines 25 to 27.

エラー報知信号線3Aは、ハードエラー検出部31A内の信号線25Aに接続されている。フリップフロップ22Aは、信号線25Aに接続されており、信号線25Aからフリップフロップ22Aへは、エラー情報3aが入力される。また、フリップフロップ22Aは、信号線26Aに接続されており、信号線25Aからの信号を遅延させた信号を信号線26Aに出力する。   The error notification signal line 3A is connected to the signal line 25A in the hard error detection unit 31A. The flip-flop 22A is connected to the signal line 25A, and the error information 3a is input from the signal line 25A to the flip-flop 22A. The flip-flop 22A is connected to the signal line 26A, and outputs a signal obtained by delaying the signal from the signal line 25A to the signal line 26A.

AND回路24Aは、信号線25Aおよび信号線26Aに接続されており、信号線25Aからの信号および信号線26Aからの信号が入力される。AND回路24Aは、信号線25Aからの信号と信号線26Aからの信号の論理積を算出することによって、2サイクル連続でエラーが発生した場合に、2サイクル連続でエラーであることを検出する。AND回路24Aは、信号線27Aを介してフリップフロップ23Aに接続されている。AND回路24Aは、2サイクル連続でエラーであることを検出した場合に、出力信号を信号線27Aに出力する。フリップフロップ23Aは、AND回路24Aからの出力信号を遅延/波形整形し、遅延/波形整形した信号を、エラー情報3aとして信号線32Aに送る。   The AND circuit 24A is connected to the signal line 25A and the signal line 26A, and receives a signal from the signal line 25A and a signal from the signal line 26A. The AND circuit 24A calculates the logical product of the signal from the signal line 25A and the signal from the signal line 26A, and detects an error in two consecutive cycles when an error occurs in two consecutive cycles. The AND circuit 24A is connected to the flip-flop 23A via the signal line 27A. The AND circuit 24A outputs an output signal to the signal line 27A when detecting an error for two consecutive cycles. The flip-flop 23A delays / waveforms the output signal from the AND circuit 24A, and sends the delayed / waveform-shaped signal to the signal line 32A as error information 3a.

この構成により、ハードエラー検出回路4’では、エラー報知信号線3Aを介してエラー情報3aが入力されると、エラー情報3aが信号線25Aを介してフリップフロップ22AおよびAND回路24Aに送られる。   With this configuration, when the error information 3a is input to the hardware error detection circuit 4 'via the error notification signal line 3A, the error information 3a is sent to the flip-flop 22A and the AND circuit 24A via the signal line 25A.

フリップフロップ22Aは、信号線25Aからの信号を遅延させ、遅延させた信号を信号線26Aに出力する。AND回路24Aは、信号線25Aからの信号と信号線26Aからの信号の論理積を算出する。AND回路24Aは、2サイクル連続でエラーであることを検出した場合に、出力信号を信号線27Aに出力する。フリップフロップ23Aは、AND回路24Aからの出力信号を遅延/波形整形し、エラー情報3aとして信号線32Aに出力する。このエラー情報3aは、OR回路21に入力される。   The flip-flop 22A delays the signal from the signal line 25A and outputs the delayed signal to the signal line 26A. The AND circuit 24A calculates a logical product of the signal from the signal line 25A and the signal from the signal line 26A. The AND circuit 24A outputs an output signal to the signal line 27A when detecting an error for two consecutive cycles. The flip-flop 23A delays / shapes the output signal from the AND circuit 24A and outputs it as error information 3a to the signal line 32A. The error information 3a is input to the OR circuit 21.

同様に、エラー報知信号線3Bを介してハードエラー検出部31Bにエラー情報3bが入力されると、ハードエラー検出部31Bが2サイクル連続でエラーであることを検出した場合に、ハードエラー検出部31Bからエラー情報3bがOR回路21に入力される。   Similarly, when the error information 3b is input to the hard error detection unit 31B via the error notification signal line 3B, when the hard error detection unit 31B detects an error for two consecutive cycles, the hard error detection unit Error information 3b is input to the OR circuit 21 from 31B.

同様に、エラー報知信号線3Cを介してハードエラー検出部31Cにエラー情報3cが入力されると、ハードエラー検出部31Cが2サイクル連続でエラーであることを検出した場合に、ハードエラー検出部31Cからエラー情報3cがOR回路21に入力される。   Similarly, when the error information 3c is input to the hard error detection unit 31C via the error notification signal line 3C, when the hard error detection unit 31C detects an error for two consecutive cycles, the hard error detection unit Error information 3c is input to the OR circuit 21 from 31C.

OR回路21は、ハードエラー検出部31A〜31Cからの信号(エラー情報3a〜3c)の論理和をハードエラー報知信号線7にハードエラー情報Xとして出力する。   The OR circuit 21 outputs the logical sum of the signals (error information 3a to 3c) from the hardware error detection units 31A to 31C to the hardware error notification signal line 7 as the hardware error information X.

このように、ハードエラー検出回路4’では、エラー情報3a〜3cのそれぞれに対応するハードエラー検出部31A〜31Cの各出力をOR回路21に入力し、論理和出力をハードエラー情報Xとして出力する。   As described above, in the hard error detection circuit 4 ′, the outputs of the hard error detection units 31A to 31C corresponding to the error information 3a to 3c are input to the OR circuit 21, and the logical sum output is output as the hard error information X. To do.

図3に示したハードエラー検出回路4の構成により、簡易な構成でハードエラー判定を行うことが可能となる。また、図4に示したハードエラー検出回路4’の構成により、連続した動作サイクルにおいて、異なる機能ブロックでソフトエラーが発生した場合であっても、OR回路21からの論理和出力(ハードエラー報知信号線7)により、2サイクル連続でエラー報知がされることはない。このため、誤ったハードエラー判定を防止できる。したがって、ハードエラー判定の信頼性を高めることができる。   With the configuration of the hard error detection circuit 4 shown in FIG. 3, it is possible to perform hard error determination with a simple configuration. Further, with the configuration of the hard error detection circuit 4 ′ shown in FIG. 4, even if a soft error occurs in different functional blocks in a continuous operation cycle, a logical sum output (hard error notification) from the OR circuit 21 The signal line 7) does not report an error for two consecutive cycles. For this reason, erroneous hardware error determination can be prevented. Therefore, the reliability of hard error determination can be improved.

なお、図4に示したハードエラー検出回路4’の構成において、フリップフロップ23Aを削除し、OR回路21の出力をフリップフロップで遅延/波形整形させ、その出力をハードエラー報知信号線7からハードエラー情報Xとして出力させてもよい。   In the configuration of the hard error detection circuit 4 ′ shown in FIG. 4, the flip-flop 23A is deleted, and the output of the OR circuit 21 is delayed / shaped by the flip-flop. The error information X may be output.

また、ハードエラー検出回路4やハードエラー検出回路4’において、ハードエラー検出回路内で使用するフリップフロップそのものをTMRなどのエラー訂正可能な構成にすることで、更なるハードエラー判定の信頼性向上が可能となる。ハードエラー検出回路4やハードエラー検出回路4’からハードエラー情報Xが出力されると、このハードエラー情報Xは、エラーカウンタ5に送られる。   Further, in the hard error detection circuit 4 and the hard error detection circuit 4 ′, the flip-flop itself used in the hard error detection circuit is configured to be capable of error correction such as TMR, thereby further improving the reliability of hard error determination. Is possible. When the hardware error information X is output from the hardware error detection circuit 4 or the hardware error detection circuit 4 ′, the hardware error information X is sent to the error counter 5.

このように、エラー検出修復装置100は、ソフトエラーによる一過性故障とハードエラーによる永久故障と、を判別し、機能ブロック内に発生したエラーの種類(ソフトエラー/ハードエラー)のうち、ハードエラーのみをエラー対象としている。そして、ハードエラーが所定数に達した場合に、再構成制御部6が、ハードエラーの発生した機能ブロックを正常なブロックに切り替えるので、永久故障が発生した系を復元することが可能となる。また、一過性故障であるソフトエラーの回路を系から切り離すことによる回路リソースのロスを防ぐことが可能となる。   As described above, the error detection / repair device 100 discriminates between a transient failure due to a soft error and a permanent failure due to a hardware error, and among the types of errors (soft errors / hard errors) occurring in the functional block, Only errors are targeted for error. When the hard error reaches a predetermined number, the reconfiguration control unit 6 switches the functional block in which the hard error has occurred to a normal block, so that the system in which the permanent failure has occurred can be restored. In addition, it is possible to prevent a loss of circuit resources caused by disconnecting a soft error circuit, which is a transient failure, from the system.

また、永久故障のみを正常な系から切り離し、永久故障する前の状態に自律的に修復するので、システム内の各機能の高い信頼性を長期間維持することが可能となる。これにより、人工衛星、原子力発電所の制御装置等のように、長期の連続稼動が求められ且つ故障修理のための工事が困難な機器に適合する論理回路を提供することが可能となる。   In addition, since only a permanent failure is disconnected from a normal system and autonomously restored to the state before the permanent failure, it is possible to maintain high reliability of each function in the system for a long period of time. As a result, it is possible to provide a logic circuit suitable for a device that requires continuous operation for a long period of time and is difficult to perform repair work such as an artificial satellite or a control device of a nuclear power plant.

なお、本実施の形態では、機能ブロックが3つの機能ブロック1A〜1Cである場合について説明したが、機能ブロックは2つであってもよいし、4つ以上であってもよい。また、本実施の形態では2サイクル連続でエラーを検出した場合にハードエラーと判定したが、3サイクル以上の所定サイクル連続でエラーを検出した場合にハードエラーと判定してもよい。   In the present embodiment, the case where the functional blocks are the three functional blocks 1A to 1C has been described. However, the number of functional blocks may be two, or may be four or more. In this embodiment, a hard error is determined when an error is detected for two consecutive cycles. However, a hard error may be determined when an error is detected for a predetermined cycle of three or more cycles.

このように実施の形態1によれば、一過性故障と永久故障と、を判別し、永久故障の場合に、機能の復元を行うので、システムの高い信頼性を長期間に亘って維持することが可能となる。   As described above, according to the first embodiment, a transient failure and a permanent failure are discriminated, and the function is restored in the case of the permanent failure, so that the high reliability of the system is maintained for a long period of time. It becomes possible.

実施の形態2.
つぎに、図5〜図7を用いてこの発明の実施の形態2について説明する。実施の形態2では、エラーカウンタ5が種々の条件に従って、永久故障(ハードエラー)が発生したか否かを判定する。
Embodiment 2. FIG.
Next, a second embodiment of the present invention will be described with reference to FIGS. In the second embodiment, the error counter 5 determines whether a permanent failure (hard error) has occurred according to various conditions.

図5は、永久故障判定方法の第1例を説明するための図である。図6は、永久故障判定方法の第2例を説明するための図である。図7は、永久故障判定方法の第3例を説明するための図である。   FIG. 5 is a diagram for explaining a first example of a permanent failure determination method. FIG. 6 is a diagram for explaining a second example of the permanent failure determination method. FIG. 7 is a diagram for explaining a third example of the permanent failure determination method.

図5〜図7は、エラーカウンタ5によるハードエラー数のカウント例と、永久故障判定例とを示している。図5〜図7に示すグラフの横軸は、時間であり、縦軸はハードエラー数(エラーカウンタ5によるカウント値)である。   5 to 7 show a count example of the number of hard errors by the error counter 5 and a permanent failure determination example. 5 to 7, the horizontal axis represents time, and the vertical axis represents the number of hard errors (count value by the error counter 5).

例えば、図5のグラフは、ハードエラー情報Xが報知される都度、エラーカウンタ5がハードエラーのカウント数を単調増加(加算)させる場合のグラフである。エラーカウンタ5にハードエラー情報Xが報知されると、エラーカウンタ5は、予め決められた数を計数値に加算し、次回のハードエラー報知まで保持する。エラーカウンタ5は、計数値としきい値41とを比較し、計数値がしきい値41を超過すると、再構成情報を更新するともに、再構成制御部6に再構成指示を行う。   For example, the graph of FIG. 5 is a graph in the case where the error counter 5 monotonically increases (adds) the hard error count every time the hardware error information X is notified. When the hardware error information X is notified to the error counter 5, the error counter 5 adds a predetermined number to the count value and holds it until the next hardware error notification. The error counter 5 compares the count value with the threshold value 41. When the count value exceeds the threshold value 41, the error counter 5 updates the reconfiguration information and instructs the reconfiguration control unit 6 to perform a reconfiguration.

図6のグラフは、エラーカウンタ5が、所定時間(所定期間の間)に渡ってハードエラー情報Xを受信しなかった場合(エラー検出されなかった場合)に計数値(エラー値)を減ずる場合のグラフである。この場合、エラーカウンタ5は、所定時間内だけハードエラー情報Xを受信しなかった場合に計数値を減ずる機能を有している。例えば、時間範囲42の間にエラーカウンタ5がハードエラー情報Xを受信しなければ、エラーカウンタ5は、計数値から所定の減算値43を減ずる。   The graph of FIG. 6 shows the case where the error counter 5 decreases the count value (error value) when the hardware error information X is not received for a predetermined time (during a predetermined period) (when no error is detected). It is a graph of. In this case, the error counter 5 has a function of reducing the count value when the hardware error information X is not received for a predetermined time. For example, if the error counter 5 does not receive the hardware error information X during the time range 42, the error counter 5 subtracts a predetermined subtraction value 43 from the count value.

図7のグラフは、エラーカウンタ5が、所定時間(時間範囲44)内だけハードエラー情報Xを受信しなかった場合に計数値をゼロクリアする場合のグラフである。この場合、エラーカウンタ5は、所定時間内だけハードエラー情報Xを受信しなかった場合に計数値をゼロクリアする機能を有している。   The graph of FIG. 7 is a graph when the count value is cleared to zero when the error counter 5 does not receive the hardware error information X within a predetermined time (time range 44). In this case, the error counter 5 has a function of clearing the count value to zero when the hard error information X is not received within a predetermined time.

上述のしきい値41、時間範囲42,44および減算値43は、パラメータ入力線8を介して送られてくるパラメータ入力情報に基づいて設定され、装置外部(例えば、外付けの制御用コンピュータ)または内部から変更可能とする。   The threshold value 41, the time ranges 42 and 44, and the subtraction value 43 are set based on parameter input information sent via the parameter input line 8, and are external to the apparatus (for example, an external control computer). Or change from the inside.

エラーカウンタ5の計数値が0未満にならない(アンダーフローしない)ようエラーカウンタ5を構成しておくと、図5の場合は減算値を0に、図7の場合は減算値をしきい値41と同じ値に、それぞれ設定することで、図5ないし図7の機能を自由に使い分けることが可能となる。時間範囲42,44の計測は、例えばエラーカウンタ5とは別のタイマ(図示せず)によって行なう。   If the error counter 5 is configured so that the count value of the error counter 5 does not become less than 0 (does not underflow), the subtraction value is 0 in the case of FIG. 5 and the subtraction value is the threshold value 41 in FIG. It is possible to freely use the functions of FIG. 5 to FIG. The time ranges 42 and 44 are measured by a timer (not shown) separate from the error counter 5, for example.

このように、本実施の形態では、計数値にしきい値を設定しておき、当該しきい値を超えた場合に再構成制御部6に対して再構成指示を発行する。また、所定期間を計測するタイマを設けておき、当該所定期間内にエラーが検出されなかった場合にエラー数を減算する。また、前記しきい値、タイマの計時量、減算値を可変にすることで、エラー発生回数や頻度に応じて、再構成処理の実施の有無を柔軟に制御することが可能となる。   Thus, in this embodiment, a threshold value is set for the count value, and a reconfiguration instruction is issued to the reconfiguration control unit 6 when the threshold value is exceeded. In addition, a timer for measuring a predetermined period is provided, and the number of errors is subtracted when no error is detected within the predetermined period. In addition, by making the threshold value, the timer timing amount, and the subtraction value variable, it is possible to flexibly control whether or not the reconfiguration process is performed according to the number of occurrences and the frequency of errors.

換言すると、計数値がしきい値を超えた場合にのみ再構成指示またはテスト開始指示を出力し、所定時間の間にハードエラーが報知されなかった場合には計数値から減算を行なっている。そして、しきい値、時間範囲、および減算値をパラメータとして装置外部または内部から可変としている。これにより、ハードエラー発生頻度と装置に要求される信頼性の度合いに応じて柔軟に再構成によるエラー修復を行うことが可能となる。   In other words, a reconfiguration instruction or a test start instruction is output only when the count value exceeds the threshold value, and subtraction is performed from the count value when a hard error is not notified for a predetermined time. The threshold value, the time range, and the subtraction value are variable from outside or inside the apparatus. Thereby, it is possible to flexibly perform error repair by reconfiguration according to the frequency of occurrence of hard errors and the degree of reliability required for the apparatus.

このように実施の形態2によれば、ハードエラー情報Xが報知される都度、ハードエラーのカウント数を単調増加させているので、簡易な構成のエラーカウンタ5によって、永久故障が発生したか否かを判定することが可能となる。   As described above, according to the second embodiment, each time the hardware error information X is notified, the count number of the hardware error is monotonously increased. Therefore, whether or not a permanent failure has occurred by the error counter 5 having a simple configuration. It becomes possible to determine.

また、所定時間内だけハードエラー情報Xを受信しなかった場合に、計数値を減ずるので、永久故障が発生したか否かを正確に判定することが可能となる。また、所定時間内だけハードエラー情報Xを受信しなかった場合に、計数値をゼロクリアするので、永久故障が発生したか否かを正確に判定することが可能となる。   In addition, when the hardware error information X is not received within a predetermined time, the count value is decreased, so that it is possible to accurately determine whether or not a permanent failure has occurred. Further, when the hardware error information X is not received within a predetermined time, the count value is cleared to zero, so that it is possible to accurately determine whether or not a permanent failure has occurred.

実施の形態3.
つぎに、図8〜図11を用いてこの発明の実施の形態3について説明する。実施の形態3では、永久故障が発生した訂正可能論理ブロック11(機能ブロック1A〜1C)を特定するためのテスト回路を設けておく。そして、機能ブロック1A〜1Cの再構成を行う前にテスト回路によって、永久故障が発生した訂正可能論理ブロック11を特定する。その後、特定された訂正可能論理ブロック11に対し、再構成を行う。
Embodiment 3 FIG.
Next, a third embodiment of the present invention will be described with reference to FIGS. In the third embodiment, a test circuit for specifying the correctable logic block 11 (functional blocks 1A to 1C) in which a permanent failure has occurred is provided. Then, before the functional blocks 1A to 1C are reconfigured, the correctable logic block 11 in which the permanent failure has occurred is specified by the test circuit. Thereafter, the specified correctable logical block 11 is reconfigured.

図8は、実施の形態3に係るエラー検出修復装置の構成を示す図である。なお、図8の各構成要素のうち実施の形態1の図1に示すエラー検出修復装置100と同一機能を達成する構成要素については同一番号を付しており、重複する説明は省略する。   FIG. 8 is a diagram illustrating the configuration of the error detection and repair apparatus according to the third embodiment. Of the constituent elements in FIG. 8, constituent elements that achieve the same functions as those of the error detection / repair device 100 shown in FIG. 1 of the first embodiment are given the same numbers, and redundant descriptions are omitted.

エラー検出修復装置101は、エラー検出修復装置100に対し、以下の追加/変更を行って構成されている。
(1)テスト回路52を追加し、エラーカウンタ5の出力をテスト開始信号に用いるとともに、テスト回路52からテスト制御信号を出力する。
(2)再構成情報を、テスト回路52から出力する。
(3)セレクタ59を追加する。エラーカウンタ5へのパラメータ入力として、セレクタ59は、通常時のパラメータ入力情報と、テスト時のパラメータ入力情報と、の何れかを選択する。テスト時にエラーカウンタ5に入力するパラメータ入力情報とセレクタ59への選択指示(セレクト入力)は、テスト回路52によって行う。
(4)機能ブロック1A〜1Cを、機能ブロック50A〜50Cに変更する。機能ブロック50A〜50Cには、通常の入力とテストデータの入力との何れかを選択するセレクタが追加されている。
(5)ハードエラー検出回路4を、ハードエラー検出回路51に変更する。ハードエラー検出回路51には、エラー情報3a〜3cの何れかを選択しバイパスする機能が追加されている。
The error detection / repair device 101 is configured by making the following additions / changes to the error detection / repair device 100.
(1) A test circuit 52 is added, the output of the error counter 5 is used as a test start signal, and a test control signal is output from the test circuit 52.
(2) The reconfiguration information is output from the test circuit 52.
(3) A selector 59 is added. As a parameter input to the error counter 5, the selector 59 selects either normal parameter input information or test parameter input information. The parameter input information to be input to the error counter 5 during the test and the selection instruction (select input) to the selector 59 are performed by the test circuit 52.
(4) The functional blocks 1A to 1C are changed to functional blocks 50A to 50C. In the function blocks 50A to 50C, a selector for selecting either normal input or test data input is added.
(5) The hard error detection circuit 4 is changed to the hard error detection circuit 51. The hard error detection circuit 51 has a function of selecting and bypassing any of the error information 3a to 3c.

具体的には、機能ブロック50A〜50Cは、信号入力線0A〜0C、通常信号線2A〜2C、エラー報知信号線3A〜3Cに加えて、テスト制御信号線56に接続されている。また、ハードエラー検出回路51は、エラー報知信号線3A〜3C、ハードエラー報知信号線7に加えてテスト制御信号線56に接続されている。   Specifically, the functional blocks 50A to 50C are connected to the test control signal line 56 in addition to the signal input lines 0A to 0C, the normal signal lines 2A to 2C, and the error notification signal lines 3A to 3C. The hard error detection circuit 51 is connected to the test control signal line 56 in addition to the error notification signal lines 3A to 3C and the hard error notification signal line 7.

また、エラーカウンタ5は、ハードエラー報知信号線7、パラメータ入力線8に加えて、テスト開始指示信号線58に接続されている。また、テスト回路52は、テスト開始指示信号線58、パラメータ入力線54、セレクト信号線55、テスト制御信号線56、再構成指示信号線9に接続されている。また、セレクタ59は、パラメータ入力線54、セレクト信号線55、パラメータ入力線53、パラメータ入力線8に接続されている。   The error counter 5 is connected to the test start instruction signal line 58 in addition to the hardware error notification signal line 7 and the parameter input line 8. The test circuit 52 is connected to the test start instruction signal line 58, the parameter input line 54, the select signal line 55, the test control signal line 56, and the reconfiguration instruction signal line 9. The selector 59 is connected to the parameter input line 54, the select signal line 55, the parameter input line 53, and the parameter input line 8.

この構成により、エラー検出修復装置101は、通常動作(ハードエラー検出処理)の際には、テスト回路52が、機能ブロック50A〜50Cに、信号入力線0A〜0Cを選択する指示を送る。信号入力線0A〜0Cを選択する指示は、テスト制御信号線56を介し、通常動作用の制御信号として、機能ブロック50A〜50Cに送られる。これにより、機能ブロック50A〜50Cは、実施の形態1と同様の動作を行う。   With this configuration, in the normal operation (hardware error detection process), the error detection / repair device 101 sends an instruction for selecting the signal input lines 0A to 0C to the function blocks 50A to 50C. An instruction to select the signal input lines 0A to 0C is sent to the functional blocks 50A to 50C as a control signal for normal operation via the test control signal line 56. Thereby, the functional blocks 50A to 50C perform the same operation as in the first embodiment.

また、通常動作の際には、テスト回路52は、ハードエラー検出回路51に、ハードエラー検出回路4を選択する指示を送る。ハードエラー検出回路4を選択する指示は、テスト制御信号線56を介し、通常動作用の制御信号として、ハードエラー検出回路51に送られる。これにより、ハードエラー検出回路51は、実施の形態1のハードエラー検出回路4と同様の動作を行う。   Further, during normal operation, the test circuit 52 sends an instruction to the hard error detection circuit 51 to select the hard error detection circuit 4. An instruction to select the hard error detection circuit 4 is sent to the hard error detection circuit 51 through the test control signal line 56 as a control signal for normal operation. Thereby, the hard error detection circuit 51 performs the same operation as that of the hard error detection circuit 4 of the first embodiment.

さらに、通常動作の際には、テスト回路52は、セレクト信号線55を介してセレクタ59に、パラメータ入力線53を選択する指示を送る。これにより、セレクタ59は、パラメータ入力線53から送られてくる通常時のパラメータ入力情報を選択してエラーカウンタ5に送る。   Further, during normal operation, the test circuit 52 sends an instruction to select the parameter input line 53 to the selector 59 via the select signal line 55. Thus, the selector 59 selects the normal parameter input information sent from the parameter input line 53 and sends it to the error counter 5.

エラーカウンタ5は、パラメータ入力情報と、ハードエラー情報Xの計数値と、に基づいて、機能ブロック50A〜50Cを再構成するか否かを判定する。エラーカウンタ5は、機能ブロック50A〜50Cを再構成する場合には、テスト回路52に、再構成することを示す情報(テスト開始信号)を送る。   The error counter 5 determines whether to reconfigure the functional blocks 50A to 50C based on the parameter input information and the count value of the hardware error information X. When reconfiguring the functional blocks 50A to 50C, the error counter 5 sends information (test start signal) indicating reconfiguration to the test circuit 52.

これにより、エラー検出修復装置101は、永久故障が発生した機能ブロック50A〜50Cを特定するためのテスト動作を開始する。テスト動作の際には、テスト回路52は、テスト制御信号線56を介して機能ブロック50A〜50Cの何れか1つと、ハードエラー検出回路51と、にテスト制御信号を送る。   As a result, the error detection / repair device 101 starts a test operation for specifying the functional blocks 50A to 50C in which the permanent failure has occurred. In the test operation, the test circuit 52 sends a test control signal to any one of the functional blocks 50A to 50C and the hard error detection circuit 51 via the test control signal line 56.

機能ブロック50A〜50Cに送られるテスト制御信号には、テストデータと、テストデータを選択する指示と、機能ブロック50A〜50Cの何れかを指定する指示(テスト対象の機能ブロックを指定する指示)と、が含まれている。これにより、機能ブロック50A〜50Cの何れか1つは、テストデータを用いたテスト動作を行う。   The test control signals sent to the functional blocks 50A to 50C include test data, an instruction for selecting the test data, and an instruction for specifying any of the functional blocks 50A to 50C (an instruction for specifying a functional block to be tested). ,It is included. Thereby, any one of the functional blocks 50A to 50C performs a test operation using the test data.

また、ハードエラー検出回路51に送られるテスト開始用のテスト制御信号には、エラー情報3a〜3cを選択する指示が含まれている。これにより、ハードエラー検出回路51は、テストデータに対応するエラー情報3a〜3cを用いたテスト動作を行う。   The test control signal for starting the test sent to the hard error detection circuit 51 includes an instruction to select the error information 3a to 3c. Thereby, the hard error detection circuit 51 performs a test operation using the error information 3a to 3c corresponding to the test data.

また、テスト動作の際には、テスト回路52は、パラメータ入力線54を介してセレクタ59に、テスト時のパラメータ入力情報を送る。さらに、テスト回路52は、セレクト信号線55を介してセレクタ59に、パラメータ入力線54を選択する指示を送る。これにより、セレクタ59は、パラメータ入力線54から送られてくるテスト時のパラメータ入力情報を選択し、選択したパラメータ入力情報をパラメータ入力線8を介してエラーカウンタ5に送る。   In the test operation, the test circuit 52 sends parameter input information at the time of testing to the selector 59 via the parameter input line 54. Further, the test circuit 52 sends an instruction to select the parameter input line 54 to the selector 59 via the select signal line 55. Accordingly, the selector 59 selects parameter input information at the time of testing sent from the parameter input line 54 and sends the selected parameter input information to the error counter 5 via the parameter input line 8.

テスト動作の際には、エラーカウンタ5は、パラメータ入力線8を介して送られてくるパラメータ入力情報と、エラーカウンタ5による計数値と、に基づいて、機能ブロック50A〜50Cの何れが永久故障の発生した機能ブロックであるかを判定する。   During the test operation, the error counter 5 indicates that any of the functional blocks 50A to 50C has a permanent failure based on the parameter input information sent via the parameter input line 8 and the count value by the error counter 5. It is determined whether or not the function block has occurred.

エラーカウンタ5は、永久故障の発生した機能ブロックを特定すると、この機能ブロックを特定する情報をテスト回路52に送る。これにより、テスト回路52は、永久故障の発生した機能ブロックに対して、再構成を行うよう、再構成制御部6に再構成指示を送る。再構成制御部6は、再構成情報に基づいて、永久故障が発生した訂正可能論理ブロック11を使用不可とし、正常なブロック(系)に切り替えさせる。   When the error counter 5 identifies the functional block in which the permanent failure has occurred, the error counter 5 sends information identifying the functional block to the test circuit 52. As a result, the test circuit 52 sends a reconfiguration instruction to the reconfiguration control unit 6 so as to reconfigure the functional block in which the permanent failure has occurred. Based on the reconfiguration information, the reconfiguration control unit 6 disables the correctable logical block 11 in which the permanent failure has occurred and switches it to a normal block (system).

つぎに、機能ブロック50A〜50Cの構成について説明する。なお、機能ブロック50A〜50Cは、同様の構成を有しているので、ここでは機能ブロック50Aの構成について説明する。   Next, the configuration of the functional blocks 50A to 50C will be described. Since the functional blocks 50A to 50C have the same configuration, the configuration of the functional block 50A will be described here.

図9は、実施の形態3に係る機能ブロックの構成を示す図である。図9では、機能ブロック50Aの内部構成を示している。なお、図8の各構成要素のうち実施の形態1の図2に示す機能ブロック1Aと同一機能を達成する構成要素については同一番号を付しており、重複する説明は省略する。   FIG. 9 is a diagram illustrating a configuration of functional blocks according to the third embodiment. FIG. 9 shows the internal configuration of the functional block 50A. In addition, the same number is attached | subjected about the component which achieves the same function as the functional block 1A shown in FIG. 2 of Embodiment 1 among each component of FIG. 8, and the overlapping description is abbreviate | omitted.

機能ブロック50Aは、訂正可能論理ブロック11、エラー検出回路15およびセレクタ61を含んで構成されている。すなわち、機能ブロック50Aは、機能ブロック1Aに、セレクタ61を追加した構成になっている。   The functional block 50A includes a correctable logic block 11, an error detection circuit 15, and a selector 61. That is, the functional block 50A has a configuration in which a selector 61 is added to the functional block 1A.

セレクタ61は、信号入力線0Aと、テストデータの入力線であるテストデータ入力線62と、セレクト信号の入力線であるセレクト信号入力線63と、訂正可能論理ブロック11への信号線である信号線64と、に接続されている。テストデータ入力線62およびセレクト信号入力線63は、テスト制御信号線56に接続されている。   The selector 61 is a signal input line 0A, a test data input line 62 that is a test data input line, a select signal input line 63 that is a select signal input line, and a signal that is a signal line to the correctable logic block 11. Is connected to the line 64. The test data input line 62 and the select signal input line 63 are connected to the test control signal line 56.

セレクタ61へは、再構成制御部6から送られてくる入力信号が、信号入力線0Aを介して入力される。また、セレクタ61へは、テスト回路52から送られてくるテスト制御信号内のテストデータが、テスト制御信号線56およびテストデータ入力線62を介して入力される。再構成制御部6からの入力信号と、テスト回路52からのテストデータと、がセレクタ61に対する被選択入力データである。また、セレクタ61へは、テスト回路52からから送られてくるテスト制御信号内のセレクト信号が、テスト制御信号線56およびセレクト信号入力線63を介して入力される。   An input signal sent from the reconfiguration control unit 6 is input to the selector 61 via the signal input line 0A. Further, the test data in the test control signal sent from the test circuit 52 is input to the selector 61 via the test control signal line 56 and the test data input line 62. The input signal from the reconfiguration controller 6 and the test data from the test circuit 52 are selected input data for the selector 61. Further, the selector 61 receives a select signal in the test control signal sent from the test circuit 52 via the test control signal line 56 and the select signal input line 63.

通常動作の際または機能ブロック50B,50Cをテストする際には、セレクト信号入力線63からセレクタ61に、信号入力線0Aを選択する指示が入力される。これにより、セレクタ61は、信号入力線0Aからの入力信号を選択して信号線64に送出する。そして、訂正可能論理ブロック11およびエラー検出回路15は、実施の形態1と同様の動作を行う。   In normal operation or when testing the functional blocks 50B and 50C, an instruction to select the signal input line 0A is input from the select signal input line 63 to the selector 61. Accordingly, the selector 61 selects an input signal from the signal input line 0A and sends it out to the signal line 64. Then, the correctable logic block 11 and the error detection circuit 15 perform the same operation as in the first embodiment.

テスト動作の際には、セレクト信号入力線63からセレクタ61に、機能ブロック50Aを選択する指示と、テストデータ入力線62を選択する指示と、が入力される。これにより、セレクタ61は、テストデータ入力線62からのテストデータを選択して信号線64に送出する。そして、訂正可能論理ブロック11およびエラー検出回路15は、テストデータを用いたテスト動作を行う。   In the test operation, an instruction to select the functional block 50A and an instruction to select the test data input line 62 are input from the select signal input line 63 to the selector 61. As a result, the selector 61 selects the test data from the test data input line 62 and sends it to the signal line 64. Then, the correctable logic block 11 and the error detection circuit 15 perform a test operation using the test data.

このように、機能ブロック50Aをテストする際にはテストデータが機能ブロック50Aの訂正可能論理ブロック11に入力され、通常動作の際または機能ブロック50B,50Cをテストする際には、信号入力線0Aからの入力信号が訂正可能論理ブロック11に入力される。   As described above, when testing the functional block 50A, test data is input to the correctable logic block 11 of the functional block 50A, and during normal operation or when testing the functional blocks 50B and 50C, the signal input line 0A. Are input to the correctable logic block 11.

これにより、テスト動作の際には、テスト対象とする機能ブロックでは、テストデータが選択され、テスト対象以外の機能ブロックでは、テストデータが選択されない。これにより、テスト対象とする機能ブロックの動作をテストすることが可能となる。本実施の形態では、例えば、機能ブロック50A〜50Cを順番にテスト対象に設定し、各機能ブロック50A〜50Cを順番にテストする。   As a result, during the test operation, test data is selected in the functional block to be tested, and test data is not selected in functional blocks other than the test target. Thereby, it becomes possible to test the operation of the functional block to be tested. In the present embodiment, for example, the function blocks 50A to 50C are set as test targets in order, and the function blocks 50A to 50C are tested in order.

図10は、実施の形態3に係るハードエラー検出回路の構成例を示す図である。ハードエラー検出回路51は、ハードエラー検出回路4と、セレクタ71を備えている。ハードエラー検出回路4は、入力側がエラー報知信号線3A〜3Cに接続され、出力側が信号線72に接続されている。   FIG. 10 is a diagram illustrating a configuration example of a hard error detection circuit according to the third embodiment. The hard error detection circuit 51 includes a hard error detection circuit 4 and a selector 71. The hard error detection circuit 4 has an input side connected to the error notification signal lines 3 </ b> A to 3 </ b> C and an output side connected to the signal line 72.

セレクタ71は、入力側がエラー報知信号線3A〜3Cと、信号線72と、テスト制御信号線56に結線されたセレクト信号線73と、に接続され、出力側がハードエラー報知信号線7に接続されている。   The selector 71 is connected to the error notification signal lines 3 </ b> A to 3 </ b> C, the signal line 72, and the select signal line 73 connected to the test control signal line 56 on the input side, and connected to the hard error notification signal line 7 on the output side. ing.

セレクタ71へは、機能ブロック50A〜50Cから送られてくるエラー情報3a〜3cが、それぞれエラー報知信号線3A〜3Cを介して入力される。また、セレクタ71へは、ハードエラー検出回路4から送られてくるハードエラー情報Xが、信号線72を介して入力される。エラー情報3a〜3cと、ハードエラー情報Xと、がセレクタ71に対する被選択入力データである。また、セレクタ71へは、テスト回路52から送られてくるテスト制御信号内のエラー情報選択信号が、テスト制御信号線56およびセレクト信号線73を介して入力される。   Error information 3a to 3c sent from the function blocks 50A to 50C is input to the selector 71 via error notification signal lines 3A to 3C, respectively. In addition, the hardware error information X sent from the hardware error detection circuit 4 is input to the selector 71 via the signal line 72. The error information 3 a to 3 c and the hard error information X are selected input data for the selector 71. Further, an error information selection signal in the test control signal sent from the test circuit 52 is input to the selector 71 via the test control signal line 56 and the select signal line 73.

通常動作の際には、セレクト信号線73を介してセレクタ71に、信号線72を選択する指示が入力される。これにより、セレクタ71は、信号線72からのハードエラー情報Xを選択してハードエラー報知信号線7に送出する。そして、エラーカウンタ5は、実施の形態1と同様の動作を行う。   In the normal operation, an instruction to select the signal line 72 is input to the selector 71 via the select signal line 73. As a result, the selector 71 selects the hard error information X from the signal line 72 and sends it to the hard error notification signal line 7. The error counter 5 performs the same operation as in the first embodiment.

テスト動作の際には、セレクト信号線73からセレクタ71に、テスト対象となっているエラー報知信号線3A〜3C(エラー情報3a〜3c)の何れか又は複数を選択する指示が入力される。これにより、セレクタ71は、エラー情報3a〜3cの中からテスト対象となっているエラー情報を選択してハードエラー報知信号線7に送出する。このように、テスト動作の際には、テスト対象とする機能ブロックから送られてくるエラー情報が選択されてハードエラー報知信号線7に送出され、テスト対象以外の機能ブロックから送られてくるエラー情報は、ハードエラー報知信号線7に送出しない。   In the test operation, an instruction for selecting any one or a plurality of error notification signal lines 3A to 3C (error information 3a to 3c) to be tested is input from the select signal line 73 to the selector 71. As a result, the selector 71 selects the error information to be tested from the error information 3 a to 3 c and sends it to the hard error notification signal line 7. In this way, during the test operation, error information sent from the functional block to be tested is selected and sent to the hard error notification signal line 7, and errors sent from functional blocks other than the test target are sent. Information is not sent to the hardware error notification signal line 7.

エラーカウンタ5は、エラー情報の計数を行う。エラーカウンタ5は、テスト時のパラメータ入力情報に基づいて設定されるしきい値と、エラー情報の計数値と、を比較する。そして、エラーカウンタ5は、計数値がしきい値よりも大きくなった場合に、テスト対象となっている機能ブロックが永久故障であると判断する。   The error counter 5 counts error information. The error counter 5 compares the threshold value set based on the parameter input information at the time of the test with the count value of the error information. Then, the error counter 5 determines that the functional block to be tested is a permanent failure when the count value is larger than the threshold value.

図11は、実施の形態3に係るテスト回路の動作手順を示すフローチャートである。エラー検出修復装置101では、エラーカウンタ5が永久故障の発生を検出すると、エラーカウンタ5からテスト開始指示信号線58を介してテスト開始指示が送られる。これにより、テスト回路52がテスト開始指示を受信し、テスト回路52によるテストが開始される。   FIG. 11 is a flowchart showing an operation procedure of the test circuit according to the third embodiment. In the error detection / repair device 101, when the error counter 5 detects the occurrence of a permanent failure, a test start instruction is sent from the error counter 5 via the test start instruction signal line 58. Thereby, the test circuit 52 receives the test start instruction, and the test by the test circuit 52 is started.

テスト回路52は、エラーカウンタ5のパラメータをテスト用のパラメータ(テスト時のパラメータ入力情報)に設定する(ステップS81)。具体的には、テスト用のパラメータに規定されたしきい値41、時間範囲42,44、減算値43などがテスト回路52からパラメータ入力線54を介してセレクタ53に送られる。   The test circuit 52 sets the parameter of the error counter 5 to a test parameter (parameter input information at the time of test) (step S81). Specifically, a threshold value 41, time ranges 42 and 44, a subtraction value 43, and the like defined for the test parameter are sent from the test circuit 52 to the selector 53 via the parameter input line 54.

また、テスト回路52は、セレクト信号線55を介してセレクタ59に、パラメータ入力線54を選択する指示(セレクト信号)を送る。換言すると、テスト回路52は、セレクタ59がパラメータ入力線54からのテスト用パラメータを選択するよう、セレクト信号を制御する。これにより、セレクタ59は、パラメータ入力線54から送られてくるテスト時のパラメータ入力情報を選択してエラーカウンタ5に送る。   Further, the test circuit 52 sends an instruction (select signal) for selecting the parameter input line 54 to the selector 59 via the select signal line 55. In other words, the test circuit 52 controls the select signal so that the selector 59 selects the test parameter from the parameter input line 54. As a result, the selector 59 selects the parameter input information for the test sent from the parameter input line 54 and sends it to the error counter 5.

続いて、テスト回路52は、機能ブロック50A〜50Cのテストを実行する。テスト回路52は、テスト対象とする機能ブロック(以下、対象機能ブロックという)を機能ブロック50A〜50Cの中から1つ選択する(ステップS82)。テスト回路52は、対象機能ブロック(エラー情報)を選択する指示(セレクト信号)をテスト制御信号内に含めて、機能ブロック50A〜50Cおよびハードエラー検出回路51に送る。具体的には、対象機能ブロックを指定したセレクト信号が、テスト制御信号線56およびセレクト信号入力線63を介して機能ブロック50A〜50Cのセレクタ61に送られる。また、対象機能ブロックを指定したセレクト信号が、テスト制御信号線56およびセレクト信号入力線73を介してセレクタ71に送られる。これにより、対象機能ブロックがテストモードに設定される。また、ハードエラー検出回路51は、対象機能ブロックの出力をバイパスするよう設定する(ステップS83)。   Subsequently, the test circuit 52 executes tests on the functional blocks 50A to 50C. The test circuit 52 selects one functional block to be tested (hereinafter referred to as a target functional block) from the functional blocks 50A to 50C (step S82). The test circuit 52 includes an instruction (select signal) for selecting the target function block (error information) in the test control signal, and sends the instruction block to the function blocks 50A to 50C and the hardware error detection circuit 51. Specifically, a select signal designating the target function block is sent to the selectors 61 of the function blocks 50A to 50C via the test control signal line 56 and the select signal input line 63. A select signal designating the target functional block is sent to the selector 71 via the test control signal line 56 and the select signal input line 73. As a result, the target functional block is set to the test mode. Further, the hard error detection circuit 51 is set to bypass the output of the target functional block (step S83).

そして、テスト回路52は、テストデータ(ハードエラー検出パターン)を対象機能ブロックに印加する(ステップS84)。テストデータとしては、例えば縮退故障検出用の0/1が時系列に交互に印加されるパターンなどが挙げられる。   Then, the test circuit 52 applies test data (hard error detection pattern) to the target functional block (step S84). Examples of the test data include a pattern in which 0/1 for stuck-at fault detection is alternately applied in time series.

機能ブロック50A〜50Cは、セレクト信号内で自らの機能ブロックが対象機能ブロックに指定されていれば、セレクタ61によってテストデータ入力線62からのテストデータを選択する。   The function blocks 50 </ b> A to 50 </ b> C select the test data from the test data input line 62 by the selector 61 if their function block is designated as the target function block in the select signal.

これにより、対象機能ブロックでは、テストデータを用いたテストが行われる。具体的には、フリップフロップ12A〜12Cでテストデータを用いたテスト処理が行われ、フリップフロップ12A〜12Cからテスト結果が送出される。   As a result, a test using the test data is performed in the target functional block. Specifically, test processing using test data is performed in the flip-flops 12A to 12C, and test results are transmitted from the flip-flops 12A to 12C.

エラー検出回路15は、テスト結果に基づいて、訂正可能論理ブロック11内で発生したエラーを検出し、エラー情報3a〜3cとしてハードエラー検出回路51に報知する。   The error detection circuit 15 detects an error that has occurred in the correctable logic block 11 based on the test result, and notifies the hardware error detection circuit 51 of the error information 3a to 3c.

ハードエラー検出回路51は、対象機能ブロックに対応するエラー情報を選択し、ハードエラー情報Xとしてハードエラー報知信号線7に出力する。具体的には、セレクタ71が、エラー情報3a〜3c(エラー報知信号線3A〜3C)の中から対象機能ブロックに対応するエラー情報(エラー報知信号線)を選択し、ハードエラー情報Xとしてハードエラー報知信号線7に出力する。   The hard error detection circuit 51 selects error information corresponding to the target functional block and outputs the error information to the hard error notification signal line 7 as the hard error information X. Specifically, the selector 71 selects error information (error notification signal line) corresponding to the target functional block from the error information 3a to 3c (error notification signal lines 3A to 3C), and the hardware error information X is hardware. The error notification signal line 7 is output.

対象機能ブロックへのテストデータの印加完了後、テスト回路52は、対象機能ブロックおよびハードエラー検出回路51に、対象機能ブロックを通常動作(通常モード)に設定する指示を入力する。これにより、対象機能ブロックが通常動作に戻され、ハードエラー検出回路51の設定が元の状態(通常動作状態)に戻される(ステップS85)。具体的には、対象機能ブロックのセレクタ61は、再構成制御部6に接続されている信号入力線を選択し、この信号入力線からの入力信号を訂正可能論理ブロック11に送る。また、セレクタ71は、信号線72からのハードエラー情報Xを選択してハードエラー報知信号線7に送出する。   After completing the application of the test data to the target function block, the test circuit 52 inputs an instruction to set the target function block to the normal operation (normal mode) to the target function block and the hardware error detection circuit 51. As a result, the target functional block is returned to the normal operation, and the setting of the hard error detection circuit 51 is returned to the original state (normal operation state) (step S85). Specifically, the selector 61 of the target functional block selects a signal input line connected to the reconfiguration control unit 6 and sends an input signal from this signal input line to the correctable logic block 11. The selector 71 selects the hard error information X from the signal line 72 and sends it to the hard error notification signal line 7.

テスト動作の際に対象機能ブロックでエラーが発生すると、ハードエラー検出回路51からエラーカウンタ5にハードエラー情報Xが入力される。このように、対象機能ブロックからのエラー情報(エラー報知信号)は、ハードエラー情報Xとして直接エラーカウンタ5に入力されているので、エラーカウンタ5は、ハードエラー情報Xの計数を行う。エラーカウンタ5が、ハードエラー情報Xに基づいて、対象機能ブロックが永久故障であると判断すると、テスト回路52にエラー報知が行われる。   When an error occurs in the target functional block during the test operation, the hardware error information X is input from the hardware error detection circuit 51 to the error counter 5. Thus, since the error information (error notification signal) from the target functional block is directly input to the error counter 5 as the hard error information X, the error counter 5 counts the hard error information X. If the error counter 5 determines that the target functional block is a permanent failure based on the hardware error information X, an error notification is sent to the test circuit 52.

この時点で、エラーカウンタ5からは、テスト結果が出力されている。エラーカウンタ5による計数値が所定のしきい値を超えると、エラーカウンタ5からエラー報知が行われる。エラーカウンタ5からエラー報知が行われると(ステップS86、Yes)、テスト回路52は、再構成指示信号線9から再構成指示を発行する。   At this time, the test result is output from the error counter 5. When the count value by the error counter 5 exceeds a predetermined threshold value, the error counter 5 issues an error notification. When an error notification is issued from the error counter 5 (step S86, Yes), the test circuit 52 issues a reconfiguration instruction from the reconfiguration instruction signal line 9.

これにより、再構成制御部6は、対象機能ブロックを永久故障と判断して切り離し、対象機能ブロックを予備の正常なブロックに切り替える(ステップS87)。一方、エラーカウンタ5からエラー報知が行われない場合(ステップS86、No)、テスト回路52は、再構成指示を発行することなく、次の処理を行う。   Thereby, the reconfiguration control unit 6 determines that the target functional block is a permanent failure and separates it, and switches the target functional block to a spare normal block (step S87). On the other hand, when error notification is not performed from the error counter 5 (step S86, No), the test circuit 52 performs the following process without issuing a reconfiguration instruction.

この後、テスト回路52は、全数テスト(全ての機能ブロック50A〜50Cへのテスト)が完了したか否かを判断する(ステップS88)。全数テストが完了していなければ(ステップS88、No)、ステップS82の処理に戻り、未処理の機能ブロックに対してステップS82〜S88の処理を繰り返す。   Thereafter, the test circuit 52 determines whether or not all the tests (tests for all the functional blocks 50A to 50C) have been completed (step S88). If the 100% test has not been completed (No at Step S88), the process returns to Step S82, and the processes at Steps S82 to S88 are repeated for the unprocessed function block.

一方、全数テストが完了すると(ステップS88、Yes)、テスト回路52は、エラーカウンタ5のパラメータを、通常動作用のパラメータに復元する。具体的には、テスト回路52は、セレクト信号線55を介してセレクタ59に、パラメータ入力線53を選択する指示(セレクト信号)を送る。換言すると、テスト回路52は、セレクタ59がパラメータ入力線53からの通常動作用パラメータを選択するよう、セレクト信号を制御する。これにより、セレクタ59は、パラメータ入力線53から送られてくる通常動作用のパラメータ入力情報を選択し、パラメータ入力線8を介してエラーカウンタ5に送る。そして、エラーカウンタ5は、パラメータを通常動作用に復元してテスト動作を完了する(ステップS89)。   On the other hand, when the exhaustive test is completed (step S88, Yes), the test circuit 52 restores the parameter of the error counter 5 to the parameter for normal operation. Specifically, the test circuit 52 sends an instruction (select signal) for selecting the parameter input line 53 to the selector 59 via the select signal line 55. In other words, the test circuit 52 controls the select signal so that the selector 59 selects the normal operation parameter from the parameter input line 53. Accordingly, the selector 59 selects the parameter input information for normal operation sent from the parameter input line 53 and sends it to the error counter 5 via the parameter input line 8. Then, the error counter 5 restores the parameters for normal operation and completes the test operation (step S89).

また、テスト回路52は、機能ブロック50A〜50Cに、信号入力線0A〜0Cを選択する指示を送る。また、テスト回路52は、ハードエラー検出回路51に、ハードエラー検出回路4を選択する指示を送る。これにより、エラー検出修復装置101は、通常動作に戻る。これによって、再構成対象となる回路の故障状況を正確に診断した上で機能ブロック50A〜50Cの再構成を実施できる。したがって、真のハードエラーが発生している系のみを正しく切り離すことが可能となる。   Further, the test circuit 52 sends an instruction to select the signal input lines 0A to 0C to the functional blocks 50A to 50C. In addition, the test circuit 52 sends an instruction for selecting the hardware error detection circuit 4 to the hardware error detection circuit 51. As a result, the error detection / repair device 101 returns to the normal operation. Thereby, the functional blocks 50A to 50C can be reconfigured after accurately diagnosing the failure state of the circuit to be reconfigured. Therefore, it is possible to correctly disconnect only the system in which a true hard error has occurred.

この後、テスト回路52がエラーカウンタ5からテスト開始指示を受信すると、再度、ステップS81〜S89の処理が行われる。なお、再構成制御部6への再構成指示はエラーカウンタ5から送出してもよい。   Thereafter, when the test circuit 52 receives a test start instruction from the error counter 5, the processes of steps S81 to S89 are performed again. The reconfiguration instruction to the reconfiguration controller 6 may be sent from the error counter 5.

このように、実施の形態3によれば、エラー検出修復装置101にテスト回路52が設けられているので、対象機能ブロックを詳細にテストすることが可能となる。これにより、再構成対象となる回路の故障状況を正確に診断したうえで再構成を実施でき、真のハードエラーが発生している系のみを正しく切り離すことが可能となる。   As described above, according to the third embodiment, the test circuit 52 is provided in the error detection / restoration apparatus 101, so that the target functional block can be tested in detail. As a result, it is possible to perform the reconfiguration after accurately diagnosing the failure state of the circuit to be reconfigured, and it is possible to correctly disconnect only the system in which the true hard error has occurred.

以上のように、本発明に係るエラー検出修復装置は、半導体集積回路の内部に実装する機能が永久故障した場合の機能の復元に適している。   As described above, the error detection / restoration apparatus according to the present invention is suitable for restoring a function when the function mounted inside the semiconductor integrated circuit has a permanent failure.

1A〜1C,50A〜50C 機能ブロック
4,51 ハードエラー検出回路
5 エラーカウンタ
6 再構成制御部
11 訂正可能論理ブロック
14 多数決回路
15 エラー検出回路
31A〜31C ハードエラー検出部
41 しきい値
42,44 時間範囲
43 減算値
52 テスト回路
100,101 エラー検出修復装置
1A to 1C, 50A to 50C Functional block 4, 51 Hard error detection circuit 5 Error counter 6 Reconfiguration control unit 11 Correctable logic block 14 Majority circuit 15 Error detection circuit 31A to 31C Hard error detection unit 41 Threshold value 42, 44 Time range 43 Subtraction value 52 Test circuit 100, 101 Error detection and repair device

Claims (5)

エラー訂正可能な複数の論理ブロックを含む論理回路と、
前記論理ブロック内に発生したエラーを検出するエラー検出部と、
前記エラー検出部で検出されたエラーの中からハードエラーを検出すると、少なくとも1つのハードエラー情報出力するハードエラー検出部と、
前記ハードエラー検出部から出力されるハードエラー情報の数を計数するとともに、計数結果に基づいて前記論理ブロックが永久故障であるか否かを判断し、前記論理ブロックが永久故障である場合には、永久故障と判断された論理ブロックを正常な論理ブロックに切り替える切り替え指示を送出するエラー計数部と、
前記エラー計数部から前記切り替え指示が送出された場合に、永久故障と判断された論理ブロックを、正常な論理ブロックに切り替える再構成制御部と、
を具備し、
前記ハードエラー検出部は、前記エラー検出部から所定サイクル連続でエラーを検出した場合に前記ハードエラーが発生したと判定して少なくとも1つの前記ハードエラー情報を出力することを特徴とするエラー検出修復装置。
A logic circuit including a plurality of error-correctable logic blocks;
An error detection unit for detecting an error occurring in the logical block;
A hard error detection unit that outputs at least one hard error information when a hard error is detected from the errors detected by the error detection unit;
When the number of pieces of hardware error information output from the hardware error detection unit is counted, it is determined whether or not the logical block is a permanent failure based on the counting result, and when the logical block is a permanent failure An error counting unit for sending a switching instruction to switch a logical block determined to be a permanent failure to a normal logical block;
A reconfiguration control unit that switches a logical block determined to be a permanent failure to a normal logical block when the switching instruction is sent from the error counting unit;
Equipped with,
The hard error detection unit determines that the hard error has occurred when an error is detected continuously from the error detection unit for a predetermined cycle, and outputs at least one of the hard error information. apparatus.
前記エラー計数部は、前記計数結果が所定のしきい値を超えた場合に、前記論理ブロックが永久故障であると判断することを特徴とする請求項に記載のエラー検出修復装置。 The error detection and repair device according to claim 1 , wherein the error counting unit determines that the logical block is a permanent failure when the counting result exceeds a predetermined threshold value. 前記エラー計数部は、前記ハードエラー検出部から所定期間の間、前記ハードエラー情報が出力されない場合、計数している前記ハードエラー情報の数を減算することを特徴とする請求項に記載のエラー検出修復装置。 3. The error counting unit according to claim 2 , wherein the hard error information is subtracted when the hard error information is not output for a predetermined period from the hard error detection unit. Error detection and repair device. 前記エラー計数部は、前記ハードエラー情報を減算する際の減算値、前記しきい値および前記所定期間の少なくとも1つが可変設定されることを特徴とする請求項に記載のエラー検出修復装置。 4. The error detection and repair device according to claim 3 , wherein the error counting unit variably sets at least one of a subtraction value when subtracting the hard error information, the threshold value, and the predetermined period . 前記複数の論理ブロックにテスト信号を入力することによって、前記複数の論理ブロックの中から永久故障が発生した論理ブロックを特定するテスト回路をさらに具備し、
前記再構成制御部は、前記テスト回路が特定した論理ブロックを、正常な論理ブロックに切り替えることを特徴とする請求項1から4のいずれか1つに記載のエラー検出修復装置。
A test circuit for identifying a logic block in which a permanent failure has occurred from among the plurality of logic blocks by inputting a test signal to the plurality of logic blocks;
The reconfiguration control unit, error detection repairing apparatus according to the logical block in which the test circuit is identified, in any one of claims 1 4, characterized in that to switch to normal logic blocks.
JP2010267378A 2010-11-30 2010-11-30 Error detection and repair device Expired - Fee Related JP5618792B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010267378A JP5618792B2 (en) 2010-11-30 2010-11-30 Error detection and repair device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010267378A JP5618792B2 (en) 2010-11-30 2010-11-30 Error detection and repair device

Publications (2)

Publication Number Publication Date
JP2012118725A JP2012118725A (en) 2012-06-21
JP5618792B2 true JP5618792B2 (en) 2014-11-05

Family

ID=46501483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010267378A Expired - Fee Related JP5618792B2 (en) 2010-11-30 2010-11-30 Error detection and repair device

Country Status (1)

Country Link
JP (1) JP5618792B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015068207A1 (en) * 2013-11-05 2015-05-14 株式会社日立製作所 Programmable device
CN112306763B (en) * 2020-11-03 2024-04-09 中国航空工业集团公司西安航空计算技术研究所 Method and device for selecting redundant data sources
KR20230030795A (en) 2021-08-26 2023-03-07 삼성전자주식회사 Memory controller and the memory device comprising the same

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08110865A (en) * 1994-10-07 1996-04-30 Fuji Photo Film Co Ltd Self-diagnostic test method for signal processing board
JP2004133496A (en) * 2002-10-08 2004-04-30 Hitachi Ltd Computer system
JP4315016B2 (en) * 2004-02-24 2009-08-19 株式会社日立製作所 System switching method for computer system
US20070260939A1 (en) * 2006-04-21 2007-11-08 Honeywell International Inc. Error filtering in fault tolerant computing systems

Also Published As

Publication number Publication date
JP2012118725A (en) 2012-06-21

Similar Documents

Publication Publication Date Title
KR100566338B1 (en) Fault tolerant computer system, re-synchronization method thereof and computer-readable storage medium having re-synchronization program thereof recorded thereon
US4564943A (en) System path stressing
US10678634B2 (en) Method and apparatus of using parity to detect random faults in memory mapped configuration registers
US20060212753A1 (en) Control method for information processing apparatus, information processing apparatus, control program for information processing system and redundant comprisal control apparatus
CN104101831A (en) Relay failure detection system
JP5618792B2 (en) Error detection and repair device
CN110999086A (en) Fault tolerant clock monitor system
US4727548A (en) On-line, limited mode, built-in fault detection/isolation system for state machines and combinational logic
US9417282B2 (en) Method for managing the operation of a circuit with triple modular redundancy and associated device
EP2580864B1 (en) Integrated circuit device, electronic device and method for detecting timing violations within a clock
US11823759B2 (en) Testing of fault detection circuit
US8560932B2 (en) Digital system and a method for error detection thereof
Almukhaizim et al. Fault tolerant design of combinational and sequential logic based on a parity check code
US7058534B1 (en) Method and apparatus for application specific test of PLDs
CN107992018B (en) Control system
CN104216857B (en) Multiplexing switching device and its switching method
WO2017058013A1 (en) A reconfigurable hardware device for providing a reliable output signal as well as a method for providing said reliable output
CN111338993B (en) Hard disk control system
CN111175630A (en) Through silicon via detection circuit, detection method thereof and integrated circuit
JP2020064382A (en) Storage device and storage method
US20200387467A1 (en) Output determination circuit
CN110134631B (en) Self-recovery SPI bus communication interface and self-recovery method thereof
CN107422668B (en) Chip circuit, control method of chip circuit, and electronic device
Biswal et al. Timed discrete event system approach to online testing of asynchronous circuits
CN115695151A (en) Fault processing method and device and ship management system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130409

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140414

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140422

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140819

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140916

R150 Certificate of patent or registration of utility model

Ref document number: 5618792

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees