JP5618792B2 - Error detection and repair device - Google Patents
Error detection and repair device Download PDFInfo
- Publication number
- JP5618792B2 JP5618792B2 JP2010267378A JP2010267378A JP5618792B2 JP 5618792 B2 JP5618792 B2 JP 5618792B2 JP 2010267378 A JP2010267378 A JP 2010267378A JP 2010267378 A JP2010267378 A JP 2010267378A JP 5618792 B2 JP5618792 B2 JP 5618792B2
- Authority
- JP
- Japan
- Prior art keywords
- error
- error detection
- hard
- circuit
- signal line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Hardware Redundancy (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
Description
本発明は、半導体集積回路の内部に実装する機能が故障した場合に、自律的に機能を復元する回路修復装置に関する。 The present invention relates to a circuit restoration device that autonomously restores a function when a function mounted inside a semiconductor integrated circuit fails.
半導体集積回路の微細化が進むにつれて、再構成可能な半導体集積回路の高集積化が進み、半導体集積回路が大規模なシステムに利用されるようになってきている。ところが、半導体プロセスの微細化および電源の低電圧化により、これまで問題にならなかった宇宙線が原因のソフトエラーによる問題も顕著になってきている。特に、社会基盤等のシステムにおいては、故障によるシステムダウンによって発生する経済的な損失は大きい。このため、故障発生時にもシステムを停止することなく、正常な状態に復旧する手段が求められている。 As miniaturization of semiconductor integrated circuits progresses, higher integration of reconfigurable semiconductor integrated circuits progresses, and semiconductor integrated circuits are being used in large-scale systems. However, with the miniaturization of semiconductor processes and the lowering of the power supply voltage, problems due to soft errors caused by cosmic rays, which have not been a problem until now, have become more prominent. In particular, in a system such as a social infrastructure, economic loss caused by a system failure due to a failure is large. For this reason, there is a demand for means for restoring a normal state without stopping the system even when a failure occurs.
さらに、高信頼性が要求されるシステムでは、チップ内部トランジスタの故障や配線の断線などの永久故障が発生した場合であっても、その影響を回避し運用を継続できるロバスト性が必須となっている。 Furthermore, in a system that requires high reliability, even when a permanent failure such as a failure of a transistor inside the chip or a disconnection of wiring occurs, robustness is required to avoid the influence and continue operation. Yes.
ソフトエラーによる一過性の故障に対しては、TMR(Triple Module Redundancy:3重多数決回路)などの多重系や、冗長符号を用いた誤り訂正などの手法にて修復が可能となる。一方、構成回路の中に永久故障が発生した場合、一過性故障を検出する機能が損なわれ、信頼性が低下する。例えば、TMRの場合、3重構成のモジュールの1系統に永久故障が発生すると、永久故障モジュールの出力が異常となるので、他の正常な2系統にソフトエラーが発生した場合、多数決回路の出力結果が異常になる。 A transient failure due to a soft error can be repaired by a multiplexing system such as TMR (Triple Module Redundancy) or a method such as error correction using a redundant code. On the other hand, when a permanent failure occurs in the constituent circuits, the function of detecting a transient failure is impaired and the reliability is lowered. For example, in the case of TMR, if a permanent failure occurs in one system of a three-layer module, the output of the permanent failure module becomes abnormal. If a soft error occurs in the other two normal systems, the output of the majority circuit The result is abnormal.
例えば、特許文献1に記載のコンピュータシステムでは、多数決回路によって、異常(障害)を検出し、異常検出回数を異常回数カウンタによってカウントしている。そして、カウント値が予め決められたしきい値を超えると、発生した障害が恒久性障害であると判定し、そうでない場合は、一過性障害であると判定している。
For example, in the computer system described in
しかしながら、上記従来の技術では、発生した障害が恒久性障害か一過性障害かの異常判定を、異常検出回数に基づいて行っているので、正確な異常判定を行うことができないという問題があった。また、恒久障害が発生したと判定された場合に、CPUモジュールの内部バスおよび制御信号を切り離しているに過ぎず、信頼性の高い動作を確保することはできないという問題があった。 However, the above-described conventional technique has a problem in that it cannot perform an accurate abnormality determination because the abnormality determination of whether the generated failure is a permanent failure or a transient failure is performed based on the number of abnormality detections. It was. Further, when it is determined that a permanent failure has occurred, the internal bus and control signal of the CPU module are merely disconnected, and there is a problem that a highly reliable operation cannot be ensured.
本発明は、上記に鑑みてなされたものであって、システムの高い信頼性を長期間に亘って維持することが可能なエラー検出修復装置を得ることを目的とする。 The present invention has been made in view of the above, and an object of the present invention is to obtain an error detection and repair device capable of maintaining high system reliability over a long period of time.
上述した課題を解決し、目的を達成するために、本発明は、エラー訂正可能な複数の論理ブロックを含む論理回路と、前記論理ブロック内に発生したエラーを検出するエラー検出部と、前記エラー検出部で検出されたエラーの中からハードエラーを検出すると、少なくとも1つのハードエラー情報を出力するハードエラー検出部と、前記ハードエラー検出部から出力されるハードエラー情報の数を計数するとともに、計数結果に基づいて前記論理ブロックが永久故障であるか否かを判断し、前記論理ブロックが永久故障である場合には、永久故障と判断された論理ブロックを正常な論理ブロックに切り替える切り替え指示を送出するエラー計数部と、前記エラー計数部から前記切り替え指示が送出された場合に、永久故障と判断された論理ブロックを、正常な論理ブロックに切り替える再構成制御部と、を具備し、前記ハードエラー検出部は、前記エラー検出部から所定サイクル連続でエラーを検出した場合に前記ハードエラーが発生したと判定して少なくとも1つの前記ハードエラー情報を出力することを特徴とする。 In order to solve the above-described problems and achieve the object, the present invention provides a logic circuit including a plurality of error-correctable logic blocks, an error detection unit for detecting an error occurring in the logic block, and the error When a hard error is detected from the errors detected by the detection unit, a hard error detection unit that outputs at least one hard error information, and the number of hardware error information output from the hard error detection unit are counted, Based on the counting result, it is determined whether or not the logical block has a permanent failure. When the logical block has a permanent failure, a switching instruction to switch the logical block determined to be a permanent failure to a normal logical block is issued. An error counter to be transmitted, and a logic block determined to be a permanent failure when the switching instruction is transmitted from the error counter. The click, anda reconfiguration control unit to switch to normal logic blocks, determines that the hard error detection unit, the hard error occurs when an error is detected in predetermined cycles continuously from the error detection unit Then, at least one of the hard error information is output .
本発明によれば、システムの高い信頼性を長期間に亘って維持することが可能になるという効果を奏する。 According to the present invention, it is possible to maintain the high reliability of the system over a long period of time.
以下に、本発明の実施の形態に係るエラー検出修復装置を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。また、実施の形態の説明に用いる図では、フリップフロップのクロック端子への配線情報は省略している。 Hereinafter, an error detection and repair apparatus according to an embodiment of the present invention will be described in detail with reference to the drawings. Note that the present invention is not limited to the embodiments. Further, in the drawing used for description of the embodiment, the wiring information to the clock terminal of the flip-flop is omitted.
実施の形態1.
図1は、実施の形態1に係るエラー検出修復装置の構成を示す図である。エラー検出修復装置100は、エラー訂正可能な論理ブロックの何れかが故障した場合に、ソフトエラー(一過性故障)/ハードエラー(永久故障)の判別機能により、ハードエラーを検出する装置である。エラー検出修復装置100は、ハードエラーが発生した系統を他の系統から切り離し、ハードエラーした機能を正常な系統の予備回路によって復元(再構成)する。
FIG. 1 is a diagram illustrating the configuration of the error detection and repair apparatus according to the first embodiment. The error detection /
エラー検出修復装置100は、再構成制御部6と、ハードエラー検出回路(ハードエラー検出部)4と、エラーカウンタ(エラー計数部)5と、複数の機能ブロックと、を含んで構成されている。ここでは、エラー検出修復装置100が、3つの機能ブロック1A〜1Cを備えている場合について説明する。
The error detection /
機能ブロック1A〜1Cは、それぞれ後述する訂正可能論理ブロック11(エラー訂正が可能な機構を有する素子の集合)および後述するエラー検出回路15を含んで構成されている。また、機能ブロック1A〜1Cは、それぞれ信号入力線0A〜0C、通常動作で使用する通常信号線2A〜2Cおよびエラー報知信号線3A〜3Cと結線されている。
Each of the
ハードエラー検出回路4は、エラー報知信号線3A〜3Cに接続されている。また、ハードエラー検出回路4とエラーカウンタ5とは、ハードエラー報知信号線7によって接続されている。また、エラーカウンタ5と再構成制御部6とは、再構成指示信号線9によって接続されている。また、再構成制御部6と前段回路(図示せず)とは、前段信号線10によって接続されている。
The hard
再構成制御部6は、前段信号線10を介して前段回路から送られてくる種々の入力情報(入力信号)を機能ブロック1A〜1Cに入力するとともに、機能ブロック1A〜1Cの再構成を制御する。
The
前段信号線10は、前段回路から送られてくる種々の入力情報を再構成制御部6に送る信号線である。信号入力線0A〜0Cは、再構成制御部6から送られてくる入力信号を機能ブロック1A〜1Cに送る信号線である。また、通常信号線2A〜2Cは、機能ブロック1A〜1Cから送られてくる通常動作で使用する信号(通常信号)を他の機能ブロック(図示せず)や論理素子(図示せず)に送る信号線である。また、エラー報知信号線3A〜3Cは、機能ブロック1A〜1Cから送られてくるエラー情報(エラー判定情報)3a〜3c(図示せず)をハードエラー検出回路4に送る信号線である。
The
通常信号線2A〜2Cへ送出される通常信号は、他の機能ブロックや論理素子で通常のシステム動作に用いられる。機能ブロック1A〜1Cに内包されるエラー検出回路15は、論理回路内に存在するエラー訂正可能な論理ブロック(以下、訂正可能論理ブロック11という)内で発生したエラーを検出し、エラー情報3a〜3cとしてエラー報知信号線3A〜3Cを介してハードエラー検出回路4に報知する。
The normal signal sent to the
エラー報知信号線3A〜3Cの何れかにエラー情報3a〜3cが報知されると、ハードエラー検出回路4は、エラー情報3a〜3cに基づいて、エラー情報3a〜3cがソフトエラーとハードエラーの何れによるものか(故障の種別)を解析する。ハードエラー検出回路4は、エラー情報3a〜3cがハードエラー(永久故障)である場合のみ、ハードエラー報知信号線7からエラーカウンタ5にハードエラーであることを示すハードエラー情報Xを報知する。
When the error information 3a to 3c is notified to any of the error
ハードエラー検出回路4からハードエラー報知信号線7にハードエラー情報Xが発行されると、エラーカウンタ5がハードエラー情報Xの発行回数を計数する。エラーカウンタ5は、パラメータ入力線8を介して送られてくるパラメータ入力情報と、エラーカウンタ5自体の計数値(計数結果)に基づいて、機能ブロック1A〜1Cを再構成するか否かを判定する。
When the hardware error information X is issued from the hardware
エラーカウンタ5は、再構成の必要条件が満たされると、再構成情報を更新し、再構成制御部6に再構成指示(再構成情報の送信)を行う。再構成情報は、永久故障と判断された論理ブロックを正常な論理ブロックに切り替える切り替え指示を含んでいる。エラーカウンタ5は、例えば、ハードエラー数(ハードエラー情報X)が所定数に達した場合に、再構成制御部6に再構成指示を行う。
When the reconfiguration requirements are satisfied, the
再構成指示を受けた再構成制御部6は、再構成情報に基づいて、前段入力情報と出力(信号入力線0A〜0C)の接続関係、および機能ブロック1A〜1Cの内部状態を更新する。換言すると、再構成制御部6は、エラーカウンタ5から送られてくる再構成情報に基づいて、前段回路から送られてくる種々の入力情報を信号入力線0A〜0Cに分配する。
Upon receiving the reconfiguration instruction, the
これにより、再構成制御部6は、再構成情報に基づいて、故障した訂正可能論理ブロック11を使用不可に設定し、正常なブロック(系)に切り替えさせる。別言すれば、ハードエラーが所定数に達した場合にエラー箇所が正常な系から切り離され、エラー箇所と等価な機能が復元される。
As a result, the
例えば、PLD(Programmable Logic Device)の1種であるFPGA(Field-Programmable Gate Array)を用いて動作系と待機系を構築しておく。そして、機能ブロック1A〜1Cの何れかに永久障害が発生した場合には、再構成制御部6が、永久障害の発生した機能ブロックを待機系へ切り替えることにより、永久障害の発生した機能ブロックの再構成を行う。なお、機能ブロック1A〜1Cの再構成は、何れの方法によって行ってもよく、上記方法に限定されない。
For example, an operation system and a standby system are constructed using an FPGA (Field-Programmable Gate Array) which is a kind of PLD (Programmable Logic Device). When a permanent failure occurs in any one of the
このように、エラー検出修復装置100は、ハードエラーの発生数を管理し、ハードエラーの発生数に基づいて機能ブロック1A〜1Cの再構成を行う。エラー検出修復装置100は、半導体集積回路の内部に実装する機能が永久故障した場合、システムの動作を止める事なく、自律的に機能を復元する。
As described above, the error detection and
つぎに、機能ブロック1A〜1Cの構成について説明する。なお、機能ブロック1A〜1Cは、同様の構成を有しているので、ここでは機能ブロック1Aの構成について説明する。
Next, the configuration of the
図2は、実施の形態1に係る機能ブロックの構成を示す図である。図2では、機能ブロック1Aの内部構成を示している。機能ブロック1Aは、訂正可能論理ブロック11およびエラー検出回路(エラー検出部)15を含んで構成されている。
FIG. 2 is a diagram illustrating a configuration of functional blocks according to the first embodiment. FIG. 2 shows the internal configuration of the
ここでは、訂正可能論理ブロック11の例として、訂正可能論理ブロック11が、TMR(Triple Module Redundancy:3重多数決回路)構成のフリップフロップを用いて動作する場合について説明する。
Here, as an example of the
訂正可能論理ブロック11は、3系統のフリップフロップ12A〜12Cおよび多数決回路14を有している。フリップフロップ12A〜12Cへは、信号入力線0Aからの入力信号が入力される。また、フリップフロップ12A〜12Cは、それぞれ個別出力信号線13A〜13Cに接続されている。個別出力信号線13A〜13Cは、フリップフロップ12A〜12Cとエラー検出回路15とを接続するとともに、フリップフロップ12A〜12Cと多数決回路14とを接続する。
The
エラー検出回路15は、入力側の信号線として個別出力信号線13A〜13Cに接続され、出力側の信号線としてエラー報知信号線3Aに接続されている。また、多数決回路14は、入力側の信号線として個別出力信号線13A〜13Cに接続され、出力側の信号線として通常信号線2Aに接続されている。
The
フリップフロップ12A〜12Cの何れかで故障が発生し、出力値が反転した場合、多数決回路14で他の正常な2個のフリップフロップ出力が多数決により選択され、通常信号線2A(多数決回路出力)に出力される。通常信号線2Aに出力される出力信号は、通常動作にて使用される。
When a failure occurs in any of the flip-
エラー検出回路15は、訂正可能論理ブロック11内の各フリップフロップ12A〜12Cからの出力(個別出力信号線13A〜13Cに送出される個別信号)を基に、エラー検出を行う。エラー検出回路15は、個別出力信号線13A〜13Cに送出される個別信号を入力とし、個別信号の全てが一致しない場合に、エラー報知信号線3Aからエラー情報3aを報知する。
The
なお、ここでは機能ブロック1Aの構成がTMR構成のフリップフロップを有している場合について説明したが、機能ブロック1Aの構成はこの構成に限らない。例えば、機能ブロック1Aは、冗長符号を付与したECC回路によってエラー訂正を行うフリップフロップを有するものや、周辺論理回路やメモリを含む更に高機能なブロックでエラー訂正を行うものでもよい。また、これらの場合はエラー訂正方式に基づいてエラー訂正が行われた際にエラーを報知するものとする。
In addition, although the case where the structure of the
図3は、実施の形態1に係るハードエラー検出回路の構成例を示す図である。ソフトエラーが原因の故障は、エラー訂正機能や前段回路からの入力値(入力情報)によって、次の動作サイクルで正しい値に更新される。このため、本実施の形態では2サイクル連続でエラーを検出した場合にハードエラーと判定する。 FIG. 3 is a diagram illustrating a configuration example of the hard error detection circuit according to the first embodiment. A failure caused by a soft error is updated to a correct value in the next operation cycle by an error correction function or an input value (input information) from a preceding circuit. For this reason, in this embodiment, a hard error is determined when an error is detected for two consecutive cycles.
ハードエラー検出回路4は、OR回路21、フリップフロップ22,23、AND回路24を備えている。OR回路21は、エラー報知信号線3A〜3Cに接続されており、エラー報知信号線3A〜3Cからのエラー情報3a〜3cが入力される。また、OR回路21は、信号線25に接続されており、エラー情報3a〜3cの論理和を信号線25に出力する。
The hard
フリップフロップ22は、信号線25に接続されており、信号線25からフリップフロップ22へは、OR回路21からの信号(エラー情報3a〜3cの論理和)が入力される。また、フリップフロップ22は、信号線26に接続されており、信号線25からの信号を遅延させた信号を信号線26に出力する。
The flip-
AND回路24は、信号線25に接続されており、信号線25からの信号(エラー情報3a〜3cの論理和)が入力される。また、AND回路24は、信号線26に接続されており、信号線26からの信号が入力される。AND回路24は、信号線25からの信号と信号線26からの信号の論理積を算出することによって、2サイクル連続でエラーが発生した場合に、2サイクル連続でエラーであることを検出する。AND回路24は、信号線27を介してフリップフロップ23に接続されている。AND回路24は、2サイクル連続でエラーであることを検出した場合に、出力信号を信号線27に出力する。フリップフロップ23は、AND回路24からの出力信号を遅延/波形整形し、遅延/波形整形した信号を、ハードエラー報知信号線7にハードエラー情報Xとして出力する。
The AND
この構成により、ハードエラー検出回路4では、エラー報知信号線3A〜3Cの何れかを介してエラー情報3a〜3cが入力されると、AND回路24がエラー情報3a〜3cの論理和を算出する。この論理和の情報は、AND回路24から信号線25に出力され、フリップフロップ22およびAND回路24に送られる。
With this configuration, in the hard
そして、フリップフロップ22は、信号線25からの信号(エラー情報3a〜3cの論理和)を遅延させ、遅延させた信号を信号線26に出力する。AND回路24は、信号線25からの信号と信号線26からの信号の論理積を算出する。これにより、AND回路24は、2サイクル連続でエラーが発生した場合に、2サイクル連続でエラーであることを検出する。ソフトエラーの場合は、2サイクル連続でAND回路24にエラーが報知されることはないので、この場合、AND回路24でエラー情報3a〜3cがキャンセルされることとなる。フリップフロップ23は、AND回路24からの出力信号が遅延/波形整形し、ハードエラー報知信号線7にハードエラー情報Xとして出力する。
The flip-
図4は、実施の形態1に係るハードエラー検出回路の他の構成例を示す図である。なお、図4の各構成要素のうち図3に示すハードエラー検出回路4と同一機能を達成する構成要素については同一番号を付しており、重複する説明は省略する。
FIG. 4 is a diagram illustrating another configuration example of the hard error detection circuit according to the first embodiment. 4 that have the same functions as those of the hard
図3に示したハードエラー検出回路4は、エラー情報3a〜3cの論理和に対してハードエラーであるか否かを判定する構成である。一方、図4に示したハードエラー検出回路4’は、エラー情報3a〜3cのそれぞれに対してハードエラーであるか否かの判定を行い、その後に論理和(エラー判定の論理和)を取る構成である。
The hard
ハードエラー検出回路4’は、OR回路21と、機能ブロック毎のハードエラー検出回路と、を備えている。ここでのハードエラー検出回路4’は、機能ブロック1A〜1Cに対し、ハードエラー検出部31A〜31Cを備えている。
The hard
ハードエラー検出部31Aは、入力側の信号線としてエラー報知信号線3Aに接続され、出力側の信号線として信号線32Aに接続されている。また、ハードエラー検出部31Bは、入力側の信号線としてエラー報知信号線3Bに接続され、出力側の信号線として信号線32Bに接続されている。ハードエラー検出部31Cは、入力側の信号線としてエラー報知信号線3Cに接続され、出力側の信号線として信号線32Cに接続されている。OR回路21は、入力側の信号線として信号線32A〜32Cに接続され、出力側の信号線としてハードエラー報知信号線7に接続されている。
The hard
ハードエラー検出部31A〜31Cは、それぞれ図3に示したハードエラー検出回路4の構成からOR回路21を削除し、信号線25を直接エラー報知信号線3A〜3Bのうちの1つの信号線に接続した構成である。
The hard
なお、ハードエラー検出部31A〜31Cは、同様の構成を有しているので、ここではハードエラー検出部31Aの構成について説明する。ハードエラー検出部31Aは、フリップフロップ22A,23A、AND回路24Aを備えている。フリップフロップ22A,23Aは、フリップフロップ22,23と同様の機能を有し、AND回路24Aは、AND回路24と同様の機能を有している。また、信号線25A〜27Aは、信号線25〜27と同様の機能を有している。
Since the hard
エラー報知信号線3Aは、ハードエラー検出部31A内の信号線25Aに接続されている。フリップフロップ22Aは、信号線25Aに接続されており、信号線25Aからフリップフロップ22Aへは、エラー情報3aが入力される。また、フリップフロップ22Aは、信号線26Aに接続されており、信号線25Aからの信号を遅延させた信号を信号線26Aに出力する。
The error
AND回路24Aは、信号線25Aおよび信号線26Aに接続されており、信号線25Aからの信号および信号線26Aからの信号が入力される。AND回路24Aは、信号線25Aからの信号と信号線26Aからの信号の論理積を算出することによって、2サイクル連続でエラーが発生した場合に、2サイクル連続でエラーであることを検出する。AND回路24Aは、信号線27Aを介してフリップフロップ23Aに接続されている。AND回路24Aは、2サイクル連続でエラーであることを検出した場合に、出力信号を信号線27Aに出力する。フリップフロップ23Aは、AND回路24Aからの出力信号を遅延/波形整形し、遅延/波形整形した信号を、エラー情報3aとして信号線32Aに送る。
The AND
この構成により、ハードエラー検出回路4’では、エラー報知信号線3Aを介してエラー情報3aが入力されると、エラー情報3aが信号線25Aを介してフリップフロップ22AおよびAND回路24Aに送られる。
With this configuration, when the error information 3a is input to the hardware error detection circuit 4 'via the error
フリップフロップ22Aは、信号線25Aからの信号を遅延させ、遅延させた信号を信号線26Aに出力する。AND回路24Aは、信号線25Aからの信号と信号線26Aからの信号の論理積を算出する。AND回路24Aは、2サイクル連続でエラーであることを検出した場合に、出力信号を信号線27Aに出力する。フリップフロップ23Aは、AND回路24Aからの出力信号を遅延/波形整形し、エラー情報3aとして信号線32Aに出力する。このエラー情報3aは、OR回路21に入力される。
The flip-
同様に、エラー報知信号線3Bを介してハードエラー検出部31Bにエラー情報3bが入力されると、ハードエラー検出部31Bが2サイクル連続でエラーであることを検出した場合に、ハードエラー検出部31Bからエラー情報3bがOR回路21に入力される。
Similarly, when the error information 3b is input to the hard
同様に、エラー報知信号線3Cを介してハードエラー検出部31Cにエラー情報3cが入力されると、ハードエラー検出部31Cが2サイクル連続でエラーであることを検出した場合に、ハードエラー検出部31Cからエラー情報3cがOR回路21に入力される。
Similarly, when the error information 3c is input to the hard
OR回路21は、ハードエラー検出部31A〜31Cからの信号(エラー情報3a〜3c)の論理和をハードエラー報知信号線7にハードエラー情報Xとして出力する。
The OR
このように、ハードエラー検出回路4’では、エラー情報3a〜3cのそれぞれに対応するハードエラー検出部31A〜31Cの各出力をOR回路21に入力し、論理和出力をハードエラー情報Xとして出力する。
As described above, in the hard
図3に示したハードエラー検出回路4の構成により、簡易な構成でハードエラー判定を行うことが可能となる。また、図4に示したハードエラー検出回路4’の構成により、連続した動作サイクルにおいて、異なる機能ブロックでソフトエラーが発生した場合であっても、OR回路21からの論理和出力(ハードエラー報知信号線7)により、2サイクル連続でエラー報知がされることはない。このため、誤ったハードエラー判定を防止できる。したがって、ハードエラー判定の信頼性を高めることができる。
With the configuration of the hard
なお、図4に示したハードエラー検出回路4’の構成において、フリップフロップ23Aを削除し、OR回路21の出力をフリップフロップで遅延/波形整形させ、その出力をハードエラー報知信号線7からハードエラー情報Xとして出力させてもよい。
In the configuration of the hard
また、ハードエラー検出回路4やハードエラー検出回路4’において、ハードエラー検出回路内で使用するフリップフロップそのものをTMRなどのエラー訂正可能な構成にすることで、更なるハードエラー判定の信頼性向上が可能となる。ハードエラー検出回路4やハードエラー検出回路4’からハードエラー情報Xが出力されると、このハードエラー情報Xは、エラーカウンタ5に送られる。
Further, in the hard
このように、エラー検出修復装置100は、ソフトエラーによる一過性故障とハードエラーによる永久故障と、を判別し、機能ブロック内に発生したエラーの種類(ソフトエラー/ハードエラー)のうち、ハードエラーのみをエラー対象としている。そして、ハードエラーが所定数に達した場合に、再構成制御部6が、ハードエラーの発生した機能ブロックを正常なブロックに切り替えるので、永久故障が発生した系を復元することが可能となる。また、一過性故障であるソフトエラーの回路を系から切り離すことによる回路リソースのロスを防ぐことが可能となる。
As described above, the error detection /
また、永久故障のみを正常な系から切り離し、永久故障する前の状態に自律的に修復するので、システム内の各機能の高い信頼性を長期間維持することが可能となる。これにより、人工衛星、原子力発電所の制御装置等のように、長期の連続稼動が求められ且つ故障修理のための工事が困難な機器に適合する論理回路を提供することが可能となる。 In addition, since only a permanent failure is disconnected from a normal system and autonomously restored to the state before the permanent failure, it is possible to maintain high reliability of each function in the system for a long period of time. As a result, it is possible to provide a logic circuit suitable for a device that requires continuous operation for a long period of time and is difficult to perform repair work such as an artificial satellite or a control device of a nuclear power plant.
なお、本実施の形態では、機能ブロックが3つの機能ブロック1A〜1Cである場合について説明したが、機能ブロックは2つであってもよいし、4つ以上であってもよい。また、本実施の形態では2サイクル連続でエラーを検出した場合にハードエラーと判定したが、3サイクル以上の所定サイクル連続でエラーを検出した場合にハードエラーと判定してもよい。
In the present embodiment, the case where the functional blocks are the three
このように実施の形態1によれば、一過性故障と永久故障と、を判別し、永久故障の場合に、機能の復元を行うので、システムの高い信頼性を長期間に亘って維持することが可能となる。 As described above, according to the first embodiment, a transient failure and a permanent failure are discriminated, and the function is restored in the case of the permanent failure, so that the high reliability of the system is maintained for a long period of time. It becomes possible.
実施の形態2.
つぎに、図5〜図7を用いてこの発明の実施の形態2について説明する。実施の形態2では、エラーカウンタ5が種々の条件に従って、永久故障(ハードエラー)が発生したか否かを判定する。
Embodiment 2. FIG.
Next, a second embodiment of the present invention will be described with reference to FIGS. In the second embodiment, the
図5は、永久故障判定方法の第1例を説明するための図である。図6は、永久故障判定方法の第2例を説明するための図である。図7は、永久故障判定方法の第3例を説明するための図である。 FIG. 5 is a diagram for explaining a first example of a permanent failure determination method. FIG. 6 is a diagram for explaining a second example of the permanent failure determination method. FIG. 7 is a diagram for explaining a third example of the permanent failure determination method.
図5〜図7は、エラーカウンタ5によるハードエラー数のカウント例と、永久故障判定例とを示している。図5〜図7に示すグラフの横軸は、時間であり、縦軸はハードエラー数(エラーカウンタ5によるカウント値)である。
5 to 7 show a count example of the number of hard errors by the
例えば、図5のグラフは、ハードエラー情報Xが報知される都度、エラーカウンタ5がハードエラーのカウント数を単調増加(加算)させる場合のグラフである。エラーカウンタ5にハードエラー情報Xが報知されると、エラーカウンタ5は、予め決められた数を計数値に加算し、次回のハードエラー報知まで保持する。エラーカウンタ5は、計数値としきい値41とを比較し、計数値がしきい値41を超過すると、再構成情報を更新するともに、再構成制御部6に再構成指示を行う。
For example, the graph of FIG. 5 is a graph in the case where the
図6のグラフは、エラーカウンタ5が、所定時間(所定期間の間)に渡ってハードエラー情報Xを受信しなかった場合(エラー検出されなかった場合)に計数値(エラー値)を減ずる場合のグラフである。この場合、エラーカウンタ5は、所定時間内だけハードエラー情報Xを受信しなかった場合に計数値を減ずる機能を有している。例えば、時間範囲42の間にエラーカウンタ5がハードエラー情報Xを受信しなければ、エラーカウンタ5は、計数値から所定の減算値43を減ずる。
The graph of FIG. 6 shows the case where the
図7のグラフは、エラーカウンタ5が、所定時間(時間範囲44)内だけハードエラー情報Xを受信しなかった場合に計数値をゼロクリアする場合のグラフである。この場合、エラーカウンタ5は、所定時間内だけハードエラー情報Xを受信しなかった場合に計数値をゼロクリアする機能を有している。
The graph of FIG. 7 is a graph when the count value is cleared to zero when the
上述のしきい値41、時間範囲42,44および減算値43は、パラメータ入力線8を介して送られてくるパラメータ入力情報に基づいて設定され、装置外部(例えば、外付けの制御用コンピュータ)または内部から変更可能とする。
The
エラーカウンタ5の計数値が0未満にならない(アンダーフローしない)ようエラーカウンタ5を構成しておくと、図5の場合は減算値を0に、図7の場合は減算値をしきい値41と同じ値に、それぞれ設定することで、図5ないし図7の機能を自由に使い分けることが可能となる。時間範囲42,44の計測は、例えばエラーカウンタ5とは別のタイマ(図示せず)によって行なう。
If the
このように、本実施の形態では、計数値にしきい値を設定しておき、当該しきい値を超えた場合に再構成制御部6に対して再構成指示を発行する。また、所定期間を計測するタイマを設けておき、当該所定期間内にエラーが検出されなかった場合にエラー数を減算する。また、前記しきい値、タイマの計時量、減算値を可変にすることで、エラー発生回数や頻度に応じて、再構成処理の実施の有無を柔軟に制御することが可能となる。
Thus, in this embodiment, a threshold value is set for the count value, and a reconfiguration instruction is issued to the
換言すると、計数値がしきい値を超えた場合にのみ再構成指示またはテスト開始指示を出力し、所定時間の間にハードエラーが報知されなかった場合には計数値から減算を行なっている。そして、しきい値、時間範囲、および減算値をパラメータとして装置外部または内部から可変としている。これにより、ハードエラー発生頻度と装置に要求される信頼性の度合いに応じて柔軟に再構成によるエラー修復を行うことが可能となる。 In other words, a reconfiguration instruction or a test start instruction is output only when the count value exceeds the threshold value, and subtraction is performed from the count value when a hard error is not notified for a predetermined time. The threshold value, the time range, and the subtraction value are variable from outside or inside the apparatus. Thereby, it is possible to flexibly perform error repair by reconfiguration according to the frequency of occurrence of hard errors and the degree of reliability required for the apparatus.
このように実施の形態2によれば、ハードエラー情報Xが報知される都度、ハードエラーのカウント数を単調増加させているので、簡易な構成のエラーカウンタ5によって、永久故障が発生したか否かを判定することが可能となる。
As described above, according to the second embodiment, each time the hardware error information X is notified, the count number of the hardware error is monotonously increased. Therefore, whether or not a permanent failure has occurred by the
また、所定時間内だけハードエラー情報Xを受信しなかった場合に、計数値を減ずるので、永久故障が発生したか否かを正確に判定することが可能となる。また、所定時間内だけハードエラー情報Xを受信しなかった場合に、計数値をゼロクリアするので、永久故障が発生したか否かを正確に判定することが可能となる。 In addition, when the hardware error information X is not received within a predetermined time, the count value is decreased, so that it is possible to accurately determine whether or not a permanent failure has occurred. Further, when the hardware error information X is not received within a predetermined time, the count value is cleared to zero, so that it is possible to accurately determine whether or not a permanent failure has occurred.
実施の形態3.
つぎに、図8〜図11を用いてこの発明の実施の形態3について説明する。実施の形態3では、永久故障が発生した訂正可能論理ブロック11(機能ブロック1A〜1C)を特定するためのテスト回路を設けておく。そして、機能ブロック1A〜1Cの再構成を行う前にテスト回路によって、永久故障が発生した訂正可能論理ブロック11を特定する。その後、特定された訂正可能論理ブロック11に対し、再構成を行う。
Embodiment 3 FIG.
Next, a third embodiment of the present invention will be described with reference to FIGS. In the third embodiment, a test circuit for specifying the correctable logic block 11 (
図8は、実施の形態3に係るエラー検出修復装置の構成を示す図である。なお、図8の各構成要素のうち実施の形態1の図1に示すエラー検出修復装置100と同一機能を達成する構成要素については同一番号を付しており、重複する説明は省略する。
FIG. 8 is a diagram illustrating the configuration of the error detection and repair apparatus according to the third embodiment. Of the constituent elements in FIG. 8, constituent elements that achieve the same functions as those of the error detection /
エラー検出修復装置101は、エラー検出修復装置100に対し、以下の追加/変更を行って構成されている。
(1)テスト回路52を追加し、エラーカウンタ5の出力をテスト開始信号に用いるとともに、テスト回路52からテスト制御信号を出力する。
(2)再構成情報を、テスト回路52から出力する。
(3)セレクタ59を追加する。エラーカウンタ5へのパラメータ入力として、セレクタ59は、通常時のパラメータ入力情報と、テスト時のパラメータ入力情報と、の何れかを選択する。テスト時にエラーカウンタ5に入力するパラメータ入力情報とセレクタ59への選択指示(セレクト入力)は、テスト回路52によって行う。
(4)機能ブロック1A〜1Cを、機能ブロック50A〜50Cに変更する。機能ブロック50A〜50Cには、通常の入力とテストデータの入力との何れかを選択するセレクタが追加されている。
(5)ハードエラー検出回路4を、ハードエラー検出回路51に変更する。ハードエラー検出回路51には、エラー情報3a〜3cの何れかを選択しバイパスする機能が追加されている。
The error detection /
(1) A
(2) The reconfiguration information is output from the
(3) A selector 59 is added. As a parameter input to the
(4) The functional blocks 1A to 1C are changed to
(5) The hard
具体的には、機能ブロック50A〜50Cは、信号入力線0A〜0C、通常信号線2A〜2C、エラー報知信号線3A〜3Cに加えて、テスト制御信号線56に接続されている。また、ハードエラー検出回路51は、エラー報知信号線3A〜3C、ハードエラー報知信号線7に加えてテスト制御信号線56に接続されている。
Specifically, the
また、エラーカウンタ5は、ハードエラー報知信号線7、パラメータ入力線8に加えて、テスト開始指示信号線58に接続されている。また、テスト回路52は、テスト開始指示信号線58、パラメータ入力線54、セレクト信号線55、テスト制御信号線56、再構成指示信号線9に接続されている。また、セレクタ59は、パラメータ入力線54、セレクト信号線55、パラメータ入力線53、パラメータ入力線8に接続されている。
The
この構成により、エラー検出修復装置101は、通常動作(ハードエラー検出処理)の際には、テスト回路52が、機能ブロック50A〜50Cに、信号入力線0A〜0Cを選択する指示を送る。信号入力線0A〜0Cを選択する指示は、テスト制御信号線56を介し、通常動作用の制御信号として、機能ブロック50A〜50Cに送られる。これにより、機能ブロック50A〜50Cは、実施の形態1と同様の動作を行う。
With this configuration, in the normal operation (hardware error detection process), the error detection /
また、通常動作の際には、テスト回路52は、ハードエラー検出回路51に、ハードエラー検出回路4を選択する指示を送る。ハードエラー検出回路4を選択する指示は、テスト制御信号線56を介し、通常動作用の制御信号として、ハードエラー検出回路51に送られる。これにより、ハードエラー検出回路51は、実施の形態1のハードエラー検出回路4と同様の動作を行う。
Further, during normal operation, the
さらに、通常動作の際には、テスト回路52は、セレクト信号線55を介してセレクタ59に、パラメータ入力線53を選択する指示を送る。これにより、セレクタ59は、パラメータ入力線53から送られてくる通常時のパラメータ入力情報を選択してエラーカウンタ5に送る。
Further, during normal operation, the
エラーカウンタ5は、パラメータ入力情報と、ハードエラー情報Xの計数値と、に基づいて、機能ブロック50A〜50Cを再構成するか否かを判定する。エラーカウンタ5は、機能ブロック50A〜50Cを再構成する場合には、テスト回路52に、再構成することを示す情報(テスト開始信号)を送る。
The
これにより、エラー検出修復装置101は、永久故障が発生した機能ブロック50A〜50Cを特定するためのテスト動作を開始する。テスト動作の際には、テスト回路52は、テスト制御信号線56を介して機能ブロック50A〜50Cの何れか1つと、ハードエラー検出回路51と、にテスト制御信号を送る。
As a result, the error detection /
機能ブロック50A〜50Cに送られるテスト制御信号には、テストデータと、テストデータを選択する指示と、機能ブロック50A〜50Cの何れかを指定する指示(テスト対象の機能ブロックを指定する指示)と、が含まれている。これにより、機能ブロック50A〜50Cの何れか1つは、テストデータを用いたテスト動作を行う。
The test control signals sent to the
また、ハードエラー検出回路51に送られるテスト開始用のテスト制御信号には、エラー情報3a〜3cを選択する指示が含まれている。これにより、ハードエラー検出回路51は、テストデータに対応するエラー情報3a〜3cを用いたテスト動作を行う。
The test control signal for starting the test sent to the hard
また、テスト動作の際には、テスト回路52は、パラメータ入力線54を介してセレクタ59に、テスト時のパラメータ入力情報を送る。さらに、テスト回路52は、セレクト信号線55を介してセレクタ59に、パラメータ入力線54を選択する指示を送る。これにより、セレクタ59は、パラメータ入力線54から送られてくるテスト時のパラメータ入力情報を選択し、選択したパラメータ入力情報をパラメータ入力線8を介してエラーカウンタ5に送る。
In the test operation, the
テスト動作の際には、エラーカウンタ5は、パラメータ入力線8を介して送られてくるパラメータ入力情報と、エラーカウンタ5による計数値と、に基づいて、機能ブロック50A〜50Cの何れが永久故障の発生した機能ブロックであるかを判定する。
During the test operation, the
エラーカウンタ5は、永久故障の発生した機能ブロックを特定すると、この機能ブロックを特定する情報をテスト回路52に送る。これにより、テスト回路52は、永久故障の発生した機能ブロックに対して、再構成を行うよう、再構成制御部6に再構成指示を送る。再構成制御部6は、再構成情報に基づいて、永久故障が発生した訂正可能論理ブロック11を使用不可とし、正常なブロック(系)に切り替えさせる。
When the
つぎに、機能ブロック50A〜50Cの構成について説明する。なお、機能ブロック50A〜50Cは、同様の構成を有しているので、ここでは機能ブロック50Aの構成について説明する。
Next, the configuration of the
図9は、実施の形態3に係る機能ブロックの構成を示す図である。図9では、機能ブロック50Aの内部構成を示している。なお、図8の各構成要素のうち実施の形態1の図2に示す機能ブロック1Aと同一機能を達成する構成要素については同一番号を付しており、重複する説明は省略する。
FIG. 9 is a diagram illustrating a configuration of functional blocks according to the third embodiment. FIG. 9 shows the internal configuration of the
機能ブロック50Aは、訂正可能論理ブロック11、エラー検出回路15およびセレクタ61を含んで構成されている。すなわち、機能ブロック50Aは、機能ブロック1Aに、セレクタ61を追加した構成になっている。
The
セレクタ61は、信号入力線0Aと、テストデータの入力線であるテストデータ入力線62と、セレクト信号の入力線であるセレクト信号入力線63と、訂正可能論理ブロック11への信号線である信号線64と、に接続されている。テストデータ入力線62およびセレクト信号入力線63は、テスト制御信号線56に接続されている。
The
セレクタ61へは、再構成制御部6から送られてくる入力信号が、信号入力線0Aを介して入力される。また、セレクタ61へは、テスト回路52から送られてくるテスト制御信号内のテストデータが、テスト制御信号線56およびテストデータ入力線62を介して入力される。再構成制御部6からの入力信号と、テスト回路52からのテストデータと、がセレクタ61に対する被選択入力データである。また、セレクタ61へは、テスト回路52からから送られてくるテスト制御信号内のセレクト信号が、テスト制御信号線56およびセレクト信号入力線63を介して入力される。
An input signal sent from the
通常動作の際または機能ブロック50B,50Cをテストする際には、セレクト信号入力線63からセレクタ61に、信号入力線0Aを選択する指示が入力される。これにより、セレクタ61は、信号入力線0Aからの入力信号を選択して信号線64に送出する。そして、訂正可能論理ブロック11およびエラー検出回路15は、実施の形態1と同様の動作を行う。
In normal operation or when testing the
テスト動作の際には、セレクト信号入力線63からセレクタ61に、機能ブロック50Aを選択する指示と、テストデータ入力線62を選択する指示と、が入力される。これにより、セレクタ61は、テストデータ入力線62からのテストデータを選択して信号線64に送出する。そして、訂正可能論理ブロック11およびエラー検出回路15は、テストデータを用いたテスト動作を行う。
In the test operation, an instruction to select the
このように、機能ブロック50Aをテストする際にはテストデータが機能ブロック50Aの訂正可能論理ブロック11に入力され、通常動作の際または機能ブロック50B,50Cをテストする際には、信号入力線0Aからの入力信号が訂正可能論理ブロック11に入力される。
As described above, when testing the
これにより、テスト動作の際には、テスト対象とする機能ブロックでは、テストデータが選択され、テスト対象以外の機能ブロックでは、テストデータが選択されない。これにより、テスト対象とする機能ブロックの動作をテストすることが可能となる。本実施の形態では、例えば、機能ブロック50A〜50Cを順番にテスト対象に設定し、各機能ブロック50A〜50Cを順番にテストする。 As a result, during the test operation, test data is selected in the functional block to be tested, and test data is not selected in functional blocks other than the test target. Thereby, it becomes possible to test the operation of the functional block to be tested. In the present embodiment, for example, the function blocks 50A to 50C are set as test targets in order, and the function blocks 50A to 50C are tested in order.
図10は、実施の形態3に係るハードエラー検出回路の構成例を示す図である。ハードエラー検出回路51は、ハードエラー検出回路4と、セレクタ71を備えている。ハードエラー検出回路4は、入力側がエラー報知信号線3A〜3Cに接続され、出力側が信号線72に接続されている。
FIG. 10 is a diagram illustrating a configuration example of a hard error detection circuit according to the third embodiment. The hard
セレクタ71は、入力側がエラー報知信号線3A〜3Cと、信号線72と、テスト制御信号線56に結線されたセレクト信号線73と、に接続され、出力側がハードエラー報知信号線7に接続されている。
The
セレクタ71へは、機能ブロック50A〜50Cから送られてくるエラー情報3a〜3cが、それぞれエラー報知信号線3A〜3Cを介して入力される。また、セレクタ71へは、ハードエラー検出回路4から送られてくるハードエラー情報Xが、信号線72を介して入力される。エラー情報3a〜3cと、ハードエラー情報Xと、がセレクタ71に対する被選択入力データである。また、セレクタ71へは、テスト回路52から送られてくるテスト制御信号内のエラー情報選択信号が、テスト制御信号線56およびセレクト信号線73を介して入力される。
Error information 3a to 3c sent from the function blocks 50A to 50C is input to the
通常動作の際には、セレクト信号線73を介してセレクタ71に、信号線72を選択する指示が入力される。これにより、セレクタ71は、信号線72からのハードエラー情報Xを選択してハードエラー報知信号線7に送出する。そして、エラーカウンタ5は、実施の形態1と同様の動作を行う。
In the normal operation, an instruction to select the
テスト動作の際には、セレクト信号線73からセレクタ71に、テスト対象となっているエラー報知信号線3A〜3C(エラー情報3a〜3c)の何れか又は複数を選択する指示が入力される。これにより、セレクタ71は、エラー情報3a〜3cの中からテスト対象となっているエラー情報を選択してハードエラー報知信号線7に送出する。このように、テスト動作の際には、テスト対象とする機能ブロックから送られてくるエラー情報が選択されてハードエラー報知信号線7に送出され、テスト対象以外の機能ブロックから送られてくるエラー情報は、ハードエラー報知信号線7に送出しない。
In the test operation, an instruction for selecting any one or a plurality of error
エラーカウンタ5は、エラー情報の計数を行う。エラーカウンタ5は、テスト時のパラメータ入力情報に基づいて設定されるしきい値と、エラー情報の計数値と、を比較する。そして、エラーカウンタ5は、計数値がしきい値よりも大きくなった場合に、テスト対象となっている機能ブロックが永久故障であると判断する。
The
図11は、実施の形態3に係るテスト回路の動作手順を示すフローチャートである。エラー検出修復装置101では、エラーカウンタ5が永久故障の発生を検出すると、エラーカウンタ5からテスト開始指示信号線58を介してテスト開始指示が送られる。これにより、テスト回路52がテスト開始指示を受信し、テスト回路52によるテストが開始される。
FIG. 11 is a flowchart showing an operation procedure of the test circuit according to the third embodiment. In the error detection /
テスト回路52は、エラーカウンタ5のパラメータをテスト用のパラメータ(テスト時のパラメータ入力情報)に設定する(ステップS81)。具体的には、テスト用のパラメータに規定されたしきい値41、時間範囲42,44、減算値43などがテスト回路52からパラメータ入力線54を介してセレクタ53に送られる。
The
また、テスト回路52は、セレクト信号線55を介してセレクタ59に、パラメータ入力線54を選択する指示(セレクト信号)を送る。換言すると、テスト回路52は、セレクタ59がパラメータ入力線54からのテスト用パラメータを選択するよう、セレクト信号を制御する。これにより、セレクタ59は、パラメータ入力線54から送られてくるテスト時のパラメータ入力情報を選択してエラーカウンタ5に送る。
Further, the
続いて、テスト回路52は、機能ブロック50A〜50Cのテストを実行する。テスト回路52は、テスト対象とする機能ブロック(以下、対象機能ブロックという)を機能ブロック50A〜50Cの中から1つ選択する(ステップS82)。テスト回路52は、対象機能ブロック(エラー情報)を選択する指示(セレクト信号)をテスト制御信号内に含めて、機能ブロック50A〜50Cおよびハードエラー検出回路51に送る。具体的には、対象機能ブロックを指定したセレクト信号が、テスト制御信号線56およびセレクト信号入力線63を介して機能ブロック50A〜50Cのセレクタ61に送られる。また、対象機能ブロックを指定したセレクト信号が、テスト制御信号線56およびセレクト信号入力線73を介してセレクタ71に送られる。これにより、対象機能ブロックがテストモードに設定される。また、ハードエラー検出回路51は、対象機能ブロックの出力をバイパスするよう設定する(ステップS83)。
Subsequently, the
そして、テスト回路52は、テストデータ(ハードエラー検出パターン)を対象機能ブロックに印加する(ステップS84)。テストデータとしては、例えば縮退故障検出用の0/1が時系列に交互に印加されるパターンなどが挙げられる。
Then, the
機能ブロック50A〜50Cは、セレクト信号内で自らの機能ブロックが対象機能ブロックに指定されていれば、セレクタ61によってテストデータ入力線62からのテストデータを選択する。
The function blocks 50 </ b> A to 50 </ b> C select the test data from the test
これにより、対象機能ブロックでは、テストデータを用いたテストが行われる。具体的には、フリップフロップ12A〜12Cでテストデータを用いたテスト処理が行われ、フリップフロップ12A〜12Cからテスト結果が送出される。
As a result, a test using the test data is performed in the target functional block. Specifically, test processing using test data is performed in the flip-
エラー検出回路15は、テスト結果に基づいて、訂正可能論理ブロック11内で発生したエラーを検出し、エラー情報3a〜3cとしてハードエラー検出回路51に報知する。
The
ハードエラー検出回路51は、対象機能ブロックに対応するエラー情報を選択し、ハードエラー情報Xとしてハードエラー報知信号線7に出力する。具体的には、セレクタ71が、エラー情報3a〜3c(エラー報知信号線3A〜3C)の中から対象機能ブロックに対応するエラー情報(エラー報知信号線)を選択し、ハードエラー情報Xとしてハードエラー報知信号線7に出力する。
The hard
対象機能ブロックへのテストデータの印加完了後、テスト回路52は、対象機能ブロックおよびハードエラー検出回路51に、対象機能ブロックを通常動作(通常モード)に設定する指示を入力する。これにより、対象機能ブロックが通常動作に戻され、ハードエラー検出回路51の設定が元の状態(通常動作状態)に戻される(ステップS85)。具体的には、対象機能ブロックのセレクタ61は、再構成制御部6に接続されている信号入力線を選択し、この信号入力線からの入力信号を訂正可能論理ブロック11に送る。また、セレクタ71は、信号線72からのハードエラー情報Xを選択してハードエラー報知信号線7に送出する。
After completing the application of the test data to the target function block, the
テスト動作の際に対象機能ブロックでエラーが発生すると、ハードエラー検出回路51からエラーカウンタ5にハードエラー情報Xが入力される。このように、対象機能ブロックからのエラー情報(エラー報知信号)は、ハードエラー情報Xとして直接エラーカウンタ5に入力されているので、エラーカウンタ5は、ハードエラー情報Xの計数を行う。エラーカウンタ5が、ハードエラー情報Xに基づいて、対象機能ブロックが永久故障であると判断すると、テスト回路52にエラー報知が行われる。
When an error occurs in the target functional block during the test operation, the hardware error information X is input from the hardware
この時点で、エラーカウンタ5からは、テスト結果が出力されている。エラーカウンタ5による計数値が所定のしきい値を超えると、エラーカウンタ5からエラー報知が行われる。エラーカウンタ5からエラー報知が行われると(ステップS86、Yes)、テスト回路52は、再構成指示信号線9から再構成指示を発行する。
At this time, the test result is output from the
これにより、再構成制御部6は、対象機能ブロックを永久故障と判断して切り離し、対象機能ブロックを予備の正常なブロックに切り替える(ステップS87)。一方、エラーカウンタ5からエラー報知が行われない場合(ステップS86、No)、テスト回路52は、再構成指示を発行することなく、次の処理を行う。
Thereby, the
この後、テスト回路52は、全数テスト(全ての機能ブロック50A〜50Cへのテスト)が完了したか否かを判断する(ステップS88)。全数テストが完了していなければ(ステップS88、No)、ステップS82の処理に戻り、未処理の機能ブロックに対してステップS82〜S88の処理を繰り返す。
Thereafter, the
一方、全数テストが完了すると(ステップS88、Yes)、テスト回路52は、エラーカウンタ5のパラメータを、通常動作用のパラメータに復元する。具体的には、テスト回路52は、セレクト信号線55を介してセレクタ59に、パラメータ入力線53を選択する指示(セレクト信号)を送る。換言すると、テスト回路52は、セレクタ59がパラメータ入力線53からの通常動作用パラメータを選択するよう、セレクト信号を制御する。これにより、セレクタ59は、パラメータ入力線53から送られてくる通常動作用のパラメータ入力情報を選択し、パラメータ入力線8を介してエラーカウンタ5に送る。そして、エラーカウンタ5は、パラメータを通常動作用に復元してテスト動作を完了する(ステップS89)。
On the other hand, when the exhaustive test is completed (step S88, Yes), the
また、テスト回路52は、機能ブロック50A〜50Cに、信号入力線0A〜0Cを選択する指示を送る。また、テスト回路52は、ハードエラー検出回路51に、ハードエラー検出回路4を選択する指示を送る。これにより、エラー検出修復装置101は、通常動作に戻る。これによって、再構成対象となる回路の故障状況を正確に診断した上で機能ブロック50A〜50Cの再構成を実施できる。したがって、真のハードエラーが発生している系のみを正しく切り離すことが可能となる。
Further, the
この後、テスト回路52がエラーカウンタ5からテスト開始指示を受信すると、再度、ステップS81〜S89の処理が行われる。なお、再構成制御部6への再構成指示はエラーカウンタ5から送出してもよい。
Thereafter, when the
このように、実施の形態3によれば、エラー検出修復装置101にテスト回路52が設けられているので、対象機能ブロックを詳細にテストすることが可能となる。これにより、再構成対象となる回路の故障状況を正確に診断したうえで再構成を実施でき、真のハードエラーが発生している系のみを正しく切り離すことが可能となる。
As described above, according to the third embodiment, the
以上のように、本発明に係るエラー検出修復装置は、半導体集積回路の内部に実装する機能が永久故障した場合の機能の復元に適している。 As described above, the error detection / restoration apparatus according to the present invention is suitable for restoring a function when the function mounted inside the semiconductor integrated circuit has a permanent failure.
1A〜1C,50A〜50C 機能ブロック
4,51 ハードエラー検出回路
5 エラーカウンタ
6 再構成制御部
11 訂正可能論理ブロック
14 多数決回路
15 エラー検出回路
31A〜31C ハードエラー検出部
41 しきい値
42,44 時間範囲
43 減算値
52 テスト回路
100,101 エラー検出修復装置
1A to 1C, 50A to 50C
Claims (5)
前記論理ブロック内に発生したエラーを検出するエラー検出部と、
前記エラー検出部で検出されたエラーの中からハードエラーを検出すると、少なくとも1つのハードエラー情報を出力するハードエラー検出部と、
前記ハードエラー検出部から出力されるハードエラー情報の数を計数するとともに、計数結果に基づいて前記論理ブロックが永久故障であるか否かを判断し、前記論理ブロックが永久故障である場合には、永久故障と判断された論理ブロックを正常な論理ブロックに切り替える切り替え指示を送出するエラー計数部と、
前記エラー計数部から前記切り替え指示が送出された場合に、永久故障と判断された論理ブロックを、正常な論理ブロックに切り替える再構成制御部と、
を具備し、
前記ハードエラー検出部は、前記エラー検出部から所定サイクル連続でエラーを検出した場合に前記ハードエラーが発生したと判定して少なくとも1つの前記ハードエラー情報を出力することを特徴とするエラー検出修復装置。 A logic circuit including a plurality of error-correctable logic blocks;
An error detection unit for detecting an error occurring in the logical block;
A hard error detection unit that outputs at least one hard error information when a hard error is detected from the errors detected by the error detection unit;
When the number of pieces of hardware error information output from the hardware error detection unit is counted, it is determined whether or not the logical block is a permanent failure based on the counting result, and when the logical block is a permanent failure An error counting unit for sending a switching instruction to switch a logical block determined to be a permanent failure to a normal logical block;
A reconfiguration control unit that switches a logical block determined to be a permanent failure to a normal logical block when the switching instruction is sent from the error counting unit;
Equipped with,
The hard error detection unit determines that the hard error has occurred when an error is detected continuously from the error detection unit for a predetermined cycle, and outputs at least one of the hard error information. apparatus.
前記再構成制御部は、前記テスト回路が特定した論理ブロックを、正常な論理ブロックに切り替えることを特徴とする請求項1から4のいずれか1つに記載のエラー検出修復装置。 A test circuit for identifying a logic block in which a permanent failure has occurred from among the plurality of logic blocks by inputting a test signal to the plurality of logic blocks;
The reconfiguration control unit, error detection repairing apparatus according to the logical block in which the test circuit is identified, in any one of claims 1 4, characterized in that to switch to normal logic blocks.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010267378A JP5618792B2 (en) | 2010-11-30 | 2010-11-30 | Error detection and repair device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010267378A JP5618792B2 (en) | 2010-11-30 | 2010-11-30 | Error detection and repair device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012118725A JP2012118725A (en) | 2012-06-21 |
JP5618792B2 true JP5618792B2 (en) | 2014-11-05 |
Family
ID=46501483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010267378A Expired - Fee Related JP5618792B2 (en) | 2010-11-30 | 2010-11-30 | Error detection and repair device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5618792B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015068207A1 (en) * | 2013-11-05 | 2015-05-14 | 株式会社日立製作所 | Programmable device |
CN112306763B (en) * | 2020-11-03 | 2024-04-09 | 中国航空工业集团公司西安航空计算技术研究所 | Method and device for selecting redundant data sources |
KR20230030795A (en) | 2021-08-26 | 2023-03-07 | 삼성전자주식회사 | Memory controller and the memory device comprising the same |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08110865A (en) * | 1994-10-07 | 1996-04-30 | Fuji Photo Film Co Ltd | Self-diagnostic test method for signal processing board |
JP2004133496A (en) * | 2002-10-08 | 2004-04-30 | Hitachi Ltd | Computer system |
JP4315016B2 (en) * | 2004-02-24 | 2009-08-19 | 株式会社日立製作所 | System switching method for computer system |
US20070260939A1 (en) * | 2006-04-21 | 2007-11-08 | Honeywell International Inc. | Error filtering in fault tolerant computing systems |
-
2010
- 2010-11-30 JP JP2010267378A patent/JP5618792B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012118725A (en) | 2012-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100566338B1 (en) | Fault tolerant computer system, re-synchronization method thereof and computer-readable storage medium having re-synchronization program thereof recorded thereon | |
US4564943A (en) | System path stressing | |
US10678634B2 (en) | Method and apparatus of using parity to detect random faults in memory mapped configuration registers | |
US20060212753A1 (en) | Control method for information processing apparatus, information processing apparatus, control program for information processing system and redundant comprisal control apparatus | |
CN104101831A (en) | Relay failure detection system | |
JP5618792B2 (en) | Error detection and repair device | |
CN110999086A (en) | Fault tolerant clock monitor system | |
US4727548A (en) | On-line, limited mode, built-in fault detection/isolation system for state machines and combinational logic | |
US9417282B2 (en) | Method for managing the operation of a circuit with triple modular redundancy and associated device | |
EP2580864B1 (en) | Integrated circuit device, electronic device and method for detecting timing violations within a clock | |
US11823759B2 (en) | Testing of fault detection circuit | |
US8560932B2 (en) | Digital system and a method for error detection thereof | |
Almukhaizim et al. | Fault tolerant design of combinational and sequential logic based on a parity check code | |
US7058534B1 (en) | Method and apparatus for application specific test of PLDs | |
CN107992018B (en) | Control system | |
CN104216857B (en) | Multiplexing switching device and its switching method | |
WO2017058013A1 (en) | A reconfigurable hardware device for providing a reliable output signal as well as a method for providing said reliable output | |
CN111338993B (en) | Hard disk control system | |
CN111175630A (en) | Through silicon via detection circuit, detection method thereof and integrated circuit | |
JP2020064382A (en) | Storage device and storage method | |
US20200387467A1 (en) | Output determination circuit | |
CN110134631B (en) | Self-recovery SPI bus communication interface and self-recovery method thereof | |
CN107422668B (en) | Chip circuit, control method of chip circuit, and electronic device | |
Biswal et al. | Timed discrete event system approach to online testing of asynchronous circuits | |
CN115695151A (en) | Fault processing method and device and ship management system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130409 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140414 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140422 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140819 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140916 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5618792 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |