JP2009506406A - Computer system control apparatus and control method - Google Patents

Computer system control apparatus and control method Download PDF

Info

Publication number
JP2009506406A
JP2009506406A JP2008525512A JP2008525512A JP2009506406A JP 2009506406 A JP2009506406 A JP 2009506406A JP 2008525512 A JP2008525512 A JP 2008525512A JP 2008525512 A JP2008525512 A JP 2008525512A JP 2009506406 A JP2009506406 A JP 2009506406A
Authority
JP
Japan
Prior art keywords
functional unit
computer system
error
defective
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008525512A
Other languages
Japanese (ja)
Inventor
ヴァイベルレ ラインハルト
ミュラー ベルント
ベール エーバーハルト
コラーニ ヨーク
グメーリヒ ライナー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Publication of JP2009506406A publication Critical patent/JP2009506406A/en
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/006Identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/18Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1629Error detection by comparing the output of redundant processing systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/845Systems in which the redundancy can be transformed in increased performance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Control By Computers (AREA)
  • Multi Processors (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本発明は、少なくとも2つの同じまたは同種の機能ユニットを備えたコンピュータシステムの制御方法および制御装置に関する。本発明によれば、まえもって設定可能な条件に依存して機能ユニットのアクティブ化および/または非アクティブ化が行われる。  The present invention relates to a control method and a control apparatus for a computer system including at least two same or similar functional units. According to the present invention, the functional unit is activated and / or deactivated depending on conditions that can be set in advance.

Description

従来技術
マイクロコントローラ(μc)またはASICのような複雑な半導体素子の製造は誤りが起こりやすい。また、構造サイズが絶えず小さくなっていくなかでドーピングは統計的なプロセスであることから、長期にわたり製造におけるエラーは不可避である。しかも、誤りの起こりやすさは多くの努力や進歩にかかわらず将来、高まることがはっきりしている。歩留まりすなわち適正に動作する素子と製造された素子の個数の比は、習熟した製造プロセスについてはおおよそ90%(すなわちこの場合にもすでに10%は欠陥品)であるが、さらに著しく低い値を生じさせることが十分に可能である。歩留まりを上昇させるメカニズムは、つまりはダイレクトにコストを低減させるものである。さらにテストや製造に対する考察から、フィールドにおいて欠陥素子を扱えるようにする要求が高まっている。
Prior Art The manufacture of complex semiconductor devices such as microcontrollers (μc) or ASICs is prone to errors. In addition, since doping is a statistical process as the structure size continues to decrease, manufacturing errors are unavoidable over a long period of time. Moreover, it is clear that the likelihood of errors will increase in the future, regardless of much effort and progress. The yield, or the ratio between the number of properly working elements and the number of manufactured elements, is approximately 90% for a well-manufactured manufacturing process (i.e., already 10% is defective in this case), but still yields significantly lower values. It is sufficiently possible to make it. The mechanism that increases the yield, that is, directly reduces the cost. In addition, due to considerations for testing and manufacturing, there is an increasing demand for handling defective elements in the field.

フラッシュメモリ、RAMまたはROMといったメモリ素子の製造において動作中に誤りを許容できるようにする目的で、今日すでに一部では採用されている手段はエラー訂正コードerror correcting codes (ECC) の利用である。この手段によれば、データビットの格納のほか検査ビットもいっしょに格納される。検査ビットは、1つのビット(あるいは既知の最大数のビット)のみに誤りが生じた場合、エラーを補助ロジックにより検出し訂正できるように構成されている。これにより、エラーが存在していてもコンポーネント全体(あるいは1つのコンポーネントのうち対応する部分コンポーネント)が適正な結果を出すようになる。検査ビットをいっしょに格納するということでかなり余分に煩雑になってしまう一方、必要とされる補助ロジックによっても実質的には大きな余分なコストが生じるわけではない。   In order to be able to tolerate errors during operation in the manufacture of memory devices such as flash memory, RAM or ROM, the means already employed in part today is the use of error correcting codes (ECC). According to this means, not only data bits but also check bits are stored together. The check bits are configured such that if an error occurs in only one bit (or the known maximum number of bits), the error can be detected and corrected by auxiliary logic. As a result, even if an error exists, the entire component (or a corresponding partial component of one component) can give an appropriate result. While storing the check bits together is considerably more cumbersome, the auxiliary logic required does not incur a substantial extra cost.

たとえばコンピュータシステム内の半導体回路におけるエラーは、この回路の動作中にも発生する可能性がある。たいていのケースでは、高いケイパビリティをシステマティックな形態で持続的なエラーの場合にも保証することはできない。僅かな例外のひとつはメモリのためのECCメカニズムである。プロセッサたとえばCPUにおける過渡的なエラーについては、リカバリまたはリセットの措置が知られている。しかしながら実行ユニットにおけるエラーについて、持続的なエラーを許容するための現実的かつ低コストなコンセプトは知られていない。   For example, errors in a semiconductor circuit in a computer system can also occur during operation of this circuit. In most cases, high capabilities cannot be guaranteed in the case of persistent errors in a systematic form. One minor exception is the ECC mechanism for memory. For transient errors in a processor, such as a CPU, recovery or reset measures are known. However, there is no known practical and low-cost concept for tolerating persistent errors for errors in execution units.

本発明の1つめの課題は、μCまたは半導体素子の製造プロセスにおいてエラーのある機能ユニットについても利用できるようにすることによって歩留まりを改善することにある。本発明の2つめの課題は、動作中のコンポーネントのケイパビリティを高めることである。このために、コンポーネント内において欠陥のある実行ユニット(たとえばコア、ALU、プロセッサ)を識別することができ、このコンポーネントを使用するシステムの稼働中、「グレースフル・デグラデーション graceful degradation」または緊急動作を行わせることのできる手段を提供するようにしたい。   The first object of the present invention is to improve the yield by making it possible to use functional units having errors in the manufacturing process of μC or semiconductor devices. The second problem of the present invention is to increase the capability of the component in operation. For this purpose, faulty execution units (eg cores, ALUs, processors) within a component can be identified, and “graceful degradation” or emergency action can be performed while a system using this component is in operation. We want to provide a means that can be done.

発明の利点
ここでは、少なくとも2つの同じまたは同種の機能ユニットを含む半導体回路たとえばマイクロコンピュータについて考察する。製造プロセスの終了時点、組み立て時、診断時または動作中のテストフェーズにおいて、テストプログラムを用いて場合によっては欠陥のある機能ユニットが識別される。有利にはこれを切替機能および比較機能によって行うことができ、たとえば図示するように切替および比較ユニットにおいて行うことができる。このユニットは機能ユニットの出力信号を、少なくとも1つの別の機能ユニットの出力信号および/または別の基準値と比較する。どの機能ユニットが欠陥を伴うかは記憶素子に格納される。これらの機能ユニットは、たとえば機能および比較ユニットまたは切断装置によって非アクティブ状態にされる。ただしこの素子は、欠陥のある機能ユニットに含まれていようと利用可能であり機能するものである。
Advantages of the Invention Here we consider a semiconductor circuit, for example a microcomputer, comprising at least two identical or similar functional units. At the end of the manufacturing process, at the time of assembly, at the time of diagnosis or during the test phase during operation, the test program is used to identify possibly defective functional units. This can advantageously be done by means of a switching function and a comparison function, for example in a switching and comparison unit as shown. This unit compares the output signal of the functional unit with the output signal of at least one other functional unit and / or another reference value. Which functional unit is defective is stored in the storage element. These functional units are deactivated, for example by a functional and comparison unit or a cutting device. However, this element can be used and functions whether it is included in a defective functional unit.

有利には本発明は、少なくとも2つの同じまたは同種の機能ユニットを備えたコンピュータシステムの制御方法および制御装置に関する。本発明によれば、まえもって設定可能な条件に依存して機能ユニットのアクティブ化および/または非アクティブ化が行われる。   The present invention advantageously relates to a control method and a control device for a computer system comprising at least two identical or similar functional units. According to the present invention, the functional unit is activated and / or deactivated depending on conditions that can be set in advance.

有利には本発明による方法によれば、機能ユニットのアクティブ化および/または非アクティブ化は、コンピュータシステムにおけるエラーを検出するための少なくとも1つの第1のステップおよび/または欠陥機能ユニットを識別するための少なくとも1つの第2のステップの結果に依存して行われる。   Advantageously, according to the method according to the invention, the activation and / or deactivation of the functional unit is for identifying at least one first step and / or defective functional unit for detecting errors in the computer system. Depending on the result of at least one second step.

有利には本発明による方法によれば、コンピュータシステムには少なくとも2つの同じまたは同種の機能ユニットが含まれており、このコンピュータシステムにおける少なくとも2つの同じまたは同種のユニットにおける少なくとも2つの動作モード間で切り替えが行われ、第1の動作モードは比較モードに対応し、第2の動作モードはパフォーマンスモードに対応する。   Advantageously according to the method according to the invention, the computer system comprises at least two identical or similar functional units, between at least two operating modes in at least two identical or similar units in the computer system. Switching is performed, the first operation mode corresponds to the comparison mode, and the second operation mode corresponds to the performance mode.

有利には本発明による方法によれば、比較モード中、比較すべき機能ユニットの出力信号におけるエラーが検出され、この比較モードは、コンピュータシステムにおけるエラーを検出するための第1のステップに対応する。   Advantageously, according to the method according to the invention, an error in the output signal of the functional unit to be compared is detected during the comparison mode, this comparison mode corresponding to a first step for detecting an error in the computer system. .

有利には本発明による方法によれば、コンピュータシステムの選択された機能ユニットが動作モードに切り替えられ、この動作モード中、欠陥のある機能ユニットの識別が、この機能ユニットの出力信号と基準値との比較により可能であり、上述の動作モードは、コンピュータシステムにおける欠陥のある機能ユニットを識別するための第2のステップに対応する。   Advantageously, according to the method according to the invention, the selected functional unit of the computer system is switched to an operating mode, during which the identification of the defective functional unit is performed with the output signal of the functional unit and the reference value. This mode of operation corresponds to a second step for identifying defective functional units in a computer system.

有利には本発明による方法によれば、基準値はコンピュータシステムの記憶装置に格納されており、動作モードへの切替時にエラー検出のため該記憶装置から読み出される。   Advantageously, according to the method according to the invention, the reference value is stored in a storage device of the computer system and is read from the storage device for error detection when switching to the operating mode.

有利には本発明による方法によれば、少なくとも2つの動作モード間の切り替えはコンピュータシステムの動作中、周期的にまたは要求に応じて行われる。   Advantageously, according to the method according to the invention, switching between at least two operating modes takes place periodically or on demand during operation of the computer system.

有利には本発明による方法によれば、少なくとも2つの動作モード間の切り替えは、エラー検出のためおよび/または欠陥のある機能ユニットの識別のために行われる。   Advantageously, according to the method according to the invention, switching between at least two operating modes is performed for error detection and / or for identification of defective functional units.

有利には本発明による方法によれば、少なくとも欠陥があると識別されたコンピュータシステムの機能ユニットに対し、コンフィギュレーションステータスおよび/またはエラーステータスが形成される。   Advantageously, according to the method according to the invention, a configuration status and / or an error status is generated at least for the functional units of the computer system identified as defective.

有利には本発明による方法によれば、機能ユニットの非アクティブ化は、この機能ユニットのコンフィギュレーションステータスまたはエラーステータスに関する情報を記憶装置に格納することにより行われ、その際、この情報は半導体システムの初期化時および/または動作中に読み出し可能であり、格納されている情報が処理されて、非アクティブであると表されたユニットの使用が動作中不可能にされる。   Advantageously, according to the method according to the invention, the deactivation of a functional unit is effected by storing information on the configuration status or error status of this functional unit in a storage device, this information being stored in the semiconductor system Can be read at initialization and / or during operation, and the stored information is processed to disable the use of units that are marked inactive.

有利には本発明による方法によれば、コンピュータシステムのアクティブ化可能および/または非アクティブ化可能なすべての機能ユニットに対し、コンフィギュレーションステータスおよび/またはエラーステータスが形成される。   Advantageously, according to the method according to the invention, a configuration status and / or an error status is generated for all functional units that can be activated and / or deactivated in a computer system.

有利には本発明による方法によれば、アクティブ化可能および/または非アクティブ化可能な機能ユニットのコンフィギュレーションステータスおよび/またはエラーステータスに関する情報は記憶装置に格納される。有利には本発明による方法によれば、コンピュータシステムには少なくとも2つの同じまたは同種の機能ユニットが含まれており、このコンピュータシステムにおける同じまたは同種の機能ユニットのうち少なくとも1つは標準に準拠して非アクティブ状態にある。   Advantageously, according to the method according to the invention, information on the configuration status and / or error status of the functional units that can be activated and / or deactivated is stored in a storage device. Advantageously, according to the method according to the invention, the computer system includes at least two identical or similar functional units, at least one of the identical or similar functional units in the computer system complying with the standard. Is inactive.

有利には本発明による方法によれば、非アクティブ状態にされた機能ユニットのコンフィギュレーションステータスに関する少なくとも1つの情報は記憶装置に格納されている。有利には本発明による方法によれば、欠陥のある機能ユニットの識別時または識別後、少なくとも欠陥があると識別された機能ユニットを非アクティブ状態にすることによって、コンピュータシステムの再コンフィギュレーションが行われる。   Advantageously, according to the method according to the invention, at least one piece of information relating to the configuration status of the deactivated functional unit is stored in the storage device. Advantageously, according to the method according to the invention, during or after the identification of a defective functional unit, the computer system is reconfigured by deactivating at least the functional unit identified as defective. Is called.

有利には本発明による方法によれば、エラーに基づき機能ユニットが非アクティブ状態にされたとき、この機能ユニットのコンフィギュレーションステータスおよび/またはエラーステータスに関する情報が記憶装置に書き込まれる。   Advantageously, according to the method according to the invention, when a functional unit is deactivated on the basis of an error, information relating to the configuration status and / or error status of this functional unit is written to the storage device.

有利には本発明による方法によれば、欠陥のある機能ユニットの識別時または識別後、コンピュータシステムの再コンフィギュレーションが行われ、欠陥があると識別された機能ユニットが非アクティブ状態にされ、その際、標準に準拠して非アクティブ状態にされたが欠陥を伴わない機能ユニットがアクティブ状態にされる。   Advantageously, according to the method according to the invention, upon or after the identification of a defective functional unit, the computer system is reconfigured so that the functional unit identified as defective is deactivated, In this case, the functional unit which has been deactivated according to the standard but without any defects is activated.

有利には本発明による方法によれば、エラーを検出するための第1のステップは、比較モード中のコンピュータシステムにおける少なくとも2つの同じまたは同種の機能ユニットの規定どおりの動作に対応する。   Advantageously, according to the method according to the invention, the first step for detecting an error corresponds to the prescribed operation of at least two identical or similar functional units in the computer system in the comparison mode.

有利には本発明による方法によれば、欠陥のある機能ユニットを識別するための第2のステップは、少なくとも1つの機能ユニットにおけるエラー検出ルーチンの処理およびこのエラー検出ルーチンの結果と基準値との比較の処理に対応する。   Advantageously, according to the method according to the invention, the second step for identifying defective functional units is the processing of the error detection routine in at least one functional unit and the result of this error detection routine and the reference value. Corresponds to the comparison process.

有利には本発明による方法によれば、欠陥のある機能ユニットを識別するための上述のステップの実行前または実行にあたり、コンピュータシステムの再コンフィギュレーションが行われ、この再コンフィギュレーションによって、種々の機能、命令、プログラムセグメントまたはプログラムが同じまたは同種の機能ユニットにおいて実行可能となる。   Advantageously, according to the method according to the invention, the computer system is reconfigured before or during the execution of the above-mentioned steps for identifying defective functional units, and this reconfiguration leads to various functions. , Instructions, program segments or programs can be executed in the same or similar functional units.

有利には本発明による方法によれば、上述のエラー検出ルーチンの基準値はこのエラー検出ルーチンといっしょに記憶装置に格納されている。   Advantageously, according to the method according to the invention, the reference value of the error detection routine described above is stored in the storage device together with this error detection routine.

有利には本発明による方法によれば、欠陥のある機能ユニットの識別時または識別後、このコンピュータシステムの再コンフィギュレーションが行われ、その際、少なくとも欠陥があると識別された機能ユニットが非アクティブ状態にされる。   Advantageously, according to the method according to the invention, the computer system is reconfigured during or after the identification of the defective functional unit, with at least the functional unit identified as defective being inactive. Put into a state.

有利には本発明による方法によれば、エラーに基づき機能ユニットが非アクティブ状態にされたとき、この機能ユニットのコンフィギュレーションステータスおよびエラーステータスが記憶装置に書き込まれる。有利には本発明による方法によれば、上述のコンピュータシステムの再コンフィギュレーション前に第1の動作モードにおいて処理するために定められている機能、命令、プログラムセグメントまたはプログラムの少なくとも一部分は、コンピュータシステムの再コンフィギュレーション後、第2の動作モードにおいて処理される。   Advantageously, according to the method according to the invention, when a functional unit is deactivated due to an error, the configuration status and error status of this functional unit are written to the storage device. Advantageously, according to the method according to the invention, at least part of the functions, instructions, program segments or programs defined for processing in the first operating mode before reconfiguration of the computer system as described above are stored in the computer system. Are processed in the second mode of operation.

有利には本発明による方法によれば、第1の動作モードは比較モードに対応し、第2の動作モードはアクティブな機能ユニットのみによるパフォーマンスモードまたはエラーモードに対応する。   Advantageously, according to the method according to the invention, the first operating mode corresponds to a comparison mode and the second operating mode corresponds to a performance mode or an error mode with only active functional units.

有利には本発明による方法によれば、機能ユニットの非アクティブ化は、コンピュータシステムの機能ユニットへのまたは各機能ユニット間の電気的な接続の遮断により不可逆的に行われる。   Advantageously, according to the method according to the invention, the deactivation of a functional unit is performed irreversibly by breaking the electrical connection to or between the functional units of the computer system.

有利には本発明による方法によれば、電気的な接続の遮断は、上述のコンピュータシステムにおいて接続の少なくとも一部分に対する電気的な作用によって達成される。   Advantageously, according to the method according to the invention, the disconnection of the electrical connection is achieved by an electrical action on at least part of the connection in the computer system described above.

有利には本発明による方法によれば、機能ユニットのアクティブ化および/または非アクティブ化はコンピュータシステムの動作中、このコンピュータシステムの一部分であるかまたはこのコンピュータシステムと常に接続されている装置を利用して行われる。   Advantageously, according to the method according to the invention, the activation and / or deactivation of the functional unit utilizes a device that is part of the computer system or is always connected to the computer system during operation of the computer system. Done.

有利には本発明は、少なくとも2つの同じまたは同種の機能ユニットを備えたコンピュータシステムの制御装置に関する。この装置は、まえもって設定可能な条件に依存してコンピュータシステムにおける機能ユニットをアクティブ状態および/または非アクティブ状態にできるようにする手段が設けられていることを特徴とする。有利には本発明による装置によれば、コンピュータシステムにおけるエラー検出および/または欠陥のある機能ユニットの識別を可能にする手段が設けられている。   Advantageously, the invention relates to a control device for a computer system comprising at least two identical or similar functional units. This device is characterized in that means are provided which allow the functional units in the computer system to be activated and / or deactivated depending on previously settable conditions. Advantageously, according to the device according to the invention, means are provided which allow error detection and / or identification of defective functional units in a computer system.

有利には本発明による装置によれば切替手段が設けられており、この切替手段により、コンピュータシステムにおける少なくとも2つの同じまたは同種の機能ユニットの少なくとも2つの動作モード間で切替可能となり、第1の動作モードは比較モードに対応し、第2の動作モードはパフォーマンスモードに対応する。   Advantageously, the device according to the invention is provided with a switching means, which enables switching between at least two operating modes of at least two identical or similar functional units in the computer system. The operation mode corresponds to the comparison mode, and the second operation mode corresponds to the performance mode.

有利には本発明による装置によれば、コンピュータシステムの選択された機能ユニットを動作モードに切り替える手段が設けられており、この動作モード中、欠陥のある機能ユニットをこの機能ユニットの出力信号と基準値との比較により識別可能である。   Advantageously, according to the device according to the invention, means are provided for switching selected functional units of the computer system to an operating mode, during which the defective functional unit is referred to the output signal of the functional unit and a reference. Can be identified by comparison with the value.

有利には本発明による装置によれば比較手段が設けられており、この比較手段により、機能ユニットの出力信号が少なくとも1つの別の機能ユニットの出力信号または基準値と比較され、不一致が生じたときはエラー情報が生成される。   Advantageously, the device according to the invention is provided with a comparison means by which the output signal of the functional unit is compared with the output signal or reference value of at least one other functional unit, resulting in a mismatch. Sometimes error information is generated.

有利には本発明による装置によれば、機能ユニットの出力信号のための基準値を格納する記憶手段と、この記憶手段から比較手段へ基準値を供給する手段が設けられている。   Advantageously, the device according to the invention is provided with storage means for storing a reference value for the output signal of the functional unit and means for supplying the reference value from this storage means to the comparison means.

有利には本発明による装置によれば、コンピュータシステムのアクティブ化可能および/または非アクティブ化可能なすべての機能ユニットに対しコンフィギュレーションステータスおよび/またはエラーステータスを形成する手段が設けられている。有利には本発明による装置には、データを格納する手段が設けられており、この手段に、アクティブ化可能および/または非アクティブ化可能な機能ユニットのコンフィギュレーションステータスまたはエラーステータスに関する少なくとも1つの情報が格納される。   Advantageously, according to the apparatus according to the invention, means are provided for creating a configuration status and / or an error status for all functional units of the computer system that can be activated and / or deactivated. Advantageously, the device according to the invention is provided with means for storing data, at least one piece of information regarding the configuration status or error status of the functional units that can be activated and / or deactivated. Is stored.

有利には本発明による装置によれば、データを格納する手段は不揮発性記憶手段である。   Advantageously according to the device according to the invention, the means for storing data are non-volatile storage means.

有利には本発明による装置によれば、コンピュータシステムの初期化時および/または動作中、記憶装置に格納されている機能ユニットのコンフィギュレーションステータスおよび/またはエラーステータスが読み出され、読み出されたデータと比較装置のエラー信号に依存して、機能ユニットのアクティブ化および/または非アクティブ化を実施することができる。   Advantageously, according to the device according to the invention, the configuration status and / or error status of the functional units stored in the storage device are read out and read out during initialization and / or operation of the computer system. Depending on the data and the error signal of the comparator, the activation and / or deactivation of the functional unit can be performed.

有利には本発明による装置によれば、機能ユニットの非アクティブ化を不可逆的に実行可能である。   Advantageously, according to the device according to the invention, the deactivation of the functional unit can be performed irreversibly.

有利には本発明による装置によれば、機能ユニットの不可逆的な非アクティブ化のためにこの機能ユニットへのまたはこの機能ユニット内での少なくとも1つの電気的な接続を遮断する手段が設けられている。   Advantageously according to the device according to the invention, means are provided for interrupting at least one electrical connection to or within the functional unit for irreversible deactivation of the functional unit. Yes.

有利には本発明による装置によれば、機能ユニットへのまたは機能ユニットにおける電気的な接続の遮断を、この接続の少なくとも一部分に対する電気的な作用によって達成可能な手段が設けられている。   Advantageously, according to the device according to the invention, means are provided that allow the disconnection of the electrical connection to or in the functional unit by electrical action on at least a part of this connection.

有利には本発明による装置によれば、エラー検出、機能ユニットのアクティブ化および/または非アクティブ化のための手段は、コンピュータシステムの一部分であるかまたはコンピュータシステムと常に接続されている。   Advantageously according to the device according to the invention, the means for error detection, functional unit activation and / or deactivation are either part of the computer system or are always connected to the computer system.

そのほかの利点および有利な実施形態については、各請求項に記載の特徴ならびに以下の説明に示されている。   Other advantages and advantageous embodiments are indicated in the features described in the claims and in the following description.

図1には、切替ロジックおよび処理ロジックを備えた一般的な切替コンポーネントが示されている。   FIG. 1 shows a typical switching component with switching logic and processing logic.

図2には、切替コンポーネントと記憶素子との接続について示されている。   FIG. 2 shows the connection between the switching component and the storage element.

図3には、記憶素子を利用した歩留まり上昇のための基本的な方法について示されている。   FIG. 3 shows a basic method for increasing the yield using the memory element.

図4には、グレースフル・デグラデーション graceful degradation と緊急動作のケイパビリティを高めるための特別な方法について示されている。   FIG. 4 shows a special method for increasing the capability of graceful degradation and emergency action.

図5には、切替コンポーネントと制御コンポーネントとの接続について示されている。   FIG. 5 shows the connection between the switching component and the control component.

図6には、制御コンポーネントを利用した歩留まり上昇のための基本的な方法について示されている。   FIG. 6 illustrates a basic method for increasing yield using a control component.

図7には、実現可能な記憶素子の構造が示されている。   FIG. 7 shows a possible structure of the memory element.

実施例の説明
以下の説明では実行ユニットのことをプロセッサ/コア/CPUとも、FPU(浮動小数点ユニット)、DSP(ディジタルシグナルプロセッサ)、コプロセッサまたはALU(算術論理ユニット)とも称することがある。
DESCRIPTION OF EMBODIMENTS In the following description, an execution unit may be referred to as a processor / core / CPU, an FPU (floating point unit), a DSP (digital signal processor), a coprocessor, or an ALU (arithmetic logic unit).

まずはじめに図1には、やはり2つよりも多くの実行ユニットを使用するための切替ユニットおよび比較ユニットの一般的な事例が描かれている。ここで考察するきn個の実行ユニットから、n個の信号N140〜N14nが切替および比較コンポーネントN100に供給される。この切替および比較コンポーネントN100は、これらの入力信号からn個までの出力信号N160〜N16nを生成することができる。最も簡単なケースすなわち「純粋なパフォーマンスモード」では、すべての信号N14iが対応する出力信号N16iとなる。これとは反対の極端なケースすなわち「純粋な比較モード」では、すべての信号N140〜N14iが出力信号N16iのうちただ1つの出力信号となる。   First of all, FIG. 1 depicts the general case of a switching unit and a comparison unit, again for using more than two execution units. From the n execution units considered here, n signals N140 to N14n are supplied to the switching and comparison component N100. The switch and compare component N100 can generate up to n output signals N160-N16n from these input signals. In the simplest case, the “pure performance mode”, all signals N14i are the corresponding output signals N16i. In the opposite extreme case, i.e. "pure comparison mode", all the signals N140 to N14i are the only output signal of the output signal N16i.

この図面には、考えられる種々のモードをどのようにして生じさせることができるかについて描かれている。このためN100には、切替ロジックN110の論理コンポーネントが含まれている。さしあたり切替ロジックの役割は、どの入力側がいかなる出力側とも接続されないかを決定することであり、つまり結果が保たれずにまたは非アクティブ状態とならずにどの入力側が無視されるのかを決定することである。切替ロジックのこの機能を、以下では切替ロジックの第1機能ともしばしば称する。さらに切替ロジックN110は、そもそもいくつの出力信号があるのかおよび入力信号のうちのいずれが入力信号が出力信号のいずれに寄与するのかを決定する。ここでは1つの入力信号が多くともちょうど1つの出力信号に寄与することができる。切替ロジックのこの機能を、以下では切替ロジックの第2機能ともしばしば称する。   This figure illustrates how the various possible modes can be generated. For this reason, N100 includes the logic component of the switching logic N110. For the time being, the role of the switching logic is to determine which input side is not connected to any output side, i.e. which input side is ignored without the result being kept or inactive. It is. This function of the switching logic is often referred to below as the first function of the switching logic. Further, the switching logic N110 determines how many output signals are present and which of the input signals contributes to which of the output signals the input signal contributes. Here, at most one input signal can contribute to exactly one output signal. This function of the switching logic is often referred to below as the second function of the switching logic.

つまり数学的に別のかたちで表すと信号の阻止なしでは、集合{N140〜N14n}の各要素に集合{N160〜N16n}の1つの要素を対応づける関数が切替ロジックによって定義されている。個々の入力信号の阻止を伴うと一般に切替ロジックにより、集合{N140〜N14n}(阻止されていない信号)の各要素に集合{N160〜N16n}の1つの要素を対応づける関数が定義されている。   In other words, in a mathematically different form, a function that associates one element of the set {N160 to N16n} with each element of the set {N140 to N14n} is defined by the switching logic without blocking signals. With blocking of individual input signals, switching logic generally defines a function that associates one element of set {N160-N16n} with each element of set {N140-N14n} (non-blocked signal). .

この場合、処理ロジックN120は出力側N16iの各々に対し、どのかたちで入力側がこの出力信号に寄与するかを決定する。例示的に種々の実施形態を説明する目的で、一般性を制限することなく、出力側N160が信号N141〜N14mによって生成されるものとする。m=1であればこのことは単に信号のスルーコネクションに相当し、m=2であれば信号N141,N142が比較される。この比較を同期または非同期に実施することができ、さらにこの比較をビットごとにまたは最上位ビットに対してのみ実施することができるし、あるいは許容範囲を用いて実施することもできる。1つの有利な実施形態によれば、複数の実行ユニットを1つのロックステップオペレーションで(すなわち同一クロック内の同一命令で)実行させることができる。ただし1つの固定的なクロックまたはフェーズシフトも、同様に有利な解決策である。m≧3である場合には、それよりも多くのオプションがある。   In this case, the processing logic N120 determines for each of the output sides N16i how the input side contributes to this output signal. For purposes of illustrating various embodiments by way of example, it is assumed that the output side N160 is generated by signals N141-N14m without limiting generality. If m = 1, this simply corresponds to a signal through connection. If m = 2, the signals N141 and N142 are compared. This comparison can be performed synchronously or asynchronously, and this comparison can be performed on a bit-by-bit basis or only on the most significant bit, or it can be performed using tolerances. According to one advantageous embodiment, multiple execution units can be executed in a single lockstep operation (i.e. with the same instruction in the same clock). However, one fixed clock or phase shift is an equally advantageous solution. If m ≧ 3, there are more options.

1つめのオプションによれば、すべての信号を比較し、少なくとも2つの異なる値が存在する場合にはエラーを検出し、このエラーを選択的にシグナリングすることができる。   According to the first option, all signals can be compared, an error can be detected if there are at least two different values, and this error can be selectively signaled.

2つめのオプションによれば、m個からk個の選択が行われる(k>m/2)。このことは比較の利用により実現可能である。選択的に、信号のうちの1つが偏差があるとして識別されると、エラー信号を発生させることができる。3つのすべての信号が異なっている場合には、考えられる種々のエラー信号を形成することができる。   According to the second option, m to k selections are made (k> m / 2). This can be achieved by using a comparison. Optionally, if one of the signals is identified as having a deviation, an error signal can be generated. If all three signals are different, various possible error signals can be formed.

3つめのオプションによれば、これらの値が1つのアルゴリズムに供給される。このアルゴリズムをたとえば平均値やメディアン値の形成、あるいはフォールトトレランスアルゴリズム(FTA)の使用とすることができる。上述のようなFTAは、入力値の極値を取り除き、残りの値に対し一種の平均値形成を行うことに基づくものである。この平均値形成を残りの値の集合すべてについて行うこともできるし、あるいは有利にはハードウェアHWにおいて容易に形成できる部分集合について行うことができる。この場合には、必ずしも値を実際に比較しなくてもよい。平均値形成であればたとえば加算と除算のみでよく、FTM,FTAまたはメディアンであれば部分的なソートが必要である。この場合も必要に応じて、極値が相当に大きい場合には選択的にエラー信号を送出することができる。   According to a third option, these values are fed into one algorithm. This algorithm can be, for example, the formation of an average value or median value, or the use of a fault tolerance algorithm (FTA). The FTA as described above is based on removing an extreme value of an input value and performing a kind of average value formation on the remaining value. This average value formation can be performed for all the remaining sets of values, or advantageously for a subset that can be easily formed in the hardware HW. In this case, it is not always necessary to actually compare the values. For average value formation, for example, only addition and division are required. For FTM, FTA, or median, partial sorting is required. Also in this case, if necessary, an error signal can be selectively transmitted when the extreme value is considerably large.

複数の信号を処理して1つの信号を生成する上述の様々なオプションを略して比較演算と称する。したがって処理ロジックの役割は、出力信号各々に対する比較演算の詳細な構造、つまりは対応する入力信号に対する比較演算の詳細な構造を決定することである。以下ではこのことを処理ロジックの第2の関数と称する。これにより一般に生じ得る誤った実行ユニットの識別を、以下では処理ロジックの第1の関数と称する。   The various options described above for processing a plurality of signals to generate a single signal are referred to as comparison operations for short. Therefore, the role of the processing logic is to determine the detailed structure of the comparison operation for each output signal, that is, the detailed structure of the comparison operation for the corresponding input signal. Hereinafter, this is referred to as a second function of the processing logic. The identification of erroneous execution units that can generally occur in this way is hereinafter referred to as the first function of the processing logic.

切替ロジックN110の情報(すなわち上述の関数)と処理ロジックの情報(すなわち出力信号つまり関数値ごとの比較演算の決定)との組み合わせがモード情報であり、この情報によってモードが確定される。この情報は一般的な事例では当然ながら多値であり、つまり1つの論理ビットだけでは表現できない。論理的に考えられるすべてのモードがある1つの定められた実現形態において有意であるのではなく、有利には許容されるモードの数が制限される。ここで強調しておくと、実行ユニットが2つしかない場合であれば実行ユニットには、すべての情報をただ1つの論理ビットに集約可能な1つの比較モードだけしか存在しない。   A combination of information of the switching logic N110 (that is, the above-described function) and information of the processing logic (that is, determination of a comparison operation for each output signal, that is, a function value) is mode information, and the mode is determined by this information. This information is naturally multi-valued in a general case, that is, it cannot be expressed by only one logical bit. Not all logically considered modes are significant in one defined implementation, but advantageously the number of modes allowed is limited. To emphasize, if there are only two execution units, there is only one comparison mode in the execution unit that can aggregate all the information into only one logical bit.

一般的な事例ではパフォーマンスモードから比較モードへの切り替えの特徴は、パフォーマンスモードではそれぞれ異なる出力側にマッピングされる実行ユニットが比較モードでは同じ出力側にマッピングされることである。このことは有利には以下のようにして実現される。すなわち実行ユニットのサブシステムが設けられており、この場合、このサブシステム内で考察すべきすべての入力信号N14iが、パフォーマンスモードにおいては対応する出力信号N16iにそれぞれダイレクトに切り替えられる一方、比較モードにおいてはすべて1つの出力側にマッピングされる。択一的に、このような切り替えをペアリングの変更によっても実現可能である。つまり本発明による1つの実施形態として、許容されるモードの量をそれが該当するよう制限できるにもかかわらず、一般的なケースにおいてはパフォーマンスモードおよび比較モードについて論じることはできない。しかしながらパフォーマンスモードから比較モードへの切り替え(またその逆の切り替え)については常に論じることができる。   In the general case, the characteristic of switching from the performance mode to the comparison mode is that execution units mapped to different output sides in the performance mode are mapped to the same output side in the comparison mode. This is advantageously realized as follows. That is, a subsystem of execution units is provided, in which all input signals N14i to be considered in this subsystem are each switched directly to the corresponding output signal N16i in the performance mode, while in the comparison mode Are all mapped to one output. Alternatively, such switching can be realized by changing the pairing. That is, as one embodiment according to the present invention, the performance mode and the comparison mode cannot be discussed in the general case, although the amount of mode allowed can be limited as it falls. However, switching from performance mode to comparison mode (and vice versa) can always be discussed.

次に、この種の切替コンポーネントおよび比較コンポーネントならびにいくつかのその他の要素を用いて、特定の条件のもとで半導体素子たとえばマイクロコンピュータなどの製造プロセスにおける歩留まりをどのように高めることができるかについて述べる。   Next, how this type of switching and comparison component and some other factors can be used to increase the yield in the manufacturing process of semiconductor devices such as microcomputers under certain conditions State.

基本的な着想について以下で大雑把に説明する:
素子たとえばマイクロコンピュータには、動作中に必要とされるよりも多くの実行ユニットが必要とされる。
The basic idea is outlined below:
Devices, such as microcomputers, require more execution units than are needed during operation.

したがって動作中は、適正に動作する実行ユニットの全個数よりも僅かな実行ユニットでもはたらかせることができる。ここで前提とするのは、適正には動作していないユニットが識別されており、それらがシステム全体に作用を及ぼす可能性のないことである。上述の切替ユニットおよび比較ユニットを利用することにより、欠陥のある実行ユニットの信号がシステム内でさらに伝播するのを切替ロジックN110を介して阻止することができる。   Accordingly, during operation, even a few execution units than the total number of execution units that operate properly can be used. The assumption here is that units that are not operating properly have been identified and that they may not affect the entire system. By utilizing the switching unit and the comparison unit described above, the signal of the defective execution unit can be prevented from further propagating in the system via the switching logic N110.

処理ロジックN120により、それぞれ異なる実行ユニットの信号を比較することができる。適切な比較によって、欠陥のある実行ユニットを識別することができる。このことは、エラーを十分にカバーするテストプログラムを利用することで可能となる。必要に応じて、外部の識別手段をいっしょに使用することもできる。   The processing logic N120 can compare the signals of different execution units. With proper comparison, defective execution units can be identified. This can be achieved by using a test program that sufficiently covers errors. If necessary, external identification means can be used together.

この種のテストをいずれかの時点で、たとえば生産ライン終点、初期化時あるいは組み立てに際して実行し、結果(すなわち欠陥のある実行ユニットの一義的な識別)を不揮発性メモリに記憶し、その結果により切替ロジックN110を、欠陥のある実行ユニットの信号が作用を及ぼさないよう制御することによって、たとえ欠陥のある実行ユニットが存在していても、適正に動作する実行ユニットを依然として利用可能なマイクロコンピュータが得られる。   This kind of test is performed at any point in time, for example at the end of the production line, at initialization or during assembly, and the result (ie a unique identification of the defective execution unit) is stored in non-volatile memory, By controlling the switching logic N110 so that the signal of the defective execution unit does not act, even if there is a defective execution unit, a microcomputer that can still use the execution unit that operates properly can be obtained. can get.

このようにして製品において実現されるフォールトトレランスによって歩留まりを高めることができる。その理由は、依然として適正に動作する実行ユニットの個数が十分にあるかぎり、欠陥を伴う素子を利用できるからである。これは適用事例に依存する。   Thus, the yield can be increased by the fault tolerance realized in the product. The reason is that as long as there are a sufficient number of execution units that still operate properly, elements with defects can be used. This depends on the application.

この着想についてここで詳しく説明する。   This idea will be explained in detail here.

切替ユニットおよび比較ユニットに関する可能な論理構成についてはすでに説明した。ここで説明する本発明を適用するためには、有利ではあるけれどもコンポーネントが必ずしも上述なようなものとして設けられていなくてもよく、また、切替ロジックや処理ロジックという上述のサブコンポーネントが必ずしも設けられていなくてよい。   The possible logical configurations for the switching unit and the comparison unit have already been described. In order to apply the present invention described here, although it is advantageous, the components are not necessarily provided as described above, and the above-described subcomponents such as switching logic and processing logic are not necessarily provided. It does not have to be.

切替ロジックの第1の機能に関して重要であるのは、場合によっては欠陥を伴う可能性のあるコンポーネントの出力を適切な形態で無視できることである。このことは、それらの出力をたとえばスイッチなどで遮断することによって実現できる。他の可能性として挙げられるのは、エラーを伴う信号用の標準「キャッチャー」にそれらの信号を切り替えることである。別の可能性として、出力信号を無効なものとしてマーキングすることができる。さらにこのことに加えてまたは択一的に用いることのできる別の可能性として、この種の出力信号の発生を対応するコンポーネント自体を非アクティブ状態にすることによって阻止することができる。そしてこれをコンポーネントの非アクティブ化、停止、クロック遮断あるいは入力信号の遮断によって実現することができる。このことにより損失電力が最小限に抑えられ、ひいては耐用年数、信頼性ならびに温度負荷が最適化されるという利点も得られる。以下では、出力が何らかの手段により無視されるすべての実行ユニットのことをパッシブ状態または非アクティブ状態にあると呼ぶことができる。   What is important with regard to the first function of the switching logic is that the output of components that may possibly be defective can be ignored in a suitable manner. This can be realized by shutting off their outputs with a switch, for example. Another possibility is to switch those signals to a standard “catcher” for signals with errors. Another possibility is to mark the output signal as invalid. Furthermore, as another possibility that can be used in addition or alternatively, the generation of this type of output signal can be prevented by deactivating the corresponding component itself. This can be realized by deactivating, stopping, shutting down the clock, or blocking the input signal. This has the advantage of minimizing power loss and thus optimizing service life, reliability and temperature load. In the following, all execution units whose output is ignored by some means can be referred to as being in a passive or inactive state.

処理ロジックの第1の機能にとって重要であるのは第1に、欠陥コンポーネントを識別できることである。有利な可能性として挙げられるのは、すべての実行ユニットに対し並列に同一のプログラムを実行させることである。ただし有利には必ずしもこのことを、実行ユニットをロックステップモードで、あるいは固定的なクロックシフトまたは位相シフトでも駆動することにより実現可能でなくてもよい。   Important to the first function of the processing logic is firstly that the defective component can be identified. An advantageous possibility is to have all execution units execute the same program in parallel. However, this may not necessarily be realized by driving the execution unit in lockstep mode or with a fixed clock shift or phase shift.

このようにして適切な比較により多数決判定を介して、場合によっては存在する欠陥コンポーネントを識別することができる。オプションとして製品テスト、初期化テストあるいは生産ライン終点テストにおいて付加的にこのプログラムの結果をさらに、事前にわかっている結果と外部のユニット(ウォッチドッグ、他のマイクロコンピュータ、テスト機器、ASIC)によって比較することができる。このことはただ2つの実行ユニットしか存在しない場合に殊に有利となる。なぜならばそのようなケースでは、双方の実行ユニットにおいて差が発生したならば、欠陥を伴う実行ユニットを識別するために第3の情報が必要となるからである。このような比較を上述の比較演算のほか、場合によっては存在する欠陥を伴う実行ユニットの一義的な識別が可能となるまで、ペアでのみでまたは部分集合に対し比較を実行することで実現することができる。したがって処理ロジックはこの第1の機能の結果として、欠陥コンポーネントを識別する必要がある。   In this way, an appropriate comparison can identify defective components that may be present via majority decision. As an option, the results of this program can be further compared in the product test, initialization test or production line end point test with the known results by external units (watchdog, other microcomputers, test equipment, ASIC) can do. This is particularly advantageous when there are only two execution units. This is because in such a case, if a difference occurs between the two execution units, the third information is required to identify the execution unit having a defect. In addition to the above comparison operations, such comparisons are realized by performing comparisons only in pairs or on subsets until a unique identification of an execution unit with possibly existing defects becomes possible. be able to. Accordingly, processing logic needs to identify the defective component as a result of this first function.

テストプログラムを、できるかぎり高い確率で欠陥が作用を及ぼすように構成する必要がある。そのようなプログラムを開発するためにたとえば、欠陥モデル(一例としてstuck-at-Modell)を利用することができるし、アプリケーションコードの一部分を実行させたり、あるいは完全な命令テストを実行させたりすることができる。生産ライン終点テストの場合であれば、それを実行ユニットに限定された現在のテストプログラムに対応させることができる。ただしこれを現在一般的な生産ライン終点テストと組み合わせることもできるし、第1の生産ライン終点テストによってすでに判定されたコンポーネントのみこのプログラムによってテストすることもできる。最後に挙げたやり方は殊に、さもなければ欠陥品に属するコンポーネントについてのみ付加的なプロセスステップが実施されるという利点を有している。このような最後の「救済ステップ」により得られたコンポーネント各々によって、製造プロセスの歩留まりがそのまま高められる。   It is necessary to configure the test program so that the defects act with the highest possible probability. To develop such a program, for example, you can use a defect model (for example, stuck-at-Modell), run a piece of application code, or run a full instruction test. Can do. In the case of a production line end point test, it can correspond to a current test program limited to execution units. However, this can be combined with the currently common production line end point test, or only components that have already been determined by the first production line end point test can be tested by this program. The last mentioned method has the advantage that, in particular, additional process steps are carried out only for components that otherwise belong to defective products. Each component obtained by such a final “relief step” directly increases the yield of the manufacturing process.

処理ロジックの第1の機能により欠陥ユニットが識別された後、その情報を格納する必要がある。本発明による方法を歩留まり上昇のために製造プロセスに適用する場合、不揮発性記憶素子を用いるのが有利である。その場合、どの実行ユニットが非アクティブであるかがそこに格納される。   After the defective unit is identified by the first function of the processing logic, the information needs to be stored. When the method according to the present invention is applied to a manufacturing process to increase yield, it is advantageous to use a non-volatile memory element. In that case, which execution unit is inactive is stored there.

図2には、この記憶素子の機能が描かれている。図2における切替および比較ユニットN500の素子N510,N520,N54i、N56iは、図1における切替および比較ユニットN100の素子N110,N120,N14i,N16iと同じ機能を有している。さらにここには記憶素子N530が描かれている。処理ロジックN520は、欠陥があると識別された実行ユニットに関する情報を記憶素子N530に送信する。切替ロジックN510はこの記憶素子にアクセス可能であり、N530により非アクティブとして表された素子が実際上も非アクティブとなるよう切替ロジックの第1の機能を実施する。   FIG. 2 shows the function of this storage element. The elements N510, N520, N54i, N56i of the switching and comparison unit N500 in FIG. 2 have the same functions as the elements N110, N120, N14i, N16i of the switching and comparison unit N100 in FIG. Further, a storage element N530 is depicted here. Processing logic N520 sends information about the execution unit identified as defective to storage element N530. The switching logic N510 is accessible to this storage element and implements the first function of the switching logic so that the element represented as inactive by N530 is actually inactive.

当然ながら記憶素子を切替および比較ユニット内に設けることができるけれども、外部に設けてもよく、さらにはコンポーネントの外部に設けてもよい。たとえばマイクロコンピュータを組み立てる際に制御装置内またはPC内に外部の素子を設けることも考えられ、それというのもこのようにすれば周辺機器を利用しながらいっそう大規模なテストを適用できるからである。   Of course, the storage element can be provided in the switching and comparison unit, but it may also be provided externally or even external to the component. For example, when assembling a microcomputer, it is conceivable to provide an external element in the control device or in the PC, because this makes it possible to apply a larger test while using peripheral devices. .

図3には、製造時の歩留まりを高めるための方法に関する基本的な着想が示されている。第1のステップN600(識別ステップ)において、欠陥のある実行ユニットの識別が行われる。識別のためには処理ロジックN520の第1の機能が利用され、つまりはテストプログラムが利用される。第2のステップN610(格納ステップ)において、欠陥情報が格納される。対応する情報が処理ロジックN520から記憶素子N530に渡される。第3のステップN620(コンフィギュレーション)において、切替ロジックN510はN530からの情報を利用して切替ロジックの第1の機能を適用し、要求されているアクティブ状態とパッシブ状態に応じて実行ユニットの出力のコンフィギュレーションを行う。ここで強調しておくと、たしかにオプションとしてこれをSWにより行うことができるけれども、1つの有利な実施形態によればここではSWコントロールによってもコンフィギュレーションに作用が及ぼされない。   FIG. 3 shows the basic idea regarding a method for increasing the yield during manufacturing. In the first step N600 (identification step), the defective execution unit is identified. For identification, the first function of the processing logic N520 is used, that is, a test program is used. In the second step N610 (storage step), defect information is stored. Corresponding information is passed from the processing logic N520 to the storage element N530. In the third step N620 (configuration), the switching logic N510 uses the information from N530 to apply the first function of the switching logic and outputs the execution unit according to the requested active and passive states. Configure. It should be emphasized here that although this can optionally be done by SW, according to one advantageous embodiment, the configuration is also not affected here by SW control.

非アクティブ状態に関する主要な要因は欠陥である。ただし1つの有利な実施形態によれば、別の理由が成り立つ可能性もある。たとえば、まったく欠陥のないコンポーネント自体についても上述の記憶素子において実行ユニットを非アクティブとしてマーキングすることができる。   The main factor regarding the inactive state is the defect. However, according to one advantageous embodiment, another reason may hold. For example, an execution unit can be marked as inactive in the storage element described above even for a component that is completely free of defects.

たとえば、テストが生産ライン終点だけでなく動作中(たとえば初期化フェーズ中あるいは通常動作中にも)実行される場合には、製造中ではなく動作中に発生したエラーを検出することができる。図1に示されているように、切替ロジックの第2の機能(アクティブな実行ユニットを動作中に互いに接続する機能)および処理ロジックの第2の機能(出力側に切り替えられた信号の比較を実施する機能)を介して、動作中も簡単にエラーを検出して欠陥のある実行ユニットを識別することができる。   For example, if the test is performed during operation (eg, during the initialization phase or during normal operation) as well as the production line end point, errors that occur during operation rather than during manufacture can be detected. As shown in FIG. 1, the second function of the switching logic (function to connect the active execution units to each other during operation) and the second function of the processing logic (compare the signals switched to the output side). Through the function to be performed), it is possible to easily detect errors during operation and identify defective execution units.

欠陥のない実行ユニットが非アクティブとマーキングされている場合、動作中にエラーが発生したときに欠陥があると識別されたユニットを欠陥がないが非アクティブ状態にあるユニットと交換することができる。この目的で有利であるのは、実行ユニットが単に非アクティブであるのかまたはそれが欠陥も有するのかという情報を記憶素子N530に格納することである。有利には非動作時に、所定の実行ユニットが欠陥を有するという情報を変更することができる。   If a non-defective execution unit is marked inactive, a unit that is identified as defective when an error occurs during operation can be replaced with a non-defective but inactive unit. It is advantageous for this purpose to store in storage element N530 information whether the execution unit is simply inactive or whether it also has a defect. Advantageously, when inactive, the information that a given execution unit is defective can be changed.

図7には、記憶素子O100(N530に対応)に関して基本的に実現可能な構造が示されている。これには第1の記憶領域O110が含まれており、そこには有利には実行ユニットの個数に応じてメモリロケーションO120〜O12nが設けられている。有利には各メモリロケーションは少なくとも1ビット以上で実現されている。メモリロケーションO12iの番号またはアドレスは、実行ユニットの番号または識別子と一義的に結びつけられている。O120の1つのビットは0にセットされており、たとえばこのことによって、対応する実行ユニットがアクティブであることが表される。これが1にセットされているならば、対応する実行ユニットは非アクティブ状態ということである。この情報をフォールトトレランスにまたは他の情報と結びつけてメモリロケーションO120〜O12nにおくことができるが、この用途に関して基本的な情報内容は常に同じまま保持される。   FIG. 7 shows a structure that can basically be realized with respect to the storage element O100 (corresponding to N530). This includes a first storage area O110, which is advantageously provided with memory locations O120 to O12n depending on the number of execution units. Advantageously, each memory location is implemented with at least one bit. The number or address of the memory location O12i is uniquely associated with the execution unit number or identifier. One bit of O120 is set to 0, for example, which indicates that the corresponding execution unit is active. If this is set to 1, the corresponding execution unit is inactive. This information can be tied to fault tolerance or other information in memory locations O120-O12n, but the basic information content for this application is always kept the same.

オプションとして付加的に第2の記憶領域O140が設けられ、有利にはこの領域には実行ユニットの個数に応じてメモリロケーションO130〜O13nが設けられる。有利には各メモリロケーションは少なくとも1ビット以上で実現されている。メモリロケーションO13iの番号またはアドレスは、実行ユニットの番号または識別子と一義的に結びつけられている。O130の1つのビットは0にセットされており、たとえばこのことによって、対応する実行ユニットが欠陥のないものとして表される。これが1にセットされているならば、対応する実行ユニットは欠陥があることが表される。この情報をフォールトトレランスにまたは他の情報と結びつけてメモリロケーションO130〜O13nにおくことができるが、この用途に関して基本的な情報内容は常に同じまま保持される。択一的に、この記憶領域は書き込み不可能であるかまたは、特別な状況でのみあるいは特別なやり方でのみ書き込み可能であり、このようにすることで一度欠陥があるものとしてマーキングされた実行ユニットが誤って欠陥なしと表されないよう保証される。   As an option, a second storage area O140 is additionally provided, which is preferably provided with memory locations O130 to O13n depending on the number of execution units. Advantageously, each memory location is implemented with at least one bit. The number or address of the memory location O13i is uniquely associated with the execution unit number or identifier. One bit of O130 is set to 0, which, for example, indicates that the corresponding execution unit is not defective. If this is set to 1, it indicates that the corresponding execution unit is defective. This information can be tied to fault tolerance or combined with other information in memory locations O130-O13n, but the basic information content for this application is always kept the same. Alternatively, this storage area is not writable or writable only in special circumstances or only in a special way, and in this way an execution unit once marked as defective Is guaranteed not to be mistakenly labeled as non-defective.

非アクティブであるが欠陥のない実行ユニットを使用することにより、上述の方法を欠陥のない素子のために提供するコールドな冗長性(コールド・リダンダンシー cold redundancy)を、可用性と信頼性の増大のために用いることができる。   By using inactive but defect-free execution units, cold redundancy, which provides the above methods for defect-free elements, is added to increase availability and reliability. Can be used.

本発明を適用可能な別の可能性は、グレースフルデグラデーションモードGraceful-Degradation ModeおよびリンプホームモードLimp-home Modeを実現することである。   Another possibility to apply the present invention is to realize a Graceful-Degradation Mode and a Limp-home Mode.

この場合の前提条件は、処理ロジックにおける上述の第2の機能を介して動作中に欠陥が見つかったことである。図4には、その際に有利に用いられる方法が示されている。最初にステップN700(エラー検出)において欠陥が見つけられる。これをたとえばテストプログラムの利用により行うことができる。ただしシステムが比較モードにあるときには、たとえばこれを処理ロジックと切替ロジックの第2の機能を介して設定できる場合には、この種のエラー検出を通常動作中に行うこともでき、つまりアプリケーションソフトウェアがテストプログラムとして機能する。このことは2つの理由から有利である:すなわちこの場合には専用のテストプログラムが不要である一方、総じて作用を及ぼす実行ユニットのすべての欠陥がこのようにして見つけられる。   A precondition in this case is that a defect has been found during operation via the second function described above in the processing logic. FIG. 4 shows a method that is advantageously used in that case. First, a defect is found in step N700 (error detection). This can be done, for example, by using a test program. However, when the system is in comparison mode, for example, if this can be set via the second function of processing logic and switching logic, this type of error detection can also be performed during normal operation, ie the application software Functions as a test program. This is advantageous for two reasons: in this case no dedicated test program is required, while all defects of the execution unit acting as a whole are found in this way.

ステップN705において、切替ロジックおよび処理ロジックの現在のコンフィギュレーションにより欠陥のある実行ユニットをすでに識別可能であるか否かがチェックされる。このことが該当するならばステップN710(エラー検出のためのコンフィギュレーション)およびN720(識別ステップ)がすでに終了しており、ステップN730にそのまま移行する。これがあてはまるのはたとえば、3つの実行ユニットからの信号が比較されるサブシステムにおいてエラーが発生した場合である。(ステップN705における)チェックの結果、該当しなかった場合(たとえば比較モードで実行している2つの実行ユニットから成るサブシステムにおいてエラーが検出された場合)、最初にステップN710において、エラー識別を可能とするコンフィギュレーションが選択される。これはもっとも簡単なやり方としてはたとえば以下のようにして行われる。すなわち「容疑候補」(すなわちエラーを生じさせたサブシステムに関与しているすべての実行ユニット)を、十分に多くの個数の他の実行ユニットとともに切替ロジックN510により1つの出力信号となるよう組み合わせる。その際に有利であるのは、エラーを呈示したSW部分をテストプログラムとして再び利用することであるが、専用のテストプログラムを利用してもよい。この場合、処理ロジックの第1の機能によりステップN720を実行させ、欠陥のある実行ユニットを識別することができる。ただし択一的に、他の識別方法を選択してもよい。たとえば容疑候補のうちの1つを受け入れ、それを欠陥のない他の実行ユニットと組み合わせる。いかなるエラーも識別されなければ、他の実行ユニットが欠陥をもつことになる。エラーが識別されれば、その実行ユニットにおけるエラーであると推定できる。後者の方法によれば、同じ識別確実性は得られないけれども、これを動作実行中にいっそう簡単に用いることができ、つまりたとえば自動車においてコンポーネントにより制御される目下クリティカルな走行操作が実行されている場合に有利となる。欠陥のある実行ユニットの識別が完了した後、両方のステップN730(格納ステップ、N610に対応)とN740(コンフィギュレーション、N620に対応)が実行される。   In step N705, it is checked whether the faulty execution unit can already be identified by the current configuration of the switching logic and processing logic. If this is the case, steps N710 (configuration for error detection) and N720 (identification step) have already been completed, and the process proceeds to step N730. This is the case, for example, when an error occurs in a subsystem where the signals from the three execution units are compared. If the result of the check (in step N705) is not applicable (for example, if an error is detected in a subsystem consisting of two execution units running in comparison mode), error identification is possible first in step N710 Is selected. The simplest way to do this is, for example: In other words, “suspect candidates” (that is, all execution units involved in the subsystem that caused the error) are combined with a sufficiently large number of other execution units so as to become one output signal by the switching logic N510. In this case, it is advantageous to use again the SW part that presented the error as a test program, but a dedicated test program may be used. In this case, step N720 can be executed by the first function of the processing logic, and a defective execution unit can be identified. However, alternatively, other identification methods may be selected. For example, accept one of the suspect candidates and combine it with other execution units without defects. If no errors are identified, other execution units will be defective. If an error is identified, it can be estimated that it is an error in the execution unit. The latter method does not provide the same identification certainty, but it can be used more easily during the execution of the movement, i.e. a currently critical driving operation controlled by a component, for example in an automobile, is being carried out. This is advantageous in some cases. After identifying the defective execution unit, both steps N730 (storage step, corresponding to N610) and N740 (configuration, corresponding to N620) are executed.

ここで強調しておくと、この最後のステップにおいて本発明による方法により多数の有利な可能性が得られることになる。欠陥がないけれども非アクティブ状態にある実行ユニットが十分に多くあるならば、上述のように完全に機能するシステムを再び形成することができる。   It should be emphasized here that in this last step a number of advantageous possibilities are obtained by the method according to the invention. If there are enough execution units that are not defective but inactive, a fully functioning system can be formed again as described above.

通常動作のために欠陥のない実行ユニットが少なすぎるケースにおいて、存在している実行ユニットに対し既存のソフトウェアを通常のように良好に実行させることができる。このことが有利になるのは、システムが通常の事例において予備伝播時間を用いて記述されている場合である。この場合におそらくは、実行ユニットの個数が低減されていても動作を保証するためにパフォーマンスを十分に提供できる。このことは殊に、著しくパフォーマンスが集中する動作状態(たとえば自動車エンジンにおける高回転数)が回避されることによって支援することができる。   In the case where there are too few defect-free execution units for normal operation, the existing software can be executed as normal for existing execution units. This is advantageous when the system is described with a pre-propagation time in the normal case. In this case, perhaps enough performance can be provided to guarantee operation even if the number of execution units is reduced. This can be supported in particular by avoiding operating conditions that are highly concentrated in performance (for example, high engine speeds in automobile engines).

通常動作のために欠陥のない実行ユニットの個数が少なすぎれば、択一的にアプリケーションのサブセットだけを実行させることができる。   If the number of execution units without defects for normal operation is too small, only a subset of the applications can be executed alternatively.

通常動作のために欠陥のない実行ユニットの個数が少なすぎるケースにおいて、第3の可能性としてアプリケーションを別のモードで実行させることができる。たとえば強い比較モードをやめて、比較的弱い比較モードまたはパフォーマンスモードを適用することができる。このケースでは、後続の動作のために比較的弱いエラー検出またはフォールトトレランスしか生じないけれども、場合によってはこのことは許容できる。なぜならばこの状態を場合によっては制限された時間のみ維持すればよいからである。本発明によればこのオプションはきわめて容易に実現できる。なぜならばここで示したコンポーネントおよび方法だけしか用いないでよいからである。当然ながら、これらの実施形態の組み合わせも考えられる。   In the case where the number of execution units without defects is too small for normal operation, the third possibility is to run the application in another mode. For example, the strong comparison mode can be stopped and a relatively weak comparison mode or performance mode can be applied. In this case, relatively weak error detection or fault tolerance occurs for subsequent operations, but in some cases this is acceptable. This is because it is only necessary to maintain this state for a limited time. According to the invention, this option can be realized very easily. This is because only the components and methods shown here can be used. Of course, combinations of these embodiments are also conceivable.

本発明による方法の着想を利用する基本的に異なる可能性として挙げられるのは、欠陥の可能性のある実行ユニットを確実に不可逆的に非アクティブ状態となるよう非アクティブにするために、記憶素子を用いずに他の手段を利用することである。これを素子のラインの制御(たとえば分離または接続)によって行うことができる。   A fundamentally different possibility of using the idea of the method according to the invention is that the storage element is deactivated to ensure that a potentially defective execution unit is irreversibly deactivated. It is to use other means without using. This can be done by controlling the line of elements (eg, separating or connecting).

以下に種々のオプションを挙げる:専用ラインのアンチフューズ(これは動作中、保守中、組み立て中または製造中に利用可能)、ラインの機械的処理(はんだ付け、切断)、レーザ、電子ビーム、X線ビームまたは特別な電気信号による焼断、ならびにラインに対する化学的作用。   Various options include: dedicated line antifuse (which can be used during operation, maintenance, assembly or manufacturing), mechanical processing of the line (soldering, cutting), laser, electron beam, X Burning with a line beam or special electrical signal, and chemical action on the line.

このためには記憶素子の代わりに制御コンポーネントが必要である。図5には、この制御コンポーネントの機能が描かれている。図5における切替および比較ユニットN800の素子N810,N820,N84i、N86iは、図1における切替および比較ユニットN100の素子N110,N120,N14i,N16iと同じ機能を有している。さらにここには制御コンポーネントN830が描かれている。処理ロジックN820は、欠陥があると識別された実行ユニットに関する情報を制御コンポーネントN830に送信する。これはたとえば上述のように実行ユニットが非アクティブ状態となるよう素子内のラインまたは機能グループを制御する手段を有している。N830を素子内、制御装置内またはシステム内のコンポーネントとすることができるけれども、N830を製造プロセスにおける機械またはこの種の機械の操作者としてもよい。これらのコンポーネントを保守の際に利用することもできる。オプションとして相応の情報をさらに切替ロジックへ送出することができ、これによって切替ロジックは第1の機能を実行し、N830により非アクティブと表された素子を実際上も非アクティブにする。   This requires a control component instead of a storage element. FIG. 5 illustrates the function of this control component. The elements N810, N820, N84i, N86i of the switching and comparison unit N800 in FIG. 5 have the same functions as the elements N110, N120, N14i, N16i of the switching and comparison unit N100 in FIG. Furthermore, a control component N830 is depicted here. Processing logic N820 sends information about the execution unit identified as defective to control component N830. This has means for controlling the lines or functional groups in the element so that the execution unit is deactivated, for example as described above. Although N830 can be a component in a device, controller, or system, N830 may be a machine in a manufacturing process or an operator of such a machine. These components can also be used for maintenance. As an option, corresponding information can also be sent to the switching logic, whereby the switching logic performs the first function, effectively deactivating the element represented as inactive by N830.

図6には、制御コンポーネントN830を利用して歩留まりを高めるための方法に関する基本的な着想が示されている。第1のステップN900(識別ステップ)において、欠陥のある実行ユニットの識別が行われる。識別のためには処理ロジックN820の第1の機能が利用され、つまりはテストプログラムが利用される。第2のステップN910において、処理ロジックN820から制御コンポーネントN830へ欠陥情報が送られる。第3のステップN920において制御コンポーネントN830はこの情報を利用し、このコンポーネントが使える手段を用いて、欠陥コンポーネントが非アクティブとなるよう素子内のラインまたは機能グループを制御する。択一的な第4のステップN930において、切替ロジックN810は情報を利用して切替ロジックの第1の機能を適用し、要求されているアクティブ状態とパッシブ状態に応じて実行ユニットの出力のコンフィギュレーションを行う。当然ながら、この種の制御コンポーネントを動作中も利用することができる。システムに対する作用はまったく同じであるので、記憶素子を利用したときに得られるすべての利点をここでもあてはめることができる。この場合、制御コンポーネントがシステム内のHWコンポーネントとして設けられていると有利である。   FIG. 6 illustrates the basic idea of a method for increasing the yield using the control component N830. In the first step N900 (identification step), the defective execution unit is identified. For identification, the first function of the processing logic N820 is used, that is, a test program is used. In a second step N910, defect information is sent from processing logic N820 to control component N830. In a third step N920, the control component N830 uses this information and uses means available to this component to control the line or functional group in the element so that the defective component is inactive. In an alternative fourth step N930, the switching logic N810 uses information to apply the first function of the switching logic and configures the output of the execution unit according to the required active and passive states. I do. Of course, this type of control component can also be used during operation. Since the effect on the system is exactly the same, all the advantages gained when using storage elements can be applied here as well. In this case, it is advantageous if the control component is provided as a HW component in the system.

実施例の説明で言及した実行ユニット以外にも、本発明による有利な方法と装置を半導体回路における他のコンポーネントにも適用することができ、たとえばアナログ/ディジタル変換器、タイマ素子、インタラプトコントローラ、通信コントローラあるいは制御ユニットなどにも適用可能である。   In addition to the execution units mentioned in the description of the embodiments, the advantageous method and apparatus according to the invention can be applied to other components in a semiconductor circuit, for example analog / digital converters, timer elements, interrupt controllers, communications. It can also be applied to a controller or a control unit.

以下では、半導体回路のこのようなコンポーネント全体を機能ユニットという用語でまとめる。   In the following, all such components of a semiconductor circuit are summarized in terms of functional units.

1つの別の有利な実施例によれば、これまで説明した本発明が他の記憶素子に対するECC保護といっしょに用いられる。この事例では高度な可用性をもつコンポーネントが得られることになり、これによればメモリも実行ユニットもフォールトトレランスに構成されており、したがって歩留まりを最大にすることができるし、動作中の最適なアベイラビリティも保証できる。   According to one further advantageous embodiment, the invention described so far is used together with ECC protection for other storage elements. In this case, the result is a highly available component that allows both memory and execution units to be configured for fault tolerance, thus maximizing yield and optimal availability during operation. Can also be guaranteed.

切替ロジックおよび処理ロジックを備えた一般的な切替コンポーネントを示す図Diagram showing a typical switching component with switching logic and processing logic 切替コンポーネントと記憶素子との接続について示す図Diagram showing connection between switching component and storage element 記憶素子を利用した歩留まり上昇のための基本的な方法について示す図The figure which shows the basic method for the yield rise which utilizes the memory element グレースフル・デグラデーション graceful degradation と緊急動作のケイパビリティを高めるための特別な方法について示す図Illustration showing a special way to increase graceful degradation and emergency action capabilities 切替コンポーネントと制御コンポーネントとの接続について示す図Diagram showing connection between switching component and control component 制御コンポーネントを利用した歩留まり上昇のための基本的な方法について示す図Diagram showing basic method for increasing yield using control component 実現可能な記憶素子の構造を示す図Diagram showing the structure of a possible storage element

Claims (42)

少なくとも2つの同じまたは同種の機能ユニットを備えたコンピュータシステムの制御方法において、
まえもって設定可能な条件に依存して機能ユニットのアクティブ化および/または非アクティブ化が行われることを特徴とする方法。
In a method for controlling a computer system comprising at least two same or similar functional units,
A method characterized in that the functional unit is activated and / or deactivated depending on pre-settable conditions.
請求項1記載の方法において、
機能ユニットのアクティブ化および/または非アクティブ化は、前記コンピュータシステムにおけるエラーを検出するための少なくとも1つの第1のステップおよび/または欠陥機能ユニットを識別するための少なくとも1つの第2のステップの結果に依存して行われることを特徴とする方法。
The method of claim 1, wherein
Activation and / or deactivation of a functional unit is a result of at least one first step for detecting an error in the computer system and / or at least one second step for identifying a defective functional unit. Depending on the method.
請求項1記載の方法において、
コンピュータシステムには少なくとも2つの同じまたは同種の機能ユニットが含まれており、
該コンピュータシステムにおける少なくとも2つの同じまたは同種のユニットにおける少なくとも2つの動作モード間で切り替えが行われ、第1の動作モードは比較モードに対応し、第2の動作モードはパフォーマンスモードに対応することを特徴とする方法。
The method of claim 1, wherein
The computer system includes at least two identical or similar functional units,
Switching between at least two operating modes in at least two identical or similar units in the computer system, wherein the first operating mode corresponds to the comparison mode and the second operating mode corresponds to the performance mode. Feature method.
請求項2または3記載の方法において、
前記比較モード中、比較すべき機能ユニットの出力信号におけるエラーが検出され、該比較モードは、前記コンピュータシステムにおけるエラーを検出するための第1のステップに対応することを特徴とする方法。
The method according to claim 2 or 3,
An error in an output signal of a functional unit to be compared is detected during the comparison mode, the comparison mode corresponding to a first step for detecting an error in the computer system.
請求項1から4のいずれか1項記載の方法において、
前記コンピュータシステムの選択された機能ユニットが動作モードに切り替えられ、該動作モード中、欠陥のある機能ユニットの識別が、該機能ユニットの出力信号と基準値との比較により行われ、
前記動作モードは、コンピュータシステムにおける欠陥のある機能ユニットを識別するための第2のステップに対応することを特徴とする方法。
The method according to any one of claims 1 to 4, wherein
The selected functional unit of the computer system is switched to an operating mode, during which the defective functional unit is identified by comparing the output signal of the functional unit with a reference value,
The method of operation, wherein the mode of operation corresponds to a second step for identifying defective functional units in a computer system.
請求項5記載の方法において、
前記基準値はコンピュータシステムの記憶装置に格納されており、動作モードへの切替時にエラー検出のため該記憶装置から読み出されることを特徴とする方法。
The method of claim 5, wherein
The reference value is stored in a storage device of a computer system, and is read from the storage device for error detection when switching to an operation mode.
請求項3または請求項5記載の方法において、
少なくとも2つの動作モード間の切り替えは前記コンピュータシステムの動作中、周期的にまたは要求に応じて行われることを特徴とする方法。
The method according to claim 3 or claim 5, wherein
Switching between at least two operating modes is performed periodically or on demand during operation of the computer system.
請求項7記載の方法において、
少なくとも2つの動作モード間の切り替えは、エラー検出のためおよび/または欠陥のある機能ユニットの識別のために行われることを特徴とする方法。
The method of claim 7, wherein
A method characterized in that switching between at least two operating modes is performed for error detection and / or for identification of defective functional units.
請求項1から8のいずれか1項記載の方法において、
少なくとも欠陥があると識別されたコンピュータシステムの機能ユニットに対し、コンフィギュレーションステータスおよび/またはエラーステータスが形成されることを特徴とする方法。
A method according to any one of claims 1 to 8,
A method wherein a configuration status and / or an error status is formed for at least functional units of a computer system identified as defective.
請求項9記載の方法において、
機能ユニットの非アクティブ化は、該機能ユニットのコンフィギュレーションステータスまたはエラーステータスに関する情報を記憶装置に格納することにより行われ、該情報は半導体システムの初期化時および/または動作中に読み出し可能であり、格納されている情報が処理されて、非アクティブであると表されたユニットの使用が動作中不可能にされることを特徴とする方法。
The method of claim 9, wherein
Deactivation of a functional unit is performed by storing information about the configuration status or error status of the functional unit in a storage device, which can be read during initialization and / or operation of the semiconductor system. A method characterized in that the stored information is processed to disable the use of a unit represented as inactive during operation.
請求項1から10のいずれか1項記載の方法において、
前記コンピュータシステムのアクティブ化可能および/または非アクティブ化可能なすべての機能ユニットに対し、コンフィギュレーションステータスおよび/またはエラーステータスが形成されることを特徴とする方法。
The method according to any one of claims 1 to 10, wherein:
A method wherein a configuration status and / or an error status is formed for all functional units of the computer system that can be activated and / or deactivated.
請求項11記載の方法において、
アクティブ化可能および/または非アクティブ化可能な機能ユニットのコンフィギュレーションステータスおよび/またはエラーステータスに関する情報は記憶装置に格納されることを特徴とする方法。
The method of claim 11 wherein:
A method, characterized in that information on the configuration status and / or error status of functional units that can be activated and / or deactivated is stored in a storage device.
請求項1記載の方法において、
前記コンピュータシステムには少なくとも2つの同じまたは同種の機能ユニットが含まれており、
該コンピュータシステムにおける同じまたは同種の機能ユニットのうち少なくとも1つは標準に従い非アクティブ状態にあることを特徴とする方法。
The method of claim 1, wherein
The computer system includes at least two identical or similar functional units;
A method wherein at least one of the same or similar functional units in the computer system is inactive according to a standard.
請求項13記載の方法において、
非アクティブ状態にされた機能ユニットのコンフィギュレーションステータスに関する少なくとも1つの情報は記憶装置に格納されていることを特徴とする方法。
14. The method of claim 13, wherein
A method characterized in that at least one piece of information relating to the configuration status of a deactivated functional unit is stored in a storage device.
請求項14記載の方法において、
欠陥のある機能ユニットの識別時または識別後、少なくとも欠陥があると識別された機能ユニットを非アクティブ状態にすることによって、前記コンピュータシステムの再コンフィギュレーションが行われることを特徴とする方法。
The method of claim 14, wherein
A method wherein the computer system is reconfigured at or after identifying a defective functional unit by deactivating at least the functional unit identified as defective.
請求項15記載の方法において、
エラーに基づき機能ユニットが非アクティブ状態にされたとき、該機能ユニットのコンフィギュレーションステータスおよび/またはエラーステータスに関する情報が記憶装置に書き込まれることを特徴とする方法。
The method of claim 15, wherein
A method, wherein when a functional unit is deactivated based on an error, information regarding the configuration status and / or error status of the functional unit is written to a storage device.
請求項15記載の方法において、
欠陥のある機能ユニットの識別時または識別後、コンピュータシステムの再コンフィギュレーションが行われ、欠陥があると識別された機能ユニットが非アクティブ状態にされて、標準に従い非アクティブ状態にされたが欠陥を伴わない機能ユニットがアクティブ状態にされることを特徴とする方法。
The method of claim 15, wherein
During or after identification of the defective functional unit, the computer system is reconfigured and the functional unit identified as defective is deactivated and deactivated according to the standard A method characterized in that a functional unit not accompanied is activated.
請求項3記載の方法において、
エラーを検出するための前記第1のステップは、比較モード中のコンピュータシステムにおける少なくとも2つの同じまたは同種の機能ユニットの規定どおりの動作に対応することを特徴とする方法。
The method of claim 3, wherein
Method according to claim 1, wherein the first step for detecting an error corresponds to a prescribed operation of at least two identical or similar functional units in a computer system in a comparison mode.
請求項18記載の方法において、
欠陥のある機能ユニットを識別するための前記第2のステップは、少なくとも1つの機能ユニットにおけるエラー検出ルーチンの処理および該エラー検出ルーチンの結果と基準値との比較の処理に対応することを特徴とする方法。
The method of claim 18, wherein:
The second step for identifying a defective functional unit corresponds to a process of an error detection routine in at least one functional unit and a process of comparing the result of the error detection routine with a reference value. how to.
請求項19記載の方法において、
欠陥のある機能ユニットを識別するための前記ステップの実行前または実行にあたり、前記コンピュータシステムの再コンフィギュレーションが行われ、該再コンフィギュレーションによって、種々の機能、命令、プログラムセグメントまたはプログラムが同じまたは同種の機能ユニットにおいて実行可能となることを特徴とする方法。
The method of claim 19, wherein
Before or during execution of the steps for identifying defective functional units, the computer system is reconfigured so that the various functions, instructions, program segments or programs are the same or similar. A method characterized in that it can be executed in any functional unit.
請求項19記載の方法において、
前記エラー検出ルーチンの基準値は該エラー検出ルーチンといっしょに記憶装置に格納されていることを特徴とする方法。
The method of claim 19, wherein
A reference value for the error detection routine is stored in a storage device together with the error detection routine.
請求項19記載の方法において、
欠陥のある機能ユニットの識別時または識別後、前記コンピュータシステムの再コンフィギュレーションが行われて、少なくとも欠陥があると識別された機能ユニットが非アクティブ状態にされることを特徴とする方法。
The method of claim 19, wherein
A method characterized in that upon or after identification of a defective functional unit, the computer system is reconfigured so that at least the functional unit identified as defective is deactivated.
請求項22記載の方法において、
エラーに基づき機能ユニットが非アクティブ状態にされたとき、該機能ユニットのコンフィギュレーションステータスおよびエラーステータスが記憶装置に書き込まれることを特徴とする方法。
The method of claim 22, wherein
A method wherein when a functional unit is deactivated based on an error, the configuration status and error status of the functional unit are written to a storage device.
請求項22記載の方法において、
前記コンピュータシステムの再コンフィギュレーション前に第1の動作モードにおいて処理するために定められた機能、命令、プログラムセグメントまたはプログラムの少なくとも一部分は、前記コンピュータシステムの再コンフィギュレーション後、第2の動作モードにおいて処理されることを特徴とする方法。
The method of claim 22, wherein
At least a portion of a function, instruction, program segment or program defined for processing in a first mode of operation prior to reconfiguration of the computer system is stored in the second mode of operation after reconfiguration of the computer system. A method characterized in that it is processed.
請求項24記載の方法において、
前記第1の動作モードは比較モードに対応し、前記第2の動作モードはアクティブな機能ユニットのみによるパフォーマンスモードまたはエラーモードに対応することを特徴とする方法。
25. The method of claim 24, wherein
The first operating mode corresponds to a comparison mode, and the second operating mode corresponds to a performance mode or an error mode with only active functional units.
請求項15または請求項22記載の方法において、
機能ユニットの非アクティブ化は、前記コンピュータシステムの機能ユニットへのまたは各機能ユニット間の電気的な接続の遮断により不可逆的に行われることを特徴とする方法。
23. The method of claim 15 or claim 22, wherein
A deactivation of a functional unit is performed irreversibly by breaking an electrical connection to or between the functional units of the computer system.
請求項26記載の方法において、
コンピュータシステムにおける電気的な接続の遮断は、接続の少なくとも一部分に対する電気的な作用によって達成されることを特徴とする方法。
The method of claim 26.
The method of claim 1, wherein disconnecting an electrical connection in a computer system is accomplished by electrical action on at least a portion of the connection.
請求項1から27のいずれか1項記載の方法において、
機能ユニットのアクティブ化および/または非アクティブ化は前記コンピュータシステムの動作中、該コンピュータシステムの一部分であるかまたは該コンピュータシステムと常に接続されている装置を利用して行われることを特徴とする方法。
28. A method according to any one of claims 1 to 27.
Functional unit activation and / or deactivation is performed during operation of the computer system using a device that is part of the computer system or is always connected to the computer system. .
少なくとも2つの同じまたは同種の機能ユニットを備えたコンピュータシステムの制御装置において、
まえもって設定可能な条件に依存してコンピュータシステムにおける機能ユニットのアクティブ化および/または非アクティブ化を可能にする手段が設けられていることを特徴とする方法。
In a control device of a computer system comprising at least two same or similar functional units,
A method, characterized in that means are provided for enabling the activation and / or deactivation of a functional unit in a computer system depending on previously settable conditions.
請求項29記載の装置において、
前記コンピュータシステムにおけるエラー検出および/または欠陥のある機能ユニットの識別を可能にする手段が設けられていることを特徴とする装置。
30. The apparatus of claim 29.
Apparatus provided with means for enabling error detection and / or identification of defective functional units in the computer system.
請求項30記載の装置において、
切替手段が設けられており、該切替手段により、コンピュータシステムにおける少なくとも2つの同じまたは同種の機能ユニットの少なくとも2つの動作モード間で切替可能となり、第1の動作モードは比較モードに対応し、第2の動作モードはパフォーマンスモードに対応することを特徴とする装置。
The apparatus of claim 30, wherein
Switching means is provided, which enables switching between at least two operation modes of at least two same or similar functional units in the computer system, the first operation mode corresponding to the comparison mode, The operation mode of 2 corresponds to the performance mode.
請求項30記載の装置において、
前記コンピュータシステムの選択された機能ユニットを動作モードに切り替える手段が設けられており、該動作モード中、欠陥のある機能ユニットを該機能ユニットの出力信号と基準値との比較により識別可能であることを特徴とする装置。
The apparatus of claim 30, wherein
Means are provided for switching the selected functional unit of the computer system to an operation mode, and a defective functional unit can be identified during the operation mode by comparing the output signal of the functional unit with a reference value. A device characterized by.
請求項32記載の装置において、
比較手段が設けられており、該比較手段により、機能ユニットの出力信号が少なくとも1つの別の機能ユニットの出力信号または基準値と比較され、不一致が生じたときはエラー情報が生成されることを特徴とする装置。
The apparatus of claim 32.
Comparing means is provided for comparing the output signal of the functional unit with the output signal or reference value of at least one other functional unit and generating error information when a mismatch occurs. Features device.
請求項33記載の装置において、
機能ユニットの出力信号のための基準値を格納する記憶手段と、該記憶手段から比較手段へ基準値を供給する手段が設けられていることを特徴とする装置。
34. The apparatus of claim 33.
An apparatus comprising: storage means for storing a reference value for the output signal of the functional unit; and means for supplying the reference value from the storage means to the comparison means.
請求項29から34のいずれか1項記載の装置において、
前記コンピュータシステムのアクティブ化可能および/または非アクティブ化可能なすべての機能ユニットに対しコンフィギュレーションステータスおよび/またはエラーステータスを形成する手段が設けられていることを特徴とする装置。
35. Apparatus according to any one of claims 29 to 34.
Apparatus for providing a configuration status and / or error status for all functional units of the computer system that can be activated and / or deactivated.
請求項29から35のいずれか1項記載の装置において、
データを記憶する手段が設けられており、該手段に、アクティブ化可能および/または非アクティブ化可能な機能ユニットのコンフィギュレーションステータスまたはエラーステータスに関する少なくとも1つの情報が格納されることを特徴とする装置。
36. Apparatus according to any one of claims 29 to 35.
Means for storing data are provided, wherein said means stores at least one piece of information regarding the configuration status or error status of a functional unit that can be activated and / or deactivated .
請求項36記載の装置において、
前記データを格納する手段は不揮発性記憶手段であることを特徴とする装置。
The apparatus of claim 36.
The apparatus for storing data is a non-volatile storage means.
請求項29から37のいずれか1項記載の装置において、
初期化時および/またはコンピュータシステム動作中に前記記憶手段に格納されたコンフィギュレーションステータスおよび/またはエラーステータスを読み出し、読み出されたデータと前記比較手段のエラー信号に依存して前記機能ユニットのアクティブ化および/または非アクティブ化を実行可能な手段が設けられていることを特徴とする装置。
38. The apparatus of any one of claims 29 to 37.
Reads the configuration status and / or error status stored in the storage means at initialization and / or during computer system operation, and activates the functional unit depending on the read data and the error signal of the comparison means Means provided for enabling and / or deactivation.
請求項29から38のいずれか1項記載の装置において、
機能ユニットの非アクティブ化を不可逆的に実行可能な手段が設けられていることを特徴とする装置。
39. Apparatus according to any one of claims 29 to 38.
Means provided with means capable of irreversibly executing the deactivation of the functional unit.
請求項39記載の装置において、
機能ユニットの不可逆的な非アクティブ化のために該機能ユニットへのまたは該機能ユニット内での少なくとも1つの電気的な接続を遮断する手段が設けられていることを特徴とする装置。
40. The apparatus of claim 39.
A device characterized in that means are provided for interrupting at least one electrical connection to or within the functional unit for irreversible deactivation of the functional unit.
請求項40記載の方法において、
機能ユニットへのまたは機能ユニットにおける電気的な接続の遮断を、該接続の少なくとも一部分に対する電気的な作用によって達成可能な手段が設けられていることを特徴とする装置。
41. The method of claim 40, wherein
A device is provided, characterized in that a means can be provided for the disconnection of the electrical connection to or in the functional unit by electrical action on at least a part of the connection.
請求項29から41のいずれか1項記載の装置において、
エラー検出、機能ユニットのアクティブ化および/または非アクティブ化のための手段は、前記コンピュータシステムの一部分であるかまたは前記コンピュータシステムと常に接続されていることを特徴とする装置。
42. The apparatus according to any one of claims 29 to 41, wherein:
An apparatus characterized in that the means for error detection, functional unit activation and / or deactivation are part of or always connected to the computer system.
JP2008525512A 2005-08-08 2006-07-21 Computer system control apparatus and control method Withdrawn JP2009506406A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102005037262A DE102005037262A1 (en) 2005-08-08 2005-08-08 Device and method for controlling a computer system
PCT/EP2006/064490 WO2007017359A1 (en) 2005-08-08 2006-07-21 Device and method for controlling a computer system

Publications (1)

Publication Number Publication Date
JP2009506406A true JP2009506406A (en) 2009-02-12

Family

ID=37478820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008525512A Withdrawn JP2009506406A (en) 2005-08-08 2006-07-21 Computer system control apparatus and control method

Country Status (7)

Country Link
EP (1) EP1915691A1 (en)
JP (1) JP2009506406A (en)
KR (1) KR20080032167A (en)
CN (1) CN101238449A (en)
DE (1) DE102005037262A1 (en)
TW (1) TW200732907A (en)
WO (1) WO2007017359A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102017204691B3 (en) * 2017-03-21 2018-06-28 Audi Ag Control device for redundantly performing an operating function and motor vehicle

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3783250A (en) * 1972-02-25 1974-01-01 Nasa Adaptive voting computer system
US4356546A (en) * 1980-02-05 1982-10-26 The Bendix Corporation Fault-tolerant multi-computer system
US4327437A (en) * 1980-07-30 1982-04-27 Nasa Reconfiguring redundancy management

Also Published As

Publication number Publication date
WO2007017359A1 (en) 2007-02-15
TW200732907A (en) 2007-09-01
CN101238449A (en) 2008-08-06
KR20080032167A (en) 2008-04-14
EP1915691A1 (en) 2008-04-30
DE102005037262A1 (en) 2007-02-15

Similar Documents

Publication Publication Date Title
JP4458119B2 (en) Multiprocessor system and control method thereof
US10042791B2 (en) Abnormal interrupt request processing
JP4330547B2 (en) Information processing system control method, information processing system, information processing system control program, and redundant configuration control device
US8055960B2 (en) Self test apparatus for identifying partially defective memory
US7941699B2 (en) Determining a set of processor cores to boot
WO2018221136A1 (en) Abnormality determination device, abnormality determination method, and abnormality determination program
US8977895B2 (en) Multi-core diagnostics and repair using firmware and spare cores
US10114356B2 (en) Method and apparatus for controlling a physical unit in an automation system
WO2016203505A1 (en) Semiconductor device and diagnostic test method
US8713236B2 (en) Maintenance guidance display device, maintenance guidance display method, and maintenance guidance display program
JP2009514064A (en) Semiconductor circuit configuration apparatus and configuration method
JP2015115727A (en) Programmable logic device
JP5924819B2 (en) Data integrity processing apparatus and data integrity processing program
JP4973703B2 (en) Failure detection method and monitoring device
JP2009506406A (en) Computer system control apparatus and control method
US20040199824A1 (en) Device for safety-critical applications and secure electronic architecture
JP5691715B2 (en) FPGA, circuit reconfiguration system, method and program using FPGA
US8074018B2 (en) Disk array apparatus, and control method and control program recording medium
WO2008004330A1 (en) Multiple processor system
CN111045844A (en) Fault degradation method and device
JP2011154459A (en) Program abnormal operation detection device for computer system
TWI434159B (en) Dual system control device
JP6194496B2 (en) Information processing apparatus, information processing method, and program
JP2021149393A (en) Processor and method for attaining redundancy for processor
JP2015106226A (en) Dual system

Legal Events

Date Code Title Description
A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090313