EP1952239A1 - Vorrichtung und verfahren zum beheben von fehlern bei einem wenigstens zwei ausführungseinheiten mit registern aufweisenden system - Google Patents

Vorrichtung und verfahren zum beheben von fehlern bei einem wenigstens zwei ausführungseinheiten mit registern aufweisenden system

Info

Publication number
EP1952239A1
EP1952239A1 EP06807389A EP06807389A EP1952239A1 EP 1952239 A1 EP1952239 A1 EP 1952239A1 EP 06807389 A EP06807389 A EP 06807389A EP 06807389 A EP06807389 A EP 06807389A EP 1952239 A1 EP1952239 A1 EP 1952239A1
Authority
EP
European Patent Office
Prior art keywords
data
register
registers
error
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
EP06807389A
Other languages
English (en)
French (fr)
Inventor
Werner Harter
Eberhard Boehl
Thomas Lindenkreuz
Thomas Kottke
Peter Tummeltshammer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Publication of EP1952239A1 publication Critical patent/EP1952239A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1629Error detection by comparing the output of redundant processing systems
    • G06F11/1641Error detection by comparing the output of redundant processing systems where the comparison is not performed by the redundant processing components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1405Saving, restoring, recovering or retrying at machine instruction level
    • G06F11/1407Checkpointing the instruction stream
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1629Error detection by comparing the output of redundant processing systems
    • G06F11/165Error detection by comparing the output of redundant processing systems with continued operation after detection of the error

Definitions

  • the invention relates to an apparatus and a method for correcting errors in a system or processor having at least two register units and a corresponding processor according to the preambles of the independent claims.
  • transient errors Due to the ever smaller semiconductor structures, an increase in transient, i. temporary processor errors expected z. B. caused by cosmic radiation. Even today transient errors occur, which are caused by electromagnetic radiation or interference in the supply lines of the processors.
  • Such a dual-core processor or processor system consists of two execution units, in particular two CPUs (master and checker), which process the same program in parallel or with a time delay.
  • the two CPUs Central Processing Unit
  • Both CPUs receive the same input data and operate the same program, but the outputs of the dual core are driven exclusively by the master.
  • the outputs of the master are compared with the outputs of the checker and thereby checked. If the output values of the two CPUs do not match, this means that at least one of the two CPUs is in a faulty state.
  • a comparator compares the outputs (instruction address, data out, control signals) of both cores (all comparisons take place in parallel):
  • the signals from b - d are used to control the data memory or external modules.
  • a possible error is signaled to the outside and leads in the standard case to switch off the affected control unit. This process would lead to a more frequent shutdown of ECUs with the expected increase in transient errors. Since there are no hardware-related damage to the computer in the case of transient errors, it would be helpful to make the computer available to the application as quickly as possible without the system having to be switched off or a restart having to take place. Methods that eliminate transient errors while avoiding a complete restart of the processor are only occasionally found for processors working in Master / Checker operation.
  • micro rollback The basic idea of the method described here (micro rollback) is to expand each component of a system independently with rollback capability in order to be able to roll back the entire system state in a consistent manner in the event of an error.
  • the architecture-specific relationship of the individual components (register, register file, ...) to one another does not have to be considered here, because the whole system state is always rolled back consistently by rollback.
  • the disadvantage of this method is a large hardware overhead that grows in proportion to the system size (e.g., number of pipeline stages in the processor).
  • Applicant's non-prepublished application 102004058288.2 discloses a method and apparatus for debugging a processor having two execution units and a corresponding processor, wherein registers are provided in which instructions and / or information associated therewith can be stored, the instructions be executed redundantly in both execution units, and comparison means such as a comparator are provided, which are designed such that a deviation and thus an error is detected by a comparison of the instructions and / or the associated information, wherein a division of the registers of the processor into first registers and second registers is predetermined the first registers are designed such that a predeterminable state of the processor and contents of the second registers are derivable therefrom, wherein buffers are contained as means for rolling back, which are designed such that at least one instruction and / or the information in the first registers rolled back and re-executed and / or restored.
  • a shadow register is an additional register (copy, redundant register) into which the same data is always written as in the original register. In case of errors in the original register, the shadow register is switched over or the data is transferred from the shadow register to the original register. It makes sense, but not necessary, to divide the set of all registers of a CPU into two subsets, "Essential Registers" and "Derivable Registers". The Essential Registers are designed in such a way that the contents of Derivable Registers can be derived from them.
  • a significant advantage of the invention is that no significant intervention in processors is necessary. It is sufficient to lead a few lines to the outside. Thus, the solution according to the invention can be realized without having to develop and produce new processors or systems. This leads to a significant cost and time savings.
  • the solution according to the invention is application-independent, ie software-independent.
  • no rollback points have to be defined. Troubleshooting is performed at the hardware level, which eliminates the need for software customization.
  • recovery can be accelerated by the solution according to the invention.
  • task repetitions and resets which are customary in the state of the art, which are usually several thousand or a few million. claiming a number of clock cycles, only a few hundred clock cycles are claimed in the solution according to the invention. This time is mainly determined by the size of the shadow register and the latency of write accesses to the data store of the execution units.
  • the contents of the shadow registers are read from the execution units to the internal registers, whereby a consistent processor state is established.
  • the registers of all execution units can be filled from the shadow registers, but it is also possible to fill the registers of an execution unit from the shadow registers and to fill the registers of the remaining execution units from the registers of the first CPU, etc.
  • the device according to the invention can be both integrated Be part of the associated system, ie For example, be formed integrated into a dual-core processor, as well as be formed as a separate module that is added to a system.
  • the invention may be used to advantage for control devices in a motor vehicle, but is not limited to such use.
  • shadow register for a processor or program status word (PSW), a register file and / or an instruction address are provided in the invention.
  • a register file or register bank or register area is a collection of registers.
  • sufficient shadow registers are provided to mirror the (essential) registers of an execution unit.
  • the shadow registers are described with contents of the registers of the at least two execution units or data relating generally to the contents or data of the registers. From the content of the Thus, in the event of an error, a fault-free state of the execution units, in particular the immediately preceding fault-free state, can be restored.
  • data is written for the register file and the PSW provided for the at least two execution units.
  • the writing process takes place especially after a comparison of these data, and only in the event that no deviation, so no error was found.
  • By comparing the registers associated with the execution units prior to writing the shadow registers it is possible to ensure that error-free data is written to the shadow registers.
  • the data for the shadow registers can be obtained in particular from the execution units by taking out the relevant signals, for example the write back bus. This requires only a minor design or hardware change requirement.
  • At least one shadow register is faded into the memory area of at least one execution unit. In this way, the shadow register can be read out by the at least one execution unit quickly and easily.
  • instructions are executed from an instruction memory of the system having at least two execution units, wherein address and write signals for the at least one shadow register are obtained.
  • An instruction decoder which may be provided for the solution according to the invention, preferably decodes instructions from the instruction memory and generates the address and write signal for the at least one shadow register.
  • An instruction decoder designed in this way can also be dispensed with if this information, ie the address and write signals, is obtained from the at least two embodiments. brought out units, compared with each other and used to control the at least one shadow register.
  • the at least one shadow register is assigned a parity for determining the correctness of the data in the shadow register. This makes it easy to ensure that there are no erroneous data in the shadow register. However, this is not necessary if you ensure by software that the register file and thus also the shadow register file are regularly completely rewritten, as this overwrites existing errors in the shadow register file.
  • the correctness can be checked by means of the provided parity. If the data in the shadow register is no longer correct, restarting the system may be appropriate. Since the shadow register is read-only in the event of an error (error does not mean errors in the shadow register, but errors in the CPUs), a complete rewriting of the shadow registers is also possible.
  • the data relating to the register are the data, in particular error-free, of the registers themselves, error-free data being restored in at least one register by transmitting the data from the shadow register to the at least one register.
  • a shadow register contains the data of a register of an execution unit in the last error-free state, whereby error can be restored by exchanging or transferring this data in the case of an error.
  • the error-free data of the register-related data may in particular be a parity, CRC or the like.
  • the data storage requirement of the shadow register is advantageously smaller than the size of a register of at least one execution unit. This way, storage space can be inside of the shadow register can be saved or the memory of the shadow register can be made smaller.
  • To restore error-free data in a register of at least one execution unit then complete data must first be restored from the checksums, as is known in the art. If only parities are stored in the shadow registers, at least two CPUs must be provided. In the event of an error, the parities of the registers of the two CPUs are compared with the shadow parities. This 3-fold comparison makes it possible to determine which CPU is faulty and to replace the incorrect register contents with the register contents of the functioning CPU.
  • data from at least two registers and at least one shadow register are compared and the data determined to be error-free, which coincide mainly.
  • This procedure can be referred to as voting or majority voting.
  • the data from at least three registers at least two registers of the execution units and a shadow register
  • the data are determined to be free of errors, the majority of which match.
  • This method can advantageously be used in particular if, to increase the processing speed, the at least one shadow register is already described before a check of the correctness of the registers of the execution units has taken place.
  • a processor according to the invention has at least two execution units with registers and at least one device according to the invention. This allows the operation of at least two execution units with registers having a processor, especially a dual-core processor, since transient errors can be easily and quickly remedied.
  • the processor has switching means for switching between a safety mode and a performance mode, wherein the at least two execution units execute the same program in the safety mode and execute various programs in the performance mode.
  • this includes, in particular, different parts of a program (parallel processing, multi-threading, symmetric multiprocessor system SMP, etc.).
  • the at least two execution units can be clocked offset or clock-synchronized in both modes, as it is described several times in this application. What is essential is a combination of recovery mechanism and reconfiguration mechanism. This allows the use of both methods and creates more flexibility between security and performance of the system used.
  • a mode switch module may be provided which provides a mode signal.
  • the core mode signal must be routed to the recovery device, as recovery can only be used in security mode.
  • various tasks are performed by computers.
  • comfort functions eg climate control
  • safety functions with different levels of safety requirements (see Motor Control and Electronic Stability Program).
  • the program code can be subdivided into three classes: Program code, where permanent and transient errors must be detected online (eg ESP or x-by-wire applications), program code in which the used hardware must be regularly tested for permanent faults (eg: engine control, sunroof control), - program code that is not relevant to safety (eg air conditioning control).
  • ESP permanent and transient errors must be detected online
  • program code in which the used hardware must be regularly tested for permanent faults eg: engine control, sunroof control
  • - program code that is not relevant to safety eg air conditioning control
  • safety mode the two processors operate the same program code, also clocked off, and different tasks in the performance mode. For applications that need to be run on tested hardware, this can be done alternately in security and performance mode.
  • the hardware is tested in safety mode by the redundancy of the two processors and the software thus runs in performance mode on tested hardware. The distribution of how often the software has to be executed in which mode is dependent on the required error detection time, ie how long a maximum error may affect, without the application causing any damage.
  • means for emptying (flushing) a cache memory are provided. This can be prevented in a simple way that data remains from the performance mode are taken over in the recovery device.
  • a switch is made between a safety mode and a performance mode. switches, wherein in the security mode, a method according to the invention for correcting errors is executed and in perfomance mode the at least two execution units execute different programs or program parts or tasks. It is possible to switch over between the modes advantageously via a mode select signal.
  • An inventive control device for a motor vehicle has a device according to the invention or a processor according to the invention.
  • vehicle control units can be improved safety and performance side.
  • Figure 1 shows a block diagram of a dual-core processor system incorporating a preferred embodiment of the device according to the invention
  • FIG. 2 shows a schematic representation of the preferred embodiment of the device according to the invention from FIG. 1;
  • FIG. 3 shows a schematic representation of the dual-core processor
  • FIG. 4 shows a block diagram of a dual-core processor system for which a preferred embodiment of the device according to the invention can be provided.
  • FIG. 5 shows a detail of a block diagram of a preferred embodiment
  • Embodiment of the device according to the invention which can be provided in particular for a dual-core processor system according to FIG.
  • FIG. 1 schematically shows a dual-core or dual-core processor system 100 which has a preferred embodiment of the device (recovery device) 120 according to the invention. Furthermore, the system has an instruction memory 130 and a data memory 140.
  • the dual-core processor system 100 has two execution units (CPUs, cores), a master 101 and a checker 102, which process a program in parallel.
  • the output of data to the periphery (application system) occurs only if the data of Master and Checker match.
  • the recovery device is stored externally, ie not integrated in the cores. Therefore, modifications to the CPUs 101, 102 are particularly advantageous except for the removal of certain internal signals necessary.
  • the internal structure of the recovery device is described in more detail in FIGS. 2 and 3.
  • the instruction memory 130 of the system is implemented as read-only memory (ROM).
  • the addresses for the instructions are routed to it via a connection 110.
  • the instruction memory 130 After applying an instruction address via the connection 110, the instruction memory 130 returns the corresponding instruction (instruction) via a connection 111.
  • the command is supplied to both CPUs 101 and 102.
  • the instruction memory 130 is implemented as standard in the illustrated embodiment. It is not changed by the provision of the recovery device 120.
  • only the addresses of the master 101 are supplied to the instruction memory 130, while the addresses of the checker 102 are only fed to a comparator (comp) 126a, which generates an error signal (Error) if addresses or Address parity of Master and Checker do not match.
  • the parities are generated by parity generators 126b and parity check 126c. These parity generators / checkers are used to protect the single point of failure path via the memory.
  • the data memory 140 of the system is designed as a read-write memory, also called Random Access Memory (RAM). It is supplied via a connection 112 (Data Address / Data Out) addresses and data. Furthermore, it outputs corresponding data to the CPUs via a connection 113 (Data In). As can be seen more clearly in FIG. 3, these are the output lines of data addresses and data of master and checker. Here, the addresses and data for the data memory 140 and for the shadow register file 121 included in the recovery device 120 are output. Master and Checker data input lines 113 normally transmit the contents of the external data memory.
  • RAM Random Access Memory
  • parity generators 126b and parity check 126c serve to secure the single point of failure path via the memory.
  • the data as well as the command memory represent weak points of the system, so-called single points of failure, since they only exist once in the system. It is therefore advisable to protect the two memories, for example by ECC (error correcting codes) or other methods known in the art (secure memory).
  • ECC error correcting codes
  • the write back bus an internal bus, is routed via a line 114 to the recovery device 110.
  • computational results or data are written to the internal register file of the CPU by various processing units such as ALU (Arithmetic and Logical Unit) or Data RAM.
  • ALU Arimetic and Logical Unit
  • Data RAM Data RAM
  • the respective program or processor status word of master 101 and checker 102 is output via a line 115 (PSW Out).
  • the processor status word provides information about the results of the execution of the instruction in the program sequence, eg is encoded in flags (corresponding bits of the PSW) whether the result of arithmetic operations is zero or negative (zero flag) or whether an overflow has occurred (carry flag).
  • the PSW contains information about the interrupt status of the CPU. With the knowledge or restoration of the processor status word, a program can be continued correctly at the interrupted point.
  • a program interruption of the currently running program can be performed.
  • the interrupt line is used to cause the two CPUs 101 and 102 to load the PSW and register file data from the external recovery module 120 to replace their possibly wrong data with correct data.
  • the source of the line 116 corresponds in FIGS. 2 and 3 to the signal Error Out, which is generated by the comparator 126 or 126a (comp).
  • the internal structure of the recovery device 120 of Figure 1 is shown schematically. For reasons of clarity, the clock skew between the two CPUs was omitted in this block diagram. However, it is understood that a clock offset can also be provided.
  • the recovery device has a register file 121 and a PSW register 122 as shadow registers.
  • the register file 121 contains at least as many registers as the master 101 or the checker 102 or at least as many registers as are necessary for restoring the relevant application (Essential Registers). For writing, it is automatically addressed by a command decoder 123. For reading, it is addressed via the line 112 (Data Address / Data Out) of the master. In operation, the data is written from the write back bus over line 115 and, in the event of an error, read from the data out outputs of the register file to the data in inputs of the CPUs via line 117. Alternatively, the data can also be described by the Data Out of the master. This is not necessary for the presented recovery device, but does not represent any significant hardware overhead, and offers the possibility of using the shadow register in another form (eg as additional memory).
  • the shadow registers are preferably displayed in the memory address area. Then it can be accessed by simple write or read operations.
  • the execution units or CPUs 101, 102 access the shadow registers only in the event of an error and only read, since the write accesses are performed by the command decoder 123 provided in this preferred embodiment of the device according to the invention.
  • the PSW register 122 when the comparison of the signals PS W Out of the master and the checker indicates no error, is described with the signal PS W Out of the master 101 via line 115.
  • the PSW register can also be addressed by the Data Address / Data Out signals of the master and written with the Data Out signal of the master. This procedure may be useful for possible extensions.
  • the PSW is read out via PS W Out and provided together with Data Out from register file 121 on line 117. As shown in FIG. 1, this line is connected to Data In of Master and Checker, again only being accessed in the event of an error.
  • line 116 is routed out of the recovery device by a comparator / parity unit 126 as described in Figure 1 and to register file 121 and PSW register 122 to ensure that there are no errors Data is stored in the shadow register.
  • the comparator / parity unit 126 is composed of at least one comparator 126a.
  • at least one parity generator 126b and / or at least one parity checker 126c are additionally provided. If an error is detected in the comparator / parity unit 126, the current data word (which has been identified as erroneous) may no longer be written to the shadow registers. However, after the triggering of an interrupt routine in the processor cores requires a few clock cycles, the connection shown can Writing can be prevented if the shadow register is set up accordingly.
  • the comparator / parity unit 126 contains all comparison and parity circuits, in order in particular to represent the following functions:
  • Parity generator for the signal Instruction Address of the master and Comparator for Instruction Address of Master and Checker, wherein the data is supplied via line 110. Parity generator for the signals Data Address and Data Out of the master
  • an interrupt routine is started in the CPUs by means of which the data from the shadow register 121, 122 are transferred to the registers of the two CPUs 101, 102 in the present example. If, for example, the PSW can not be written in a CPU, the PSW 25 or its bits can be set by an appropriate software routine in the interrupt routine. (For example, an overflow overflow can be done if the overflow flag must be set). Subsequently, both CPUs 101, 102 continue to operate with correct register contents.
  • the device 120 also includes the command decoder 123 to recognize the commands that the register describe terfile.
  • the command decoder generates for these commands the address for the registers of the register file to be addressed as well as the write signal.
  • the decoder receives the instruction delayed by one clock and outputs at the output and the write signal for the register file 121.
  • a unit 124 is provided for the clock delay by one clock.
  • the signal Instruction Address is delayed by two clock delay unit 125 by two clocks to the register file 121 out.
  • the instruction address is additionally delayed by one clock to the register file since, in the case of an interrupt, the instruction address must be stored from a different pipeline stage than during a jump however, are processor-specific details that are not directly related to the recovery device.
  • the register file stores the current instruction address in the case of a jump instruction.
  • the instruction address is passed through the pipelines within the processor. It would also be possible to obtain the jump address by taking another bus out of the CPU, but the presented external continuation can minimize interference with the cores.
  • the signal Error Out is provided to the input Interrupt of Master and Checker. Error Out becomes active when the comparator / parity unit 126 of the recovery extension 120 detects a deviation between master and checker.
  • FIG 3 the internal structure of the dual-core processor system of Figure 1 is shown schematically. For reasons of clarity, the clock skew between the two CPUs has also been omitted in this block diagram.
  • master 101 and checker 102 are shown separately, which also follows the separate representation of lines 110 to 117.
  • the line 112 is duplicated, which should represent the two signals Data Address and Data Out.
  • the units of the recovery device namely register file 121, PSW register 122, decoder 123, clock delay units 124, 125 and comparator / parity unit 126 as well as the instruction memory 130 and the data memory 140 are shown.
  • the subunits 126a, 126b, 126c of the comparator / parity unit 126 are spatially separated in the diagram.
  • FIG. 4 schematically shows a dual-core processor system for which a preferred embodiment of the device according to the invention can be provided.
  • This block diagram shows a reconfigurable system that can be switched between a performance mode and a safety mode.
  • the reconfigurable two-processor system In order to meet the requirement for high computational performance or security, the reconfigurable two-processor system must be switchable in operation between the two modes.
  • safety mode which is used in the processing of safety-relevant program code
  • the system operates in the classic Master / Checker mode, an embodiment of the device according to the invention being used.
  • the system operates like a two-processor system, in particular having the performance of a conventional two-processor system.
  • Switching between the two modes is done by the operating system through a special instruction, the mode switch command.
  • This instruction is preferably detected outside the processor by a processor-external unit and converted into a NoOperation instruction, before being sent to the processor. sor is passed on. This avoids interference with the command decoder of the two processors.
  • both cores work off the same program. Since some components are simply present (e.g., buses, clock line, and supply voltage), they should be specially protected. To additionally protect the system against Common Cause errors such as EMC or voltage spikes on the supply voltage, the two processors can work in this mode with a clock offset.
  • the CPUs work different programs or program parts or tasks and thus achieve higher performance and computing power than a single CPU.
  • Each CPU can control the instruction memory, the data memory and the peripherals. Therefore, the clock of these components and the CPUs must be in phase in performance mode. If there is no clock switching of a CPU when switching from the safety mode to the performance mode, then in performance mode it would have to perform a wait cycle each time it accesses the peripherals until it receives the data. Since this results in a high performance penalty, the clock of this CPU for the performance mode is switched to the phase polarity of the master clock. To do this, the clock offset must be switched off in the performance mode.
  • the accesses must be managed by special units (instruction RAM control unit, data RAM control unit). Since memory accesses to the instruction memory in each clock can now be performed by both CPUs, these accesses must be decoupled by one instruction cache per CPU, so that the instruction memory does not become the power-limiting factor.
  • the cache controllers use a Burst access of four instructions to the instruction memory. However, it is not necessary to decouple the data accesses of the two CPUs to the data memory through a cache, since, for example, in automotive applications only every 10th instruction is a data memory access. If this distribution changes, a data cache can be provided for each CPU. In summary, therefore, it is an extension of a system that has a recovery functionality to provide performance functionality.
  • the two CPUs work the same commands and behave identically.
  • the internal states of the two CPUs i. the data in the registers and the instruction caches will be identical.
  • the two CPUs operate on different instructions, and thus the internal processor states are also different. Therefore, the data in the two CPUs and in the instruction caches must be synchronized before switching from the performance to the secure mode.
  • a command is required to switch the two-processor system between the two modes. Calling the command initiates the mode change. Switching from the performance mode to the safety mode is advantageously stored in the time tables for both CPUs. Usually a CPU will start the mode switching first. This starts the mode change and informs the second CPU at the same time by an interrupt that it should also change the mode.
  • each CPU has the option of performing at least two atomic accesses to the data memory. These non-interruptible memory accesses are necessary for synchronization of the shared data of both processors or also for task synchronization.
  • a CPU To ensure data consistency in performance mode, it is necessary for a CPU to be able to read a value from the data store and then modify that value modified without interruption by another CPU. This is ensured in particular by the fact that, as soon as a specific memory area is accessed, data memory accesses for other CPUs are prevented by the creation of a wait command.
  • the CPU can release the data memory for other CPUs by means of another data memory access to the reserved address.
  • the ability to block memory access for other CPUs can be used in software to implement techniques to allow shared memory access to data, or the CPUs can synchronize with each other through task processing ("semaphore") confused with the synchronization with which the security mode can be changed).
  • the switching means for switching between the modes are thus designed as a mode switch unit 407.
  • the use of the recovery device is only intended in security mode. Therefore, it is convenient to pass a core mode signal, which outputs the mode switch unit, to the recovery device.
  • the recovery device can be designed to be switched on and off by the core mode signal. It can also be provided The recovery device in the performance mode, for example, by a clock enable signal completely shut down to reduce power consumption.
  • a dual-core processor system for which a preferred embodiment of the device according to the invention may be provided, is indicated as a whole by 400.
  • the system includes two CPUs, master 101 and checker 102, instruction memory 130, and data memory 140.
  • the memories are not duplicated, but are executed as secure storage, as explained above. They can also be duplicated.
  • ICU instruction storage control unit
  • the ICU manages all accesses of the two CPUs 101, 102 to the common instruction memory 130.
  • the ICU In the secure mode, only the master 101 is allowed to request instructions from the instruction memory in case of a cache miss.
  • the ICU then not only loads the one instruction, but preferably executes a burst access to reload the cache line in one piece.
  • an instruction cache 402 of the master 101 receives the instructions directly, while an instruction cache 403 of the checker 102 receives the instructions later by an intended clock offset.
  • the ICU unit 401 Since in performance mode the two CPUs can simultaneously request instructions from the instruction memory 130, the ICU unit 401 must prioritize the accesses. Normally, the master has the higher priority. However, in order not to totally slow down the checker in the worst case, the checker has the higher priority if in the clock cycle before the master had access to the instruction memory 130.
  • the DCU 404 is a data storage controller (DCU).
  • the DCU 404 manages the accesses of the two CPUs to the data memory 140 and the peripheral. In addition, it still needs to provide an individual processor identification bit. Based on this bit in the performance mode, the two CPUs be distinguished from the operating system. This bit can be read by a read access to a specific memory address. For example, while the address is the same for both CPUs, the master gets an O back while the checker gets a 1. If more than two CPUs are provided, more bits must be used accordingly.
  • the DCU 404 In performance mode, the DCU 404 must resolve the concurrent accesses of the two CPUs to the data memory 140 and to the peripheral. Basically, the same prioritization takes place as with the ICU 401.
  • a sepa- rate mechanism is implemented to allow the data memory to be locked to the other CPU (similar to the MESI protocol):
  • the prioritization is the same as for the data storage accesses. With a simultaneous blocking request from both CPUs, the master first receives the exclusive access rights.
  • the implementation of the memory lock mechanism is done in the DCU to use standard processors.
  • the functionality of the memory lock mechanism consists of 6 states: corel_access-. Memory access from Master. If the master wants to lock the memory, he can do so in this state. core2_access-. Memory access by Checker. If the checker wants to lock the memory, he can do that in this state. coreljocked: Master 1 has locked the data store. He has exclusive access to the data storage and peripherals. If the checker wants to access the memory in this state, it will be replaced by the
  • Mode Switch Detect units 405 and 406 are Mode Switch Detect units.
  • the mode switch detect units each sit between the instruction cache 402 or 403 and the CPU and observe the command bus. As soon as they notice the mode-switch instruction, they communicate this to a mode switch unit 407.
  • This functionality could also be done by the command decoder of the two processors.
  • standard processors are to be used here without an internal change, this is implemented externally.
  • the disadvantage is that the command is recognized as soon as it is read from the memory. If a jump instruction is now in the program sequence before, the switchover instruction is nevertheless active, although it would actually be deleted in the pipeline due to the jump. Thus, the system would erroneously change mode.
  • this problem can be solved by reordering the instructions by the compiler so that there is no jump instruction before the mode-switch instruction. The necessary distance between the jump command and the mode switch command depends on the number of pipeline stages of the CPUs used.
  • the mode switching is done by the software.
  • the necessary hardware support is implemented in the mode-switch unit 407.
  • the following program extract shows, for example, the changeover from the safety to the performance mode:
  • the mode switch detect unit of the master first detects the switchover command. This informs them by the signal corel_signal of the mode-switch unit, which as a consequence stops the checker by the waitl signal. 1.5 bars later, the Checker's Mode-Switch Detect unit also detects the toggle command. The mode switch unit then stops the checker for half a clock to synchronize the clock signals of the two CPUs in phase. Finally, the mode signal is switched from the safety mode to the performance mode and the wait signals are removed.
  • step (3) the two CPUs now load their processor identification bit from the DCU. Then (4) is checked to see if the bit is set to 0 or 1 and a conditional jump is made by Checker (5) because its Coreld bit is 1. The master does not jump, but works on this Program position further because its core id bit is 0. Thus, the program sequence of the two CPUs - as desired - separated.
  • the recovery device is first activated via the core mode signal. Subsequently, the cache is flushed (flushed) to prevent data remains from being taken over into the recovery device. Then the register contents of the two processors are adapted via a software routine, which also describes the shadow registers in the recovery device. Therefore, no software adjustments to the recovery device are necessary except for the cache flush.
  • FIG. 5a and FIG. 5b are referred to together as FIG.
  • FIG. 5a shows an example of three clocks, shown in FIG. 5b for two clocks.
  • FIG. 5 for reasons of clarity, only the structure relating to the register file 121 is shown. The structure regarding the PSW register does not differ from this.
  • master 101 and checker 102 provide data of recovery device 120 via lines 110, 112, 114, and 115.
  • separate clocks 203 and 204 are provided for master 101 and checker 102.
  • these clock encoders are formed integrated into the cores. In this case, the clock signal (clk) must be brought out. The two processors are no longer working synchronously. Therefore, care should be taken when writing to the recovery device that the two CPUs are not too far apart (i.e., the clock skew must not be too large).
  • FL core buffer stages 201, 202 driven by the core clocks 203, 204 are used
  • the shadow register file 121 and the PSW register 122 are clocked with a separate clock generator 205.
  • the shadow register file 121 as well as the PSW register 122 are clocked by the core clocks 203, 204.
  • the register file must be written asynchronously.
  • the writing process is controlled by the comparator / parity unit 126, which sends a write signal each time two new matching data words are present. If the data words do not match, the comparator / parity unit generates an error signal over the line 116.
  • the read access to the shadow register file 121 also takes place synchronously in this case via the clocks 203, 204 of the individual cores 101, 102.

Abstract

Es wird eine Vorrichtung (120) zum Beheben von Fehlern bei einem wenigstens zwei Ausführungseinheiten (101, 102) mit Registern aufweisenden System (100, 400) vorgestellt, wobei die Register zur Aufnahme von Daten ausgebildet sind. Die Vorrichtung weist Vergleichsmittel (126) auf, die derart eingerichtet sind, dass durch einen Vergleich von Daten, die zur Ablage in den Registern vorgesehen sind, eine Abweichung und damit ein Fehler feststellbar ist. Weiterhin sind wenigstens ein Schattenregister (121, 122), das derart eingerichtet ist, dass Daten der Register betreffende Daten darin ablegbar sind, und Mittel zum Wiederherstellen fehlerfreier Daten in wenigstens einem Register auf Grundlage der Daten in dem wenigstens einem Schattenregister (121, 122) bei einem festgestellten Fehler vorgesehen. Mit dieser Vorrichtung kann die Sicherheit eines Mehr-Kern-Prozessors (100) verbessert werden.

Description

Beschreibung
Titel
Vorrichtung und Verfahren zum Beheben von Fehlern bei einem wenigstens zwei Ausführungseinheiten mit Registern aufweisenden System
Die Erfindung betrifft eine Vorrichtung und ein Verfahren zum Beheben von Fehlern bei einem wenigstens zwei Ausführungseinheiten bzw. CPUs mit Registern aufweisenden System bzw. Prozessor sowie einen entsprechenden Prozessor gemäß den Oberbegriffen der unabhängigen Ansprüche.
Stand der Technik
Aufgrund der immer kleiner werdenden Halbleiterstrukturen wird eine Zunahme von transienten, d.h. temporären Prozessorfehlern erwartet, die z. B. durch kosmische Strahlung hervorgerufen werden. Auch heute treten schon transiente Fehler auf, die durch elektromagnetische Strahlung oder Einkopplung von Störungen in die Versorgungsleitungen der Prozessoren hervorgerufen werden.
Im Stand der Technik werden Fehler in einem Prozessor durch zusätzliche Überwachungseinrichtungen oder durch einen redundanten Rechner bzw. durch Einsatz eines Dual-Core(Doppel-Kern)-Rechners erkannt.
Ein solcher Dual-Core- Prozessor bzw. ein solches Prozessorsystem besteht aus zwei Ausführungseinheiten, insbesondere zwei CPUs (Master und Checker), die parallel oder zeitversetzt das gleiche Programm abarbeiten. Die beiden CPUs (Central Processing Unit) können taktsynchron, also parallel (im Lockstep oder Common Mode), oder um einige Takte zeitversetzt arbeiten. Beide CPUs empfangen dieselben Eingangsdaten und arbeiten das gleiche Programm ab, die Ausgänge des Dual-Cores werden jedoch ausschließlich durch den Master getrieben. In jedem Taktzyklus werden die Ausgänge des Masters mit den Aus- gangen des Checkers verglichen und dadurch überprüft. Stimmen die Ausgangswerte der beiden CPUs nicht überein, so bedeutet das, dass sich mindestens eine der beiden CPUs in einem fehlerhaften Zustand befindet.
In einer Beispielarchitektur für einen Dual-Core- Prozessor vergleicht ein Kompa- rator dabei die Ausgänge (Instruktionsadresse, Data Out, Kontrollsignale) beider Cores (alle Vergleiche finden parallel statt):
a: Instruktionsadresse (Ohne eine Überprüfung der Instruktionsadresse könnte der Master unbemerkt eine falsche Instruktion adressieren, die dann in beiden Prozessoren unerkannt abgearbeitet werden würde.) b: Data Out c: Datenadresse d: Kontrollsignale wie Write Enable oder Read Enable
Die Signale aus b - d dienen der Ansteuerung des Datenspeichers bzw. externer Module.
Ein möglicher Fehler wird nach außen signalisiert und führt im Standardfall zum Abschalten des betroffenen Steuergerätes. Dieser Ablauf würde bei der erwarte- ten Zunahme von transienten Fehlern zu einem häufigeren Abschalten von Steuergeräten führen. Da bei transienten Fehlern keine hardwaretechnische Schädigung des Rechners vorliegt, wäre es hilfreich, den Rechner möglichst schnell wieder der Anwendung zur Verfügung zu stellen, ohne dass das System abschaltet oder ein Neustart erfolgen muss. Methoden, die transiente Fehler beheben und dabei einen kompletten Neustart des Prozessors vermeiden, sind für Prozessoren, die im Master/Checker Betrieb arbeiten, nur vereinzelt zu finden.
Dazu zeigt die Veröffentlichung von Jiri Gaisler: „Concurrent error-detection and modular fault-tolerance in a 32-bit processing core for embedded space flight applications" vom Twenty-Fourth International Symposium on Fault-Tolerant Computing, pages 128-130, June 1994 einen Prozessor mit-integrierten Fehle- rerkennungs- und Recovery- Mechanismen (z. B. Parity Checking und automati- sehe Instruktionswiederholung), der fähig ist, im Master/Checker Betrieb zu arbeiten. Die internen Fehlererkennungsmechanismen im Master oder im Checker triggern eine Recovery- Operation immer nur lokal in einem Prozessor. Dadurch verlieren die beiden Prozessoren ihre Synchronität zueinander, und ein Vergleich der Ausgänge kann nicht mehr stattfinden. Die einzige Möglichkeit, die beiden Prozessoren wieder zu synchronisieren, besteht in einem Neustart beider Prozessoren während einer unkritischen Phase der Mission.
Weiterhin zeigt die Schrift von Yuval Tamir and Marc Tremblay mit dem Titel "High-performance fault-tolerant vlsi Systems using micro rollback" aus IEEE Transactions on Computers, volume 39, pages 548-554, 1990 eine Methode namens „Micro Rollback", durch die der komplette Zustand eines beliebigen VLSI-Systems um eine bestimmte Anzahl von Takten zurückgerollt werden kann. Dazu werden alle Register und das Registerfile als gesamtes durch einen zusätzlichen Fl FO- Puffer erweitert. Neue Werte werden bei dieser Methode nicht direkt in das eigentliche Register geschrieben, sondern vorerst im Puffer abgelegt und erst nach ihrer Überprüfung in das Register übertragen. Um den gesamten Prozessorzustand zurückzurollen, werden die Inhalte aller FIFO- Puffer als ungültig markiert. Wenn das System um bis zu k Taktzyklen zurückgerollt werden können soll, werden für jedes Register k Puffer benötigt. - A -
Diese im Stand der Technik vorgestellten Prozessoren haben somit den Mangel, dass sie durch Recovery- Operationen ihre Synchronität verlieren, da Recovery immer nur in einem Prozessor lokal durchgeführt wird. Die Grundidee des beschriebenen Verfahrens (Micro Rollback) dabei ist, jede Komponente eines Sys- tems unabhängig mit Rollbackfähigkeit zu erweitern, um im Fehlerfall den gesamten Systemzustand auf konsistente Weise zurückrollen zu können. Der architekturspezifische Zusammenhang der einzelnen Komponenten (Register, Registerfile, ...) zueinander muss hierbei nicht betrachtet werden, da durch Rollback wirklich immer der gesamte Systemzustand konsistent zurückgerollt wird. Der Nachteil dieses Verfahrens ist ein großer Hardware-Overhead, der proportional zur Systemgröße (z.B. Anzahl der Pipelinestufen im Prozessor) wächst.
In der nicht vorveröffentlichten Anmeldung 102004058288.2 der Anmelderin werden ein Verfahren und eine Vorrichtung zum Beheben von Fehlern bei einem Prozessor mit zwei Ausführungseinheiten sowie ein entsprechender Prozessor vorgestellt, wobei Register vorgesehen sind, in welchen Instruktionen und/oder diesen zugeordnete Informationen ablegbar sind, wobei die Instruktionen redundant in beiden Ausführungseinheiten abgearbeitet werden, und Vergleichsmittel wie z.B. ein Komparator enthalten sind, die derart gestaltet sind, dass durch ei- nen Vergleich der Instruktionen und/oder der zugeordneten Informationen eine Abweichung und damit ein Fehler erkannt wird, wobei eine Aufteilung der Register des Prozessors in erste Register und zweite Register vorgegeben ist, wobei die ersten Register derart gestaltet sind, dass aus ihnen ein vorgebbarer Zustand des Prozessors und Inhalte der zweiten Register herleitbar sind, wobei Puffer als Mittel zum Zurückrollen enthalten sind, die derart ausgebildet sind, dass wenigstens eine Instruktion und/oder die Informationen in den ersten Registern zurückgerollt und erneut ausgeführt und/oder wiederhergestellt werden.
Bei den bisher vorgeschlagenen Maßnahmen besteht meist das Problem, dass tiefgehende Änderungen im Prozessoraufbau notwendig sind, wodurch herkömmliche Prozessoren nicht verwendet werden können. Damit stellt sich das Problem, Fehler, insbesondere transiente Fehler ohne einen System- oder Prozessor- Neustart bei gleichzeitiger Vermeidung von großem Hardware- Aufwand zu beheben.
Erfindungsgemäß werden daher ein Verfahren und eine Vorrichtung sowie ein entsprechender Prozessor mit den Merkmalen der unabhängigen Patentansprüche vorgestellt. Vorteilhafte Ausgestaltungen sind Gegenstand der Unteransprüche.
Vorteile der Erfindung
Bei einem Schattenregister (shadow register) handelt es sich um ein zusätzliches Register (Kopie, redundantes Register), in das immer die gleichen Daten geschrieben werden wie in das Originalregister. Bei Fehlern im Originalregister wird auf das Schattenregister umgeschaltet bzw. die Daten aus dem Schattenregister in das Originalregister übertragen. Es bietet sich an, ist aber nicht zwingend, die Menge aller Register einer CPU in zwei Teilmengen aufzuteilen, "Es- sential Registers" und "Derivable Registers ". Die Essential Registers sind der- art gestaltet sind, dass aus ihnen die Inhalte Derivable Registers ableitbar sind. Ein wesentlicher Vorteil der Erfindung besteht darin, dass kein wesentlicher Eingriff in Prozessoren notwendig ist. Es ist ausreichend, wenige Leitungen nach außen zu führen. Damit kann die erfindungsgemäße Lösung verwirklicht werden, ohne neue Prozessoren bzw. Systeme entwickeln und herstellen zu müssen. Dies führt zu einer wesentlichen Kosten- und Zeitersparnis. Daneben ist die erfindungsgemäße Lösung applikations-, d.h. software-unabhängig. Es müssen insbesondere keine Rollback- Punkte definiert werden. Die Fehlerbehebung wird auf Hardwareebene ausgeführt, wodurch keine Softwareanpassung notwendig wird. Zusätzlich kann ein Recovery durch die erfindungsgemäße Lösung be- schleunigt werden. Im Gegensatz zu Task- Wiederholungen und Resets, wie sie im Stand der Technik üblich sind, die meist mehrere Tausend bzw. einige Millio- nen Taktzyklen beanspruchen, werden bei der erfindungsgemäßen Lösung nur einige hundert Taktzyklen beansprucht. Diese Zeit wird hauptsächlich durch die Größe des Schattenregisters und die Latenz der Schreibzugriffe auf den Datenspeicher der Ausführungseinheiten bestimmt.
Im Fehlerfall wird der Inhalt der Schattenregister von den Ausführungseinheiten auf die internen Register eingelesen, wodurch ein konsistenter Prozessorzustand hergestellt wird. Es können dabei die Register aller Ausführungseinheiten aus den Schattenregistern befüllt werden, es ist aber auch möglich, die Register einer Ausführungseinheit aus den Schattenregistern zu befüllen und die Register der übrigen Ausführungseinheiten aus den Registern der ersten CPU zu befüllen usw. Die erfindungsgemäße Vorrichtung kann sowohl integrierter Bestandteil des zugeordneten Systems sein, d.h. beispielsweise in einen Dual-Core- Prozessor integriert ausgebildet sein, als auch als separate Baugruppe ausge- bildet sein, die einem System zugefügt wird. Die Erfindung kann vorteilhaft für Steuergeräte in einem Kraftfahrzeug verwendet werden, ist aber nicht auf eine derartige Verwendung beschränkt.
Bei der nachfolgenden Beschreibung der bevorzugten Ausführungsformen der erfindungsgemäßen Lösung wird sowohl auch das Verfahren als auch auf die Vorrichtung (Recovery- Verfahren und Recovery- Vorrichtung) Bezug genommen, soweit es nicht ausdrücklich anders beschrieben ist.
Vorteilhafterweise sind bei der Erfindung Schattenregister für ein Prozessor- bzw. Programm-Status-Wort (PSW), ein Registerfile und/oder eine Instruktionsadresse vorgesehen. Ein Registerfile oder eine Registerbank oder ein Registerbereich ist eine Ansammlung von Registern. Zweckmäßigerweise sind ausreichend Schattenregister vorgesehen, um die (essentiellen) Register einer Ausführungseinheit zu spiegeln. Die Schattenregister werden mit Inhalten der Register der wenigstens zwei Ausführungseinheiten oder allgemein mit die Inhalte bzw. Daten der Register betreffenden Daten beschrieben. Aus dem Inhalt der Schat- tenregister kann somit im Fehlerfall ein fehlerfreier Zustand der Ausführungseinheiten, insbesondere der unmittelbar vorhergehende fehlerfreie Zustand wiederhergestellt werden. In das wenigstens eine Schattenregister werden in einer bevorzugten Ausführungsform Daten für das Registerfile und das PSW geschrie- ben, die für die wenigstens zwei Ausführungseinheiten vorgesehen sind. Der Schreibvorgang findet insbesondere nach einem Vergleich dieser Daten statt, und nur für den Fall, dass keine Abweichung, also kein Fehler festgestellt wurde. Durch einen Vergleich der den Ausführungseinheiten zugehörigen Register vor dem Beschreiben der Schattenregister kann sichergestellt werden, dass in die Schattenregister fehlerfreie Daten geschrieben werden. Die Daten für die Schattenregister können insbesondere durch Herausführen der betreffenden Signale, bspw. des Write Back- Busses, aus den Ausführungseinheiten erhalten werden. Dazu ist nur ein geringer Konstruktions- bzw. Hardwareänderungsbedarf notwendig.
Bei einem bevorzugten Ausführungsbeispiel der erfindungsgemäßen Lösung wird wenigstens ein Schattenregister in den Speicherbereich wenigstens einer Ausführungseinheit eingeblendet. Auf diese Weise kann das Schattenregister von der wenigstens einen Ausführungseinheit schnell und einfach ausgelesen werden.
Vorteilhafterweise werden bei dem erfindungsgemäßen Verfahren Befehle aus einem Instruktionsspeicher des wenigstens zwei Ausführungseinheiten mit Register aufweisenden Systems ausgeführt, wobei Adress- und Schreibsignale für das wenigstens eine Schattenregister erhalten werden. Dabei dekodiert bevorzugt ein Befehlsdecoder, der für die erfindungsgemäße Lösung vorgesehen sein kann, Befehle aus dem Instruktionsspeicher und generiert das Adress- und Schreibsignal für das wenigstens eine Schattenregister. Auf einen derart ausgestalteten Befehlsdecoder kann auch verzichtet werden, wenn diese Informati- onen, d.h. die Adress- und Schreibsignale, aus den wenigstens zwei Ausfüh- rungseinheiten herausgeführt, miteinander verglichen und für die Ansteuerung des wenigstens einen Schattenregisters verwendet werden.
Zweckmäßigerweise wird dem wenigstens einen Schattenregister eine Parität zum Feststellen der Korrektheit der Daten in dem Schattenregister zugeordnet. So kann auf einfache Weise sichergestellt werden, dass sich in dem Schattenregister keine fehlerhaften Daten befinden. Dies ist aber nicht nötig, wenn man softwaremäßig sicherstellt, dass das Registerfile und damit auch das Schattenregisterfile regelmäßig komplett neu beschrieben werden, da somit bestehende Fehler im Schattenregisterfile überschrieben werden. Vor einem Übertragen der Schattenregisterdaten auf wenigstens eine der Ausführungseinheiten kann mittels der vorgesehenen Parität die Korrektheit überprüft werden. Sind die Daten im Schattenregister nicht mehr korrekt, kann ein Neustart des Systems zweckmäßig sein. Da auf das Schattenregister nur im Fehlerfall lesend zugegriffen wird (Fehlerfall bedeutet nicht Fehler im Schattenregister, sondern Fehler in den CPUs), ist ein komplettes Neubeschreiben der Schattenregister ebenso möglich.
In einer bevorzugten Ausgestaltung der erfindungsgemäßen Lösung sind die Daten der Register betreffende Daten die, insbesondere fehlerfreien, Daten der Register selbst, wobei fehlerfreie Daten in wenigstens einem Register durch ü- bertragen der Daten aus dem Schattenregister in das wenigstens eine Register wiederhergestellt werden. In diesem Fall enthält ein Schattenregister die Daten eines Registers einer Ausführungseinheit im letzten fehlerfreien Zustand, wodurch bei einem Fehler die Fehlerfreiheit durch Austausch bzw. Übertragen die- ser Daten wiederhergestellt werden kann.
Es kann ebenso zweckmäßig vorgesehen sein, dass die fehlerfreien Daten der Register betreffenden Daten Prüfsummen sind. Dabei kann es sich insbesondere um eine Parität, CRC o. ä. handeln. In diesem Fall ist der Datenspeicherbedarf des Schattenregisters vorteilhaft kleiner als die Größe eines Registers wenigstens einer Ausführungseinheit. Auf diese Weise kann Speicherplatz innerhalb des Schattenregisters eingespart werden bzw. der Speicher des Schattenregisters kann kleiner bemessen werden. Zum Wiederherstellen von fehlerfreien Daten in einem Register wenigstens einer Ausführungseinheit müssen dann zunächst aus den Prüfsummen vollständige Daten wiederhergestellt werden, wie es im Stand der Technik bekannt ist. Werden nur Paritäten in den Schattenregistern gespeichert, sind wenigstens zwei CPUs vorzusehen. Im Fehlerfall werden die Paritäten der Register der beiden CPUs mit den Schattenparitäten verglichen. Durch diesen 3-fach Vergleich kann man feststellen, welche CPU fehlerhaft ist, und deren fehlerhafte Registerinhalte durch die Registerinhalte der funk- tionierenden CPU ersetzen.
Gemäß einer vorteilhaften Ausgestaltung des erfindungsgemäßen Verfahrens werden Daten von wenigstens zwei Registern und wenigstens einem Schattenregister verglichen und die Daten als fehlerfrei festgestellt, die hauptsächlich übereinstimmen. Dieses Verfahren kann als Abstimmungs- oder Mehrheitsverfahren bezeichnet werden. Es werden dabei die Daten von wenigstens drei Registern (wenigstens zwei Register der Ausführungseinheiten und ein Schattenregister) verglichen, wobei die Daten als fehlerfrei festgestellt werden, die mehrheitlich übereinstimmen. Dieses Verfahren kann vorteilhaft insbesondere ange- wendet werden, wenn zur Steigerung der Verarbeitungsgeschwindigkeit das wenigstens eine Schattenregister bereits beschrieben wird, bevor eine Überprüfung der Korrektheit der Register der Ausführungseinheiten stattgefunden hat.
Es sei erwähnt, dass im Fehlerfall an Stelle einer Neubeschreibung der Daten in den Registern der Ausführungseinheiten auch ein Einblenden der Schattenregister oder andersartiges Umschalten möglich ist.
Ein erfindungsgemäßer Prozessor weist wenigstens zwei Ausführungseinheiten mit Registern und wenigstens eine erfindungsgemäße Vorrichtung auf. Dadurch kann der Betrieb eines wenigstens zwei Ausführungseinheiten mit Registern aufweisenden Prozessors, insbesondere eines Dual-Core- Prozessors, verbessert werden, da transiente Fehler einfach und schnell behebbar sind.
In einer bevorzugten Ausgestaltung weist der Prozessor Umschaltmittel zum Umschalten zwischen einem Sicherheits-Modus und einem Performanz-Modus auf, wobei die wenigstens zwei Ausführungseinheiten in dem Sicherheits-Modus das gleiche Programm abarbeiten, und in dem Performanz-Modus verschiedene Programme abarbeiten. Es versteht sich, dass darunter insbesondere auch verschiedene Teile eines Programms zu verstehen sind (Parallelverarbeitung, MuI- tithreading, Symmetrisches Multiprozessorsystem SMP usw.). Die wenigstens beiden Ausführungseinheiten können dabei in beiden Modi taktversetzt oder taktsynchron arbeiten, wie es in dieser Anmeldung mehrfach beschrieben ist. Wesentlich ist eine Kombination aus Recovery-Mechanismus und Rekonfigurie- rungs-Mechanismus. Dies ermöglicht den Einsatz beider Methoden und schafft mehr Spielraum zwischen Sicherheit und Performanz des eingesetzten Systems. Zum Umschalten zwischen den Modi kann ein Mode-Switch-Modul vorgesehen sein, das ein Mode-Signal bereitstellt. Das core-Mode-Signal muss an die Reco- very- Vorrichtung geleitet werden, da der Einsatz von Recovery nur im Sicherheits-Modus möglich ist. Beispielsweise im Automobil werden unterschiedli- che Aufgaben durch Rechner abgearbeitet. Es gibt Komfortfunktionen (z.B. Klimasteuerung) und Sicherheitsfunktionen mit verschieden hohen Sicherheitsanforderungen (vgl. Motorsteuerung und Elektronisches Stabilitätsprogramm). Wenn diese verschiedenen Applikationen auf einem zentralen Steuergerät ausgeführt werden, kann der Programmcode in drei Klassen unterteilt werden: - Programmcode, bei dem permanente und transiente Fehler online entdeckt werden müssen (Bsp. ESP oder x-by-wire Anwendungen), Programmcode, bei dem die benutzte Hardware in regelmäßigen Abständen auf permanente Fehler getestet werden muss (Bsp.: Motorsteuerung, Schiebedachsteuerung), - Programmcode, der nicht sicherheitsrelevant ist (z.B. Klimaanlagensteuerung). Somit ist es vorteilhaft, einen erfindungsgemäßen Prozessor um die Möglichkeit der Umschaltung zwischen den beiden Modi Sicherheit und Performanz zu erweitern. Im Sicherheitsmodus arbeiten die beiden Prozessoren denselben Programmcode, auch taktversetzt, ab und im Performanzmodus unterschiedliche Aufgaben. Bei Applikationen, die auf getesteter Hardware abgearbeitet werden müssen, kann dies abwechselnd im Sicherheits- und Performanzmodus geschehen. Dabei wird die Hardware im Sicherheitsmodus durch die Redundanz der beiden Prozessoren getestet und die Software läuft somit im Performanzmodus auf getesteter Hardware ab. Die Verteilung, wie oft die Software in welchem Modus abgearbeitet werden muss, ist abhängig von der geforderten Fehlerentdeckungszeit, d.h. wie lange sich maximal ein Fehler auswirken darf, ohne dass durch die Applikation Schaden angerichtet werden kann.
In einer vorteilhaften Ausgestaltung des erfindungsgemäßen Prozessors sind Mittel zum Leeren (Flushen) eines Cache-Speichers vorgesehen. Dadurch kann auf einfache Weise verhindert werden, dass Datenreste aus dem Performanz- Modus in die Recovery-Vorrichtung übernommen werden.
Es ist zweckmäßig, wenn bei dem erfindungsgemäßen Prozessor wenigstens zwei Taktgeber vorgesehen sind.
Ebenso zweckmäßig kann es sein, wenn bei dem erfindungsgemäßen Prozessor genau ein Taktgeber für jeweils eine Ausführungseinheit und ein Taktgeber für die Vorrichtung vorgesehen ist.
Durch diese beiden Ausgestaltungen ergeben sich vielfältige vorteilhafte Möglichkeiten zur synchronen oder asynchronen Ansteuerung der Ausführungseinheiten und der Schattenregister.
Gemäß einer bevorzugten Ausgestaltung des erfindungsgemäßen Verfahrens wird zwischen einem Sicherheits-Modus und einem Perfomanz-Modus umge- schaltet, wobei im Sicherheits-Modus ein erfindungsgemäßes Verfahren zum Beheben von Fehlern ausgeführt wird und im Perfomanz-Modus die wenigstens zwei Ausführungseinheiten verschiedene Programme bzw. Programmteile oder Tasks ausführen. Zwischen den Modi kann vorteilhaft über ein Mode Select Signal umgeschaltet werden.
Ein erfindungsgemäßes Steuergerät für ein Kraftfahrzeug weist eine erfindungsgemäße Vorrichtung oder einen erfindungsgemäßen Prozessor auf. Damit können Kfz-Steuergeräte sicherheits- und performanzseitig verbessert werden.
Weitere Vorteile und Ausgestaltungen der Erfindung ergeben sich aus der Beschreibung und der beiliegenden Zeichnung.
Es versteht sich, dass die vorstehend genannten und die nachstehend noch zu erläuternden Merkmale nicht nur in der jeweils angegebenen Kombination, sondern auch in anderen Kombinationen oder in Alleinstellung verwendbar sind, ohne den Rahmen der vorliegenden Erfindung zu verlassen.
Die Erfindung ist anhand eines Ausführungsbeispiels in der Zeichnung schema- tisch dargestellt und wird im folgenden unter Bezugnahme auf die Zeichnung ausführlich beschrieben.
Figurenbeschreibung
Figur 1 zeigt ein Blockdiagramm eines Dual-Core- Prozessor-Systems, das eine bevorzugte Ausgestaltung der erfindungsgemäßen Vorrichtung enthält;
Figur 2 zeigt eine schematische Darstellung der bevorzugten Ausgestal- tung der erfindungsgemäßen Vorrichtung aus Figur 1; Figur 3 zeigt eine schematische Darstellung des Dual-Core- Prozessor-
Systems aus Figur 1;
Figur 4 zeigt ein Blockdiagramm eines Dual-Core- Prozessor-Systems, für das eine bevorzugte Ausgestaltung der erfindungsgemäßen Vorrichtung vorgesehen sein kann; und
Figur 5 zeigt einen Ausschnitt eines Blockdiagramms einer bevorzugten
Ausgestaltung der erfindungsgemäßen Vorrichtung, die insbeson- dere für ein Dual-Core- Prozessor-System gemäß Figur 4 vorgesehen sein kann.
In den Figuren sind gleiche Elemente mit gleichen Bezugszeichen versehen.
In Figur 1 ist schematisch ein Dual-Core- bzw. Doppelkern- Prozessor-System 100 gezeigt, das eine bevorzugte Ausführungsform der erfindungsgemäßen Vorrichtung (Recovery- Vorrichtung) 120 aufweist. Weiterhin weist das System einen Befehlsspeicher (Instruction Memory) 130 und einen Datenspeicher (Data Memory) 140 auf.
Das Dual-Core- Prozessor-System 100 weist zwei Ausführungseinheiten (CPUs, Cores) auf, einen Master 101 und einen Checker 102, die parallel ein Programm bearbeiten. Die Ausgabe von Daten an die Peripherie (Anwendungssystem) erfolgt nur, wenn die Daten von Master und Checker übereinstimmen. Bei diesem Ausführungsbeispiel ist die Recovery-Vorrichtung extern gelagert ist, d.h. nicht in die Cores integriert. Daher sind besonders vorteilhaft bis auf die Herausführung bestimmter interner Signale keine Modifikationen an den CPUs 101, 102 notwendig. Die innere Struktur der Recovery-Vorrichtung ist den Figuren 2 und 3 genauer beschrieben. Der Befehlsspeicher 130 des Systems ist als Festwertspeicher, auch Read-Only Memory (ROM) genannt, ausgeführt. Zu ihm werden die Adressen für die Befehle (Instruction address) über eine Verbindung 110 geführt. Nach Anlegen einer Befehlsadresse über die Verbindung 110 gibt der Befehlsspeicher 130 über eine Verbindung 111 den entsprechenden Befehl (Instruction) zurück. Der Befehl wird beiden CPUs 101 und 102 zugeführt. Der Befehlsspeicher 130 ist in der dargestellten Ausführungsform standardmäßig ausgeführt. Er wird durch das Vorsehen der Recovery- Vorrichtung 120 nicht verändert. Wie in Figur 3 im Detail zu sehen, werden nur die Adressen des Masters 101 an den Befehlsspeicher 130 geführt, während die Adressen des Checkers 102 nur zu einem Komparator (comp) 126a geführt werden, der ein Fehlersignal (Error) erzeugt, wenn Adressen oder Adress-Parity von Master und Checker nicht übereinstimmen. Die Paritäten werden von Paritätsgeneratoren (parity generator) 126b erzeugt und Paritätsprüfern (parity check) 126c geprüft. Diese Parity Generatoren/Checker die- nen der Absicherung des Single point of failure- Pfades über die Speicher.
Der Datenspeicher 140 des Systems ist als Schreib- Lese-Speicher, auch Random-Access Memory (RAM) genannt, ausgeführt. Ihm werden über eine Verbindung 112 (Data Address/Data Out) Adressen und Daten zugeführt. Weiterhin gibt er über eine Verbindung 113 entsprechende Daten an die CPUs aus (Data In). Wie in Figur 3 deutlicher zu sehen, handelt es sich um die Ausgangsleitungen von Daten-Adressen und Daten von Master und Checker. Hier werden die Adressen und Daten für den Datenspeicher 140 und für das in der Recovery- Vorrichtung 120 enthaltene Schattenregisterfile 121 ausgegeben. Auf den Da- teneingangsleitungen 113 von Master und Checker werden normalerweise die Inhalte des externen Datenspeichers übertragen. Wenn über den Komparator 126a eine Diskrepanz (Fehler) zwischen Master und Checker erkannt wurde, werden nach Auslösung des Error Signals (Interrrupt In) auf einer entsprechenden Leitung 117 die gesicherten Inhalte des externen Registerfiles 121 und des externen PSW- Registers 122 (Fig. 3) zu Master und Checker übertragen. Es bietet sich an, CPU-intern den Eingang der Leitungen 113 und 117 auf den Write Back Bus zu legen bzw. mappen. Auch der Datenspeicher 140 ist standardmäßig ausgeführt und wird durch Vorsehen der Recovery- Vorrichtung nicht verändert. Wie in Figur 3 im Detail zu sehen, werden nur die Adressen und Daten des Masters an den Datenspeicher 140 geführt, während die Adressen und Daten des Checkers nur zur dem Komparator 126a geführt werden. Dieser erzeugt ein Fehlersignal, wenn Adressen bzw. Daten oder Adress-Parity bzw. Daten- Parity von Master und Checker nicht übereinstimmen. Die Paritäten werden von Paritätsgeneratoren (parity generator) 126b erzeugt und Paritätsprüfern (parity check) 126c geprüft. Diese Parity Generatoren/Checker dienen der Absicherung des Single point of failure- Pfades über die Speicher.
Der Daten- sowie der Befehlspeicher stellen Schwachstellen des Systems, sog. Single points of failure, dar, da sie im System jeweils nur einmal vorhanden sind. Es bietet sich daher an, die beiden Speicher bspw. durch ECC (error correcting codes) oder andere im Stand der Technik bekannte Methoden abzusichern (sicherer Speicher).
Der Write Back Bus, ein interner Bus, ist über eine Leitung 114 an die Recovery- Vorrichtung 110 geführt. Auf dem Write Back Bus werden von verschiedenen Prozessoreinheiten wie ALU (Arithmetische und Logische Einheit) oder Daten- RAM Rechenergebnisse bzw. Daten in das interne Registerfile der CPU geschrieben.
Weiterhin wird über eine Leitung 115 (PSW Out) das jeweilige Programm- bzw. Prozessor-Status- Wort von Master 101 und Checker 102 ausgegeben. Das Prozessor-Status-Wort gibt Auskunft über Ergebnisse der Befehlsausführung im Programmablauf, z.B. wird in Flags (entsprechende Bits des PSW) kodiert festgehalten, ob das Ergebnis von Rechenoperationen Null oder negativ ist (Zero Flag) oder ob ein Überlauf aufgetreten ist (Carry Flag) usw. Außerdem enthält das PSW Informationen über den Interrupt-Status der CPU. Mit der Kenntnis bzw. Restaurierung des Prozessor-Status-Wort es kann ein Programm an der abgebrochenen Stelle korrekt fortgesetzt werden.
Über eine Leitung 116 (Interrupt In), die an Master und Checker geführt wird, kann eine Programmunterbrechung des gerade laufenden Programms durchgeführt werden. Vorzugsweise wird die Interrupt-Leitung dazu verwendet, um die beiden CPUs 101 und 102 zu veranlassen, das PSW und die Registerfiledaten von dem externen Recovery-Modul 120 zu laden und damit ihre möglicherweise falschen Daten durch korrekte Daten zu ersetzen. Die Quelle der Leitung 116 entspricht in den Figuren 2 und 3 dem Signal Error Out, dass durch den Kompa- rator 126 bzw. 126a (comp) erzeugt wird.
In Figur 2 ist der innere Aufbau der Recovery- Vorrichtung 120 aus Figur 1 schematisch dargestellt. Aus Übersichtsgründen wurde der Taktversatz zwi- sehen den beiden CPUs in diesem Blockschaltbild weggelassen. Es versteht sich aber, dass ebenso ein Taktversatz vorgesehen sein kann. Die Recovery- Vorrichtung weist als Schattenregister ein Registerfile 121 und ein PSW- Register 122 auf.
Das Registerfile 121 enthält zumindest so viele Register wie der Master 101 bzw. der Checker 102 oder mindestens so viele Register, wie zur Wiederherstellung der betreffenden Anwendung erforderlich sind (Essential Registers). Zum Schreiben wird es automatisch von einem Befehlsdecoder 123 adressiert. Zum Lesen wird es über die Leitung 112 (Data Address/Data Out) des Masters ad- ressiert. Beim Betrieb werden die Daten vom Write Back Bus über die Leitung 115 geschrieben und im Fehlerfall von den Data Out Ausgängen des Registerfiles in die Data In Eingänge der CPUs über die Leitung 117 gelesen. Alternativ können die Daten auch vom Data Out des Masters beschrieben werden. Dies ist für die vorgestellte Recovery- Vorrichtung nicht notwendig, stellt aber keinen nennenswerten Hardware Overhead dar, und bietet die Möglichkeit, das Schattenregister auch in anderer Form (z.B. als zusätzlicher Speicher) zu verwenden. Um die Schattenregister auslesen zu können, werden sie vorzugsweise in den Speicheradressbereich eingeblendet. Dann kann durch einfache Schreib- oder Leseoperationen auf sie zugegriffen werden. Bei dieser Ausführungsform wird durch die Ausführungseinheiten bzw. CPUs 101, 102 nur im Fehlerfall und nur lesend auf die Schattenregister zugegriffen, da die Schreibzugriffe durch den in dieser bevorzugten Ausführungsform der erfindungsgemäßen Vorrichtung vorgesehenen Befehlsdecoder 123 durchgeführt werden.
Das PSW- Register 122 wird, wenn der Vergleich der Signale PS W Out des Masters und des Checkers keinen Fehler anzeigt, mit dem Signal PS W Out des Masters 101 über Leitung 115 beschrieben. Alternativ kann das PSW- Register auch von den Signalen Data Address/Data Out des Masters adressiert und mit dem Signal Data Out des Masters beschrieben werden. Diese Vorgehensweise kann für mögliche Erweiterungen sinnvoll sein. Das PSW wird über PS W Out ausgelesen und zusammen mit Data Out vom Registerfile 121 an Leitung 117 zur Verfügung gestellt. Diese Leitung ist, wie in Figur 1 gezeigt, mit Data In von Master und Checker verbunden, wobei wiederum nur im Fehlerfall zugegriffen wird.
Innerhalb der Recovery- Vorrichtung 120 wird die Leitung 116 von einer Kompa- rator/Paritätseinheit 126 aus der Recovery- Vorrichtung heraus, wie in Figur 1 beschrieben, und an das Registerfile 121 sowie das PSW- Register 122 geführt, um sicherzustellen, dass keine fehlerhaften Daten in das Schattenregister gespeichert werden. Wie in Figur 3 gezeigt, setzt sich die Kompara- tor/Paritätseinheit 126 zumindest aus wenigstens einem Komparator 126a zusammen. Vorteilhaft sind zusätzlich wenigstens ein Paritätserzeuger 126b und/oder wenigstens ein Paritätsprüfer 126c vorgesehen. Falls ein Fehler in der Komparator/Paritätseinheit 126 detektiert wird, darf das derzeitige Datenwort (welches ja als fehlerhaft erkannt wurde) nicht mehr auf die Schattenregister geschrieben werden. Nachdem das Auslösen einer Interrupt- Routine in den Prozessor-Kernen aber einige Taktzyklen benötigt, kann durch die gezeigte Verbin- dung das Beschreiben verhindert werden, wenn das Schattenregister entsprechend eingerichtet ist.
Die Komparator/Paritätseinheit 126 enthält alle Vergleichs- und Paritäts- 5 Schaltungen, um insbesondere folgende Funktionen darzustellen:
Vergleicher von Write Back Bus von Master und Checker, wobei die Daten über Leitung 114 zugeführt werden. Nachdem dieser Bus zeitweise auf "hochohmig" geschalten ist, was einen Vergleich unmöglich macht, muss diesem Komparator auch das Write Enable Signal aus dem Deco- l o der zur Verfügung gestellt werden.
Parity-Generator für das Signal Instruction Address des Master sowie Vergleicher für Instruction Address von Master und Checker, wobei die Daten über Leitung 110 zugeführt werden. Parity-Generator für die Signale Data Address und Data Out des Master
15 sowie
Vergleicher für die Signale Data Address und Data Out von Master und Checker, wobei die Daten über Leitung 112 zugeführt werden. Vergleicher für das Signal PS W Out von Master und Checker, wobei die Daten über Leitung 115 zugeführt werden.
20
Wird ein Fehler festgestellt, so wird im vorliegenden Beispiel eine Interrupt- Routine in den CPUs gestartet, durch die die Daten aus dem Schattenregister 121, 122 in die Register der beiden CPUs 101, 102 übertragen werden. Kann beispielsweise das PSW in einer CPU nicht beschrieben werden, kann das PSW 25 bzw. dessen Bits durch eine entsprechende Software- Routine in der Interrupt- Routine gesetzt werden. (Beispielsweise kann eine Addition mit Überlauf durchgeführt werden, wenn das Überlauf-Flag gesetzt werden muss). Anschließend können beide CPUs 101, 102 mit korrektem Registerinhalt weiterarbeiten.
30 In der gezeigten Ausführungsform weist die erfindungsgemäße Vorrichtung 120 auch den Befehlsdecoder 123 auf, um die Befehle zu erkennen, die das Regis- terfile beschreiben. Der Befehlsdecoder generiert für diese Befehle die Adresse für die zu adressierenden Register des Registerfiles sowie das Write-Signal. Am Eingang erhält der Decoder die um einen Takt verzögerte Instruktion und gibt am Ausgang Adressen und das Write-Signal für das Registerfile 121 aus. Für die Taktverzögerung um einen Takt ist eine Einheit 124 vorgesehen.
Nach dem Vergleich wird das Signal Instruction Address durch eine weitere Taktverzögerungseinheit 125 um zwei Takte verzögert an das Registerfile 121 geführt. (Wie in Figur 3 detaillierter gezeigt, wird die Instruction Address ein wei- teres Mal zusätzlich auch um einen Takt verzögert auf das Registerfile geführt, da im Falle eines Interrupts die Instruktionsadresse aus einer anderen Pipelinestufe abgespeichert werden muss als bei einem Sprung. Dabei handelt es sich allerdings um prozessorspezifische Details, die mit der Recovery- Vorrichtung direkt nicht zusammenhängen.) Das Registerfile speichert im Fall eines Sprung- befehls die derzeitige Instruktionsadresse ab. Die Instruktionsadresse wird innerhalb des Prozessors durch die Pipelines geführt. Man könnte die Sprungadresse auch durch das Herausführen eines weiteren Busses aus der CPU beschaffen, durch die vorgestellte externe Weiterführung können aber die Eingriffe in die Cores minimiert werden.
Über die Leitung 116 wird das Signal Error Out an den Eingang Interrupt In von Master und Checker bereitgestellt. Error Out wird aktiv, wenn die Kompara- tor/Paritätseinheit 126 der Recovery- Erweiterung 120 eine Abweichung zwischen Master und Checker feststellt.
In Figur 3 ist der innere Aufbau des Dual-Core- Prozessor-Systems aus Figur 1 schematisch dargestellt. Aus Übersichtsgründen wurde der Taktversatz zwischen den beiden CPUs auch in diesem Blockschaltbild weggelassen. In dieser Abbildung sind Master 101 und Checker 102 getrennt dargestellt, woraus eben- falls die getrennte Darstellung der Leitungen 110 bis 117 folgt. Die Leitung 112 ist doppelt ausgeführt, was die beiden Signale Data Address und Data Out repräsentieren soll.
Zwischen den Kernen des Masters und des Checkers sind die Einheiten der Re- covery-Vorrichtung, nämlich Registerfile 121, PSW-Register 122, Decoder 123, Taktverzögerungseinheiten 124, 125 und Komparator/Paritätseinheit 126 sowie der Befehlsspeicher 130 und der Datenspeicher 140 dargestellt. Die Untereinheiten 126a, 126b, 126c der Komparator/Paritätseinheit 126 sind in der Darstellung räumlich getrennt.
In Figur 4 ist ein Dual-Core- Prozessor-System schematisch gezeigt, für das eine bevorzugte Ausgestaltung der erfindungsgemäßen Vorrichtung vorgesehen sein kann. Dieses Blockschaltbild zeigt ein rekonfigurierbares System, bei dem zwischen einem Performanz- Modus und einem Sicherheits-Modus umgeschaltet werden kann.
Um die Anforderung nach hoher Rechenperformanz oder Sicherheit zu gewährleisten, muss das rekonfigurierbare Zweiprozessorsystem im Betrieb zwischen den beiden Modi umschaltbar sein. Im Sicherheitsmodus, der bei der Abarbei- tung von sicherheitsrelevanten Programmcode verwendet wird, arbeitet das System im klassischen Master/Checker Modus, wobei eine Ausgestaltung der erfindungsgemäßen Vorrichtung verwendet wird.
Im Performanzmodus arbeitet das System wie ein Zweiprozessorsystem, wobei es insbesondere die Performanz eines herkömmlichen Zweiprozessorsystems aufweist.
Das Umschalten zwischen den beiden Modi erfolgt durch das Betriebssystem durch eine spezielle Instruktion, dem Mode-Switch Befehl. Diese Instruktion wird vorzugsweise außerhalb des Prozessors durch eine prozessorexterne Einheit detektiert und in einen NoOperation Befehl gewandelt, bevor sie an den Prozes- sor weitergegeben wird. Damit wird ein Eingriff in die Befehlsdecoder der beiden Prozessoren vermieden.
Im Sicherheits-Modus arbeitete das System entsprechend den Figuren 1 bis 3, wobei beide Cores das gleiche Programm abarbeiten. Da manche Komponenten nur einfach vorhanden sind (z.B. Busse, Taktleitung und Versorgungsspannung), sollten diese speziell abgesichert werden. Um das System zusätzlich gegen Common Cause Fehler wie EMV oder Spannungsspitzen auf der Versorgungsspannung abzusichern, können die beiden Prozessoren in diesem Modus mit einem Taktversatz arbeiten.
Im Performanz- Modus arbeiten die CPUs verschiedene Programme bzw. Programmteile oder Tasks ab und erreichen so eine höhere Performanz und Rechenleistung als eine einzelne CPU. Jede CPU kann den Instruktions- bzw. Be- fehlsspeicher, den Datenspeicher und die Peripherie ansteuern. Daher muss der Takt dieser Komponenten und der CPUs im Performanzmodus phasengleich sein. Erfolgt keine Taktumschaltung einer CPU bei der Umschaltung vom Sicherheitsmodus in den Performanzmodus, so müsste dieser im Performanzmodus bei jedem Zugriff auf die Peripherie einen Wartetakt einlegen, bis er die Da- ten erhält. Da dies eine hohe Performanzeinbuße mit sich bringt, wird der Takt dieser CPU für den Performanzmodus auf die Phasenpolarität des Mastertaktes umgeschaltet. Dazu muss der Taktversatz im Performanzmodus ausgeschaltet werden.
Da nun beide CPUs auf die Peripherie zugreifen können, müssen in diesem Modus die Zugriffe durch spezielle Einheiten (Instruktions- RAM Control- Einheit, Daten- RAM Control- Einheit) verwaltet werden. Da Speicherzugriffe auf den Instruktionsspeicher in jedem Takt nun durch beide CPUs erfolgen können, müssen diese Zugriffe durch je einen Instruktionscache pro CPU entkoppelt werden, damit der Instruktionsspeicher nicht zum leistungsbegrenzenden Faktor wird. In der gezeigten Implementierung greifen die Cache-Controller mit Hilfe eines Burst-Zugriffes von vier Instruktionen auf den Instruktionsspeicher zu. Jedoch ist es nicht notwendig, die Datenzugriffe der beiden CPUs auf den Datenspeicher durch einen Cache ebenfalls zu entkoppeln, da z.B. bei Automobilanwendungen nur jede 10. Instruktion ein Datenspeicherzugriff ist. Wenn sich diese Verteilung ändert, kann ein Datencache für jede CPU vorgesehen werden. Zusammenge- fasst handelt es sich folglich um eine Erweiterung eines Systems, das eine Re- covery- Funktionalität besitzt, um eine Performanz- Funktionalität.
Modusumschaltung:
Im Sicherheitsmodus arbeiten die beiden CPUs die gleichen Befehle ab und verhalten sich identisch. Dazu müssen die internen Zustände der beiden CPUs, d.h. die Daten in den Registern und den Instruktionscaches, identisch sein. Im Per- formanzmodus arbeiten die beiden CPUs jedoch verschiedene Befehle ab und somit sind auch die internen Prozessorzustände unterschiedlich. Daher müssen die Daten in den beiden CPUs und in den Instruktionscaches vor einem Umschalten vom Performanz- in den Sicherheitsmodus synchronisiert werden.
Eine wichtige Voraussetzung für die Modusumschaltung des umschaltbaren Zweiprozessorsystems ist, dass das Betriebssystem die beiden gleichartigen CPUs unterscheiden kann. Dazu muss jede CPU eine zugeordnete ID aufweisen. Dazu ist ein einzelnes Bit ausreichend. Im Sicherheitsmodus darf dieses Bit nicht überprüft werden, da sonst der Komparator einen Fehler signalisieren würde.
Weiterhin ist zur Umschaltung des Zweiprozessorsystems zwischen den beiden Modi ein Befehl erforderlich. Durch Aufruf des Befehls wird der Moduswechsel eingeleitet. Die Umschaltung vom Performanzmodus in den Sicherheitsmodus wird vorteilhafterweise in den Time Tables für beide CPUs abgelegt. Meist wird eine CPU die Modusumschaltung zuerst beginnen. Diese startet den Modus- wechsel und teilt der zweiten CPU gleichzeitig durch einen Interrupt mit, dass diese ebenfalls den Modus wechseln soll.
Zusätzlich sollte gewährleistet sein, dass im Performanzmodus jede CPU die Möglichkeit hat, mindestens zwei atomare Zugriffe auf den Datenspeicher auszuführen. Diese nicht unterbrech baren Speicherzugriffe sind zur Synchronisation der gemeinsam benutzten Daten beider Prozessoren oder auch zur Tasksynch- ronisation notwendig.
Um im Performanzmodus die Datenkonsistenz zu gewährleisten, ist es notwendig, dass eine CPU die Möglichkeit hat, einen Wert aus dem Datenspeicher auszulesen und anschließend ohne eine Unterbrechung durch eine andere CPU diesen Wert modifiziert zurückzuschreiben. Dies wird insbesondere dadurch gewährleistet, dass, sobald auf einen bestimmten Speicherbereich zugegriffen wird, Datenspeicherzugriffe für andere CPUs durch das Anlegen eines Wait- Kommandos unterbunden werden. Die CPU kann durch einen weiteren Datenspeicherzugriff auf die reservierte Adresse den Datenspeicher wieder für andere CPUs freigeben. Durch die Möglichkeit, den Speicherzugriff für andere CPUs zu unterbinden, können in Software Techniken implementiert werden, um den Da- tenzugriff auf gemeinsam genutzte Speicher zu ermöglichen, oder die CPUs können sich durch "Semaphore" gegenseitig bei der Abarbeitung von Tasks synchronisieren (nicht zu verwechseln mit der Synchronisation mit der in den Sicherheitsmodus gewechselt werden kann).
Die Umschaltmittel zum Umschalten zwischen den Modi sind somit als Mode- Switch Einheit 407 ausgebildet. Der Einsatz der Recovery- Vorrichtung ist nur im Sicherheits-Modus vorgesehen. Daher ist es zweckmäßig ein Core Mode Signal, das die Mode-Switch Einheit ausgibt, an die Recovery- Vorrichtung zu führen. Damit einhergehend kann die Recovery- Vorrichtung durch das Core Mode Sig- nal ein- und ausschaltbar ausgebildet sein. Dabei kann ebenso vorgesehen sein, die Recovery- Vorrichtung im Performanz-Modus z.B. durch ein Clock Enable Signal komplett abzuschalten, um den Stromverbrauch zu verringern.
In Figur 4 ist ein Dual-Core- Prozessor-System, für das eine bevorzugte Ausges- taltung der erfindungsgemäßen Vorrichtung vorgesehen sein kann, insgesamt mit 400 bezeichnet. Das System weist zwei CPUs, Master 101 und Checker 102, Befehlsspeicher 130 und Datenspeicher 140 auf. Die Speicher sind nicht dupliziert, sondern sind als sichere Speicher ausgeführt, wie weiter oben erläutert wurde. Sie können auch dupliziert ausgeführt werden.
Mit 401 ist eine Instruktionsspeicher- Steuereinheit (ICU) bezeichnet. Die ICU verwaltet alle Zugriffe der beiden CPUs 101, 102 auf den gemeinsamen Befehlsspeicher 130. Im Sicherheitsmodus darf nur der Master 101 im Falle eines Cache Miss Befehle aus dem Befehlsspeicher anfordern. Die ICU lädt dann nicht nur den einen Befehl nach, sondern führt vorzugsweise einen Burstzugriff aus, um die Cachezeile in einem Stück nachzuladen. Dabei erhält ein Instruktionscache 402 des Masters 101 die Instruktionen direkt, während ein Instruktionscache 403 des Checker 102 die Instruktionen um einen vorgesehenen Taktversatz später erhält.
Da im Performanzmodus die beiden CPUs gleichzeitig vom Instruktionsspeicher 130 Befehle anfordern können, muss die ICU- Einheit 401 eine Priorisierung der Zugriffe vornehmen. Normalerweise hat der Master die höhere Priorität. Um den Checker jedoch im ungünstigsten Fall nicht total auszubremsen, hat der Checker die höhere Priorität, wenn im Taktzyklus davor der Master den Zugriff auf den Befehlsspeicher 130 hatte.
Mit 404 ist eine Datenspeicher- Steuereinheit (DCU) bezeichnet. Die DCU 404 verwaltet die Zugriffe der beiden CPUs auf den Datenspeicher 140 und die Peri- pherie. Zusätzlich muss sie noch ein individuelles Prozessoridentifikationsbit bereitstellen. Anhand dieses Bits können im Performanzmodus die beiden CPUs vom Betriebssystem unterschieden werden. Dieses Bit kann durch einen Lesezugriff auf eine bestimmte Speicheradresse ausgelesen werden. Während die Adresse für beide CPUs gleich ist, erhält beispielsweise der Master eine O zurück während der Checker eine 1 erhält. Sind mehr als zwei CPUs vorgesehen, müssen entsprechend mehr Bits verwendet werden.
Im Sicherheitsmodus werden alle Zugriffe auf den Datenspeicher und die Peripherie durch den Master ausgeführt, während Anfragen vom Checker nur für den für die Fehlererkennung notwendigen Vergleich verwendet werden. Die ausgele- senen Daten werden direkt zum Master geführt und mit einem evtl. vorgesehenen Taktversatz, z.B. 1,5 Takte, zum Checker.
Im Performanzmodus muss die DCU 404 die gleichzeitigen Zugriffe der beiden CPUs zum Datenspeicher 140 und zu der Peripherie auflösen. Grundsätzlich erfolgt die gleiche Priorisierung wie bei der ICU 401. Zusätzlich ist noch ein Se- maphormechanismus implementiert, um ein Sperren des Datenspeichers für die andere CPU zu ermöglichen (ähnlich zu dem MESI-Protokoll): Eine CPU kann den Datenspeicher sperren, so dass sie exklusiven Zugriff darauf hat. Während dieser Zeit werden die Zugriffe anderer CPUs durch die DCU gesperrt, bis die erste CPU den Speicher wieder frei gibt. Das Sperren und Freigeben erfolgt durch einen Lesezugriff auf eine bestimmte Speicheradresse (FBFF=64511 in dieser Implementierung), den die DCU erkennen kann. Die Priorisierung ist gleich wie bei den Datenspeicherzugriffen. Bei einem gleichzeitigen Sperrwunsch von beiden CPUs erhält der Master zuerst die exklusiven Zugriffsrechte. Die Implementierung des Speichersperrmechanismus erfolgt in der DCU, um Standardprozessoren verwenden zu können.
Die Funktionalität des Speichersperrmechanismus besteht aus 6 Zuständen: corel_access-. Speicherzugriff von Master. Falls der Master den Speicher sperren möchte, kann er das in diesem Zustand vornehmen. core2_access-. Speicherzugriff von Checker. Falls der Checker den Speicher sperren möchte, kann er dass in diesem Zustand vornehmen. coreljocked: Master 1 hat den Datenspeicher gesperrt. Er hat exklusiven Zugriff auf den Datenspeicher und die Peripherie. Möchte in diesem Zustand der Checker auf den Speicher zugreifen, so wird er durch das
Signal wait2 angehalten, bis der Master den Datenspeicher wieder freigegeben hat. core2_locked: Checker hat den Datenspeicher exklusiv für sich reserviert. Nun wird der Master bei Datenspeicheroperationen durch das Signal waitl angehalten.
- lockl_wait: Der Datenspeicher war durch den Checker gesperrt als der Master ihn ebenfalls für sich reservieren wollte. Der Master ist somit für die nächste Speichersperrung vorgemerkt.
- Iock2_wait: Datenspeicher war durch den Master gesperrt. Der Checker bekommt den Speicher vorreserviert.
Mit 405 und 406 sind Mode-Switch Detect Einheiten bezeichnet. Die Mode- Switch Detect Einheiten sitzen jeweils zwischen dem Instruktionscache 402 bzw. 403 und der CPU und beobachten den Befehlsbus. Sobald sie die mode-switch Instruktion bemerken, teilen sie dies einer Mode-Switch Einheit 407 mit. Diese Funktionalität könnte ebenso durch den Befehlsdecoder der beiden Prozessoren erfolgen. Da aber hier Standardprozessoren ohne eine interne Änderung verwendet werden sollen, wird dies extern implementiert. Nachteilig ist, dass der Befehl erkannt wird, sobald er aus dem Speicher ausgelesen wird. Ist nun im Programmablauf davor ein Sprungbefehl, ist der Umschaltbefehl trotzdem aktiv, obwohl er eigentlich in der Pipeline aufgrund des Sprunges gelöscht werden würde. Somit würde das System fehlerhaft den Modus wechseln. Dieses Problem kann jedoch gelöst werden, indem die Instruktionen durch den Compiler so umgeordnet werden, dass vor der mode-switch Instruktion kein Sprungbefehl steht. Der notwendige Abstand zwischen dem Sprungbefehl und dem mode- switch Befehl ist abhängig von der Anzahl der Pipelinestufen der verwendeten CPUs.
Wie bereits erwähnt, erfolgt die Modusumschaltung durch die Software. Die da- zu nötige Hardwareunterstützung ist in der Mode-Switch Einheit 407 implementiert. Der folgende Programmauszug stellt beispielsweise die Umschaltung vom Sicherheits- in den Performanzmodus dar:
LDL rl, 248
LDH rl, 255 (D
MODE - SWITCH (2)
LDW r2,rl (3)
BTEST r2, 5 (4)
JMPI CT (5)
In Zeile (1) wird in das Register rl die Adresse geladen, an der die DCU das Prozessor Id- Bit ausgibt. Als nächstes (2) wird der mode-switch Befehl ausgeführt. Da die beiden Prozessoren im Sicherheitsmodus in diesem Beispiel mit einem Taktversatz von 1,5 Takten arbeiten, erkennt die Mode-Switch Detect Einheit des Masters zuerst den Umschaltbefehl. Dies teilt sie durch das Signal corel_signal der Mode-Switch Einheit mit, die als Folge den Checker durch das Signal waitl anhält. 1,5 Takte später erkennt die Mode-Switch Detect Einheit des Checkers ebenfalls den Umschaltbefehl. Die Mode-Switch Einheit hält anschließend den Checker für einen halben Takt an, um die Taktsignale der beiden CPUs bezüglich der Phase zu synchronisieren. Schließlich wird das Modussignal vom Sicherheitsmodus auf den Performanzmodus umgeschaltet und die wait- Signale werden weggenommen. Die beiden CPUs arbeiten nun mit identischen Taktsignalen weiter. Im Schritt (3) laden nun die beiden CPUs ihr Prozessoridentifikationsbit aus der DCU. Dann wird (4) überprüft ob das Bit auf 0 oder 1 ge- setzt ist und es wird ein bedingter Sprung von Checker ausgeführt (5), da sein Coreld-Bit 1 ist. Der Master führt keinen Sprung aus, sondern arbeitet an dieser Programmposition weiter, da sein Core-Id-Bit 0 ist. Somit ist der Programmablauf der beiden CPUs - wie gewünscht - getrennt. Beim Umschalten von Perfor- manz- auf Sicherheits-Modus wird zunächst die Recovery- Vorrichtung über das Core Mode Signal aktiviert. Anschließend wird der Cache geleert (geflusht) um zu verhindern, dass Datenreste in die Recovery- Vorrichtung übernommen werden. Dann werden über eine Softwareroutine die Registerinhalte der beiden Prozessoren angepasst, was zugleich auch die Schattenregister in der Recovery- Vorrichtung beschreibt. Daher sind bis auf den Cache-Flush keine Softwareanpassungen für die Recovery- Vorrichtung notwendig. Durch Einbau von Regis- terstufen zwischen den einzelnen Prozessoren sowie vor bestimmten Eingangssignalen ist es möglich, die Prozessoren im Taktversatz zu betreiben, was zur Eindämmung von Common-Mode-Fehlern dient.
Zusätzlich können, wie anhand Figur 5 erläutert, mehrere Taktgeber (Clock) (Quarze) für die einzelnen Prozessoren verwendet werden. Figur 5a und Figur 5b werden zusammen als Figur 5 bezeichnet. In Figur 5a ist ein Beispiel für drei Taktgeber, in Figur 5b für zwei Taktgeber gezeigt. In Figur 5 wird aus Gründen der Übersicht nur der Aufbau betreffend das Registerfile 121 gezeigt. Der Aufbau betreffend das PSW- Register unterscheidet sich davon nicht.
Von Master 101 und Checker 102 werden, wie beschrieben, über die Leitungen 110, 112, 114 und 115 Daten der Recovery- Vorrichtung 120 bereitgestellt. Bei der Ausgestaltung gemäß Figur 5 sind für Master 101 und Checker 102 separate Taktgeber 203 und 204 vorgesehen. Es ist ebenso denkbar, dass diese Takt- geber in die Cores integriert ausgebildet sind. In diesem Fall muss das Taktgeber-Signal (clk) herausgeführt werden. Die beiden Prozessoren arbeiten nun nicht mehr synchron. Daher sollte beim Schreiben auf die Recovery- Vorrichtung darauf geachtet werden, dass die beiden CPUs nicht zu weit auseinander laufen (d.h. der Taktversatz darf nicht zu groß werden). Dazu werden vorzugsweise von den Core-Taktgebern 203, 204 getriebene Fl FO- Pufferstufen 201, 202
(First In First Out) vor die Komparator/Paritätseinheit 126 eingefügt, die die ein- gehenden Signale puffern. Sobald die CPUs 101, 102 zu weit auseinander laufen, kann der schnellere bspw. über ein wait Signal angehalten werden, bis sie wieder taktsynchron laufen.
Bei der Ausgestaltung gemäß Figur 5a werden das Schattenregisterfile 121 sowie das PSW- Register 122 (nicht gezeigt) mit einem separaten Taktgeber 205 getaktet.
Bei der Ausgestaltung gemäß Figur 5b werden das Schattenregisterfile 121 so- wie das PSW- Register 122 (nicht gezeigt) von den Core-Taktgebern 203, 204 getaktet. In diesem Fall muss das Registerfile asynchron beschrieben werden. Der Schreibvorgang wird dabei über die Komparator/Paritätseinheit 126 gesteuert, die jedes Mal, wenn zwei neue übereinstimmende Datenwörter anliegen, ein Schreibsignal absetzt. Falls die Datenwörter nicht übereinstimmen, erzeugt die Komparator/Paritätseinheit ein Fehlersignal über die Leitung 116. Der Lesezugriff auf das Schattenregisterfile 121 erfolgt auch in diesem Fall synchron über die Taktgeber 203, 204 der einzelnen Cores 101, 102.
Es versteht sich, dass die vorstehend erläuterten bevorzugten Ausführungsfor- men des erfindungsgemäßen Verfahrens nur beispielhaft zu verstehen sind. Daneben sind für einen Fachmann weitere Lösungen denkbar, ohne den Rahmen der vorliegenden Erfindung zu verlassen.

Claims

Ansprüche
1. Vorrichtung (120) zum Beheben von Fehlern bei einem wenigstens zwei Ausführungseinheiten (101, 102) mit Registern aufweisenden System (100, 400), wobei die Register zur Aufnahme von Daten ausgebildet sind, mit Vergleichsmitteln (126), die derart eingerichtet sind, dass durch einen Vergleich von Daten, die zur Ablage in den Registern vorgesehen sind, eine Abweichung und anhand der Abweichung ein Fehler feststellbar ist, g e k e n n z e i c h n e t d u r c h wenigstens ein Schattenregister (121, 122), das derart eingerichtet ist, dass Daten der Register betreffende Daten darin ablegbar sind, und durch
Mittel zum Wiederherstellen fehlerfreier Daten in wenigstens einem Register auf Grundlage der Daten in dem wenigstens einen Schattenregister (121, 122) bei einem festgestellten Fehler.
2. Vorrichtung (120) nach Anspruch 1, gekennzeichnet durch wenigstens ein ein Prozessor- Status-Wort (PSW) (122), ein Registerfile (121) und/oder eine Instruktionsadresse aufnehmendes Schattenregister.
3. Vorrichtung (120) nach einem der Ansprüche 1 oder 2, dadurch gekenn- zeichnet, dass das wenigstens eine Schattenregister (121, 122) in den
Speicherbereich wenigstens einer Ausführungseinheit (101, 102) einblendbar ist.
4. Vorrichtung (120) nach einem der vorstehenden Ansprüche, gekennzeich- net durch eine Befehlsausführeinheit (123) zum Ausführen von Befehlen aus einem Instruktionsspeicher (130) des wenigstens zwei Ausführungs- einheiten (101, 102) mit Registern aufweisenden Systems (100, 400) zum Erhalt von Adress- und Schreibsignalen für das wenigstens eine Schattenregister (121, 122).
5. Vorrichtung (120) nach einem der vorstehenden Ansprüche, dadurch gekennzeichnet, dass die Daten der Register betreffenden Daten die Daten der Register selbst sind, und die Mittel zum Wiederherstellen fehlerfreier Daten in wenigstens einem Register auf Grundlage der Daten in dem wenigstens einen Schattenregister (121, 122) bei einem festgestellten Fehler zum Übertragen der Daten aus dem wenigstens einen Schattenregister
(121, 122) in wenigstens ein Register ausgebildet sind.
6. Vorrichtung (120) nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass die Daten der Register betreffenden Daten Prüfsummen sind.
7. Prozessor (100, 400) mit wenigstens zwei Ausführungseinheiten (101, 102), gekennzeichnet durch eine Vorrichtung (120) nach einem der vorstehenden Ansprüche.
8. Prozessor (100, 400) nach Anspruch 7, gekennzeichnet durch Umschaltmittel (407) zum Umschalten zwischen einem Sicherheits- Modus und einem Perfomanz-Modus, wobei die wenigstens zwei Ausführungseinheiten (101, 102) in dem Sicherheits-Modus das gleiche Programm ausführen und in dem Perfomanz-Modus verschiedene Programme ausführen.
9. Prozessor (100, 400) nach Anspruch 7 oder 8, gekennzeichnet durch Mittel zum Leeren eines Cache-Speichers (402, 403).
10. Prozessor (100, 400) nach einem der Ansprüche 7 bis 9, dadurch gekennzeichnet, dass wenigstens zwei Taktgeber (203, 204, 205) vorgesehen sind.
11. Prozessor (100, 400) nach Anspruch 10, dadurch gekennzeichnet, dass genau ein Taktgeber (203, 204) für jeweils eine Ausführungseinheit (101, 102) und ein Taktgeber (205) für die Vorrichtung (120) vorgesehen ist.
12. Verfahren zum Beheben von Fehlern bei einem wenigstens zwei Ausfüh- rungseinheiten (101, 102) mit Registern aufweisenden System (100, 400), wobei Daten zur Ablage in den Registern vorgesehen werden, wobei die Daten verglichen werden und bei einer Abweichung ein Fehler festgestellt wird, d a d u r c h g e k e n n z e i c h n e t , d a s s wenigstens ein Schattenregister (121, 122) zur Aufnahme von Daten der
Register betreffenden Daten vorgesehen wird, wobei fehlerfreie Daten in wenigstens einem Register auf Grundlage der Daten in dem wenigstens einen Schattenregister (121, 122) bei einem festgestellten Fehler wiederhergestellt werden.
13. Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass in das wenigstens eine Schattenregister ein Prozessor- Status-Wort (PSW) (122), ein Registerfile (121) und/oder eine Instruktionsadresse abgelegt wird.
14. Verfahren nach Anspruch 12 oder 13, dadurch gekennzeichnet, dass wenigstens ein Schattenregister (121, 122) in den Speicherbereich wenigstens einer Ausführungseinheit (101, 102) eingeblendet wird.
15. Verfahren nach einem der Ansprüche 12 bis 14, dadurch gekennzeichnet, dass Befehle aus einem Instruktionsspeicher (130) des wenigstens zwei
Ausführungseinheiten (101, 102) mit Registern aufweisenden Systems (100, 400) ausgeführt werden, wobei Adress- und Schreibsignale für das wenigstens eine Schattenregister (121, 122) erhalten werden.
16. Verfahren nach einem der Ansprüche 12 bis 15, dadurch gekennzeichnet, dass dem wenigstens einen Schattenregister (121, 122) eine Parität zum
Festellen der Korrektheit der Daten in dem Schattenregister (121, 122) zugeordnet wird.
17. Verfahren nach einem der Ansprüche 12 bis 16, dadurch gekennzeichnet, dass die Daten der Register betreffende Daten die Daten der Register selbst sind, und fehlerfreie Daten in wenigstens einem Register durch Ll- bertragen der Daten aus dem wenigstens einen Schattenregister (121, 122) in das wenigstens eine Register wiederhergestellt werden.
18. Verfahren nach einem der Ansprüche 12 bis 16, dadurch gekennzeichnet, dass die Daten der Register betreffende Daten Prüfsummen sind.
19. Verfahren nach einem der Ansprüche 12 bis 18, dadurch gekennzeichnet, dass die Daten von wenigstens zwei Registern und wenigstens einem Schattenregister (121, 122) verglichen werden und die Daten als fehlerfrei festgestellt werden, die hauptsächlich übereinstimmen.
20. Verfahren nach einem der Ansprüche 12 bis 19, dadurch gekennzeichnet, dass zwischen einem Sicherheits-Modus und einem Perfomanz-Modus umgeschaltet wird, wobei im Sicherheits-Modus ein Verfahren nach einem der Ansprüche 12 bis 19 ausgeführt wird, und wobei im Perfomanz-Modus die wenigstens zwei Ausführungseinheiten verschiedene Programme ausführen.
21. Steuergerät für ein Kraftfahrzeug, gekennzeichnet durch eine Vorrichtung nach einem der Ansprüche 1 bis 6 oder einen Prozessor nach einem der Ansprüche 7 bis 11.
EP06807389A 2005-11-18 2006-10-18 Vorrichtung und verfahren zum beheben von fehlern bei einem wenigstens zwei ausführungseinheiten mit registern aufweisenden system Ceased EP1952239A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102005055067A DE102005055067A1 (de) 2005-11-18 2005-11-18 Vorrichtung und Verfahren zum Beheben von Fehlern bei einem wenigstens zwei Ausführungseinheiten mit Registern aufweisenden System
PCT/EP2006/067558 WO2007057271A1 (de) 2005-11-18 2006-10-18 Vorrichtung und verfahren zum beheben von fehlern bei einem wenigstens zwei ausführungseinheiten mit registern aufweisenden system

Publications (1)

Publication Number Publication Date
EP1952239A1 true EP1952239A1 (de) 2008-08-06

Family

ID=37684923

Family Applications (1)

Application Number Title Priority Date Filing Date
EP06807389A Ceased EP1952239A1 (de) 2005-11-18 2006-10-18 Vorrichtung und verfahren zum beheben von fehlern bei einem wenigstens zwei ausführungseinheiten mit registern aufweisenden system

Country Status (7)

Country Link
US (1) US20090044044A1 (de)
EP (1) EP1952239A1 (de)
JP (1) JP2009516277A (de)
KR (1) KR20080068710A (de)
CN (1) CN101313281A (de)
DE (1) DE102005055067A1 (de)
WO (1) WO2007057271A1 (de)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005054587A1 (de) * 2005-11-16 2007-05-24 Robert Bosch Gmbh Programmgesteuerte Einheit und Verfahren zum Betreiben derselbigen
US20090228686A1 (en) * 2007-05-22 2009-09-10 Koenck Steven E Energy efficient processing device
US9207661B2 (en) * 2007-07-20 2015-12-08 GM Global Technology Operations LLC Dual core architecture of a control module of an engine
US7689751B2 (en) * 2008-02-15 2010-03-30 Sun Microsystems, Inc. PCI-express system
JP5243113B2 (ja) * 2008-06-19 2013-07-24 株式会社日立製作所 演算処理装置多重化制御システム
JP4709268B2 (ja) * 2008-11-28 2011-06-22 日立オートモティブシステムズ株式会社 車両制御用マルチコアシステムまたは内燃機関の制御装置
US8112674B2 (en) * 2009-04-01 2012-02-07 International Business Machines Corporation Device activity triggered device diagnostics
US8886994B2 (en) * 2009-12-07 2014-11-11 Space Micro, Inc. Radiation hard and fault tolerant multicore processor and method for ionizing radiation environment
JP5620730B2 (ja) * 2010-07-13 2014-11-05 株式会社日立製作所 2重系演算処理装置および2重系演算処理方法
US8589775B2 (en) * 2011-03-14 2013-11-19 Infineon Technologies Ag Error tolerant flip-flops
US9058419B2 (en) 2012-03-14 2015-06-16 GM Global Technology Operations LLC System and method for verifying the integrity of a safety-critical vehicle control system
JP5978873B2 (ja) * 2012-09-12 2016-08-24 株式会社デンソー 電子制御装置
JP6050083B2 (ja) * 2012-10-18 2016-12-21 ルネサスエレクトロニクス株式会社 半導体装置
KR101978984B1 (ko) * 2013-05-14 2019-05-17 한국전자통신연구원 프로세서의 오류를 검출하는 장치 및 방법
KR20140134376A (ko) * 2013-05-14 2014-11-24 한국전자통신연구원 오류감지가 가능한 프로세서 및 이를 이용한 프로세서 코어 오류 감지 방법
GB2515618B (en) 2013-05-30 2017-10-11 Electronics & Telecommunications Res Inst Method and apparatus for controlling operation voltage of processor core, and processor system including the same
US9304935B2 (en) * 2014-01-24 2016-04-05 International Business Machines Corporation Enhancing reliability of transaction execution by using transaction digests
US9130559B1 (en) * 2014-09-24 2015-09-08 Xilinx, Inc. Programmable IC with safety sub-system
US10275007B2 (en) * 2014-09-26 2019-04-30 Intel Corporation Performance management for a multiple-CPU platform
US9727679B2 (en) 2014-12-20 2017-08-08 Intel Corporation System on chip configuration metadata
US20160179161A1 (en) * 2014-12-22 2016-06-23 Robert P. Adler Decode information library
KR101658828B1 (ko) * 2015-03-23 2016-09-22 한국전자통신연구원 씨피유 코어의 기능복구를 위한 장치 및 방법
US10942748B2 (en) * 2015-07-16 2021-03-09 Nxp B.V. Method and system for processing interrupts with shadow units in a microcontroller
US10289578B2 (en) * 2015-09-01 2019-05-14 International Business Machines Corporation Per-DRAM and per-buffer addressability shadow registers and write-back functionality
CN105573856A (zh) * 2016-01-22 2016-05-11 芯海科技(深圳)股份有限公司 一种解决指令读取异常问题的方法
KR102649318B1 (ko) 2016-12-29 2024-03-20 삼성전자주식회사 상태 회로를 포함하는 메모리 장치와 그것의 동작 방법
US10558539B2 (en) * 2017-09-28 2020-02-11 GM Global Technology Operations LLC Methods and systems for testing components of parallel computing devices
US10528077B2 (en) * 2017-11-21 2020-01-07 The Boeing Company Instruction processing alignment system
US10599513B2 (en) 2017-11-21 2020-03-24 The Boeing Company Message synchronization system
GB2575668B (en) 2018-07-19 2021-09-22 Advanced Risc Mach Ltd Memory scanning operation in response to common mode fault signal
CN114610519B (zh) * 2022-03-17 2023-03-14 电子科技大学 一种处理器寄存器组的异常错误的实时恢复方法及系统

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5313625A (en) * 1991-07-30 1994-05-17 Honeywell Inc. Fault recoverable computer system
JPH06195235A (ja) * 1992-12-22 1994-07-15 Hitachi Ltd 制御装置およびプロセッサ
JPH0773059A (ja) * 1993-03-02 1995-03-17 Tandem Comput Inc フォールトトレラント型コンピュータシステム
US5504859A (en) * 1993-11-09 1996-04-02 International Business Machines Corporation Data processor with enhanced error recovery
WO1996033464A1 (en) * 1995-04-18 1996-10-24 International Business Machines Corporation Processing unit to clock interface
US5689634A (en) * 1996-09-23 1997-11-18 Hewlett-Packard Co. Three purpose shadow register attached to the output of storage devices
US5926646A (en) * 1997-09-11 1999-07-20 Advanced Micro Devices, Inc. Context-dependent memory-mapped registers for transparent expansion of a register file
JP2002014943A (ja) * 2000-06-30 2002-01-18 Nippon Telegr & Teleph Corp <Ntt> 耐故障性システム及びその故障検出方法
US6772368B2 (en) * 2000-12-11 2004-08-03 International Business Machines Corporation Multiprocessor with pair-wise high reliability mode, and method therefore
US6751749B2 (en) * 2001-02-22 2004-06-15 International Business Machines Corporation Method and apparatus for computer system reliability
US20030028696A1 (en) * 2001-06-01 2003-02-06 Michael Catherwood Low overhead interrupt
BRPI0411824A (pt) * 2003-06-24 2006-08-08 Bosch Gmbh Robert processo para a comutação entre, pelo menos, dois modos de operação de uma unidade de processamento, bem como, unidade de processamento correspondente
JP2005235074A (ja) * 2004-02-23 2005-09-02 Fujitsu Ltd Fpgaのソフトエラー補正方法
DE102005054587A1 (de) * 2005-11-16 2007-05-24 Robert Bosch Gmbh Programmgesteuerte Einheit und Verfahren zum Betreiben derselbigen

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO2007057271A1 *

Also Published As

Publication number Publication date
JP2009516277A (ja) 2009-04-16
WO2007057271A1 (de) 2007-05-24
DE102005055067A1 (de) 2007-05-24
KR20080068710A (ko) 2008-07-23
CN101313281A (zh) 2008-11-26
US20090044044A1 (en) 2009-02-12

Similar Documents

Publication Publication Date Title
WO2007057271A1 (de) Vorrichtung und verfahren zum beheben von fehlern bei einem wenigstens zwei ausführungseinheiten mit registern aufweisenden system
EP1807763B1 (de) Verfahren und vorrichtung zur überwachung einer speichereinheit in einem mehrprozessorsystem
EP1917592B1 (de) Rechnersystems mit wenigstens zwei ausführungseinheiten und einer vergleichseinheit sowie verfahren zu dessen steuerung
EP1667022A2 (de) Vorrichtung und Verfahren zur Behebung von Fehlern bei einem Prozessor mit zwei Ausführungseinheiten
DE69817696T2 (de) Warmaustausch von gespiegeltem Nachschreib-Cachespeicher
DE102011086530A1 (de) Mikroprozessorsystem mit fehlertoleranter Architektur
DE102008004205A1 (de) Schaltungsanordnung und Verfahren zur Fehlerbehandlung in Echtzeitsystemen
EP1955164A1 (de) Programmgesteuerte einheit und verfahren zum betreiben derselbigen
EP1618476A2 (de) Programmgesteuerte einheit und verfahren
DE102004037713A1 (de) Verfahren, Betriebssystem und Rechengerät zum Abarbeiten eines Computerprogramms
DE102004051966A1 (de) Verfahren, Betriebssystem und Rechengerät zum Abarbeiten eines Computerprogramms
DE102005037226A1 (de) Verfahren und Vorrichtung zur Festlegung eines Startzustandes bei einem Rechnersystem mit wenigstens zwei Ausführungseinheiten durch markieren von Registern
DE102004051952A1 (de) Verfahren zur Datenverteilung und Datenverteilungseinheit in einem Mehrprozessorsystem
EP1433061B1 (de) Verfahren zum überprüfen eines rechnerkerns eines mikroprozessors oder eines mikrocontrollers
WO2007017372A1 (de) Verfahren und vorrichtung zur steuerung eines rechnersystems mit wenigstens zwei ausführungseinheiten
DE102004051937A1 (de) Verfahren und Vorrichtung zur Synchronisierung in einem Mehrprozessorsystem
DE102004051967A1 (de) Verfahren, Betriebssystem und Rechengerät zum Abarbeiten eines Computerprogramms
DE102004051964A1 (de) Verfahren und Vorrichtung zur Überwachung einer Speichereinheit in einem Mehrprozessorsystem
EP1915674B1 (de) Verfahren und vorrichtung zur steuerung eines rechnersystems mit wenigstens zwei ausführungseinheiten und mit wenigstens zwei gruppen von internen zuständen
DE102004051950A1 (de) Verfahren und Vorrichtung zur Taktumschaltung bei einem Mehrprozessorsystem
DE102005037259A1 (de) Verfahren und Vorrichtung zur Festlegung eines Startzustandes bei einem Rechnersystem mit wenigstens zwei Ausführungseinheiten durch Umschalten von Registersätzen
DE102004051992A1 (de) Verfahren und Vorrichtung zur Verzögerung von Zugriffen auf Daten und/oder Befehle eines Mehrprozessorsystems
DE102005037258A1 (de) Verfahren und Vorrichtung zur Festlegung eines Startzustandes bei einem Rechnersystem mit wenigstens zwei Ausführungseinheiten durch Übernehmen des Startzustandes

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20080618

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU LV MC NL PL PT RO SE SI SK TR

17Q First examination report despatched

Effective date: 20080917

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION HAS BEEN REFUSED

18R Application refused

Effective date: 20090831