EP1812861A1 - Method and device for delaying accesses to data and/or commands of a multiprocessor system - Google Patents

Method and device for delaying accesses to data and/or commands of a multiprocessor system

Info

Publication number
EP1812861A1
EP1812861A1 EP05811008A EP05811008A EP1812861A1 EP 1812861 A1 EP1812861 A1 EP 1812861A1 EP 05811008 A EP05811008 A EP 05811008A EP 05811008 A EP05811008 A EP 05811008A EP 1812861 A1 EP1812861 A1 EP 1812861A1
Authority
EP
European Patent Office
Prior art keywords
data
processor
access
delaying
commands
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
EP05811008A
Other languages
German (de)
French (fr)
Inventor
Thomas Kottke
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE200410051950 external-priority patent/DE102004051950A1/en
Priority claimed from DE200410051952 external-priority patent/DE102004051952A1/en
Priority claimed from DE200410051992 external-priority patent/DE102004051992A1/en
Priority claimed from DE200410051964 external-priority patent/DE102004051964A1/en
Priority claimed from DE200410051937 external-priority patent/DE102004051937A1/en
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Publication of EP1812861A1 publication Critical patent/EP1812861A1/en
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30181Instruction operation extension or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30181Instruction operation extension or modification
    • G06F9/30189Instruction operation extension or modification according to execution mode, e.g. mode flag
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1629Error detection by comparing the output of redundant processing systems
    • G06F11/1641Error detection by comparing the output of redundant processing systems where the comparison is not performed by the redundant processing components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1695Error detection or correction of the data by redundancy in hardware which are operating with time diversity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/16Protection against loss of memory contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • G06F9/3851Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution from multiple instruction streams, e.g. multistreaming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3885Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/845Systems in which the redundancy can be transformed in increased performance

Definitions

  • the invention relates to a method for delaying the access to data and / or commands of a multi-computer system and a corresponding delay unit according to the known from the prior art features of the independent claims.
  • dual-computer systems or dual-processor systems are today's computer systems for safety-critical applications, in particular in vehicles such as for anti-lock braking systems, electronic stability program (ESP), X-by-wire systems such as drive-by-wire or steer-by-wire as well as break-by-wire, etc. or other networked systems.
  • ESP electronic stability program
  • X-by-wire systems such as drive-by-wire or steer-by-wire as well as break-by-wire, etc. or other networked systems.
  • powerful error mechanisms and error handling mechanisms are required, in particular to counteract transient errors that arise, for example, in miniaturization of the semiconductor structures of the computer systems.
  • an increase in performance ie an increase in performance
  • the two execution units or cores process different
  • the second reason to realize a dual-core or multi-core architecture is one
  • processors must be in the performance Mode, and the same data in error detection mode.
  • Such a device or unit enables the effective operation of a two-processor system, so that in the two modes security and performance can be switched during operation.
  • processors will be discussed below, which also includes cores or computing units conceptually.
  • a cache is usually provided for each processor.
  • a cache is usually not sufficient because this cache must be spatially located between the two processors. Consequently, due to the long delay between the cache and the two processors, the two processors could only operate with a limited clock frequency.
  • Caches serve as a fast cache in the system, so that the processor does not always have to fetch the data from the slow main memory. In order to make this possible, it is important to pay close attention to the access time when implementing the cache. This consists of the actual access time to fetch the data from the cache and from the time to pass the data to the processor together. If the cache is now located far away from the processor, the transfer of data takes a long time and the processor can no longer work with its full clock. Because of this timing problem, two-processor systems typically provide a separate cache for each processor.
  • the saving takes place by utilizing a clock offset.
  • the invention describes a method and a device for delaying the access to data and / or commands of a multiprocessor system having a first and a second processor, to which a memory unit is assigned, wherein the second processor operates with a clock offset and the device operates in this way is formed such that the first processor accesses the memory unit and the second processor receives the data and / or commands with a clock offset.
  • the memory unit is a cache memory
  • the advantages of this memory technology can be combined with the advantages of the invention.
  • the memory unit is addressed by at least one processor and is directly coupled to the processor that addresses it.
  • a delay element is included and the device is designed such that the clock offset is used by the delay element to implement a bridging of the duration of the data and / or commands from the memory unit to the second processor.
  • comparison means are provided by which the data and / or commands are compared and these comparison means are arranged spatially close to the following processor.
  • the device is configured such that the clock offset is utilized to guide the comparison data of the first processor to the second processor.
  • Cache for the slave processor can be omitted.
  • a dual-processor system there are 2 processors that can handle the same or different tasks. These two processors of the dual-computer system can execute these tasks isochrone- or off-clock. If a two-processor system is constructed for fault detection, it is advantageous to avoid common-mode errors that these two processors operate with a clock skew. This method is most effective when a non-integer clock offset> 1 is chosen. This means that in this first application form both processors or cores work the same tasks. If the two processors work off different tasks, it is more advantageous for them to run clock-edge synchronously, since the external components such as memory can only be controlled with the clock of a processor. If, for example, a two-processor system switchable between these two modes is used, it is thus optimized for an operating mode.
  • this is compensated for by the fact that in the two-processor system (or multiprocessor system) which can be switched over between two modes such as security and performance, the two processors work in the security mode with a clock offset and in the mode without clock offset.
  • the Performance mode no clock offset is advantageous because the external components such as memory are usually operated at a lower clock frequency and are designed by the clock edge suitable for only one processor. Otherwise, the second clock offset processor would have a wait cycle each time it accesses memory, because it will expose the external component by one-half
  • the optimum in error detection is taken out of safety mode and in performance mode the maximum in performance.
  • the invention advantageously relates to a method and a device for delaying access to data and / or instructions of a multiprocessor system having a first and a second processor, which is associated with a memory unit, wherein the first and second processors operate with a clock offset and the Device is designed such that both processors access the same memory unit with this clock offset.
  • write operations and read operations are delayed as accesses, the device between delaying the accesses and non ⁇
  • Delay of accesses is switchable.
  • a multiprocessor system is disclosed with such a device.
  • the two processors operate at a clock skew. This can be shifted both by whole bars as well as parts of the bar against each other be.
  • a different clock frequency is used in the two modes. In the safety-critical mode, for example, a lower clock can be used for interference suppression than in the performance mode.
  • the first operating mode corresponds to a safety mode in which the two arithmetic units execute the same programs and / or data and comparison means are provided which compare the states that arise during the execution of the same programs to match.
  • the erf ⁇ ndungswashe unit or the inventive method allows the optimized implementation of the two modes in a two-processor system.
  • the two processors operate in error detection mode (F mode)
  • the two processors receive the same data / instructions and operate in performance mode (P mode), so each processor can access the memory. Then this unit manages the accesses to the only simply existing memory or peripherals.
  • the unit takes over the data / addresses of a processor (called master here) and forwards them to the components such as memory, bus, etc.
  • the second processor (here slave) wants to make the same access.
  • the data distribution unit accepts this at a second port but does not forward the request to the other components.
  • the data distribution unit gives the slave the same data as the master and compares the data of the two processors. If these are different, this indicates the data distribution unit (here DVE) by an error signal.
  • DVE data distribution unit
  • the two processors work on different parts of the program.
  • the memory accesses are thus also different.
  • the DVE thus accepts the request from the processors and returns the results / requested data to the processor that requested them.
  • one processor is placed in a wait state until the other has been serviced.
  • the switching between the two modes and thus the different operation of the data distribution unit is effected by a control signal. This can either be generated by one of the two processors or externally.
  • the DVE unit delays the data for the slave accordingly or stores the output data of the master until it matches the output data of the master
  • Slave can be compared for error detection.
  • FIG. 1 shows a dual-computer system with a first computer 100, in particular one
  • Error detection include, in which namely the first computer 100 and the second computer 101 with a time offset, in particular a predetermined time offset or a predetermined clock offset work.
  • any time can be predetermined for a time offset and also any desired clock with respect to an offset of the clock cycles.
  • This may be an integer offset of the clock cycle, but just as shown in this example, for example, an offset of 1.5 clock cycles, in which case the first computer 100 just works 1.5 clock cycles before the second computer 101 respectively operated becomes.
  • this system is designed to operate at a given skew or clock skew, particularly 1.5 clock cycles, i. while a computer, z. B. computer 100 directly the components, in particular the external components 103 and 104 responds, the second computer 101 operates with a delay of exactly 1.5 clock cycles to do so.
  • computer 101 is fed with the inverted clock, that is to say the inverted clock at the clock input CLK2.
  • 117 is a command bus in which 117A is a command address bus and 117B is the partial command (data) bus.
  • Address bus 117A is connected to computer 100 via a command address connection IA1 (instruction address 1) and to computer 101 via an instruction address connection IA2 (instruction address 2).
  • the instructions themselves are transmitted via the sub-command bus 117B, which is connected to computer 100 via a command terminal II (Instruction 1) and to computer 101 via a command terminal 12 (Instruction 2).
  • this command bus 117 consisting of 117A and 117B is a component 103 z.
  • Instruction memory in particular a secure instruction memory or the like interposed.
  • This component in particular as a command memory is operated in this example with the clock CLK.
  • a data bus is shown which includes a data address bus or a data address line 116A and a data bus or a data line 116B. It is 116A, so the
  • Data address line via a data address port DAl (Data Address 1) to the computer 100 and via a data address port DA2 (Data Address 2) connected to computer 101.
  • the data bus or the data line 116B is connected via a data connection DO1 (Data Out 1) and a data connection DO2 (Data Out 2) Computer 100 or computer 101 connected.
  • the data bus 116C which is connected to computer 100 or computer 101 via a data connection Dil (Data In 1) and a data connection DI2 (Data In 2), also belongs to data bus 116.
  • a component 104 is interposed, for example a data memory, in particular a secure data memory o. ⁇ . This component 104 is also supplied with the clock CLK in this example.
  • the components 103 and 104 are representative of any components which are connected via a data bus and / or command bus to the computers of the dual-computer system and corresponding to the accesses via data and / or commands of the dual-processor system with respect to write operations and / or read operations erroneous data and / or commands receive or give away.
  • error detection generators 105, 106 and 107 are provided which generate an error detection such as, for example, a parity bit or another error code such as an error correction code, ie ECC, or the like
  • an error correction code ie ECC
  • the parity bit or another error code such as ECC.
  • a delay unit 102 is now connected as shown in the lines of the data bus and / or in the command bus. Because of
  • Clarity is shown only the involvement in the data bus. Of course, this is just as possible and imaginable with regard to the command bus.
  • This delay unit 102 or the delay unit delays the accesses, here in particular the memory accesses, in such a way that a possible time or clock offset is compensated, in particular in the event of an error detection, for example via the comparators 110 and
  • the error signal is generated in the dual-computer system, that is, the error detection is performed in the dual-computer system.
  • Various variants can be implemented here: delay of the read and write operations, delay of only the write operations or, although not preferred, a delay of the read operations. It can be converted by a change signal, in particular the error signal, a delayed write operation in a read operation to prevent erroneous writing.
  • DVE Data distribution unit
  • IIIOPDetect the changeover request
  • mode switch unit the mode switch unit
  • Iram and Dram Control module the Iram and Dram Control module
  • This unit is located between the cache and the processor on the instruction bus and checks if the IUOp command is being loaded into the processor. If the command is detected, this event is reported to the Modeswitch unit.
  • Switch-Detect "'unit is unique to each processor. The "Switch-Detect” unit does not have to be fault-tolerant since it is duplicated and thus redundant, but on the other hand it is conceivable to perform this unit in a fault-tolerant and thus singular manner, but the redundant design is preferred.
  • ModeSwitch Switching between the two modes is triggered by the "Switch-Detect” unit, which is to switch from Lock to Split mode
  • Both "Switch-Detect” units detect the switchover, as both processors execute the same program code in Lock mode.
  • the "Switch-Detect” unit of processor 1 recognizes this 1.5 clocks before the "" switch mode. Detect “'Unit of the processor 2.
  • The""Modeswitch'” unit stops the processor 1 by 2 clocks with the help of the wait signal.
  • the processor 2 is also stopped 1.5 clocks later, but only by half a clock to be synchronized to the system clock. Subsequently, the status signal is switched to split for the other components and the two processors continue to work. In order for the two processors to perform different tasks, they must diverge in the program code. This is done by reading directly after switching to split mode
  • Processor ID is done. This read processor ID is different for each of the two processors. If a comparison is now made to a desired processor ID, then the corresponding processor can be brought to another program location with a conditional jump command. When switching from split mode to lock mode, a processor will notice this, or one of them first. This
  • Switch-Detect unit and informs the Modeswitch unit which stops the corresponding processor and informs the second of the request for synchronization by an interrupt, the second processor receives an interrupt and can now execute a software routine to complete its task.
  • both "Switch-Detect" units must notify the Modeswitch unit that they want to switch to Split mode, and if the changeover request is only from one unit, the error is detected by the comparison units These continue to receive data from one of the two processors and they do not match the stopped processors.
  • the two processors are in split mode and one does not switch back to lock mode, this can be detected by an external watchdog. With a trigger signal for each processor, the watchdog notices that the waiting processor does not answer. If there is only one watchdog signal for the processor system, then the triggering of the watchdog must only take place in lock mode. Thus, the watchdog would recognize that the mode switch did not occur.
  • the mode signal is available as a dual-rail signal. Where "UO" is Lock mode and " ⁇ 01" is SpKt mode. Errors have occurred with "W and" ⁇ 11 "'.
  • IramControl Access to the instruction memory of the two processors is controlled via the IRAM Control. This must be designed securely because it is a single point of failure. It consists of two state machines for each processor: one each isochronous iramlclkreset and one asynchronous readiraml. In safety-critical mode, the state machines of the two processors monitor each other and in performance mode, they work separately.
  • processor 1 has the higher priority. After a access to the main memory by processor 1 gets now - if both processors want to access the main memory again ⁇ processor2 the
  • Allocated memory access permission are implemented for each processor. In lock mode, the output signals of the machines are compared to detect any errors.
  • the data for updating the cache 2 in lock mode are in the IRAM control
  • the caches of the two processors can be reloaded differently.
  • the two caches are not coherent.
  • the two processors can diverge and the comparators thus signal an error.
  • a flag table is set up in the IRAM Control. This indicates whether a cache line was written in lock or split mode.
  • lock mode the cache line entry will be set to 0 on a cache line reload and set to 0 in the cache line
  • Split mode even with a cache update of the cache line from only one cache - to 1. If the processor now executes a memory access in lock mode, it is checked whether this cache line was updated in lock mode, i. is the same in both caches. In split mode, the processor can always access the cache line, regardless of the cache line
  • Flag Vector is. This table only has to be present once, since in the case of an error the two processors diverge and thus the errors are reliably detected at the comparators. Since the access times on the central table are relatively high, this table can also be copied to every cache.
  • DramControl In this component, the parity is formed for each of the address, data, and memory control signals from each processor.
  • - Processor Status Lock The two processors are in lock mode. This means that the functionality of the data storage icing is not necessary. Processor 1 coordinates the memory accesses. - Processor status Split: An access conflict resolution to the data storage is now necessary and a storage lock must be possible.
  • the state in split mode is again divided into 7 states, which resolve the access conflicts and the
  • Processor 2 access the memory, it is stopped by a wait signal until processor 1 releases the data memory again. ⁇
  • processor 2 gets the memory pre-reserved. In the case of normal memory access without locks, processor 2 can access processor 1 before processor 1 if processor 1 was in front of it.
  • Memory access of processor 1 The memory is not locked in this case. Processor 1 is allowed to access the data store. If he wants to lock him, he can do so in this condition.
  • the clock changeover is shown using an example, so that with respect to one mode, a clock change takes place in comparison to the other mode.
  • the two modes, the clock clk and the two processor or Coretakte are shown.
  • the two processors work in one clock skew. This can be shifted both by whole bars as well as parts of the clock against each other.
  • Another variant is that a different clock frequency is used in the two modes. In the safety-critical mode, for example, a lower clock can be used for interference suppression than in the performance mode.
  • a cache is provided for each processor, as shown again schematically in FIG.
  • a cache is usually not sufficient because this cache must be spatially located between the two processors. Consequently, due to the long delay between the cache and the two processors, the two processors could only operate with a limited clock frequency.
  • Caches serve as a fast cache so that the processor does not always have to fetch the data from the slow main memory. In order to make this possible, it is important to pay close attention to the access time when implementing the cache. This consists of the actual access time to fetch the data from the cache and from the time to pass the data to the processor together. If the cache is now located far away from the processor, the transfer of data takes a long time and the processor can no longer work with its full clock. Because of this timing problem, two-processor systems typically provide a separate cache for each processor.
  • a cache requires a lot of chip space and also a lot of power. As a result, it also produces a lot of waste heat, which must be dissipated. If a cache can now be dispensed with, then a two-processor system can be implemented much more cost-effectively.
  • one processor is the master and one processor is the slave.
  • the master first processes the data and thus also drives the peripheral components such as memory, cache, DMA controller, etc.
  • the slave processes the same data with a clock offset of 1.5 clocks, for example. This also means that it also gets the data from the shared memory and from the external components later this time.
  • the output data of the two processors such as memory address, data, etc. are compared with each other. To be able to compare the data with each other, the results of the master must also be buffered for 1.5 cycles.
  • Such an example system is shown below.
  • the command and data cache are now arranged directly at the master as in a single processor.
  • the master therefore does not have to accept any performance losses in terms of the cache-to-processor runtimes. Since the slave only processes the data 1.5 clocks later, this time can now be used to transfer the data to the second processor, which is now further away from the cache.
  • two flip-flops can be used in an exemplary clock offset of 1.5 clocks, as shown in Figure 6.
  • the first one is with the beat of the

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

The invention relates to a method and device for delaying accesses to data and/or commands of a multiprocessor system comprising a first and a second processor to both of which a memory unit is assigned. The second processor operates with a clock pulse offset, and the device is designed in such a manner that the first processor accesses the memory unit, and the second processor, with a clock pulse offset, receives the data and/or commands.

Description

Verfahren und Vorrichtung zur Verzögerung von Zugriffen auf Daten und/oder Befehle eines MehrprozessorsystemsMethod and device for delaying access to data and / or commands of a multiprocessor system
Stand der TechnikState of the art
Die Erfindung geht aus von einem Verfahren zur Verzögerung der Zugriffe auf Daten und/oder Befehle eines Mehrrechnersystems sowie einer entsprechenden Verzögerungseinheit gemäß den aus dem Stand der Technik bekannten Merkmale der unabhängigen Ansprüche.The invention relates to a method for delaying the access to data and / or commands of a multi-computer system and a corresponding delay unit according to the known from the prior art features of the independent claims.
In technischen Anwendungen, wie insbesondere im Kraftfahrzeug oder imIn technical applications, such as in particular in the motor vehicle or in
Industriegüterbereich also z.B. Maschinenbereich und in der Automatisierung werden ständig mehr und mehr mikroprozessor- oder rechnerbasierte Steuerungs- und Regelungssysteme für sicherheitskritische Anwendungen eingesetzt. Dabei sind Zweirechnersysteme oder Zweiprozessorsysteme (Dual Cores) heutzutage gängige Rechnersysteme für sicherheitskritische Anwendungen, insbesondere im Fahrzeug wie beispielsweise für Antiblockiersysteme, das Elektronische Stabilitätsprogramm (ESP), X- by-Wire-Systeme wie Drive-by-Wire oder Steer-by-Wire sowie Break-by-Wire, usw. oder auch bei sonstigen vernetzten Systemen. Um diese hohen Sicherheitsansprüche in zukünftigen Anwendungen zu befriedigen, sind mächtige Fehlermechanismen und Fehlerbehandlungsmechanismen erforderlich, insbesondere um transienten Fehler, die beispielsweise bei Verkleinerung der Halbleiterstrukturen der Rechnersysteme entstehen, zu begegnen. Dabei ist es relativ schwierig den Core selbst, also den Prozessor zu schützen. Eine Lösung hierfür ist wie erwähnt die Verwendung eines Zweirechnersystems oder Dual Core-Systems zur Fehlerdetektion. Solche Prozessoreinheiten mit wenigstens zwei integrierten Ausfuhrungseinheiten sind somit als Dual-Core- oder Multi-Core- Architekturen bekannt. Solche Dual-Core- oder Multi-Core- Architekturen werden nach heutigem Stand der Technik hauptsächlich aus zwei Gründen vorgeschlagen:For example, in the industrial goods sector, eg in the machine area, and in automation, more and more microprocessor-based or computer-based control systems are being used for safety-critical applications. In this case, dual-computer systems or dual-processor systems (dual cores) are today's computer systems for safety-critical applications, in particular in vehicles such as for anti-lock braking systems, electronic stability program (ESP), X-by-wire systems such as drive-by-wire or steer-by-wire as well as break-by-wire, etc. or other networked systems. In order to meet these high security requirements in future applications, powerful error mechanisms and error handling mechanisms are required, in particular to counteract transient errors that arise, for example, in miniaturization of the semiconductor structures of the computer systems. It is relatively difficult to protect the core itself, so the processor. One solution to this is, as mentioned, the use of a dual-computer system or dual core system for fault detection. Such processor units with at least two integrated execution units are thus known as dual-core or multi-core architectures. Such dual-core or multi-core architectures are proposed according to the current state of the art mainly for two reasons:
Zum Einen kann damit eine Leistungssteigerung, also eine Performance-Steigerung erreicht werden, indem die beiden Ausfuhrungseinheiten oder Cores als zwei Recheneinheiten auf einem Halbleiterbaustein betrachtet und behandelt werden. In dieser Konfiguration bearbeiten die zwei Ausfuhrungseinheiten oder Cores unterschiedlicheOn the one hand, an increase in performance, ie an increase in performance, can be achieved by considering and treating the two execution units or cores as two arithmetic units on a semiconductor component. In this configuration, the two execution units or cores process different
Programme respektive Tasks. Dadurch lässt sich eine Leistungssteigerung erzielen, weshalb diese Konfiguration als Leistungsmodus oder Performance-Mode bezeichnet wird.Programs respectively tasks. As a result, an increase in performance can be achieved, which is why this configuration is referred to as a power mode or performance mode.
Der zweite Grund, eine Dual-Core- oder Multi-Core- Architektur zu realisieren, ist eineThe second reason to realize a dual-core or multi-core architecture is one
Sicherheitssteigerung, indem die beiden Ausfuhrungseinheiten redundant das gleiche Programm abarbeiten. Die Ergebnisse der beiden Ausfuhrungseinheiten oder CPUs, also Cores werden verglichen und ein Fehler kann bei dem Vergleich auf Übereinstimmung erkannt werden. Im Folgenden wird diese Konfiguration als Sicherheitsmodus oder Safety-Mode oder auch Fehlererkennungsmodus bezeichnet.Increased security, as the two execution units redundantly execute the same program. The results of the two execution units or CPUs, that is to say cores, are compared and an error can be identified in the comparison for consistency. In the following, this configuration is referred to as safety mode or safety mode or error detection mode.
Heutzutage gibt es somit einerseits Zwei- oder Mehrprozessorsysteme die zur Erkennung von Hardware-Fehlern redundant arbeiten (siehe Dual-Core oder Master-Checker- Systeme) und anderseits Zwei- oder Mehrprozessorsysteme, die auf ihren Prozessoren unterschiedliche Daten abarbeiten.Nowadays, there are on the one hand two- or multi-processor systems that work redundantly to detect hardware errors (see dual-core or master-checker systems) and, on the other hand, two- or multi-processor systems that process different data on their processors.
Vorteile und Aufgabe der ErfindungAdvantages and objects of the invention
Kombiniert man nun diese beiden Betriebsarten gemäß einer Ausfuhrungsform der nachfolgenden Erfindung in einem Zwei- oder Mehrprozessorsystem (der Einfachheit halber wird nun nur noch von einem Zweiprozessorsystem gesprochen, die nachfolgende Erfindung ist aber genauso auf Mehrprozessorsystemen anwendbar), so müssen die beiden Prozessoren im Performance-Modus unterschiedliche Daten erhalten und im Fehlererkennungsmodus die gleichen Daten. Solch eine Vorrichtung oder Einheit ermöglicht den effektiven Betrieb eines Zweiprozessorsystems, so dass in den beiden Modi Sicherheit und Performance im Betrieb umgeschaltet werden kann. Dabei wird im weiteren von Prozessoren gesprochen, was aber ebenso Cores bzw. Recheneinheiten begrifflich einschließt.Combining these two modes of operation according to an embodiment of the present invention in a two or more processor system (for simplicity, only a two-processor system is now discussed, but the following invention is equally applicable to multiprocessor systems), the two processors must be in the performance Mode, and the same data in error detection mode. Such a device or unit enables the effective operation of a two-processor system, so that in the two modes security and performance can be switched during operation. In this case, processors will be discussed below, which also includes cores or computing units conceptually.
Bei den Implementierungen von insbesondere Zweiprozessorsystemen (Dual-Core) wird üblicherweise für jeden Prozessor ein Cache vorgesehen. Ein Cache ist normalerweise nicht ausreichend, da dieser Cache räumlich gesehen zwischen den beiden Prozessoren angeordnet werden muss. Aufgrund der langen Laufzeit zwischen dem Cache und den beiden Prozessoren könnten folglich die beiden Prozessoren nur mit einer begrenzten Taktfrequenz arbeiten. Caches dienen dabei im System als schneller Zwischenspeicher, damit der Prozessor die Daten nicht immer aus dem langsamen Hauptspeicher holen muss. Um dies zu ermöglichen, muss bei der Implementierung von Cache stark auf dessen Zugriffsdauer geachtet werden. Diese setzt sich aus der eigentlichen Zugriffszeit um die Daten aus dem Cache zu holen und aus der Zeit um die Daten an den Prozessor weiterzureichen zusammen. Ist der Cache nun räumlich weit entfernt vom Prozessor platziert, so dauert die Übermittlung der Daten sehr lange und der Prozessor kann nicht mehr mit seinem vollen Takt arbeiten. Aufgrund dieses Timingproblems wird bei Zweiprozessorsystemen für jeden Prozessor üblicherweise ein eigener Cache vorgesehen.In implementations of two-processor systems, in particular, a cache is usually provided for each processor. A cache is usually not sufficient because this cache must be spatially located between the two processors. Consequently, due to the long delay between the cache and the two processors, the two processors could only operate with a limited clock frequency. Caches serve as a fast cache in the system, so that the processor does not always have to fetch the data from the slow main memory. In order to make this possible, it is important to pay close attention to the access time when implementing the cache. This consists of the actual access time to fetch the data from the cache and from the time to pass the data to the processor together. If the cache is now located far away from the processor, the transfer of data takes a long time and the processor can no longer work with its full clock. Because of this timing problem, two-processor systems typically provide a separate cache for each processor.
Es ist Aufgabe der Erfindung ein Verfahren und eine Vorrichtung anzugeben, durch welche ein Cache bei einem Zweiprozessorsytsem eingespart werden kann, bzw. bei Multiprozessorsystemen die redundanten Caches. Die Einsparung erfolgt durch Ausnutzung eines Taktversatzes.It is an object of the invention to provide a method and a device by which a cache can be saved in a Zweiprozessorsytsem, or in multiprocessor systems, the redundant caches. The saving takes place by utilizing a clock offset.
Beschreibung der Ausführungsbeispiele und Vorteile der ErfindungDescription of the embodiments and advantages of the invention
Die Erfindung beschreibt zur Lösung der Aufgabe ein Verfahren und eine Vorrichtung zur Verzögerung der Zugriffe auf Daten und/oder Befehle eines Mehrprozessorsystems mit einem ersten und einem zweiten Prozessor, denen eine Speichereinheit zugeordnet ist, wobei der zweite Prozessor mit einem Taktversatz arbeitet und die Vorrichtung derart ausgebildet ist, dass der erste Prozessor auf die Speichereinheit zugreift und der zweite Prozessor mit einem Taktversatz die Daten und/oder Befehle erhält. Vorteilhafter Weise - A -To achieve the object, the invention describes a method and a device for delaying the access to data and / or commands of a multiprocessor system having a first and a second processor, to which a memory unit is assigned, wherein the second processor operates with a clock offset and the device operates in this way is formed such that the first processor accesses the memory unit and the second processor receives the data and / or commands with a clock offset. Advantageously - A -
handelt es sich bei der Speichereinheit um einen Cache-Speicher womit die Vorteile dieser Speichetechnik mit den Vorteilen der Erfindung kombiniert werden können.If the memory unit is a cache memory, the advantages of this memory technology can be combined with the advantages of the invention.
Zweckmäßiger Weise wird die Speichereinheit von wenigstens einem Prozessor adressiert und ist direkt an dem Prozessor angekoppelt, der sie adressiert.Conveniently, the memory unit is addressed by at least one processor and is directly coupled to the processor that addresses it.
Vorteilhaft ist, dass ein Verzögerungselement enthalten ist und die Vorrichtung derart ausgestaltet ist, dass der Taktversatz durch das Verzögerungselement genutzt wird um eine Überbrückung der Laufzeit der Daten und/oder Befehle von der Speichereinheit zu dem zweiten Prozessor zu realisieren.It is advantageous that a delay element is included and the device is designed such that the clock offset is used by the delay element to implement a bridging of the duration of the data and / or commands from the memory unit to the second processor.
Weiterhin von Vorteil ist dass Vergleichsmittel vorgesehen sind, durch welche die Daten und/oder Befehle verglichen werden und diese Vergleichsmittel räumlich nah an dem nachfolgenden Prozessor angeordnet sind.It is furthermore advantageous that comparison means are provided by which the data and / or commands are compared and these comparison means are arranged spatially close to the following processor.
Zweckmäßiger Weise ist die Vorrichtung derart ausgestaltet, dass der Taktversatz ausgenutzt wird um die Verleichsdaten des ersten Prozessors zum zweiten Prozessor zu führen.Conveniently, the device is configured such that the clock offset is utilized to guide the comparison data of the first processor to the second processor.
Vorteilhaft ist, dass je nach Ausgestaltung als Zugriffe entweder Schreiboperationen undIt is advantageous that, depending on the configuration as accesses either write operations and
Leseoperationen oder nur Leseoperationen oder nur Schreiboperationen verzögert werden.Read operations or only read operations or only write operations are delayed.
Wenn diese beiden Prozessoren nun mit einem Taktversatz betrieben werden, kann nun mit dem vorgeschlagenen Verfahren und der entsprechenden Vorrichtung auf den zweitenIf these two processors are now operated with a clock offset, can now with the proposed method and the corresponding device to the second
Cache für den Slave-Prozessor verzichtet werden.Cache for the slave processor can be omitted.
In einem Zweirechnersystem gibt es 2 Prozessoren die dieselben oder verschiedene Aufgaben abarbeiten können. Diese beiden Prozessoren des Zweirechnersystems können diese Aufgaben taktsynchron oder taktversetzt abarbeiten. Wird ein Zweiprozessorsystem zur Fehlerentdeckung aufgebaut, ist es vorteilhaft zur Vermeidung von Common-Mode Fehlern, dass diese beide Prozessoren mit einem Taktversatz arbeiten. Am effektivsten ist diese Methode wenn ein nicht ganzzahliger Taktversatz >1 gewählt wird. D.h. in dieser ersten Anwendungsform arbeiten beide Prozessoren oder Cores gleiche Aufgaben ab. Arbeiten die beiden Prozessoren verschiedene Aufgaben ab, ist es vorteilhafter sie taktflankensynchron laufen zu lassen, da die externen Komponenten wie Speicher nur mit dem Takt eines Prozessors angesteuert werden können. Soll nun beispielsweise ein zwischen diesen beiden Modi umschaltbares Zweiprozessorsystem eingesetzt werden, ist es somit auf einen Betriebsmodus optimiert.In a dual-processor system, there are 2 processors that can handle the same or different tasks. These two processors of the dual-computer system can execute these tasks isochrone- or off-clock. If a two-processor system is constructed for fault detection, it is advantageous to avoid common-mode errors that these two processors operate with a clock skew. This method is most effective when a non-integer clock offset> 1 is chosen. This means that in this first application form both processors or cores work the same tasks. If the two processors work off different tasks, it is more advantageous for them to run clock-edge synchronously, since the external components such as memory can only be controlled with the clock of a processor. If, for example, a two-processor system switchable between these two modes is used, it is thus optimized for an operating mode.
Erfindungsgemäß wird dies dadurch kompensiert, dass in dem Zweiprozessorsystem (bzw. Mehrprozessorsystem), welches umschaltbar ist zwischen 2 Modi wie Sicherheit und Performance, die beiden Prozessoren im Modus Sicherheit mit einem Taktversatz arbeiten und im Modus Performance ohne Taktversatz. Im Modus Performance ist kein Taktversatz vorteilhaft, da die externen Komponenten wie Speicher meistens mit einer niedrigeren Taktfrequenz betrieben werden und von der Taktflanke nur auf einen Prozessor passend ausgelegt sind. Der zweite taktversetzte Prozessor hätte sonst bei jedem Speicherzugriff einen Wartezyklus, da er die externe Komponente um einen halbenAccording to the invention, this is compensated for by the fact that in the two-processor system (or multiprocessor system) which can be switched over between two modes such as security and performance, the two processors work in the security mode with a clock offset and in the mode without clock offset. In the Performance mode, no clock offset is advantageous because the external components such as memory are usually operated at a lower clock frequency and are designed by the clock edge suitable for only one processor. Otherwise, the second clock offset processor would have a wait cycle each time it accesses memory, because it will expose the external component by one-half
Takt zu spät ansteuert.Clock is too late.
Durch eine Taktumschaltung für ein Zweiprozessorsystem wird im Modus Sicherheit das Optimum bei der Fehlererkennung herausgeholt und im Modus Performance das Maximum an der Performance.By switching the clock for a two-processor system, the optimum in error detection is taken out of safety mode and in performance mode the maximum in performance.
Somit geht die Erfindung vorteilhafter Weise von einem Verfahren und einer Vorrichtung zur Verzögerung der Zugriffe auf Daten und/oder Befehle eines Mehrprozessorsystems mit einem ersten und einem zweiten Prozessor, denen eine Speichereinheit zugeordnet ist, wobei der erste und zweite Prozessor mit einem Taktversatz arbeiten und die Vorrichtung derart ausgebildet ist, dass beide Prozessoren mit diesem Taktversatz auf die gleiche Speichereinheit zugreifen.Thus, the invention advantageously relates to a method and a device for delaying access to data and / or instructions of a multiprocessor system having a first and a second processor, which is associated with a memory unit, wherein the first and second processors operate with a clock offset and the Device is designed such that both processors access the same memory unit with this clock offset.
Zweckmäßiger Weise werden dabei als Zugriffe Schreiboperationen und Leseoperationen verzögert werden, wobei die Vorrichtung zwischen Verzögerung der Zugriffe und Nicht¬Appropriately, write operations and read operations are delayed as accesses, the device between delaying the accesses and non¬
Verzögerung der Zugriffe umschaltbar ist. Daneben ist ein Mehrprozessorsystem mit einer derartigen Vorrichtung offenbart.Delay of accesses is switchable. In addition, a multiprocessor system is disclosed with such a device.
In wenigstens einem Modus arbeiten die beiden Prozessoren in einem Taktversatz. Dieser kann sowohl um ganze Takte als auch um Teile des Taktes gegeneinander verschoben sein. Eine weitere Variante ist, dass in den beiden Modi eine unterschiedliche Taktfrequenz verwendet wird. Im sicherheitskritischen Modus kann zur Störungsunterdrückung z.B. ein niedrigerer Takt verwendet werden als im Performancemodus. Dabei können diese beiden Varianten auch miteinander kombiniert werden.In at least one mode, the two processors operate at a clock skew. This can be shifted both by whole bars as well as parts of the bar against each other be. Another variant is that a different clock frequency is used in the two modes. In the safety-critical mode, for example, a lower clock can be used for interference suppression than in the performance mode. These two variants can also be combined with each other.
Dabei entspricht der erste Betriebsmodus einem Sicherheitsmodus, bei dem die zwei Recheneinheiten gleiche Programme und/oder Daten abarbeiten und Vergleichsmittel vorgesehen sind, welche die bei der Abarbeitung der gleichen Programme entstehenden Zustände auf Übereinstimmung vergleichen.In this case, the first operating mode corresponds to a safety mode in which the two arithmetic units execute the same programs and / or data and comparison means are provided which compare the states that arise during the execution of the same programs to match.
Die erfϊndungsgemäße Einheit bzw. das erfindungsgemäße Verfahren ermöglicht die optimierte Implementierung der beiden Modi in einem Zweiprozessorsystem.The erfϊndungsgemäße unit or the inventive method allows the optimized implementation of the two modes in a two-processor system.
Arbeiten die beiden Prozessoren im Fehlererkennungsmodus (F-Modus), so erhalten die beiden Prozessoren die gleichen Daten/Instruktionen und arbeiten sie im Performancemodus (P-Modus), so kann jeder Prozessor auf den Speicher zugreifen. Dann verwaltet diese Einheit die Zugriffe auf den nur einfach vorhandenen Speicher oder Peripherie.If the two processors operate in error detection mode (F mode), the two processors receive the same data / instructions and operate in performance mode (P mode), so each processor can access the memory. Then this unit manages the accesses to the only simply existing memory or peripherals.
Im F-Modus übernimmt die Einheit die Daten/Adressen eines Prozessors (hier Master genannt) und leitet diese an die Komponenten wie Speicher, Bus, usw. weiter. Der zweite Prozessor (hier Slave) möchte den gleichen Zugriff machen. Die Datenverteilungseinheit nimmt dies an einem zweiten Port entgegen, aber leitet die Anfrage nicht an die weiteren Komponenten weiter. Die Datenverteilungseinheit übergibt dem Slave die gleichen Daten wie dem Master und vergleicht die Daten der beiden Prozessoren. Sind diese unterschiedlich, so zeigt dies die Datenverteilungseinheit (hier DVE) durch ein Fehlersignal an. Es arbeitet somit nur der Master auf den Bus/Speicher und der Slave bekommt die selben Daten (Funktionsweise wie bei einem Dual-Core System).In F mode, the unit takes over the data / addresses of a processor (called master here) and forwards them to the components such as memory, bus, etc. The second processor (here slave) wants to make the same access. The data distribution unit accepts this at a second port but does not forward the request to the other components. The data distribution unit gives the slave the same data as the master and compares the data of the two processors. If these are different, this indicates the data distribution unit (here DVE) by an error signal. Thus, only the master works on the bus / memory and the slave gets the same data (functioning as with a dual-core system).
Im P-Modus arbeiten die beiden Prozessoren unterschiedliche Programmteile ab. Die Speicherzugriffe sind somit auch unterschiedlich. Die DVE nimmt somit die Anforderung der Prozessoren entgegen und gibt die Ergebnisse/angeforderte Daten an den Prozessor zurück, der sie angefordert hat. Möchten nun beide Prozessoren gleichzeitig auf eine Komponenten zugreifen, so wird ein Prozessor in einen Wartezustand versetz, bis der andere bedient wurde.In P mode, the two processors work on different parts of the program. The memory accesses are thus also different. The DVE thus accepts the request from the processors and returns the results / requested data to the processor that requested them. Would like both processors at the same time on one Accessing components, one processor is placed in a wait state until the other has been serviced.
Die Umschaltung zwischen den beiden Modi und somit der unterschiedlichen Arbeitsweise der Datenverteilungseinheit erfolgt durch ein Steuersignal. Dies kann entweder von einem der beiden Prozessoren generiert werden oder extern.The switching between the two modes and thus the different operation of the data distribution unit is effected by a control signal. This can either be generated by one of the two processors or externally.
Wird das Zweiprozessorsystem im F-Modus mit einem Taktversatz betrieben und im P- Modus nicht, so verzögert die DVE — Einheit die Daten für den Slave entsprechend, bzw. speichert die Ausgangsdaten des Master solange, bis sie mit den Ausgangsdaten desIf the two-processor system is operated with a clock offset in F mode and not in P mode, the DVE unit delays the data for the slave accordingly or stores the output data of the master until it matches the output data of the master
Slave zur Fehlererkennung verglichen werden können.Slave can be compared for error detection.
Der Taktversatz wird anhand der Figur 1 für ein Zweirechnersystem näher erläutert:The clock offset is explained in more detail with reference to FIG. 1 for a dual-computer system:
Figur 1 zeigt ein Zweirechnersystem mit einem ersten Rechner 100, insbesondere einemFIG. 1 shows a dual-computer system with a first computer 100, in particular one
Masterrechner und einem zweiten Rechner 101, insbesondere einem Slave-Rechner. Das gesamte System wird dabei mit einem vorgebbaren Takt bzw. in vorgebbaren Taktzyklen (clock cycle) CLK betrieben. Über den Takteingang CLKl des Rechners 100 sowie über den Takteingang CLK2 des Rechners 101 wird diesem der Takt zugeführt. Bei diesem Zweirechnersystem ist darüber hinaus beispielhaft ein spezielles Merkmal zurMaster computer and a second computer 101, in particular a slave computer. The entire system is operated with a predeterminable clock or in predeterminable clock cycles (clock cycle) CLK. About the clock input CLKL of the computer 100 and the clock input CLK2 of the computer 101, the clock is supplied to this. In this dual-computer system is also an example of a special feature of
Fehlererkennung enthalten, in dem nämlich der erste Rechner 100 sowie der zweite Rechner 101 mit einem Zeitversatz, insbesondere einem vorgebbaren Zeitversatz bzw. einem vorgebbaren Taktversatz arbeiten. Dabei ist jede beliebige Zeit für einen Zeitversatz vorgebbar und auch jeder beliebige Takt bezüglich eines Versatzes der Taktzyklen. Dies kann ein ganzzahliger Versatz des Taktzyklus (clock cycle) sein, aber eben auch wie in diesem Beispiel dargestellt, beispielsweise ein Versatz von 1,5 Taktzyklen, wobei hier der erste Rechner 100 eben 1,5 Taktzyklen vor dem zweiten Rechner 101 arbeitet respektive betrieben wird. Durch diesen Versatz kann vermieden werden, dass Gleichtaktfehler, sogenannte common mode failures, die Rechner oder Prozessoren, also die Cores des Dual Cores Systems, gleichartig stören und damit unerkannt bleiben. D.h. solche Gleichtaktfehler betreffen durch den Versatz die Rechner zu unterschiedlichen Zeitpunkten im Programmablauf und bewirken demnach unterschiedliche Effekte bezüglich der beiden Rechner wodurch Fehler erkennbar werden. Gleichartige Fehlerwirkungen ohne Taktversatz wären u.U. in einem Vergleich nicht erkennbar, dies wird dadurch vermieden. Um diesen Versatz bezüglich der Zeit oder des Taktes, hier insbesondere 1,5 Taktzyklen im Zweirechnersystem zum implementieren sind die Versatzbausteine 112 bis 115 implementiert.Error detection include, in which namely the first computer 100 and the second computer 101 with a time offset, in particular a predetermined time offset or a predetermined clock offset work. In this case, any time can be predetermined for a time offset and also any desired clock with respect to an offset of the clock cycles. This may be an integer offset of the clock cycle, but just as shown in this example, for example, an offset of 1.5 clock cycles, in which case the first computer 100 just works 1.5 clock cycles before the second computer 101 respectively operated becomes. By this offset can be avoided that common mode failures, the computers or processors, so the cores of the dual-core system, disturbing similar and thus remain unrecognized. That is to say, such common-mode errors relate to the computers at different times in the program sequence due to the offset, and thus cause different effects with respect to the two computers, as a result of which errors become recognizable. Similar error effects without clock skew could not be detected in a comparison, this is avoided. To this offset in time or of the clock, in particular 1.5 clock cycles in the dual-computer system for implementing the offset blocks 112 to 115 are implemented.
Um die genannten Gleichtaktfehler zu erkennen ist dieses System eben beispielsweise dazu ausgelegt in einem vorgegebenen Zeitversatz oder Taktzyklenversatz zu arbeiten, insbesondere hier 1,5 Taktzyklen, d.h. während der eine Rechner, z. B. Rechner 100 direkt die Komponenten, insbesondere die externen Komponenten 103 und 104 anspricht, arbeitet der zweite Rechner 101 mit einer Verzögerung von genau 1,5 Taktzyklen dazu. Um in diesem Fall die gewünschte Eineinhalbzyklusverzögerung, also von 1,5 Taktzyklen zu erzeugen wird Rechner 101 mit der invertierten Clock, also dem invertierten Takt am Takteingang CLK2 gespeist. Dadurch müssen aber auch die vorgenannten Anschlüsse des Rechners also seine Daten bzw. Befehle über die Busse um die genannten Taktzyklen, also hier insbesondere 1,5 Taktzyklen verzögert werden, wozu eben wie gesagt die Versatz- oder Verzögerungsbausteine 112 bis 115 vorgesehen sind. Neben den beiden Rechnern oder Prozessoren 100 und 101 sind Komponenten 103 undFor example, to recognize the aforementioned common mode errors, this system is designed to operate at a given skew or clock skew, particularly 1.5 clock cycles, i. while a computer, z. B. computer 100 directly the components, in particular the external components 103 and 104 responds, the second computer 101 operates with a delay of exactly 1.5 clock cycles to do so. In order to produce in this case the desired one and a half cycle delay, ie of 1.5 clock cycles, computer 101 is fed with the inverted clock, that is to say the inverted clock at the clock input CLK2. As a result, but also the aforementioned connections of the computer so its data or commands on the buses to the clock cycles mentioned, so here in particular 1.5 clock cycles are delayed, including just as said the offset or delay blocks 112 to 115 are provided. In addition to the two computers or processors 100 and 101 are components 103 and
104 vorgesehen, die über Busse 116, bestehend aus den Busleitungen 116A und 116B und 116C sowie 117, bestehend aus den Busleitungen 117A und 117B mit den beiden Rechnern 100 und 101 in Verbindung stehen. 117 ist dabei ein Befehlsbus, bei welchem mit 117A ein Befehlsadressbus und mit 117B der Teil-Befehls(daten)bus bezeichnet ist. Der Adressbus 117A ist über einen Befehlsadressanschluss IAl (Instruction Adress 1) mit Rechner 100 und über einen Befehlsadressanschluss IA2 (Instruction Adress 2) mit Rechner 101 verbunden. Die Befehle selbst werden über den Teil-Befehlsbus 117B übertragen, der über einen Befehlsanschluss Il (Instruction 1) mit Rechner 100 und über einen Befehlsanschluss 12 (Instruction 2) mit Rechner 101 verbunden ist. In diesem Befehlsbus 117 bestehend aus 117A und 117B ist eine Komponente 103 z. B. ein104, which are connected via buses 116, consisting of the bus lines 116A and 116B and 116C and 117, consisting of the bus lines 117A and 117B with the two computers 100 and 101 in combination. 117 is a command bus in which 117A is a command address bus and 117B is the partial command (data) bus. Address bus 117A is connected to computer 100 via a command address connection IA1 (instruction address 1) and to computer 101 via an instruction address connection IA2 (instruction address 2). The instructions themselves are transmitted via the sub-command bus 117B, which is connected to computer 100 via a command terminal II (Instruction 1) and to computer 101 via a command terminal 12 (Instruction 2). In this command bus 117 consisting of 117A and 117B is a component 103 z. B. a
Befehlsspeicher, insbesondere ein sicherer Befehlsspeicher oder dergleichen zwischengeschaltet. Auch diese Komponente, insbesondere als Befehlsspeicher wird in diesem Beispiel mit dem Takt CLK betrieben. Daneben ist mit 116 ein Datenbus dargestellt, welcher einen Datenadressbus oder eine Datenadressleitung 116A und einen Datenbus oder eine Datenleitung 116B enthält. Dabei ist 116A, also dieInstruction memory, in particular a secure instruction memory or the like interposed. This component, in particular as a command memory is operated in this example with the clock CLK. In addition, at 116, a data bus is shown which includes a data address bus or a data address line 116A and a data bus or a data line 116B. It is 116A, so the
Datenadressleitung, über einen Datenadressanschluss DAl (Data Adress 1) mit dem Rechner 100 und über einen Datenadressanschluss DA2 (Data Adress 2) mit Rechner 101 verbunden. Ebenso ist der Datenbus oder die Datenleitung 116B über einen Datenanschluss DOl (Data Out 1) und einen Datenanschluss DO2 (Data Out 2) mit Rechner 100 bzw. Rechner 101 verbunden. Weiterhin zu Datenbus 116 gehört die Datenbusleitung 116C, welche über einen Datenanschluss Dil (Data In 1) und einen Datenanschluss DI2 (Data In 2) jeweils mit Rechner 100 bzw. Rechner 101 verbunden ist. In diesem Datenbus 116 bestehend aus den Leitungen 116A, 116B und 116C ist eine Komponente 104 zwischengeschaltet, beispielsweise ein Datenspeicher, insbesondere ein sicherer Datenspeicher o. ä . Auch diese Komponente 104 wird in diesem Beispiel mit dem Takt CLK versorgt.Data address line, via a data address port DAl (Data Address 1) to the computer 100 and via a data address port DA2 (Data Address 2) connected to computer 101. Likewise, the data bus or the data line 116B is connected via a data connection DO1 (Data Out 1) and a data connection DO2 (Data Out 2) Computer 100 or computer 101 connected. The data bus 116C, which is connected to computer 100 or computer 101 via a data connection Dil (Data In 1) and a data connection DI2 (Data In 2), also belongs to data bus 116. In this data bus 116 consisting of the lines 116A, 116B and 116C, a component 104 is interposed, for example a data memory, in particular a secure data memory o. Ä. This component 104 is also supplied with the clock CLK in this example.
Dabei stehen die Komponenten 103 und 104 stellvertretend für beliebige Komponenten die über einen Datenbus und/oder Befehlsbus mit den Rechnern des Zweirechnersystems verbunden sind und entsprechend der Zugriffe über Daten und/oder Befehle des Zweirechnersystems bezüglich Schreiboperationen und/oder Leseoperationen fehlerhafte Daten und/oder Befehle erhalten oder abgeben können. Zur Fehlervermeidung sind zwar Fehlerkennungsgeneratoren 105, 106 und 107 vorgesehen welche eine Fehlerkennung erzeugen wie beispielsweise ein Parity-Bit oder auch einen anderen Fehlercode wie beispielsweise einen Error- Correction-Code, also ECC, o. ä.. Dazu vorgesehen sind dann auch die entsprechenden Fehlerkennungsprüfeinrichtungen oder Check-Einrichtungen 108 und 109 zur Überprüfung der jeweiligen Fehlerkennung also beispielsweise des Parity-Bit oder eines anderen Fehlercodes wie ECC.The components 103 and 104 are representative of any components which are connected via a data bus and / or command bus to the computers of the dual-computer system and corresponding to the accesses via data and / or commands of the dual-processor system with respect to write operations and / or read operations erroneous data and / or commands receive or give away. In order to avoid errors, error detection generators 105, 106 and 107 are provided which generate an error detection such as, for example, a parity bit or another error code such as an error correction code, ie ECC, or the like Fehlerkennungsprüfeinrichtungen or check-facilities 108 and 109 for checking the respective misrecognition, for example, the parity bit or another error code such as ECC.
Der Vergleich der Daten und/oder Befehle bezüglich der redundanten Ausführung im Zweirechnersystem erfolgt in den Vergleichern oder Komparatoren 110 und 111 wie in Figur 1 dargestellt. Existiert nun aber ein Zeitversatz, insbesondere ein Takt- oder Taktzyklusversatz zwischen den Rechnern 100 und 101, entweder hervorgerufen durch ein nichtsynchrones Zweiprozessorsystem oder bei einem synchronenThe comparison of the data and / or commands with respect to the redundant embodiment in the dual-computer system takes place in the comparators or comparators 110 and 111 as shown in FIG. But now there is a time offset, in particular a clock or clock cycle offset between the computers 100 and 101, either caused by a non-synchronous Zweiprozessorsystem or a synchronous
Zweiprozessorsystem durch Fehler in der Synchronisierung oder auch wie in diesem speziellen Beispiel durch einen zur Fehlererkennung gewünschten Zeit- bzw. Taktzyklusversatz, insbesondere hier von 1,5 Taktzyklen, so kann in diesem Zeit- oder Taktversatz ein Rechner hier insbesondere Rechner 100 fehlerhafte Daten und/oder Befehle in Komponenten, insbesondere externe Komponenten wie z. B. hier insbesondere die Speicher 103 oder 104, aber auch bezüglich anderen Teilnehmern oder Aktuatoren oder Sensoren schreiben oder lesen. So kann er auch in fehlerhafter Weise einen Schreibzugriff anstatt eines vorgesehenen Lesezugriffs durch diesen Taktversatz durchführen. Diese Szenarien führen selbstverständlich zu Fehlern im gesamten System, insbesondere ohne klare Anzeigemöglichkeit welche Daten und/oder Befehle gerade fehlerhaft geändert wurden, wodurch auch die Recovery-Problematik entsteht.Two-processor system due to errors in the synchronization or as in this particular example by a time or clock cycle offset desired for error detection, in particular here 1.5 clock cycles, then in this time or clock offset a computer here in particular computer 100 erroneous data and / or commands in components, especially external components such. B. here in particular the memory 103 or 104, but also with respect to other participants or actuators or sensors write or read. Thus, it may also erroneously perform a write access instead of a designated read access by this clock offset. Of course, these scenarios lead to errors in the entire system, in particular, without clear indication of what data and / or commands have just been changed incorrectly, which also causes the recovery problem.
Um diese Problematik zu lösen wird nun eine Verzögerungseinheit 102 wie dargestellt in die Leitungen des Datenbusses und/oder in den Befehlsbus geschaltet. Aus Gründen derIn order to solve this problem, a delay unit 102 is now connected as shown in the lines of the data bus and / or in the command bus. Because of
Übersichtlichkeit ist nur die Einschaltung in den Datenbus dargestellt. Bezüglich des Befehlsbusses ist dies natürlich genauso möglich und denkbar. Diese Verzögerungseinheit 102 oder die Delay Unit verzögert die Zugriffe, hier insbesondere die Speicherzugriffe so, dass ein möglicher Zeit- oder Taktversatz kompensiert wird, insbesondere bei einer Fehlererkennung beispielsweise über die Komparatoren 110 undClarity is shown only the involvement in the data bus. Of course, this is just as possible and imaginable with regard to the command bus. This delay unit 102 or the delay unit delays the accesses, here in particular the memory accesses, in such a way that a possible time or clock offset is compensated, in particular in the event of an error detection, for example via the comparators 110 and
111 z.B. mindestens solange, bis das Fehlersignal im Zweirechnersystem erzeugt ist, also die Fehlererkennung im Zweirechnersystem durchgeführt ist. Dabei können verschiedene Varianten implementiert sein: Verzögerung der Schreib- und Leseoperationen, Verzögerung nur der Schreiboperationen oder auch, wenn auch nicht bevorzugt, eine Verzögerung der Leseoperationen. Dabei kann durch ein Änderungssignal, insbesondere das Fehlersignal, eine verzögerte Schreiboperation in eine Leseoperation gewandelt werden um fehlerhaftes Schreiben zu unterbinden.111 e.g. at least until the error signal is generated in the dual-computer system, that is, the error detection is performed in the dual-computer system. Various variants can be implemented here: delay of the read and write operations, delay of only the write operations or, although not preferred, a delay of the read operations. It can be converted by a change signal, in particular the error signal, a delayed write operation in a read operation to prevent erroneous writing.
Nachfolgend anhand Figur 2 nun eine beispielhafte Implementierung bezüglich derBelow with reference to FIG 2 now an exemplary implementation with respect to
Datenverteilungseinheit (DVE), die sich vorzugsweise aus einer Vorrichtung zur Detektierung des Umschaltwunsches (durch IIIOPDetect), der Mode-Switch-Einheit sowie dem Iram- und Dram-Control-Baustein zusammensetzt:Data distribution unit (DVE), which preferably consists of a device for detecting the changeover request (by IIIOPDetect), the mode switch unit and the Iram and Dram Control module:
IllOpDetect: Die Umschaltung zwischen den beiden Modi wird durch die EinheitenIllOpDetect: The switching between the two modes is through the units
""Switch-Detect"' erkannt. Diese Einheit liegt zwischen dem Cache und dem Prozessor auf dem Instruktionsbus und schaut ob der Befehl IUOp in den Prozessor geladen wird. Wird der Befehl detektiert, so wird dieses Ereignis der Modeswitch Einheit mitgeteilt. Die ""Switch-Detect"' Einheit ist für jeden Prozessor einzeln vorhanden. Die Einheit ""Switch-Detect"' muss nicht fehlertolerant ausgeführt sein, da sie doppelt und somit redundant vorhanden ist. Andererseits ist es denkbar diese Einheit fehlertolerant und damit singulär auszuführen, bevorzugt ist aber die redundante Ausführung.This unit is located between the cache and the processor on the instruction bus and checks if the IUOp command is being loaded into the processor. If the command is detected, this event is reported to the Modeswitch unit. Switch-Detect "'unit is unique to each processor. The "Switch-Detect" unit does not have to be fault-tolerant since it is duplicated and thus redundant, but on the other hand it is conceivable to perform this unit in a fault-tolerant and thus singular manner, but the redundant design is preferred.
ModeSwitch: Die Umschaltung zwischen den beiden Modi wird durch die ""Switch- Detect'" Einheit getriggert. Soll eine Umschaltung vom Lock in den Split Modus erfolgen, detektieren beide ""Switch-Detect"' Einheiten die Umschaltung, da beide Prozessoren den gleichen Programmcode im Lock Modus abarbeiten. Die ""Switch- Detect'" Einheit des Prozessor 1 erkennt dies 1,5 Takte vor der ""Switch-Detect"' Einheit des Prozessors 2. Die ""Modeswitch'" Einheit hält mit Hilfe des Wait Signals den Prozessor 1 um 2 Takte an. Der Prozessor 2 wird 1,5 Takte später ebenfalls angehalten, aber nur um einen halben Takt, damit er zum Systemtakt synchronisiert wird. Anschließend wird das Status-Signal auf Split geschaltet für die weiteren Komponenten und die beiden Prozessoren arbeiten weiter. Damit die beiden Prozessoren nun unterschiedliche Tasks ausführen, müssen sie im Programmcode auseinanderlaufen. Dies erfolgt, indem direkt nach Umschalten in den Split-Modus ein Lesezugriff auf dieModeSwitch: Switching between the two modes is triggered by the "Switch-Detect" unit, which is to switch from Lock to Split mode Both "Switch-Detect" units detect the switchover, as both processors execute the same program code in Lock mode.The "Switch-Detect" unit of processor 1 recognizes this 1.5 clocks before the "" switch mode. Detect "'Unit of the processor 2. The""Modeswitch'" unit stops the processor 1 by 2 clocks with the help of the wait signal. The processor 2 is also stopped 1.5 clocks later, but only by half a clock to be synchronized to the system clock. Subsequently, the status signal is switched to split for the other components and the two processors continue to work. In order for the two processors to perform different tasks, they must diverge in the program code. This is done by reading directly after switching to split mode
Prozessor-ID erfolgt. Diese ausgelesene Prozessor-ID ist für jeden der beiden Prozessoren unterschiedlich. Wird nun auf eine Soll-Prozessor-ID verglichen, kann anschließend mit einem Conditional Jump Befehl der entsprechende Prozessor an eine andere Programmstelle gebracht werden. Bei einer Umschaltung vom Split-Modus in den Lock-Modus wird dies ein Prozessor bemerken, bzw. einer der beiden zuerst. DieserProcessor ID is done. This read processor ID is different for each of the two processors. If a comparison is now made to a desired processor ID, then the corresponding processor can be brought to another program location with a conditional jump command. When switching from split mode to lock mode, a processor will notice this, or one of them first. This
Prozessor wird Programmcode ausführen, in dem der Umschaltbefehl enthalten ist. Dies wird nun durch die ""Switch-Detect"' Einheit registriert und teilt dies der Modeswitch Einheit mit. Diese hält den entsprechenden Prozessor an und teilt dem zweiten den Wunsch der Synchronisation durch einen Interrupt mit. Der zweite Prozessor erhält einen Interrupt und kann nun eine Softwareroutine zur Beendigung seines Tasks ausführen.Processor will execute program code containing the switchover command. This is now registered by the "Switch-Detect" unit and informs the Modeswitch unit which stops the corresponding processor and informs the second of the request for synchronization by an interrupt, the second processor receives an interrupt and can now execute a software routine to complete its task.
Nun springt er ebenfalls an die Programmstelle, in der sich der Befehl zur Umschaltung befindet. Seine ""Switch-Detect"' Einheit signalisiert nun ebenfalls den Wunsch zum Moduswechsel an die Modeswitch Einheit. Zur nächsten steigenden Systemtaktflanke wird nun das Wait Signal für den Prozessor 1 deaktiviert und 1,5 Takte später für den Prozessor 2. Nun arbeiten beide wieder mit einem Taktversatz von 1,5 Takten synchron.Now he also jumps to the program location where the changeover command is located. His "Switch-Detect" unit now also signals the desire to change mode to the Modeswitch unit.The Wait signal for the processor 1 is now deactivated for the next rising system clock edge and 1.5 clocks later for the processor 2. Both now work again synchronous with a clock offset of 1.5 clocks.
Befinden sich das System im Lock Modus, so müssen beide ""Switch-Detect"' Einheiten der Modeswitch Einheit mitteilen, dass sie in den Split Modus wollen. Erfolgt der Umschaltwunsch nur von einer Einheit, so wird der Fehler von den Vergleichseinheiten erkannt, da diese von einem der beiden Prozessoren weiterhin Daten geliefert bekommen und diese nicht mit dem angehaltenen Prozessoren übereinstimmen.If the system is in Lock mode, both "Switch-Detect" units must notify the Modeswitch unit that they want to switch to Split mode, and if the changeover request is only from one unit, the error is detected by the comparison units These continue to receive data from one of the two processors and they do not match the stopped processors.
Sind die beiden Prozessoren im Split Modus und einer schaltet nicht zurück in den Lock- Modus, so kann dies durch einen externen Watchdog erkannt werden. Bei einem Triggersignal für jeden Prozessor bemerkt der Watchdog dass der wartende Prozessor sich nicht mehr meldet. Ist nur ein Watchdogsignal für das Prozessorsystem vorhanden, so darf die Triggerung des Watchdogs nur im Lock-Modus erfolgen. Somit würde der Watchdog erkennen, dass die Modusumschaltung nicht erfolgte. Das Modussignal liegt als Dual-Rail Signal vor. Dabei steht "UO"' für den Lock-Modus und "Λ01"' für den SpKt- Modus. Bei "W und "Λ 11"' sind Fehler aufgetreten.If the two processors are in split mode and one does not switch back to lock mode, this can be detected by an external watchdog. With a trigger signal for each processor, the watchdog notices that the waiting processor does not answer. If there is only one watchdog signal for the processor system, then the triggering of the watchdog must only take place in lock mode. Thus, the watchdog would recognize that the mode switch did not occur. The mode signal is available as a dual-rail signal. Where "UO" is Lock mode and " Λ 01" is SpKt mode. Errors have occurred with "W and" Λ 11 "'.
IramControl: Der Zugriff auf den Befehlsspeicher der beiden Prozessoren wird über die IRAM Control gesteuert. Diese muss sicher ausgelegt sein, da sie ein Single Point of Failure ist. Sie besteht aus zwei Zustandsautomaten für jeden Prozessor: als je einen taktsynchronen iramlclkreset und einen asynchronen readiraml. Im sicherheitskritischen Modus überwachen sich die Zustandsautomaten der beiden Prozessoren gegenseitig und im Performancemodus arbeiten sie getrennt.IramControl: Access to the instruction memory of the two processors is controlled via the IRAM Control. This must be designed securely because it is a single point of failure. It consists of two state machines for each processor: one each isochronous iramlclkreset and one asynchronous readiraml. In safety-critical mode, the state machines of the two processors monitor each other and in performance mode, they work separately.
Das Nachladen der beiden Caches der Prozessoren werden durch 2 Zustandsautomaten gesteuert. Einem synchronen Zustandsautomaten iramclkreset und einem asynchronen readiram. Durch diese beiden Zustandsautoamten werden auch die Speicherzugriffe im Split-Modus verteilt. Hierbei hat Prozessor 1 die höhere Priorität. Nach einem Zugrif auf den Hauptspeicher durch Prozessor 1 bekommt nun — wenn beide Prozessoren wieder auf den Hauptspeicher zugreifen wollen ~ Prozessor2 dieThe reloading of the two caches of the processors are controlled by 2 state machines. A synchronous state machine iramclkreset and an asynchronous readiram. These two state car offices also distribute the memory accesses in split mode. Here processor 1 has the higher priority. After a access to the main memory by processor 1 gets now - if both processors want to access the main memory again ~ processor2 the
Speicherzugriffserlaubnis zugeteilt. Diese beiden Zustandsautomaten sind für jeden Prozessor implementiert. Im Lock-Modus werden die Ausgangssignale der Automaten verglichen um auftretende Fehler erkennen zu können.Allocated memory access permission. These two state machines are implemented for each processor. In lock mode, the output signals of the machines are compared to detect any errors.
Die Daten zum Aktualisieren des Cache 2 im Lock-Modus werden in der IRAM-ControlThe data for updating the cache 2 in lock mode are in the IRAM control
Einheit um 1,5 Takte verzögert.Unit delayed by 1.5 bars.
In Bit 5 im Register 0 der SysControl wird codiert um welchen Core es sich handelt. Core 1 ist das Bit 0 und bei Core 2 ist es High. Dieses Register ist in den Speicherbereich mit der Adresse 65528 gespiegelt.In bit 5 in register 0 of the SysControl is encoded which core is concerned. Core 1 is bit 0 and Core 2 is high. This register is mirrored in the memory area with the address 65528.
Bei einem Speicherzugriff von Core 2 wird erst überprüft in welchem Modus sich der Rechner befindet. Ist er im Lock-Modus so wird sein Speicherzugriff unterdrückt. Dieses Signal liegt als Common-Rail Signal vor, da es sicherheitskritisch ist. Der Programmcounter des Prozessors 1 wird um 1,5 Takte verzögert um im Lock-Modus mit dem Programmcounter des Prozessors 2 verglichen werden zu können.In a memory access of Core 2 is first checked in which mode the computer is. If it is in lock mode, its memory access is suppressed. This signal is available as a common-rail signal because it is safety-critical. The program counter of the processor 1 is delayed by 1.5 clocks to be compared in lock mode with the program counter of the processor 2 can.
Im Split Modus können die Caches der beiden Prozessoren unterschiedlich nachgeladen werden. Wenn nun in den Lock-Modus umgeschaltet wird, sind die beiden Caches nicht kohärent zueinander. Dadurch können die beiden Prozessoren auseinanderlaufen und die Vergleicher signalisieren folglich einen Fehler. Um dies zu vermeiden, ist in der IRAM Control eine Flag Tabelle aufgebaut. In dieser wird vermerkt, ob eine Cachezeile im Lock- oder im Split-Modus geschrieben wurde. Im Lock-Modus wird der für die Cachezeile entsprechende Eintrag bei einer Cachezeilennachladung auf 0 gesetzt und imIn split mode, the caches of the two processors can be reloaded differently. When switching to lock mode, the two caches are not coherent. As a result, the two processors can diverge and the comparators thus signal an error. To avoid this, a flag table is set up in the IRAM Control. This indicates whether a cache line was written in lock or split mode. In lock mode, the cache line entry will be set to 0 on a cache line reload and set to 0 in the cache line
Split-Modus — auch bei einer Cacheaktualisierung der Cachezeile von nur einem Cache — auf 1. Führt der Prozessor nun im Lock-Modus einen Speicherzugriff aus, so wird überprüft, ob diese Cachezeile im Lock-Modus aktualisiert wurde, d.h. in beiden Caches gleich ist. Im Split-Modus kann der Prozessor immer auf die Cachezeile zugreifen, unabhängig wie derSplit mode - even with a cache update of the cache line from only one cache - to 1. If the processor now executes a memory access in lock mode, it is checked whether this cache line was updated in lock mode, i. is the same in both caches. In split mode, the processor can always access the cache line, regardless of the cache line
Flag Vector ist. Diese Tabelle muss nur einmal vorhanden sein, da bei einem Fehler die beiden Prozessoren auseinanderlaufen und somit an den Vergleichern dieser Fehler sicher erkannt wird. Da die Zugriffszeiten auf der zentralen Tabelle relativ hoch sind, kann diese Tabelle auch zu jedem Cache kopiert werden.Flag Vector is. This table only has to be present once, since in the case of an error the two processors diverge and thus the errors are reliably detected at the comparators. Since the access times on the central table are relatively high, this table can also be copied to every cache.
DramControl: In dieser Komponente werden für die Adress-, Daten- und Speichersteuersignale von jedem Prozessor das Parity gebildet.DramControl: In this component, the parity is formed for each of the address, data, and memory control signals from each processor.
Es gibt einen Prozess für beide Prozessor zum Sperren des Speichers. Dieser Prozess muss nicht sicher implementiert sein, da im Lock-Modus fehlerhafte Speicherzugriffe durch die Vergleicher erkannt werden und im Split-Modus keine sicherheitsrelevanten Anwendungen ausgeführt werden. Hierin wird überprüft, ob der Prozessor den Speicher für den anderen Prozessor sperren möchte. Dieses Sperren des Datenspeichers erfolgt durch einen Zugriff auf die Speicheradresse $FBFF$=64511. Dieses Signal soll genau ein Takt lang anliegen, auch wenn am Prozessor zum Zeitpunkt des Aufrufens ein wait- command anliegt. Der Zustandsautomat zur Verwaltung der Datenspeicherzugriffe besteht aus 2 Hauptzuständen:There is a process for both processors to lock the memory. This process does not have to be implemented safely because in Lock mode faulty memory accesses are detected by the comparators and no safety-relevant applications are executed in split mode. Here it is checked if the processor wants to lock the memory for the other processor. This data memory is locked by accessing the memory address $ FBFF $ = 64511. This signal should be present for exactly one cycle, even if a wait command is present at the processor at the time of the call. The state machine for managing the data storage access consists of 2 main states:
- Prozessorstatus Lock: Die beiden Prozessoren arbeiten im Lock-Modus. D.h. die Funktionalität des Datenspeicheriocking ist nicht notwendig. Prozessor 1 koordiniert die Speicherzugriffe. - Prozessorstatus Split: Nun ist eine Zugriffskonfliktauflösung auf den Datenspeicher nötig und ein Speichersperren muss erfolgen können.- Processor Status Lock: The two processors are in lock mode. This means that the functionality of the data storage icing is not necessary. Processor 1 coordinates the memory accesses. - Processor status Split: An access conflict resolution to the data storage is now necessary and a storage lock must be possible.
Der Zustand im Split-Modus ist wiederum in 7 Zustände untergliedert, die die Zugriffskonflikte auflösen und denThe state in split mode is again divided into 7 states, which resolve the access conflicts and the
Datenspeicher für jeweils den anderen Prozessor sperren können. Bei gleichzeitigem Wunsch der beiden Prozessoren bei einem Zugriff, stellt die aufgeführte Reihenfolge gleichzeitig die Priorisierung dar.Lock data storage for each other processor. At the same time request of the two processors in an access, the listed order is also the prioritization.
- Corel \_Lock: Prozessor 1 hat den Datenspeicher gesperrt. Möchte in diesem Zustand- Corel \ _Lock: Processor 1 has locked the data store. I want to be in this state
Prozessor 2 auf den Speicher zugreifen, so wird er durch ein Wartesignal angehalten, bis Prozessor 1 den Datenspeicher wieder freigibt. \Processor 2 access the memory, it is stopped by a wait signal until processor 1 releases the data memory again. \
- Core2\_Lock: Ist der gleiche Zustand wie der vorige nur dass nun Prozessor 2 den Datenspeicher gesperrt hat und Prozessor 1 bei Datenspeicheroperationen angehalten wird.- Core2 \ _Lock: Is the same state as the previous one except that now processor 2 has locked the data memory and processor 1 is stopped during data storage operations.
- lockl\_wait: Der Datenspeicher war durch den Prozessor 2 gesperrt als Prozessor 1 ihn ebenfalls für sich reservieren wollte. Prozessor 1 ist somit für die nächste Speichersperrung vorgemerkt.- Lockl \ _wait: The data storage was locked by the processor 2 as processor 1 wanted him to reserve for himself. Processor 1 is thus flagged for the next memory lock.
- nex: Das gleiche für Prozessor 2. Der Datenspeicher war während des Sperrversuchs durch Prozessor 1 gesperrt. Prozessor 2 bekommt den Speicher vorreserviert. Bei normalen Speicherzugriff ohne Sperren kann hier Prozessor 2 vor Prozessor 1 zugreifen wenn davor Prozessor 1 dran war.- nex: The same for processor 2. The data store was locked during the attempted lock by processor 1. Processor 2 gets the memory pre-reserved. In the case of normal memory access without locks, processor 2 can access processor 1 before processor 1 if processor 1 was in front of it.
- Speicherzugriff von Prozessor 1: Der Speicher ist in diesem Fall nicht gesperrt. Prozessor 1 darf auf den Datenspeicher zugreifen. Falls er ihn sperren möchte, kann er dies in diesem Zustand vornehmen.Memory access of processor 1: The memory is not locked in this case. Processor 1 is allowed to access the data store. If he wants to lock him, he can do so in this condition.
- Speicherzugriff durch Prozessor 2. Im selben Takt wollte Prozessor 1 nicht auf den Speicher zugreifen somit ist der Speicher frei für den Prozessor 2.Memory access by processor 2. In the same clock processor 1 did not want to access the memory thus the memory is free for the processor 2.
- kein Prozessor möchte auf den Datenspeicher zugreifen- no processor wants to access the data store
Die DVE setzt sich wie erwähnt zusammen aus dem Detektierung des UmschaltwunschesThe DVE sits down as mentioned together from the detection of Umschaltwunsches
(IllOPDetect) der ModeSwitch-Einheit und der Iram- und DramControl.(IllOPDetect) of the ModeSwitch unit and the Iram and DramControl.
In Figur 3 ist nun die Taktumschaltung an einem Beispiel dargestellt, so dass bezüglich des einen Modus im Vergleich zum anderen Modus eine Taktumschaltung erfolgt. Dabei sind die beiden Modi, der Takt clk und die beiden Prozessor- oder Coretakte gezeigt. In einem Modus arbeiten die beiden Prozessoren in einem Taktversatz. Dieser kann sowohl um ganze Takte als auch um Teile des Taktes gegeneinander verschoben sein. Eine weitere Variante ist, dass in den beiden Modi eine unterschiedliche Taktfrequenz verwendet wird. Im sicherheitskritischen Modus kann zur Störungsunterdrückung z.B. ein niedrigerer Takt verwendet werden als im Performancemodus. Dabei können diese beiden Varianten auch miteinander kombiniert werden.In FIG. 3, the clock changeover is shown using an example, so that with respect to one mode, a clock change takes place in comparison to the other mode. The two modes, the clock clk and the two processor or Coretakte are shown. In one mode, the two processors work in one clock skew. This can be shifted both by whole bars as well as parts of the clock against each other. Another variant is that a different clock frequency is used in the two modes. In the safety-critical mode, for example, a lower clock can be used for interference suppression than in the performance mode. These two variants can also be combined with each other.
Daneben löst aber auch die dargestellte spezielle Implementierung die Eingangs genannten Aufgaben.In addition, however, the illustrated special implementation solves the aforementioned tasks.
Bei den Implementierungen von insbesondere Zweiprozessorsystemen (Dual-Core) wird für jeden Prozessor ein Cache vorgesehen wie nochmals schematisch in Figur 4 gezeigt. Ein Cache ist normalerweise nicht ausreichend, da dieser Cache räumlich gesehen zwischen den beiden Prozessoren angeordnet werden muss. Aufgrund der langen Laufzeit zwischen dem Cache und den beiden Prozessoren könnten folglich die beiden Prozessoren nur mit einer begrenzten Taktfrequenz arbeiten.In the implementations of two-processor systems in particular (dual-core), a cache is provided for each processor, as shown again schematically in FIG. A cache is usually not sufficient because this cache must be spatially located between the two processors. Consequently, due to the long delay between the cache and the two processors, the two processors could only operate with a limited clock frequency.
Caches dienen als schneller Zwischenspeicher, damit der Prozessor die Daten nicht immer aus dem langsamen Hauptspeicher holen muss. Um dies zu ermöglichen, muss bei der Implementierung von Cache stark auf dessen Zugriffsdauer geachtet werden. Diese setzt sich aus der eigentlichen Zugriffszeit um die Daten aus dem Cache zu holen und aus der Zeit um die Daten an den Prozessor weiterzureichen zusammen. Ist der Cache nun räumlich weit entfernt vom Prozessor platziert, so dauert die Übermittlung der Daten sehr lange und der Prozessor kann nicht mehr mit seinem vollen Takt arbeiten. Aufgrund dieses Timingproblems wird bei Zweiprozessorsystemen für jeden Prozessor üblicherweise ein eigener Cache vorgesehen.Caches serve as a fast cache so that the processor does not always have to fetch the data from the slow main memory. In order to make this possible, it is important to pay close attention to the access time when implementing the cache. This consists of the actual access time to fetch the data from the cache and from the time to pass the data to the processor together. If the cache is now located far away from the processor, the transfer of data takes a long time and the processor can no longer work with its full clock. Because of this timing problem, two-processor systems typically provide a separate cache for each processor.
Wenn diese beiden Prozessoren nun mit einem Taktversatz betrieben werden, kann nun mit dem in Figur 5 vorgeschlagenen Verfahren auf den zweiten Cache für den Slave-If these two processors are now operated with a clock offset, the method proposed in FIG. 5 can now be applied to the second cache for the slave channel.
Prozessor verzichtet werden.Processor be waived.
Ein Cache benötigt viel Chipfläche und auch viel Strom. Dadurch produziert er auch viel Abwärme, die abgeführt werden muss. Kann nun auf einen Cache verzichtet werden, so lässt sich ein Zweiprozessorsystem deutlich kostengünstiger implementieren. Bei dem hier vorgestellten Zweirechnersystem ist ein Prozessor der Master und ein Prozessor der Slave. Der Master arbeitet als erstes die Daten ab und steuert folglich auch die Peripheriekomponenten wie Speicher, Cache, DMA-Kontroller usw. an. Der Slave arbeitet die gleichen Daten mit einem Taktversatz von hier beispielhaft 1,5 Takte ab. Das bedeutet auch, dass er die Daten aus dem gemeinsamen Speicher und von den externen Komponenten ebenfalls um diese Zeitdauer später erhält. Die Ausgangsdaten der beiden Prozessoren wie Speicheradresse, Daten, usw. werden miteinander verglichen. Um die Daten miteinander vergleichen zu können, müssen die Ergebnisse des Masters ebenfalls 1,5 Takte zwischengespeichert werden. Ein solches Beispielsystem ist unten abgebildet.A cache requires a lot of chip space and also a lot of power. As a result, it also produces a lot of waste heat, which must be dissipated. If a cache can now be dispensed with, then a two-processor system can be implemented much more cost-effectively. In the dual-computer system presented here, one processor is the master and one processor is the slave. The master first processes the data and thus also drives the peripheral components such as memory, cache, DMA controller, etc. The slave processes the same data with a clock offset of 1.5 clocks, for example. This also means that it also gets the data from the shared memory and from the external components later this time. The output data of the two processors such as memory address, data, etc. are compared with each other. To be able to compare the data with each other, the results of the master must also be buffered for 1.5 cycles. Such an example system is shown below.
Um gemäß Figur 5 nun ein Cache für beide Prozessoren verwenden zu können, werden nun der Befehls- und Datencache direkt am Master angeordnet wie bei einem Single- Prozessor. Der Master muss somit keine Performanceeinbußen bezüglich der Laufzeiten zwischen Cache und Prozessor hinnehmen. Da der Slave die Daten erst 1,5 Takte später abarbeitet, kann man diese Zeit nun benutzen um die Daten an den zweiten nun räumlich weiter vom Cache entfernten Prozessor zu führen.In order to be able to use a cache for both processors according to FIG. 5, the command and data cache are now arranged directly at the master as in a single processor. The master therefore does not have to accept any performance losses in terms of the cache-to-processor runtimes. Since the slave only processes the data 1.5 clocks later, this time can now be used to transfer the data to the second processor, which is now further away from the cache.
Dazu können bei einem beispielhaften Taktversatz von 1,5 Takten zwei Flip-Flops benutzt werden, wie dies in Figur 6 dargestellt ist. Das Erste wird mit dem Takt desFor this purpose, two flip-flops can be used in an exemplary clock offset of 1.5 clocks, as shown in Figure 6. The first one is with the beat of the
Masters angesteuert, das Zweite mit dem Takt des Slaves. Das erste Flip-Flop wird direkt am Ausgang der Quelle positioniert. Das Zweite wird nun entsprechend der Länge, die das Signal in der Differenz zwischen den beiden Takten zurücklegen kann, entsprechend näher am Slave positioniert. Dies entspricht bei 1,5 Takte Zeitversatz der Laufzeitlänge in einem halben Takt und bei einem Taktversatz von 2 Takte der Laufzeitlänge von einemMasters controlled, the second with the clock of the slave. The first flip-flop is positioned directly at the output of the source. The second will now be positioned closer to the slave according to the length that the signal can travel in the difference between the two measures. At 1.5 clocks, this corresponds to a time offset of the runtime length in half a clock and a clock offset of 2 clocks in the runtime of one
Takt. Dann übernimmt das zweite Flip-Flop das Signal. Nun kann noch einmal die Strecke, die das Signal während eines ganzen Taktes zurücklegen kann, überbrückt werden. In der Abbildung ist dies durch 1.) die nahe Anordnung an der Senke dargestellt, 2.) entspricht der Länge die in der Taktdifferenz zurückgelegt werden kann und 3.) ist die Länge die in einem Takt nach dem zweiten Flip-Flop zurückgelegt werden kann. Clock. Then the second flip-flop takes over the signal. Now, once again, the distance that the signal can cover during a whole measure can be bridged. In the figure this is represented by 1.) the close arrangement at the sink, 2.) the length which can be covered in the clock difference, and 3.) the length which can be covered in one cycle after the second flip-flop ,

Claims

Ansprüche claims
1. Verfahren zur Verzögerung der Zugriffe auf Daten und/oder Befehle eines Mehrprozessorsystems mit einem ersten und einem zweiten Prozessor, denen eine Speichereinheit zugeordnet ist, wobei der zweite Prozessor mit einem Taktversatz arbeitet und die Vorrichtung derart ausgebildet ist, dass der erste Prozessor auf dieA method of delaying accesses to data and / or instructions of a multiprocessor system having first and second processors associated therewith a memory unit, the second processor operating at a clock skew, and the apparatus being configured such that the first processor resides on the first processor
Speichereinheit zugreift und der zweite Prozessor mit einem Taktversatz die Daten erhält.Memory unit accesses and receives the second processor with a clock offset data.
2. Verfahren zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 1, dadurch gekennzeichnet, dass der Taktversatz durch ein2. A method for delaying the access to data and / or instructions according to claim 1, characterized in that the clock offset by a
Verzögerungselement genutzt wird um eine Überbrückung der Laufzeit der Daten und/oder Befehle von der Speichereinheit zu dem zweiten Prozessor zu realisieren.Delay element is used to bridge the runtime of the data and / or commands from the memory unit to realize the second processor.
3. Verfahren zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 1, dadurch gekennzeichnet, dass der Taktversatz ausgenutzt wird um3. A method for delaying the access to data and / or commands according to claim 1, characterized in that the clock offset is exploited to
Verleichsdaten des ersten Prozessors zum zweiten Prozessor zu führen.To pass comparison data of the first processor to the second processor.
4. Verfahren zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 1, dadurch gekennzeichnet, dass als Zugriffe Schreiboperationen und Leseoperationen verzögert werden.4. A method for delaying the access to data and / or commands according to claim 1, characterized in that as accesses write operations and read operations are delayed.
5. Verfahren zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 1, dadurch gekennzeichnet, dass als Zugriffe nur Schreiboperationen verzögert werden.5. A method for delaying the access to data and / or commands according to claim 1, characterized in that are delayed as accesses only write operations.
6. Verfahren zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 1, dadurch gekennzeichnet, dass als Zugriffe nur Leseoperationen verzögert werden. 6. A method for delaying the access to data and / or commands according to claim 1, characterized in that as accesses only read operations are delayed.
7. Verfahren zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 1, dadurch gekennzeichnet, dass der Taktversatz halbzahlig vorgegeben wird.7. A method for delaying the access to data and / or instructions according to claim 1, characterized in that the clock offset is given half-integer.
8. Verfahren zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 1, dadurch gekennzeichnet, dass der Taktversatz ganzzahlig vorgegeben wird.8. A method for delaying the access to data and / or commands according to claim 1, characterized in that the clock offset is given in integers.
9. Verfahren zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 1, dadurch gekennzeichnet, dass der Taktversatz zu 1,5 Takten vorgegeben wird.9. A method for delaying the access to data and / or commands according to claim 1, characterized in that the clock offset is set to 1.5 clocks.
10. Vorrichtung zur Verzögerung der Zugriffe auf Daten und/oder Befehle eines Mehrprozessorsystems mit einem ersten und einem zweiten Prozessor, denen eine Speichereinheit zugeordnet ist, wobei der zweite Prozessor mit einem Taktversatz arbeitet und die Vorrichtung derart ausgebildet ist, dass der erste Prozessor auf die Speichereinheit zugreift und der zweite Prozessor mit einem Taktversatz die Daten und/oder Befehle erhält.10. A device for delaying access to data and / or instructions of a multiprocessor system having a first and a second processor, which is associated with a memory unit, wherein the second processor operates with a clock offset and the device is designed such that the first processor to the Memory unit accesses and receives the second processor with a clock offset data and / or commands.
11. Vorrichtung zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 10, dadurch gekennzeichnet, dass es sich bei der Speichereinheit um einen Cache handelt.11. Device for delaying the access to data and / or commands according to claim 10, characterized in that the storage unit is a cache.
12. Vorrichtung zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 10, dadurch gekennzeichnet, dass die Speichereinheit von wenigstens einem Prozessor adressiert wird und die Speichereinheit direkt an dem Prozessor angekoppelt ist, der sie adressiert.12. Device for delaying the access to data and / or commands according to claim 10, characterized in that the memory unit is addressed by at least one processor and the memory unit is coupled directly to the processor that addresses it.
13. Vorrichtung zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 10, dadurch gekennzeichnet, dass ein Verzögerungselement enthalten ist und die Vorrichtung derart ausgestaltet ist, dass der Taktversatz durch das Verzögerungselement genutzt wird um eine Überbrückung der Laufzeit der Daten und/oder Befehle von der Speichereinheit zu dem zweiten Prozessor zu realisieren.13. A device for delaying the access to data and / or commands according to claim 10, characterized in that a delay element is included and the device is configured such that the clock offset is used by the delay element to a bridging the duration of the data and / or To implement commands from the memory unit to the second processor.
14. Vorrichtung zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 10, dadurch gekennzeichnet, dass Vergleichsmittel vorgesehen sind, durch welche die Daten und/oder Befehle verglichen werden.14. Device for delaying the access to data and / or commands according to claim 10, characterized in that comparison means are provided by which the data and / or commands are compared.
15. Vorrichtung zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 14, dadurch gekennzeichnet, dass die Vergleichsmittel räumlich nah an dem nachfolgenden Prozessor angeordnet sind.15. Device for delaying the access to data and / or commands according to claim 14, characterized in that the comparison means are arranged spatially close to the subsequent processor.
16. Vorrichtung zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 14, dadurch gekennzeichnet, dass die Vorrichtung derart ausgestaltet ist, dass der Taktversatz ausgenutzt wird um die Verleichsdaten des ersten Prozessors zum zweiten Prozessor zu führen.16. Device for delaying the access to data and / or commands according to claim 14, characterized in that the device is designed such that the clock offset is utilized to guide the Verleichsdaten the first processor to the second processor.
17. Vorrichtung zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 10, dadurch gekennzeichnet, dass die Vorrichtung derart ausgestaltet ist, dass als Zugriffe Schreiboperationen und Leseoperationen verzögert werden.17. Device for delaying the access to data and / or commands according to claim 10, characterized in that the device is designed such that write accesses and read operations are delayed as accesses.
18. Vorrichtung zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach18. Device for delaying access to data and / or commands
Anspruch 10, dadurch gekennzeichnet, dass die Vorrichtung derart ausgestaltet ist, dass als Zugriffe nur Schreiboperationen verzögert werden.Claim 10, characterized in that the device is designed such that only write operations are delayed as accesses.
19. Vorrichtung zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 10, dadurch gekennzeichnet, dass die Vorrichtung derart ausgestaltet ist, dass als Zugriffe nur Leseoperationen verzögert werden.19. Device for delaying the access to data and / or commands according to claim 10, characterized in that the device is designed such that only read operations are delayed as accesses.
20. Vorrichtung zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 10, dadurch gekennzeichnet, dass die Vorrichtung derart ausgestaltet ist, dass der Taktversatz halbzahlig vorgegeben wird.20. Device for delaying the access to data and / or commands according to claim 10, characterized in that the device is designed such that the clock offset is given half-integer.
21. Vorrichtung zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach Anspruch 10, dadurch gekennzeichnet, dass die Vorrichtung derart ausgestaltet ist, dass der Taktversatz ganzzahlig vorgegeben wird.21. Device for delaying the access to data and / or commands according to claim 10, characterized in that the device is designed such that the clock offset is given in integers.
22. Vorrichtung zur Verzögerung der Zugriffe auf Daten und/oder Befehle nach22. Device for delaying the access to data and / or commands according to
Anspruch 10, dadurch gekennzeichnet, dass die Vorrichtung derart ausgestaltet ist, dass der Taktversatz zu 1,5 Takten vorgegeben wird. 23. Mehrprozessorsystem mit einer Vorrichtung nach einem der Ansprüche 10 bisClaim 10, characterized in that the device is designed such that the clock offset is set to 1.5 clocks. 23. Multiprocessor system with a device according to one of claims 10 to
22. 22nd
EP05811008A 2004-10-25 2005-10-25 Method and device for delaying accesses to data and/or commands of a multiprocessor system Ceased EP1812861A1 (en)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
DE200410051950 DE102004051950A1 (en) 2004-10-25 2004-10-25 Clock switching unit for microprocessor system, has switching unit by which switching can be done between two operating modes, where unit is formed so that clock switching takes place with one processor during switching of modes
DE200410051952 DE102004051952A1 (en) 2004-10-25 2004-10-25 Data allocation method for multiprocessor system involves performing data allocation according to operating mode to which mode switch is shifted
DE200410051992 DE102004051992A1 (en) 2004-10-25 2004-10-25 Access delay method for multiprocessor system involves clocking processors differently to enable both processors to access memory at different times
DE200410051964 DE102004051964A1 (en) 2004-10-25 2004-10-25 Memory unit monitoring device for use in multiprocessor system, has switching unit, though which system is switched between two operating modes such that device is arranged in such a manner that contents of unit are simultaneously logged
DE200410051937 DE102004051937A1 (en) 2004-10-25 2004-10-25 Data distributing method for multiprocessor system, involves switching between operating modes e.g. safety and performance modes, of computer units, where data distribution and/or selection of data source is dependent upon one mode
PCT/EP2005/055542 WO2006045804A1 (en) 2004-10-25 2005-10-25 Method and device for delaying accesses to data and/or commands of a multiprocessor system

Publications (1)

Publication Number Publication Date
EP1812861A1 true EP1812861A1 (en) 2007-08-01

Family

ID=35677569

Family Applications (5)

Application Number Title Priority Date Filing Date
EP05811008A Ceased EP1812861A1 (en) 2004-10-25 2005-10-25 Method and device for delaying accesses to data and/or commands of a multiprocessor system
EP05801543A Not-in-force EP1807763B1 (en) 2004-10-25 2005-10-25 Method and device for monitoring a memory unit in a multi-processor system
EP05801268A Ceased EP1807761A1 (en) 2004-10-25 2005-10-25 Method and device for distributing data from at least one data source in a multiprocessor system
EP05797084A Active EP1810145B1 (en) 2004-10-25 2005-10-25 Method and device for synchronising in a multi-processor system
EP05811107A Withdrawn EP1820102A2 (en) 2004-10-25 2005-10-25 Method and device for carrying out clock changeover in a multiprocessor system

Family Applications After (4)

Application Number Title Priority Date Filing Date
EP05801543A Not-in-force EP1807763B1 (en) 2004-10-25 2005-10-25 Method and device for monitoring a memory unit in a multi-processor system
EP05801268A Ceased EP1807761A1 (en) 2004-10-25 2005-10-25 Method and device for distributing data from at least one data source in a multiprocessor system
EP05797084A Active EP1810145B1 (en) 2004-10-25 2005-10-25 Method and device for synchronising in a multi-processor system
EP05811107A Withdrawn EP1820102A2 (en) 2004-10-25 2005-10-25 Method and device for carrying out clock changeover in a multiprocessor system

Country Status (8)

Country Link
US (4) US7853819B2 (en)
EP (5) EP1812861A1 (en)
JP (5) JP2008518312A (en)
KR (4) KR20070062579A (en)
AT (2) ATE409327T1 (en)
DE (2) DE502005005284D1 (en)
RU (1) RU2007119316A (en)
WO (5) WO2006045798A1 (en)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7882379B2 (en) * 2006-09-22 2011-02-01 Sony Computer Entertainment Inc. Power consumption reduction in a multiprocessor system
US20080244305A1 (en) * 2007-03-30 2008-10-02 Texas Instruments Deutschland, Gmbh Delayed lock-step cpu compare
DE102007063291A1 (en) * 2007-12-27 2009-07-02 Robert Bosch Gmbh safety control
JP4633134B2 (en) 2008-03-27 2011-02-16 ルネサスエレクトロニクス株式会社 Microcontroller, control system, and design method of microcontroller
US7941698B1 (en) * 2008-04-30 2011-05-10 Hewlett-Packard Development Company, L.P. Selective availability in processor systems
JP2010198131A (en) * 2009-02-23 2010-09-09 Renesas Electronics Corp Processor system and operation mode switching method for processor system
US8275977B2 (en) * 2009-04-08 2012-09-25 Freescale Semiconductor, Inc. Debug signaling in a multiple processor data processing system
US8295287B2 (en) * 2010-01-27 2012-10-23 National Instruments Corporation Network traffic shaping for reducing bus jitter on a real time controller
US8954714B2 (en) * 2010-02-01 2015-02-10 Altera Corporation Processor with cycle offsets and delay lines to allow scheduling of instructions through time
WO2011101707A1 (en) * 2010-02-16 2011-08-25 Freescale Semiconductor, Inc. Data processing method, data processor and apparatus including a data processor
KR101664108B1 (en) 2010-04-13 2016-10-11 삼성전자주식회사 Apparatus and method of hardware acceleration for processing synchronization of multi core
JP5718600B2 (en) * 2010-09-10 2015-05-13 日本電気通信システム株式会社 Information processing system and information processing method
US8683251B2 (en) 2010-10-15 2014-03-25 International Business Machines Corporation Determining redundancy of power feeds connecting a server to a power supply
JP5796311B2 (en) * 2011-03-15 2015-10-21 オムロン株式会社 Control device and system program
WO2012144011A1 (en) 2011-04-18 2012-10-26 富士通株式会社 Thread processing method and thread processing system
US9086977B2 (en) * 2011-04-19 2015-07-21 Freescale Semiconductor, Inc. Cache memory with dynamic lockstep support
WO2014080245A1 (en) 2012-11-22 2014-05-30 Freescale Semiconductor, Inc. Data processing device, method of execution error detection and integrated circuit
US9429981B2 (en) * 2013-03-05 2016-08-30 St-Ericsson Sa CPU current ripple and OCV effect mitigation
US9823983B2 (en) 2014-09-25 2017-11-21 Nxp Usa, Inc. Electronic fault detection unit
WO2016087175A1 (en) * 2014-12-01 2016-06-09 Continental Teves Ag & Co. Ohg Processing system for a motor vehicle system
JP6516097B2 (en) * 2015-06-11 2019-05-22 大日本印刷株式会社 Arithmetic device, IC card, arithmetic method, and arithmetic processing program
JP2019061392A (en) 2017-09-26 2019-04-18 ルネサスエレクトロニクス株式会社 Microcontroller and control method of microcontroller
US10642826B1 (en) 2018-08-30 2020-05-05 Gravic, Inc. Mixed-mode method for combining active/active and validation architectures utilizing a check integrity module
US11269799B2 (en) * 2019-05-03 2022-03-08 Arm Limited Cluster of processing elements having split mode and lock mode
US11899547B2 (en) * 2021-11-30 2024-02-13 Mellanox Technologies, Ltd. Transaction based fault tolerant computing system
US20230259433A1 (en) * 2022-02-11 2023-08-17 Stmicroelectronics S.R.L. Systems and methods to test an asychronous finite machine

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1269827B (en) * 1965-09-09 1968-06-06 Siemens Ag Method and additional device for the synchronization of data processing systems working in parallel
US3783250A (en) * 1972-02-25 1974-01-01 Nasa Adaptive voting computer system
US4823256A (en) 1984-06-22 1989-04-18 American Telephone And Telegraph Company, At&T Bell Laboratories Reconfigurable dual processor system
AU616213B2 (en) * 1987-11-09 1991-10-24 Tandem Computers Incorporated Method and apparatus for synchronizing a plurality of processors
US6038584A (en) * 1989-11-17 2000-03-14 Texas Instruments Incorporated Synchronized MIMD multi-processing system and method of operation
US5226152A (en) * 1990-12-07 1993-07-06 Motorola, Inc. Functional lockstep arrangement for redundant processors
DE4104114C2 (en) * 1991-02-11 2000-06-08 Siemens Ag Redundant data processing system
JPH05128080A (en) * 1991-10-14 1993-05-25 Mitsubishi Electric Corp Information processor
US5751932A (en) 1992-12-17 1998-05-12 Tandem Computers Incorporated Fail-fast, fail-functional, fault-tolerant multiprocessor system
JPH07121483A (en) 1993-10-28 1995-05-12 Nec Eng Ltd Shared memory access control circuit
US5758132A (en) 1995-03-29 1998-05-26 Telefonaktiebolaget Lm Ericsson Clock control system and method using circuitry operating at lower clock frequency for selecting and synchronizing the switching of higher frequency clock signals
CA2178440A1 (en) 1995-06-07 1996-12-08 Robert W. Horst Fail-fast, fail-functional, fault-tolerant multiprocessor system
JPH096733A (en) * 1995-06-14 1997-01-10 Toshiba Corp Parallel signal processor
JPH0973436A (en) * 1995-09-05 1997-03-18 Mitsubishi Electric Corp Operation mode switching system of multiplied computers
US5732209A (en) * 1995-11-29 1998-03-24 Exponential Technology, Inc. Self-testing multi-processor die with internal compare points
US5809522A (en) * 1995-12-18 1998-09-15 Advanced Micro Devices, Inc. Microprocessor system with process identification tag entries to reduce cache flushing after a context switch
FR2748136B1 (en) * 1996-04-30 1998-07-31 Sextant Avionique ELECTRONIC MODULE WITH REDUNDANT ARCHITECTURE FOR FUNCTIONALITY INTEGRITY CONTROL
GB2317032A (en) * 1996-09-07 1998-03-11 Motorola Gmbh Microprocessor fail-safe system
GB9704542D0 (en) * 1997-03-05 1997-04-23 Sgs Thomson Microelectronics A cache coherency mechanism
EP0978784A1 (en) * 1998-08-04 2000-02-09 Motorola, Inc. Method for coding computer programs and method for debugging coded computer programs
GB2340627B (en) * 1998-08-13 2000-10-04 Plessey Telecomm Data processing system
JP2000200255A (en) 1999-01-07 2000-07-18 Hitachi Ltd Method and circuit for synchronization between processors
WO2000079405A1 (en) * 1999-06-21 2000-12-28 Hitachi, Ltd. Data processor
US6615366B1 (en) * 1999-12-21 2003-09-02 Intel Corporation Microprocessor with dual execution core operable in high reliability mode
US6640313B1 (en) * 1999-12-21 2003-10-28 Intel Corporation Microprocessor with high-reliability operating mode
US6772368B2 (en) * 2000-12-11 2004-08-03 International Business Machines Corporation Multiprocessor with pair-wise high reliability mode, and method therefore
DE10136335B4 (en) * 2001-07-26 2007-03-22 Infineon Technologies Ag Processor with several arithmetic units
US6947047B1 (en) * 2001-09-20 2005-09-20 Nvidia Corporation Method and system for programmable pipelined graphics processing with branching instructions
US20040076189A1 (en) * 2002-10-17 2004-04-22 International Business Machines Corporation Multiphase clocking method and apparatus
US7055060B2 (en) * 2002-12-19 2006-05-30 Intel Corporation On-die mechanism for high-reliability processor
JP2004234144A (en) * 2003-01-29 2004-08-19 Hitachi Ltd Operation comparison device and operation comparison method for processor
EP1639454A2 (en) * 2003-06-24 2006-03-29 Robert Bosch GmbH Method for switching between at least two operating modes of a processor unit and corresponding processor unit
US7134031B2 (en) * 2003-08-04 2006-11-07 Arm Limited Performance control within a multi-processor system
DE10349581A1 (en) * 2003-10-24 2005-05-25 Robert Bosch Gmbh Method and device for switching between at least two operating modes of a processor unit

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO2006045804A1 *

Also Published As

Publication number Publication date
DE502005005490D1 (en) 2008-11-06
WO2006045801A2 (en) 2006-05-04
US20080126718A1 (en) 2008-05-29
JP2008518312A (en) 2008-05-29
EP1807763B1 (en) 2008-09-24
WO2006045804A1 (en) 2006-05-04
KR20070083772A (en) 2007-08-24
WO2006045800A1 (en) 2006-05-04
JP2008518311A (en) 2008-05-29
JP2008518308A (en) 2008-05-29
DE502005005284D1 (en) 2008-10-16
KR20070083771A (en) 2007-08-24
US20090164826A1 (en) 2009-06-25
US7853819B2 (en) 2010-12-14
WO2006045798A1 (en) 2006-05-04
EP1807763A2 (en) 2007-07-18
EP1820102A2 (en) 2007-08-22
KR20070067168A (en) 2007-06-27
JP4532561B2 (en) 2010-08-25
EP1810145B1 (en) 2008-09-03
WO2006045801A3 (en) 2006-07-06
EP1807761A1 (en) 2007-07-18
ATE407398T1 (en) 2008-09-15
US20080163035A1 (en) 2008-07-03
JP2008518309A (en) 2008-05-29
US20080209251A1 (en) 2008-08-28
ATE409327T1 (en) 2008-10-15
WO2006045802A2 (en) 2006-05-04
WO2006045802A3 (en) 2007-01-04
KR20070062579A (en) 2007-06-15
JP2008518310A (en) 2008-05-29
RU2007119316A (en) 2008-12-10
EP1810145A1 (en) 2007-07-25

Similar Documents

Publication Publication Date Title
EP1807763B1 (en) Method and device for monitoring a memory unit in a multi-processor system
DE102005055067A1 (en) Device and method for correcting errors in a system having at least two execution units with registers
EP1917592B1 (en) Computer system with at least two execution units and a comparison unit and method for controlling the same
EP3077912B1 (en) Control device for a motor vehicle
EP1667022A2 (en) Device and method for correcting errors in a processor with two processing units
EP1812856B1 (en) Method and device for evaluating a signal of a computer system comprising at least two execution units
DE102008004205A1 (en) Circuit arrangement for error treatment in real-time system e.g. controller, for motor vehicle, has processing units reporting result of inherent error diagnosis by monitoring unit that activates arithmetic units in dependence of result
EP1955164A1 (en) Program-controlled unit and method for the operation thereof
EP1776637A2 (en) Method for delaying access to data and/or commands of a dual computer system, and corresponding delaying unit
WO2004034261A1 (en) Method for event synchronisation, especially for processors of fault-tolerant systems
EP1618476A2 (en) Program-controlled unit and method
DE102004051952A1 (en) Data allocation method for multiprocessor system involves performing data allocation according to operating mode to which mode switch is shifted
WO2006015955A2 (en) Method for registering errors and corresponding register
DE102004051937A1 (en) Data distributing method for multiprocessor system, involves switching between operating modes e.g. safety and performance modes, of computer units, where data distribution and/or selection of data source is dependent upon one mode
DE102004051992A1 (en) Access delay method for multiprocessor system involves clocking processors differently to enable both processors to access memory at different times
DE102004051950A1 (en) Clock switching unit for microprocessor system, has switching unit by which switching can be done between two operating modes, where unit is formed so that clock switching takes place with one processor during switching of modes
DE102004051964A1 (en) Memory unit monitoring device for use in multiprocessor system, has switching unit, though which system is switched between two operating modes such that device is arranged in such a manner that contents of unit are simultaneously logged
WO2004034172A2 (en) Method for synchronizing events, particularly for processors of fault-tolerant systems
DE102005037245A1 (en) Method and device for controlling a computer system with at least two execution units
DE102009001048A1 (en) Device for testing functioning of dual-core computer system for e.g. security-relevant control system of motor vehicle, has switching and comparison unit triggered-off by signal, where signal is led back to test unit
DE3603240C2 (en)
DD254077A1 (en) MICRORECHNER ARRANGEMENT FOR USE IN MULTIMIKRORECHNERSYSTEMEN
DD297723A5 (en) CIRCUIT ARRANGEMENT FOR PROGRAM INTERRUPTION
DE102005037258A1 (en) Method and device for determining a start state in a computer system having at least two execution units by adopting the start state

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20070525

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU LV MC NL PL PT RO SE SI SK TR

17Q First examination report despatched

Effective date: 20070827

DAX Request for extension of the european patent (deleted)
REG Reference to a national code

Ref country code: DE

Ref legal event code: R003

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION HAS BEEN REFUSED

18R Application refused

Effective date: 20121108