DE102004011450A1 - Anvisierte Fehlertoleranz durch spezielle CPU-Befehle - Google Patents

Anvisierte Fehlertoleranz durch spezielle CPU-Befehle Download PDF

Info

Publication number
DE102004011450A1
DE102004011450A1 DE102004011450A DE102004011450A DE102004011450A1 DE 102004011450 A1 DE102004011450 A1 DE 102004011450A1 DE 102004011450 A DE102004011450 A DE 102004011450A DE 102004011450 A DE102004011450 A DE 102004011450A DE 102004011450 A1 DE102004011450 A1 DE 102004011450A1
Authority
DE
Germany
Prior art keywords
fault
tolerant
fault tolerant
processing unit
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102004011450A
Other languages
English (en)
Inventor
Ken Gary Roseville Pomaranski
Andrew Harvey Roseville Barr
Dale John Roseville Shidla
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of DE102004011450A1 publication Critical patent/DE102004011450A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1629Error detection by comparing the output of redundant processing systems
    • G06F11/1641Error detection by comparing the output of redundant processing systems where the comparison is not performed by the redundant processing components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30181Instruction operation extension or modification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Hardware Redundancy (AREA)
  • Retry When Errors Occur (AREA)
  • Executing Machine-Instructions (AREA)

Abstract

Ein offenbartes Ausführungsbeispiel bezieht sich auf einen Mikroprozessor zum anvisierten fehlertoleranten Rechnen. Der Decodierschaltungsaufbau des Mikroprozessors ist konfiguriert, um eine fehlertolerante Version eines Befehls und eine nicht-fehlertolerante Version des Befehls unterschiedlich voneinander zu decodieren. Der Ausführungsschaltungsaufbau des Mikroprozessors ist konfiguriert, um die fehlertolerante Version des Befehls mit Redundanzprüfung auszuführen und die nicht-fehlertolerante Version des Befehls ohne Redundanzprüfung auszuführen.

Description

  • Die vorliegende Erfindung bezieht sich allgemein auf Computersysteme. Insbesondere bezieht sich die vorliegende Erfindung auf fehlertolerante und hoch verfügbare Computersysteme.
  • Frühere Lösungen für ein Bereitstellen einer Fehlertoleranz bei einer Digitalverarbeitung sind entweder hardwarebasiert, softwarebasiert oder eine Kombination von beidem. Eine Fehlertoleranz kann in Hardware durch ein Laufenlassen zweier vollständiger zentraler Verarbeitungseinheiten (CPUs) im Verriegelungsschritt oder dreier CPUs in einer „Wähl"-Konfiguration bereitgestellt werden. Ein System kann z. B. drei CPUs, die den gleichen Befehlsstrom ausführen, gemeinsam mit drei separaten Hauptspeichereinheiten und separaten I/O-Vorrichtungen verwenden, die Funktionen duplizieren, so daß, wenn eines jedes Typs von Element ausfällt, das System weiterhin funktioniert. Leider umfassen derartige Systeme einen ungeheuren Systemmehraufwand, nicht nur hinsichtlich der Anzahl benötigter CPUs, sondern auch hinsichtlich der Infrastruktur, die die CPUs unterstützt (Speicher, Leistung, Kühlsysteme usw.).
  • Softwarebasierte Lösungen beruhen üblicherweise auf einem zumindest dreimaligen vollständigen erneuten Laufenlassen eines Programms. Dies führt zu effektiven Ausführungszeiten, die dreimal länger als dann sind, wenn das Programm nur einmal laufengelassen wird. Kombinationsschemata erfordern sowohl eine zusätzliche Hardware (z. B. zweimal die Hardware) als auch eine zusätzliche Verarbeitung. Die zusätzliche Verarbeitung kann die Form einer Software-Prüfpunktgebung annehmen. Die Software-Prüfpunktgebung betrifft die Fähigkeit, bei einem Fehler eine spezifische Befehlssequenz „erneut abzuspielen".
  • Die oben erläuterten bestehenden Lösungen sind teuer in Bezug auf Kosten und/oder Systemverhalten. So sind Verbesserungen an Systemen und Verfahren zum Bereitstellen einer fehlertoleranten Digitalverarbeitung sehr wünschenswert.
  • Es ist die Aufgabe der vorliegenden Erfindung, einen Mikroprozessor mit verbesserten Charakteristika, ein verbessertes Verfahren zum anvisierten fehlertoleranten Rechnen, eine Rechenvorrichtung mit verbesserten Charakteristika oder ein Computerprogrammprodukt mit verbesserten Charakteristika zu schaffen.
  • Diese Aufgabe wird durch einen Mikroprozessor gemäß Anspruch 1, ein Verfahren gemäß Anspruch 6, eine Rechenvorrichtung gemäß Anspruch 14 oder ein Computerprogrammprodukt gemäß Anspruch 16 gelöst.
  • Ein Ausführungsbeispiel der Erfindung bezieht sich auf einen Mikroprozessor zum anvisierten (targeted) fehlertoleranten Rechnen. Der Decodierschaltungsaufbau des Mikroprozessors ist konfiguriert, um eine fehlertolerante Version eines Befehls und eine nicht-fehlertolerante Version des Befehls unterschiedlich voneinander zu decodieren. Der Ausführungsschaltungsaufbau des Mikroprozessors ist konfiguriert, um die fehlertolerante Version des Befehls mit einer Redundanzprüfung auszuführen und die nicht-fehlertolerante Version des Befehls ohne Redundanzprüfung auszuführen.
  • Ein weiteres Ausführungsbeispiel der Erfindung bezieht sich auf ein Verfahren zum anvisierten fehlertoleranten Rechnen in einer zentralen Verarbeitungseinheit (CPU). Das Verfahren umfaßt ein Decodieren einer fehlertoleranten Version eines Befehls, um einen ersten Operationscode zu erzeugen, und ein Decodieren einer nicht-fehlertoleranten Version des Befehls, um einen zweiten Operationscode zu erzeugen. Der erste Operationscode wird mit Redundanzprüfung ausgeführt.
  • Der zweite Operationscode wird ohne Redundanzprüfung ausgeführt.
  • Ein weiteres Ausführungsbeispiel der Erfindung bezieht sich auf ein Computerprogrammprodukt. Das Programmprodukt umfaßt einen ersten Typ computerlesbarer Befehle, die mit Redundanzprüfung auszuführen sind, und einen zweiten Typ computerlesbarer Befehle, die nicht-redundant auszuführen sind.
  • Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beigefügten Zeichnungen näher erläutert. Es zeigen:
  • 1 ein exemplarisches schematisches Diagramm eines CPU-Schaltungsaufbaus zur anvisierten Fehlertoleranz gemäß einem Ausführungsbeispiel der Erfindung, wobei es für Fachleute auf dem Gebiet des Mikroprozessorentwurfs ersichtlich ist, daß weitere Entwürfe existieren können, die die gleiche Basisfunktion durchführen;
  • 2A eine exemplarische Befehlssequenz unter Verwendung einer fehlertoleranten Version eines Befehls gemäß einem Ausführungsbeispiel der Erfindung;
  • 2B ein Flußdiagramm eines Verfahrens, das in einer CPU während einer Ausführung eines fehlertoleranten Befehls gemäß einem Ausführungsbeispiel der Erfindung durchgeführt wird; und
  • 3 ein Diagramm, das zwei unterschiedliche Pegel einer anvisierten Fehlertoleranz gemäß einem Ausführungsbeispiel der Erfindung darstellt.
  • Wie oben erläutert wurde, weisen frühere Systeme und Verfahren zur fehlertoleranten Digitalverarbeitung verschiedene Nachteile auf. Die vorliegende Erfindung bezieht sich auf Systeme und Verfahren zum verbesserten fehlertoleranten Rechnen.
  • Ein herkömmlicher Befehlssatz eines modernen Mikroprozessors besteht aus Befehlen, die im allgemeinen für Leistung optimiert sind. Gemäß einem Ausführungsbeispiel der Erfindung werden spezielle Befehle, die fehlertolerante Merkmale aufweisen, hinzugefügt, um einen derartigen herkömmlichen Befehlssatz zu ergänzen. Eine arithmetische oder logische Operation kann z. B. zwei Typen oder Versionen aufweisen. Eine nicht-fehlertolerante Version verwendet einen Ausführungspfad, der für eine schnelle Leistung konfiguriert ist, während eine fehlertolerante Version einen Pfad mit Redundanzprüfung verwendet, um die Korrektheit des Ergebnisses sicherzustellen. Im Gegensatz dazu liefern herkömmliche CPUs üblicherweise keine derartige Verifizierungsoption für arithmetische und logische Funktionen. Dies ist so, da die Verifizierung dieser Funktionen üblicherweise langsam und komplex ist, was eine Leistung in Bezug auf Geschwindigkeit reduziert. Weitere Strukturen in dem Mikroprozessor, wie z. B. Cache-Speicher, Register, Übersetzungspuffer (Translation Lookaside Buffer; TLBs) und dergleichen, werden üblicherweise durch Paritätsbits oder eine Fehlerkorrekturcodierung verifiziert.
  • Ein Ausführungsbeispiel der vorliegenden Erfindung verwendet spezielle Versionen bestimmter CPU-Befehle, um eine Fehlertoleranz auf eine anvisierte Art und Weise bereitzustellen. Spezifische Operationen innerhalb einer Anwendung können für eine Fehlertoleranz anvisiert sein, während weitere Operationen (oder weitere gesamte Programme) ohne den Mehraufwand aufgrund einer Redundanzprüfung durchgeführt werden können.
  • Eine derartige anvisierte Fehlertoleranz weist gegenüber früheren Lösungen verschiedene Vorteile auf. Sie kann selektiv auf Systemprozesse angewendet werden, anstatt auf alle Systemprozesse angewendet zu werden. Es gibt einige Prozesse, die nicht wesentlich genug sind, um die Zuordnung derartiger Betriebsmittel zu rechtfertigen, oder die erwünschterweise so schnell wie möglich laufen sollen (ohne durch eine Redundanzprüfung verlangsamt zu werden). Ein Druck-Spooler-Programm z. B. ist wahrscheinlich nicht ausreichend wesentlich, um eine Fehlertoleranz zu benötigen. Gemäß einem Ausführungsbeispiel der Erfindung erlaubt eine anvisierte Fehlertoleranz es, daß ein derartiges nichtwesentliches Programm ohne die speziellen Redundanzprüf-Befehle geschrieben werden kann, so daß das nichtwesentliche Programm nicht unnötig wertvolle Systembetriebsmittel verbraucht. Andererseits können wesentliche Programme oder Prozesse, die eine Redundanzprüfung benötigen, unter Verwendung der speziellen Befehle geschrieben sein, um eine fehlertolerante Ausführung derselben zu liefern. Die Wahl bleibt dem Anwendungsprogrammierer überlassen.
  • 1 ist ein schematisches Diagramm eines CPU-Schaltungsaufbaus für eine anvisierte Fehlertoleranz gemäß einem exemplarischen Ausführungsbeispiel der Erfindung. Der CPU-Schaltungsaufbau umfaßt eine Abrufeinheit 102, einen Befehls-Cache 104, eine Befehlsdecodiereinheit 106, einen Register-Lade/Speicher-Schaltungsaufbau 108, eine Gleitkomma-Registerdatei 110, eine erste Gleitkomma-Einheit (FPU #1) 112, eine zweite Gleitkomma-Einheit (FPU #2) 114 und einen Hardware-Komparator und zugeordnete Flags 116.
  • Natürlich umfaßt die CPU weitere Komponenten und Verbindungen über die dargestellten hinaus. Die dargestellten Komponenten umfassen diejenigen, die zu der exemplarischen fehlertoleranten Operation gehören, die unten Bezug nehmend auf die 2A und 2B erläutert ist.
  • Gemäß einem Ausführungsbeispiel der Erfindung ist der Befehlsdecodierer-Schaltungsaufbau 106 konfiguriert, um eine fehlertolerante und eine nicht-fehlertolerante Version eines Befehls unterschiedlich voneinander zu decodieren. Der fehlertolerante Befehle kann durch einen ersten Opera tionscode (OP-Code) dargestellt werden, während die nicht-fehlertolerante Version des gleichen Befehls durch einen zweiten Operationscode dargestellt werden kann. Der CPU-Schaltungsaufbau ist konfiguriert, um die fehlertolerante Version des Befehls mit Redundanzprüfung auszuführen und die nicht-fehlertolerante Version des Befehls ohne Redundanzprüfung auszuführen.
  • Gemäß einem Ausführungsbeispiel können die Flags (siehe 116) ein erstes „Gültig"-Flag und ein zweites „Vergleichsergebnis"-Flag umfassen. Das Gültig-Flag kann verwendet werden, um die Gültigkeit eines gespeicherten Ergebnisses anzuzeigen. Das Vergleichsergebnis-Flag kann das Ergebnis eines Vergleichs anzeigen, der durch den zugeordneten Komparator durchgeführt wird.
  • 2A stellt eine exemplarische Befehlssequenz unter Verwendung einer fehlertoleranten Version eines Befehls gemäß einem Ausführungsbeispiel der Erfindung dar. Die exemplarische Befehlssequenz umfaßt einen fehlertoleranten Multiplikationsbefehl (FT_MULT). Weitere Beispiele umfassen einen fehlertoleranten Additionsbefehl (FT_ADD), weitere fehlertolerante arithmetische Befehle und fehlertolerante logische Befehle (FT_AND, FT_NAND, FT_OR, FT_XOR und dergleichen).
  • Die Sequenz in 2A beginnt durch ein Laden eines Operands x in ein erstes Register R1 und ein Laden eines Operands y in ein zweites Register R2. Nachdem die Register mit den Operanden beladen sind, wird die Multiplikationsoperation durchgeführt.
  • Bei einer normalen nicht-fehlertoleranten Multiplikation (MULT) wird der Inhalt von R1 und R2 direkt an eine Gleitkomma-Einheit gesandt, die ein Ergebnis erzeugt, das in einem dritten Register R3 gespeichert wird. Es wird davon ausgegangen, daß das Ergebnis in R3 gültig für die MULT-Operation ist.
  • Hier führen wir jedoch eine fehlertolerante Multiplikation (FT_MULT) aus. Die Operation FT_MULT ist langsamer und komplexer als die Operation MULT. Die spezifischen Schritte, die bei einem Ausführungsbeispiel eines Durchführens einer derartigen fehlertoleranten Operation beinhaltet sind, sind wie folgt in Bezugnahme auf 2B beschrieben.
  • 2B ist ein Flußdiagramm eines Verfahrens, das in einer CPU während einer Ausführung eines fehlertoleranten Befehls gemäß einem Ausführungsbeispiel der Erfindung durchgeführt wird. Der Prozeß beginnt mit einem Senden 202 des Inhalts des ersten und des zweiten Registers (R1 und R2) an eine erste Gleitkomma-Einheit (FPU #1) und an eine zweite Gleitkomma-Einheit (FPU #2). Wie in 2B gezeigt ist, kann dies aus Effizienzgründen in zwei parallelen Schritten (202-1 und 202-2) durchgeführt werden. Der Schaltungsaufbau kann z. B. konfiguriert sein, wie in 1 dargestellt ist, wobei der Inhalt von R1 und R2 aus der Registerdatei 110 parallel in sowohl die FPU #1 112 als auch die FPU #2 114 geladen wird.
  • Jede der FPUs #1 und #2 führt dann die bezeichnete Operation bezüglich der Operanden durch (204-1 bzw. 204-2). In dem Fall von FT_MULT ist die Operation eine Multiplikation der beiden Operanden. Die Ergebnisse der Operationen werden durch jede FPU an einen Komparator gesandt 206-1 und 206-2. Der Komparator weist vorzugsweise eine Hardware-Schaltung 116 auf, die entworfen ist, um schnell die beiden Ergebnisse zu vergleichen und zu bestimmen 208, ob dieselben übereinstimmen oder nicht.
  • Wenn die beiden Ergebnisse übereinstimmen, wird ein gültiges Ergebnis in einem dritten Register R3 gespeichert 210. Das Ergebnis kann als gültig angezeigt werden, indem ein Gültig-Flag gesetzt wird, das dem Komparator zugeordnet ist. (Eine Rücksetzung des Gültig-Flags würde ein ungültiges Ergebnis anzeigen.) Ein Herausfinden, daß die Ergebnis se übereinstimmen, verifiziert die Genauigkeit der durchgeführten Operation.
  • Andererseits wird, wenn die Ergebnisse nicht übereinstimmen, eine Bestimmung 212 hinsichtlich dessen durchgeführt, ob die maximalen N Male zum Wiederholen oder erneuten Durchführen der Operation erreicht wurden. Eine Zählervorrichtung kann verwendet werden, um die Wiederholungsmale zu verfolgen. Bei einer spezifischen Implementierung kann N dreimal sein. Alternativ kann N einmal, zweimal, viermal oder mehr betragen. Bei einem Ausführungsbeispiel kann die Zahl N ein Parameter des fehlertoleranten Befehls sein, derart, daß N auswählbar sein kann.
  • Wenn die maximalen N Male zum Wiederholen bereits durchgeführt wurden, kann eine Maschinenprüfung durchgeführt werden 214, um die sichtlich fehlerhafte Operation der CPU zu prüfen und/oder diagnostizieren. Eine Fehlernachricht kann als ein Ergebnis der Maschinenprüfung erzeugt werden.
  • Wenn die maximalen N Male zum Wiederholen nicht erreicht sind, kehrt der Prozeß schleifenmäßig zurück, derart, daß die FPUs die Operation erneut durchführen 204 und ihre Ergebnisse erneut an den Komparator senden 206. Die Bestimmung 208 hinsichtlich dessen wird erneut durchgeführt, ob die Ergebnisse übereinstimmen oder nicht. Wenn dieses Mal eine Übereinstimmung vorliegt, wird ein gültiges Ergebnis in R3 gespeichert 210. Wenn keine Übereinstimmung vorliegt, wird wieder eine Prüfung 212 durchgeführt, um zu sehen, ob die maximale Wiederholungsanzahl erreicht wurde. Wenn das Maximum ohne Übereinstimmung erreicht wurde, kann eine Maschinenprüfung durchgeführt werden 214. Andernfalls kehrt der Prozeß schleifenmäßig wieder zurück, um die Operation in den FPUs zu wiederholen.
  • Bei einem Ausführungsbeispiel wird ein Protokoll von Vergleichsfehlern behalten (d. h. wenn die Vergleichsergebnisse nicht übereinstimmen). Wenn z. B. eine erste Iteration der Operation den Vergleich nicht besteht, jedoch eine spätere Iteration durchkommt, können der eine oder die mehreren Vergleichsfehler selbst dann protokolliert werden, wenn keine Maschinenprüfung durchgeführt wurde. Das Protokollieren kann als ein zusätzlicher Schritt implementiert sein, nachdem eine Bestimmung 208 durchgeführt ist, daß die Ergebnisse nicht übereinstimmen. Das Protokollieren kann z. B. als ein zusätzlicher Schritt zwischen den Blöcken 208 und 212 in 2 durchgeführt werden.
  • 3 ist ein Diagramm, das zwei unterschiedliche Pegel einer anvisierten Fehlertoleranz gemäß einem Ausführungsbeispiel der Erfindung darstellt.
  • Eine erste Ebene einer Anvisierung befindet sich auf der Programmebene. Ein Ausführungsbeispiel der Erfindung ermöglicht es, daß ein Programm mit bestimmten fehlertoleranten (F-T) Aspekten oder ohne fehlertolerante Aspekte geschrieben werden kann. Ein Programm mit fehlertoleranten Aspekten ist als Programm A 302 dargestellt, während ein Programm ohne fehlertolerante Aspekte als Programm B 303 dargestellt ist. Das Programm A 302 umfaßt zumindest eine Routine 304, die fehlertolerante Versionen eines oder mehrerer Befehle verwendet. Andererseits umfaßt das Programm B 303 nur Routinen 306, die keine fehlertoleranten Versionen von Befehlen verwenden. Anders ausgedrückt erlaubt es ein Ausführungsbeispiel der Erfindung, daß ein Programm anvisiert werden kann, um eine Fehlertoleranz zu umfassen oder nicht. Programme ohne Fehlertoleranz sollten am schnellsten durchgeführt werden.
  • Eine zweite Ebene einer Anvisierung ist pro Routine oder Sequenz von Befehlen, oder sogar pro Befehl, innerhalb eines Programms. Es wird das Programm A 302 aus 3 betrachtet. Das Programm A 302 umfaßt einige Routinen 304, die anvisiert sein können, um fehlertolerante Befehle zu verwenden, und weitere Routinen 306, die keine fehlertoleranten Befehle verwenden. Die zur Fehlertoleranz anvisier ten Routinen 304 können in einem bestimmten Aspekt wesentlicher sein. Die Genauigkeit ihrer Berechnungen kann z. B. als wesentlich erachtet werden, so daß diese Berechnungen anvisiert sind, um unter Verwendung fehlertoleranter Befehle durchgeführt zu werden. Andererseits können die Routinen 306, die keine fehlertoleranten Befehle verwenden, hinsichtlich einer Berechnungsgenauigkeit weniger wesentlich sein.
  • Ausführungsbeispiele der vorliegenden Erfindung weisen verschiedene Vorteile gegenüber fehlertoleranten Rechentechniken des Stands der Technik auf. Ein Hardware- und/oder Software-Mehraufwand, der zur Bereitstellung einer Fehlertoleranz benötigt wird, kann unter Umständen reduziert werden. Dies wird dadurch durchgeführt, daß der Programmschreiber spezifische Befehle im Inneren eines Programms mit einer „Sicherheit einer Korrektheit" anvisieren kann. Die erforderliche Hardware ist reduziert, da dieses Schema nicht mehrere CPUs und keine zusätzliche zugeordnete Infrastruktur benötigt. Die Software-Ausführungszeiten werden relativ schnell gehalten, da die Hardware selbst die Redundanzprüfung auf einer anvisierten Basis durchführt.

Claims (21)

  1. Mikroprozessor zum anvisierten fehlertoleranten Rechnen, wobei der Mikroprozessor folgende Merkmale aufweist: einen Decodierschaltungsaufbau (106), der konfiguriert ist, um eine fehlertolerante Version eines Befehls und eine nicht-fehlertolerante Version des Befehls unterschiedlich voneinander zu decodieren; und einen Ausführungsschaltungsaufbau, der konfiguriert ist, um die fehlertolerante Version des Befehls mit Redundanzprüfung auszuführen und die nicht-fehlertolerante Version des Befehls ohne Redundanzprüfung auszuführen.
  2. Mikroprozessor gemäß Anspruch 1, bei dem der Ausführungsschaltungsaufbau folgende Merkmale aufweist: eine erste Verarbeitungseinheit, die konfiguriert ist, um Operandendaten zu empfangen, eine dem Befehl zugeordnete Operation auszuführen und ein erstes Ergebnis zu erzeugen; eine zweite Verarbeitungseinheit, die konfiguriert ist, um die Operandendaten zu empfangen, die Operation auszuführen und ein zweites Ergebnis zu erzeugen; und einen Komparator, der konfiguriert ist, um das erste und das zweite Ergebnis zu vergleichen.
  3. Mikroprozessor gemäß Anspruch 2, bei dem für die fehlertolerante Version des Befehls, wenn der Vergleich nicht übereinstimmt, die Ausführung durch die Verarbeitungseinheiten und der Vergleich von Ergebnissen durch den Komparator bis zu einem Maximum von N Malen wiederholt werden, bis eine Übereinstimmung auftritt.
  4. Mikroprozessor gemäß Anspruch 3, bei dem, wenn das erste und das zweite Ergebnis niemals übereinstimmen, eine Maschinenprüfung auf dem Mikroprozessor durchgeführt wird.
  5. Mikroprozessor gemäß einem der Ansprüche 2 bis 4, der ferner folgendes Merkmal aufweist: eine Registerdatei, die konfiguriert ist, um sowohl der ersten als auch der zweiten Verarbeitungseinheit Operandendaten bereitzustellen.
  6. Verfahren zum anvisierten fehlertoleranten Rechnen in einer zentralen Verarbeitungseinheit, wobei das Verfahren folgende Schritte aufweist: Decodieren eines ersten Operationscodes, der einer fehlertoleranten Version eines Befehls entspricht; Decodieren eines zweiten Operationscodes, der einer nicht-fehlertoleranten Version des Befehls entspricht; Ausführen des ersten Operationscodes mit Redundanzprüfung; und Ausführen des zweiten Operationscodes ohne Redundanzprüfung.
  7. Verfahren gemäß Anspruch 6, bei dem ein Satz mehrerer Befehle in einer fehlertoleranten und einer nicht-fehlertoleranten Version jedes Befehls in dem Satz bereitgestellt wird.
  8. Verfahren gemäß Anspruch 7, bei dem der Satz von Befehlen arithmetische Funktionen umfaßt.
  9. Verfahren gemäß Anspruch 7, bei dem der Satz von Befehlen logische Funktionen umfaßt.
  10. Verfahren gemäß einem der Ansprüche 6 bis 9, bei dem die Ausführung des ersten Operationscodes folgende Schritte aufweist: Bereitstellen von Operandendaten an eine erste Verarbeitungseinheit; Bereitstellen der Operandendaten an eine zweite Verarbeitungseinheit; Ausführen einer Operation bezüglich der Operandendaten durch die erste Verarbeitungseinheit, um ein erstes Ergebnis zu erzeugen; Ausführen der Operation bezüglich der Operandendaten durch die zweite Verarbeitungseinheit, um ein zweites Ergebnis zu erzeugen; und Vergleichen des ersten und des zweiten Ergebnisses.
  11. Verfahren gemäß Anspruch 10, das ferner, wenn das erste und das zweite Ergebnis nicht übereinstimmt, den Ausführungsschritt und den Vergleichsschritt wiederholt.
  12. Verfahren gemäß Anspruch 11, bei dem das Wiederholen bis zu einem Maximum von N Malen fortfährt, bis das erste und das zweite Ergebnis übereinstimmen.
  13. Verfahren gemäß Anspruch 12, das ferner, wenn das erste und das zweite Ergebnis während der N Wiederholungen niemals übereinstimmten, eine Durchführung einer Maschinenprüfung bezüglich der CPU aufweist.
  14. Rechenvorrichtung zum anvisierten fehlertoleranten Rechnen, wobei die Vorrichtung folgende Merkmale aufweist: eine Einrichtung zum Decodieren eines ersten Operationscodes, der einer fehlertoleranten Version eines Befehls entspricht, und eines zweiten Operationscodes, der einer nicht-fehlertoleranten Version des Befehls entspricht; eine redundante Einrichtung zum Ausführen des ersten Operationscodes; und eine nicht-redundante Einrichtung zum Ausführen des zweiten Operationscodes.
  15. Vorrichtung gemäß Anspruch 14, bei der die redundante Einrichtung folgende Merkmale aufweist: eine erste Verarbeitungseinheit, die konfiguriert ist, um Operandendaten zu empfangen, eine dem ersten Operationscode zugeordnete Operation auszuführen und ein erstes Ergebnis zu erzeugen; eine zweite Verarbeitungseinheit, die konfiguriert ist, um die Operandendaten zu empfangen, die Operation auszuführen und ein zweites Ergebnis zu erzeugen; und einen Komparator, der konfiguriert ist, um das erste und das zweite Ergebnis zu vergleichen.
  16. Computerprogrammprodukt, das ein computerverwendbares Medium aufweist, in dem ein computerlesbarer Code ausgeführt ist, wobei das Computerprogrammprodukt folgende Merkmale umfaßt: einen ersten Typ computerlesbarer Befehle, die mit Redundanzprüfung auszuführen sind; und einen zweiten Typ computerlesbarer Befehle, die nicht-redundant auszuführen sind.
  17. Computerprogrammprodukt gemäß Anspruch 16, bei dem der erste Typ computerlesbarer Befehle fehlertolerante arithmetische Befehle umfaßt.
  18. Computerprogrammprodukt gemäß Anspruch 17, bei dem der zweite Typ computerlesbarer Befehle nicht-fehlertolerante arithmetische Befehle umfaßt.
  19. Computerprogrammprodukt gemäß Anspruch 16, bei dem der erste Typ computerlesbarer Befehle fehlertolerante logische Funktionen umfaßt.
  20. Computerprogrammprodukt gemäß Anspruch 19, bei dem der zweite Typ computerlesbarer Befehle nicht-fehlertolerante Logikbefehle umfaßt.
  21. Verfahren gemäß Anspruch 11, das ferner, wenn das erste und das zweite Ergebnis nicht übereinstimmen, ein Protokollieren eines Vergleichsfehlers aufweist.
DE102004011450A 2003-07-18 2004-03-09 Anvisierte Fehlertoleranz durch spezielle CPU-Befehle Withdrawn DE102004011450A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/623,099 US7146530B2 (en) 2003-07-18 2003-07-18 Targeted fault tolerance by special CPU instructions
US10/623099 2003-07-18

Publications (1)

Publication Number Publication Date
DE102004011450A1 true DE102004011450A1 (de) 2005-02-17

Family

ID=34063303

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102004011450A Withdrawn DE102004011450A1 (de) 2003-07-18 2004-03-09 Anvisierte Fehlertoleranz durch spezielle CPU-Befehle

Country Status (3)

Country Link
US (1) US7146530B2 (de)
JP (1) JP2005038420A (de)
DE (1) DE102004011450A1 (de)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6625756B1 (en) * 1997-12-19 2003-09-23 Intel Corporation Replay mechanism for soft error recovery
US7213168B2 (en) * 2003-09-16 2007-05-01 Rockwell Automation Technologies, Inc. Safety controller providing for execution of standard and safety control programs
US7711898B2 (en) * 2003-12-18 2010-05-04 Intel Corporation Register alias table cache to map a logical register to a physical register
WO2007113346A1 (es) * 2006-03-31 2007-10-11 Intel Corporation Deteccion de errores transitorios mediante nueva ejecucion selectiva
US7444544B2 (en) * 2006-07-14 2008-10-28 International Business Machines Corporation Write filter cache method and apparatus for protecting the microprocessor core from soft errors
US7925923B1 (en) 2008-01-31 2011-04-12 Hewlett-Packard Development Company, L.P. Migrating a virtual machine in response to failure of an instruction to execute
US7941698B1 (en) * 2008-04-30 2011-05-10 Hewlett-Packard Development Company, L.P. Selective availability in processor systems
US8082425B2 (en) * 2009-04-29 2011-12-20 Advanced Micro Devices, Inc. Reliable execution using compare and transfer instruction on an SMT machine
US20110099439A1 (en) * 2009-10-23 2011-04-28 Infineon Technologies Ag Automatic diverse software generation for use in high integrity systems
US20110208948A1 (en) * 2010-02-23 2011-08-25 Infineon Technologies Ag Reading to and writing from peripherals with temporally separated redundant processor execution
CN102985839B (zh) * 2010-07-08 2016-08-10 皇家飞利浦电子股份有限公司 用于超高场mri的路由器和线圈阵列
US8516356B2 (en) 2010-07-20 2013-08-20 Infineon Technologies Ag Real-time error detection by inverse processing
US9015655B2 (en) 2012-10-19 2015-04-21 Northrop Grumman Systems Corporation Generating a diverse program
US9529654B2 (en) 2013-11-27 2016-12-27 Electronics And Telecommunications Research Institute Recoverable and fault-tolerant CPU core and control method thereof
KR102175403B1 (ko) 2014-07-21 2020-11-06 한국전자통신연구원 디지털 연산 회로의 기능 복구 장치 및 방법
KR101658828B1 (ko) 2015-03-23 2016-09-22 한국전자통신연구원 씨피유 코어의 기능복구를 위한 장치 및 방법
KR102162321B1 (ko) 2016-03-14 2020-10-06 한국전자통신연구원 프로세서 시스템 및 그것의 고장 검출 방법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2003338A1 (en) 1987-11-09 1990-06-09 Richard W. Cutts, Jr. Synchronization of fault-tolerant computer system having multiple processors
US5148432A (en) * 1988-11-14 1992-09-15 Array Technology Corporation Arrayed disk drive system and method
US5138708A (en) * 1989-08-03 1992-08-11 Unisys Corporation Digital processor using current state comparison for providing fault tolerance
WO1993009494A1 (en) * 1991-10-28 1993-05-13 Digital Equipment Corporation Fault-tolerant computer processing using a shadow virtual processor
JPH0773059A (ja) * 1993-03-02 1995-03-17 Tandem Comput Inc フォールトトレラント型コンピュータシステム
DE69435090T2 (de) 1993-12-01 2009-06-10 Marathon Technologies Corp., Stow Rechnersystem mit Steuereinheiten und Rechnerelementen
JP3971565B2 (ja) * 2000-11-06 2007-09-05 富士通株式会社 半導体装置及び半導体装置初期設定方法

Also Published As

Publication number Publication date
US7146530B2 (en) 2006-12-05
US20050015659A1 (en) 2005-01-20
JP2005038420A (ja) 2005-02-10

Similar Documents

Publication Publication Date Title
DE102004011450A1 (de) Anvisierte Fehlertoleranz durch spezielle CPU-Befehle
DE102010037457B4 (de) Verfahren zur Datenverarbeitung zum Bereitstellen eines Wertes zum Ermitteln, ob bei einer Ausführung eines Programms ein Fehler aufgetreten ist, Verfahren zur Datenverarbeitung zum Ermitteln, ob bei einer Ausführung eines Programms ein Fehler aufgetreten ist, Verfahren zum Erzeugen von Programm-Code, Datenverarbeitungsanordnungen zum Bereitstellen eines Wertes zum Ermitteln, ob bei einer Ausführung eines Programms ein Fehler aufgetreten ist, Datenverarbeitungsanordnungen zum Ermitteln, ob bei einer Ausführung eines Programms ein Fehler aufgetreten ist, und Datenverarbeitungsanordnungen zum Erzeugen von Programm-Code
EP1952239A1 (de) Vorrichtung und verfahren zum beheben von fehlern bei einem wenigstens zwei ausführungseinheiten mit registern aufweisenden system
DE60115976T2 (de) Rechnersystem und Interruptvorgang
DE10312264A1 (de) Verfahren und Vorrichtung zum Hervorrufen von Unterschieden bei mit Verriegelungsschritten versehenen Prozessoren
DE60206555T2 (de) Fehlererkennung von Austauschdaten
EP0104635A2 (de) Verfahren und Anordnung zum Prüfen eines digitalen Rechners
DE102014117971B4 (de) Verfahren zur Datenverarbeitung zum Ermitteln, ob bei einer Ausführung eines Programms ein Fehler aufgetreten ist, und Datenverarbeitungsanordnungen zum Erzeugen von Programm-Code
DE112017003350T5 (de) Speicherauslesebefehle, prozessoren, verfahren und systeme, die bei defekten daten keine ausnahme annehmen
DE102004034766A1 (de) Fehlererfassungsverfahren und System für Prozessoren, das verriegelungsschrittweise betriebene gleichzeitige Teilprozesse verwendet
DE102006005817A1 (de) Fehlererkennungsvorrichtung für einen Adressdecoder und Vorrichtung zur Fehlererkennung für einen Adressdecoder
DE102011011333B4 (de) Lesen in Peripheriegeräte und schreiben aus Peripheriegeräten mit zeitlich getrennter, redundanter Prozessorausführung
EP1955164A1 (de) Programmgesteuerte einheit und verfahren zum betreiben derselbigen
WO2005045665A1 (de) Verfahren und vorrichtung zur operandenverarbeitung in einer prozessoreinheit
WO2004092972A2 (de) Programmgesteuerte einheit und verfahren
DE69626263T2 (de) System zur Zuteilung mehrerer Befehle ohne Verzweigungsunterbrechung in einem Pipelineprozessor
DE102007040721B4 (de) Datenverarbeitungsanordnung, Verfahren zur Datenverarbeitung, Computerprogrammelement und Überprüfungsanordnung für einen Speicher
DE10085438B4 (de) Prozessor mit Wiederholarchitektur mit schnellen und langsamen Wiederholpfaden
DE102014114157B4 (de) Verfahren zur Datenverarbeitung zum Ermitteln, ob bei einer Ausführung eines Programms ein Fehler aufgetreten ist und Datenverarbeitungsanordnungen zum Erzeugen von Programm-Code
DE102013009364B4 (de) Verfahren und System zur Erkennung von latenten Fehlern in Mikrocontrollern
DE19524863B4 (de) Mikroprozessor mit eingebautem Abschnitt zur zyklischen Redundanzprüfung und Verfahren zum Ausführen von Operationen zur zyklischen Redundanzprüfung unter Verwendung von diesem
DE60310308T2 (de) Verfahren und Gerät zur Fehlertoleranz für temporäre Ergebnisse in einer zentralen Verarbeitungseinheit
DE102013210839B4 (de) Einschränken der Verarbeitung innerhalb eines Prozessors zum Erleichtern der Ausführung einer Transaktion
DE3433679A1 (de) Verfahren und anordnung zur sicherung von wichtigen informationen in speichereinheiten mit wahlweisem zugriff, insbesondere von steuerbits in als cache-speicher arbeitenden pufferspeichern einer datenverarbeitungsanlage
DE102004001651A1 (de) Verfahren und Prozessor zur automatischen Befehls-Betriebsartumschaltung unter Verwendung einer Paritätsüberprüfung

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8139 Disposal/non-payment of the annual fee