WO2007017393A2

WO2007017393A2 - Verfahren und vorrichtung zur abarbeitung von datenwörtern und/oder instruktionen

Info

Publication number: WO2007017393A2
Application number: PCT/EP2006/064719
Authority: WO
Inventors: Reinhard Weiberle; Bernd Mueller; Eberhard Boehl; Yorck Collani; Rainer Gmehlich
Original assignee: Robert Bosch Gmbh
Priority date: 2005-08-08
Filing date: 2006-07-27
Publication date: 2007-02-15
Also published as: WO2007017393A3; EP1917594A2; CN101243408A; US20090037705A1; DE102005037214A1

Abstract

Verfahren zur Abarbeitung von Datenwörtern und/oder Instruktionen, wobei bei der Abarbeitung zwischen mindestens zwei Betriebsmodi unterschieden wird und ein erster Betriebsmodus einem Vergleichsmodus und ein zweiter Betriebsmodus einem Performanzmodus entspricht, wobei im Vergleichsmodus eine Vergleichseinheit aktiviert ist und diese Vergleichseinheit im Performanzmodus deaktiviert ist, dadurch gekennzeichnet, dass die Vergleichseinheit für den Vergleichsmodus dann abhängig davon aktiviert wird, dass wenigstens zwei gleiche Datenwörter und/oder Instruktionen zur Abarbeitung kommen und die wenigstens gleichen Datenwörter und/oder Instruktionen jeweils durch ein Steuereinheit auf die wenigstens zwei Ausführungseinheiten verteilt werden.

Description

Verfahren und Vorrichtung zur Abarbeitung von Datenwörtern und/oder Instruktionen

Stand der Technik

Die Erfindung geht aus von einem Verfahren und einer Vorrichtung zur Unterscheidung zwi- sehen wenigstens zwei Betriebsmodi eines Mikroprozessors mit wenigstens zwei Ausführungseinheiten zur Abarbeitung von Programmsegmenten gemäß den Oberbegriffen der unabhängigen Ansprüche.

Transiente Fehler, ausgelöst durch Alpha-Teilchen oder kosmische Strahlung, werden zuneh- mend ein Problem für integrierte Schaltungen. Durch abnehmende Strukturbreiten, sinkende

Spannungen und höhere Taktfrequenzen nimmt die Wahrscheinlichkeit zu, dass eine, Ladungsänderung hervorgerufen durch ein Alpha-Teilchen oder kosmische Strahlung, einen logischen Wert in einer integrierten Schaltung verfälscht. Ein falsches Berechnungsresultat kann die Folge sein. In sicherheitsrelevanten Systemen müssen daher solche Fehler zuverlässig detdetiert wer- den.

Bei sicherheitsrelevanten Systemen, wie z.B. einem ABS-Regelsystem in einem Kraftfahrzeug, in denen Fehlfunktionen der Elektronik sicher detektiert werden müssen, werden gerade bei den entsprechenden Steuereinrichtungen solcher Systeme üblicherweise Redundanzen zur Fehlerer- kennung vorgesehen. So ist beispielsweise in bekannten ABS-Systemen jeweils der komplette

Mikrocontroller dupliziert, wobei die gesamten ABS-Funktionen redundant berechnet und auf Übereinstimmung geprüft werden. Tritt eine Diskrepanz der Ergebnisse auf, so wird das ABS- System abgeschaltet. Solche Prozessoreinheiten mit wenigstens zwei integrierten Cores sind auch als Dual-Core oder Multi-Core Architekturen bekannt. Die verschiedenen Cores fiihren redundant und taktsynchron das gleiche Programmsegment aus, die Ergebnisse der beiden Cores werden verglichen, und ein Fehler wird dann bei dem Vergleich auf Übereinstimmung erkannt werden. Im Folgenden wird diese Konfiguration als Vergleichsmodus bezeichnet.

Dual-Core oder Multi-Core Architekturen werden in anderen Anwendungen auch zur Leistungssteigerung, also zu einer Performanz-Steigerung eingesetzt. Beide Cores führen unterschiedliche Programmsegmente aus, wodurch sich eine Leistungssteigerung erzielen lässt, wes- halb diese Konfiguration als Leistungsmodus oder Performanzmodus bezeichnet wird. Dieses

System wird bei gleichen Cores auch als ein symmetrisches Multiprozessorsystem (SMP) bezeichnet.

Eine Erweiterung dieser Systeme ist eine Umschaltung durch Software zwischen diesen beiden Modi mittel eines Zugriffs auf eine spezielle Adresse und spezialisierter Hardware-

Vorrichtungen. Im Vergleichsmodus werden die Ausgangsignale der Cores miteinander verglichen. Im Performanzmodus arbeiten die beiden Cores als ein symmetrisches Mehrprozessorsystem (SMP) und führen unterschiedliche Programme, Programmsegmente oder Befehle aus.

Vorteile der Erfindung

Ein Vorteil dieser Erfindung besteht darin, dass keine unterschiedlichen Prozessormodi berücksichtigt werden müssen, zwischen denen je nach Architektur der Ausführungseinheiten zeitaufwendig umgeschaltet werden muss.

Aufgabe der Erfindung ist es eine Flexibilität zwischen diesen verschiedenen Wirkungsweisen der zwei Modi zu erreichen und dies insbesondere ohne eine explizite Umschaltung der Modi zu erreichen. Es soll nur noch die Vergleichseinheit aktiviert oder deaktiviert werden. Diese Aktivierung oder Deaktivierung soll nicht explizit durch eine Instruktion oder Instruktionssequenz erfolgen, sondern nur noch implizit stattfinden.

Ein weiterer Vorteil besteht in dem Verzicht auf explizite Umschaltbefehle, da hierfür sonst Bits bzw. Bitkombinationen im Instruktionswort der Ausführungseinheit reserviert werden müssten. Weiterhin ist vorteilhaft, dass die Möglichkeiten bestehen, einerseits ohne hardwarenahe Software zwischen Vergleichmodus und Performanzmodus umschalten zu können und andererseits auch nur fiir einzelne Instruktionen den Vergleich durchfuhren zu lassen, anstatt den gesamten Prozessor im Modus umzuschalten.

Weiterhin besteht ein Vorteil darin, dass die parallelen Ausfuhrungseinheiten mit einem festen Taktversatz arbeiten können und dadurch insbesondere im Vergleichsmodus der Einfluss von global wirkenden Fehlerereignissen kurzer Dauer auf die zu vergleichenden Daten verringert wird.

Vorteilhaft wird die Vergleichseinheit für den Vergleichsmodus abhängig davon aktiviert, dass wenigstens zwei gleiche Datenwörter und/oder Instruktionen zur Abarbeitung kommen und die wenigstens gleichen Datenwörter und/oder Instruktionen jeweils durch ein Steuereinheit auf die wenigstens zwei Ausfuhrungseinheiten verteilt werden. Vorteilhaft kommen die Datenwörter und/oder Instruktionen taktgleich oder mit festem Taktversatz zur Abarbeitung.

Zweckmäßigerweise sind die Datenwörter und/oder Instruktionen in einem Befehlswort als Teildatenwörter und/oder Teilinstruktionen enthalten. Vorteilhaft sind die Datenwörter und/oder Instruktionen im Programmablauf nacheinander angeordnet. Vorteilhaft wird abhängig von der Anzahl der gleichen auf einander folgenden Datenwörter und /oder Instrukti- onen, diese auf eine entsprechende Anzahl von Ausführungseinheiten verteilt. Zweckmäßigerweise wird die Vergleichseinheit deaktiviert, wenn zwei aufeinander folgende Datenwörter und/oder Instruktionen, die gleichzeitig oder mit dem festen Taktversatz zueinander in den mindestens zwei Ausführungseinheiten ausgeführt würden nicht übereinstimmen. Vorteilhaft werden die zu vergleichenden Daten und Instruktionen durch eine vorgebbare Position im Speicher vorgegeben. Vorteilhaft ist eine Vorrichtung zur Abarbeitung von Datenwörtern und/oder Instruktionen enthalten, wobei bei der Abarbeitung zwischen mindestens zwei Betriebsmodi unterschieden wird und ein erster Betriebsmodus einem Vergleichsmodus und ein zweiter Betriebsmodus einem Performanzmodus entspricht, mit einer Vergleichseinheit, welche derart ausgebildet ist, dass diese im Vergleichsmodus aktiviert ist und im Performaremo- dus deaktiviert ist, dadurch gekennzeichnet, dass Mittel enthalten sind, die derart ausgebildet sind, dass die Vergleichseinheit für den Vergleichsmodus dann abhängig davon aktiviert wird, dass wenigstens zwei gleiche Datenwörter und/oder Instruktionen nacheinander zur Abarbeitung kommen und die wenigstens gleichen Datenwörter und/oder Instruktionen jeweils auf die wenigstens zwei Ausführungseinheiten verteilt werden. Weitere Vorteile und vorteilhafte Ausgestaltungen ergeben sich aus den Merkmalen der Ansprüche sowie der Beschreibung.

Figuren

Figur 1 zeigt den schematischen Aufbau eines superskalaren Rechners.

Figur 2 zeigt eine Möglichkeit der Implementierung des Aufbaus einer Dekodierein- heit C220 aus C200 für eine superskalare Ausführungseinheit ohne VLIW

Architektur.

Figur 3 zeigt eine mögliche Implementierung der Dekodiereinheit C220 aus C200 für eine VLIW Architektur.

In Figur 4 ist ein VLIW Prozessor mit Pipelines dargestellt.

Beschreibung der Ausführungsbeispiele

Manche Einheiten in den Figuren besitzt dieselbe Nummer sind aber zusätzlich mit a oder b gekennzeichnet. Wird mit der Nummer ohne den Zusatz a oder b referenzierl, so ist eine der vorhandenen Einheiten aber keine spezielle Instanz gemeint. Wird nur eine bestimmte Instanz einer Einheit referenziert wird immer die Kennung a oder b der Nummer nachgestellt.

Eine Ausführungseinheit kann im Folgenden sowohl einen Prozessor/Core/CPU, als auch eine

FPU (Floating Point Unit), DSP (Digitaler Signalprozessor), Coprozessor oder ALU (Arithmetic logical Unit) bezeichnen.

Ein Prozessorcore besteht einerseits aus Speicherelementen (z.B. Cache-Speicher, Register) und aus Logikelementen (z.B. die arithmetische logische Einheit (ALU)). Da Speicherelemente mit

Prüfcodes (Parity oder ECC) effektiv überwacht werden können, besteht ein weiterer Überwachungsansatz in der alleinigen Verdopplung der Logik eines Cores. In einer Ausführungsform ist der Aufbau der Logik eine Cores als eine Pipeline. Für die vorliegende Beschreibung besteht diese Pipeline ihrerseits aus Teilausführungseinheiten (Pipelinestufen), die Befehle der schritt- weise bearbeiten. Steuerregister zur Ansteuerung einer Verarbeitungslogik und die angesteuerte Verarbeitungslogiklogik selbst werden zu einer Pipelinestufe zusammengefasst. Eine dieser Pipelinestufen wird EXECUTE Einheit genannt, und führt die eigentliche arithmetische/logische Operation des Befehls aus. Wird die Pipeline einer Ausführungseinheit verdoppelt und werden die Befehle des auszuführenden Programmsegments an beide Pipelines weitergegeben, so werden zur Fehlerentdeckung die Resultate an den Ausgängen der so genannten EXECUTE Einheit verglichen.

Im Gegensatz dazu wird bei Prozessorcores eine Verdopplung von Teilstufen der Pipeline zur Performanzsteigerung verwendet. Dazu werden zwei aufeinander folgende Programmbefehle unter Berücksichtigung von gegenseitigen Abhängigkeiten gleichzeitig auf jeweils einer Pipeline ausgeführt. In diesem Fall spricht man von einem superskalaren Mikroprozessor.

Wie die Pipelines gleichzeitig mit Befehlen versorgt werden, um diese parallel zu bearbeiten, hängt von der jeweiligen Architektur ab. Eine Möglichkeit besteht darin, die Befehle für die Pipelines, die parallel bearbeitet werden, in einem großen Befehlswort zusammenzufassen. In diesem Fall spricht man von einer VLIW (Very Large Instruction Word) Architektur. Eine weitere Möglichkeit ist, dass die Ausführungseinheit aufeinander folgende Befehle aus dem Speicher lädt und diese unter Berücksichtigung der Abhängigkeiten auf die zur Verfügung stehenden H- pelines verteilt.

Eine Erweiterung dieser Systeme ist der Einbau einer Umschalteinheit, die je nach Anwendungszweck das System in den Vergleichsmodus oder in den Performanzmodus schaltet. Im Vergleichsmodus werden die Ausgangsignale der Ausführungseinheiten bzw. die Ausgangssg- nale der EXECUTE Stufen der Pipeline miteinander verglichen. Bei einer Differenz wird ein

Fehlersignal ausgegeben. Im Performanzmodus arbeiten die beide Ausführungseinheiten als ein symmetrisches Mehrprozessorsystem (SMP) bzw. die Pipelines einer superskalaren Mikroprozessors arbeiten unterschiedliche Befehle ab. Die Vergleichseinheit ist im diesem Modus nicht aktiv. Dieser Erweiterung liegt die Annahme zugrunde, dass nicht alle Programmsegmente s- cherheitskritisch sind und für diese die vorhandenen Komponenten nicht zur Fehlerentdeckung sondern zur Performanzsteigerung eingesetzt werden können.

Zwischen diesen beiden Modi kann, über Software gesteuert, dynamisch im Betrieb umgeschaltet werden. Bei der hier beschriebenen Erfindung wird eine Ausfiihrungseinheit mit zwei oder mehreren Execute Einheiten und einer Vergleichseinheit verwendet. Die Vergleichseinheit wird dadurch aktiviert, dass ein Befehl mehrmals aufeinander folgend identisch im Speicher codiert ist. Beide Befehlsworte werden parallel ausgeführt, indem sie durch die Ausführungseinheit auf verschiedenen Pipelines verteilt werden und deren Ergebnisse verglichen werden. Besitzt die Ausführungseinheit eine VLIW Architektur so wird die Vergleichseinheit dadurch aktiviert, dass mehrere identische Teilbefehle in einem Befehlswort existieren. Sind die Instruktionen durch die EXECUTE Stufe der Pipeline verarbeitet worden, werden die Ausgangsignale der Stufen mit- einander verglichen. Findet ein Vergleich der Ausgangssignale der EXECUTE Stufen statt, ist dies mit dem Vergleichsmodus der im Stand der Technik beschrieben Architekturen vergleichbar. Findet kein Vergleich statt und beide Pipelines verarbeiten unterschiedliche Instruktionen (bzw. Teilinstruktionen) so ist dies mit dem Performanzmodus der im Stand der Technik beschriebenen Architekturen vergleichbar.

Die vorliegende Beschreibung zeigt zwei Ausführungsformen der Erfindung.

Figur 1 zeigt schematisch einen möglichen Aufbau einer Ausführungseinheit C200 welche zwei Pipelines C230a, C230b besitzt. Die Einheit C210 lädt die Instruktionswörter und reicht diese an die Decodiereinheit C220 weiter. In dieser Stufe werden die Instruktionen dekodiert und für die weitere Verarbeitung in einer Warteschlange zwischengepuffert (siehe Figur 2 C220a). Aus dieser Warteschlange werden die gepufferten Befehle entnommen und auf die beiden Pipelines C230a und C230b verteilt. Innerhalb der Pipelines befindet sich jeweils eine EXECUTE Stufe C240a und C240b. Diese Stufen führen die eigentliche arithmetische oder logische Operation eines Befehls durch. Die Ergebnisse aus den Stufen C240a und C240b werden in C260 zusammengeführt, gemäß der für die Einheit C200 zu Grunde liegenden Ausführungssemantik sortiert und abgespeichert. Neben den Einheiten C240a und C240b können die Pipelines C230a,C230b noch weitere Verarbeitungseinheiten (Stufen) unterteilt sein. Durch die Einheit C250 können die Ausgangssignale der Einheiten C240a und C240b miteinander verglichen werden. Die Eh- heit C250 erzeugt ein Fehlersignale, wenn sich die Ausgangssignale von C240a und C240b von einander unterscheiden. Damit der Vergleich in C250 nur für die Ergebnisse solcher Instruktionen durchgeführt wird, die identisch sind, ist es notwendig, dass C220 die Vergleichseinheit C250 nur dann aktiviert, wenn zwei identische Instruktionen vorliegen. Die Deaktivierung kann auf verschiedene Weisen realisiert werden. Dazu kann ein Vergleich durch die Einheit C250 wird nicht durchgeführt werden, indem die Einheit selbst inaktiv ist oder durch geeignete Signale inaktiv geschaltet wird. Weiterhin kann die Inaktivität dadurch erreicht werden, dass keine Signale zum Vergleich an die Einheit C250 angelegt werden. In einer weiteren Möglichkeit findet zwar ein Vergleich durch die Einheit C250 statt, das Ergebnis wird aber ignoriert.

Liegt keine VLIW Architektur vor, so beschreibt die in Figur 2 dargestellte Einheit C220a eine mögliche Implementierung der Einheit C220 näher. Instruktionen, die von der Einheit C221 dekodiert worden sind, werden in einer Warteschlange C222 zwischengespeichert. Diese Warteschlange ist in Form einer FIFO (First In First Out) realisiert, so dass Befehle in der Reihenfol- ge an die weiteren Pipelinestufen weitergegeben werden, wie sie in die Warteschlange eingestellt wurden. C223(l) und C223(2) bezeichnen daher zu einem gegebenen Zeitpunkt die beiden Instruktionen, die als nächstes an die nachfolgenden Pipelines C230a, C230b weitergegeben werden müssen. Entdeckt die Einheit C220a über die Vergleichseinheit C224, dass zwei identische Instruktionen C223(l) und C223(2) in der Wartenschlange C222 aufeinander folgen, wer- den beide Instruktionen gleichzeitig an die jeweilige Pipeline C230a und C230b weitergeben und die Vergleichseinheit C250 für den Takt, an dem das Ergebnis an den Ausgängen von C240a und C240b anliegt aktiviert. Die Einheit C225 stellt sicher, dass die Vergleichseinheit im richtigen Takt aktiviert wird. Ist die Instruktion C223(l) durch C240a und Instruktion C223(2) durch C240b ausgeführt worden, werden die Ausgänge von C240a und C240b durch C250 mi- einander verglichen. Um den Hardareaufwand zur Erkennung gleicher Instruktionen oder Daten möglichst gering zu halten sollte gewährleistet sein, dass sie als Paar unmittelbar aufeinander folgen und der erste Teil dieses Paares immer an einer ungeraden Position steht, wenn in C230a immer die Elemente aus der ungeraden Position und in C230b immer die Elemente der darauf folgenden geraden Position verarbeitet werden. Diese Platzierung kann durch Vorgaben an den Übersetzer gelöst werden.

Liegt eine VLIW- Architektur vor so beschreibt die in Figur 3 dargestellte Einheit C320 eine weitere Ausführungsform der Einheit C220 der Erfindung. Hier bilden zwei Teilinstruktionen ein Befehlswort. Bei einer VLIW- Architektur werden die dekodierten Instruktionen ebenfalls in einer Warteschlange C322 in Form eines FIFO gespeichert. Hier muss die Einheit C320 nicht auf zwei identische aufeinander folgende Instruktionen in der Warteschlange über die Einheit C324 prüfen, sondern, ob sich zwei identisch Teilinstruktionen C323a(l) und C323b(l) in einem Instruktionswort befinden. Ist dies der Fall, dann wird die Vergleichseinheit C350 über C324 für den Takt, an dem das Ergebnis den Ausgängen der EXECUTE Stufen C340a und C340b anliegt aktiviert. Die Einheit C325 stellt sicher, dass die Vergleichseinheit im richtigen Takt εk- tiviert wird. Unabhängig davon, ob beide Teilinstruktionen identisch sind oder nicht, werden die beiden Teilinstruktionen C323a(l) und C323b(l) von der Einheit C320 auf die beiden Pipelinestufen C330a und C330b verteilt und dort parallel berechnet.

Über diesen Mechanismus kann flexibel festgelegt werden, ob das Ergebnis einer Instruktion verglichen werden soll oder nicht, ohne das bestimmte Instruktionen oder Instruktionssequenzen für eine Umschaltung reserviert werden müssen. Ob ein Vergleich stattfindet oder nicht hängt von keinem Modus der Ausführungseinheit ab.

Die hier beschriebene Erfindung lässt sich auch auf Ausführungseinheiten mit o (o > 2) Pipel- nes verwenden. Es werden beim Auftreten von m (p <= o) im Programmablauf nacheinander angeordneten identischen Befehlen oder identischen Teilinstruktionen in einem Instruktionswort das Ergebnis analog zu dem oben beschriebenen Verfahren verglichen. Dabei kann je nach Inp- lementierung das m fest oder auch während des Programmablaufes variable sein. Statt eines

Vergleiches kann auch eine Voting vorgenommen werden. Die Einheiten C224,C250 bzw. C324,C350 für einen VLIW Prozessor müssen dann auf diese größere Anzahl von Pipelines an- gepasst werden. Entsprechend angepasste Einheiten sind dann mit einer entsprechenden Anzahl von Eingängen zum Vergleich der Instruktionen/Teilinstruktionen und der Ausgabesignale der einzelnen EXECUTE Stufen.

Für einen VLIW Prozessor mit o Pipelines (o > 2) ist eine beispielhafte Implementierung in Figur 4 dargestellt. So beschreibt die in Figur 4 gezeigte Einheit C420 eine alternativ mögliche Implementierung der Einheit C220 der Erfindung. Hier bilden o Teilinstruktionen ein Befehb- wort, das von C421 dekodiert in einer Warteschlange C422 in Form eines FIFO für Einträge mit jeweils der gesamten Breite der o Teilinstruktionen gespeichert wird. Existieren o Teilinstruktionen und n Einträge in der Warteschlange, dann bezeichnet C423(a,b) die a-te dekodierte Teilinstruktion an der b-ten Position in der Warteschlage (a=l ...o und b=l ...n). Die Einheit C420 prüft ob sich p identisch Teilinstruktionen C423(a,l) (a=l ...o) in einem Instruktionswort befin- den. Ist dies der Fall, dann wird die Vergleichseinheit C450 über C424 für den Takt, an dem das

Ergebnis den Ausgängen der entsprechenden EXECUTE Stufen für die identischen Teilinstruktionen anliegt aktiviert. Die Einheit C425 stellt sicher, dass die Vergleichseinheit im richtigen Takt aktiviert wird. Unabhängig davon, ob die p Teilinstruktionen identisch sind oder nicht, werden die n Teilinstruktionen C423(l,l) bis C423(o,l) von der Einheit C420 auf die beiden Pi- pelinestufen C430(l) und C430(o) verteilt und dort parallel berechnet. C430(a) bezeichnet hierbei die a-te Pipeline, die die a-te Teilinstruktion bearbeitet.

Bei der parallelen Abarbeitung von Daten und Befehlen in zwei oder mehreren Ausführungsein- heiten kann es vorteilhaft sein, diese Ausfuhrungseinheiten nicht taktgenau arbeiten zu lassen, sondern mit einem festen Taktversatz zueinander zu betreiben. Dieser Taktversatz ist mögl- cherweise 0,1, 2, 3,... Takte und kann Vorteilhafterweise noch um jeweils einen halben Takt zusätzlich verzögert sein. Das hat den Vorteil insbesondere bei der Arbeitsweise im Vergleichsmodus, dass global wirkende Fehlereinflüsse von kurzer Dauer sich nicht gleichartig auf die vσ- schiedenen Ausführungseinheiten und die damit erzeugten Ergebnisse auswirken können.

Claims

Patentansprüche

1. Verfahren zur Abarbeitung von Datenwörtern und/oder Instruktionen, wobei bei der Abarbeitung zwischen mindestens zwei Betriebsmodi unterschieden wird und ein erster Betriebsmodus einem Vergleichsmodus und ein zweiter Betriebsmodus einem Performanzmodus entspricht, wobei im Vergleichsmodus eine Vergleichseinheit aktiviert ist und diese Vergleichseinheit im Performanzmodus deaktiviert ist, dadurch gekennzeichnet, dass die Vergleichseinheit für den Vergleichsmodus abhängig davon aktiviert wird, dass wenigstens zwei gleiche Datenwörter und/oder Instruktionen zur Abarbeitung kommen und die wenigstens gleichen Datenwörter und/oder Instruktio- nen jeweils durch ein Steuereinheit auf die wenigstens zwei Ausführungseinheiten verteilt werden.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Datenwörter und/oder Instruktionen taktgleich oder mit festem Taktversatz zur Abarbeitung kommen.

3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Datenwörter und/oder Instruktionen in einem Befehlswort als Teildatenwörter und/oder Teilinstruktionen enthalten sind.

4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Datenwörter und/oder

Instruktionen im Programmablauf nacheinander angeordnet sind.

5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass abhängig von der Anzahl der gleichen auf einander folgenden Datenwörter und /oder Instruktionen, diese auf eine entsprechende Anzahl von Ausführungseinheiten verteilt wird.

6. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass die Vergleichseinheit deaktiviert wird, wenn zwei aufeinander folgende Datenwörter und/oder Instruktionen, die gleichzeitig oder mit dem festen Taktversatz zueinander in den mindestens zwei Ausfiihrungseinheiten ausgeführt würden nicht übereinstimmen

7. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die zu vergleichenden Da- ten und Instruktionen durch eine vorgebbare Position im Speicher vorgegeben werden.

8. Vorrichtung zur Abarbeitung von Datenwörtern und/oder Instruktionen, wobei bei der Abarbeitung zwischen mindestens zwei Betriebsmodi unterschieden wird und ein erster Betriebsmodus einem Vergleichsmodus und ein zweiter Betriebsmodus einem

Performanzmodus entspricht, mit einer Vergleichseinheit, welche derart ausgebildet ist, dass diese im Vergleichsmodus aktiviert ist und im Performanzmodus deaktiviert ist, dadurch gekennzeichnet, dass Mittel enthalten sind, die derart ausgebildet sind, dass die Vergleichseinheit für den Vergleichsmodus dann abhängig davon aktiviert wird, dass wenigstens zwei gleiche Datenwörter und/oder Instruktionen nacheinander zur Abarbeitung kommen und die wenigstens gleichen Datenwörter und/oder Instπk- tionen jeweils auf die wenigstens zwei Ausführungseinheiten verteilt werden.