DE2048473C3

DE2048473C3 - Mit einem Hauptdatenrechner verbundener Fehlerdatenrechner geringerer Leistungsfähigkeit

Info

Publication number: DE2048473C3
Application number: DE19702048473
Authority: DE
Inventors: Edwin Dr. 7030 Böblingen; Skuin Petar Dipl.-Ing. 7031 Magstadt; Knauft Günter 7030 Böblingen; Hajdu Johann 7031 Holzgerlingen Vogt
Original assignee: IBM Deutschland GmbH
Current assignee: IBM Deutschland GmbH
Filing date: 1970-10-02
Publication date: 1976-02-26

Description

tion oder Operation errechnet werden;; es muß also einMaschinenstop vorgenommen werden. Das System bleibt dann so lange stillgesetzt, bis das Servicepersonal einen Austausch der schadhaften Systemkomponenten vorgenommen hat.

ν Es ergibt sich also hierbei der Nachteil, daß wert-Volle Maschinenzeit verlorengeht, was besonders bei der Durchführung dringlicher Arbeiten störend ist.

Zur Beseitigung einfacher Fehler in einem Datenverarbeitungssystem ist es bekannt (vgl. IBIvI Technical Disclosure Bulletin, Vol. 11, Nr. 5, Oktober 1968, S. 515), für die Addierer, Multiplizierer, Modifizierer, Verschiebeeinheiten und dergleichen Befehlsausführungselemente jeweils ein Ausführunnselement der genannten Art redundant vorzusehen, so daß dieses zusätzlich vorhandene Ausführungselement im Fehlerfalle eines Ausführungselementes der eigenen Art, dessen Funktion gegebenenfalls mit geringerer Leistungsfähigkeit übernehmen kann.

Von Nachteil ist bei dieser Art derFeltilerbehebung, daß die redundanten Ausfuhrungselemente Bestandteil des Rechners sind und sie deshalb, wie dieser, den gleichen Störungssituationen unterworfen sind. Außerdem läßt sich mit dieser Art der Fehierbehebung keine Fehlerprotokollierung durchführen, die besonders wichtig für das Erkennen ernsthafterer zukünftiger Fehler in der Maschine ist, denen beispielsweise durch eine prophylaktische Wartungsarbe't zuvorgekommen werden kann.

Da es Anwendungsfälle für elektronische Datenverarbeitungssysteme gibt, in denen eine Unterbrechung in keinem Fall auftreten darf, ist auch schon ein Datenverarbeitungssystem bekanntgeworden, das aus zwei synchronisierten Datenverarbeitungseinheiten besteht, die die gleiche Arbeitsfunktionen mit den Eingangsdaten durchführen, wobei jede Verarbeirungseinheit eine Vielzahl von Datenquellen enthält, die einer Vielzahl von Datenquellen in der anderen Verarbeitungseinheit entsprechen (vgl. deutsche Auslegeschrift 12 80 593). Die beiden Datenveriirbeitungseinheiten dieses Systems sind hierbei so geschaltet, daß sie sich gegenseitig selbst kontrollieren und im Fehlerfalle die fehlerhaft arbeitende Datenverarbeitungseinheit vom System abschalten.

Dieses System gestattet bei der hohen Zuverlässigkeit heutiger Datenverarbeitungssysteme einen weitgehend unterbrechungsfreien Betrieb. Von der Kostenbetrachtung her ist aber ein solches E'atenverarbeitungssystem sehr unwirtschaftlich, da es. für die Ausführung der Aufgaben etwa den doppellten Aufwand benötigt.

Zu diesem Gebiet der duplizierten D'atenverarbeitungssysteme zählt auch eine Datenverarbeitungsanlage, die in »Automatic Control«, Dezember 1959, S. 46 bis 52 beschrieben ist. Danach wird dem Hauptprozessor ein Stand-by-Prozessor gleicher Struktur zugeordnet, der im Fehlerfall die Funktion des defekten Hauptprozessor übernimmt. Dabei setzen die eigenen Prüfschaltungen des Hauptprozessors eine Anzeige, die von dem Stand-by-Prozessor abgefragt wird.

Von Nachteil ist auch hier, wie bei dem zuvor erwähnten Datenverarbeitungssystem, nicht nur der hohe Aufwand für den kompletten zweiten Prozessor, sondern auch der Mangel an Fehlertransparenz, da keine Identifizierung der individuellen Prüfschaltungen im Hauptprozessor, die eine Beurteilung des Fehlers zuließe, vorgenommen wird.

Die Aufgabe; der vorliegenden Erfindung besteh deshalb darin, einmal die bisher üblichen hoh^i Kosten für den Fehlerdatenrechner zu verringern um zum anderen seine Fehlerdiagnosemöglichkeitec zi

s erhöhen, so daß nicht nur ein weitgehend unter brechuugsireier Betrieb des Datcnvörarbeiiüügs systems gewährleistet .ist, sondern auch durch verbesserte Diagnosemöglichkeiten zukünftige ernsthafte Fehlersituationen frühzeitig erkannt und beseitig

ίο werden können.

Gelöst wird diese Aufgabe durch die in den Hauptanspruch angegebenen Merkmale.

Weitere vorteilhafte Ausgestaltungen und Weiterbildungen des Gegenstandes der Erfindung sind dec Unteranspriichen zu entnehmen.

Die Vorteile, die das elektronische Datenverarbeitungssystem nach der vorliegenden Erfindung gegenüber bekannten Datenverarbeitungsanlagen besitzt, liegen einmal in der besonders wirtschaftlichen Lösung einer Fehlersituation, die eine Betriebsunterbrechung des Systems weitgehend vermeidet. Andererseits wird durch die Abspeicherung der Fehlerdaten für eine zeitversetzte Diagnose schon sehr frühzeitig eine zukünftige ernsthafte Fehlersituation erkannt, die möglicherweise zu einem Totalzusammenbruch des System? führen könnte, was insbesondere bei der Durchführung von Realzeitaufgaben schwerwiegende Folgen haben könnte.

Im folgenden wird ein Ausführungsbeispiel der Erfindung an Hand von Zeichnungen näher beschrieben. Es zeigt

Fig. 1 ein Blockschaltbild des aus Haupt- und Fehlerverarbeitungssystem bestehenden Datenverarbeitungssystems gemäß dem Ausführungsbeispiel, F i g. 2 ein Arbeitsablaufschema dss Datenverarbeitungssystems nach Fig. 1,

Fig. 3A bis 5B Darstellungen des Datenflusses und der Steuerungen des Datenverarbeitungssystems nach F i g. 1 und

F i g. 6 ein Diagramm zur Darstellung der Arbeitszyklen des Datenverarbeitungssystems nach Fig. 1 bei einem aufgetretenen Fehler.

Allgemeine Beschreibung

F i g. 1 zeigt ein elektronisches Datenverarbeitungssystem EDV, das aus einem Hauptverarbeitungssystem (HVS)I, das auch die Ein/Ausgabekanäle und die Ein/Ausgabegeräte enthält und aus einem Fehlerverarbeitungssystem (FVS)I besteht. An das Fehlerverarbeitungssystem 2 ist ein PJattenspeicher (PSP) 3 angeschlossen, der unter anderem das Fehlerprogramm und freie Speicherbereiche für das spätere Abspei-

ehern von Fehlerdaten enthält. Hauptverarbeitungssystem 1 und Fehlerverarbeitungssystem 2 sind über eine Adressensammelleitung AS, eine Steuersammelleitung CS und eine Daiensammelleitung DS miteinander verbunden. Die Sammelleitung DS ist hierbei als Ringleitung ausgebildet. Ferner sind besondere Schaltkreise für die Anpassung der beiden Systeme vorgesehen, auf die später ausführlich eingegangen werden wird.

Wie bereits erwähnt wurde, handelt es sich bei den beiden Systemen 1 und 2 nicht um identische Einheiten, sondern um zwei verschiedene und durchaus selbständige Einheiten. Die genannten besonderen Schaltkreise erlauben dem FehlerverarbeitiinoKsvstpm

im Fehlerfalle des Hauptverarbeitungssystems in des- stellt sind, die jeweils die in bestimmten Registern 38 sen Funktion einzugreifen und das richtige Teilergeb- und 39 und die in einer Funktionseinheit 41 befindnis oder Ergebnis zu errechnen und in das Hauptver- liehe Information auf korrekte Parität überprüfen, arbeitungssystem zurückzubringen. Danach wird das Wie die Fig. 1, 3A und 3B zeigen, ist das Fehler-

Hauptverarbeitungssystem 1 erneut von dem Fehler- 5 Verarbeitungssystem (FVS) 2 über ein Sammelleitungsverarbeitungssystem 2 gestartet. system mit dem Hauptverarbeitungssystem (HVS)I

Das Fehlerverarbeitungssystem 2 führt also nur die verbunden. Über dieses Sammelleitungssystem überfehlerhafte Funktion des Hauptverarbeitungssystems 1 prüft das Fehlerverarbeitungssystem 2 in regelmäßigen aus. Solange keine Störungsmeldungen vom Haupt- Abständen die Ausgänge im wesentlichen aller Prüfverarbeitungssystem vorliegen, wird das Fehlerver- io schaltungen des Hauptverarbeitungssystems 1. Das arbeitungssystem 2 nicht benutzt. Fehlerverarbeitungssystem 2 bedient sich hierbei eines

Als Beispiel sei im folgenden ein Fehler der arith- besonderen Aufrufverfahrens insofern, als allen Prüfmetischen und logischen Einheit (ALU) 41, F i g. 3 A, schaltungen, die überwacht werden, eine nur sie kennherausgegriffen, bei dem nur die UND-Operation und zeichnende Adresse zugeordnet ist. Auf diese Weise auch diese nur bei einem bestimmten Bitmuster am 15 ist es nun möglich, den Ausgang jeder Prüfschaltung Eingang gestört ist. durch Aufruf einer ihrem Ausgang fest zugeordneten

Durch eine Störmeldung, z. B. durch einen Paritäts- Adresse zentral abzufragen.

fehler, der von einer Paritätsprüfschaltung entdeckt Zur Erläuterung dieses Aufrufverfahrens sei ange-

wird, wird das Fehlerverarbeitungssystem 2 aktiviert. nommen, daß eine Störung in der arithmetischen und Dieses System hat dann die Aufgabe festzustellen, ao logischen Einheit (ALU)Al, Fig.3A, vorliegt. Das aus welchem Teil des Hauptverarbeitungssystems 1 Fehlerverarbeitungssystem 2 prüft das Hauptverarbeidie Fehlermeldung vorliegt und dann anschließend tungssystem 1 ständig nach dem in F i g. 2 dargestellalle wichtigen Informationsquellen, z. B. das Opera- ten Schema. Dieses Schema sieht zwischen der Austionsregister OPR, das TD-Register TDR und das führung einer Mikroinstruktion und der nächsten im CD-Register CDR, dargestellt in F i g. 3 A, die im 25 ungünstigsten Fehlerfalle drei Verfahrensschritte vor, Zusammenhang mit dem gemeldeten Fehler stehen um das korrekte Ergebnis einer Mikroinstruktion zu können, abzufragen. bilden. Zunächst wird nach Ausführung einer Mikro-

Da es sich bei dem gemeldeten Fehler durchaus Instruktion geprüft, ob ein Fehler vorliegt. Ist dieses auch um einen intermittierenden Fehler handeln kann, nicht der Fall, wird, wie Fig. 2 zeigt, die nächste versucht das Hauptverarbeitungssystem zunächst 3° Mikroinstruktion ausgeführt. Liegt aber ein Fehler durch eine oder mehrere Wiederholungen den Fehler vor, dann wird im ersten Schritt des Verfahrens, nach zu beseitigen. Erst wenn diese Operationen ohne Er- dem das Fehlerverarbeitungssystem betrieben wird, folg verlaufen sind, wird das Fehlerverarbeitungs- untersucht, wo der Fehler im Hauptverarbeitungssystem eingeschaltet. Da das Fehlerverarbeitungs- system 1 vorliegt. Außerdem wird für die Systemsystem 2 die Art der fehlerhaft ausgeführten Opera- 35 wartung und die Fehlerstatistik ein Fehlerabspeichetion sowie die Ursprungsdaten kennt, die dieser rungs-Unterprogramm, die sogenannte LOG-Routine, Operation unterzogen werden, errechnet es den eingeleitet. Im Schritt 2 wird dann das Fehlerunterrichtigen Wert in seinem Addierwerk in mehreren programm, kurz Fehlerroutine genannt, in das Fehlerkleineren Schritten, da dieses Addierwerk einen Verarbeitungssystem vom Plattenspeicher 3 in F i g. 1 weniger aufwendigen Aufbau besitzt als das Addier- 40 geladen und die Instruktion zunächst wiederholt. Erwerk im Hauptverarbeitungssystem 1. Das nunmehr gibt sich bei der anschließenden Prüfung ein fehlerrichtige Ergebnis wird dann in das Hauptverarbei- freies Ergebnis, dann wird unmittelbar danach die tungssystem übertragen, beispielsweise in das Resul- nächste Mikroinstruktion ausgeführt. Ist dieses nicht tatregister 42, dargestellt in F i g. 3 A. der Fall, d. h., wenn das Resultat noch immer iden-

Das Hauptverarbeitungssystem 1 kann nun mit dem 45 tisch falsch ist, dann führt das Fehlerverarbeitungsrichtigen Ergebnis das laufende Programm fortsetzen, system im Schritt 3 die fehlerhafte Funktion selbst nachdem das Fehlerverarbeitungssystem 2 ein Start- aus und führt außerdem die LOG-Routine durch. Das signal zu dem Hauptverarbeitungssystem 1 übertragen richtige Ergebnis wird am Ende des Schrittes 3 in das hat. Mit diesem Gesamtsystem ist es also möglich, Hauptverarbeitungssystem 1 eingespeist, beispielseine Vielzahl von Fehlern zu korrigieren, wobei aller- 50 weise, wie bereits erwähnt wurde, in das Resultatdings die Gesamtverarbeitungsgeschwindigkeit des register (RR) Al, F i g. 3 A. Im Anschluß daran wird Systems vermindert wird, wenn Fehler korrigiert dann die nächste Mikroinstraktion ausgeführt, wobei werden müssen. zwischen der Ausführung dieser Mikroinstruktion und

der darauffolgenden wieder auf das Vorliegen von Ausführliche Beschreibung 55 Fehlern gemäß F i g. 2 geprüft wird.

Zur Durchführung des Verarbeitungsschrittes 1 des

Die Schaltkreisstmktur einer Datenverarbeitungs- Fehlerverarbeitungssystems 2 wird über die Adresseneinrichtung wird bekanntlich mit Hilfe von beson- sammelleitung/lSAdresseninfonnationzudemHauptderen Prüfschaltungen laufend überwacht, um Ver- Verarbeitungssystem 1 übertragen, um die Ausgänge arbeitungsfehler möglichst schnell zu erkennen. Diese 60 der verschiedenen Prüfschaltungen abzufragen und Fehlerprüfschaltungen sind im allgemeinen Paritäts- so eine Information darüber zu gewinnen, wo im prüfschaltungen, die an den Ausgängen von größeren Hauptverarbeitungssystem Fehler vorliegen. Die über und kleineren Funktionseinheiten angebracht sind und die Adressensammelleitung AS übertragene Adressendie Paritätsprüfung der Resultatinformation vorneh- information gelangt, zu einem Decoder (DEC) 31, men, die in dem von der jeweiligen Prüfschaltung 65 Fig. 3B, der die Adresseninformationen entschlüsselt überwachten Verarbeitungsschritt gewonnen wurde. und Torsteuersignale für die Tore 46, 47 und 51 er-Es wird in diesem Zusammenhang auf Fig. 3A ver- zeugt. Während die Torsteuersignale für die Tore46 wiesen, in der drei Prüfschaltungen 43 bis 45 darge- und 47 über die Steuerleitungsbündel 49 und 48 direkt

zu den als UND-Schaltungen ausgebildeten Eingängen a, b, c, d ... übertragen werden, erfolgt die Übertragung des Torsteuersignals für das Tor 51 indirekt über die UND-Schaltung 37, Fig. 3 A.

Wie die F i g. 3 A und 3 B zeigen, bestehen die Torschaltungen 46, 47, 50 und 51 aus einer Kombination von UND-Schaltungen 8 mit einer ODER-Schaltung O, wobei die Ausgänge der UND-Schaltungen direkt die Eingänge für die nachfolgende ODER-Schaltung bilden. Die als UND-Schaltungen ausgebildeten Eingänge der genannten Tore besitzen im allgemeinen zwei Eingänge, wobei der eine Eingang, wie bereits erwähnt wurde, von den Ausgangssignalen des Decoders 31 gesteuert wird. Der verbleibende Eingang einer UND-Schaltung führt dann zu verschiedenen anderen Punkten in der Systemstruktur, wie beispielsweise zu den Ausgängen der Prüfschaltungen 43 bis 45 und zu bestimmten Ausgängen des Funktionsdecoders (F-DEC) 36, da nicht nur die korrekte Arbeitsweise von Registern und Funktions- ao einheiten auf Fehlerfreiheit geprüft werden muß, sondern auch der Funktionsdecoder 36, damit festgestellt werden kann, ob die ausgewählte Funktion auch die gewünschte Funktion ist.

Zur Durchführung des ersten Schrittes im Arbeitsablauf des Fehlerverarbeitungssystems 2 werden über die Adressensammelleitung AS nacheinander Adressen zu dem Hauptverarbeitungssystem übertragen, die im Decoder 31 entschlüsselt werden und nacheinander die Ausgänge der Prüfschaltungen 43 bis 45 und den Ausgang des Funktionsdecoders 36 aufrufen. Bei diesem Aufruf sind im einzelnen folgende Schaltungen aktiv:

Decoder 31, Torschaltung 46 mit den Eingängen in der Reihenfolge a, b, c und g,
Torschaltung 47 mit ihrem Eingang a.

Da vereinbarungsgemäß angenommen wurde, daß eine Störung in der arithmetischen und logischen Einheit (ALU)Al vorliegt, ist auch die Prüfschaltung (CH) 45 aktiv.

Nur im Falle einer aktiven Prüfschaltung werden weitere Ausgänge von Registern durch das Fehler-Verarbeitungssystem 2 abgefragt. Welche Register im einzelnen abgefragt werden, hängt davon ab, welche Prüfschaltung angesprochen hat. Im Falle eines Fehlers der arithmetischen und logischen Einheit 41 werden folgende weitere Daten abgefragt:

Inhalt des Registers (CDR) 39, das den Operanden B enthält, über Torschaltung 46, Eingang /, Inhalt des Registers (TDR)3S, das den Operanden A enthält, über Torschaltung 46, Eingang e, Ausgang der arithmetischen Einheit (ALU) 41 über Torschaltung 46, Eingang d,
Ausgangssignalmuster des Funktionsdecoders (F-OEC) 36 für die fhlerhaft ausgeführte Funktion über Torschaltung 46, Eingang g.

Das Ausgangssignalmuster des Funktionsdecoders 36 wird über ein Leitungsbündel 52 zu der Torschaltung 46 übertragen, wobei die Anzahl der Leitungen in diesem Bündel der parallel zu übertragenden Anzahl von Signalmusterbits entspricht. Der Einfachheit wegen wurde dieses Leitungsbündel in den Fig.3A und 3B als Einzelleitung dargestellt. Der Eingang g der Torschaltung 46 ist ebenfalls vereinfacht dargestellt. Seine Funktion für die Übertragung des Ausgangssignalmusters des Funktionsdecoders 36 ist jedenfalls so, daß beim Aufruf dieses Eingangs g durch den Decoder 31 das gesamte Ausgangssignalmuster des Funktionsdecoders auf den Eingang α der Torschaltung 47 übertragen wird.

Über die Torschaltung 47, die einen ähnlichen Aufbau wie die Torschaltung 46 besitzt, werden die genannten Daten im ersten Verarbeitungsschritt des Fehlerverarbeitungssystems 2 auf die Datensammelleitung DS gegeben, die das Hauptverarbeitungssystem mit dem Fehlerverarbeitungssystem 2 verbindet.

Über diese Torschaltung 47 und deren Eingang/ ' wird die Datensammelleitung DS in der in F i g. 1 dargestellten Weise weitergeführt. Über den Eingang e dieses Tores wird außerdem der Inhalt des Operationsregisters (OPR) 35 nach dem Aufruf durch den Decoder 31 auf die Datensammelleitung DS übertragen. Die Eingänge b bis d dieser Torschaltung stehen weiteren, hier nicht näher interessierenden Operationen zur Verfügung.

Im Schritt 1 des Arbeitsablaufs des Fehlerverarbeitungssystems wird ferner, wie bereits erwähnt, ein Unterprogramm für die Fehlerabspeicherung, die sogenannte LOG-Routine, eingeleitet.

Auf die zuvor erläuterte Weise konnten alle für die Durchführung der folgenden Arbeitsschritte 2 und 3 wichtigen Daten in das Fehlerverarbeitungssystem 2 eingegeben werden. Dieses System enthält somit alle erforderlichen Daten, um die weiteren Verarbeitungsschritte durchführen zu können. Der zur Sicherung der Daten erforderliche Datenfluß im ersten Arbeitsschritt ist in den F i g. 3 A und 3 B an Hand der fett ausgedruckten Leitungen leicht erkennbar.

Im zweiten Arbeitsschritt wird das Laden des Fehlerunterprogramms, der sogenannten Fehlerroutine, durchgeführt. Zur Veranschaulichung dieser Vorgänge dienen die Fig.4A und 4B, die im wesentlichen den Fig. 3 A und 3B gleichen und im Fettdruck diejenigen Leitungen, Register und Funktionseinheiten hervorheben, die an der Durchführung dieses Arbeitsschrittes beteiligt sind.

Dieser zweite Schritt wird dadurch eingeleitet, daß der Inhalt .des Operationsregisters (OPR)35 des Hauptverarbeitungssystems 1 neu geladen wird. Hierzu wird die entsprechende Information über die Datensammelleitung DS, die Leitung 53 und den Eingang α der dem Operationsregister 35 vorgeschalteten Torschaltung 50 in das Operationsregister übertragen. Die Auswahl des Einganges α der Torschaltung 50 erfolgt mit einer Adresseninformation, die über die Adressensammelleitung AS vom Fehlerverarbeitungssystem her übertragen wird. Der Decoder 30 entschlüsselt diese Adresse und erzeugt auf der Leitung 54 ein Ausgangssignal, das zu der UND-Schaltung 33 übertragen wird. Ein weiteres Torsteuersignal für diese UND-Schaltung 33 wird über die Leitung 56 von einer Steuersammelleitung CS geliefert. Wenn also die für den Eingang α der Torschaltung 50 vorliegende Adresse und außerdem ein Steuerimpuls auf der Leitung 56 vorliegt, dann wird die für das Operationsregister 35 bestimmte Information von der Datensammelleitung DS in dieses Register übertragen.

Im Anschluß daran wird das Hauptverarbeitungs-

609 609190

system erneut gestartet, indem der Start-Stop-Schal- Fehlerverarbeitungssystem 2 zu dem Hauptverarbeiter (SS-FL) 34 eingeschaltet wird, der dann ein ent- tungssystem 1 übertragen. Von der Datensammelsprechendes Steuersignal an den Funktionsdecoder leitung DS führt eine Leitung 58 zu dem Eingang a 36 abgibt. einer dem Resultatregister 42 vorgeschalteten Tor-Die Einschaltung dieses beispielsweise als Flipflop 5 schaltung 51. Die Übertragung des richtigen Resulausgebildeten Start-Stop-Schalters 34 erfolgt mit tats in das ResuUatregister 42 kann aber erst dann Hilfe des Aufrufes einer ihm zugeordneten Adresse erfolgen, wenn das zweite Steuersignal am Eingang a und der gleichzeitigen Übertragung eines Steuer- der Torschaltung 51 vorliegt. Dieses zweite Steuersignals von der Steuersammelleitung CS. Die Adresse signal ergibt sich als Ausgangssignal einer UND-für diesen Start-Stop-Schalter 34 wird ebenfalls über io Schaltung 37, das dann vorliegt, wenn einerseits über die Adressensammelleitung AS vom Fehlerverarbei- die Eingangsleitung 59 von der Steuersammelleitung tungssystem 2 zu dem Hauptverarbeitungssystem 1 GS' ein Steuersignal und auf der Eingangsleitung 60 übertragen. Der Decoder 30 entschlüsselt diese ein Auf ruf signal des Decoders 31 vorliegt. Der geAdresse und liefert auf seiner Ausgangsleitung 55 nannte Decoder erzeugt dieses Signal bei der Entein Steuersignal für die Durchschaltung der UND- 15 schlüsselung der Adresseninformation, die in der Schaltung 32. Diese Schaltung gibt dann ein Aus- üblichen Weise über die Adressensammelleitung AS gangssignal für die Einschaltung des Start-Stop- übertragen wurde.

Schalters 34 ab, wenn gleichzeitig ein Steuersignal Zur Beurteilung der Geschwindigkeitsreduktion an ihrem anderen Eingang über die Leitung 56 von des beschriebenen Datenverarbeitungssystems beim der Steuersammelleitung CS her übertragen wird. 20 Vorliegen von Fehlern dient die F i g. 6. Die obere Nach dem Empfang des Ausgangssignals des Start- Zeile in dieser Figur zeigt einen Abschnitt von Ver-Stop-Schalters 34 erzeugt der Funktionsdecoder 36 arbeitungszyklen (N — 1) bis N + 6 des Hauptvererneut die Torsteuersignale an seinen Ausgängen /1 arbeitungssystems (HVS) 1. Dieser Figur ist zu entbis /n, die für die Wiederholung der zuvor fehler- nehmen, daß das Hauptverarbeitungssystem seinen haft ausgeführten Instruktion erforderlich sind. 25 Verarbeitungszyklus (N — I) beendet hat und sich Ein Blick auf das Arbeitsablaufschema in Fig. 2 nun im Verarbeitungszyklus N befindet. Noch vor zeigt, daß im Anschluß an die Instruktionswieder- Beendigung dieses Zyklus stellt das Fehlerverarbeiholung im Schritt 2 wieder eine Fehlerprüfung vor- tungssystem (FVS) 2 einen Fehler F fest. Das Fehlergenommen wird, die sich in der gleichen oder einer Verarbeitungssystem reagiert mit der Durchführung ähnlichen Weise abspielen kann, wie sie schon im 30 der Arbeitsschritte 1 und 2 (51 + 52). Am Ende Zusammenhang mit dem Schritt 1 erläutert wurde. des Arbeitsschrittes 2 wird das Hauptverarbeitungs-Stellt sich bei dieser Fehlerprüfung heraus, daß der system 1 erneut gestartet, um seinen Verarbeitungsoder die gleichen Fehler immer noch vorliegen, dann zyklus N durchzuführen. Im Beispiel der F i g. 6 wird tritt das Fehlerverarbeitungssystem 2 in seinen dritten nun angenommen, daß ein bezüglich des ersten Feh-Verarbeitungsschritt ein. Wie F i g. 2 zeigt, besteht 35 lers identischer Fehler /F vom Fehlerverarbeitungsdieser Schritt darin, daß das Fehlerverarbeitungs- system 2 festgestellt wird. In diesem Falle tritt dieses system 2 nun selbst die Ausführung der fehlerhaften System in seinen dritten Arbeitsschritt (53) ein. Das Funktion vornimmt und die LOG-Zählung veranlaßt. Fehlerverarbeitungssystem 2 errechnet das korrekte Es sei angenommen, daß der gleiche Fehler in der Resultat, überträgt dieses in das Hauptverarbeitungsarithmetischen und logischen Einheit (ALU) 41 40 system 1 und startet dieses nun für den nächsten immer noch vorliegt. Bei der Fehlerprüfung wird Zyklus N + 1, da es selbst die dem Zyklus N zugedahcr festgestellt, daß die Prüfschaltung (CH) 45 ordnete Funktion, allerdings wesentlich langsamer aktiv ist. Das Fehlerverarbeitungssystem 2 führt nun als das Hauptverarbeitungssystem 1, errechnet hat. die gleichen Abfragen durch, die bereits im Zusam- Dieses ist also das Schema, nach dem das Fehlervermenhang mit den Fig. 3A und 3B erläutert wurden, 45 arbeitungssystem2 in die Operation des Hauptverum sich in den Besitz der für die Errechnung des arbeitungssystems 1 im Fehlerfalle eingreift. Nicht richtigen Resultats erforderlichen Fehler- und Ur- dargestellt sind in Fig.6 diejenigen Tests, die zur Sprungsdaten zu bringen. Das heißt also, daß im Ermittlung des Fehlers und der Art des Fehlers Falle des Fehlers der arithmetischen und logischen durchgeführt werden.
Einheit 41 über den Eingang d der Torschaltung 46 50

die Ausgangsin^formation der arithmetischen und lo- Kurze Zusammenfassung
gischen Einheit 41 über den Eingang α der Torschaltung 47 auf die Datensammelleitung DS über- Für die Ermittlung eines Fehlers und die Verarbeitragen wird, die diese Information zum Fehlerver- rung eines Fehlers in einem elektronischen Datenarbeitungssystem überträgt. Ferner werden die In- 55 Verarbeitungssystem ist ein hinsichtlich seines Schalhalte der Register 38 und 39 über die Torschaltungen tungsaufbaues und seiner Verarbeitungsgeschwindig-46 und 47 in das Fehlerverarbeitungssystem übertra- keit begrenztes Fehlerverarbeitungssystem vorgesegen. Dort werden die Fehlerdaten verglichen, und bei hen, das über ein Sammelleitungssystem mit dem Vorliegen eines identischen Fehlers wird das richtige Hauptverarbeitungssystem verbunden ist. Dieses Feh-Resultat in dem Fehlerverarbeitungssystem errechnet. 60 lerverarbeitungssystem überwacht über seine Verbin-Das ermittelte Resultat wird im Anschluß daran dungsleitungen die Prüfschaltungen des Hauptverin das Resultatregister (RR) 42 des Hauptverarbei- arbeirungssystemE, stellt im Fehlerfalle den Fehler tungssystemsl zurückübertragen. Für die Rücküber- fest, übernimmt die Ursprungsinformation und die tragung ergibt sich der in Fig. 5 A durch fett ausge- Fehlerinformation in seinen Speicher, lädt erneut die druckte Linien gekennzeichnete Datenfluß. Im übri- 65 an der fehlerhaften Funktion beteiligten Register und gen entsprechen die Fig. 5 A und 5B, ebenso wie die Funktionseinheiten und startet das Hauptverarbei-F i g. 4 A und 4 B, den F i g. 3 A und 3 B. Das richtige tungssystem erneut für die Ausführung der fehler-Resultat wird über die Datensammelleitung DS vom haften Information.

Claims

Patentansprüche: Fehlerfällen für Statistik- und Servicezwecke speichert. ■■_ '-■'-■ ■,·

1. Elektronisches Datenverarbeitungssystem mit einem Hauptdatenrechner und einem Fehlerdatenrechner, die über ein Sammelleitungssystem verbunden sind, wobei der Hauptdatenrechner

Die Erfindung betrifft ein elektronisches Datenverarbeitungssystem mit einem Hauptdatenrechner und einem Fehlerdatenrechner nach dem Oberbegriff mittels eigener Prüf schaltungen seinen Betrieb ic des Anspruchs 1. überwacht und im Fehlerfall eine Anzeige und Fast ausnahmslos besitzen elektronische Datenvereinen Stoppschalter für den Fehlerdatenrechner arbeitungssysteme Fehlerprüfschaltungen zur Uberaufsetzt, der dann die Aufgaben des Hauptdaten- wachung der in ihnen durchgeführten arithmetischen rechners ausführt, dadurch gekennzeich- und logischen Operationen. Zu den bekanntesten net, daß der gegenüber dem Hauptdatenrechner 15 Einrichtungen hierbei zählen die Paritätsprüfschalbezüglich seiner arithmetischen und logischen tungen, die davon ausgehen, daß sie auf der Basis Fähigkeiten stark reduzierte Fehlerdatenrechner einer festen Datenlänge ein zusätzliches Bit, das so-(2 in Fig. 1) die einzelnen Prüfschaltungen (z.B. genannte Paritätsbit, erzeugen, das die Anzahl der 43 bis 45 in Fig. 3 A und 3B) des Hauptdaten- Bits innerhalb dieser festen Datenlänge zu einer gerechners (1) mittels einer Aufrufanordnung (AS; ao raden oder ungeraden macht. Die Parität dieser Da-31, 46, 47, DS) adressiert und im Fehlerfalle die tenlänge kann von einem Verarbeitungsschritt zum entsprechende Prüfschaltung identifiziert und die nächsten neu gebildet und mit der ursprünglichen Ursprungsinfonnationen aus den an der fehler- verglichen werden. Sind hierbei Abweichungen festhaften Operation beteiligten Registern und Funk- zustellen, dann handelt es sich in aller Regel um tionseinheiten (z. B. 37, 38, 39, 41) übernimmt, 25 einen Fehler, der, je nach Gewicht, zu einem Maschifiir eine spätere Diagnose speichert und mit diesen in an sich bekannter Weise eine Befehlswiederholung im Hauptdatenrechner veranlaßt und

nach einem erneuten identischen Fehler dann die

nenstop führen kann.

Nun sind keineswegs alle festgestellten Fehler auf defekte Schaltkreise zurückzuführen, wobei es sich im Falle eines defekten Schaltkreises um permanente fehlerhafte Funktion im eigenen Verarbeitungs- 30 Fehler handeln würde, sondern sie werden vielmehr werk selbst errechnet und über ein selektions- durch andere Ursachen, wie beispielsweise Entladung fähiges Übertragungssystem (AS, CS, DS, 31, 37, hoher statischer Spannungen, die zu fehlerhaften Im-51) in ein der auszuführenden Funktion entspre- pulsen auf den Übertragungsleitungen innerhalb des chendes Resultatregister (z. B. 42) des Haupt- Systems führen können, verursacht. Bei einer Operadatenrechners überträgt und dieses schließlich 35 tionswiederholung, die bei bekannten Datenverarbeidurch Rückstellen des Stoppschalters (34) für die
Ausführung der nächsten Funktion startet.

2. Elektronisches Datenverarbeitungssystem nach Anspruch 1, dadurch gekennzeichnet, daß

tungssystemen (vgl. deutsche Offenlegungsschriften 19 01 036 und 19 01297) in einem solchen Falle verordnet wird, tritt dann der Fehler, gegebenenfalls nach weiteren Wiederholungen, nicht mehr auf. Diese

der Fehlerdatenrechner (2 in Fig. 1) mit einem 40 sogenannten intermittierenden Fehler, die auch auf Speicher (3) verbunden ist, der ein Fehlerunterprogramm für die Abspeicherung der Fehlerdaten, für die Befehlswiederholung und für die

anderen Ursachen beruhen können, sind im allgemeinen nur sehr schwer zu lokalisieren.

Ein bekanntes Verfahren hierzu (vgl. »Proceedings Seminar on Automatic Check Out Technique«,

geführten Funktion enthält, welches der Fehler- 45 BATELLE Institute, Columbus, Ohio, 1962, S. 52 bis datenrechner bei Feststellung eines Fehlers aus 65), bei dem ein Fehlerunterprogramm aufgerufen diesem Speicher abruft und für die Fehlerverarbeitung übernimmt.

Selbsterrechnung des Resultats der fehlerhaft auswird, benutzt eine Prüfzeichenmusterquelle, deren Information zu den einzelnen Elementen eines Datenverarbeitungssystems übertragen wird. Bei einer kor-

nach einem der vorhergehenden Ansprüche, da- 50 rekten Arbeitsweise dieser Elemente sind deren Ausdurch gekennzeichnet, daß das selektionsfähige gangssignale genau bekannt, und diese sind ebenso Übertragungssystem Ad (45

3. Elektronisches Datenverarbeitungssystem

aus Adressen- (AS in Fig. 3Ä und 3B), Daten- (DS) und Steuersammelleitungen (CS) besteht.

4. Elektronisches

nach einem oder mehreren der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß der Fehlerdatenrechner (2 in Fig. 1) für die Resultaterrechnung eine arithmetische und logische Einheit besitzt, die einen einfachen serialen Aufbau to besitzt und somit das Resultat in mehreren Schritten errechnet.

5. Elektronisches Datenverarbeitungssystem nach einem oder mehreren der Ansprüche 1 bis 4. dadurch gekennzeichnet, daß der Fehlerdatenrechner (2 in F i g. 1) die Fehlerinformationen in einen reservierten Bereich des Speichers (3) überträgt und dort für eine vorgebbare Anzahl von

wie die Information der Prüfzeichenmusterquelle gespeichert. Bei einem Vergleich der erwarteten Ausgangssignalmuster mit den tatsächlich vorliegenden

Datenverarbeitungssystem 55 kann festgestellt werden, welche Schaltkreise auf

Grund eines Defektes diese Fehler verursachen.

Für Fehlerstatistik- und Servicezwecke hat man auch bereits daran gedacht, die bei einem auftretenden Fehler interessierenden Fehlerdaten in einem besonders reservierten Bereich eines Speichers aufzubewahren. Diese Fehlerdaten können dann später, gegebenenfalls sogar maschinell, analysiert werden. Liegen in einem elektronischen Datenverarbeitungssystem sogenannte permanente Fehler vor, d. h. also Fehler, die durch schadhafte Schaltkreise oder Bauelemente verursacht werden, dann kann durch die Wiederholung einer fehlerhaften Funktion oder Operation nicht mehr das richtige Resultat dieser Funk-