-
Die Erfindung betrifft eine Einrichtung
zur Diagnose sporadischer Fehler in einem seriellen Übertragungssystem
oder Netzwerk, das eine Anzahl von Teilnehmern miteinander und mit
einer zentralen Diagnoseeinrichtung verbindet.
-
Im Zuge einer zunehmenden Dezentralisierung
bei der Automatisierung vielfältigster
Aufgaben, wie Sprach-, Video- und
Datenübertragung,
Fernsteuern und -regeln und dergleichen über räumlich ausgedehnte Netze mit
einer großen
Anzahl angeschlossener Netzwerkteilnehmer, kommt der Selbstdiagnose
eines Übertragungssystems
eine immer größer werdende
Bedeutung zu. Aus diesem Grund hat man bereits Einrichtungen und
Verfahren geschaffen, die eine Selbstdiagnose in derartigen Einrichtungen
durchführen,
die bereits so differenziert sind, daß sie dem Netzwerkbetreiber
die Ursachen von Schwachstellen in seinem System selbständig mitteilen,
ohne dabei den sonst üblichen
Einsatz externer Hilfsmittel zu benötigen. Das Grundprinzip dieser
Systeme besteht darin, alle an das Netz angeschlossene Teilnehmer
in die Systemdiagnose einzubeziehen.
-
Aus der Patentschrift
DE 40 39 013 C2 ist eine
Multiprozessor-Datenverarbeitungsanlage bekannt geworden, bei welcher
zur Überwachung
der betriebsmäßigen Funktionalität eines
Einzel- oder Mehrprozessorsystems eine nachgewiesene Fehlfunktion
an eine Fehlfunktionsüberwachung-Steuereinheit
gemeldet wird. Nachteiligerweise wird hierzu eine separate Steuerleitung
verwendet.
-
Weiter zeigt die Druckschrift
DE 44 01 540 A1 ein
Verfahren, bei welchem eine Meldungssteuerung eine von einer Vermittlungsanlage
kommende Meldung aufnimmt. Die Meldung wird dann mit einem Meldungsspeicher
verglichen und aufgrund dieser Information wird von der Meldungssteuerung
eine Entscheidung getroffen, ob eine Verbindung zu einer Servicestelle
aufgebaut wird, um einen Texthinweis für eine Serviceperson zu übermitteln.
-
Die Druckschrift
GB 2 287 558 A beschreibt eine Überwachungseinheit
für Computer,
die an einem Netzwerk betrieben werden. Eine Supervisor Unit zeigt
hierbei an einer zentralen Stelle Fehlermeldungen an, die von einem
der am Netzwerk betriebenen Computer verursacht worden sind. Damit
der Supervisor, also eine ausführende
Person, den Fehler beheben kann, sind Aktionen von seiner Supervisor Unit
aus notwendig. Die vom Supervisor ausgeführten Aktionen werden mit der
dazugehörenden
Fehlermeldung in sogenannte „History-Storing Means" in der Supervisor
Unit mitprotokolliert und abgelegt. Bei wiederholten Fehlern wird
dem Supervisor angezeigt, welche Aktionen beim gleichen Fehler notwendig
sind. Es handelt sich also um eine Art lernendes Expertensystem.
Für sporadisch
auftretende Fehler im Netzwerk ist diese Überwachungseinheit jedoch ungeeignet,
da sporadische Fehler nicht zu einer dauerhaft anstehenden Fehlermeldung
führen.
-
Die meisten bekannten Diagnoseverfahren und
-einrichtungen für
serielle Übertragungssysteme beruhen
allerdings auf einer zentralen Überwachung des
Datenverkehrs, wobei die Einrichtung, welche die Überwachung
steuert, auch den Datenverkehr aufzeichnet und versucht aus diesen
Daten Rückschlüsse auf
die Art und den Ort eines aufgetretenen Fehlers zu gewinnen.
-
Wie 1 einer
solchen bekannten Anordnung eines Übertragungsnetzes ÜN, an das
alle Teilnehmer Tln1 bis Tlnn mittels Anschlußschaltungen AS1 bis ASn parallel angeschlossen
sind, zeigt, ist die Diagnoseeinrichtung DE als zentrales Element für die Überwachung
des Datenverkehrs und die Auswertung der festgestellten Fehler vorgesehen und über ihre
Anschlußschaltung
AS ebenfalls an das Übertragungsnetz ÜN angeschaltet.
-
Wie 1 erkennen
läßt, gibt
es hier ein Problem, wenn ein sporadischer Fehler F an der Stelle
S1, d.h. auf dem Streckenabschnitt des Übertragungsnetzes ÜN auftritt,
der die Teilnehmer Tln1 und Tln2 miteinander verbindet. Sporadische
Fehler, wie beispielsweise stochastische Einbrüche von Störsignalen oder Entladungen
elektrostatischer Überspannungen
in den Übertragungsnetzen,
haben die unangenehme Eigenschaft, daß sie meist nur kurzzeitig und
dabei auch noch völlig
asynchron auftreten. Dadurch ist es der Diagnoseeinrichtung DE zwar
möglich
den Fehler zu festzustellen, aber nicht möglich den Ort seines Auftretens
zwischen Teilnehmer Tln1 und Teilnehmer Tln2 zu lokalisieren.
-
Man hat deshalb auch ein anderes
System entwickelt, dessen Prinzip aus 2 hervorgeht
und das diesen oben dargestellten Nachteil vermeidet. Es handelt
sich hierbei um ein sogenanntes Master/Slave-System. In einem Master-/Slave-System führt der Master
nach einem festgestellten Fehler F einen Diagnoselauf durch, um
den Ort des Fehlers zu lokalisieren. Bei diesem Verfahren läßt sich
der Fehlerort S2 eines sporadischen Fehlers, im Gegensatz zu einem harten
Fehler, jedoch nur dann ermitteln, wenn er während des Diagnoselaufs noch
aktiv ist. Ist der Fehler vorher verschwunden, dann gibt es bei
diesem Verfahren keine Möglichkeit
mehr, den Fehlerort zu bestimmen. Vermutlich ist auch die Information über die
Art des Fehlers nicht mehr zu gewinnen.
-
Obwohl Systeme mit aktiver Teilnehmerankopplung,
wie in 2, die besten
Voraussetzungen für
eine differenzierte Fehlerdiagnose bieten, sind die Störungen und
der Ort ihres Auftretens nicht mehr lokalisierbar, wenn sie in eine
Totzone fallen, die dort beginnt, wo die Netzwerk- Update-Zeit (NUT)
durch den Fehlereinfluß nicht
mehr einzuhalten ist (tNUT), und zu dem
Zeitpunkt endet, der für
einen Diagnoselauf notwendig ist. Das bedeutet, daß alle Fehler, die
von ihrer Fehlerwirkzeit her in diese Totzone fallen, prinzipbedingt
nicht mehr lokalisiert werden können.
-
3 veranschaulicht
die Bandbreite B einer nicht lokalisierbaren Störung, die in die Totzone mit
den erwähnten
zeitlichen Grenzen fällt.
-
Da auch auf dem vorstehenden Prinzip
beruhende Verfahren und Anordnungen nicht in allen Fällen die
Lokalisierung von sporadischen Fehlern oder Störungen erlauben, ist ihre Verwendung
in Diagnoseeinrichtungen, die mit absoluter Zuverlässigkeit alle
auftretenden sporadischen Fehler erkennen müssen, weil bestimmte Anwendungen
dieses erfordern, nicht für
derartige Anwendungen geeignet. Es ist daher die Aufgabe der vorliegenden
Erfindung, eine Diagnoseeinrichtung anzugeben, die alle auftretenden
Störungen
erfassen und lokalisieren kann und damit für Anwendungen mit höchsten Qualitätsansprüchen an
die Fehlersicherheit geeignet sind.
-
Gelöst wird diese Aufgabe durch
die in Anspruch 1 angegebenen Merkmale. Weitere vorteilhafte Ausgestaltungen
und Weiterbildungen des Gegenstandes der Erfindung sind den Unteransprüchen zu entnehmen.
-
Hierdurch wird die Möglichkeit
gegeben, eine lückenlose
Fehlerdiagnose in Netzwerken oder Übertragungsnetzwerken auch
für sporadische
Fehler vorzunehmen.
-
Im folgenden wird die Erfindung an
Hand der beiliegenden Zeichnungen ausführlich beschrieben. Es zeigen:
-
1 eine
Prinzipdarstellung eines Netzwerkes mit linearer Busstruktur und
einer zentralen Diagnoseeinrichtung,
-
2 eine
Prinzipdarstellung eines Master-/Slave-Netzwerksystems mit aktiver Ankopplung der
Teilnehmereinrichtungen,
-
3 eine
Prinzipdarstellung der Bandbreite einer nicht lokalisierbaren Störung,
-
4 eine
Prinzipdarstellung eines verteilten Netzwerksystems mit dedizierten
Fehlerdetektoren gemäß der Erfindung,
-
5 eine
Prinzipdarstellung des Protokollaufbaus eines dezentralen Teilnehmers
nach dem ISO/OSI-Referenzmodell
und
-
6 eine
Prinzipdarstellung eines Teils eines Protokollstapels,
-
7 eine
schematische Darstellung wie Ereignisse mit niedriger Priorität in zyklischer
Reihenfolge abgearbeitet werden.
-
Nachstehend wird das erfindungsgemäße Prinzip
erläutert,
das die oben erwähnten
Nachteile bekannter Verfahren und Anordnungen zur Fehlerdiagnose
in verteilten Netzen vermeidet.
-
Es liegt diesem Prinzip zugrunde,
daß die Fehler
oder Störungen
nicht mehr durch eine zentrale Diagnoseeinrichtung erfaßt werden,
wie es bei den oben beschrieben bekannten Einrichtungen und Verfahren
der Fall ist, sondern dezentral an jedem Teilnehmer in diesem Netzwerk.
-
Durch die dadurch möglich gewordene gleichzeitige
Speicherung der Fehler in allen Teilnehmereinrichtungen entfällt die
Totzone, in der Fehler nicht erfaßt werden konnten.
-
Um dieses zu realisieren, werden,
wie 4 zeigt, in jeder
Teilnehmereinrichtung und der Mastereinrichtung Fehlerdetektoren
FD vorgesehen, die dezentral Fehlerprüfungen auf den unterschiedlichen Protokollebenen,
typischerweise auf der Schicht-1 und Schicht-2 von insgesamt sieben
Protokollschichten des verwendeten Übertragungsverfahrens vornehmen.
-
Hierzu zeigt 6 einen Ausschnitt aus dem Protokollstapel
eines Feldbusprotokolls. Der Zeichenumsetzer 5 übernimmt
hierbei die Aufgaben der MDS (Medium Dependent Sublayer) 11 sowie
optional die Aufgaben der MAU (Medium Attachment Unit) 12.
-
Mau 12 und MDS 11 bilden
zusammen die physikalische Schicht, die, wie oben schon erwähnt wurde,
auch Schicht-1 genannt wird. Oberhalb der der MDS 11 beginnt
die Sicherungsschicht (Data-Zink Layer) DLL, auch Schicht-2 genannt,
mit ihrer Subkomponente MAC (Medium Access Control) 10. Die
Schicht-1 und die Schicht-2 tauschen in der Regel zeichenorientierte
physikalische Protokolldateneinheiten (PhPPDU) aus. Diese Schnittstelle
ist in der vorliegenden Erfindung physikalisch ausgeprägt und stellt
die serielle Schnittstelle 2 in 1 dar. Ist der Informationsgehalt der
PhPDU der seriellen Schnittstelle 2 kleiner als der der
MDS 11 des verwendeten Feldprotokolls, so sind entsprechende
einleitende Steuer-Protokolleinheiten PDU zu definieren, die eine
zusammengehörende
Folge von PhPDU's
klassifizieren.
-
Vorzugsweise werden die oben erwähnten Fehlerdetektoren
FD direkt in die für
ein Übertragungsprotokoll
zur Verfügung
stehenden Schaltkreise integriert. Erkannte Fehlerzustände auf
dem Übertragungsmedium
oder in einer Protokollschicht werden von entsprechenden Detektoren
an den Empfangsschaltungen der Teilnehmer erfaßt und gespeichert. Hat ein
Netzwerkteilnehmer mehrere Empfangsschaltungen, dann hat er auch
entsprechend mehr Detektoren. Das ist z. B. dann der Fall, wenn eine
Vollduplex-Übertragung
zwischen zwei benachbarten Teilnehmern realisiert wird.
-
5 zeigt
nun einen typischen Protokollaufbau eines Netzwerkteilnehmers, wobei
hier nur die interessierenden Schichten, nämlich die physikalische Schicht
(Physical Layer) PL, d. h. die Schicht-1, und die Sicherungsschicht
(Data-Link-Layer) DLL, d. h. die Schicht-2, dargestellt sind. Es ist zu sehen,
daß an
den entsprechenden Protokollschichten, der MAC-US (Medium Access Control)-Unterschicht
von DLL und an der MDS (Medium Dependent Sublayer)-Schicht von PL,
die auch noch zwischen MAC-US und MDS über eine weitere Unterschicht
MIS-US (Medium Independent Sublayer) verfügt, Fehlerdetektoren FD angeordnet
sind. Schließlich
stellt die Einheit MAU (Medium Attachment Unit) eine bidirektionale
Verbindung von MDS mit dem Übertragungsnetz ÜN her.
-
Schicht-1 und Schicht-2 sind die
wesentlichen Träger
der Hardware der Einrichtung nach 5 und
sie können
somit auch mit Hardware-Fehlerprüfschaltungen
geprüft
werden, die tief in der Logikstruktur an "neuralgischen", d. h. fehlerrelvanten Punkten angeordnet
sind.
-
Während
die wesentlichen Aufgaben der Schicht-1 die Festlegungen der Definitionen
für die Übertragung
(Medium, Baudrate, Spannungsversorgung und dergleichen), das Übertragungsverfahren und
Vorgaben, wie Pin-Belegungen und Anschlüsse sind, definieren sie auch
die Signalpegel für
die Kodierung einzelner Bits.
-
Die Schicht-2, die Sicherungsschicht
beschreibt das Buszugriffsverfahren, sowie die Datensicherung. Brücken und
normale Schalter arbeiten ebenfalls auf dieser Protokollschicht.
-
Übertragungssysteme
besitzen heute meist einen Übertragungskanal
für Netzmanagementsignale
(Netzmanagement-Funktionen).
Aus Gründen der Übertragungseffizienz
sollte dieser Kanal während
der Übertragung
von (Nutz-)Daten wenig benutzt werden, z. B. dadurch, daß ihm die
für die Übertragung
von Managementsignalen zugebilligte Zeit minimiert wird. Das kann
beispielsweise dadurch erreicht werden, daß jedem Netzwerkteilnehmer
ein fester Zeitschlitz zugeteilt wird, in welchem er seine Managementsignale übertragen
kann und zwar nur in dieser Zeitscheibe. Bei längeren Signalfolgen muß dann deren Übertragung
auf mehrere Zeitscheiben verteilt werden.
-
Da die Anzahl der hierfür benötigten Datenbreiten
für eine
differenzierte Fehlermeldung die üblichen Kapazitäten eines
Managementkanals überschreitet,
wird ein als Informationssammler und -Verteiler arbeitender Diagnose-
und Report-Manager (DRM) vorgesehen, der seine Aufgabe dadurch löst, daß er aus
den vorliegenden Informationen der Fehlerdetektoren FD (meist nur
ein Fehlerbit je Fehlerdetektor) ein Fehlerbild kodiert. Dieses
Fehlerbild eines Netzwerkteilnehmers wird dann (beispielsweise in seiner
ihm zugeteilten Zeitscheibe) über
das Übertragungsnetz ÜN an eine
andere Netzwerkzentrale, z. B. einen Master übertragen.
-
Das Besondere an dem Diagnose- und
Reportmanager DRM besteht nun darin, daß beispielsweise der Master
(Busmaster) die Diagnoseinformation, beispielsweise das Fehlerbild,
des dezentralen Netzwerkteilnehmers nicht mehr adressieren und abfragen
muß, sondern
daß nun
der dezentrale, beim Netzwerkteilnehmer vorhandene DRM das zu meldende
Fehlerbild und/oder eine Statusinformation in Form eines Ereignisses
E, z. B. ein Zustand einer zu überwachenden
Funktion seines Teilnehmers, voradressiert, so daß automatisch
die aktuellste Fehlerinformation übertragen wird.
-
Wie 5 zeigt,
wird vom DRM die Adresse (ID-ADR), eine Identifizierung ID erzeugt
und zu einem ID-Sende-Empfangspufferspeicher
FDSP übertragen,
von dem dann in seiner Zeitscheibe die ID und auch die Fehlerbilder
zu dem Master (nicht dargestellt) über ÜN übertragen werden. Damit die
stets aktuellste Fehlerinformation übertragen wird, erfolgt der
Pufferbetrieb nach dem bekannten LIFO-Prinzip (LIFO = last in/first
out). Die Nutzdaten werden über einen
Data genannten Daten-Sende-Empfangspufferspeicher DSEP auf das ÜN übertragen.
Die Adresse ID kann parallel zu den Daten oder als Vorläufer (Header)
seriell mit den Daten übertragen
werden.
-
Neben den Fehlereinflüssen, die
im allgemeinen zu Übertragungsfehlern
führen,
gibt es in solchen Netzwerken auch noch andere Informationen, die
zwar zu keinen Übertragungsstörungen führen, die
aber dennoch parallel zur Nutzdatenübertragung gemeldet werden
müssen.
Zu diesen Informationen gehören
Meldungen über
interne Zustände
der einzelnen Netzwerkteilnehmer, sog. Statusinformationen.
-
Daraus leitet sich eine weitere Besonderheit her,
da der DRM in der Lage sein soll, zwischen Informationen mit hoher
Priorität
und solchen mit niedriger Priorität unterscheiden zu können. Informationen
mit hoher Priorität sind
die oben beschriebenen Einflüsse,
die zu Übertragungsfehlern
führen,
während
Informationen mit niedriger Priorität sich z.B. auf periphere Meldungen
beziehen, wie Ausfall einer Peripheriespannung, Ablauf eines Überwachungs-Timers
(Watchdog), Ausfall eines externen Prozessors (CPU), Abfall der Übertragungsqualität (MAU Warnung)
und dergleichen. Mau (Medium Attachment Unit) ist eine Komponente
der physikalischen Schicht (Physical Layer) PL, welche die physikalische
Kopplung zwischen Medium und Protokollstapel herstellt.
-
Um dieses Prioritätsschema zu realisieren, erhalten
alle Informationen niedriger Priorität, welche die vorstehend genannten
Ereignisse E repräsentieren,
die gleiche Priorität.
-
Um zu verhindern, daß eine große Zahl
an Ereignissen einer Meldung die Übertragung anderer Meldungen
blockiert, wird, wie 7 zeigt,
nach jeder erfolgten Meldung eines Ereignisses Ei im
Sinne einer Uhr die nächste
Meldung abgefragt. Damit wird eine Übertragung aller Ereignisse
E1,..., EN garantiert.
-
Dieser Ablauf der Übertragung
von Informationen mit niedriger Priorität wird durch das Auftreten eines
Ereignisses mit hoher Priorität
nach Art einer Interrupt-Verarbeitung
unterbrochen, bei welcher nach vollendeter Übertragung der Meldung des
Ereignisses mit hoher Priorität,
das zu fehlerhafter Übertragung
führen
kann, das Ablaufschema nach 7 an
der unterbrochenen Stelle fortgesetzt wird.
-
Die Übertragungen der Fehler- und
Statusmeldungen (Ereignismeldungen) sollte die Nutzdatenübertragung
möglichst
wenig beeinflussen. Bekannte Übertragungssysteme,
wie z. B. Interbus, erlauben auf Grund ihres zyklischen Betriebs
die Möglichkeit
auf jedem Netzwerkteilnehmer einen Mechanismus zu installieren,
der die Übertragung
von obigen Ereignissen nur in einem bestimmten Raster von n-gültigen Nutzdatenübertragungen
zuläßt (z. B.
n = 16). Das bedeutet, daß die Übertragung
sowohl der asynchronen Fehlermeldungen eines Netzwerkteilnehmers,
als auch aller anderen Netzwerkteilnehmer auf ein festgelegtes Raster
von n Übertragungszyklen
synchronisiert werden. Dadurch wird die zur Verfügung stehende Bandbreite des Übertragungsnetzes
optimal für
diese Ereignisse genutzt. Ferner kann durch Anpassung des Rasters
die Determinierbarkeit der Nutzdatenübertragungen gewahrt bleiben.