DE69113077T2 - Modellgestütztes deduktives System für Netzwerksfehlerdiagnose. - Google Patents

Modellgestütztes deduktives System für Netzwerksfehlerdiagnose.

Info

Publication number
DE69113077T2
DE69113077T2 DE69113077T DE69113077T DE69113077T2 DE 69113077 T2 DE69113077 T2 DE 69113077T2 DE 69113077 T DE69113077 T DE 69113077T DE 69113077 T DE69113077 T DE 69113077T DE 69113077 T2 DE69113077 T2 DE 69113077T2
Authority
DE
Germany
Prior art keywords
situation
network
action
situations
inclination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69113077T
Other languages
English (en)
Other versions
DE69113077D1 (de
Inventor
Mark Ronald Adler
Meyer Alvin Billmers
Michael George Carifio
Steven Harvey Schwartz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digital Equipment Corp
Original Assignee
Digital Equipment Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Equipment Corp filed Critical Digital Equipment Corp
Publication of DE69113077D1 publication Critical patent/DE69113077D1/de
Application granted granted Critical
Publication of DE69113077T2 publication Critical patent/DE69113077T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2257Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using expert systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S706/00Data processing: artificial intelligence
    • Y10S706/902Application using ai with detail of the ai system
    • Y10S706/911Nonmedical diagnostics
    • Y10S706/916Electronic or computer, internal or network, circuit

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

    Bereich der Erfindung
  • Die vorliegende Erfindung betrifft die Netzwerksfehlerdiagnose, insbesondere ein modellbasiertes Schlußfolgerungssystem, das Fehler in lokalen Netzwerken (LANs) diagnostiziert.
  • Hintergrund der Erfindung
  • Ein Computernetzwerk, wie beispielsweise ein lokales Netzwerk (LAN), weist viele verschiedene, miteinander gekoppelte Komponenten auf. Daher gibt es in dem Netzwerk viele Bereiche, in denen ein Fehler auftreten kann. Nachdem ein Fehler auftritt, führt eine Person, die eine Diagnose ausführt, normalerweise eine Störungssuche in dem LAN durch, indem sie - basierend auffrüheren Erfahrungen bei der Störungssuche - spezifische Komponenten in dem LAN testet.
  • Computernetzwerke werden zunehmend heterogener, wobei Ausrüstungsteile verschiedener Hersteller - die verschiedene Netzwerkprotokolle verwenden - eingesetzt werden, die miteinander kommunizieren, kooperieren und in Wettbewerb zueinander stehen, um in dem Unternehmen eines Kunden zum Einsatz zu kommen. Die gegenwärtigen Verfahren zur Netzwerksstörungssuche reichen nicht aus, um die komplexen Netzwerke von verschiedenen Zulieferern zu verwalten bzw. zu managen. Um den besten Kundendienst zu gewährleisten, sind neue Wege für die Netzwerksfehlerdiagnose erforderlich.
  • Es wurden bereits Wege zur Netzwerksdiagnose unter Verwendung künstlicher Intelligenz beschrieben, die eine regelbasierte Schlußfolgerung verwenden, bei denen Regeln eine Diagnose für ein System spezifizieren, das auf der Erfüllung von Regelbedingungen basiert. Ein derartiges regelbasiertes System wird von M. Yoshida et al. beschrieben: "Application of Knowledge Engineering to Computer System Diagnosis", Review of Electrical Communication Laboratory, Band 37, Nr. 1, 1989. Der Weg der regelbasierten Schlußfolgerung ist sehr starr und erfordert einen extrem großen Satz von Regeln, um genügend Situationen zu behandeln, damit ein nützliches Diagnosewerkzeug bereitgestellt wird.
  • Ein zur regelgestützten Schlußfolgerung alternativer Weg ist die modellbasierte Schlußfolgerung, eine Künstliche-Intelligenz-Technologie, bei der strukturelle und funktionale Informationen über ein Objekt, beispielsweise eine Komponente eines Computernetzwerks oder das Netzwerk selbst, aus einem Modell des Objekts abgeleitet wird. Modellbasierte Schlußfolgerung ergibt einen robusteren Weg der Diagnose. Es wurde jedoch kritisiert, daß Wege der modellgestützten Schlußfolgerung eine zu "tiefe" Kenntnis von individuellen Netzwerkkomponenten erfordern. Es besteht ein Bedarf an einem System für die Netzwerkstörungssuche unter Verwendung von Verfahren der modellbasierten Schlußfolgerung, das Fehler in beliebig komplexen Computernetzwerken mit heterogenen Bestandteilen diagnostizieren kann und gleichzeitig keine "tiefe" Kenntnis erfordert. Ein derartiges System muß die Art und die Stelle von strukturellen Fehlern deduzieren bzw. ableiten, indem es ein Modell des Netzwerks, ein Modell von Diagnosefachwissen und Verhaltens- bzw. Ablaufbeschreibungen einschließlich berichtigter Fehlfunktionen verwendet.
  • Zusammenfassuna der Erfindung
  • Diese und weitere Aufgaben werden von der in den Ansprüchen definierten vorliegenden Erfindung gelöst, die durch Verwenden von Information, die für das Fehlerdiagnoseverfahren relevant ist, ein System zum Diagnostizieren von Netzwerkfehlern in einem Computernetzwerk schafft. Diese Relevanz wird - mit dem Einsatz von modellbasierter Schlußfolgerung - durch die Struktur der Netzwerkkomponenten, die Topologie des Netzwerks und das kausale Verhältnis oder Wechselwirkung unter diesen Komponenten bestimmt. Das modellbasierte Schlußfolgerungssystem der vorliegenden Erfindung verwendet sowohl allgemeine als auch spezifisohe Diagnosetechniken, so daß das Schlußfolgerungssystem dazu verwendet werden kann, verschiedene oder sich entwickelnde Netzwerke zu diagnostizieren. Ein als "Allgemeinste Klasse"-Mechanismus bezeichneter Mechanismus wird dazu verwendet, in dem modellbasierten Schlußfolgerungssystem die geeigneten Wissensstrukturen hervorzubringen. Das modellbasierte Schlußfolgerungssystem testet das Computernetzwerk aktiv und zieht, falls notwendig, Daten heran, die aktive Diagnosehypothesen entweder bestätigen oder widerlegen, und es sammelt auch zusätzliche Informationen, um die Diagnosestrategie zu verfeinern. Das Schlußfolgerungssystem stellt auch einen abstimmbaren Mechanismus zum Zusammenstellen der Tätigkeitsliste (tunable agenda scheduling mechanism) bereit, der die Kosten und den Nutzen von zugehörigen Störungssuchaktionen einschätzt und darauf einwirkt. Das Schlußfolgerungssystem versucht, den Fehler sowohl hinsichtlich des Einflusses auf das Netzwerk selbst und auf die Anforderungen an die Arbeitszeit mit minimalen Kosten zu isolieren.
  • Das modellbasierte Schlußfolgerungssystem der vorliegenden Erfindung verwendet eine als "Situation" bezeichnete Datenstruktur, die eine Angabe über ein LAN oder eine Untergruppe seiner Komponenten darstellt, die wahr oder falsch sein kann. Fehlersuchwissen eines Experten wird dazu verwendet, allgemeine und spezifische Diagnoseverfahren mit der vorliegenden Situation zu verknüpfen. Das modellbasierte Schlußfolgerungssystem erzeugt geeignete Situationen, in dem es sowohl ein Modell des zu untersuchenden Netzwerks (d.h. ein Netzwerktopologiemodell) als auch eine objektorientierte Netzwerkskomponentenklassenhierarchie verwendet.
  • Jede Situation besitzt "Rollen", die an Komponenten in dem interessierenden Netzwerk gebunden sind. Eine der Komponenten in dem Netzwerk - oder ein Aggregat bzw. eine Gruppe von Komponenten - spielt eine "Fokus"-Rolle, während andere Komponenten (oder Aggregate) "unterstützende" Rollen in der Situation spielen. Die Bindung einer Rolle an eine Komponente wird von dem verwendeten Netzwerktopologiemodell bestimmt und ist durch die Komponentenklassenhierarchie beschränkt. Die Fokusrolle ist der Zeiger (index) auf die Klassenhierarchie, die Diagnoseinformationen enthält, welche ähnliche Situationen miteinander verbinden.
  • Die MGC (Most General Class bzw. Allgemeinste Klasse) der Fokusrolle in dem berichteten Problem (oder Grund- bzw. Wurzelsituation) ist ein Zeiger auf in der Klassenhierarchie gespeicherte kausale Information. Von diesem Ausgangspunkt aus bilden kausale Verzweigungen Verknüpfungen zu verbundenen Untersituationen. Diese kausal verknüpften Untersituationen werden ausgewählt und erforscht, indem die logisch verknüpften Untersituationen bestätigt und widerlegt werden, bis die Wurzelsituation entweder bestätigt oder widerlegt ist. Diese dynamisch abgeleitete Kombination von Situationen und kausalen Verzweigungen kann als "Diagnosebaum" angesehen werden. Die Klassenhierarchie und der MGC-Mechanismus der vorliegenden Erfindung begrenzen die Verzweigung entsprechend dem spezifischen gerade diagnostizierten Netzwerk. Der MGC-Mechanismus begrenzt den Satz von zu untersuchenden Untersituationen dadurch, daß er identifiziert, welche kausalen Verzweigungen sich auf das gerade diagnostizierte Netzwerk beziehen.
  • Durch Verwendung von sowohl modellbasierter als auch kausaler Schlußfolgerung unter Verwendung eines Netzwerktopologiemodells, einer Komponentenklassenhierarchie und Diagnosebaumstrukturen stellt die vorliegende Erfindung ein effizientes System zur Netzwerksdiagnose dar. Dieses System kann außerdem bei Computernetzwerken eingesetzt werden, das von verschiedenen Herstellern stammende Komponenten einsetzt, für die keine ausführlichen Informationen erhältlich sind, da das System sowohl allgemeine Wissensverfahren als auch spezielle Verfahren verwendet.
  • Kurze Beschreibung der Zeichnungen
  • Fig. 1 ist ein Blockdiagramm, das das System der vorliegenden Erfindung und die mit der Erfindung verwendete Informationsbasis zeigt.
  • Fig. 2 zeigt ein Beispiel eines Teiles einer Klassenhierarchie.
  • Fig. 3 zeigt ein Beispiel einer "Situation".
  • Fig. 4 zeigt ein Beispiel eines Diagnosebaums.
  • Fig. 5 zeigt ein Beispiel eines Teils eines zu diagnostizierenden Netzwerks.
  • Ausführliche Beschreibung
  • Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zum Diagnostizieren von Fehlern in einem lokalen Netzwerk (LAN). Ein System zum Diagnostizieren von LAN-Fehlern ist in Fig. 1 gezeigt. Das System weist eine Diagnosemaschine 10 auf, die in der bevorzugten Ausführungsform prozeduraler Code ist, der die Diagnose durchführt. Die Diagnosemaschine 10 kann auf einem oder mehreren Standard-Allzweck-Computern betrieben werden. Aus diesem Grund wird der physikalische Aufbau der Maschine 10 nicht ausführlicher beschrieben.
  • Die Diagnosemaschine 10 hat Zugang zu einer Informationsbasis 12, die konzeptionell in eine Netzwerktopologie 14, eine Klassenhierarchie 16 und eine Diagnoseepisode 22 unterteilt ist. Die Klassenhierarchie 16 ist weiter in eine Komponentenbibliothek 18 und ein Diagnosefachwissen 19 konzeptionell unterteilt. Ein Netzwerk, wie ein LAN 20, ist durch die Netzwerktopologie 14 modelliert. Alternativ kann die Informationsbasis 12 so angesehen werden, daß sie konzeptionell ein Netzwerkmodell 24 und ein Diagnosemodell 26 umfaßt.
  • Wenn sich der Diagnosemaschine 10 ein Problem (eine "Wurzelsituation") stellt, greift sie auf die Informationsbasis 12 zu, um das LAN-Problem zu diagnostizieren und eine fehlerhafte ersetzbare Feldeinheit (field replaceable unit bzw. FRU) in einer der Komponenten des LAN 20 zu bestimmen. Wenn die Diagnosemaschine 10 die Schritte einer Diagnose durchläuft, wird ein Baum von Situationen in der Diagnoseepisode 22 gebildet. Dieser Baum faßt den Ablauf der Untersuchungsschritte zusammen, die unternommen wurden, um die fehlerhafte Komponente zu identifizieren, und die das von der Wurzelsituation beschriebene Problem reparieren.
  • Die Netzwerktopologie 14 modelliert individuelle Komponenten, Unterkomponenten dieser Komponenten und Aggregate von Komponenten, die das LAN 20 bilden. Die Netzwerktopologie 14 enthält beispielsweise spezifische Information, die sich auf ein spezielles Plattenlaufwerk bezieht, das eine Komponente des LAN 20 ist.
  • Das Diagnosefachwissen 19 kodifiziert Störungssuchfachwissen, das von Personen stammt, die Experten in der Netzwerkstörungssuche sind. Das Diagnosefachwissen 19 enthält "Situationen", die Wissensstrukturen sind, welche Angaben über ein Netzwerk oder eine Netzwerkkomponente sind. Das Diagnosefachwissen 19 enthält "kausale Verzweigungen", Verbindungen zwischen zwei Situationen, für die eine logische Verbindung existiert. Das Diagnosefachwissen 19 enthält auch Aktionen, die Situationen in Beziehung zu dem LAN 20 setzen, wobei jede Aktion entweder die Wahrheit einer zugeordneten Situation bestimmt oder Netzwerkeinheiten identifiziert, die in Beziehung zu dieser Situation stehen.
  • Die Komponentenbibliothek 18 enthält Informationen zu Komponentenspezifikationen, d.h. was allen einzelnen Beispielen einer spezifischen Komponentenart gemeinsam ist. Dies steht im Gegensatz zu der Netzwerktopologie 14, die Informationen über bestimmte "Instanzen" einer Komponente enthält, d.h., was Komponente A&sub1; verschieden von Komponente A&sub2; macht, wenn beide Komponenten zur Klasse A gehören. Es gibt somit zumindest zwei Arten von Komponenteninformationen, nämlich klassenweite und instanzenspezifische Informationen, die in der Informationsbasis 12 enthalten sind. Aus diesem Grund verwendet eine Ausführungsform der vorliegenden Erfindung einen objektorientierten Weg zur Netzwerkmodellierung.
  • In einem objektorientierten System beschreiben "Klassen" die Arten von Objekten, die es in der Welt gibt, und "Instanzen" dieser Klassen sind rechnerische Darstellungen von tatsächlichen Objekten. Objekte, sowohl Klassen als auch Instanzen, beeinflussen sich durch Senden von "Nachrichten" gegenseitig. Beispielsweise kann die Nachricht "Inkrementieren" zu einem Zahlenobjekt geschickt werden, und ein anderes, den inkrementierten Wert darstellendes Zahlenobjekt wird zurückgeschickt. Jede Klasse kann jedoch ihre eigene Version der Nachricht implementieren, beispielsweise gibt es verschiedene prozedurale Implementationen von "Inkrementieren" für ganze Zahlen und Fließkommazahlen. Jede dieser klassenspezifischen Implementationen wird als "Methode" bezeichnet. Ein objektorientiertes System ruft automatisch die geeignete Methode auf, wenn eine Nachricht an ein Objekt gesandt wird.
  • In einem objektorientierten System sind Klassen hierarchisch organisiert, so daß jede Klasse ihre eigene Methode für eine gegebene Nachricht implementieren oder die entsprechende Nachricht und weitere Merkmale von ihrer Oberklasse "erben" kann. In einem Mehrfachvererbungssystem kann eine Klasse mehr als eine Oberklasse besitzen. Ein Transceiver- bzw. Sende-Empfangskabel ist beispielsweise sowohl ein ETHERNET-Kabel als auch ein Kabel mit zwei Enden, so daß es die Eigenschaften von beiden dieser zwei Kabelklassen erbt.
  • Bei der vorliegenden Erfindung sind die Netzwerkkomponenten und -unterkomponenten, Hardware und Software, individuelle Komponenten und Aggregat- Komponenten in einfacher Weise in einer wie in Fig. 2 gezeigten Vielfachvererbung-Klassenhierarchie organisiert. Durch Verwendung von Klassen eines höheren Niveaus (d.h. abstrakter) wird es einem menschlichen Diagnoseexperten ermöglicht, allgemeine Informationen über alle Objekte in diesen großen Klassen nur einmal zu spezifizieren. Der Experte braucht diese Informationen nicht für jede Unterklasse zu wiederholen. Der effektive Einsatz von abstrakten Klassen erleichtert auch die Diagnose von an das LAN 20 angeschlossenen Komponenten von Drittherstellern, für die keine ausführlichen Informationen hinsichtlich der einzelnen Komponenten zur Verfügung stehen.
  • Die in Fig. 2 gezeigte Klassenhierarchie stellt nicht ein tatsächliches Netzwerk wie beispielsweise das LAN 20 dar, sondern es zeigt das Verhältnis von Klassen und Unterklassen. Dadurch kann die vorliegende Erfindung, basierend auf der spezifischen Netzwerktopologie des LAN 20, einen als "Allgemeinste Klasse" (MGC) bezeichneten Weg verwenden, um die kausalen Verzweigungen jeder Situation zu identifizieren. Die Verwendung von MGC kombiniert allgemeine Informationen über eine Situation mit spezifischen Details des gerade untersuchten Netzwerks 20, um eine Diagnoseepisode 22 zu schaffen, die für eine spezielle LAN-Konfiguration angepaßt ist.
  • Wie vorstehend ausgeführt ist, kann eine Situation als eine Angabe über eine Komponente eines Computernetzwerks, eine Untergruppe von Netzwerkkomponenten oder das Netzwerk als Ganzes angesehen werden. Die Situation kann wahr oder falsch sein und eine korrekte Operation oder einen Fehler repräsentieren. Beispielsweise wird ein entweder von einem menschlichen Techniker oder einer Netzwerküberwachungsvorrichtung berichtetes "Symptom" durch die "Wurzelsituation" repräsentiert. Der Wahrheitswert für diese Situation muß entweder durch Durchführen einer dieser Situation zugeordneten Aktion oder durch Untersuchen der Wahrheit von Untersituationen festgestellt werden.
  • Ein Beispiel einer Situation ist in Fig. 3 gezeigt. Eine Situation weist eine oder mehrere "Rollen" auf, von denen jede von einer Netzwerkkomponente oder einer Ansammlung von Komponenten ausgefüllt ist. Diese Komponente (oder Ansammlung) wird als "Spieler" der Rolle bezeichnet. Eine Rolle in jeder Situation ist als "Fokusrolle" hervorgehoben, während die anderen Rollen "unterstützende Rollen" sind. Eine Situation kann als Angabe über ihren besonderen Fokusrollenspieler im Kontext mit seinen Spielern von unterstützenden Rollen angesehen werden. So ist zum Beispiel der Fokusrollenspieler in einer Situation "Server lädt nicht" der problematische Server. Die unterstützenden Rollen sind der Netzwerk-Host, der den Server spielen soll, der Netzwerkweg, der den Host und den Server verbindet, und das gesamte Netzwerk, auf dem der Server und der Host betrieben werden.
  • Beim Durchführen ihrer Diagnose untersucht die Diagnosemaschine 10 eine Situation, indem sie mit der Wurzelsituation beginnt, um zu bestimmen, ob die Situation wahr ist. Wahrheit kann in einer von zwei Wegen bestimmt werden. Der erste Weg ist das Ausführen einer "Aktion". Eine Aktion ordnet einer Situation prozedurale Codes zu, und versetzt des System in die Lage, mit dem menschlichen Diagnostiker oder dem zu diagnostizierenden Netzwerk zusammenzuwirken. Eine Aktion kann den Wahrheitswert einer Situation bestimmen, einige oder alle ihrer Rollenspieler identifizieren oder beides durchführen.
  • Die Wahrheit einer Situation kann auch auf einem zweiten Weg erhalten werden, nämlich durch Erforschen einer "kausalen Verzweigung". Situationen sind oft kausal verbunden, beispielsweise "Server lädt nicht" wird von "Vorrichtung läuft nicht" unterstützt, wenn der Lade-Host in der ersten Situation der gleiche ist wie die gestoppte Vorrichtung in der zweiten Situation. Eine kausale Verzweigung kodifiziert das logische Verhältnis zwischen den zwei Situationen, während eine "Rollenentsprechung" (role correspondenoe) die Spieler in den zwei Rollen "Lade-Host" und "Gestoppte Vorrichtung" gleichsetzt.
  • Es gibt potentiell viele kausale Verzweigungen, die von einer einzigen Situation aus erforscht werden können. Es kann jedoch sein, daß nur eine kleine Anzahl für eine gegebene Netzwerktopologie anwendbar ist. Um die geeigneten kausalen Verzweigungen für eine Situation zu identifizieren, werden in der vorliegenden Erfindung die vorstehend genannten Vorgehensweisen und Methoden, MGC, verwendet.
  • Sobald bei einer Situation durch die Untersuchung der Situation feststeht, ob sie wahr oder falsch ist, kann eine zugeordnete Reparatur angegeben werden. Nicht alle Situationen geben Reparaturen an, da eine Reparatur nicht immer einfach anzugeben ist. Inklinationsinformation wird verwendet, um Situationen und Untersituationen zu erforschen. Die Inklination einer Situation kann Bestätigen, Widerlegen oder beides sein. Dies gibt an, wie eine Situation dazu verwendet werden kann, die Gesamtdiagnose zu unterstützen. (Beispielsweise würde "Bestätigen" einer Situation mit Inklination "Widerlegen" der Diagnose nicht helfen.)
  • Eine Diagnoseepisode umfaßt einen Baum von durch kausale Verzweigungen verbundenen Situationen, wobei die Wurzelsituation die Wurzel dieses Baums ist. Die Bestimmung der Wahrheit der Wurzelsituation stellt erst dann eine vollständige Diagnose dar, wenn eine anwendbare Reparatur identifiziert wird. Kausal verbundene Untersituationen werden untersucht, bis die fehlerhafte FRU gefunden ist und eine Reparatur angegeben wird. Somit wird eine hierarchische Diagnose durchgeführt.
  • Wie vorstehend ausgeführt, weist jede Situation Rollen auf, die an Komponenten des interessierenden Netzwerks angebunden sind. Die Anbindung einer Rolle an eine spezifische Netzwerkkomponente wird von dem Netzwerktopologiemodell 14 bestimmt und ist durch die Klassenhierarchie 16 beschränkt. Die Fokusrolle in einer Situation muß ausgefüllt sein, da sie der Zeiger in die Diagnostikinformation ist, die in der Klassenhierarchie 16 gespeichert ist. Unterstützende Rollen können jedoch freigelassen werden, außer wenn sie benötigt werden.
  • In dem in Fig. 3 gezeigten Beispiel einer Situation ist die Situation "Server lädt nicht" und wird nachstehend als Situation 1 bezeichnet. Die Inklination identifiziert, was für die Situation getan werden muß, d.h. Bestätigen, Widerlegen oder beides, um das Ziel der Diagnose zu unterstützen. In diesem Fall versucht die Diagnosemaschine 10 zu bestätigen, daß der Server nicht lädt. In Situation 1 ist der Client die Fokusrolle, und die Allgemeinste Klasse (MGC) ist in Klammern gezeigt. In diesem Fall ist die MGC für den Cient "Server". Der Rollenspieler in dieser Instanz ist Server DS1, der eine Instanz von Server 200 ist, wie aus der Klassenhierarchie 16 von Fig. 2 ersichtlich ist. Die verbleibenden drei Rollen sind der Host, der Weg und das Netzwerk, die für diese Situation unterstützende Rollen sind. Die MGC für den Host ist "Computer", während die MGC für Weg "Netzwerkweg" ist. Die MGC für jede Rolle in einer Situation wird von dem menschlichen Wissensingenieur spezifiziert. Der Rollenspieler für den Host ist "BOOTER", während der Rollenspieler für den Weg noch nicht bestimmt worden ist. Die Rollen der Situation werden somit mit Netzwerkeinheiten ausgefüllt, die aus dem Netzwerktopologiemodell 14 abgeleitet sind. Auf diese Weise setzen Rollen Situationen zu dem gerade diagnostizierten tatsächlichen Netzwerk 20 in Beziehung.
  • Der Wahrheitswert einer Situation kann durch ihre zugehörigen Bestätigungsaktionen bestimmt oder von dem Wahrheitswert von Situationen abgeleitet werden, die durch kausale Verzweigungen dazu in Beziehung stehen. Diese Verhältnisse sind in der Netzwerkklassenhierarchie 16, wie beispielsweise der in Fig. 2 gezeigten, gespeichert und durch die Verwendung der Fokusrollen mit dem Netzwerktopologiemodell 14 verbunden. Als Beispiel wird angenommen, daß die Wahrheit von Situation 1, "Server lädt nicht", von Situation 2, "ein Computer ist abgestürzt", abgeleitet werden kann. Die Wahrheit der ersten Situation wird von der zweiten Situation abgeleitet, wenn bekannt ist, daß: (1) Computer Q die Lade-Host-Rolle (eine unterstützende Rolle) in Situation 1 spielt; 0 auch die Rolle des gestoppten Computers (die Fokusrolle) in Situation 2 spielt und 0 nicht läuft.
  • Die obigen Situationen 1 und 2 stehen durch das "Getragen-von"-Verhältnis zueinander in Beziehung, das eines von sechs kausalen Verhältnissen ist, die eine Kompilation der logischen Implikation-, Äquivalenz- und Negation-Operatoren sind. Die Liste der kausalen Verhältnisse enthält, ist jedoch nicht darauf beschränkt:
  • getragen-von A ist wahr, wenn B wahr ist
  • getragen-von-nicht A ist wahr, wenn B falsch ist
  • negiert-durch A ist falsch, wenn B wahr ist
  • negiert-durch-nicht A ist falsch, wenn B falsch ist
  • äquivalent-zu A ist wahr dann und nur dann, wenn B wahr ist
  • äquivalent-zu-nicht A ist wahr dann und nur dann, wenn B falsch ist
  • Für eine gegebene Situation ist kausale Verzweigungsinformation, die als Zeiger zu Kind- bzw. Child-Situationen angesehen werden kann, die eine Eltern- bzw. Parent-Situation bestätigen oder widerlegen, in einem linearen Unterbaum in der Klassenhierarchie 16 zu finden. Die Endpunkte des Unterbaums sind die MGC der Fokusrolle in der Parent-Situation und die spezifische Klasse des Fokusrollenspielers in dieser Situation. Für die in Fig. 3 dargestellte Situation list die MGC der Fokusrolle Server, so daß Server in der Klassenhierarchie 16 von Fig. 2 ein Endpunkt des Unterbaums ist. Die spezifische Klasse des Fokusrollenspielers (in dieser Situation der Client) ist Servertyp 200. Somit bildet Server 200 den anderen Endpunkt des Unterbaums.
  • Beginnend bei einer Situation auf höchstem Niveau, d.h. dem berichteten Problem, werden die kausalen Verzweigungen erforscht, indem Untersituationen bestätigt und widerlegt werden, bis die Situation auf höchstem Niveau entweder bestätigt oder widerlegt ist und eine anwendbare Reparatur angegeben ist. Die kausalen Verzweigungen, die identifiziert und erforscht werden, werden ausgewählt, indem wiederum die Klasseninformation der Fokusrolle für jede Parent-Situation verwendet wird. Auf diese Weise wird ein "Baum" von kausalen Verzweigungen aufgebaut, indem versucht wird, die Situation an der Wurzel des Baums zu bestätigen oder zu widerlegen. Mit anderen Worten kann der Grund der Situation A&sub1; dadurch erklärt werden, daß dem Weg von Untersituationen gefolgt wird, die A&sub1; bestätigen. In ähnlicher Weise kann der Grund für das Verwerfen von Situation A&sub1; dadurch erklärt werden, daß dem Weg gefolgt wird, der Situation A&sub1; widerlegt. Damit von einer kausalen Verzweigung angenommen werden kann, daß sie eine Erklärung für eine Parent-Situation liefert, muß die Wahrheit für eine Untersituation bestimmt werden, die diese Parent-Situation trägt.
  • Für eine Situation kann es jederzeit viele kausale zu erforschende Verzweigungen geben. Die Auswahl der nächsten zu erforschenden kausalen Verzweigung kann durch Verwendung von Vorbedingungsklauseln gefiltert werden, die der kausalen Verzweigung zugeordnet sind. Das Erforschen einer besonderen Situation, während unterstützende Rollen nicht angebunden sind, kann beispielsweise dazu führen, daß keine nützliche Information bereitgestellt wird. Eine Vorbedingungsklausel blockiert dieses unerwünschte Verhalten. Die kausale Verzweigung zwischen Situationen kann außerdem Rollenentsprechungen und die Abbildung von Rollenbindungen zwischen einer Führungsrollensituation und einer Situation einer unterstützenden Rolle spezifizieren. Der Spieler in einer bestimmten Rolle muß eine Instanz einer Unterklasse der MGC für diese Rolle sein.
  • Eine Ausführungsform der Erfindung verwendet beim Erforschen kausaler Verzweigungen einen abstimmbaren Mechanismus zum Zusammenstellen der Tätigkeitsliste, um basierend auf einer Einschätzung der Kosten und Nutzen dieser Aktionen eine Anleitung bereitzustellen, welche Störungssuchaktionen zu unternehmen sind. Die Diagnosemaschine 10 mit dem Mechanismus zum Zusammenstellen der Tätigkeitsliste versucht, den Fehler in dem LAN 20 hinsichtlich der Einwirkung auf das LAN 20 selbst und der benötigten Arbeitsleistung mit minimalen Kosten zu isolieren. Eine Ausführungsform des Zusammenstellens bewirkt, daß Aktionen, die geringfügige Kosten (d.h. weniger als 5,00 US-$) verursachen, sofort ausgeführt werden, wobei andere Aktionen verschoben ("auf die Tätigkeitsliste gesetzt") werden, bis alle kausalen Verzweigungen erforscht worden sind. Eine dieser Verzweigungen weist dann hoffentlich eine Aktion auf, die geringfügige Kosten verursacht und die richtige Diagnose liefert. Wenn dies nicht geschieht, werden die auf die Liste gesetzten Aktionen schließlich in einer Reihenfolge nach zunehmenden Kosten ausgeführt.
  • Ein Beispiel eines Teils eines LAN 20 ist in Fig. 5 dargestellt. Dieser Teil des Netzwerks ist mit DSNet bezeichnet. Es gibt ein Hauptkabel BC-3, an das die Transceiver TV-4, TV-5 und TV-6 angeschlossen sind. Diese Transceiver TV-4, TV-5 und TV-6 sind Instanzen der Klasse Übertragungsvorrichtung 4000. Der Transceiver TV-4 ist über ein Transceiver- bzw. Sende-Empfangskabel TC-1 an einen mit DS1 bezeichneten Server 200 angeschlossen. Eine mit BYSTANDER bezeichnete Instanz eines Computers 8800 ist über ein Sende-Empfangskabel TC-3 an den Transceiver TV-6 angeschlossen. Eine weitere, mit BOOTER bezeichnete Instanz eines Computers 8800 ist über ein Sende-Empfangskabel TC- 2 an den Transceiver TV-5 angeschlossen. Eine mit LINK bezeichnete Instanz eines Netzwerkweges umfaßt (in Reihenfolge) das Sende-Empfangskabel TC-1, den Transceiver TV-4, das Hauptkabel BC-3, den Transceiver TV-5 und das Sende-Empfangskabel TC-2. Diese Instanz eines Netzwerkweges, LINK, ist ein Aggregat jener spezifischen Komponenten in DSNet, die den Netzwerkweg zwischen DS1 und BOOTER bilden.
  • Ein Beispiel einer Diagnose eines Problems in dem vorstehend beschriebenen Netzwerk dient dazu, die Vorgehensweise der vorliegenden Erfindung zu verdeutlichen. Dementsprechend sind in Fig. 4 ein Beispielproblem und ein Diagnosebaum dargestellt. Für dieses Beispiel werden die folgenden Symbole benutzt, die aus Fig. 4 ersichtlich sind.
  • § eine Situation
  • Å eine Aktion
  • * eine kausale Verzweigung
  • ∅ eine unbesetzte Rolle
  • = ist gleich
  • « ist-getragen-von
  • < ist-getragen-von-nicht
  • // ist-negiert-durch
  • / ist-negiert-durch-nicht
  • == ist-äquivalent-zu
  • = ist-äquivalent-zu-nicht
  • MGC= Most-general-class bzw. Allgemeinste Klasse. Die MGC für eine Rolle ist in Klammern angegeben.
  • (Der Großbuchstabe vor einer Rolle, so wie beispielsweise "L" in "L-Client", bezieht sich einfach auf eine Rolle für eine spezielle Situation.)
  • Der Benutzer beschreibt der Diagnosemaschine 10 ein Problem. Dieses Problem ist:
  • Server lädt nicht, wobei der Lade-Cient (L-Client) der Server DS1 ist. Die Diagnosemaschine 10 verifiziert, daß DS1 eine Unterinstanz von Server ist, und erzeugt:
  • §1: Server lädt nicht.
  • L-Client (Server): DS1
  • L-Netzwerk (Netzwerk): &empty;
  • L-Host (Computer): &empty;
  • L-Weg (Netzwerk-Weg): &empty;
  • Die Inklination für die Wurzelsituation wird auf "Bestätigen" gesetzt.
  • Für diese Situation (§1) gibt es keine Aktionen für Wahrheit. Es gibt jedoch Aktionen mit geringfügigen Kosten, die den Spieler jeder der unterstützenden Rollen identifizieren:
  • Å1T: L-Netzwerk
  • Å1U: L-Host
  • Å1V: L-Weg
  • Obwohl jede Aktion geringfügige bzw. "vernachlässigbare" Kosten verursacht, sind diese reale, zu Buche schlagende Kosten. Die kostengünstigste Aktion ist Å1T: diese Aktion bindet L-Netzwerk an DSnet an. Die nächstteurere ist Å1V: dies hat keinen Erfolg, da zuerst L-Host angebunden werden muß. Dies wird von der Aktion gefordert, nicht von dem Diagnosemechanismus. Schließlich wird Å1U versucht, was L-Host an BOOTER (eine Instanz eines Computers) anbindet. Nun wird Å1V nochmals durchgeführt: L-Weg wird an LINK (eine Instanz eines Netzwerk-Weges und speziell der Weg von DS1 zu BOOTER) angebunden.
  • An diesem Punkt liegt folgende Situation vor:
  • §1: Server lädt nicht.
  • L-Client (Server): DS1
  • L-Netzwerk (Netzwerk): DSnet
  • L-Host (Computer): BOOTER
  • L-Weg (Netzwerk-Weg): LINK
  • Es gibt vier kausale Verzweigungen unter §1, wie aus Fig. 4 ersichtlich ist. Diese kausalen Verzweigungen wurden durch Bezugnahme auf die Klasseninformation in der Fokusrolle von Situation §1 aus der Klassenhierarchie 16 gewonnen. In diesem Fall ist die MGC der Fokusrolle Server; die spezifische Klasse des Fokusrollenspielers ist Server 200. Die vier kausalen Verzweigungen sind:
  • *1A Einheit bzw. Device Hardware ist OK.
  • Vorbedingungen: &empty;
  • Entsprechungen: L-Client = H-Device
  • *1B Computer ist als Lade-Host konfiguriert.
  • Vorbedingungen: &empty;
  • Entsprechungen: L-Host = A-Host
  • L-Client = A-Client
  • *1C Hindernis im Weg.
  • Vorbedingungen: &empty;
  • Entsprechungen: L-Weg = T-Weg
  • *1D Eine Netzwerkeinheit überträgt unverständlich (jabbering).
  • Vorbedingungen: &empty;
  • Entsprechungen: L-Netzwerk = J-Netzwerk
  • Die erste Rolle in jeder Rollenentsprechung gehört zu der Eltern- bzw. Parent- Situation; die zweite Rolle gehört zu der Kind- bzw. Child-Situation.
  • Alle vier Verzweigungen tragen die Parent-Situation §1, gestützt auf ihre Inklination. Jede dieser Verzweigungen kann erforscht werden.
  • Die Verzweigung *1A ist willkürlich gewählt. Das System bindet H-Device an DS- 1 (die Komponente, die die L-Client-Rolle spielt) an, verifiziert, daß DS-1 eine Unterinstanz von Device ist, und erzeugt:
  • §11: Device Hardware ist OK.
  • H-Device (Device): DS1
  • Die Parent-Inklination war Bestätigen, das Verhältnis ist "< ", so daß die Inklination für diese Situation auf "Widerlegen" gesetzt wird.
  • Es gibt keine Aktionen für diese Situation (§11). Es gibt zwei kausale Verzweigungen:
  • *11A / Einheit kann eingeschaltet werden.
  • Vorbedingungen: &empty;
  • Entsprechungen: H-Device = U-Device; und
  • *11B / Einheit durchläuft Selbsttest erfolgreich.
  • Vorbedingungen: &empty;
  • Entsprechungen: H-Device = T-Device.
  • Diese beiden Verzweigungen widerlegen, wobei sie zu der Widerlegen-Inklination von Situation §11 passen.
  • Dann wird *11B gewählt. Das System bindet T-Device an DS-1 (von L-Client) an, verifiziert, daß DS1 eine Unterinstanz von Device ist, und erzeugt:
  • §112: Device durchläuft Selbsttest erfolgreich.
  • T-Device (Device): DS1
  • Die Parent-Inklination war Widerlegen, das Verhältnis ist "/ ", so daß die Inklination für diese Situation auf Widerlegen gesetzt wird.
  • Für diese Situation gibt es zwei Aktionen:
  • Å112J: Mit Strom versorgen (power-cycle) und LED2 überprufen.
  • Å112K: Mit Strom versorgen und Konsolennachrichten untersuchen (Selbsttest).
  • Diese beiden Aktionen verursachen nicht-geringfügige Kosten, deshalb werden beide Aktionen auf die Tätigkeitsliste gesetzt.
  • Es gibt keine kausalen Verzweigungen unter §112, weshalb die Diagnosemaschine 10 zu §11 zurückgeht. An diesem Punkt wird *11A - die verbleibende noch nicht erforschte Verzweigung - ausgewählt.
  • Das System bindet U-Device an DS-1 an, verifiziert, daß DS1 eine Unterinstanz von Device ist, und erzeugt:
  • §111: Device kann eingeschaltet werden.
  • U-Devioe (Device): DS1
  • Die Parent-Inklination war Widerlegen, das Verhältnis ist "/ ", weshalb die Inklination für diese Situation auf Widerlegen gesetzt wird.
  • Für diese Situation gibt es drei Aktionen:
  • Å111J: Mit Strom versorgen und LED1 überprüfen.
  • Å111K: Mit Strom versorgen und Konsolennachrichten untersuchen (alle).
  • Å111L: Steckdose des Netzkabels testen.
  • Alle vorstehend genannten Aktionen verursachen nicht-geringfügige Kosten, weshalb alle Aktionen auf die Tätigkeitsliste gesetzt werden.
  • Es sind keine kausalen Verzweigungen unterhalb §111 vorhanden, weshalb der Computer 10 zu §11 zurückgeht. Es sind auch keine nicht-erforschten Verzweigungen unterhalb von §11 vorhanden, weshalb die Diagnosemaschine 10 zu §1 zurückgeht.
  • Nun wird die kausale Verzweigung *1B willkürlich ausgewählt. Das System bindet Rollen an, verifiziert die Erfüllung der MGC und erzeugt:
  • §12: Computer ist als Lade-Host konfiguriert.
  • A-Host (Computer): BOOTER
  • A-Client (Server): DS1
  • Die Parent-Inklination war Bestätigen, das Verhältnis ist "< ", weshalb die Inklination für diese Situation auf Widerlegen gesetzt wird.
  • Für diese Situation gibt es zwei Aktionen:
  • Å12J: Lade-Konfiguration der Datenbank überprüfen.
  • Å12K: Client-Software auf Lade-Host verifizieren.
  • Beide Aktionen verursachen nicht-geringfügige Kosten, weshalb beide Aktionen auf die Tätigkeitsliste gesetzt werden.
  • Da keine kausalen Verzweigungen unterhalb §12 vorhanden sind, geht die Diagnosemaschine 10 zu §1 zurück. An diesem Punkt wird *1D willkürlich ausgewählt.
  • Die Verzweigung von §1, *1D, führt zu:
  • §14: Ein Netzwerk-Device überträgt unverständlich.
  • J-Netzwerk (Netzwerk): DSNet.
  • J-Brücken (Brücken-Satz):
  • J-Unternetze (Unternetzwerk-Satz):
  • Die Parent-Inklination war Bestätigen, das Verhältnis ist "«", weshalb die Inklination für diese Situation auf Bestätigen gesetzt wird.
  • Für diese Situation gibt es zwei Rollenspieler-Aktionen:
  • Å14T: J-Brücken
  • Å14U: J-Unternetze
  • Es ist eine Wahrheit-Aktion (nicht-geringfügige Kosten) vorhanden:
  • Å14J: Unverständliche Übertragung tritt in dem Netzwerk auf.
  • Diese Wahrheit-Aktion hört das Netzwerk auf Rauschen ab.
  • Da keine kausalen Verzweigungen unterhalb §14 vorhanden sind, geht die Diagnosemaschine 10 zu §1 zurück. Beim Erforschen der Verzweigung *1C bindet die Diagnosemaschine 10 Rollen an, verifiziert die Erfüllung der MGC und erzeugt:
  • §13: Hindernis im Weg
  • T-Weg (Netzwerk-Weg): LINK.
  • Die Parent-Inklination war Bestätigen 81 das Verhältnis ist "«", weshalb die Inklination für diese Situation auf Bestätigen gesetzt wird.
  • Für diese Situation gibt es eine Aktion:
  • Å13J: Weg-Integrität verifizieren.
  • Diese sendet eine Nachricht von einem Ende des Wegs zum anderen. Sie verursacht nicht-geringfügige Kosten, weshalb sie auf die Tätigkeitsliste gesetzt wird. Es sind zwei kausale Verzweigungen unterhalb §13 vorhanden. Die erste führt zu:
  • §131: Hindernis-in-Komponente
  • O-Komponente (Komponente): TC-1
  • Die Aktion Å131J (Nachricht durch Komponente senden) verursacht nicht-geringfügige Kosten, weshalb sie auf die Tätigkeitsliste gesetzt wird. Die andere kausale Verzweigung (*13B) wird nun erforscht. Dies führt zu:
  • §132: Hindernis-im-Weg
  • T-Weg (Netzwerk-Weg): TV-4, BC-3, TV-5, TC-2
  • Diese Situation untersucht, ob ein Hindernis in dem Netzwerkweg vorhanden ist, der ohne die erste Komponente (TC-1) in dem Weg LINK verbleibt. Es ist festzuhalten, daß §132 eine zweite Instanz der gleichen Situationsklasse "Hindernis- im-Weg" ist. Weitere Untersituationen werden rekursiv erforscht, wobei jedesmal eine andere Komponente aus dem Weg (ursprünglich LINK) entfernt wird, bis gezeigt wird, daß eine der Komponenten das Hindernis ist. Von §132 aus sind beispielsweise zwei kausale Verzweigungen, §1321 und §1322, vorhanden. Die erste Untersituation ist:
  • §1321: Hindernis-in-Komponente
  • O-Komponente (Komponente): TV-4
  • Wenn ein Hindernis in Komponente TV-4 vorhanden ist (d.h. §1321 ist "wahr"), dann wird eine Reparatur oder Ersetzung von TV-4 angegeben. Anderenfalls wird der Rest des Wegs in der anderen kausalen Verzweigung erforscht:
  • §1322: Hindernis-im-Weg
  • T-Weg (Netzwerk-Weg): BC-3, TV-5, TC-2
  • Wenn diese Verzweigung wiederum bestätigt, werden weitere Untersituationen erforscht, bis die fehlerhafte Komponente isoliert ist.
  • Somit wurde ein Baum von durch kausale Verzweigungen verbundenen Situationen geschaffen, wie in Fig. 4 gezeigt ist. Eine Tätigkeitsliste, die nützliche Aktionen mit nicht-geringfügigen Kostenvektoren enthält, wurde ebenfalls geschaffen. Wenn die Aktionen mit geringfügigen Kosten die Diagnose nicht vollständig liefern konnten, werden die früher auf die Tätigkeitsliste gesetzten Aktionen verwendet. Basierend auf einem Vergleich des Kostenvektors jeder Aktion wird die kostengünstigste Aktion gewählt. Diese Aktion wird nun durchgeführt. Falls erfolgreich, bestimmt die Aktion die Wahrheit ihrer zugeordneten Situation. Diese Wahrheit wird so weit wie möglich nach oben weitergeleitet.
  • Die Kosten einer Aktion basieren auf verschiedenen Dimensionen bzw. Grundlagen (tatsächliche Zeit, Computerzeit, Netzwerkverkehr, Geld, menschliche Arbeitskraft). Innerhalb jeder Dimension können die Kosten auch eine Zeitabhängigkeit zeigen. Es wird angenommen, daß zahlreiche Aktionen mit nicht-geringfügigen Kosten auf die Tätigkeitsliste gesetzt wurden.
  • Gewählt sei Aktion Å12K: Verifizieren-Client-Software-auf-Host. Die Software wird über das Netzwerk überprüft. Die Software ist in Ordnung und beeinflußt die Wahrheit von §12 nicht. (Wenn die Software fehlerhaft wäre oder fehlen würde, würde §12 widerlegt). Als nächste Aktion wird Å12J gewählt: Überprüfen-Ladekonfiguration-Datenbank. Eine Netzwerksanfrage zeigt wiederum, daß der Host korrekt konfiguriert ist.
  • Es geht weiter mit Aktion: "Å111K: Überprüfen-Konsolennachricht-für-Einschalten" wird gewählt. Eine menschlicher Diagnostiker wird angewiesen, DS1 mit Strom zu versorgen und die Konsole zu beobachten. Die Nachrichten, die erscheinen, zeigen erfolgreiches Einschalten an und bestätigen dadurch §111. Die Nachrichten zeigen auch an, daß DS1 seinen Selbsttest erfolgreich durchläuft, diese Information wird in einem Cache-Speicher gespeichert. Dies senkt die Kosten von Å112K auf geringfügig; der Kostenvektor wird automatisch modifiziert.
  • Die nächste ausgewählte Aktion ist Å112K Überprüfen-Konsolennachricht-ob- Selbsttest-erfolgreich-durchlaufen. Die Datenbank gibt OK zurück und §112 ist bestätigt.
  • Es werden weiterhin Aktionen von der Tätigkeitsliste ausgewählt und durchgeführt, bis das Problem in dem Netzwerk identifiziert ist. Zur Verdeutlichung wird beispielsweise die Aktion Å131K (Untersuchen-Komponentenverbindungen) ausgewählt. Der Diagnostiker wird aufgefordert, die Netzwerkverbindungen der Komponente zu überprüfen, die die O-Komponentenrolle in Situation §131 (Sende-Empfangskabel TC-1) spielt. Wenn der Diagnostiker berichtet, daß das Kabel an einem Ende nicht angeschlossen ist, wird Situation §131 als wahr bestimmt. Dieser Wahrheitswert wird längs der kausalen Verzweigungen *13A und *1C weitergeleitet und bestimmt §13 und §1 als wahr. Da Situation §131 wahr ist, ist die Inklination von §131 "Bestätigen", und §131 weist ein "reparieren-wenn- wahr" auf, die Reparatur "Reparieren TC-1 (des Spielers in der O-Komponentenrolle)" wird angegeben, und die Diagnose ist fertiggestellt. Die für den Fehler verantwortliche ersetzbare Feldeinheit (FRU) sowie die geeignete Reparatur wurden identifiziert.

Claims (13)

1. Computergestütztes Verfahren zur Durchführung von Fehlerdiagnose in einem Netzwerk mit einer Vielzahl von Komponenten unter Verwendung von modellbasierter Schlußfolgerung, wobei das Verfahren folgende Schritte umfaßt:
Speichern von möglichen Komponenten für das Netzwerk (20), von auf die Komponenten bezogener Information und von Verbindungen zwischen Komponenten als hierarchische Struktur in einer Komponentenbibliothek (18);
Speichern einer Vielzahl von Situationen, wobei jede Situation eine Aussage über eine oder mehrere Komponenten des Netzwerks (20) ist, wobei jede Situation eine Inklination umfaßt, die spezifiziert, ob die Angabe zu bestätigen oder zu widerlegen ist, wobei jede Situation wahlweise eine Aktion umfaßt, um eine diagnostische Funktion auszuführen, wobei jede Situation wahlweise eine oder mehrere Verbindungen zu anderen Situationen umfaßt;
Empfangen eines Berichts eines Fehlers in einer Komponente des Netzwerks (20);
Herbeiführen einer Grund- bzw. Wurzelsituation, die das berichtete Problem darstellt, wobei die Grundsituation eine der Vielzahl von Situationen ist;
Schaffen eines Diagnosebaums durch:
(i) Hinzufügen der Aktion für die Grundsituation zu einer Tätigkeitsliste,
(ii) wenn die Grundsituation keine Aktion aufweist, Verwendung der Komponentenbibliothek, um andere Situationen auszuwählen, die die Inklination der Grundsituation unterstützen werden,
(iii) Hinzufügen der Aktion für jede ausgewählte Situation zu der Tätigkeitsliste, wenn die ausgewählte Situation eine Aktion aufweist,
(iv) wenn die ausgewählte Situation keine Aktion aufweist, Verwendung der Komponentenbibliothek, um andere Situationen auszuwählen, die die Inklination der ausgewählten Situation unterstützen werden, und
(v) rekursives Wiederholen der Teilschritte (iii) und (iv) für jede ausgewählte Situation;
hierarchisches Einordnen jeder Aktion auf der Tätigkeitsliste gemäß einem festgelegten Schema;
Ausführen jeder Aktion auf der Tätigkeitsliste der Reihe nach, bis der Fehler in dem Netzwerk identifiziert ist.
2. Verfahren nach Anspruch 1, bei dem jeder Aktion prozedurale Codes zugeordnet sind, die eine diagnostische Funktion ausführen.
3. Verfahren nach Anspruch 1, bei dem die Durchführung jeder Aktion einer Situation einen Wahrheitswert für die Situation festsetzt.
4. Verfahren nach Anspruch 1, bei dem eine Komponente einen Satz von Teilkomponenten enthält.
5. Verfahren nach Anspruch 1, das des weiteren den Schritt umfaßt, die Inklination der Grundsituation auf Bestätigen zu setzen.
6. Verfahren nach Anspruch 1, bei dem die Komponentenbibliothek, die Netzwerktopologie-Informationsbasis und die Vielzahl von Situationen in einer Speichervorrichtung gespeichert werden.
7. Verfahren nach Anspruch 1, bei dem jede der Vielzahl von Situationen eine oder mehrere Rollen umfaßt, wobei jede Rolle jede Situation an eine in der Komponentenbibliothek gespeicherte Komponente anbindet.
8. Verfahren nach Anspruch 7, das des weiteren den Schritt umfaßt, die Netzwerktopologie-Informationsbasis zu verwenden, um jede Rolle an eine relevante Komponente des Netzwerks anzubinden.
9. Computerimplementiertes System zum Durchführen von Fehlerdiagnose in einem Computernetzwerk mit einer Vielzahl von Komponenten und Teilkomponenten, wobei das System umfaßt:
eine Komponentenbibliothek (18), die mögliche Komponenten und Teilkomponenten für das Netzwerk, auf die Komponenten und Teilkomponenten bezogene Information und Verbindungen zwischen Komponenten und Teilkomponenten als hierarchische Struktur speichert;
eine Netzwerktopologie-Informationsbasis (14), die die Komponenten und Teilkomponenten des Netzwerks (20) modelliert;
eine Vielzahl von Situationen, wobei jede Situation eine Angabe über eine einzelne Komponente des Netzwerks oder einen Satz von Komponenten des Netzwerks ist, wobei jede Situation eine Inklination umfaßt, die spezifiziert, ob die Angabe zu bestätigen oder zu widerlegen ist, wobei jede Situation wahlweise eine Aktion umfaßt, der prozedurale Codes zugeordnet sind, um eine Fehlerdiagnostikfunktion durchzuführen, wobei jede Situation wahlweise eine oder mehrere Verbindungen zu verwandten Situationen umfaßt;
eine Einrichtung zum Empfangen eines Berichts eines Problems in einer Komponente des Netzwerks;
eine Einrichtung zum Herbeiführen einer Grund- oder Wurzelsituation, die das berichtete Problem darstellt, wobei die Grundsituation eine der Vielzahl von Situationen ist; und
eine Einrichtung zum Durchführen einer hierarchischen Diagnose (26), wobei die Einrichtung umfaßt:
(i) eine Einrichtung zum Durchführen der Aktion für die Grundsituation, wenn die Grundsituation eine Aktion aufweist, die die Inklination der Grundsituation unterstützt,
(ii) eine Einrichtung zum Verwenden der Komponentenbibliothek, um andere Situationen auszuwählen, die mit der Grundsituation verbunden sind, die die Inklination der Grundsituation unterstützen wird, wenn die Grundsituation keine Aktion aufweist, die die Inklination für die Grundsituation unterstützt,
(iii) eine Einrichtung zum Setzen der Inklination für jede gewählte Situation,
(iv) eine Einrichtung zum Durchführen der Aktion für jede ausgewählte Situation, wenn die ausgewählte Situation eine Aktion aufweist, die die Inklination der ausgewählten Situation unterstützt, und
(v) eine Einrichtung zum Verwenden der Komponentenbibliothek, um andere Situationen auszuwählen, die mit einer ausgewählten Situation verbunden sind, die die Inklination der ausgewählten Situation unterstützen werden, wenn die ausgewählte Situation keine Aktion aufweist, die die Inklination für die ausgewählte Situation unterstützt.
10. System nach Anspruch 9, bei dem die Komponentenbibliothek (18), die Netzwerktopologie-Informationsbasis (14) und die Vielzahl von Situationen in einer Speichervorrichtung gespeichert sind.
11. System nach Anspruch 9, bei dem das Netzwerk (20) ein lokales Netzwerk ist.
12. System nach Anspruch 9, bei dem jede der Vielzahl von Situationen Rollen umfaßt, die jede Situation an Komponenten und Teilkomponenten anbindet, die in der Komponentenbibliothek gespeichert sind.
13. System nach Anspruch 9, das des weiteren eine Einrichtung zum Verwenden der Netzwerktopologie-Informationsbasis umfaßt, um jede Rolle an eine relevante Komponente oder Teilkomponente des Netzwerks anzubinden.
DE69113077T 1990-02-15 1991-02-13 Modellgestütztes deduktives System für Netzwerksfehlerdiagnose. Expired - Fee Related DE69113077T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US48057690A 1990-02-15 1990-02-15

Publications (2)

Publication Number Publication Date
DE69113077D1 DE69113077D1 (de) 1995-10-26
DE69113077T2 true DE69113077T2 (de) 1996-05-30

Family

ID=23908497

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69113077T Expired - Fee Related DE69113077T2 (de) 1990-02-15 1991-02-13 Modellgestütztes deduktives System für Netzwerksfehlerdiagnose.

Country Status (4)

Country Link
US (1) US5428619A (de)
EP (1) EP0442809B1 (de)
JP (1) JPH05313940A (de)
DE (1) DE69113077T2 (de)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9019017D0 (en) * 1990-08-31 1990-10-17 Hewlett Packard Co Network fault analysis
CA2122334A1 (en) * 1992-08-28 1994-03-17 Per-Arne Carebrand Management in telecom and open systems
EP0616708B1 (de) * 1992-10-13 2000-03-22 Hewlett-Packard Company Systemverwaltungsverfahren und -vorrichtung.
US5666481A (en) * 1993-02-26 1997-09-09 Cabletron Systems, Inc. Method and apparatus for resolving faults in communications networks
US5793933A (en) * 1993-09-13 1998-08-11 Kabushiki Kaisha Toshiba Computer-implemented system and method for constructing a system
WO1995008886A1 (en) * 1993-09-20 1995-03-30 Cabletron Systems, Inc. Communications network management system and method, using fuzzy logic
US5528516A (en) 1994-05-25 1996-06-18 System Management Arts, Inc. Apparatus and method for event correlation and problem reporting
US5664093A (en) * 1994-12-27 1997-09-02 General Electric Company System and method for managing faults in a distributed system
US5717835A (en) * 1995-01-11 1998-02-10 International Business Machines Corporation Simple approach to case-based reasoning for data navigation tasks
US5724503A (en) * 1995-03-31 1998-03-03 Sun Microsystems, Inc. Method and apparatus for interpreting exceptions in a distributed object system
US5619645A (en) * 1995-04-07 1997-04-08 Sun Microsystems, Inc. System isolation and fast-fail
US5809282A (en) * 1995-06-07 1998-09-15 Grc International, Inc. Automated network simulation and optimization system
US5878420A (en) * 1995-08-31 1999-03-02 Compuware Corporation Network monitoring and management system
US6356886B1 (en) 1995-11-30 2002-03-12 Electronic Data Systems Corporation Apparatus and method for communicating with a knowledge base
US5864660A (en) * 1996-03-12 1999-01-26 Electronic Data Systems Corporation Testing the integration of a plurality of elements in a computer system using a plurality of tests codes, each corresponding to an alternate product configuration for an associated element
US6311166B1 (en) 1996-07-25 2001-10-30 Price Waterhouse World Firm Services Bv Method for analyzing effectiveness of internal controls in a model of an accounting system
JP3450611B2 (ja) * 1996-09-18 2003-09-29 富士通株式会社 障害情報管理装置
US5996090A (en) * 1997-10-29 1999-11-30 International Business Machines Corporation Method and apparatus for quantitative diagnosis of performance problems using external representations
US6651189B1 (en) * 1998-09-02 2003-11-18 Korea Telecommunication Authority Communication network disturbance management method using top-down method
US6707795B1 (en) * 1999-04-26 2004-03-16 Nortel Networks Limited Alarm correlation method and system
US6918059B1 (en) * 1999-04-28 2005-07-12 Universal Music Group Method and system for handling errors in a distributed computer system
US6513129B1 (en) * 1999-06-30 2003-01-28 Objective Systems Integrators, Inc. System and method for managing faults using a gateway
US6574633B1 (en) * 1999-11-01 2003-06-03 Honeywell International Inc. Method for dynamically grouping limited range physical entities in a topological space
US6604208B1 (en) * 2000-04-07 2003-08-05 Telefonaktiebolaget Lm Ericsson (Publ) Incremental alarm correlation method and apparatus
WO2001099010A1 (en) * 2000-06-21 2001-12-27 Applied Systems Intelligence, Inc. Method and system for providing an intelligent goal-oriented user interface to data and services
US7409356B1 (en) 2000-06-21 2008-08-05 Applied Systems Intelligence, Inc. Method and system for intelligent supply chain collaboration
US6892192B1 (en) 2000-06-22 2005-05-10 Applied Systems Intelligence, Inc. Method and system for dynamic business process management using a partial order planner
US6751661B1 (en) * 2000-06-22 2004-06-15 Applied Systems Intelligence, Inc. Method and system for providing intelligent network management
DE50014349D1 (de) * 2000-07-22 2007-07-05 Abb Research Ltd System zur unterstützung einer fehlerursachenanalyse
US6684180B2 (en) * 2001-03-08 2004-01-27 International Business Machines Corporation Apparatus, system and method for reporting field replaceable unit replacement
EP1405187B1 (de) * 2001-07-06 2019-04-10 CA, Inc. Verfahren und system zum korrelieren und bestimmen von wurzelursachen von system- und unternehmensereignissen
DE10133375A1 (de) * 2001-07-10 2003-01-30 Daimler Chrysler Ag Verfahren und Vorrichtung zum automatischen Erstellen eines Bayes-Netzwerks
US6907430B2 (en) 2001-10-04 2005-06-14 Booz-Allen Hamilton, Inc. Method and system for assessing attacks on computer networks using Bayesian networks
CN100459462C (zh) * 2002-08-29 2009-02-04 华为技术有限公司 通讯系统故障诊断方法和系统
DE10307342B4 (de) * 2003-02-21 2005-08-11 Volkswagen Ag Vorrichtung und Verfahren zur modellbasierten On-Board-Diagnose
DE10307343B4 (de) * 2003-02-21 2005-10-06 Volkswagen Ag On-Board-Diagnosevorrichtung und On-Board-Diagnoseverfahren für Kraftfahrzeuge
DE10312557B4 (de) * 2003-03-21 2007-07-12 Volkswagen Ag Verfahren zur Überprüfung der funktionalen Sicherheit von elektronischen Systemen eines Fahrzeugs
US20040221198A1 (en) * 2003-04-17 2004-11-04 Vecoven Frederic Louis Ghislain Gabriel Automatic error diagnosis
US20050005572A1 (en) * 2003-07-11 2005-01-13 Perkins Darcie Woodruff Window box and mounting system
US8286168B2 (en) * 2003-07-11 2012-10-09 Ca, Inc. Infrastructure auto discovery from business process models via batch processing flows
WO2005008404A2 (en) * 2003-07-11 2005-01-27 Computer Associates Think, Inc. Modeling of applications and business process services through auto discovery analysis
US8180610B2 (en) * 2003-10-08 2012-05-15 Honeywell International Inc. Model-based diagnostic interface for a vehicle health management system having a system model with a system nomeclature
FR2875083B1 (fr) * 2004-09-03 2006-12-15 Cit Alcatel Dispositif de diagnostic modulaire a base de connaissances evolutive, pour un reseau de communications
FR2875078B1 (fr) * 2004-09-08 2006-11-24 Cit Alcatel Dispositif de diagnostic a modeles de diagnostic adaptatifs, pour un reseau de communications
FR2886792B1 (fr) * 2005-06-07 2007-08-10 Evolium Sas Soc Par Actions Si Outil de diagnostic de reseau de communication, a exploitation de resultats de tests reels et/ou de validation par mode d'affichage controle
US7529974B2 (en) * 2006-11-30 2009-05-05 Microsoft Corporation Grouping failures to infer common causes
US8073798B2 (en) * 2007-05-24 2011-12-06 Palo Alto Research Center Incorporated Dynamic domain abstraction through meta-analysis
WO2009067709A2 (en) * 2007-11-21 2009-05-28 Motive, Incorporated Service management system and method of executing a policy in a network
US20090240510A1 (en) * 2008-03-18 2009-09-24 Hopkins Lloyd B Balanced Scorecard Method for Determining an Impact on a Business Service Caused by Degraded Operation of an IT System Component
CN101316139B (zh) * 2008-07-14 2011-08-10 中兴通讯股份有限公司 一种光传输设备的状态检测方法和装置
CN102035667B (zh) * 2009-09-27 2012-08-29 华为技术有限公司 网络可靠性评估方法、装置和系统
US8612931B2 (en) 2010-07-14 2013-12-17 International Business Machines Corporation Interactive blueprinting for packaged applications
US9965348B2 (en) * 2014-11-12 2018-05-08 International Business Machines Corporation Optimized generation of data for software problem analysis
CN104503423A (zh) * 2014-11-21 2015-04-08 河南中烟工业有限责任公司 基于profinet的工业以太网控制系统故障诊断方法
CN104486096A (zh) * 2014-11-21 2015-04-01 河南中烟工业有限责任公司 基于工业以太网故障诊断方法中决策树的推理方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4829426A (en) * 1983-09-02 1989-05-09 Cogensys Corporation Computer-implemented expert system and method for decision-making
US4697243A (en) * 1985-07-25 1987-09-29 Westinghouse Electric Corp. Methods of servicing an elevator system
US4803683A (en) * 1985-08-30 1989-02-07 Hitachi, Ltd. Method and apparatus for testing a distributed computer system
US4817092A (en) * 1987-10-05 1989-03-28 International Business Machines Threshold alarms for processing errors in a multiplex communications system
US4866635A (en) * 1987-10-19 1989-09-12 Carnegie Group Inc. Domain independent shell for building a diagnostic expert system

Also Published As

Publication number Publication date
EP0442809A2 (de) 1991-08-21
EP0442809B1 (de) 1995-09-20
JPH05313940A (ja) 1993-11-26
DE69113077D1 (de) 1995-10-26
US5428619A (en) 1995-06-27
EP0442809A3 (en) 1992-09-16

Similar Documents

Publication Publication Date Title
DE69113077T2 (de) Modellgestütztes deduktives System für Netzwerksfehlerdiagnose.
DE69523588T2 (de) Gerät und methode zur ereigniskorrelation und problemmeldung
DE68929289T2 (de) Expertensystem für fehlerdiagnose
DE60007587T2 (de) Automatische diagnostik von drucker-systemen mittels bayesianischen netzwerken
DE60017457T2 (de) Verfahren zur isolierung eines fehlers in fehlernachrichten
DE602005004997T2 (de) Diagnostisches Verfahren und System
DE60005861T2 (de) Verfahren und system zur analyse von kontinuirlichen parameterdaten für diagnostik und reparaturen
DE69023389T2 (de) &#34;Unbekannt&#34;-Antwortverarbeitung in einem Expertendiagnosesystem.
DE69225822T2 (de) Auf Hypothesen und Schlussfolgerungen basiertes Diagnoseverfahren von Datenkommunikationsnetzwerken
DE69803575T2 (de) Visualisierung in einem modularen softwaresystem
DE60106799T2 (de) Probabilistische Diagnose, inbesondere für eingebettete Fernanwendungen
DE69328164T2 (de) Systemverwaltungsverfahren und -vorrichtung.
DE19742446B4 (de) Fehlerdiagnoseverfahren
DE68926130T2 (de) Diagnoseexpertensystem
DE69712119T2 (de) Ein effizientes datengesteuertes Theorierevisionssystem
DE69214171T2 (de) Fehlerdiagnose durch Prozess-Simulation
EP1192543B1 (de) Verfahren und anordnung zur ermittlung eines fehlerbaums eines technischen systems, computerprogramm-erzeugnis und computerlesbares speichermedium dafür
EP0685086B1 (de) Einrichtung zur automatischen erzeugung einer wissensbasis für ein diagnose-expertensystem
DE102004015504A1 (de) Verfahren und Vorrichtung zur diagnostischen Wahl eines Wartungskonzepts für ein komplexes System
DE102004024262A1 (de) Wissensbasiertes Diagnosesystem für ein komplexes technisches System mit zwei getrennten Wissensbasen zur Verarbeitung technischer Systemdaten und zur Verarbeitung von Kundenbeanstandungen
DE10220938A1 (de) Ein Verfahren und ein System zum Prüfen einer Unternehmenskonfiguration
WO2006105930A1 (de) Diagnosesystem zur bestimmung einer gewichteten liste möglicherweise fehlerhafter komponenten aus fahrzeugdaten und kundenangaben
DE102004015400A1 (de) Methode und Einrichtung für die Bewertung der Wartungsfähigkeit von komplexen Systemen
DE102004015503A1 (de) Verfahren und Vorrichtung zum Korrigieren diagnostischer Analysekonzepte in komplexen Systemen
DE10349005B4 (de) Verfahren zur Überwachung eines Netzwerks

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8328 Change in the person/name/address of the agent

Free format text: GRUENECKER, KINKELDEY, STOCKMAIR & SCHWANHAEUSSER, 80538 MUENCHEN

8339 Ceased/non-payment of the annual fee