-
HINTERGRUND DER ERFINDUNG
-
Eine Ausführungsform betrifft allgemein das Identifizieren der Detektion von Fehlern und Anomalien in den Wartungsreparaturdaten.
-
Dienstleister, etwa die Wartungsabteilung bei einem Vertragshändler, diagnostizieren Problemkreise in der Fahrzeugelektronik mithilfe von Wartungsdiagnosewerkzeugen, die Diagnosesoftwarealgorithmen verwenden. Auf der Grundlage von Diagnosesoftwarealgorithmen werden Diagnosestörungscodes (DTCs) im Fahrzeug gesetzt. Die Wartungsdiagnosewerkzeuge holen DTCs aus dem Speicher eines Fahrzeugprozessors und werden verwendet, um den Fehler im Fahrzeug zu bestimmen. Jeder Prozessor im Fahrzeug enthält einen Speicher, der DTCs speichert, wenn das Fahrzeug einen Fehler aufweist und dieser detektiert wird. Der Wartungstechniker kann die aktuellen oder den Verlauf beliebiger DTCs untersuchen, um die Ursache im Fahrzeug zu ermitteln. DTCs sind alphanumerische Codes, die verwendet werden, um einen Fehler zu identifizieren, der in verschiedenen Komponenten im Fahrzeug auftritt. Derartige DTCs stehen in Beziehung mit verschiedenen elektrischen Funktionen des Fahrzeugs, welche den Kraftmaschinenbetrieb, Emissionen, das Bremsen, den Antriebsstrang, die Sicherheit und die Lenkung umfassen, aber nicht darauf beschränkt sind. Jedes Teilsystem kann seinen eigenen fahrzeugeigenen Prozessor aufweisen, um Fehler im Betrieb des Teilsystems zu überwachen, oder ein Prozessor kann für das Überwachen von Fehlern für mehrere Teilsysteme zuständig sein. Wenn der Teilsystemprozessor einen Fehler detektiert, werden ein oder mehrere DTCs erzeugt.
-
Die DTCs unterstützen den Wartungstechniker bei der genauen Lokalisierung des betroffenen Bereichs. Mit der Hilfe eines Abfragewerkzeugs holt der Wartungstechniker DTCs. Obwohl der DTC den Techniker beim genauen Lokalisieren des betroffenen Bereichs unterstützt, liefert der DTC keine definitiven Informationen hinsichtlich der genauen Ursache des Problems. Gewöhnlich zeigt ein DTC einen Fehler entweder in einer speziellen Komponente, oder in einer Schaltung, welche die Komponente mit dem Steuermodul verbindet, oder im Steuermodul selbst an. Nun ist es immer noch Aufgabe des Technikers, die Ursache zu identifizieren, indem er weitere Tests an elektrischen Schaltungen durchführt, analytische Schlussfolgerungen, frühere Erfahrungen oder die bestmögliche Schätzung verwendet. Somit bieten DTCs eine Diagnose nur bis zu einem gewissen Grad, und eine zusätzliche Verfeinerung der Diagnose kann nur erreicht werden, indem zusätzliche Feldtests durchgeführt werden und zusätzliche Betriebsparameterdaten vom Fahrzeug aufgenommen werden. Manchmal kann der Algorithmus, der den DTC erzeugt, einen Programmierfehler aufweisen und dem Techniker eine falsche Diagnose liefern. Zudem können DTCs ein zeitweise auftretendes oder temporäres Verhalten aufweisen, was aufgrund des Fehlens der Betriebsbedingungen beim Setzen des DTCs von Technikern schwer zu beheben ist. Ein zeitweise auftretendes Verhalten von Fehlern liegt in denjenigen Fällen vor, wenn ein Fehler ausgelöst und aufgezeichnet wird, die Fehlerbedingungen jedoch beim Wartungs- und Reparaturzentrum nicht nachvollzogen werden können.
-
Das Abfragewerkzeug kann ferner fahrzeugeigene Diagnosebetriebsparameteridentifikatoren (PIDs) holen, um spezielle Informationen zu ermitteln, die von einem Sensor oder einer ähnlichen Einrichtung ausgegeben wurden. Ein PID-Code ist ein Betriebsparameter einer Komponente, der mithilfe des Abfragewerkzeugs aufgezeichnet wird, und der durch Lesen am Kommunikationsbus des Fahrzeugs übertragen wird. Eine der Einrichtungen am Kommunikationsbus erkennt den PID-Code, für den sie zuständig ist, und sendet Informationen mit Bezug auf den PID-Code zurück, die weitere Details bzgl. einer oder mehrerer der Einrichtungen, die Daten erfassen, mit Bezug auf den detektierten Fehler enthalten. Jedoch kann die Anzahl von PIDs, die einen DTC betreffen, ziemlich zahlreich sein und für Wartungspersonal ist eine zufällige Analyse der PID-Codes zeitaufwendig und mühsam.
-
Die Druckschrift US 2008 / 0 004 764 A1 offenbart ein Verfahren zur Sammlung und Analyse von Diagnosedaten, um Fehler in Fahrzeugkomponenten zu diagnostizieren, bei dem historische Fahrzeugdiagnosedaten statistisch analysiert werden, um Betriebsparameterbereiche zu bestimmen, die normalen Betriebsbedingungen und verschiedenen Fehlerbedingungen entsprechen.
-
In der Druckschrift
DE 10 2008 020 380 B4 ist ein Verfahren zum rechnergestützten Lernen einer Steuerung und/oder Regelung eines technischen Systems offenbart, bei dem beruhend auf Trainingsdaten, die im Betrieb des technischen Systems erfasst wurden, eine Qualitätsfunktion und eine Aktionsauswahlregel gelernt werden, wobei die Qualitätsfunktion einen Optimalbetrieb des technischen Systems modelliert und die Aktionsauswahlregel die jeweils bevorzugte Aktion im Betrieb angibt.
-
Die Druckschrift
DE 10 2007 010 978 A1 offenbart ein Verfahren zur Unterstützung einer Diagnose eines elektrischen Systems mittels wahrscheinlichkeitsbasierter Fehlerkandidatenermittlung, bei dem ein Strukturdatensatz mit Informationen zu Komponenten und deren Verschaltung erfasst wird, Informationen zu Ausfallwahrscheinlichkeiten der Komponenten erfasst werden, und Fehlerereignisinformationen erfasst werden und daraus ein Bayes-Netz erstellt wird, das eine Ursache-Wirkungs-Beziehung zwischen den Komponenten und den Fehlerereignissen abbildet.
-
In der Druckschrift
EP 2 857 916 A1 ist ein Verfahren zum Detektieren eines Fehlers in einer Anordnung offenbart, die durch mindestens einen Parameter charakterisierbar ist, bei dem mehrere Werte des Parameters zu mehreren Zeitpunkten und/oder an mehreren Messpunkten erfasst und in mehrere Gruppen eingeteilt werden. Wenn die Anzahl der Werte einer Gruppe nicht mit einem vorgegebenen Bereich übereinstimmt, wird ein Fehlersignal ausgelöst.
-
ZUSAMMENFASSUNG DER ERFINDUNG
-
Ein Vorteil einer Ausführungsform ist die Detektion von Programmierfehlern in Diagnosesoftwarealgorithmen unter Verwendung von Daten von Betriebsparameteridentifikatoren (PIDs). Zudem kann beim Fehlen irgendwelcher in den Betriebsparameteridentifikatoren detektierten Anomalien unter Verwendung der PIDs ermittelt werden, ob der Fehler die identifizierte Schaltung betrifft, die gegenwärtig getestet und gewartet wird. Die hier beschriebene Technik kann verfügbare PIDs analysieren, PIDs in informative von nicht informative Kategorien einteilen, Fehlerbedingungen aus den Kategorien detektieren, ermitteln, ob im Diagnosealgorithmus ein Programmierfehler existiert, die Schlüssel-PIDs ermitteln, die zur Charakterisierung der zeitweise auftretenden DTCs zuständig sind und ermitteln, ob der Fehler die identifizierte Schaltung betrifft, die gerade getestet wird.
-
Eine Ausführungsform betrachtet eine auf einer Parameteridentifikation basierende Fehlerisolationstechnik. Es wird eine Diagnosesoftwareroutine ausgeführt, um Diagnosestörungscodes zu identifizieren, welche zum Detektieren von Fehlern in einer Schaltung eines gegenwärtig gewarteten Fahrzeugs verwendet werden. Die Diagnosesoftwareroutine holt Parameteridentifikationsdaten, welche die Schaltung betreffen, die durch den detektierten Fehler identifiziert wird. Parameteridentifikationsdaten von früher gewarteten Fahrzeugen werden an einem Computer beschafft. Die Parameteridentifikationsdaten werden von denjenigen früher gewarteten Fahrzeugen geholt, welche Fahrzeuge umfassen, die die gleichen Fahrzeugspezifikationen wie das gegenwärtig gewartete Fahrzeug unter im Wesentlichen gleichen Betriebsbedingungen wie das gegenwärtig gewartete Fahrzeug aufweisen. Die Parameteridentifikationsdaten der früher gewarteten Fahrzeuge werden auf der Grundlage einer wechselseitigen Abhängigkeit voneinander in mehrere Cluster gruppiert. Eine gemeinsame Wahrscheinlichkeitsverteilung wird als Funktion einer wechselseitigen Abhängigkeit der Parameteridentifikationsdaten der früher gewarteten Fahrzeuge ermittelt. Parameteridentifikationsdaten des gegenwärtig gewarteten Fahrzeugs, die eine Kohärenz mit den Parameteridentifikationsdaten von den früher gewarteten Fahrzeugen aufweisen, werden ausgewählt. Eine wechselseitige Abhängigkeit der Parameteridentifikationsdaten des gegenwärtig gewarteten Fahrzeugs wird auf die entsprechende gemeinsame Wahrscheinlichkeitsverteilung abgebildet. Eine Anomalie bei den Parameteridentifikationsdaten des gegenwärtig gewarteten Fahrzeugs wird in Ansprechen darauf detektiert, dass die Wahrscheinlichkeitsverteilung der Parameteridentifikationsdaten außerhalb einer vorbestimmten Varianz liegt. Die detektierte Anomalie stellt einen Programmierfehler in der Diagnosesoftwareroutine und/oder ein zeitweises Auftreten eines jeweiligen Diagnosestörungscodes dar. Die Diagnosesoftwareroutine und/oder eine Komponente, die mit dem zeitweisen Auftreten des jeweiligen Diagnosestörungscodes verbunden ist, werden modifiziert, um den Programmierfehler zu korrigieren.
-
Figurenliste
-
- 1 ist ein Blockdiagramm eines Diagnosereparaturmeldesystems.
- 2 ist ein Flussdiagramm eines Verfahrens für eine Technik zur Klassifizierung von Anomalien von Fehlern.
- 3 ist eine grafische Bildschirmdarstellung zur Identifikation von Hauptkomponenten zur Verwendung bei der Clusterbildung und der Divergenzanalyse.
- 4a-4c sind grafische Umrissdarstellungen zur Identifikation korrekt gruppierter Cluster.
- 5 ist eine grafische Darstellung der Verteilungsdichte für einen PID-Trainingsdatensatz.
- 6 ist eine beispielhafte grafische Darstellung der Verteilungsdichte für PID-Testdaten, die eine Kohärenz zwischen den Datensätzen anzeigt.
- 7 ist eine beispielhafte grafische Darstellung der Verteilungsdichte für PID-Testdaten, die eine Nichtkohärenz zwischen den Datensätzen anzeigt.
- 8 ist ein beispielhaftes Balkendiagramm, das eine hohe KL-Divergenz darstellt.
- 9 ist ein beispielhaftes Balkendiagramm, das eine niedrige KL-Divergenz darstellt.
-
GENAUE BESCHREIBUNG
-
In 1 ist ein Diagnosereparaturmeldesystem 10 gezeigt. Das Diagnosereparaturmeldesystem 10 enthält mehrere Wartungszentren 12 zum Melden von Diagnosestörungscodes (DTCs), die durch das Warten von Fahrzeugen beschafft werden.
-
Zur Ermittlung, ob bei einer speziellen Wartungsreparatur eine Fehldiagnose aufgetreten ist, werden Reparaturdaten von den Wartungsstationen geholt. Originalteilhersteller, etwa Kraftfahrzeugfirmen, unterhalten ein Online-Reparaturmeldesystem. Bei diesem Beispiel werden die Fahrzeuge zu einer Wartungsstation gebracht, etwa einer Wartungsabteilung bei einem Vertragshändler. Die Techniker werden unter Verwendung eines Abfragewerkzeugs 14, das mit einen oder mehreren Prozessoren im Fahrzeug (z.B. einem Kraftmaschinensteuermodul) kommuniziert, eine Diagnoseprüfung am Fahrzeug laufen lassen. Jeder der Prozessoren im Fahrzeug enthält einen Speicher oder verwendet einen entfernten Speicher, um DTCs 16 zu speichern, wenn am Fahrzeug ein Problem auftritt und ein Fehlercode aufgezeichnet wird. Das Speichern der DTCs 16 im Fahrzeugprozessorspeicher erleichtert dem Wartungstechniker den Versuch, das Problem im Fahrzeug zu erfassen, speziell wenn das Fahrzeug gegenwärtig das Problem nicht zeigt; stattdessen kann der Wartungstechniker die aktuellen oder den vergangenen Verlauf beliebiger DTCs untersuchen, die im Speicher des Fahrzeugs gespeichert worden sind, um zu ermitteln, welche Problemkreise im Fahrzeug vorhanden waren, als das Problem auftrat. Die DTCs 16 sind alphanumerische Codes, die verwendet werden, um ein Problem zu identifizieren, das in verschiedenen Komponenten im Fahrzeug auftritt. Derartige DTCs 16 können mit verschiedenen Fahrzeugfunktionen in Beziehung stehen, die einen Kraftmaschinenbetrieb, Emissionen, das Bremsen, den Antriebsstrang und die Lenkung umfassen, aber nicht darauf beschränkt sind. Jedes Teilsystem kann seinen eigenen fahrzeugeigenen Prozessor zum Überwachen von Fehlern beim Betrieb des Teilsystems aufweisen oder ein Prozessor kann für das Überwachen von Fehlern in mehreren Teilsystemen zuständig sein. Wenn der Teilsystemprozessor einen Fehler detektiert, werden ein oder mehrere DTCs 16 erzeugt. Die DTCs 16 werden im Speicher des Prozessors gespeichert und später zum Testen vom Wartungstechniker geholt. Die DTCs 16 unterstützen den Wartungstechniker bei der genauen Lokalisierung des betreffenden Bereichs. Um einen DTC 16 zu holen, wählt der Wartungstechniker einen Modus am Abfragewerkzeug 14, der das Holen von DTCs 16 anfordert, die für einen aktuellen oder vergangenen Fahrzyklus gespeichert wurden. Jedoch ist die Anzahl der DTCs 16 in einem Fahrzeug beschränkt und das Herausfinden der Ursache wird sehr schwierig, wenn mehrere DTCs 16 gleichzeitig ausgelöst werden. Das Abfragewerkzeug 16 kann auch verwendet werden, um die Betriebsparameteridentifikatoren (PIDs) 18 zu holen, die zu dem Zeitpunkt aufgezeichnet worden sind, an dem der DTC ausgelöst und von den fahrzeugeigenen Prozessoren aufgezeichnet wurde. Die Gesundheit der Teilsysteme wird typischerweise durch eine Vielzahl (z.B. tausende) von Betriebs-PIDs 18 überwacht, welche unter Verwendung verschiedener Sensoren und Diagnosesoftwareroutinen, die in den fahrzeugeigenen Prozessoren enthalten sind, ununterbrochen gesammelt werden. Die PIDs 18 werden aus Daten der Betriebsumstände beim Auftreten eines Fehlers (engl.: freeze frame data) erfasst, die ein Satz mit einer beschränkten Anzahl von Instanzen zu dem Zeitpunkt sind, als der DTC auftrat. Die Informationen in den PIDs 18 können Daten enthalten, welche ihre Betriebsbedingung betreffen (z.B. wird ein Verhältnis des Luft/Kraftstoff-Gemisches bereitgestellt, sodass ermittelt werden kann, ob das Verhältnis innerhalb eines minimalen und maximalen Werts liegt). Die DTCs 16 und die PIDs 18 werden erfasst und in einer Vielzahl von Speichereinrichtungen 20 gespeichert, und können zur späteren Analyse geholt werden. Ein Analysewerkzeug 22 steht in Verbindung mit den Speichereinrichtungen 20, um alle oder einen Teil der Wartungsdaten zu holen, welche die DTCs 16 und die PIDs 18 von früher gewarteten Fahrzeugen enthalten, um das Identifizieren von Ursachen eines gegenwärtig gewarteten Fahrzeugs zu unterstützen. Das Analysewerkzeug 22 kann einen Computer, einen Laptop, eine tragbare drahtlose Verarbeitungseinrichtung oder eine ähnliche Einrichtung umfassen, die Daten speichert und die Diagnoseroutinen wie hier beschrieben ausführt.
-
Die hier beschriebene Methodik stellt eine durch Daten gesteuerte Technik bereit, um die PIDs systematisch zu analysieren, und um beim Fehlen irgendeiner Anomalie Fehler im Kraftfahrzeugsystem zu klassifizieren. Das heißt, dass ermittelt wird, ob der von den Testdaten beschriebene Fehler zu einem Fehler gehört, der unter Verwendung von Verlaufsdaten, die nachstehend im Detail beschrieben werden, in einer Trainingsdatenanalyse beschrieben ist. PIDs, die ähnliche Variationstrends zeigen, werden als kohärent beschrieben. Als Folge werden unter Verwendung kohärenter PIDs, nachdem eine Kohärenz zwischen den PIDs in einer Trainingsphase identifiziert wurde, Cluster gebildet. Nachdem Cluster gebildet sind, kann nun eine Vergleichsanalyse des Verhaltens von PIDs, die zu einem gleichen Cluster gehören, zwischen den Trainingsdaten und den Testdaten zur Anomaliedetektion verwendet werden. Da ein Systemfehler von allen PIDs über alle Cluster hinweg für eine jeweilige spezielle Fehlerinstanz beschrieben wird, kann eine gemeinsame Wahrscheinlichkeitsverteilung der PIDs verwendet werden, um die Gruppe von Fehlern zu charakterisieren, die klassifiziert wird. Als Folge enthält die ausgeführte Technik eine Trainingsphase, die historische Wartungsdaten verwendet, und eine Testphase, die sowohl die gegenwärtigen Wartungsdaten als auch historische Wartungsdaten verwendet, um den Fehler zu detektieren.
-
2 stellt ein Flussdiagramm einer allgemeinen Übersicht des Trainingsphasenabschnitts und des Testabschnitts für die Fehlerdetektionstechnik dar. In Schritt 30 werden aus zuvor gewarteten Fahrzeugen mehrere Muster von PID-Daten geholt. Ein Muster ist, so wie es hier beschrieben ist, eine Gruppe von PID-Werten für ein spezifisches Fahrzeug und einen spezifischen DTC. Wenn beispielsweise ein spezifisches Fahrzeug einen spezifischen DTC aufwies, der ausgelöst wurde, dann zeichnet der fahrzeugeigene Prozessor zu dem Zeitpunkt, an dem der DTC ausgelöst wurde, jeweilige Sensorwerte (PIDs) auf, etwa die Fahrzeuggeschwindigkeit, den Drosselklappenwinkel, die Kraftmaschinenkühlmitteltemperatur, die Umgebungstemperatur. Die geholten Trainingsdaten stammen von Fahrzeugen, welche die gleichen Fahrzeugspezifikationen wie das gegenwärtig gewartete Fahrzeug aufweisen.
-
DTCs, die als zeitweise auftretend ermittelt wurden, werden von dem fahrzeugfremden Diagnosewerkzeug vorzugsweise als zeitweise auftretende DTCs identifiziert und markiert. Im Diagnosewerkzeug kann ein Satz heuristischer Richtlinien eingestellt sein, um zu identifizieren, wann ein zeitweise auftretender DTC auftritt, und der identifizierte zeitweise auftretende DTC wird danach als zeitweise auftretender DTC zur zukünftigen Analyse markiert oder beschriftet.
-
Bei Schritt 31 werden PID-Daten vorverarbeitet, um die PID-Daten in Kategorien einzuteilen und PIDs ohne Bezug und mit konstanten Werten unter Verwendung von Kenntnissen aus dem Kraftfahrzeugbereich zu beseitigen.
-
Bei Schritt 32 werden die Daten über die verschiedenen PID-Werte hinweg unter Verwendung einer Datenreduktionstechnik auf Kohärenz analysiert, welche korrelations- und informationstheoretische Maßnahmen verwendet. Bei der hier beschriebenen Datenreduktionstechnik ist eine Schlüsselannahme das Vorhandensein einer Kohärenz zwischen den PIDs. Die Kohärenz stellt die Berechtigung zum Ausbilden der Cluster aus kohärenten PIDs bereit, sodass PIDs in einem gleichen Cluster aufgrund ihrer jeweiligen Kohärenz eine ähnliche Variation aufweisen. Eine Datenreduktion kann unter Verwendung einer Hauptkomponentenanalyse bzw. Principal Component Analysis (PCA) und einer Unabhängigkeitsanalyse bzw. Independent Component Analysis (ICA) angewendet werden, um die Datengröße zu verringern und eine Kohärenz zwischen PID-Werten zu finden.
-
Die PCA identifiziert eine lineare Kombination von Variablen, welche eine Variabilität im Datensatz am besten beschreiben. Die lineare Kombination von Variablen wird durch eine Eigenvektorzerlegung einer Kovarianzmatrix der PID-Daten berechnet. Die lineare Kombination von Variablen, welche die größte Variabilität beschreibt (z.B. 90 % der Gesamtvarianz im Datensatz), wird als Basisvektoren zur Transformation der Daten in einen neuen Raum mit verringerten Dimensionen verwendet. Unter Betrachtung der Redundanz im Datensatz werden Informationen extrahiert. Außerdem ist die PCA nur unter der Annahme effektiv, dass die Daten eine Gaußverteilung aufweisen, was bei Kraftfahrzeugsystemen möglicherweise nicht zutrifft, weil es mehrere nicht lineare Prozesse gibt, die nicht-gaußsche Daten erzeugen können.
-
Die ICA ist eine nicht lineare Technik zum Schätzen statistisch unabhängiger Komponenten aus einer Datenmatrix. Die ICA wird zur linearen Darstellung von nicht-gaußschen Daten verwendet, sodass die Komponenten statistisch unabhängig oder so unabhängig wie möglich sind. Die ICA ist in Systemen am effektivsten, die hochgradig nicht linear sind, bei denen die Daten wahrscheinlicher nicht-gaußsche Daten sind. Da die Daten unter Verwendung der PCA bereits reduziert worden sind, wird die ICA auf die PCA-Datenausgabe angewendet, um zu prüfen, ob eine weitere Reduktion möglich ist.
-
Die durch die PCA und die ICA ermittelte Redundanz zeigt die Kohärenz, die zwischen den PIDs vorhanden ist, welche zur Fehlerdetektion mit zwei Ansätzen verwendet werden kann. Der erste Ansatz reduziert die Anzahl der PIDs und bildet einen Datensatz mit einer mehrfachen Reduktion der Datengröße und unterteilt dann die PID-Daten in so viele Cluster wie die Anzahl von statistisch unabhängigen Komponenten. Die statistische Unabhängigkeit zwischen zwei Komponenten impliziert, dass der Wert einer Komponente nicht vom Wert der anderen abhängt. Der zweite Ansatz unterstützt das Identifizieren anomaler PIDs, indem deren statistische Abweichung mit ihrem erwarteten Cluster geprüft wird, was nachstehend im Schritt 32 beschrieben wird.
-
Als ein Beispiel eines Fahrzeugsystems, das die in dieser Anmeldung erläuterten Konzepte verwendet, um Anomalien in den Diagnosealgorithmen zu detektieren und um eine Fehlerisolation durchzuführen, wird hier ein Emissionssystem beschrieben. Es versteht sich, dass das im Folgenden beschriebene Emissionssystem nur ein Beispiel für die verschiedenen Fahrzeugsysteme ist, die die Fehlerisolationstechnik verwendet können. Das Fahrzeugsystem enthält eine H02S-Heizungssteuerungsbank. Die HO2S-Heizungsleistungsbank und die HO2S-Heizungswiderstandsschaltungsbank enthält 1376 Muster. Ein resultierender Datensatz für die beiden Bänke weist die Dimension 1376x253 auf, wobei die Dimension 253 die Anzahl der PIDs darstellt, die aus sowohl binären als auch realwertigen PIDs bestehen. Unter Verwendung der Bereichskenntnisse werden aus diesen 42 PIDs gewählt, wie in Schritt 30 erörtert wurde. Der resultierende Datensatz hat die Dimension 1376x42.
-
Der resultierende Datensatz wird als nächstes wie erörtert unter Verwendung von sowohl PCA- als auch ICA-Verfahren auf Redundanz überprüft. In der PCA werden die orthogonalen Richtungen entlang einer maximalen Variation identifiziert. 3 zeigt eine grafische Bildschirmdarstellung, der verwendet wird, um Hauptkomponenten zu identifizieren, die zur Clusterbildung gewählt werden müssen. Die grafische Darstellung verwendet Varianzwerte auf der Y-Achse und einen Index der Hauptkomponenten auf der X-Achse. Es ist zu sehen, dass bei der 9. Hauptkomponente ein signifikantes Knie auftritt. Es wird ermittelt, dass die ersten 9 Komponenten im Wesentlichen 90 % der Gesamtvarianz im Datensatz berücksichtigen. Dies impliziert, dass die Daten von den PIDs entlang von 9 orthogonalen Richtungen eine größere Variation zeigen. Unter Verwendung einer Annahme, dass Hauptkomponenten in der PCA mit einer größeren zugehörigen Varianz die Zielstruktur darstellen und diejenigen mit einer geringeren Variation Rauschen darstellen, kann eine Kohärenz in den Daten abgeleitet werden. Die unter der PCA identifizierten Komponenten werden unter Verwendung der ICA weiter verarbeitet und die Entropie jeder ermittelten latent unabhängigen Komponente wird geschätzt.
-
Anhand der ICA-Analyse wurde herausgefunden, dass 7 der 9 Komponenten signifikant sind. Die Reduktion von 9 auf 7 Komponenten zeigt an, dass es eine Redundanz in den PID-Daten gibt, welche mithilfe der Clusterbildung analysiert werden kann.
-
In Schritt 33 wird eine Clusterbildung durchgeführt, um die tatsächliche Anzahl von Clustern und deren Konsistenz zur Darstellung der ursprünglichen Daten herauszufinden. Die Clusterbildung betrifft eine nicht überwachte Technik zur Klassifizierung von unbeschrifteten PID-Datensätzen in finite verborgene Datenstrukturen in Abhängigkeit von deren Entfernung in irgendeinem Merkmalraum. Hier sind die PID-Daten unbeschriftet, weil die Fehler vor der Analyse nicht bekannt sind. Die Clusterbildung umfasst die Wahl von Unterscheidungsmerkmalen aus einem Satz von Kandidaten und dann das Transformieren derselben, um neue Merkmale aus den ursprünglichen zu erzeugen (z.B. Entfernungsmaße). Die gewählten Werte werden dann gemäß ihrer Entfernung im transformierten Merkmalsraum in Cluster eingeteilt. Nachdem ein Entfernungsmaß gewählt wurde, macht die Konstruktion einer Kriterienfunktion zur Clusterbildung die Unterteilung von Clustern zu einem Optimierungsproblem. Die Optimalität des Clusterbildungsprozesses kann durch eine grafische Umrissdarstellung verifiziert werden, die die Umrissbreite eines PID in einem Cluster misst.
-
4a-4c stellen Datensätze von grafischen Umrissdarstellungen für jeweilige Cluster (z.B. Cluster 1-5) auf der Grundlage wechselseitiger Informationen zwischen den PIDs dar. Die horizontale Breite Sw i jedes jeweiligen Balkens im Diagramm variiert von 1, was eine gute Clusterbildung ist, bis -1, was eine schlechte Clusterbildung ist. Die Clusterbildung kann entweder auf der Grundlage von Abstandsmaßen oder von Maßen der wechselseitigen Information durchgeführt werden.
-
Eine Clusterbildung auf der Grundlage des Abstands kann einen euklidischen Abstand oder einen Minkowski-Abstand verwenden. Der euklidische Abstand ist ein Spezialfall des Minkowski-Abstands. Der Nachteil von Minkowski-Abständen liegt darin, dass das größte skalierte Merkmal zur Dominanz über andere Merkmale tendiert. Als Folge müssen die Daten vor der Clusterbildung normiert werden. Ein Vergleich zwischen syntaktischen und statistischen Maßnahmen der Datenclusterbildung legt nahe, dass die letzteren die ersteren überflügeln.
-
Die Clusterbildung auf der Grundlage wechselseitiger Informationen ist ein weiteres Beispiel dafür, wie Cluster von PIDs gebildet werden können. Hinsichtlich einer wechselseitigen Abhängigkeit zwischen zwei PIDs wird angenommen, dass zwei PIDs untereinander einen hohen Grad an Abhängigkeit aufweisen, wenn die zwei PIDs einen hohen Wert an wechselseitiger Information aufweisen. PIDs, die einen hohen Grad an wechselseitiger Information aufweisen, werden als kohärent bezeichnet und miteinander gruppiert. Hinsichtlich einer Ermittlung zeitweise auftretender DTCs können zeitweise auftretende DTCs anfänglich als ein Klasse gruppiert werden und nicht zeitweise auftretende DTCs können als eine weitere Klasse gruppiert werden. Dann kann eine wechselseitige Information zwischen den Klassen analysiert werden und es können Cluster gebildet werden, um die Schlüssel-PIDs zu ermitteln, welche die zeitweise auftretenden DTCs von den nicht zeitweise auftretenden DTCs unterscheiden. Eine Ähnlichkeitsverteilung von PIDs in einem Cluster liefert eine Bereichskenntnis. Es gibt so viele Verteilungen wie es Cluster gibt. Wenn eine Reihe von PIDs von einem neuen Fahrzeug beschafft wird, werden die PIDs im Hinblick auf das Wissen, das von zuvor gewarteten Fahrzeugen erworben wurde, in Clustern getestet. Die wechselseitigen Informationen zwischen diesen PIDs werden in entsprechenden Clustern berechnet und die wechselseitigen Informationswerte werden auf die zuvor geschätzten Verteilungen von Abständen über jeden Cluster hinweg abgebildet. Wenn es einen wesentlichen Betrag an Abweichung mit Bezug auf einen spezifischen PID in einem speziellen Cluster gibt, dann wird der PID als anomal betrachtet und beim Bewertungsprozess zur Ermittlung des Fehlers nicht verwendet.
-
Wieder mit Bezug auf 4a-4c sind Datensätze von grafischen Umrissdarstellungen für jeweilige Cluster (z.B. Cluster 1-5) auf der Grundlage von wechselseitigen Informationen zwischen den PIDs dargestellt. Jeder horizontale Balken entspricht einem PID und jeder zusammenhängende Satz von Balken stellt einen Cluster entlang der Y-Achse dar. Die Cluster sind entlang der Y-Achse als 1-5 gruppiert. Die X-Achse stellt einen Umrisswert dar. Wie vorstehend beschrieben wurde, ist die Länge jedes horizontalen Balkens (Sw i - Umrissbreite) ein Maß einer Tendenz eines jeweiligen PID, zu dem Clustern zu gehören, in dem er sich befindet. Daher stellen horizontale Balken mit positiven Umrisswerten korrekt gruppierte Cluster dar, wohingegen Cluster mit negativen Umrisswerten schlecht gruppierte Cluster darstellen. Wie erwähnt wurde, sind die PIDs in einem Cluster kohärent. Dies impliziert, dass Parameter, die von PIDs in einem Cluster angezeigt werden, ähnliche Variationstrends aufweisen. Wenn die PIDs nicht fehlerhaft sind, sollte jede Veränderung bei einem Parameter von ähnlichen Variationen bei allen anderen Parametern begleitet werden. Als Folge sollten die wechselseitigen Informationen zwischen den PIDs in Abwesenheit irgendeiner Anomalie in den PIDs sowohl in den historischen Trainingsdatensätzen als auch den Testdatensätzen ähnliche Verteilungen aufweisen.
-
Die wechselseitigen Informationen werden gemessen, um die Kohärenz zwischen den PIDs zu charakterisieren. Die Verteilung der Kohärenz wird ferner durch Aufzeichnen der Verteilungsdichtefunktionen und der wechselseitigen Informationen für jeden Cluster charakterisiert. Ein Beispiel einer Aufzeichnung für einen jeweiligen Cluster für einen Trainingsdatensatz ist in 5 gezeigt. Die X-Achse stellt Ähnlichkeitswerte unter Verwendung wechselseitiger Informationen dar, wohingegen die Y-Achse eine Verteilungsfunktion für den jeweiligen Cluster darstellt.
-
Bei Schritt 34 werden Informationsgruppen erzeugt. Informationsgruppen werden erzeugt, indem zufällig ein PID aus jedem Cluster gewählt wird. Zudem kann ein beliebiger Einzel-PID (d.h. ein einzelner PID, der zu keinem Cluster gehört) zu den Informationsgruppen hinzugefügt werden. Der Informationsgehalt der Informationsgruppe ist ein Maß, das verwendet wird, um die Blockentropie [engl.: joint entropy] der PIDs innerhalb jeder jeweiligen Informationsgruppe zu ermitteln. Die Informationsgruppen werden verwendet, um die Divergenz der PIDs zu ermitteln, welche nachstehend im Detail erörtert wird. Die Divergenz der PIDs wird zur Ermittlung einer Fehlerklassifizierung verwendet.
-
Bei Schritt 35 wird der Anomalie- und Fehlerdetektionsprozess unter Verwendung des Testdatensatzes des gegenwärtigen Fahrzeugs eingeleitet. Zuerst wird das Vorhandensein von Anomalien ermittelt und dann wird die Fehlerklassifizierung ermittelt. Ein Fehler wird charakterisiert, indem die gemeinsame Wahrscheinlichkeitsverteilung auf die PIDs in ihrer Gesamtheit angewendet wird. Der Zustand des Systems bei einem Fehler wird durch die Werte der PIDs beschrieben und daher ist er eine Funktion aller PIDs über alle Cluster hinweg. Als ein vorläufiger Schritt zur Fehlerklassifizierung wird in der Trainingsphase eine gemeinsame Wahrscheinlichkeitsverteilung der unabhängigen Komponenten aller PIDs ermittelt.
-
Die Fehlerklassifizierung kann durchgeführt werden, indem die Kulback-Leibler-Divergenz (KL-Divergenz) zwischen der gemeinsamen Wahrscheinlichkeit der unabhängigen Komponenten in den Trainingssatz-PIDs und denjenigen der PIDs im Testsatz ermittelt wird. Die KL-Divergenz quantifiziert die Entfernung zwischen zwei Wahrscheinlichkeitsverteilungsfunktionen.
-
Bei Schritt 36 werden mehrere Muster von PID-Daten aus dem gegenwärtig gewarteten Fahrzeug geholt.
-
Bei Schritt 37 wird ein jeweiliger Test-PID aus dem gegenwärtig gewarteten Fahrzeug identifiziert. Der jeweilige PID aus dem gegenwärtig gewarteten Fahrzeug wird analysiert, indem eine Anomalie-Detektionstechnik angewendet wird, um zu detektieren, ob eine Anomalie vorhanden ist. Um die Anomalie zu detektieren, wird die Verteilung wechselseitiger Informationen zwischen den Daten der PIDs für die historischen Daten (d.h. früher gewartete Fahrzeuge) und Testdaten des gegenwärtig gewarteten Fahrzeugs ermittelt. Wenn die wechselseitige Informationsverteilung ähnlich ist, dann wird ermittelt, dass der PID nicht anomal ist. Wenn auf ähnliche Weise die KL-Divergenz zwischen den Testdaten und den Trainingsdaten niedrig ist, dann zeigt die niedrige Divergenz an, dass der Fehler zu der modellierten Klasse gehört. Eine Abweichung zwischen den wechselseitigen Informationsverteilungen zeigt das Vorhandensein anomaler PIDs an und ein hoher Wert der Divergenz zeigt an, dass der Fehler nicht zu der anvisierten Fehlerklasse gehört. Die Fehlerdetektion wird ausgeführt, indem eine Divergenz zwischen einer gemeinsamen Wahrscheinlichkeitsverteilung der PIDs, die am gegenwärtig gewarteten Fahrzeug beobachtet werden, und der gemeinsamen Wahrscheinlichkeitsverteilung der früher gewarteten Fahrzeuge geschätzt wird. Bei einem Beispiel eines DTC, der während eines Betriebs eines Fahrzeugs ausgelöst wird, welcher das Auftreten eines möglichen Fehlers anzeigt, kann die Erzeugung eines DTC nicht immer die Ursache des Fehlers anzeigen, da die DTCs auf der Grundlage einer Diagnoseroutine erzeugt werden, die vorbestimmten logischen oder harten Entscheidungen folgt. Jedoch können Anomalien detektiert werden, indem die PIDs in Clustern analysiert werden, die zuvor in der Trainingsphase gebildet wurden. Da PIDs kohärent sind, sollte jede Variation bei einem Parameter unter normalen Bedingungen von ähnlichen Variationen bei allen anderen kohärenten Parametern begleitet werden. Der Abstand und die wechselseitige Information zwischen diesen PIDs sollten für jede spätere Instanz des Fehlers gleich bleiben. Wenn irgendwelche der PIDs anomal sind, dann wird der jeweilige PID mit anderen PIDs in seinem Cluster nicht kohärent bleiben, da der Abstand dieses PID mit Bezug auf andere im gleichen Cluster von seinen zuvor geschätzten Werten abweichen wird. Daher wird zuerst ermittelt, ob in den Daten Anomalien existieren, bevor ermittelt wird, ob der Fehler zu der anvisierten Klasse gehört.
-
Die wechselseitigen Informationen des PID, der auf eine Anomalie mit Bezug auf andere in einem zugehörigen Cluster des Trainingsdatensatzes getestet wird, werden auf die bereits berechneten Verteilungsdichtefunktionen des Trainingsdatensatzes abgebildet. Zum Beispiel werden PID-Werte für einen Luftmassenstromsensor (MAF-Sensor) des gegenwärtig gewarteten Fahrzeug aufgezeichnet. Die PID-Werte für den MAF-Sensor werden im Cluster-1 gruppiert, der 12 verschiedene PIDs aufweist. Der erste Schritt besteht in der Berechnung der wechselseitigen Informationen des MAF-Ausgabe-PID-Werts mit Bezug auf die 11 weiteren PID-Werte und dann darin, jeden von diesen abzubilden, um die Verteilungsfunktion des MAF Cluster-1 zu erhalten. Der Prozess wird wiederholt, indem jedes Mal zufällige Sätze mit 50 Mustern gewählt werden.
-
6 zeigt eine grafische Darstellung der geschätzten Verteilungsfunktion gegenüber der wechselseitigen Informationen dieses PID mit Bezug auf die anderen PIDs für das gegenwärtig gewartete Fahrzeug. Die in 6 gezeigte grafische Darstellung ähnelt der grafischen MAF-Sensordarstellung in 5 und daher ist die Divergenz gering. Die Ähnlichkeit zwischen der grafischen Testdatendarstellung (6) und der grafischen Trainingsdatendarstellung (5) zeigt an, dass es eine Kohärenz mit den anderen PIDs im Cluster-1 gibt, sodass der jeweilige PID nicht anomal ist. Dieser Prozess muss für alle PIDs im Testdatensatz wiederholt werden.
-
7 stellt ein Beispiel einer grafischen Darstellung dar, bei dem die geschätzte Wahrscheinlichkeitsverteilungsfunktion des Testdatensatzes keine Ähnlichkeit mit dem Trainingsdatensatz zeigt. Die Unähnlichkeit zeigt an, dass der jeweilige getestete PID anomal ist. Als Folge zeigt die Unähnlichkeit an, dass ein Programmierfehler beim Diagnosesoftwarealgorithmus vorliegt. Eine Anomalie wie vorstehend erwähnt kann einen PID umfassen, der fehlerhafte Werte aufweist, oder sie kann einen PID umfassen, der mit einem zeitweise auftretenden DTC verbunden ist, wie vorstehend beschrieben wurde. Um Anomalien zu ermitteln, die mit den zeitweise auftretenden DTCs verbunden sind, werden die DTCs, welche als zeitweise auftretend identifiziert wurden und die im Datensatz eines Clusters gehalten werden, auf die bereits berechnete Verteilungsdichtefunktion des Trainingsdatensatzes abgebildet. Auf die gleiche Weise wie vorstehend erörtert wird ein Vergleich durchgeführt, um zu ermitteln, ob die Divergenz niedrig ist oder ob die Divergenz hoch ist. Eine niedrige Divergenz zwischen den PIDs, die mit den zeitweise auftretenden DTCs verbunden sind und den PIDs, die mit den nicht zeitweise auftretenden DTCs verbunden sind, zeigt eine Kohärenz an, sodass der jeweilige PID als normal identifiziert wird, wohingegen eine hohe Divergenz anzeigt, dass der PID-Cluster anomal ist. Es versteht sich, dass die Wahrscheinlichkeitsdichtediagramme ein Liniendiagramm, ein Balkendiagramm oder ein Punkt-Diagramm enthalten können. Nachdem der anomale PID-Cluster identifiziert ist, werden dessen Werte mit den spezifizierten Werten in der Diagnosesoftwareroutine verglichen. Die Konstrukteure führen entweder Veränderungen an der Diagnosesoftwareroutine durch, oder sie führen geeignete Modifikationen an der Komponente durch, die mit dem PID verbunden ist, sodass die anomalen Werte nicht wieder auftreten.
-
Bei Schritt 38 wird ermittelt, ob irgendwelche der abgebildeten Werte hoch sind (d.h. im Wesentlichen ähnlich wie die grafisch dargestellte Wahrscheinlichkeitsverteilungsfunktion des Trainingsdatensatzes). Wenn ermittelt wird, dass die abgebildeten Werte hoch sind, dann wird bei Schritt 39 ermittelt, dass in den PID-Daten keine Anomalien existieren. Die Routine geht dann zu Schritt 42 weiter, um zu ermitteln, ob weitere PIDs eine Analyse benötigen.
-
Wenn bei Schritt 38 ermittelt wird, dass die abgebildeten Werte niedrig sind, dann wird bei Schritt 40 ermittelt, dass in den PID-Daten Anomalien existieren. Alle Informationsgruppen, welche den jeweiligen PID enthalten, werden bei Schritt 41 aus der Liste entfernt. Darüber hinaus kann ermittelt werden, dass angesichts des Vorhandenseins der Anomalie ein Programmierfehler im Diagnosealgorithmus existiert.
-
Bei Schritt 42 wird ermittelt, ob weitere PIDs ein Testen benötigen. Wenn weitere PIDs ein Testen benötigen, dann wird zu Schritt 37 zurückgekehrt, um das Testen zusätzlicher PIDs einzuleiten. Wenn keine zusätzlichen PIDs ein Testen benötigen, dass geht die Routine für diejenigen PIDs, bei denen keine Anomalie existiert, zu Schritt 43 weiter.
-
Bei Schritt 43 wird die Fehlerklassifizierungstechnik eingeleitet. Die bei Schritt 34 erzeugten Informationsgruppen werden verwendet, um eine Divergenz zwischen den Testdaten und den Trainingsdaten zu ermitteln. Während der Testphase sollte jeder Satz von PID-Werten des jeweiligen Fehlers eine ähnliche gemeinsame Wahrscheinlichkeitsverteilungsfunktion ihrer unabhängigen Komponenten aufweisen. Daher wird die KL-Divergenz zwischen den gemeinsamen Wahrscheinlichkeitsverteilungen des modellierten Fehlers und der Testdaten ermittelt. Wenn ermittelt wird, dass die KL-Divergenz niedrig ist, dann wird der Fehler für die Schaltung, die getestet wird, klassifiziert. Wenn ermittelt wird, dass die KL-Divergenz hoch ist, dann wird der Fehler nicht der Schaltung zugeordnet, die getestet wird.
-
Bei Schritt 43 wird eine Informationsgruppe gewählt, die keine anomalen PIDs und den höchsten Informationsgehalt aufweist. Bei Schritt 44 wird die KL-Divergenz für die PIDs der gewählten Informationsgruppe zwischen dem Trainingsdatensatz und dem Testdatensatz ermittelt.
-
Bei Schritt 45 wird ermittelt, ob die KL-Divergenz hoch ist. 8 stellt eine grafische Darstellung dar, der eine hohe KL-Divergenz zeigt. Eine hohe KL-Divergenz zeigt an, dass der Fehler nicht in der getesteten Schaltung liegt und der Techniker nach anderen Schaltungen zum Testen suchen sollte. 9 zeigt eine grafische Darstellung, der eine niedrige KL-Divergenz zeigt. Die KL-Divergenz wird durch die X-Achse dargestellt und ein Häufigkeitszähler wird durch die Y-Achse dargestellt. Eine niedrige KL-Divergenz zeigt an, dass sich der Fehler in der getesteten Schaltung befindet, und dass der Techniker in dieser Schaltung mit dem Testen auf Fehler fortfahren soll. Wenn bei Schritt 45 ermittelt wird, dass die KL-Divergenz hoch ist, dann wird bei Schritt 46 ermittelt, dass der Fehler nicht zu der getesteten Schaltung gehört. Wenn bei Schritt 45 ermittelt wird, dass die KL-Divergenz niedrig ist, dann wird bei Schritt 47 ermittelt, dass der Fehler zu der getesteten Schaltung gehört. Bei Schritt 48 wird die Routine beendet.
-
Es ist zu verstehen, dass die hier beschriebenen Ausführungsformen in Industrien angewendet werden können, in denen eine Wartungsdiagnose an Systemen durchgeführt wird, welche Schwerlastgeräte, Flugzeuge und Raumschiffe umfassen, aber nicht darauf beschränkt sind. Obwohl bestimmte Ausführungsformen der vorliegenden Erfindung im Detail beschrieben worden sind, werden Fachleute auf dem Gebiet, das diese Erfindung betrifft, verschiedene alternative Entwürfe und Ausführungsformen zum Umsetzen der Erfindung in die Praxis, wie sie durch die folgenden Ansprüche definiert ist, erkennen.