-
Technisches Gebiet
-
Die Erfindung betrifft die Verwendung von datenbasierten Funktionsmodellen für Modellberechnungen in Steuergeräten für Echtzeitanwendungen. Weiterhin betrifft die vorliegende Erfindung die Ermittlung und die Verwendung einer Modellgültigkeitsangabe in Echtzeitanwendungen.
-
Technischer Hintergrund
-
Digitale Steuergeräte werden in zahlreichen Anwendungen zum Steuern und Regeln von technischen Systemen verwendet. Diese Steuergeräte verarbeiten Sensorsignale entsprechend einem vorgegebenen Steuergerätealgorithmus, so dass eine oder mehrere Stellgrößen für die Ansteuerung von Stellgebern ermittelt werden. Derartige Steuergeräte kommen beispielsweise für die Steuerung von Motorsystemen in Kraftfahrzeugen zum Einsatz.
-
Die verwendeten Steuergerätealgorithmen verwenden häufig Modellfunktionen zur Ermittlung von Zustandsgrößen in dem zu steuernden technischen System, weil die jeweilige Zustandsgröße nicht durch einen Sensor ermittelt werden kann oder weil aufgrund von Kosten, Zuverlässigkeit oder sonstigen Gründen auf die Verwendung eines Sensors verzichtet werden soll.
-
Weiterhin können die Modellfunktionen parallel zur sensorischen Erfassung der Sensorwerte gerechnet werden, um die Sensorwerte zu überprüfen bzw. zu plausibilisieren.
-
Die Modellfunktionen können als datenbasierte Funktionsmodelle vorgesehen werden, die im Unterschied zu physikalischen Modellen, die einen bekannten physikalischen Wirkzusammenhang in Form eines Gleichungssystems oder einer Berechnungsvorschrift abbilden, lediglich aus einer mathematischen Analyse von zuvor erfassten Messdaten erstellt bzw. trainiert werden. Derartige datenbasierte Funktionsmodelle werden in der Regel bei komplexen physikalischen Wirkzusammenhängen verwendet, bei denen ein entsprechendes physikalisches Modell nicht oder nur mit hohem Rechenaufwand berechnet werden kann.
-
Typischerweise ist die Modellgenauigkeit von datenbasierten Funktionsmodellen im Betriebsbereich, für den das datenbasierte Funktionsmodell trainiert wurde, sehr hoch. Jedoch weicht der Modellwert eines datenbasierten Funktionsmodells außerhalb des Trainingsbereichs, d.h. des Bereichs, in dem die Stützstellen liegen, mit denen das datenbasierte Funktionsmodell erstellt bzw. trainiert worden ist, oft erheblich vom Verhalten des zu modellierenden physikalischen Systems ab. Diese geringe Extrapolationsgüte ist ein bekannter Nachteil von datenbasierten Funktionsmodellen gegenüber physikalischen Modellen.
-
Eine Unterkategorie von datenbasierten Modellen besteht aus den sogenannten Gauß-Prozess-Modellen. Diese sind beispielsweise in der Druckschrift
DE 10 2013 206 292 A1 beschrieben.
-
Gauß-Prozess-Modelle werden von der Prämisse abgeleitet, dass der zu modellierende physikalische Wert durch eine stochastische Funktion der Eingangsgrößen beschrieben werden kann, die die Form eines Gauß-Prozesses hat. Gauß-Prozesse sind unendlich-dimensionale Verallgemeinerungen von multivariablen Normalverteilungen, siehe z. B. C. E. RASMUSSEN ET AL., GAUSSIAN PROCESSES FOR MACHINE LEARNING, MIT PRESS 2006. Vereinfacht ausgedrückt besteht die Prämisse in der Erwartung, dass die Ergebnisse von Messungen an ein- und demselben Betriebspunkt normalverteilt sind und dass bei nahe beieinanderliegenden Betriebspunkten die Messwertmittelwerte ebenfalls nahe beieinanderliegen. Da für Gauß-Prozesse einige relativ einfache mathematische Regeln gelten, sind Algorithmen bekannt, mit denen aus Messdaten Modelle ermittelt werden können, die unter der genannten Prämisse genauestmöglich sind.
-
Aus der Druckschrift
DE 10 2013 212840 A1 ist eine in Hardware-ausgebildete Recheneinheit beschrieben, mit der Gauß-Prozess-Modelle in Echtzeit berechnet werden können.
-
Offenbarung der Erfindung
-
Erfindungsgemäß sind ein Verfahren zum Ausführen einer Funktion basierend auf einem Modellwert eines datenbasierten Funktionsmodells abhängig von einer Modellgültigkeitsangabe für eine Echtzeitberechnung gemäß Anspruch 1 sowie durch die Vorrichtung gemäß dem nebengeordneten Anspruch vorgesehen.
-
Weitere Ausgestaltungen sind in den abhängigen Ansprüchen angegeben.
-
Gemäß einem ersten Aspekt ist ein Verfahren zum Ausführen einer Funktion basierend auf einem Modellwert eines datenbasierten Funktionsmodells vorgesehen, mit folgenden Schritten:
- – Ermitteln eines Modellwerts eines datenbasierten Funktionsmodells an einem Abfragepunkt;
- – Ermitteln einer Modellgenauigkeitsangabe oder einer Modellgültigkeitsangabe, die die Genauigkeit bzw. die Gültigkeit des Modellwerts des datenbasierten Funktionsmodells an dem Abfragepunkt angibt;
- – Ausführen der Funktion abhängig von der Modellgültigkeitsangabe.
-
Für den Betrieb eines technischen Systems kann eine Kenntnis über eine Modellgültigkeit/Modellgenauigkeit eines durch ein datenbasiertes Funktionsmodell ermittelten Modellwerts hilfreich sein, um die Verlässlichkeit des berechneten Modellwerts für die durch das Steuergerät auszuführende Funktion zu berücksichtigen. Insbesondere kann die Modellgültigkeit/Modellgenauigkeit für eine Plausibilisierung eines Sensorwerts mit Hilfe des Modellwerts und bei der Einleitung von von dem Modellwert abhängigen Schutzmaßnahmen berücksichtigt werden.
-
Ein bisheriger Ansatz besteht darin, einen Modellwert eines datenbasierten Funktionsmodells nur dann als hinreichend genau bzw. gültig anzusehen, wenn sich die Werte der Eingangsgrößen eines Eingangsgrößenvektors des Funktionsmodells innerhalb vorgegebener Grenzen befinden. Durch Vorgabe dieser Grenzen wird ein Hyperquader für den Eingangsgrößenvektor vorgegeben, wobei für Abfragepunkte innerhalb des Hyperquaders die resultierenden Modellwerte des datenbasierten Funktionsmodells als gültig angesehen werden und die Bereiche außerhalb des Hyperquaders als ungültig. Bei datenbasierten Funktionsmodellen hat der Bereich einer hohen Modellgenauigkeit jedoch häufig nicht die Form eines Hyperquaders, so dass viele Modellwerte zu Eingangsgrößenvektoren außerhalb des Hyperquaders nicht als gültig angesehen werden, obwohl sie eine hohe Modellgenauigkeit aufweisen, oder umgekehrt.
-
In einer ersten Alternative kann das datenbasierte Funktionsmodell einem Gauß-Prozess-Modell entsprechen, wobei die Modellgenauigkeitsangabe als die Varianz oder die Standardabweichung des Gaußprozessmodells bestimmt wird. Ein häufig verwendeter alternativer Begriff für die Modellgenauigkeitsangabe ist die Toleranz des Modells.
-
Somit ist es möglich, bei einem Gauß-Prozess-Modell als datenbasiertes Funktionsmodell als Maß für die Modellgenauigkeit die Varianz oder Standardabweichung einer dem Funktionsmodell zu Grunde liegenden Wahrscheinlichkeitsverteilung an dem Abfragepunkt zu berechnen. Jedoch erfordert die Berechnung der Varianz bei einer Anzahl M von Stützstellen für das datenbasierte Funktionsmodell ½·M·(M + 1) Multiplikationen und Additionen, während für die Berechnung des Modellwerts selbst nur die Anzahl M von Multiplikationen und Additionen benötigt wird.
-
Da bei einer hohen Anzahl von Stützstellen für das Gauß-Prozess-Modell eine Berechnung der Modellgenauigkeitsangabe über die Berechnung der Varianz oder Standardabweichung mit einem sehr hohen Rechenaufwand verbunden, der durch das für die entsprechende Anwendung vorgesehene Steuergerät oft nicht in Echtzeit geleistet werden kann, kann in einer weiteren Alternative die Modellgenauigkeitsangabe oder Modellgültigkeitsangabe abhängig von einem bereitgestellten Modellgenauigkeitsmodell bzw. Modellgültigkeitsmodell ermittelt werden. Das Modellgenauigkeitsmodell bzw. Modellgültigkeitsmodell kann einem datenbasierten Modell entsprechen, das für ausgewählte Stützstellen in einem Eingangsgrößenbereich mit einer Modellgenauigkeit bzw. einer Modellgültigkeit als Stützwerte trainiert ist.
-
Eine Idee des obigen Verfahrens besteht darin, bei einem trainierten datenbasierten Funktionsmodell für Abfragepunkte, die aus einem Zulässigkeitsbereich ausgewählt sind, der größer ist als der Bereich, der durch die Stützstellen für das Anlernen des datenbasierten Funktionsmodells definiert ist, jeweils eine Modellgenauigkeitsangabe bzw. Modellgültigkeitsangabe zu ermitteln. Der Zulässigkeitsbereich ist ein vorgegebener Bereich für Eingangsgrößenvektoren, der auch Betriebsbereiche umfasst, für die keine Stützstellen für den Trainingsprozess des datenbasierten Funktionsmodells vorliegen. Die Modellgenauigkeitsangabe kann sich z.B. bei einem Gaußprozessmodell als datenbasiertes Funktionsmodell z.B. in Form einer Varianz oder Standardabweichung einer dem Funktionsmodell zu Grunde liegenden Wahrscheinlichkeitsverteilung an dem Abfragepunkt ergeben. Generell kann eine Modellgenauigkeitsangabe bzw. Modellgültigkeitsangabe auch bei anderen datenbasierten Funktionsmodellen z.B. durch Vermessen oder Überprüfen bestimmt werden. Die Modellgenauigkeitsangaben bzw. Modellgültigkeitsangaben können allgemein in einfacher Weise berechnet werden, wenn diese Berechnung nicht in Echtzeit erfolgen muss und somit ein sehr viel höherer Rechenaufwand als für eine Berechnung in einem Steuergerät in Echtzeit in Kauf genommen werden kann. Abhängig von den gewählten Abfragepunkten und den resultierenden Modellgenauigkeitsangaben bzw. Modellgültigkeitsmodell kann ein Modellgenauigkeitsmodell bzw. Modellgültigkeitsmodell in Form eines datenbasierten Modells angelernt werden.
-
Die Verwendung eines datenbasierten Modellgenauigkeitsmodells bzw. eines Modellgültigkeitsmodells für die Ermittlung der Modellgenauigkeitsangabe bzw. Modellgültigkeitsangabe begrenzt den Rechenaufwand auf ein Maß, das zur Anzahl der entsprechenden Stützstellen des datenbasierten Modellgenauigkeitsmodells proportional ist, und ermöglicht es, dass Berechnungen des Modellwerts des datenbasierten Funktionsmodells und der Modellgenauigkeit des Modellgenauigkeitsmodells bzw. der Modellgültigkeit des Modellgültigkeitsmodells in Echtzeit mit reduziertem Berechnungsaufwand möglich sind.
-
Ein Vorteil des obigen Verfahrens besteht darin, dass ein datenbasiertes Funktionsmodell in einem großen Bereich von Abfragepunkten genutzt werden kann, da eine entsprechende Modellgenauigkeitsangabe bzw. Modellgültigkeitsangabe jederzeit in Echtzeit zur Verfügung steht. So kann eine hohe Sicherheit gegenüber Fehlfunktionen durch Betrachtung der Modellgenauigkeit bzw. der Modellgültigkeit des jeweiligen Modellwerts des datenbasierten Funktionsmodells in Echtzeit gewährleistet werden.
-
Weiterhin kann die Modellgültigkeitsangabe durch einen Schwellwertvergleich mit dem Ausgangswert des Modellgenauigkeitsmodells ermittelt werden, wobei der Eingangsgrößenbereich für die Stützstellen zum Trainieren des Modellgenauigkeitsmodells größer ist als der Eingangsgrößenbereich von Stützstellen, mit denen das datenbasierte Funktionsmodell trainiert worden ist.
-
Weiterhin kann das datenbasierte Funktionsmodell einem Gauß-Prozess-Modell entsprechen.
-
Es kann vorgesehen sein, dass ein Modellgenauigkeitsmodell Genauigkeiten des Modellwerts des datenbasierten Funktionsmodells durch ein Gauß-Prozess-Modell, durch eine Support-Vektor-Regression, durch ein Radial-Basis-Funktion-Modell oder durch eine Multilayer-Perceptron-Regression modelliert.
-
Alternativ kann ein Modellgültigkeitsmodell Gültigkeiten von Modellwerten des datenbasierten Funktionsmodells durch eine Gauß-Prozess-Klassifikation, eine Support-Vektor-Klassifikation, durch ein Radial-Basis-Funktion-Modell oder eine Multilayer-Perceptron-Klassifikation modellieren.
-
Es kann vorgesehen sein, dass die Funktion eine Schutzfunktion umfasst, die abhängig von der Modellgenauigkeitsangabe bzw. Modellgültigkeitsangabe ausgeführt wird.
-
Alternativ kann die Funktion eine Plausibilisierungsfunktion, insbesondere für einen Sensorwert umfassen, wobei die Plausibilisierungsfunktion abhängig von der Modellgültigkeitsangabe ausgeführt wird oder in der Plausibilisierungsfunktion die Modellgenauigkeit berücksichtigt wird.
-
Es kann vorgesehen sein, dass die Funktion eine Regelungsfunktion umfasst, wobei die Regelungsfunktion abhängig von der Modellgenauigkeitsangabe bzw. Modellgültigkeitsangabe ausgeführt wird oder deaktiviert wird.
-
Insbesondere kann eine Genauigkeit des Modellwerts des datenbasierten Funktionsmodells durch dessen Varianz, dessen Standardabweichung oder eine davon abgeleitete Größe angegeben werden.
-
Kurzbeschreibung der Zeichnungen
-
Ausführungsformen werden nachfolgend anhand der beigefügten Zeichnungen näher erläutert. Es zeigen:
-
1 eine schematische Darstellung eines Prüfstands zum Erfassen von Trainingsdaten zum Anlernen eines datenbasierten Funktionsmodells;
-
2 eine schematische Darstellung einer Modellberechnungseinheit für ein Steuergerät; und
-
3 ein Flussdiagramm zur Veranschaulichung eines Verfahrens zum Ermitteln einer Modellgenauigkeit.
-
Beschreibung von Ausführungsformen
-
1 zeigt eine schematische Darstellung eines Prüfstands 1 zum Testen eines physikalischen Systems 2, wie beispielsweise eines Verbrennungsmotors.
-
Der Prüfstand 1 umfasst weiterhin eine Teststeuereinheit 3, die eine Anzahl M von Messpunkten Xi (Vektoren aus einer oder mehreren Messgrößen (Eingangsgrößen)) für das physikalische System 2 bereitstellt. Entsprechend werden Ausgangswerte einer Ausgangsgröße z des physikalischen Systems 2 gemessen, die jeweils den Messpunkten Xi zugeordnet und als Testdaten in einem Testdatenspeicher 4 gespeichert werden. Die Messpunkte stellen jeweils einen Messpunktvektor mit einer oder mehreren Messgrößen (Eingangsgrößen) dar. Die so als Kombination eines Messpunkts Xi mit einem Messwert Zi einer entsprechenden Ausgangsgröße z erhaltenen Testdaten stehen anschließend zur Auswertung des Verhaltens des physikalischen Systems 2 bzw. zur Erstellung von den das physikalische System 2 beschreibenden Modellen zur Verfügung.
-
2 zeigt eine schematische Darstellung einer Hardwarearchitektur für einen integrierten Steuerbaustein 11, z. B. in Form eines Mikrocontrollers, in dem in integrierter Weise eine Hauptrecheneinheit 12 und eine Modellberechnungseinheit 13 zur rein hardwarebasierten Berechnung eines datenbasierten Funktionsmodells vorgesehen sind. Die Hauptrecheneinheit 12 und die Modellberechnungseinheit 13 stehen über eine interne Kommunikationsverbindung 14, wie z. B. einen Systembus, miteinander in Kommunikationsverbindung. Weiterhin ermöglicht die interne Kommunikationsverbindung 14 einen Zugriff auf einen Speicher 15 sowohl durch die Hauptrecheneinheit 12 als auch durch die Modellberechnungseinheit 13.
-
Grundsätzlich ist die Modellberechnungseinheit 13 im Wesentlichen hartverdrahtet und dem entsprechend nicht wie die Hauptrecheneinheit 12 dazu ausgebildet, einen Softwarecode auszuführen. Alternativ ist eine Lösung möglich, in der die Modellberechnungseinheit 13 zur Berechnung des datenbasierten Funktionsmodells einen eingeschränkten, hoch spezialisierten Befehlssatz zur Verfügung stellt. In der Modellberechnungseinheit 13 kann eine Zustandsmaschine vorgesehen sein, die den fest vorgegebenen Berechnungsablauf steuert. Dies ermöglicht eine ressourcenoptimierte Realisierung einer solchen Modellberechnungseinheit 13 bzw. einen flächenoptimierten Aufbau in integrierter Bauweise.
-
Die Modellberechnungseinheit 13 weist einen Rechenkern 31 auf, der eine Berechnung eines vorgegebenen Algorithmus rein in Hardware implementiert.
-
Die Verwendung von nicht parametrischen, datenbasierten Funktionsmodellen basiert auf einem Bayes-Regressionsverfahren. Die Grundlagen der Bayes-Regression sind beispielsweise in C. E. Rasmussen et al., „Gaussian Processes for Machine Learning", MIT Press 2006, beschrieben. Bei der Bayes-Regression handelt es sich um ein datenbasiertes Verfahren, das auf einem Modell basiert. Zur Erstellung des Modells sind Messpunkte von Trainingsdaten sowie zugehörige Ausgangsdaten einer zu modellierenden Ausgangsgröße erforderlich. Die Erstellung des Modells erfolgt anhand der Verwendung von Stützstellendaten, die den Trainingsdaten ganz oder teilweise entsprechen oder aus diesen generiert werden. Weiterhin werden abstrakte Hyperparameter bestimmt, die den Raum der Modellfunktionen parametrisieren und effektiv den Einfluss der einzelnen Messpunkte der Trainingsdaten auf die spätere Modellvorhersage gewichten.
-
Die abstrakten Hyperparameter werden durch ein Optimierungsverfahren bestimmt. Eine Möglichkeit für ein solches Optimierungsverfahren besteht in einer Optimierung einer Marginal Likelihood p(Y|H, X). Die Marginal Likelihood p(Y|H, X) beschreibt die Plausibilität der gemessenen y-Werte der Trainingsdaten, dargestellt als Vektor Y, gegeben die Modellparameter H und die x-Werte der Trainingsdaten. Im Modelltraining wird p(Y|H, X) maximiert, indem geeignete Hyperparameter gesucht werden, die zu einem Verlauf der durch die Hyperparameter und die Trainingsdaten bestimmten Modellfunktion führen und die Trainingsdaten möglichst genau abbilden. Zur Vereinfachung der Berechnung wird der Logarithmus von p(Y|H, X) maximiert, da der Logarithmus die Stetigkeit der Plausibilitätsfunktion nicht verändert.
-
Ein Gauß-Prozess-Modell hat die folgende mathematische Form:
-
Dabei bedeuten:
- z
- Modellwert berechnet am Betriebspunkt x(t) zum Zeitpunkt t
- D
- Anzahl der Eingangsgrößen des Modells
- x(t) = (xp(t))
- D-dimensionaler Datenvektor des Abfragepunktes, an dem das Funktionsmodell zum Zeitpunkt t ausgewertet wird.
- M
- Anzahl der Messpunkte, die zum Modelltraining verwendet wurden
- Xi = (Xi,p)
- (i = 1, 2, ..., M) – D-dimensionaler Stützstellenvektor Nr. i. Dabei entsprechen die Eingangsgrößen des Datenvektors des Abfragepunktes den Eingangsgrößen des Stützstellenvektors.
- µZ
- Mittelwerte von Messwerten Zi an den Stützstellenpunkten Xi.
- Bi, rp
- (i = 1, 2, ..., M; p = 1, 2, ..., D) – Modellparameter, die durch die Algorithmen zur Modellermittlung berechnet werden
-
Die Hardware des Rechenkerns 31 der Modellberechnungseinheit 3 ist ausgebildet, eine Formelberechnung der vorstehend genannten Formel durchzuführen.
-
Wie sinngemäß in
C. E. RASMUSSEN ET AL., GAUSSIAN PROCESSES FOR MACHINE LEARNING, MIT PRESS 2006 beschrieben ist, werden bei der Herleitung der Modellparameter B
i, r
k zunächst die Parameter r
k sowie ein weiterer Parameter ρ so bestimmt, dass die Wahrscheinlichkeit, dass die folgende M×M-Matrix die Kovarianzmatrix für die Wahrscheinlichkeitsverteilung der Messwerte an den Messpunkten X
1, ..., X
M ist, maximal ist:
-
Anschließend berechnen sich die Parameter B
i nach der folgenden Formel:
-
Wobei Zi (i = 1, 2, ..., M) den Ausgangsgrößen des technischen Systems an den Stützstellenvektoren Xi als Eingangsgrößenvektoren und μz dem Mittelwert der Messwerte Z1, ..., ZM entsprechen.
-
Für die Modellgenauigkeit, also die erwartete Genauigkeit des Modellwertes z(x) an einem Abfragepunkt x, kann eine Größe angegeben werden, die mathematisch die Varianz der bedingten Wahrscheinlichkeitsverteilung am Punkt x unter gegebenen Werten an den Punkten Z
1, ..., Z
M darstellt. In der Regel entspricht ein kleiner Wert der Modellgenauigkeitsangabe eine hohe (gute) Genauigkeit, während ein großer Wert der Modellgenauigkeitsangabe dagegen einer geringen (schlechten) Genauigkeit entspricht.
-
Je kleiner σ2(x) (Varianz) oder deren Wurzel σ(x) (die Standardabweichung des Modells), desto höher die Modellgenauigkeit am Abfragepunkt x. Somit kann die Varianz oder die Standardabweichung als Angaben zur Modellgenauigkeit oder davon abgeleitete Größen, wie z.B. die Ergebnisse von Schwellwertvergleichen mit den Modellgenauigkeiten, als eine Modellgültigkeitsangabe, d.h. eine Angabe, ob für den betreffenden Anwendungsfall ein hinreichend genauer Modellwert zu erwarten ist, angesehen werden.
-
Die Berechnung der Modellgültigkeitsangabe in Echtzeit ist aufgrund der geringen Extrapolationsgüte von datenbasierten Funktionsmodellen von hohem Interesse. Ein Modellwert kann daher entsprechend seiner Modellgültigkeitsangabe in einer nachgelagerten Funktion berücksichtigt werden.
-
Wird beispielsweise in einem Verbrennungsmotor die Temperatur eines Bauteils im Abgastrakt durch ein Gauß-Prozess-Modell bestimmt, um bei Überschreitung einer Temperaturschwelle Maßnahmen zum Bauteilschutz einzuleiten, so besteht bei nicht gegebener Modellgültigkeit bzw. geringer Modellgenauigkeit an dem Betriebspunkt (Abfragepunkt) die Gefahr, dass eine Temperaturüberschreitung nicht erkannt wird. Bauteilschutzmaßnahmen werden in diesem Fall nicht eingeleitet, und das Bauteil kann beschädigt werden. Wenn jedoch erkannt wird, dass der Modellwert eine geringe Genauigkeit aufweist oder nicht gültig ist, so kann schon bei fehlender Modellgültigkeit oder bei geringer Modellgenauigkeit die Bauteilschutzmaßnahme eingeleitet werden, um die Beschädigung des Bauteils zu verhindern.
-
Auch werden häufig über Sensoren erfasste Sensorwerte mit Modellwerten verglichen, um die sensorisch erfassten Sensorwerte zu plausibilisieren. Bei geringer Modellgenauigkeit oder nicht gegebener Modellgültigkeit des Modellwerts besteht jedoch die Gefahr, dass ein nicht defekter Sensor als defekt oder umgekehrt ein defekter Sensor als nicht defekt erkannt wird. Basierend auf der Modellgültigkeitsangabe kann die Diagnose aufgrund dieser Entscheidung temporär deaktiviert und die Fehldiagnose vermieden werden.
-
Mit Bezug auf das Flussdiagramm der 3 wird nachfolgend ein Verfahren zum Ermitteln einer Modellgültigkeitsangabe beschrieben.
-
In Schritt S1 wird zunächst mit Hilfe eines zuvor trainierten datenbasierten Funktionsmodells ein Modellwert an einem bestimmten Abfragepunkt ermittelt. Die weitere Verwendung des Modellwertes in Algorithmen ist im Flussdiagramm nicht dargestellt.
-
In Schritt S2 wird nun basierend auf einem Modellgenauigkeitsmodell, das zuvor basierend auf für vorgegebenen Stützstellen ermittelten Modellgenauigkeiten des datenbasierten Funktionsmodells bestimmt worden ist, eine Modellgenauigkeitsangabe an dem bestimmten Abfragepunkt modelliert.
-
Das Modellgenauigkeitsmodell kann beispielsweise durch Auswahl von Stützstellen innerhalb eines Eingangsgrößenbereichs der Eingangsgrößen des datenbasierten Funktionsmodells ausgewählt werden, die möglichst gleich verteilt sind und über den Bereich von Stützstellen hinausgeht, für den das datenbasierte Funktionsmodell trainiert worden ist. Wie zuvor beschrieben, können als Stützwerte für das Training des Modellgenauigkeitsmodells die Standardabweichungen oder die Varianzen für das datenbasierte Funktionsmodell an den ausgewählten Stützstellen berechnet werden. Basierend auf den ausgewählten Stützstellen und die zugehörigen Stützwerte kann das Modellgenauigkeitsmodell ermittelt werden, das beispielsweise in Form eines Gauß-Prozess-Modells bestimmt wird. Dieses Modell kann die Form aufweisen:
-
Dabei bedeuten:
- σmod
- Modellgenauigkeitsangabe berechnet am Abfragepunkt x(t) zum mod Zeitpunkt t
- D
- Anzahl der Eingangsgrößen des Modellgenauigkeitsmodells, die der Anzahl der Eingangsgrößen des datenbasierten Funktionsmodells entspricht;
- x(t) = (xp(t))
- D-dimensionaler Datenvektor des Abfragepunktes, an dem das Funktionsmodell zum Zeitpunkt t ausgewertet wird.
- N
- Anzahl der Stützstellen, die zum Modelltraining verwendet wurden
- Yi = (Yi,p)
- (i = 1, 2, ..., N) – D-dimensionaler Stützstellenvektor Nr. i.
- Ci, sp
- (i = 1, 2, ..., N; p = 1, 2, ..., D) – Modellparameter, die durch die Algorithmen zur Modellermittlung berechnet werden
-
Ein quantitativer Wert für die Modellgenauigkeitsangabe kann dann Δ(x(t)) = f·σmod(x(t)) sein, wobei f ein im Rahmen der Entwicklung festgelegter Faktor ist, z.B. zwischen 1 und 5, insbesondere 3 (bei normalverteilten Größen in technischen Prozessen wird häufig der Bereich, der vom Erwartungswert einen Abstand von höchstens der dreifache Standardabweichung hat, als hinreichend vollständige Abdeckung der möglichen Ergebnisse gesehen). Alternativ kann das Modellgenauigkeitsmodell anstelle mit Hilfe eines Gauß-Prozess-Modells auch mit Hilfe einer Support-Vektor-Regression oder einer Multilayer-Perceptron-Regression modelliert werden.
-
In Schritt S3 wird die Modellgenauigkeitsangabe mit einem Schwellwert verglichen, um auf eine fehlende Modellgültigkeit zu schließen, wenn die Modellgenauigkeitsangabe einen vorgegebenen Schwellenwert übersteigt. Wird festgestellt, dass die Modellgenauigkeitsangabe größer ist als der vorgegebene Schwellwert (Alternative: Ja), so wird das Verfahren mit Schritt S4 fortgesetzt, andernfalls (Alternative: Nein) wird zu Schritt S1 zurückgesprungen.
-
In Schritt S4 wird nun basierend auf der nicht ausreichenden Modellgenauigkeit bzw. Modellgültigkeit eine vorgegebene Funktion im Steuergerät ausgeführt. Wenn beispielsweise durch das datenbasierte Funktionsmodell ein Modellwert ermittelt wird, der bei Überschreitung eines Schwellenwerts zur Einleitung einer Schutzmaßnahme führt, wie beispielsweise ein Temperaturschutz eines Bauteils, so kann bei erkannter fehlender Modellgültigkeit bzw. bei einer Modellgenauigkeit (Varianz, Standardabweichung) oberhalb des vorgegebenen Schwellenwerts die Schutzmaßnahme ohne Betrachtung des Modellwerts eingeleitet werden.
-
Alternativ kann bei einem Modellwert, der als Eingangsgröße für einen geschlossenen Regelkreis dient, bei erkannter fehlender Modellgültigkeit oder bei einer Modellgenauigkeit oberhalb des vorgegebenen Schwellenwerts auf ein Vorsteuerverfahren umgeschaltet werden, um so ein Aufschwingen des geschlossenen Regelkreises zu vermeiden.
-
Wenn beispielsweise der Modellwert des datenbasierten Funktionsmodells zur Plausibilisierung eines Sensorwertes verwendet wird, so kann bei zu großer Modellgültigkeitsangabe die Funktion zur Plausibilisierung temporär deaktiviert werden.
-
Alternativ kann die Modellgenauigkeitsangabe dazu verwendet werden, festzustellen, ob ein Modellwert mit einer vorgegebenen Wahrscheinlichkeit um nicht mehr als einen vorgegebenen Betrag Δ(x(t)) vom realen Wert abweicht. Der tatsächliche Wert der physikalischen Größe zreal(t) liegt damit mit der vorgegebenen Wahrscheinlichkeit im Intervall [z(x(t)) – Δ(x(t)), z(x(t)) + Δ(x(t))]. Es kann nun vorgesehen sein, dass eine Einleitung einer Schutzmaßnahme bei Überschreitung eines vorgegebenen Schwellenwertes Zmax vorgenommen wird, wenn gilt: z(x(t)) + Δ(x(t)) > zmax
-
Nur wenn obige Bedingung nicht gilt, ist hinreichend sicher, dass zreal(t) ≤ zmax. Wird durch das datenbasierte Funktionsmodell ein Modellwert z(x(t)) ermittelt, der mit einem Sensormesswert zsens(t) verglichen wird, um den Sensormesswert des Sensors zu plausibilisieren, so können die Prüfkriterien definiert werden:
Wenn |zsens(t) – z(x(t))| ≤ difffunktional – ∆(x(t)) ist der Sensor funktionstüchtig, da es sichergestellt ist, dass der Abstand zwischen zsens(t) und zreal(t) nicht größer ist als der vorgegebene Wert difffunktional.
-
Analog ist der Sensor defekt, wenn |zsens(t) – z(x(t))| > diffdefekt + ∆(x(t)), da es sichergestellt ist, dass der Abstand zwischen zsens(t) und zreal(t) größer ist als der vorgegebene Wert diffdefekt.
-
Die Werte difffunktional und diffdefekt sind vorgegebene Schwellenwerte für die Fehlererkennung und die Gutprüfung, wobei vorzugsweise gilt: 0 < difffunktional ≤ diffdefekt.
-
Die Modellgültigkeit kann auch direkt aus einem Modellgültigkeitsmodell bestimmt werden, das nicht mit einer Angabe über eine Modellgenauigkeit an den ausgewählten Betriebsstellen zur Modellierung des Modellgültigkeitsmodells, sondern mit Hilfe von Angaben zu Modellgültigkeiten modelliert wird. Die Modellgültigkeiten ergeben sich beispielsweise aus einem Vergleich der Modellgenauigkeitsangabe, wie beispielsweise der Standardabweichung, der Varianz oder davon abgeleiteten Größen mit einem vorgegebenen Schwellenwert, der vorzugsweise ein Modellmittelwert von 0,5 ist, so dass ein systematischer Vorhersagefehler vermieden werden kann. Durch den Vergleich mit dem vorgegebenen Schwellenwert werden ausgewählten Stützstellen zur Modellierung des Modellgültigkeitsmodells Werte von 1 oder 0 zugeordnet, je nachdem, ob ein Modellwert an der betreffenden Stützstelle eine ausreichende Modellgenauigkeit hat und somit gültig ist oder nicht. Somit kann durch entsprechendes Training ein Modellgültigkeitsmodell erstellt werden, bei dem die Stützwerte lediglich 0 oder 1 betragen, so dass man nun eine Klassifikation der Modellwerte in gültig und nicht gültig erhält. Das entsprechend zugrundeliegende datenbasierte Funktionsmodell kann ein Gauß-Prozess-Klassifikation, eine Support-Vektor-Klassifikation oder eine Multilayer-Perceptron-Klassifikation sein.
-
Eine weitere Möglichkeit, die Modellgenauigkeit zu bestimmen, besteht darin, die Varianz der dem Gauß-Prozess-Modell zu Grunde liegenden Wahrscheinlichkeitsverteilung
durch einen Term zu approximieren, der im relevanten Zulässigkeitsbereich relativ zur Varianz nur einen geringen Approximationsfehler aufweist, sich aber mit wesentlich geringerem Aufwand berechnen lässt als σ
2(x), und für diese Approximation eine abgeschnittenen (truncated) Singulärwertzerlegung der Matrix L
–1 zu verwenden.
-
Bei der Singulärwertzerlegung wird die Matrix L–1 als Produkt L–1 = UEU‘ einer Matrix U von M Links-Singulärvektoren, einer Diagonalmatrix E mit den dazugehörigen, betragsmäßig absteigend angeordneten Singulärerten, und der zu U transponierten Matrix U‘ dargestellt. Die Existenz solcher Matrizen ist sichergestellt, da L–1 eine symmetrische Matrix mit reellen Einträgen und somit nach einem Satz der linearen Algebra orthogonal diagonalisierbar ist.
-
Für die Approximation werden dann nur die Q ersten Singulärvektoren und die Q ersten Singulärwerte berücksichtigt, wobei die Einträge nach ihrem Beitrag zur Approximationsgüte sortiert sind. Die Anzahl Q der ausgewählten Singulärvektoren und die Anzahl und Größe der zugehörigen Singulärwerte bestimmen die Güte der Approximation und die Rechenzeiteinsparung.
-
Genauer sei
L–1 = U × E × U' eine Zerlegung von L
–1 als Produkt von drei Matrizen, wobei U eine reelle orthogonale M×M-Matrix ist, U‘ die Transponierte und gleichzeitig Inverse von U ist und E eine Diagonalmatrix von Singulärwerten ist.
-
Es sei Q < M und E
trunc die Diagonalmatrix, die man aus E erhält, indem ab dem (Q + 1)-ten Eintrag alle Diagonaleinträge durch 0 ersetzt werden:
-
Es seien E
trunc und U als Kombination von Q × Q-, Q × (M – Q)-, (M – Q) × Q- und (M – Q) × (M – Q)-Matrizen dargestellt:
-
Es wird nun der Term
aus Gleichung für σ
2(x) approximiert durch
-
Dann gilt
-
wobei
die Diagonalmatrix mit den Wurzeln der Beträge der Singulärwerte in E
QQ bezeichnet, Sign
QQ die Diagonalmatrix mit den Vorzeichen der Singulärwerte in E
QQ bezeichnet, U ~
QQ das Produkt von U
QQ und
bezeichnet und U ~
(M-Q)Q das Produkt von U
(M-Q)Q und
. Aus der letzten Zeile der Gleichung für kprod(x) lässt sich erkennen, dass sich kprod(x) mit QM + Q Multiplikationen berechnen lässt, wohingegen für die Berechnung des zweiten Terms in der Gleichung für σ
2(x) die Anzahl 1/2 M(M + 1) an Multiplikationen erforderlich ist. Ist Q kleiner als 1/2 M, so lässt sich σ
2(x) durch
σ ~2(x) = k(x, x) – kprod(x) so approximieren, dass der Rechenaufwand zur Berechnung der Approximation geringer ist als der Rechenaufwand zur Berechnung von σ
2(x).
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- DE 102013206292 A1 [0007]
- DE 102013212840 A1 [0009]
-
Zitierte Nicht-Patentliteratur
-
- C. E. RASMUSSEN ET AL., GAUSSIAN PROCESSES FOR MACHINE LEARNING, MIT PRESS 2006 [0008]
- C. E. Rasmussen et al., „Gaussian Processes for Machine Learning“, MIT Press 2006 [0038]
- C. E. RASMUSSEN ET AL., GAUSSIAN PROCESSES FOR MACHINE LEARNING, MIT PRESS 2006 [0043]