-
Mit Hilfe von Maschinenlernverfahren, insbesondere mit Hilfe von Neuronalen Netzen, lassen sich komplexe nichtlineare Zusammenhänge abbilden. Die Abbildung erfolgt hierbei jedoch nicht analytisch und ist in der Regel nicht nachvollziehbar. Bei sicherheitskritischen Funktionen, wie z. B. bei einer Lenkung eines Fahrzeugs, muss jedoch sichergestellt werden, dass die Funktion in jedem möglichen Fahrzustand ein zuverlässiges Ergebnis liefert. Eine solche Absicherung ist auf analytischem Wege nicht möglich.
-
Aus der
DE 10 2019 217 071 A1 ist ein Verfahren zum Ermitteln einer unzulässigen Abweichung einer technischen Einrichtung bekannt. Das Ermitteln erfolgt mithilfe eines künstlichen neuronalen Netzes, dem in einer Lernphase Eingangsdaten und Ausgangsdaten der technischen Einrichtung zugeführt werden. In einer anschließenden Prädiktionsphase werden dem neuronalen Netz nur die Eingangsdaten zugeführt und im neuronalen Netz Ausgangsvergleichsdaten berechnet, die mit den Ausgangsdaten der technischen Einrichtung verglichen werden.
-
Der Erfindung liegt die Aufgabe zu Grunde, ein Verfahren und eine Vorrichtung zum Bereitstellen eines Schätzwertes für mindestens einen Zustandsparameter und/oder Steuerparameter eines Systems zu schaffen, bei denen der Schätzwert insbesondere überprüft und abgesichert ist.
-
Die Aufgabe wird erfindungsgemäß durch ein Verfahren mit den Merkmalen des Patentanspruchs 1 und eine Vorrichtung mit den Merkmalen des Patentanspruchs 10 gelöst. Vorteilhafte Ausgestaltungen der Erfindung ergeben sich aus den Unteransprüchen.
-
Insbesondere wird ein Verfahren zum Bereitstellen eines Schätzwertes für mindestens einen Zustandsparameter und/oder Steuerparameter eines Systems zur Verfügung gestellt, wobei Eingangsdaten, die das System beschreiben, erfasst und/oder empfangen werden, wobei der Schätzwert ausgehend von den empfangenen Eingangsdaten mittels eines trainierten Maschinenlernverfahrens geschätzt wird, wobei ausgehend von den empfangenen Eingangsdaten mittels einer vorgegebenen Basiskennlinie überprüft wird, ob der Schätzwert in einem vorgegebenen Intervall um die Basiskennlinie herum liegt, wobei der Schätzwert korrigiert wird, wenn der Schätzwert außerhalb des vorgegebenen Intervalls liegt, und wobei der Schätzwert ausgegeben wird.
-
Ferner wird insbesondere eine Vorrichtung zum Bereitstellen eines Schätzwertes für mindestens einen Zustandsparameter und/oder Steuerparameter eines Systems geschaffen, umfassend eine Steuereinrichtung, wobei die Steuereinrichtung dazu eingerichtet ist, Eingangsdaten, die das System beschreiben, zu empfangen, ein trainiertes Maschinenlernverfahren bereitzustellen und den Schätzwert ausgehend von den empfangenen Eingangsdaten mittels des trainierten Maschinenlernverfahrens zu schätzen, und ausgehend von den empfangenen Eingangsdaten mittels einer vorgegebenen Basiskennlinie zu überprüfen, ob der Schätzwert in einem vorgegebenen Intervall um die Basiskennlinie herum liegt, und den Schätzwert zu korrigieren, wenn der Schätzwert außerhalb des vorgegebenen Intervalls liegt, und den Schätzwert auszugeben.
-
Das Verfahren und die Vorrichtung ermöglichen es, einen von einem trainierten Maschinenlernverfahren, insbesondere von einem trainierten Neuronalen Netz, geschätzten Schätzwert für mindestens einen Zustandsparameter und/oder Steuerparameter eines Systems, zu überprüfen und abzusichern. Hierdurch kann sichergestellt werden, dass der Schätzwert für den mindestens einen Zustandsparameter und/oder Steuerparameter des Systems innerhalb eines vorgegebenen Wertebereichs liegt. Dies wird erreicht, indem der von dem trainierten Maschinenlernverfahren geschätzte Schätzwert mittels einer vorgegebenen Basiskennlinie überprüft wird. Die Basiskennlinie bildet insbesondere denselben Zusammenhang zwischen den Eingangsdaten und dem mindestens einen Zustandsparameter und/oder Steuerparameter des Systems ab wie das trainierte Maschinenlernverfahren. Insbesondere bildet die Basiskennlinie den Zusammenhang jedoch in gegenüber dem trainierten Maschinenlernverfahren vereinfachter Weise ab. Es wird überprüft, ob der mittels des trainierten Maschinenlernverfahrens geschätzte Schätzwert innerhalb eines vorgegebenen Intervalls (d.h. innerhalb eines vorgegebenen Bereichs) um die Basiskennlinie herum liegt. Ergibt das Überprüfen, dass der Schätzwert außerhalb des vorgegebenen Bereichs um die Basiskennlinie liegt, so wird der Schätzwert korrigiert und der (korrigierte) Schätzwert ausgegeben. Liegt der Schätzwert hingegen innerhalb des Intervalls um die Basiskennlinie, so wird der mittels des trainierten Maschinenlernverfahren geschätzte (unkorrigierte) Schätzwert ausgegeben. Der Schätzwert wird insbesondere als analoges oder digitales Signal ausgegeben.
-
Ein System ist insbesondere eine technische Einrichtung, welche sich mit Hilfe von dem mindestens einen Zustandsparameter beschreiben lässt und/oder mittels des mindestens einen Steuerparameters steuern lässt. Ein System kann beispielsweise eine Lenkung eines Fahrzeugs sein. Ferner kann ein System auch ein elektronisch gesteuertes Fahrassistenzsystem eines Fahrzeugs zur Fahrdynamikregelung sein (z.B. Electronic Stability Control, ESC) sein.
-
Der Schätzwert kann eindimensional oder mehrdimensional sein. Die Basiskennlinie kann auf der Eingangsseite sowohl eindimensional als auch mehrdimensional ausgebildet sein. Auch die Ausgangsseite kann eindimensional oder mehrdimensional sein. Die Basiskennlinie kann beispielsweise als Funktion definiert sein, die eine ein- oder mehrdimensionale Urbildmenge (der ein- oder mehrdimensionalen Eingangsdaten) auf eine ein- oder mehrdimensionale Bildmenge (ein- oder mehrdimensionale Werte für den mindestens einen Zustandsparameter und/oder Steuerparameter) abbildet. Die Anzahl der Dimensionen der Bildmenge entspricht der Anzahl der Dimensionen des Schätzwertes.
-
Das trainierte Maschinenlernverfahren ist insbesondere ein trainiertes Neuronalen Netz. Das Maschinenlernverfahren ist bzw. wurde darauf trainiert, ausgehend von den Eingangsdaten einen Schätzwert für den mindestens einen Zustandsparameter und/oder Steuerparameter des Systems zu schätzen. Ein Training und eine Anwendung des Maschinenlernverfahrens erfolgen hierbei mittels an sich bekannter Verfahren.
-
Teile der Vorrichtung, insbesondere die Steuereinrichtung, können einzeln oder zusammengefasst als eine Kombination von Hardware und Software ausgebildet sein, beispielsweise als Programmcode, der auf einem Mikrocontroller oder Mikroprozessor ausgeführt wird. Es kann jedoch auch vorgesehen sein, dass Teile einzeln oder zusammengefasst als anwendungsspezifische integrierte Schaltung (ASIC) und/oder feldprogrammierbares Gatterfeld (FPGA) ausgebildet sind.
-
Die Vorrichtung kann beispielsweise in einem Fahrzeug verwendet werden und in dem Fahrzeug angeordnet sein. Das Fahrzeug ist insbesondere ein Kraftfahrzeug. Das Fahrzeug kann jedoch auch ein anderes Land-, Schienen-, Luft-, Wasser- oder Raumfahrzeug sein, beispielsweise eine Drohne oder ein Lufttaxi. Insbesondere wird auch ein Fahrzeug geschaffen, umfassend mindestens eine Vorrichtung nach einer der beschriebenen Ausführungsformen.
-
In einer Ausführungsform ist vorgesehen, dass das vorgegebene Intervall zumindest für einen Abschnitt der Basiskennlinie konstant gewählt ist. Das Intervall ist dann beispielsweise in Form von Absolutwerten angegeben, um die der mittels des Maschinenlernverfahrens geschätzte Schätzwert von der Basiskennlinie abweichen darf. Wird mittels des Verfahrens beispielsweise ausgehend von einer Zahnstangenposition, einer Zahnstangengeschwindigkeit, einer Zahnstangenkraft und einem Lenkradmoment eine Reibung der Lenkung geschätzt, so darf der mittels des trainierten Maschinenlernverfahrens geschätzte Schätzwert für die Reibung nur um einen vorgegeben Wert (z.B. +/- 200 N) von einem Wert abweichen, der sich aus der Basiskennlinie ergibt, die beispielsweise die Reibung als Funktion der Zahnstangengeschwindigkeit abbildet.
-
In einer Ausführungsform ist vorgesehen, dass das vorgegebene Intervall zumindest für einen Abschnitt der Basiskennlinie in Abhängigkeit von einem jeweiligen Wert der Basiskennlinie festgelegt ist. Hierdurch kann das Intervall unter Berücksichtigung eines Verlaufs der Basiskennlinie verändert werden. Insbesondere kann das Intervall hierdurch in Abhängigkeit von einem jeweiligen Wert der Basiskennlinie schrumpfen oder mitwachsen. Insbesondere kann das Intervall beispielsweise in Form von relativen Werten in Bezug auf einen Wert der Basiskennlinie definiert werden. Beispielsweise kann vorgesehen sein, dass Intervallgrenzen oberhalb und unterhalb eines Wertes der Basiskennlinie mit Hilfe eines vorgegebenen Faktors definiert sind bzw. definiert werden (z.B. ein Faktor von 1,1 und 0,9 des Wertes, sodass die Grenzen des Intervalls stets +/- 10 % oberhalb/unterhalb des jeweiligen Wertes der Basiskennlinie liegen).
-
In einer Ausführungsform ist vorgesehen, dass der Schätzwert zumindest für einen Abschnitt der Basiskennlinie beim Korrigieren auf den Wert der Basiskennlinie geändert wird. Der mittels des trainierten Maschinenlernverfahrens geschätzte Wert wird dann durch den jeweiligen Wert der Basiskennlinie ersetzt und ausgegeben.
-
In einer Ausführungsform ist vorgesehen, dass der Schätzwert zumindest für einen Abschnitt der Basiskennlinie beim Korrigieren auf einen Wert derjenigen Intervallgrenze des vorgegebenen Intervalls geändert wird, die über- oder unterschritten wurde. Hierdurch kann eine Sättigung erreicht werden, bei der der Schätzwert stets nur die Intervallgrenzen um die Basiskennlinie herum erreichen kann.
-
In einer Ausführungsform ist vorgesehen, dass der Schätzwert zumindest für einen Abschnitt der Basiskennlinie beim Korrigieren auf einen vorgegebenen Wert geändert wird. Hierdurch kann der Schätzwert direkt auf einen fest vorgegebenen Wert geändert werden. Wird beispielsweise ein Wert für einen Steuerparameter geschätzt, der einen Anteil einer Unterstützungsfunktion, z.B. beim Lenken in einem Fahrzeug, definiert, so kann der Wert beim Über- oder Unterschreiten der Intervallgrenzen des Intervalls auf Null (oder einen anderen vorgegebenen Wert) gesetzt werden.
-
In einer Ausführungsform ist vorgesehen, dass das Korrigieren des Schätzwertes zumindest für einen Abschnitt der Basiskennlinie stetig innerhalb von einer vorgegebenen Korrekturzeit erfolgt. Hierdurch kann ein stetiger Übergang von dem mittels des trainierten Maschinenlernverfahrens geschätzten Schätzwert zu dem korrigierten Schätzwert erreicht werden. Hierdurch kann eine abrupte Korrektur verhindert werden, welche beispielsweise von einem Nutzer des Systems oder eines darauf aufbauenden Systems als störend empfunden werden könnte. Die vorgegebene Korrekturzeit beträgt, je nach konkretem Anwendungsfall, beispielsweise einige Millisekunden, einige 100 Millisekunden, 1 Sekunde oder mehrere Sekunden.
-
In einer Ausführungsform ist vorgesehen, dass die vorgegebene Korrekturzeit unter Berücksichtigung von einer Differenz zwischen dem vom trainierten Maschinenlernverfahren geschätzten Schätzwert und einem jeweiligen Wert der Basiskennlinie festgelegt wird. Insbesondere ist vorgesehen, dass die vorgegebene Korrekturzeit proportional zu einem Betrag der Differenz festgelegt wird. Hierdurch kann eine Korrekturrate konstant gehalten werden, was insbesondere bei Nutzeranwendungen mit Rückkopplung an den Nutzer vom Nutzer als natürlich und angenehm empfunden wird.
-
In einer Ausführungsform ist vorgesehen, dass das System eine Lenkung eines Fahrzeugs und der Zustandsparameter eine Reibung der Lenkung ist. Insbesondere wird die Reibung der Lenkung mittels des trainierten Maschinenlernverfahrens, insbesondere mittels eines trainierten Neuronalen Netzes, ausgehend von einer Zahnstangenposition, einer Zahnstangengeschwindigkeit, einer Zahnstangenkraft und einem Lenkradmoment geschätzt. Die Basiskennlinie bildet eine Abhängigkeit der Reibung zumindest von der Zahnstangengeschwindigkeit ab.
-
Weitere Merkmale zur Ausgestaltung der Vorrichtung ergeben sich aus der Beschreibung von Ausgestaltungen des Verfahrens. Die Vorteile der Vorrichtung sind hierbei jeweils die gleichen wie bei den Ausgestaltungen des Verfahrens.
-
Nachfolgend wird die Erfindung anhand bevorzugter Ausführungsbeispiele unter Bezugnahme auf die Figuren näher erläutert. Hierbei zeigen:
- 1 eine schematische Darstellung einer Ausführungsform der Vorrichtung zum Bereitstellen eines Schätzwertes für mindestens einen Zustandsparameter und/oder Steuerparameter eines Systems;
- 2 eine schematische Darstellung einer Basiskennlinie 4 zur Verdeutlichung der Erfindung.
-
In 1 ist eine schematische Darstellung einer Ausführungsform der Vorrichtung 1 zum Bereitstellen eines Schätzwertes 20 für mindestens einen Zustandsparameter und/oder Steuerparameter eines Systems 40 gezeigt. Das System 40 ist in der gezeigten Ausführungsform eine Lenkung 51 eines Fahrzeugs 50. Die Vorrichtung 1 ist in dem Fahrzeug 50 angeordnet. Die Vorrichtung 1 kann auch Teil der Lenkung 51 des Fahrzeugs 50 sein. Das in dieser Offenbarung beschriebene Verfahren wird nachfolgend anhand der Vorrichtung 1 näher erläutert.
-
Die Vorrichtung 1 umfasst eine Steuereinrichtung 2, deren Funktionalität beispielsweise mittels einer Recheneinrichtung, beispielsweise einem Mikroprozessor, und einem Speicher bereitgestellt wird.
-
Die Steuereinrichtung 2 ist dazu eingerichtet, Eingangsdaten 10, die das System 40 beschreiben, zu empfangen, ein trainiertes Maschinenlernverfahren 3 bereitzustellen und den Schätzwert 20 ausgehend von den empfangenen Eingangsdaten 10 mittels des trainierten Maschinenlernverfahrens 3 zu schätzen. Das trainierte Maschinenlernverfahren 3 ist insbesondere ein trainiertes Neuronales Netz. Das trainierte Maschinenlernverfahren 3 wird insbesondere mittels eines Moduls 2-1 bereitgestellt. Die Eingangsdaten 10 sind im Beispiel der Lenkung 51 insbesondere eine Zahnstangenposition, eine Zahnstangengeschwindigkeit, eine Zahnstangenkraft und ein Lenkradmoment. Der Schätzwert 20 ist insbesondere eine Reibung der Lenkung.
-
Ferner ist die Steuereinrichtung 2 dazu eingerichtet, ausgehend von den empfangenen Eingangsdaten 10 mittels einer vorgegebenen Basiskennlinie 4 zu überprüfen, ob der Schätzwert 20 in einem vorgegebenen Intervall 15 um die Basiskennlinie 4 herum liegt, und den Schätzwert 20 zu korrigieren, wenn der Schätzwert 20 außerhalb des vorgegebenen Intervalls 15 liegt. Hierzu stellt die Steuereinrichtung 2 insbesondere die Module 2-2 und 2-3 bereit. Das Modul 2-2 bestimmt ausgehend von den Eingangsdaten 10, in einem einfachen Modell insbesondere ausgehend von der Zahnstangengeschwindigkeit, mittels der Basiskennlinie 4 einen Basiskennlinienwert 21. Das Modul 2-3 überprüft, ob der mittels des trainierten Maschinenlernverfahrens 3 geschätzte Schätzwert 20 in einem vorgegebenen Intervall 15 um den Basiskennlinienwert 21 herum liegt. Ergibt die Überprüfung, dass dies der Fall ist, so wird der mittels des trainierten Maschinenlernverfahrens 3 geschätzte Schätzwert 20 ausgegeben. Ergibt die Prüfung hingegen, dass dies nicht der Fall ist, so wird der mittels des trainierten Maschinenlernverfahrens 3 geschätzte Schätzwert 20 mittels des Moduls 2-3 korrigiert.
-
Der Schätzwert 20 wird von der Steuereinrichtung 2 ausgegeben und wird beispielsweise dem System 40 bzw. der Lenkung 51 zugeführt, welche ausgehend von dem Schätzwert 20, insbesondere einem Schätzwert 20 für die Reibung der Lenkung 51, eine Reibungskompensation steuert oder regelt.
-
In der 2 ist eine schematische Darstellung einer Basiskennlinie 4 und von Schätzwerten 20 zur Verdeutlichung der Erfindung gezeigt. Die Basiskennlinie 4 bildet einen Zusammenhang zwischen den Eingangsdaten 10, im Beispiel der Lenkung beispielsweise der Zahnstangengeschwindigkeit 11, und der jeweils dem Schätzwert 20 zugrunde liegenden Größe ab, im Beispiel der Lenkung beispielsweise der Reibung 12 der Lenkung. Die Reibung 12 kann in einem einfachen Modell beispielsweise als Funktion der Zahnstangengeschwindigkeit modelliert werden (z.B. F - v2, mit F der Reibungskraft und v der Zahnstangengeschwindigkeit). Um die Basiskennlinie 4 herum ist das vorgegebene Intervall 15 gezeigt, welches durch eine obere Grenze 16 und eine untere Grenze 17 definiert ist. Im Beispiel der Lenkung ergibt sich das vorgegebene Intervall 15 bzw. die obere Grenze 16 und die untere Grenze 17 beispielsweise durch eine vorgegebene maximale Abweichung +/- Δ der Reibung 12. Im gezeigten Beispiel liegt der mittels des trainierten Maschinenlernverfahren geschätzte Schätzwert 20 über fast den gesamten Wertebereich der Eingangsdaten 10 bzw. der Zahnstangengeschwindigkeit 11 innerhalb des vorgegebenen Intervalls 15. Nur in dem Bereich, der in der 2 mit X gekennzeichnet ist, liegt der Schätzwert 20 außerhalb des vorgegebenen Intervalls 15. Insbesondere wird die obere Grenze 16 des vorgegebenen Intervalls 15 überschritten.
-
Es kann vorgesehen sein, dass das vorgegebene Intervall 15 zumindest für einen Abschnitt der Basiskennlinie 4 konstant gewählt ist (wie dies beispielhaft in der 2 gezeigt ist).
-
Es kann vorgesehen sein, dass das vorgegebene Intervall 15 zumindest für einen Abschnitt der Basiskennlinie 4 in Abhängigkeit von einem jeweiligen Wert der Basiskennlinie 4 festgelegt ist oder festgelegt wird. Beispielsweise kann vorgesehen sein, die obere Grenze 16 und die untere Grenze 17 des vorgegebenen Intervalls 15 durch Multiplikation des Wertes der Basiskennlinie 4 mit jeweils einem konstanten Faktor zu bestimmen (z.B. 1,1 für die obere Grenze 16 und 0,9 für die untere Grenze; das Intervall ist dann stets definiert durch Grenzen +/-10 % des Wertes der Basiskennlinie 4).
-
Es kann vorgesehen sein, dass der Schätzwert 20 zumindest für einen Abschnitt der Basiskennlinie 4 beim Korrigieren auf den Wert der Basiskennlinie 4 geändert wird. In dem durch das X gekennzeichneten Bereich würden die jeweiligen Schätzwerte 20 dann auf die Werte der Basiskennlinie 4 gesetzt werden.
-
Es kann vorgesehen sein, dass der Schätzwert 20 zumindest für einen Abschnitt der Basiskennlinie 4 beim Korrigieren auf einen Wert derjenigen Intervallgrenze 16, 17 des vorgegebenen Intervalls 15 geändert wird, die über- oder unterschritten wurde. Hierdurch kann ein Sättigungseffekt erreicht werden. In dem durch das X gekennzeichneten Bereich in der 2 würden die jeweiligen Schätzwerte 20 dort dann auf den Wert der oberen Grenze 16 gesetzt werden.
-
Es kann vorgesehen sein, dass der Schätzwert 20 zumindest für einen Abschnitt der Basiskennlinie 4 beim Korrigieren auf einen vorgegebenen Wert geändert wird. Der vorgegebene Wert ist beispielsweise Null oder eine sonstige Konstante.
-
Es kann vorgesehen sein, dass das Korrigieren des Schätzwertes 20 zumindest für einen Abschnitt der Basiskennlinie 4 stetig innerhalb von einer vorgegebenen Korrekturzeit t (1) erfolgt. Die Korrekturzeit t kann beispielsweise konstant gewählt sein und beispielsweise zwischen einigen Hundert Millisekunden und einigen Sekunden liegen.
-
Es kann weiterbildend vorgesehen sein, dass die vorgegebene Korrekturzeit t unter Berücksichtigung von einer Differenz 18 zwischen dem vom trainierten Maschinenlernverfahren geschätzten Schätzwert 20 und einem jeweiligen Wert der Basiskennlinie 4 festgelegt wird. Insbesondere wird hierbei eine proportionale Abhängigkeit gewählt, sodass die vorgegebene Korrekturzeit t umso größer ist, je größer die Differenz 18 ist. Hierbei kann beispielsweise eine lineare Abhängigkeit gewählt werden. Grundsätzlich sind jedoch auch andere Abhängigkeiten möglich.
-
Das Verfahren und die Vorrichtung ermöglichen es, ein mittels eines trainierten Maschinenlernverfahrens geschätzten Schätzwert verbessert zu überprüfen und abzusichern.
-
Bezugszeichenliste
-
- 1
- Vorrichtung
- 2
- Steuereinrichtung
- 2-1
- Modul
- 2-2
- Modul
- 2-3
- Modul
- 3
- trainiertes Maschinenlernverfahren
- 4
- Basiskennlinie
- 10
- Eingangsdaten
- 11
- Zahnstangengeschwindigkeit
- 12
- Reibung der Lenkung
- 15
- vorgegebenes Intervall
- 16
- obere Grenze des Intervalls
- 17
- untere Grenze des Intervalls
- 18
- Differenz
- 20
- Schätzwert
- 40
- System
- 50
- Fahrzeug
- 51
- Lenkung
- t
- vorgegebene Korrekturzeit
- X
- Bereich (außerhalb des Intervalls)
- Δ
- maximale Abweichung
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- DE 102019217071 A1 [0002]