DE102023200229A1 - Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung - Google Patents

Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung Download PDF

Info

Publication number
DE102023200229A1
DE102023200229A1 DE102023200229.9A DE102023200229A DE102023200229A1 DE 102023200229 A1 DE102023200229 A1 DE 102023200229A1 DE 102023200229 A DE102023200229 A DE 102023200229A DE 102023200229 A1 DE102023200229 A1 DE 102023200229A1
Authority
DE
Germany
Prior art keywords
wheel
vehicle
model
friction
brake pressure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102023200229.9A
Other languages
English (en)
Inventor
Valentin Loeffelmann
Ilya Kamenshchikov
Felix Milo Richter
Felix Berkenkamp
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE102023200229.9A priority Critical patent/DE102023200229A1/de
Publication of DE102023200229A1 publication Critical patent/DE102023200229A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60TVEHICLE BRAKE CONTROL SYSTEMS OR PARTS THEREOF; BRAKE CONTROL SYSTEMS OR PARTS THEREOF, IN GENERAL; ARRANGEMENT OF BRAKING ELEMENTS ON VEHICLES IN GENERAL; PORTABLE DEVICES FOR PREVENTING UNWANTED MOVEMENT OF VEHICLES; VEHICLE MODIFICATIONS TO FACILITATE COOLING OF BRAKES
    • B60T8/00Arrangements for adjusting wheel-braking force to meet varying vehicular or ground-surface conditions, e.g. limiting or varying distribution of braking force
    • B60T8/17Using electrical or electronic regulation means to control braking
    • B60T8/174Using electrical or electronic regulation means to control braking characterised by using special control logic, e.g. fuzzy logic, neural computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/092Reinforcement learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Transportation (AREA)
  • Fuzzy Systems (AREA)
  • Neurology (AREA)
  • Mechanical Engineering (AREA)
  • Regulating Braking Force (AREA)

Abstract

Gemäß verschiedenen Ausführungsformen wird ein Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung beschrieben, aufweisend Trainieren eines Fahrzeugmodells für ein Fahrzeug und Erzeugen von Trainingsdatenelementen für die Fahrzeugsteuerung, wobei jedes Trainingsdatenelement erzeugt wird aus einem Paar aus einem Verlauf eines Eingangs-Bremsdrucks und einem Geschwindigkeitsverlauf, der durch Zuführen einer Folge von Eingangs-Radbremsdrücken gemäß dem Verlauf des Eingangs-Bremsdrucks zu dem Fahrzeugmodell ermittelt wird.

Description

  • Stand der Technik
  • Die vorliegende Offenbarung bezieht sich auf Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung.
  • Steuerungsverfahren, wie beispielsweise für eine Fahrzeugsteuerung, können mittels modellbasierten verstärkenden Lernens trainiert werden, wobei mittels eines Modells Trainingsdaten erzeugt werden, so dass weniger reale Experimente also ohne den Einsatz eines solchen Modells erforderlich sind. Dieses Modell muss allerdings seinerseits trainiert werden und auch für dieses Training ist eine hohe Dateneffizienz wünschenswert.
  • Es sind deshalb effiziente Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung wünschenswert.
  • Offenbarung der Erfindung
  • Gemäß verschiedenen Ausführungsformen wird ein Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung bereitgestellt, aufweisend Trainieren eines Fahrzeugmodells für ein Fahrzeug, das
    • • ein auf einem ersten neuronalen Netzwerk basierendes trainierbares Hydraulikmodell aufweist, das für jedes Rad eine Abhängigkeit eines resultierenden Radbremsdrucks von einem Eingangs-Radbremsdruck modelliert;
    • • ein Reibungsmodell aufweist, das für jedes Rad des Fahrzeugs eine Abhängigkeit eines Reibungskoeffizienten des Rads von einer Geschwindigkeit des Rads und einer Geschwindigkeit des Fahrzeugs modelliert;
    • • ein auf einem zweiten neuronalen Netzwerk basierendes zweites Neigungsmodell aufweist, das eine Abhängigkeit einer Neigung des Fahrzeugs von Reibungskräften der Räder des Fahrzeugs modelliert;
    • • aus einer Gewichtsverteilung gemäß einer mittels des Neigungsmodells ermittelten Neigung für jedes Rad die Normalkraft des Rads ermittelt;
    • • für jedes Rad durch Multiplikation eines mittels des Reibungsmodells ermittelten Reibungskoeffizienten und der Normalkraft des Rads die Reibungskraft des Rads ermittelt;
    • • für jedes Rad eine Radgeschwindigkeitsänderung durch Linearkombination der Reibungskraft des Rads und eines mittels des Hydraulikmodells ermittelten Radbremsdrucks ermittelt;
    • • eine Gesamtreibungskraft des Fahrzeugs als Summe der Reibungskräfte der Räder ermittelt; und
    • • eine Fahrzeuggeschwindigkeitsänderung durch Linearkombination der Gesamtreibungskraft und eines Luftwiderstandsterms ermittelt; und
  • Erzeugen von Trainingsdatenelementen für die Fahrzeugsteuerung, wobei jedes Trainingsdatenelement erzeugt wird aus einem Paar aus einem Verlauf eines Eingangs-Bremsdrucks und einem Geschwindigkeitsverlauf, der durch Zuführen einer Folge von Eingangs-Radbremsdrücken gemäß dem Verlauf des Eingangs-Bremsdrucks zu dem Fahrzeugmodell ermittelt wird.
  • Im Unterschied zu einem allgemeinem maschinellen Lernmodell, wie z.B. einem allgemeinen neuronalen Netzwerk, ist das Fahrzeugmodell, das gemäß dem oben beschriebenen Verfahren verwendet wird, strukturiert. Insbesondere sind neuronale Netzwerke über vorgegebene Gleichungen miteinander verknüpft. Dies verbessert die Dateneffizienz gegenüber der alleinigen Verwendung von neuronalen Netzwerken - insbesondere in Kombination mit modellbasiertem Verstärkungslernen. Das Trainieren eines Modells (hier eines Fahrzeugmodells) ist ein integraler Bestandteil des modellbasierten Verstärkungslernens, bei dem das Modell verwendet wird um zusätzliche Trainingsdaten für den Verstärkungslernalgorithmus zu generieren. Indem gemäß dem oben beschriebenen Verfahren dem Modell (gegenüber einem allgemeinen neuronalen Netzwerk) mehr Struktur verliehen wird, wird dateneffizienteres Lernen und bessere Verallgemeinerung ermöglicht.
  • Im Folgenden werden verschiedene Ausführungsbeispiele angegeben.
  • Ausführungsbeispiel 1 ist ein Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung wie oben beschrieben.
  • Ausführungsbeispiel 2 ist ein Verfahren nach Ausführungsbeispiel 1, wobei das Hydraulikmodell die Abhängigkeit des resultierenden Radbremsdrucks von dem Eingangs-Radbremsdruck durch eine Differentialgleichung modelliert, die einen Term enthält, der durch das erste neuronale Netzwerk implementiert ist
  • In anderen Worten wird eine neuronale ODE (ordinary differential equation) für die Implementierung des Hydraulikmodells verwendet. Dies ermöglicht eine effiziente Auswertung und ein effektives Training.
  • Ausführungsbeispiel 3 ist ein Verfahren nach Ausführungsbeispiel 1 oder 2, wobei das Neigungsmodell die Abhängigkeit der Neigung des Fahrzeugs von den Reibungskräften der Räder des Fahrzeugs durch eine Differentialgleichung modelliert, die einen Term enthält, der durch das zweite neuronale Netzwerk implementiert ist
  • In anderen Worten wird eine neuronale ODE (ordinary differential equation) für die Implementierung des Neigungsmodells verwendet. Dies ermöglicht eine effiziente Auswertung und ein effektives Training.
  • Ausführungsbeispiel 4 ist ein Verfahren nach einem der Ausführungsbeispiele 1 bis 3, wobei das Reibungsmodell trainierbar ist und auf einem dritten neuronalen Netzwerkwerk basiert.
  • Damit kann das Fahrzeugmodell auch hinsichtlich der Reibung an Trainingsdaten angepasst werden.
  • Ausführungsbeispiel 5 ist ein Verfahren nach Ausführungsbeispiel 4, wobei das Reibungsmodell die Abhängigkeit des Reibungskoeffizienten des Rads von der Geschwindigkeit des Rads und der Geschwindigkeit des Fahrzeugs durch eine Differentialgleichung modelliert, die einen Term enthält, der durch das dritte neuronale Netzwerk implementiert ist.
  • In anderen Worten wird eine neuronale ODE (ordinary differential equation) für die Implementierung des Reibungsmodells verwendet. Dies ermöglicht eine effiziente Auswertung und ein effektives Training.
  • Ausführungsbeispiel 6 ist ein Verfahren nach einem der Ausführungsbeispiele 1 bis 5, wobei die Koeffizienten der Linearkombination der Reibungskraft des Rads und des mittels des Hydraulikmodells ermittelten Radbremsdrucks trainierbar sind.
  • Dies ermöglicht die Anpassung des Fahrzeugmodells in Hinblick auf die Auswirkung von Reibungskraft gegenüber dem Untergrund und der Bremsen.
  • Ausführungsbeispiel 7 ist ein Verfahren nach einem der Ausführungsbeispiele 1 bis 6, wobei die Koeffizienten der Linearkombination der Gesamtreibungskraft und des Luftwiderstandsterms trainierbar sind.
  • Damit ist das Fahrzeugmodell insbesondere hinsichtlich der Auswirkung von Luftwiderstand im Vergleich zur Bremswirkung der Bremsen anpassbar.
  • Ausführungsbeispiel 8 ist ein Verfahren zum Trainieren einer Fahrzeugsteuerung, aufweisend Erzeugen von Trainingsdaten gemäß einem der Ausführungsbeispiele 1 bis 7 und Trainieren der Fahrzeugsteuerung unter Verwendung der Trainingsdaten.
  • Ausführungsbeispiel 9 ist ein Verfahren nach Ausführungsbeispiel 8, wobei die Fahrzeugsteuerung unter Verwendung der Trainingsdaten mittels verstärkenden Lernens trainiert wird.
  • Das Fahrermodell liefert somit Trainingsdaten für verstärkendes Lernen (reinforcement learning RL). Dies verringert die Anzahl der realen Experimente, die durchgeführt werden müssen.
  • Ausführungsbeispiel 10 ist ein Fahrzeugsteuerungs-Trainingssystem, eingerichtet zum Durchführen des Verfahrens nach einem der Ausführungsbeispiele 1 bis 9.
  • Ausführungsbeispiel 11 ist ein Computerprogramm mit Befehlen, die, wenn sie durch einen Prozessor ausgeführt werden, bewirken, dass der Prozessor ein Verfahren nach einem der Ausführungsbeispiele 1 bis 9 durchführt.
  • Ausführungsbeispiel 12 ist ein computerlesbares Medium, das Befehle speichert, die, wenn sie durch einen Prozessor ausgeführt werden, bewirken, dass der Prozessor ein Verfahren nach einem der Ausführungsbeispiele 1 bis 9 durchführt.
  • In den Zeichnungen beziehen sich ähnliche Bezugszeichen im Allgemeinen auf dieselben Teile in den ganzen verschiedenen Ansichten. Die Zeichnungen sind nicht notwendigerweise maßstäblich, wobei die Betonung stattdessen im Allgemeinen auf die Darstellung der Prinzipien der Erfindung gelegt wird. In der folgenden Beschreibung werden verschiedene Aspekte mit Bezug auf die folgenden Zeichnungen beschrieben.
    • 1 zeigt ein Fahrzeug.
    • 2 veranschaulicht ein Radmodell.
    • 3 veranschaulicht ein Fahrzeugmodell.
    • 4 zeigt ein Ablaufdiagramm, das ein Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung gemäß einer Ausführungsform darstellt.
  • Die folgende ausführliche Beschreibung bezieht sich auf die begleitenden Zeichnungen, die zur Erläuterung spezielle Details und Aspekte dieser Offenbarung zeigen, in denen die Erfindung ausgeführt werden kann. Andere Aspekte können verwendet werden und strukturelle, logische und elektrische Änderungen können durchgeführt werden, ohne vom Schutzbereich der Erfindung abzuweichen. Die verschiedenen Aspekte dieser Offenbarung schließen sich nicht notwendigerweise gegenseitig aus, da einige Aspekte dieser Offenbarung mit einem oder mehreren anderen Aspekten dieser Offenbarung kombiniert werden können, um neue Aspekte zu bilden.
  • Im Folgenden werden verschiedene Beispiele genauer beschrieben.
  • 1 zeigt ein Fahrzeug 101.
  • Im Beispiel von 1 ist ein Fahrzeug 101, beispielsweise ein PKW oder LKW, mit einer Fahrzeugsteuereinrichtung 102 versehen.
  • Die Fahrzeugsteuereinrichtung 102 weist Datenverarbeitungskomponenten auf, z.B. einen Prozessor (z.B. eine CPU (Zentraleinheit)) 103 und einen Speicher 104 zum Speichern von Steuersoftware, gemäß der die Fahrzeugsteuereinrichtung 102 arbeitet, und Daten, die von dem Prozessor 103 verarbeitet werden.
  • Beispielsweise weist die gespeicherte Steuerungssoftware (Computerprogramm) Anweisungen auf, die, wenn der Prozessor sie ausführt, bewirken, dass der Prozessor 103 ein maschinelles Lernmodell 105 implementiert.
  • Die Fahrzeugsteuereinrichtung 102 kann verschiedene Steueraufgaben übernehmen die von Fahrerassisstenzufunktionen bis zu vollständig autonomen Fahren reichen.
  • Beispielsweise ist gemäß einer Ausführungsform die Fahrzeugsteuereinrichtung 102 eine Steuerungseinrichtung für ein Antiblockiersystem (ABS), d.h. erzeugt einen gewünschten Bremsdruck (auch als Eingangs-(Rad-)Bremsdruck bezeichnet) für eine Bremse 106, und wird mit Hilfe von modellbasiertem Lernen optimiert. Beispielsweise werden Daten über das Verhalten des Fahrzeugs mittels eines Modells ermittelt (in diesem Fall z.B. Paare von eingegebenem (d.h. gewünschten) Bremsdruck (über mehrere Zeitschritte) und daraus resultierendem Geschwindigkeitsverlauf) und diese Daten können dann als Trainingsdaten für die Fahrzeugsteuereinrichtung 102 verwendet werden (die beispielsweise mittels verstärkendem Lernen (engl. reinforcement learning RL) trainiert wird). Die damit trainierte Fahrzeugsteuereinrichtung 102 kann anschließend zum Steuern eines Fahrzeuges verwendet werden.
  • Das Modell, das für ein solches Vorgehen erforderlich ist, ist für das genannte Beispiel eines Antiblockiersystems ein Fahrzeugmodell, das für einen Verlauf eines eingegebenen Bremsdrucks (d.h. eines gewünschten Bremsdrucks für mehrere Zeitschritte) eine daraus resultierende Geschwindigkeit des Fahrzeugs (ausgehend von einem Startwert der Geschwindigkeit) ausgibt.
  • Wird ein solches Fahrzeugmodell seinerseits mittels verstärkendem Lernen trainiert, wird es typischerweise an relativ wenige Trainingsdaten angepasst und muss in der Lage sein, lokale Vorhersagen zu treffen (d. h. es nur lokal um die Trainingsdaten herum verallgemeinern). Einerseits ist es wünschenswert, dass ein solches Fahrzeugmodell hinreichend allgemein ist, um sich an die Realität anzupassen, andererseits muss es dateneffizient trainiert werden können.
  • Eine Möglichkeit zum Lernen eines Fahrzeugmodells ist zum Beispiel das Trainieren eines (z.B. zeitdiskret arbeitenden) neuronalen Netzwerks mit überwachtem Lernen mittels Zeitreihendaten als Trainingsdaten (d.h., wie oben beschriebene, eine Zeitreihe des gewünschten Bremsdrucks und als Ground-Truth eine Zeitreihe der resultierenden Geschwindigkeit). Um die Dateneffizienz (ohne nötige Änderungen an dem Trainingsverfahren) zu erhöhen, wird gemäß verschiedenen Ausführungsformen das neuronale Netz strukturiert (d.h. in mehrere Teilnetze aufgeteilt, die geeignet verknüpft werden). Konkret wird gemäß verschiedenen Ausführungsformen eine hybride neuronale ODE (ordinary differential equation, also gewöhnliche Differentialgleichung) verwendet, die Vorwissen über Fahrzeugsysteme mit der Flexibilität von neuronalen Netzwerken kombiniert, um dateneffizientes Lernen zu ermöglichen.
  • Gemäß verschiedenen Ausführungsformen weist das Fahrzeugmodell somit eine Struktur auf, die einer Kombination aus mehreren Modulen entspricht, die flexibel parametrisiert werden können, entweder gemäß festen physikalischen Gleichungen, flexiblen neuronalen Netzen oder einer hybriden Kombination aus beidem.
  • Im Folgenden wird ein Beispiel für ein Fahrzeugmodell im Detail beschrieben.
  • Das Fahrzeugmodell ist in diesem Beispiel ein Modell für ein Fahrzeug mit vier Rädern von denen jedes eine interne Dynamik aufweist.
  • 2 veranschaulicht ein Radmodell 200.
  • Das Radmodell 200 liefert für das jeweilige Rad die Reibungskraft F f r W ( t )
    Figure DE102023200229A1_0001
    („W“ für engl. „wheel“ und „fr“ für englisch friction), die auf das Rad durch den Untergrund (im Zeitschritt t) einwirkt. Es weist ein Hydraulikmodell 201, ein Reibungsmodell 202 und ein Radgeschwindigkeitsmodell 203 auf.
  • Das Radmodell 200 erhält als Eingabe einen gewünschten Bremsdruck p d e s W ( t )
    Figure DE102023200229A1_0002
    („des“ für engl. desired) und das Radgeschwindigkeitsmodell 203 modelliert die resultierende Radgeschwindigkeit gemäß einer Differentialgleichung: v ˙ W ( t ) = c f F f r W ( t ) c p p W ( t ) tanh ( c t v W ( t ) )
    Figure DE102023200229A1_0003
    wobei p W ( t ) = H y d r a u l i k ( p d e s W ( t ) )
    Figure DE102023200229A1_0004
    F f r W ( t ) = R e i b u n g ( 1 v W ( t ) v V ( t ) ) F n o r m a l W ( t )
    Figure DE102023200229A1_0005
    wobei cp und cf trainierbare Konstanten sind und F n o r m a l W ( t )
    Figure DE102023200229A1_0006
    die aktuelle Normalkraft des Rads auf den Untergrund ist. Diese hängt von der Neigung des Fahrzeugs ab und ist für ein Vorderrad gleich F n o r m a l F W ( t )
    Figure DE102023200229A1_0007
    und für ein Hinterrad F n o r m a l R W ( t ) .
    Figure DE102023200229A1_0008
    Die Größe vV(t) ist die Fahrzeuggeschwindigkeit („V“ für engl. vehicle).
  • Die trainierbaren Konstanten cp und cf sind nicht nur typische Druck- und Reibungskonstanten, sondern berücksichtigen auch die Trägheit des Rades und seinen Radius. Durch die Eliminierung redundanter Lernparameter wie Radius des Rades und Trägheit des Rades wird das Modell leichter trainierbar.
  • Das Reibungsmodell 202, d.h. die Funktion Reibung(.) ist in der Regel statisch (es ist zeitunabhängig und hat keine internen Zustände) und kann entweder durch ein physikalisches Reibungsmodell oder durch ein neuronales Netzwerk 204 implementiert werden. In letzterem Fall kann die Eingabe 1 v W ( t ) v V ( t )
    Figure DE102023200229A1_0009
    während des Trainings gestört werden, um die Hessematrix des Reibungsmodells zu regularisieren und somit das Lernen einer glatten Funktion zu fördern.
  • Die hydraulischen Komponenten eines Fahrzeugs verfügen typischerweise über eine interne Steuerlogik, die darauf abzielt, den Verschleiß des Aktuators der Bremse 106 zu minimieren. Deshalb wird als Hydraulikmodell 201, d.h. für die Funktion Hydraulik(.) ein Modell verwendet, das eine zeitkontinuierliche neuronale ODE mit einem zeitdiskreten Logikmodul kombiniert. Das Hydraulikmodell 201 besteht insbesondere aus einer dynamischen Komponente, die als ein System zweiter Ordnung modelliert wird p ¨ W ( t ) = 2 c 1 c 2 2 p ˙ W ( t ) c 1 2 ( p W ( t ) p l o g i c W ( t ) )
    Figure DE102023200229A1_0010
    wobei c1 und c2 lernbare Konstanten sind. Um die Steuerlogik zu berücksichtigen, wird p l o g i c W ( t )
    Figure DE102023200229A1_0011
    als ein zeitdiskretes Signal verwendet, das für jeden Zeitschritt konstant ist. Es hängt insbesondere von dem aktuell gewünschten Bremsdruck p d e s W ( t )
    Figure DE102023200229A1_0012
    und einer Folge von n vergangenen Bremsdrücken p ( t Δ t Δ T i Δ T )
    Figure DE102023200229A1_0013
    ab, wobei i die vergangenen Drücke indiziert. Die genaue funktionale Form des Hydraulikmodells 201 ist flexibel, aber gemäß einem Ausführungsbeispiel wird für p l o g i c W ( t )
    Figure DE102023200229A1_0014
    ein Feed-Forward-MLP (multi-layer perceptron) 205, das sowohl den aktuell gewünschten Bremsdruck als auch die Abfolge der vergangenen Bremsdrücke direkt als Eingaben übernimmt, verwendet. Ein rekurrentes Modell wie ein LSTM (Long short-term memory), das dann nur den aktuell gewünschten Bremsdruck als Eingabe erhält, ist eine Alternative.
  • 3 veranschaulicht ein Fahrzeugmodell 300.
  • Das Fahrzeugmodell weist für jedes Rad (FR, FL, RR, RL) ein Radmodell 301 entsprechend dem Radmodell 200 von 2 auf. Die von den Radmodellen 301 gelieferten Reibungskräfte F f r W ( t )
    Figure DE102023200229A1_0015
    für die vier Räder werden mittels eines Neigungsmodells 302, d.h. einer Funktion Neigung(.), kombiniert, das über die Neigung für jedes Rad die Normalkraft F n o r m a l W ( t )
    Figure DE102023200229A1_0016
    berechnet und an das jeweilige Radmodell 301 zurückgeliefert. Dies erfolgt gemäß F t o t ( t ) = W M e n g e   d e r   R ä d e r F f r W ( t )
    Figure DE102023200229A1_0017
    c ( t ) = N e i g u n g ( F t o t ( t ) )
    Figure DE102023200229A1_0018
    F f r F W ( t ) = m g c ( t )
    Figure DE102023200229A1_0019
    F f r R W ( t ) = m g ( 1 c ( t ) )
    Figure DE102023200229A1_0020
    wobei m die trainierbare Masse des Fahrzeugs ist, g die Gravitationskonstante und c(t) ∈ [0,11 die Gravitationskraft zwischen dem Vorder- und dem Hinterrad verteilt. Das Neigungsmodell 302 (Differentialgleichung) berücksichtigt die Tatsache, dass sich das Fahrzeug während eines Bremsvorgangs nach vorne neigt und somit mehr Druck auf den Vorderrädern lastet.
  • Das Neigungsmodell 302 kann flexibel gewählt werden, z.B. als ein rekurrentes neuronales Netzwerk. Gemäß einer Ausführungsform wird es (ähnlich wie oben pW(t)) als eine Kombination einer statischen Komponente mit neuronalen ODE zweiter Ordnung modelliert, d. h. c(t) folgt einer Dynamik zweiter Ordnung mit einem neuronalen Netz 304 (das eine f implementiert) das Reibungskräfte auf Änderungen des Schwerpunkts abbildet: c ¨ ( t ) = 2 c 4 c 5 c ˙ ( t ) c 4 2 ( c ( t ) f ( F t o t ( t ) ) )
    Figure DE102023200229A1_0021
  • Die Fahrzeuggeschwindigkeit vV(t) ergibt sich aus einem Fahrzeuggeschwindigkeitsmodell 303. Sie hängt von der Summe aller Radreibungskräfte Ftot(t) sowie einem Aerodynamikterm ab: v ˙ V ( t ) = 1 m ( F t o t ( t ) c v ( v V ( t ) ) 2 )
    Figure DE102023200229A1_0022
  • Das Fahrzeugmodell enthält somit mehrere Komponenten, die teilweise durch explizite Formeln und teilweise durch neuronale ODEs, d.h. Differentialgleichungen, deren Eingaben zumindest teilweise von neuronalen Netzwerken geliefert werden, auf. Diese können zu einem System gewöhnlicher Differentialgleichungen zusammengefasst werden, z.B. der Form ( p ¨ W ( t ) c ¨ ( t ) v ˙ W v ˙ V ) = ( h 1 ( p d e s W ( t ) ) h 2 ( p d e s W ( t ) ) h 3 ( p d e s W ( t ) ) h 4 ( p d e s W ( t ) ) )
    Figure DE102023200229A1_0023
    wobei sich die rechte Seite, d.h. die Funktionen h1 bis h4 gemäß der Zusammenhänge entsprechend der obigen Formeln ergibt. Dieses System gewöhnlicher Differentialgleichungen kann dann in einen ODE-Löser eingeben werden, der letztendlich insbesondere vV liefert. Dabei verarbeitet der ODE-Löser Ausgaben von den neuronalen Netzen 204, 205 und ggf. 304. Es sollte beachtet werden, dass das Gesamtfahrzeug vier individuelle Räder mit eigenen Parametern und jeweils eigenen vorgegebenen Bremsdruck haben kann. Es gibt also nicht einen Bremsdruck, sondern vier verschiedene. Entsprechend können in der obigen Gleichung v̇W, p̈W(t) und p d e s W ( t )
    Figure DE102023200229A1_0024
    mehrere Komponenten (eine pro Rad) haben.
  • Das Fahrzeugmodell 300 kann mittels (z.B. aus Messungen gewonnener) Trainingsdaten, die Paare von gewünschtem Bremsdruck (über mehrere Zeitschritte; als Eingabe für das Fahrzeugmodell 300) und daraus resultierendem Geschwindigkeitsverlauf (als Ground-Truth für das Fahrzeugmodell 300) trainiert werden, d.h. die verschiedenen trainierbaren Parameter, insbesondere die Gewichte der neuronalen Netzwerke, werden angepasst, damit die Ausgaben des Fahrzeugmodells 300 für die Eingaben aus den Trainingsdaten den jeweiligen Ground-Truth Daten (im Mittel bzw. statistisch) möglichst gut entsprechen.
  • Das Fahrzeugmodell 300 kann wie oben erwähnt zusammen mit üblichen modellbasierten Verstärkungslernmethoden verwendet werden, um den Bremsweg eines Fahrzeugs zu optimieren, d.h. beispielsweise kann die Fahrzeugsteuereinrichtung 102 mittels des Fahrzeugmodells 300 und verstärkendem Lernen trainiert werden, wenn die Geschwindigkeit des Fahrzeugs reduziert werden soll, einen geeigneten zeitlichen Verlauf eines Bremssteuersignals p d e s W
    Figure DE102023200229A1_0025
    auszugeben. Es kann auch beispielsweise zur Optimierung von TCSs (Tracking Control Systems) oder ABS Reglern oder anderweitigen Fahrdynamikreglern für beliebige Fahrzeuge verwendet werden.
  • Zusammengefasst wird gemäß verschiedenen Ausführungsformen ein Verfahren bereitgestellt, wie in 4 dargestellt.
  • 4 zeigt ein Ablaufdiagramm 400, das ein Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung gemäß einer Ausführungsform darstellt.
  • In 401 wird ein Fahrzeugmodell für ein Fahrzeug trainiert, das
    • • ein auf einem ersten neuronalen Netzwerk basierendes trainierbares Hydraulikmodell aufweist, das für jedes Rad eine Abhängigkeit eines resultierenden Radbremsdrucks von einem Eingangs-Radbremsdruck modelliert;
    • • ein Reibungsmodell aufweist, das für jedes Rad des Fahrzeugs eine Abhängigkeit eines Reibungskoeffizienten des Rads von einer Geschwindigkeit des Rads und einer Geschwindigkeit des Fahrzeugs modelliert;
    • • ein auf einem zweiten neuronalen Netzwerk basierendes zweites Neigungsmodell aufweist, das eine Abhängigkeit einer Neigung des Fahrzeugs von Reibungskräften der Räder des Fahrzeugs modelliert;
    • • aus einer Gewichtsverteilung gemäß einer mittels des Neigungsmodells ermittelten Neigung für jedes Rad die Normalkraft des Rads ermittelt;
    • • für jedes Rad durch Multiplikation eines mittels des Reibungsmodells ermittelten Reibungskoeffizienten und der Normalkraft des Rads die Reibungskraft des Rads ermittelt;
    • • für jedes Rad eine Radgeschwindigkeitsänderung durch Linearkombination der Reibungskraft des Rads und eines mittels des Hydraulikmodells ermittelten Radbremsdrucks ermittelt;
    • • eine Gesamtreibungskraft des Fahrzeugs als Summe der Reibungskräfte der Räder ermittelt; und
    • • eine Fahrzeuggeschwindigkeitsänderung durch Linearkombination der Gesamtreibungskraft und eines Luftwiderstandsterms ermittelt.
  • In 402 werden Trainingsdatenelemente für die Fahrzeugsteuerung erzeugt, wobei jedes Trainingsdatenelement erzeugt wird aus einem Paar (z.B. als Paar oder unter Verwendung eines Paares) aus einem Verlauf eines Eingangs-Bremsdrucks und einem Geschwindigkeitsverlauf, der durch Zuführen einer Folge von Eingangs-Radbremsdrücken gemäß dem Verlauf des Eingangs-Bremsdrucks zu dem Fahrzeugmodell ermittelt wird.
  • Die Trainingsdaten können auch weitere Signale beinhalten. In diesem Fall kann das Fahrzeugmodell als Teil eines größeren Modells agieren. Es können auch zusätzliche Trainingsdaten (zusätzlich zu den mittels des Fahrzeugmodells erzeugten Trainingsdatenelementen) mit einem bestehenden Regler generiert werden.
  • Die trainierbaren Elemente und Parameter, insbesondere die Gewichte der neuronalen Netzwerke, werden beim Trainieren des Fahrzeugmodells trainiert.
  • Das Verfahren von 4 kann durch einen oder mehrere Computer (die z.B. ein Fahrzeugsteuerungs-Trainingssystem implementieren) mit einer oder mehreren Datenverarbeitungseinheiten durchgeführt werden. Der Begriff „Datenverarbeitungseinheit“ kann als irgendein Typ von Entität verstanden werden, die die Verarbeitung von Daten oder Signalen ermöglicht. Die Daten oder Signale können beispielsweise gemäß mindestens einer (d.h. einer oder mehr als einer) speziellen Funktion behandelt werden, die durch die Datenverarbeitungseinheit durchgeführt wird. Eine Datenverarbeitungseinheit kann eine analoge Schaltung, eine digitale Schaltung, eine Logikschaltung, einen Mikroprozessor, einen Mikrocontroller, eine Zentraleinheit (CPU), eine Graphikverarbeitungseinheit (GPU), einen Digitalsignalprozessor (DSP), eine integrierte Schaltung einer programmierbaren Gatteranordnung (FPGA) oder irgendeine Kombination davon umfassen oder aus dieser ausgebildet sein. Irgendeine andere Weise zum Implementieren der jeweiligen Funktionen, die hierin genauer beschrieben werden, kann auch als Datenverarbeitungseinheit oder Logikschaltungsanordnung verstanden werden. Es können ein oder mehrere der im Einzelnen hier beschriebenen Verfahrensschritte durch eine Datenverarbeitungseinheit durch eine oder mehrere spezielle Funktionen ausgeführt (z. B. implementiert) werden, die durch die Datenverarbeitungseinheit durchgeführt werden.
  • Das Verfahren ist also gemäß verschiedenen Ausführungen insbesondere computerimplementiert.
  • Obwohl spezielle Ausführungsformen hier dargestellt und beschrieben wurden, wird vom Fachmann auf dem Gebiet erkannt, dass die speziellen Ausführungsformen, die gezeigt und beschrieben sind, gegen eine Vielfalt von alternativen und/oder äquivalenten Implementierungen ausgetauscht werden können, ohne vom Schutzbereich der vorliegenden Erfindung abzuweichen. Diese Anmeldung soll irgendwelche Anpassungen oder Variationen der speziellen Ausführungsformen abdecken, die hier erörtert sind. Daher ist beabsichtigt, dass diese Erfindung nur durch die Ansprüche und die Äquivalente davon begrenzt ist.

Claims (12)

  1. Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung, aufweisend: Trainieren eines Fahrzeugmodells für ein Fahrzeug, das ein auf einem ersten neuronalen Netzwerk basierendes trainierbares Hydraulikmodell aufweist, das für jedes Rad eine Abhängigkeit eines resultierenden Radbremsdrucks von einem Eingangs-Radbremsdruck modelliert; ein Reibungsmodell aufweist, das für jedes Rad des Fahrzeugs eine Abhängigkeit eines Reibungskoeffizienten des Rads von einer Geschwindigkeit des Rads und einer Geschwindigkeit des Fahrzeugs modelliert; ein auf einem zweiten neuronalen Netzwerk basierendes zweites Neigungsmodell aufweist, das eine Abhängigkeit einer Neigung des Fahrzeugs von Reibungskräften der Räder des Fahrzeugs modelliert; aus einer Gewichtsverteilung gemäß einer mittels des Neigungsmodells ermittelten Neigung für jedes Rad die Normalkraft des Rads ermittelt; für jedes Rad durch Multiplikation eines mittels des Reibungsmodells ermittelten Reibungskoeffizienten und der Normalkraft des Rads die Reibungskraft des Rads ermittelt; für jedes Rad eine Radgeschwindigkeitsänderung durch Linearkombination der Reibungskraft des Rads und eines mittels des Hydraulikmodells ermittelten Radbremsdrucks ermittelt; eine Gesamtreibungskraft des Fahrzeugs als Summe der Reibungskräfte der Räder ermittelt; und eine Fahrzeuggeschwindigkeitsänderung durch Linearkombination der Gesamtreibungskraft und eines Luftwiderstandsterms ermittelt; und Erzeugen von Trainingsdatenelementen für die Fahrzeugsteuerung, wobei jedes Trainingsdatenelement erzeugt wird aus einem Paar aus einem Verlauf eines Eingangs-Bremsdrucks und einem Geschwindigkeitsverlauf, der durch Zuführen einer Folge von Eingangs-Radbremsdrücken gemäß dem Verlauf des Eingangs-Bremsdrucks zu dem Fahrzeugmodell ermittelt wird.
  2. Verfahren nach Anspruch 1, wobei das Hydraulikmodell die Abhängigkeit des resultierenden Radbremsdrucks von dem Eingangs-Radbremsdruck durch eine Differentialgleichung modelliert, die einen Term enthält, der durch das erste neuronale Netzwerk implementiert ist
  3. Verfahren nach Anspruch 1 oder 2, wobei das Neigungsmodell die Abhängigkeit der Neigung des Fahrzeugs von den Reibungskräften der Räder des Fahrzeugs durch eine Differentialgleichung modelliert, die einen Term enthält, der durch das zweite neuronale Netzwerk implementiert ist
  4. Verfahren nach einem der Ansprüche 1 bis 3, wobei das Reibungsmodell trainierbar ist und auf einem dritten neuronalen Netzwerkwerk basiert.
  5. Verfahren nach Anspruch 4, wobei das Reibungsmodell die Abhängigkeit des Reibungskoeffizienten des Rads von der Geschwindigkeit des Rads und der Geschwindigkeit des Fahrzeugs durch eine Differentialgleichung modelliert, die einen Term enthält, der durch das dritte neuronale Netzwerk implementiert ist.
  6. Verfahren nach einem der Ansprüche 1 bis 5, wobei die Koeffizienten der Linearkombination der Reibungskraft des Rads und des mittels des Hydraulikmodells ermittelten Radbremsdrucks trainierbar sind.
  7. Verfahren nach einem der Ansprüche 1 bis 6, wobei die Koeffizienten der Linearkombination der Gesamtreibungskraft und des Luftwiderstandsterms trainierbar sind.
  8. Verfahren zum Trainieren einer Fahrzeugsteuerung, aufweisend Erzeugen von Trainingsdaten gemäß einem der Ansprüche 1 bis 7 und Trainieren der Fahrzeugsteuerung unter Verwendung der Trainingsdaten.
  9. Verfahren nach Anspruch 8, wobei die Fahrzeugsteuerung unter Verwendung der Trainingsdaten mittels verstärkenden Lernens trainiert wird.
  10. Fahrzeugsteuerungs-Trainingssystem, eingerichtet zum Durchführen des Verfahrens nach einem der Ansprüche 1 bis 9.
  11. Computerprogramm mit Befehlen, die, wenn sie durch einen Prozessor ausgeführt werden, bewirken, dass der Prozessor ein Verfahren nach einem der Ansprüche 1 bis 9 durchführt.
  12. Computerlesbares Medium, das Befehle speichert, die, wenn sie durch einen Prozessor ausgeführt werden, bewirken, dass der Prozessor ein Verfahren nach einem der Ansprüche 1 bis 9 durchführt.
DE102023200229.9A 2023-01-12 2023-01-12 Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung Pending DE102023200229A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102023200229.9A DE102023200229A1 (de) 2023-01-12 2023-01-12 Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102023200229.9A DE102023200229A1 (de) 2023-01-12 2023-01-12 Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung

Publications (1)

Publication Number Publication Date
DE102023200229A1 true DE102023200229A1 (de) 2024-07-18

Family

ID=91667710

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102023200229.9A Pending DE102023200229A1 (de) 2023-01-12 2023-01-12 Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung

Country Status (1)

Country Link
DE (1) DE102023200229A1 (de)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102021206880A1 (de) 2021-06-30 2023-01-05 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren und Vorrichtung zur optimalen Parametrisierung eines Fahrdynamikregelungssystems für Fahrzeuge

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102021206880A1 (de) 2021-06-30 2023-01-05 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren und Vorrichtung zur optimalen Parametrisierung eines Fahrdynamikregelungssystems für Fahrzeuge

Similar Documents

Publication Publication Date Title
DE69934161T2 (de) Vorrichtung zur Regelung des Fahrverhaltens eines Kraftfahrzeugs unter Verwendung eines mathematischen Reifenmodells
DE102005013807B4 (de) Verfahren zum Regeln eines Fahrzeugs und integriertes Fahrzeugregelungssystem
EP1119479B1 (de) Verfahren und vorrichtung zur ermittlung einer geschwindigkeitsgrösse
DE102006054425A1 (de) Verfahren und Vorrichtung zum Ermitteln eines Modellparameters eines Referenzfahrzeugmodells
WO2014154639A1 (de) Fahrzeugreferenzgeschwindigkeitsbestimmungsverfahren und fahrzeugsteuergerät mit einem solchen verfahren
DE19939872B4 (de) Verfahren und Vorrichtung zur Sensorüberwachung insbesondere für ein ESP-System für Fahrzeuge
DE102019209462A1 (de) Verfahren zur Bestimmung eines Vertrauens-Wertes eines detektierten Objektes
DE102019111041A1 (de) Verfahren und Vorrichtung zur Ermittlung eines Schätzwertes des Schwimmwinkels eines Fahrzeugs
DE102020115390A1 (de) VORRICHTUNG ZUM ERZEUGEN EINES BESCHLEUNIGUNGSPROFILS UND VERFAHREN ZUM AUTONOMEN FAHREN AUF EINER GEKRÜMMTEN STRAßE UNTER VERWENDUNG DESSELBEN
DE102020112107A1 (de) Vorrichtung und Verfahren zum Abschätzen eines Neigungswinkels einer Straße
DE102020214620A1 (de) Auswerteeinrichtung, Computerprogramm und computerimplementiertes Verfahren zum Trainieren eines neuronalen Netzes zur Reibwertbestimmung
DE102017216061A1 (de) Situationsabhängige Entscheidungsfindung für Fahrzeuge
DE102019105850A1 (de) Verfahren zur Erzeugung eines reduzierten neuronalen Netzes für ein Steuergerät eines Fahrzeuges mithilfe von Eigenvektoren
DE112021005568T5 (de) Datenverarbeitungsvorrichtung und Datenverarbeitungsverfahren
DE102017219365B4 (de) Vorrichtung und Verfahren zur adaptiven Fahrzeugregelung
DE102019106596B4 (de) Verfahren und System zum Bestimmen einer Geschwindigkeit eines Fahrzeugs
DE102020105783A1 (de) Verfahren zur Erzeugung eines reduzierten neuronalen Netzes
DE102023200229A1 (de) Verfahren zum Erzeugen von Trainingsdaten für eine Fahrzeugsteuerung
DE102019128459A1 (de) Steuervorrichtung für ein Fahrzeug
DE102021200274B3 (de) Verfahren und Vorrichtung zum Bereitstellen einer Bremsentemperatur mindestens einer Bremse eines Fahrzeugs
DE102021130866A1 (de) Verfahren zum Ermitteln einer Fahrzeugmasse eines Fahrzeuges, Massen-Abschätzungseinheit sowie Fahrzeug
DE102019130484A1 (de) Verfahren und Vorrichtung zum Anlernen eines Ensembles von neuronalen Netzen
DE102019113958A1 (de) Verfahren zur Leistungssteigerung eines Fahrzeugsystems mit einem neuronalen Netz zum Steuern einer Fahrzeugkomponente
DE102019214709B4 (de) Detektieren von Gefahrengeräuschen eines Egofahrzeugs
DE102020210700A1 (de) Flexiblerer iterativer Betrieb künstlicher neuronaler Netzwerke