DE102021132197A1

DE102021132197A1 - Verfahren, Systeme und Vorrichtungen zur verhaltensbasierten adaptiven, an den Fahrstil eines Fahrers anpassenden, Geschwindigkeitsregelung (ACC)

Info

Publication number: DE102021132197A1
Application number: DE102021132197.2A
Authority: DE
Inventors: Jagannadha Reddy Satti; Amanpal S. Grewal; Mohammadali Shahriari
Original assignee: GM Global Technology Operations LLC
Current assignee: GM Global Technology Operations LLC
Priority date: 2021-01-14
Filing date: 2021-12-07
Publication date: 2022-07-14
Also published as: US11834042B2; CN114763139A; US20220219695A1

Abstract

In verschiedenen Ausführungsformen werden Verfahren, Systeme und Fahrzeugvorrichtungen bereitgestellt. Ein Verfahren zum Implementieren einer adaptiven Geschwindigkeitsregelung (ACC), das durch Verstärkungslemen (RL) festgelegt wird, beinhaltet das Ausführen einer adaptiven Geschwindigkeitsregelung durch einen Prozessor, um einen Satz von Fahrzeugeingaben über die Betriebsumgebung und den aktuellen Betrieb eines Host-Fahrzeugs zu empfangen; das Identifizieren eines Zielfahrzeugs, das in der Umgebung des Host-Fahrzeugs operiert und das Quantifizieren eines Satzes von Zielfahrzeugparametern über das Zielfahrzeug, die aus den erfassten Eingaben abgeleitet werden, durch den Prozessor; das Modellieren einer Zustandsabschätzung des Host-Fahrzeugs und des Zielfahrzeugs durch Erzeugen eines Satzes von Geschwindigkeitsberechnungen und Drehmomentberechnungen für jedes Fahrzeug; das Erzeugen eines Satzes von Ergebnissen aus mindestens einer Belohnungsfunktion auf der Grundlage einer oder mehrerer modellierter Zustandsabschätzungen des Hostfahrzeugs und des Zielfahrzeugs; das Verarbeiten des Satzes von Ergebnissen mit durch RL ermittelten Daten zum Fahrerverhalten, um eine oder mehrere Steueraktionen mit den Daten zum Fahrerverhalten zu korrelieren.

Description

Einführung
Die vorliegende Offenbarung bezieht sich im Allgemeinen auf Fahrzeuge und insbesondere auf Verfahren, Systeme und Vorrichtungen, die das Fahrerverhalten bewerten und ein Zielfahrzeugverhalten erkennen, um ein intelligentes Modell für eine adaptive Geschwindigkeitsregelungsfunktion zu trainieren, das mit dem Fahrstil eines Fahrers bei der Bedienung eines Fahrzeugs korreliert.
Die letzten Jahren haben erhebliche Fortschritte bei autonomen und teilautonomen Fahrfunktionen in bodengebundenen Fahrzeugen, wie z. B. Super Cruise (eine freihändige teilautonome Fahrerassistenzfunktion, die mithilfe von hochauflösenden Karten und Sensoren, die die Straße beobachten, das Beschleunigen und Abbremsen eines Fahrzeugs unterstützt), LKA (Spurhalteassistent (Engl.: Lane Keep Assist), eine teilautonome Fahrfunktion, die die Lenkung unterstützt, um ein Fahrzeug in der Mitte der Fahrspur zu halten) und andere. Fahrzeuge können immernoch in vielerlei Hinsicht verbessert werden.
Eine adaptive Geschwindigkeitsregelung (Engl.: Adaptive Cruise Control, ACC) ermöglicht es einem Fahrzeug, seine Geschwindigkeit automatisch anzupassen, um einen voreingestellten Abstand zum vorausfahrenden Fahrzeug auf der Grundlage der Präferenzen des Fahrers einzuhalten. Bei den derzeit erhältlichen konventionellen Geschwindigkeitsregelsystemen kann der Fahrer den Abstand zum vorausfahrenden Fahrzeug und die Geschwindigkeit eines Host-Fahrzeugs manuell einstellen. Beim teilautonomen Fahren kann es jedoch vorkommen, dass die Abstände hinter einem Zielfahrzeug nicht den Wünschen des Fahrers entsprechen. Das Verhalten des Zielfahrzeugs wird derzeit bei der Umsetzung von Beschleunigungs- und Abbremsanforderungen in der adaptiven Geschwindigkeitsregelung (ACC) nicht berücksichtigt.
Es ist wünschenswert, die Umgebung eines Host-Fahrzeugs in Verbindung mit einem Zielfahrzeug zu verstehen und Befehlsanforderungen zu ändern, um die Leistung des ACC zu verbessern.
Es ist wünschenswert, eine ACC so zu gestalten, den Zielverfolgungsabstand auf der Grundlage von Echtzeit-, historischen und Online-Interaktionen zwischen Fahrer und Fahrzeug anzupassen und gleichzeitig angemessene Sicherheitsmargen beizubehalten.
Es ist wünschenswert, das Fahrverhalten des Zielfahrzeugs auf der Grundlage verschiedener Fahrszenarien (z. B. umliegende Ziele), Straßengeometrien und der Dynamik des Zielfahrzeugs zu klassifizieren und zu lernen.
Es ist wünschenswert, eine Wissensbasis für ein Host-Fahrzeug zu erstellen, die auf den Interaktionen mit dem Zielfahrzeug basiert und auf den Leistungspräferenzen des Fahrers beruht, zumindest auf Online- und historischen Informationen, der Fahrregion, dem Zieltyp, der Straßenklasse und der relativen Fahrspurposition.
Es ist wünschenswert, adaptive Geschwindigkeitsregelungen für einzelne Fahrer oder Fahrerklassen auf der Grundlage einer Echtzeit- oder gespeicherten Wissensbasis anzupassen.
Es ist wünschenswert, einen kostengünstigen Lern- und Klassifizierungsalgorithmus für die Fahreridentifikation zu entwickeln, der auf ressourcenbeschränkten eingebetteten Steuerungen ausgeführt werden kann, und eine kundenorientierte Anpassung der Fahrspurverfolgung ohne zusätzliche Hardware zu ermöglichen.
Darüber hinaus werden andere wünschenswerte Merkmale und Eigenschaften der vorliegenden Offenbarung aus der nachfolgenden detaillierten Beschreibung und den beigefügten Ansprüchen ersichtlich werden, wenn diese in Verbindung mit den beigefügten Zeichnungen und dem vorstehenden technischen Gebiet und Hintergrund betrachtet werden.
Beschreibung der Erfindung
In mindestens einer beispielhaften Ausführungsform wird ein Verfahren zur Implementierung einer adaptiven Geschwindigkeitsregelung (ACC) unter Verwendung von Verstärkungslemen (Engl.: Reinforcement Learning, RL) bereitgestellt. Das Verfahren beinhaltet das Ausführen der adaptiven Geschwindigkeitsregelung (ACC) durch einen Prozessor, um einen Satz von Fahrzeugeingaben über die Betriebsumgebung und den aktuellen Betrieb eines Host-Fahrzeugs zu erhalten; das Identifizieren eines Zielfahrzeugs, das in der Umgebung des Host-Fahrzeugs operiert, und das Quantifizieren eines Satzes von Zielfahrzeugparametern über das Zielfahrzeug, die aus den erfassten Eingaben abgeleitet werden; das Modellieren einer Zustandsabschätzung des Host-Fahrzeugs und des Zielfahrzeugs durch den Prozessor durch Erzeugen eines Satzes von Geschwindigkeitsberechnungen und Drehmomentberechnungen für jedes Fahrzeug; das Erzeugen eines Satzes von Ergebnissen aus mindestens einer Belohnungsfunktion auf der Grundlage einer oder mehrerer modellierter Zustandsabschätzungen des Host-Fahrzeugs und des Zielfahrzeugs durch den Prozessor; und Verarbeiten des Satzes von Ergebnissen mit in der RL enthaltenen Daten zum Fahrerverhalten, um eine oder mehrere Steueraktionen mit den Daten zum Fahrerverhalten zu korrelieren.
In mindestens einer Ausführungsform beinhaltet das Verfahren das Anwenden mindestens einer Steueraktion durch den Prozessor, die mit den Daten zum Fahrerverhalten des RL korreliert ist, um mindestens eine Funktion der adaptiven Geschwindigkeitsregelung des Host-Fahrzeugs anzupassen.
In mindestens einer Ausführungsform beinhaltet das Verfahren das Anpassen, durch den Prozessor, der mindestens einen Steueraktion, die mit den Daten zum Fahrerverhalten des RL korreliert ist, auf der Grundlage einer Steuer-Sicherheitsüberprüfung.
In mindestens einer Ausführungsform beinhaltet das Verfahren das Aktualisieren, durch den Prozessor, von Daten einer Lernmatrix auf der Grundlage des erzeugten Satzes von Ergebnissen aus mindestens einer Belohnungsfunktion, um ein Profil des Fahrerverhaltens zu erstellen.
In mindestens einer Ausführungsform beinhaltet das Verfahren das Berechnen der Belohnungsfunktion durch den Prozessor unter Verwendung eines Parametersatzes, der Geschwindigkeitsberechnungen und Drehmomentberechnungen von Schätzungen der Beschleunigung und Geschwindigkeit des Host- und des Zielfahrzeugs beinhaltet.
In mindestens einer Ausführungsform beinhaltet das Verfahren das Anpassen eines oder mehrerer Abstände zwischen dem Host-Fahrzeug und dem Zielfahrzeug durch den Prozessor basierend auf dem gelernten Fahrerverhalten, das in den Daten der Lernmatrix enthalten ist.
In mindestens einer Ausführungsform beinhaltet das Verfahren die Steuer-Sicherheitsüberprüfung, die eine Geschwindigkeitsdifferenz zwischen einer sicheren Geschwindigkeit und einer Schätzung der Geschwindigkeit des Zielfahrzeugs und des Host-Fahrzeugs einschließt.
In einer anderen beispielhaften Ausführungsform wird ein System bereitgestellt. Das System beinhaltet einen Satz von Eingaben, die von einem Prozessor erhalten werden, welche einen Satz von Fahrzeugeingaben einer oder mehrerer Messeingaben eines Host-Fahrzeugbetriebs und erfasste Eingaben einer Betriebsumgebung über ein Host-Fahrzeug beinhalten, die verwendet werden, um Steueroperationen eines adaptiven Geschwindigkeitsregelungssystems (ACC-System) auszuführen, welches Verstärkungslemen (Engl.: Reinforcement Learning, RL) implementiert ist und in dem Host-Fahrzeug enthalten ist; wobei das ACC-System des Fahrzeugs durch ein Fahrerverhalten-Vorhersagemodell instruiert wird, welches durch das RL erstellt wird, das die Erwartungen des Fahrers online lernt und auch ein dynamisches neuronales Netzwerk (DNN) verwendet, um den Satz von Fahrzeugeingaben zu verarbeiten, um die Steueroperationen auf der Grundlage historischer Daten anzupassen; wobei der Prozessor konfiguriert ist, ein in der Umgebung des Host-Fahrzeugs operierendes Zielfahrzeug zu identifizieren, um einen Satz von Zielfahrzeugparametern über das Zielfahrzeug zu quantifizieren, die von den erfassten Daten abgeleitet werden; wobei der Prozessor konfiguriert ist, eine Zustandsabschätzung des Host-Fahrzeugs und des Zielfahrzeugs auf der Grundlage eines Satzes von Geschwindigkeitsberechnungen und Drehmomentberechnungen über jedes Fahrzeug zu modellieren;
In mindestens einer beispielhaften Ausführungsform ist der Prozessor konfiguriert, einen Satz von Ergebnissen aus mindestens einer Belohnungsfunktion auf der Grundlage einer oder mehrerer Zustandsabschätzungen des Host-Fahrzeugs und des Zielfahrzeugs zu erzeugen; und der Prozessor ist konfiguriert, den Satz von Ergebnissen mit den durch RL ermittelten Daten zum Fahrerverhalten zu verarbeiten, um eine oder mehrere Steueraktionen mit den Daten zum Fahrerverhalten zu korrelieren. In einer ähnlichen Ausführungsform können historische Daten in dem DNN verwendet werden, um eine oder mehrere Steueraktionen mit den Daten zum Fahrerverhalten zu korrelieren.
In mindestens einer beispielhaften Ausführungsform ist der Prozessor konfiguriert, mindestens eine Steueraktion anzuwenden, die mit den durch RL ermittelten Daten zum Fahrerverhalten korreliert ist, um mindestens eine Steueraktion des ACC-Systems des Host-Fahrzeugs anzupassen.
In mindestens einer beispielhaften Ausführungsform ist der Prozessor konfiguriert, mindestens eine Steueraktion anzupassen, die mit den durch RL ermittelten Daten zum Fahrerverhalten korreliert ist, auf der Grundlage einer Steuer-Sicherheitsüberprüfung.
In mindestens einer beispielhaften Ausführungsform ist der Prozessor konfiguriert, mindestens eine Steueraktion anzupassen, die mit den durch RL ermittelten Daten zum Fahrerverhalten korreliert ist, auf der Grundlage einer Steuer-Sicherheitsüberprüfung.
In mindestens einer beispielhaften Ausführungsform ist der Prozessor konfiguriert, die Belohnungsfunktion unter Verwendung eines Satzes von Parametern zu berechnen, der Geschwindigkeitsberechnungen und Drehmomentberechnungen von Schätzungen der Beschleunigung und Geschwindigkeit des Host-Fahrzeugs und des Zielfahrzeugs beinhaltet.
In mindestens einer beispielhaften Ausführungsform ist der Prozessor konfiguriert, einen oder mehrere Abstände zwischen dem Host-Fahrzeug und dem Zielfahrzeug auf der Grundlage des in den Daten der Lernmatrix enthaltenen gelernten Fahrerverhaltens anzupassen.
In mindestens einer beispielhaften Ausführungsform ist der Prozessor konfiguriert, die Steuer-Sicherheitsüberprüfung zu aktivieren, welche eine Überprüfung der Geschwindigkeitsdifferenz zwischen einer sicheren Geschwindigkeit und einer Schätzung der Geschwindigkeit des Zielfahrzeugs und des Host-Fahrzeugs beinhaltet.
In einer einer weiteren beispielhaften Ausführungsform wird eine Fahrzeugvorrichtung bereitgestellt. Die Fahrzeugvorrichtung beinhaltet eine Fahrzeugsteuerung, die einen Prozessor beinhaltet, wobei der Prozessor durch ein Verstärkungslemen (RL) eingerichtet und konfiguriert ist, um: eine adaptive Geschwindigkeitsregelung durch den Prozessor auszuführen, um einen Satz von Fahrzeugeingaben über die Betriebsumgebung und den aktuellen Operationen eines Host-Fahrzeugs zu empfangen; ein Zielfahrzeug, das in der Umgebung des Host-Fahrzeugs operiert, durch den Prozessor zu identifizieren und einen Satz von Zielfahrzeugparametern über das Zielfahrzeug, die aus den erfassten Eingaben abgeleitet werden, zu quantifizieren; eine Zustandsabschätzung des Host-Fahrzeugs und des Zielfahrzeugs durch Erzeugen eines Satzes von Geschwindigkeitsberechnungen und Drehmomentberechnungen für jedes Fahrzeug durch den Prozessor zu modellieren; einen Satz von Ergebnissen aus mindestens einer Belohnungsfunktion, welche auf einer oder mehrerer modellierter Zustandsabschätzungen des Host-Fahrzeugs und des Zielfahrzeugs basiert, durch den Prozessor zu erzeugen; den Satz von Ergebnissen mit durch das RL ermittelten Daten zum Fahrerverhalten mit einer oder mehreren Steueraktionen für die Daten zum Fahrerverhalten zu korrelieren.
In mindestens einer beispielhaften Ausführungsform beinhaltet die Fahrzeugvorrichtung den Prozessor, der konfiguriert ist, um: mindestens eine Steueraktion anzuwenden, die mit den durch RL ermittelten Daten zum Fahrerverhalten korreliert ist, um mindestens eine Operation der adaptiven Geschwindigkeitsregelung des Host-Fahrzeugs anzupassen.
In mindestens einer beispielhaften Ausführungsform beinhaltet die Fahrzeugvorrichtung den Prozessor, der konfiguriert ist, mindestens eine Steueraktion anzupassen, die mit den durch RL ermittelten Daten zum Fahrerverhalten korreliert ist, auf der Grundlage einer Steuer-Sicherheitsüberprüfung.
In mindestens einer beispielhaften Ausführungsform beinhaltet die Fahrzeugvorrichtung den Prozessor, der konfiguriert ist, um: Daten einer Lernmatrix auf der Grundlage des generierten Satz von Ergebnissen von mindestens einer Belohnungsfunktion zu aktualisieren, um ein Profil des Fahrerverhaltens zu erstellen und die Fahrererwartung zu quantifizieren.
In mindestens einer beispielhaften Ausführungsform beinhaltet die Fahrzeugvorrichtung den Prozessor, der konfiguriert ist, um: die Belohnungsfunktion unter Verwendung eines Satzes von Parametern zu berechnen, die Geschwindigkeitsberechnungen und Drehmomentberechnungen von Schätzungen der Beschleunigung und Geschwindigkeit des Host-Fahrzeugs und des Zielfahrzeugs beinhalten.
In mindestens einer beispielhaften Ausführungsform beinhaltet die Fahrzeugvorrichtung den Prozessor, der konfiguriert ist, einen oder mehrere Abstände zwischen dem Host-Fahrzeug und dem Zielfahrzeug auf der Grundlage des erlernten Fahrerverhaltens anzupassen, das in den Daten der Lösung der Lernmatrix enthalten ist, die online unter Verwendung der vorgeschlagenen RL oder offline unter Verwendung des entwickelten DNN erlernt wird.
Figurenliste
Die beispielhaften Ausführungsformen werden im Folgenden in Verbindung mit den folgenden Zeichnungen beschrieben, wobei gleiche Bezugszeichen gleiche Elemente bezeichnen und wobei:

1 ist ein funktionales Blockdiagramm, das ein autonomes oder teilautonomes Fahrzeug mit einem Steuersystem zeigt, das Fahrzeugaktionen auf der Grundlage der Verwendung eines neuronalen Netzwerks für das Fahrerverhalten in einem Fahrzeugsteuersystem steuert, gemäß beispielhaften Ausführungsformen;
2 ist ein Diagramm, das ein adaptives Geschwindigkeitsregelsystem eines Fahrzeugsteuersystems zeigt, das unter Verwendung des neuronalen Netzwerks zur Vorhersage des Fahrerverhaltens implementiert sein kann, gemäß verschiedenen Ausführungsformen;
3 ist ein Diagramm, das Komponenten eines adaptiven Geschwindigkeitsregelsystems eines Fahrzeugsteuersystems veranschaulicht, das unter Verwendung des neuronalen Netzes zur Vorhersage des Fahrerverhaltens implementiert sein kann, gemäß verschiedenen Ausführungsformen, die in den 1-2 dargestellt sind;
4 zeigt ein beispielhaftes Diagramm von Belohnungsfunktionen zur Verwendung in dem Steuerverfahren des in 1-3 dargestellten adaptiven Geschwindigkeitsregelsystems gemäß verschiedenen Ausführungsformen;
5. ist ein beispielhaftes Diagramm, das den potenziellen Nutzen einer beispielhaften Verwendung des in 1-3 dargestellten adaptiven Geschwindigkeitsregelsystems gemäß verschiedenen Ausführungsformen veranschaulicht; und
6 ist ein beispielhaftes Flussdiagramm, das die Schritte zur Verwendung in dem in 1-3 dargestellten adaptiven Geschwindigkeitsregelsystem in Übereinstimmung mit verschiedenen Ausführungsformen veranschaulicht.

Detaillierte Beschreibung
Die folgende detaillierte Beschreibung ist lediglich beispielhafter Natur und ist nicht dazu beabsichtigt, die Anwendung und den Gebrauch einzuschränken. Darüber hinaus besteht nicht die Absicht, durch ausdrückliche oder stillschweigende Theorien gebunden zu sein, die in dem vorangehenden technischen Gebiet, dem Hintergrund, der kurzen Zusammenfassung oder der folgenden detaillierten Beschreibung dargestellt sind. Wie hierin verwendet, bezieht sich der Begriff „Modul“ auf jede Hardware, Software, Firmware, elektronische Steuerkomponente, Verarbeitungslogik und/oder Prozessorvorrichtung, einzeln oder in beliebiger Kombination, einschließlich, aber nicht beschränkt auf: anwendungsspezifische integrierte Schaltungen (ASIC), ein feldprogrammierbares Gate-Array (FPGA), eine elektronische Schaltung, einen Prozessor (gemeinsam, dediziert oder Gruppe) mit Speicher, der eines oder mehrere Software- oder Firmware-Programme ausführt, eine kombinatorische Logikschaltung und/oder andere geeignete Komponenten, die die beschriebene Funktionalität bereitstellen.
Ausführungsformen der vorliegenden Offenbarung können hierin in Form von funktionalen und/oder logischen Blockkomponenten und verschiedenen Verarbeitungsschritten beschrieben werden. Solche Blockkomponenten können durch eine beliebige Anzahl von Hardware-, Software- und/oder Firmware-Komponenten realisiert sein, die zur Ausführung der angegebenen Funktionen konfiguriert sind. Beispielsweise kann eine Ausführungsform der vorliegenden Offenbarung verschiedene integrierte Schaltungskomponenten verwenden, z. B. Speicherelemente, digitale Signalverarbeitungselemente, Logikelemente, Nachschlagetabellen oder Ähnliches, die eine Vielzahl von Funktionen unter der Kontrolle eines oder mehrerer Mikroprozessoren oder anderer Steuergeräte ausführen können. Darüber hinaus wird der Fachmann verstehen, dass Ausführungsformen der vorliegenden Offenbarung in Verbindung mit einer beliebigen Anzahl von Systemen verwendet werden können und dass die hier beschriebenen Systeme lediglich beispielhafte Ausführungsformen der vorliegenden Offenbarung sind.
Der Kürze halber werden konventionelle Techniken im Zusammenhang mit Signalverarbeitung, Datenübertragung, Signalisierung, Steuerung, maschinellem Lernen, Bildanalyse und anderen funktionallen Aspekten der Systeme (und der einzelnen Betriebskomponenten der Systeme) hierin nicht im Detail beschrieben. Darüber hinaus sollen die in den verschiedenen Abbildungen dargestellten Verbindungslinien beispielhafte funktionale Beziehungen und/oder physikalische Kopplungen zwischen den verschiedenen Elementen darstellen. Es sollte beachtet werden, dass viele alternative oder zusätzliche funktionale Beziehungen oder physikalische Verbindungen in einer Ausführungsform der vorliegenden Offenbarung vorhanden sein können.
Der zeitliche Abstand zum Zielfahrzeug kann bei einem ACC-System in Schritten von 1 bis 2,5 Sekunden eingestellt werden. Wenn das Zielfahrzeug beispielsweise beschleunigt, beschleunigt das Host-Fahrzeug seinerseits, jedoch nur bis zu einer Höchstgrenze. Wenn ein anderes Fahrzeug vor dem Zielfahrzeug auftaucht, schaltet das ACC automatisch auf das neue Zielfahrzeug um, wobei nur ein Bruchteil der Zeit zur Verfügung steht, das neue Zielfahrzeug zu erkennen. Bei diesen Entscheidungen hat das ACC keine Kenntnis von den Präferenzen des Fahrers in verschiedenen Gegenden, Einstellungen usw. Das ACC kann die Bewegung des Fahrzeugs überwachen und Daten zu den Fahrerpräferenzen sammeln.
Die vorliegende Offenbarung stellt Methoden, Systeme und Vorrichtungen zur Verfügung, die ein intelligentes System und Verfahren ermöglichen, das das Zielfahrzeugverhalten mathematisch quantifiziert und sein Verhalten in ein adaptives Steuerungsdesign einbezieht, das der adaptiven Geschwindigkeitsregelungsfunktion das Gewünschte liefert.
Darüber hinaus stellt die vorliegende Offenbarung Methoden, Systeme und Vorrichtungen zur Verfügung, die einen Online-Ansatz ermöglichen, der ein intelligentes Zusatzmerkmal ist, um die Leistung und den gewünschten Folgeabstand auf interaktive Weise zu verbessern.
Darüber hinaus werden Verfahren, Systeme und Vorrichtungen bereitgestellt, die eine Klassifizierung der Eigenschaften von Zielfahrzeugen und Orten für die adaptive Geschwindigkeitsregelung ermöglichen.
Mit Bezug auf 1 ist ein Steuersystem 100 einem Fahrzeug 10 (hierin auch als „Host-Fahrzeug“ bezeichnet) in Übereinstimmung mit verschiedenen Ausführungsformen zugeordnet. Im Allgemeinen sorgt das Steuersystem (oder einfach „System“) 100 für die Steuerung verschiedener Aktionen des Fahrzeugs 10 (z. B. Drehmomentsteuerung), die durch Verstärkungslemen (Engl.: Reinforcement Learning, RL) festgelegt werden, das in einem Modell vom DNN-Typ gespeichert ist oder gespeichert werden kann, das den Betrieb als Reaktion auf Daten von Fahrzeugeingaben steuert, z. B. wie weiter unten in Verbindung mit den 2-6 ausführlicher beschrieben.
In verschiedenen beispielhaften Ausführungsformen ist das System 100 in der Lage, ein ACC-Verhaltensvorhersagemodell bereitzustellen, das die Vorliebe des Fahrers für das Verfolgen eines Abstands zu verschiedenen Zielfahrzeugen lernt. Das System 100 beinhaltet eine Methodik zur Klassifizierung der Fahrerpräferenz auf der Grundlage von Fahrszenarien (z. B. Verkehrszeichen, Stop-and-Go-Verkehr, Stadtverkehr usw.). Das System 100 ist in der Lage, eine Wissensbasis für eine Ziel-Verfolgungsleistungspräferenz unter Verwendung von Online- und historischen Fahrer- und Umgebungsinformationen aufzubauen. Das System 100 ist in der Lage, Online-Fahrer-Fahrzeug-Interaktionen zu nutzen, um die Spurverfolgungsleistung anzupassen und auf der Grundlage von Echtzeit- oder gespeichertem Wissen die Anpassung der Spurverfolgungssteuerung für einzelne Fahrer oder Fahrerklassen zu ermöglichen. Das System 100 kann auch die Spur-Verfolgungsleistungspräferenz auf ein Fahrzeug auf der Grundlage der Fahreridentifikation anpassen und ein kostengünstiges Lernverfahren mit einem Klassifizierungsalgorithmus für die Fahreridentifikation bereitstellen, das auf ressourcenbeschränkten Steuergeräten ausgeführt werden kann (zusätzlich zu dem bestehenden SuperCruise/LC-Seitensteuerungsalgorithmus einsetzbar). Das System 100 ermöglicht eine individuelle Anpassung der Spurverfolgung unter Beibehaltung der Sicherheitsreserven.
In verschiedenen beispielhaften Ausführungsformen bietet das System 100 einen Prozess, bei dem ein Algorithmus verwendet wird, der Drehmoment und Geschwindigkeit in der eingebetteten Steuersoftware eines Host-Fahrzeugs des Systems 100 steuert, so dass DNNs für ein ACC-Verhaltensvorhersagemodell verwendet werden können. Das System 100 ermöglicht das Erlernen der Fahrerpräferenz für den Folgeabstand für verschiedene Zielfahrzeuge, wie z.B. ein Zielfahrzeug, und das Klassifizieren der Fahrerpräferenz auf der Grundlage von Fahrszenarien, z.B. Verkehrszeichen, Stop-and-Go-Verkehr, Stadtverkehr usw. Das System 100 kann unter Verwendung einer Q-Matrix eine Wissensbasis für die Zielfahrzeug-Verfolgungsleistungspräferenz aufbauen, indem es Online- und historische Fahrer- und Umgebungsinformationen nutzt.
Wie in 1 dargestellt, beinhaltet das Fahrzeug 10 im Allgemeinen ein Fahrgestell 12, eine Karosserie 14, Vorderräder 16 und Hinterräder 18. Die Karosserie 14 ist auf dem Fahrgestell 12 angeordnet und umschließt im Wesentlichen die Komponenten des Fahrzeugs 10. Die Karosserie 14 und das Fahrgestell 12 können zusammen einen Rahmen bilden. Die Räder 16-18 sind jeweils in der Nähe einer Ecke der Karosserie 14 drehbar mit dem Fahrgestell 12 verbunden. In verschiedenen Ausführungsformen beinhalten die Räder 16, 18 eine Radanordnung, die auch jeweils zugehörige Reifen beinhaltet.
In verschiedenen Ausführungsformen ist das Fahrzeug 10 autonom oder teilautonom, und das Steuersystem 100 und/oder Komponenten davon sind in das Fahrzeug 10 integriert. Das Fahrzeug 10 ist zum Beispiel ein Fahrzeug, das automatisch gesteuert wird, um Fahrgäste von einem Ort zu einem anderen zu befördern. Das Fahrzeug 10 ist in der gezeigten Ausführungsform als PKW dargestellt, aber es sollte beachtet werden, dass jedes andere Fahrzeug, einschließlich Motorräder, LKWs, Sport Utility Vehicles (SUVs), Wohnmobile (Engl.: Recreational Vehicles, RVs), Wasserfahrzeuge, Flugzeuge und dergleichen, ebenfalls verwendet sein können.
Wie dargestellt, beinhaltet das Fahrzeug 10 im Allgemeinen ein Antriebssystem 20, ein Getriebesystem 22, ein Lenksystem 24, ein Bremssystem 26, ein Kanisterspülsystem 31, eine oder mehrere Benutzereingabevorrichtungen 27, ein Sensorsystem 28, ein Aktuatorsystem 30, mindestens eine Datenspeichervorrichtung 32, mindestens eine Steuerung 34 und ein Kommunikationssystem 36. Das Antriebssystem 20 kann in verschiedenen Ausführungsformen einen Verbrennungsmotor, eine elektrische Maschine, wie z. B. einen Traktionsmotor, und/oder ein Brennstoffzellen-Antriebssystem beinhalten.
Das Getriebesystem 22 ist konfiguriert, die Leistung von dem Antriebssystem 20 auf die Fahrzeugräder 16 und 18 entsprechend wählbarer Übersetzungsverhältnisse zu übertragen. Gemäß verschiedenen Ausführungsformen kann das Getriebesystem 22 ein gestuftes Automatikgetriebe, ein stufenloses Getriebe oder andere geeignete Getriebe beinhalten.
Das Bremssystem 26 ist konfiguriert, den Fahrzeugrädern 16 und 18 ein Bremsmoment zur Verfügung zu stellen. Das Bremssystem 26 kann in verschiedenen Ausführungsformen Reibungsbremsen, Brake-by-Wire-Systeme, ein regeneratives Bremssystem, wie z. B. eine elektrische Maschine, und/oder andere geeignete Bremssysteme beinhalten.
Das Lenksystem 24 beeinflusst die Position der Fahrzeugräder 16 und/oder 18. Obwohl zur Veranschaulichung als ein Lenkrad beinhaltend dargestellt, mag das Lenksystem 24 in einigen Ausführungsformen, die im Rahmen der vorliegenden Offenbarung in Betracht gezogen werden, kein Lenkrad beinhalten.
Die Steuerung 34 beinhaltet mindestens einen Prozessor 44 (und ein neuronales Netzwerk 33) und eine computerlesbare Speichervorrichtung oder -medium 46. Wie oben erwähnt, liefert die Steuerung 34 (z. B. sein Prozessor 44) in verschiedenen Ausführungsformen Daten, die sich auf einen projizierten zukünftigen Weg des Fahrzeugs 10 beziehen, einschließlich projizierter zukünftiger Lenkanweisungen, im Voraus an das Lenksteuersystem 84 zur Verwendung bei der Steuerung der Lenkung für eine begrenzte Zeitspanne für den Fall, dass die Kommunikation mit dem Lenksteuersystem 84 nicht verfügbar ist. In verschiedenen Ausführungsformen stellt die Steuerung 34 dem Lenksteuersystem 84, 34 über das weiter unten beschriebene Kommunikationssystem 36, z. B. über einen Kommunikationsbus und/oder einen Sender (in 1 nicht dargestellt), Kommunikation zur Verfügung.
In verschiedenen Ausführungsformen beinhaltet die Steuerung 34 mindestens einen Prozessor 44 und eine computerlesbare Speichervorrichtung oder -medium 46. Der Prozessor 44 kann jeder beliebige kundenspezifische oder handelsübliche Prozessor, eine Zentralprozessoreinheit (CPU), eine Grafikverarbeitungseinheit (GPU), ein Hilfsprozessor unter mehreren der Steuerung 34 zugeordneten Prozessoren, ein Mikroprozessor auf Halbleiterbasis (in Form eines Mikrochips oder Chipsets), eine beliebige Kombination davon oder allgemein eine beliebige Vorrichtung zur Ausführung von Befehlen sein. Die computerlesbare Speichervorrichtung oder -medium 46 können flüchtige und nicht-flüchtige Speicher beinhalten, z.B. Nur-Lese-Speicher (ROM), Direktzugriffsspeicher (RAM) und Keep-Alive-Speicher (KAM). KAM ist ein dauerhafter oder nichtflüchtiger Speicher, der verwendet werden kann, um mehrere neuronale Netzwerke zusammen mit verschiedenen Betriebsvariablen zu speichern, während der Prozessor 44 ausgeschaltet ist. Die computerlesbare Speichervorrichtung oder -medium 46 kann unter Verwendung einer beliebigen Anzahl bekannter Speichervorrichtungen wie PROMs (programmierbarer Nur-Lese-Speicher), EPROMs (elektrisch PROM), EEPROMs (elektrisch löschbares PROM), Flash-Speicher oder anderer elektrischer, magnetischer, optischer oder kombinierter Speichervorrichtungen implementiert sein, die in der Lage sind, Daten zu speichern, von denen einige ausführbare Befehle darstellen, die von der Steuerung 34 beim Steuern des Fahrzeugs 10 verwendet werden.
Die Anweisungen können eines oder mehrere separate Programme beinhalten, von denen jedes eine geordnete Auflistung von ausführbaren Anweisungen zum Implementieren logischer Funktionen beinhaltet. Die Anweisungen, wenn sie von dem Prozessor 44 ausgeführt werden, empfangen und verarbeiten Signale von dem Sensorsystem 28, führen Logik, Berechnungen, Verfahren und/oder Algorithmen zur automatischen Steuerung der Komponenten des Fahrzeugs 10 durch und erzeugen Steuersignale, die an das Aktuatorsystem 30 übertragen werden, um die Komponenten des Fahrzeugs 10 auf der Grundlage der Logik, der Berechnungen, der Verfahren und/oder der Algorithmen automatisch zu steuern. Obwohl in 1 nur eine Steuerung 34 dargestellt ist, können Ausführungsformen des Fahrzeugs 10 jede beliebige Anzahl von Steuerungen 34 beinhalten, die über ein beliebiges geeignetes Kommunikationsmedium oder eine Kombination von Kommunikationsmedien kommunizieren und zusammenarbeiten, um die Sensorsignale zu verarbeiten, Logik, Berechnungen, Verfarhen und/oder Algorithmen durchzuführen und Steuersignale zu erzeugen, um Funktionen des Fahrzeugs 10 automatisch zu steuern.
Wie in 1 dargestellt, beinhaltet das Fahrzeug 10 im Allgemeinen neben dem oben erwähnten Lenksystem 24 und der Steuerung 34 ein Fahrgestell 12, eine Karosserie 14, Vorderräder 16 und Hinterräder 18. Die Karosserie 14 ist auf dem Fahrgestell 12 angeordnet und umschließt im Wesentlichen die Komponenten des Fahrzeugs 10. Die Karosserie 14 und das Fahrgestell 12 können gemeinsam einen Rahmen bilden. Die Räder 16-18 sind jeweils in der Nähe einer Ecke der Karosserie 14 drehbar mit dem Fahrgestell 12 verbunden. In verschiedenen Ausführungsformen umfassen die Räder 16, 18 eine Radbauanordnung, die auch entsprechend zugehörige Reifen enthält.
In verschiedenen Ausführungsformen ist das Fahrzeug 10 ein autonomes Fahrzeug, und das Steuersystem 100 und/oder Komponenten davon sind in das Fahrzeug 10 integriert. Das Fahrzeug 10 ist zum Beispiel ein Fahrzeug, das automatisch gesteuert wird, um Fahrgäste von einem Ort zu einem anderen zu befördern. Das Fahrzeug 10 ist in der gezeigten Ausführungsform als Pkw dargestellt, aber es sollte anerkannt werden, dass jedes andere Fahrzeug, einschließlich Motorräder, Lastwagen, Sport Utility Vehicles (SUVs), Wohnmobile (RVs), Wasserfahrzeuge, Luftfahrzeuge und dergleichen, ebenfalls verwendet sein können.
Wie dargestellt, beinhaltet das Fahrzeug 10 im Allgemeinen auch ein Antriebssystem 20, ein Getriebesystem 22, ein Bremssystem 26, ein oder mehrere Benutzereingavorrichtungen 27, ein Sensorsystem 28, ein Aktuatorsystem 30, mindestens eine Datenspeichervorrichtung 32 und ein Kommunikationssystem 36. Das Antriebssystem 20 kann in verschiedenen Ausführungsformen einen Verbrennungsmotor, eine elektrische Maschine, wie z. B. einen Traktionsmotor, und/oder ein Brennstoffzellen-Antriebssystem beinhalten. Das Getriebesystem 22 ist konfiguriert, Leistung von dem Antriebssystem 20 auf die Fahrzeugräder 16 und 18 entsprechend wählbarer Übersetzungsverhältnisse zu übertragen. Gemäß verschiedenen Ausführungsformen kann das Getriebesystem 22 ein gestuftes Automatikgetriebe, ein stufenloses Getriebe oder andere geeignete Getriebe beinhalten.
Das Bremssystem 26 ist konfiguriert, den Fahrzeugrädern 16 und 18 ein Bremsmoment zur Verfügung zu stellen. Das Bremssystem 26 kann in verschiedenen Ausführungsformen Reibungsbremsen, Brake-by-Wire-Systeme, ein regeneratives Bremssystem, wie eine elektrische Maschine, und/oder andere geeignete Bremssysteme umfassen.
Das Lenksystem 24 beeinflusst die Stellung der Räder 16 und/oder 18 des Fahrzeugs. Obwohl zur Veranschaulichung als ein Lenkrad beinhatend dargestellt, mag das Lenksystem 24 in einigen Ausführungsformen, die im Rahmen der vorliegenden Offenbarung in Betracht gezogen werden, kein Lenkrad beinhalten.
Die Steuerung 34 beinhaltet eine Fahrzeugsteuerung, die auf der Grundlage der Ausgabe des Modells des neuronalen Netzwerks 33 direkt beeinflusst wird. In einer beispielhaften Ausführungsform kann für einen Anpassungsfaktor, der die kontinuierliche Ausgabe der Modelle des neuronalen Netzwerkes 33 ist, eine Vorwärtskopplung angewendet werden, um eine Steueraktion für das gewünschte Drehmoment oder eine ähnliche Aktion zu erzeugen (im Falle eines kontinuierlichen Modells des neuronalen Netzwerks 33 sind die Ausgaben beispielsweise die kontinuierlichen APC/SPARK-Vorhersagewerte).
In verschiedenen Ausführungsformen empfangen eine oder mehrere Benutzereingabevorrichtungen 27 Eingaben von einem oder mehreren Passagieren (und dem Fahrer 11) des Fahrzeugs 10. In verschiedenen Ausführungsformen beinhalten die Eingaben ein gewünschtes Reiseziel für das Fahrzeug 10. In bestimmten Ausführungsformen beinhalten eine oder mehrere Eingabevorrichtungen 27 einen interaktiven Touchscreen in dem Fahrzeug 10. In bestimmten Ausführungsformen beinhalten eine oder mehrere Eingabevorrichtungen 27 einen Lautsprecher zum Empfangen von Audioinformationen von den Fahrgästen. In bestimmten anderen Ausführungsformen können eine oder mehrere Eingabevorrichtungen 27 eine oder mehrere andere Arten von Vorrichtungen umfassen und/oder mit einer Benutzervorrichtung (z. B. einem Smartphone und/oder anderen elektronischen Geräten) der Passagiere gekoppelt sein.
Das Sensorsystem 28 beinhaltet einen oder mehrere Sensoren 40a-40n, die beobachtbare Bedingungen der äußeren Umgebung und/oder der inneren Umgebung des Fahrzeugs 10 erfassen. Die Sensoren 40a-40n beinhalten, ohne darauf beschränkt zu sein, Radare, Lidare, globale Positionierungssysteme (GPS), optische Kameras, Wärmekameras, Ultraschallsensoren, Trägheitsmessgeräte und/oder andere Sensoren.
Das Aktuatorsystem 30 beinhaltet einen oder mehrere Aktuatoren 42a-42n, die eine oder mehrere Fahrzeugfunktionen steuern, wie z.B. das Kanisterspülsystem 31, das Ansaugsystem 38, das Antriebssystem 20, das Getriebesystem 22, das Lenksystem 24 und das Bremssystem 26, ohne darauf beschränkt zu sein. In verschiedenen Ausführungsformen kann das Fahrzeug 10 auch innere und/oder äußere Fahrzeugmerkmale aufweisen, die in 1 nicht dargestellt sind, wie z. B. verschiedene Türen, einen Kofferraum und Kabinenmerkmale wie Luft, Musik, Beleuchtung, Touchscreen-Display-Komponenten (z.B. solche, die in Verbindung mit Navigationssystemen verwendet werden) und dergleichen.
Die Datenspeichervorrichtung 32 speichert Daten zur Verwendung bei der automatischen Steuerung des Fahrzeugs 10, einschließlich der Speicherung von Daten eines DNN, das durch das RL erstellt wird, um ein Fahrerverhalten für die Fahrzeugsteuerung vorherzusagen. In verschiedenen Ausführungsformen speichert die Datenspeichervorrichtung 32 ein maschinelles Lernmodell eines DNN und andere Datenmodelle, die von der RL erstellt werden. Das von dem RL erstellte Modell kann für ein DNN-Verhaltensvorhersagemodell oder ein RL-erstelltes Modell verwendet werden (siehe. 2, DNN-Vorhersagemodell (210) oder RL-Vorhersagemodell). In einer beispielhaften Ausführungsform ist kein separates Training für das DNN erforderlich, sondern das DNN-Verhaltensvorhersagemodell (d. h. das DNN-Vorhersagemodell) ist mit einer Reihe von gelernten Funktionen implementiert. In verschiedenen Ausführungsformen kann das neuronale Netzwerk 33 (d.h. das DNN-Verhaltensvorhersagemodell) durch RL erstellt oder durch eine überwachte Lernmethodik von einem entfernten System trainiert und in das Fahrzeug 10 (drahtlos und/oder drahtgebunden) übertragen oder bereitgestellt und in der Datenspeichervorrichtung 32 gespeichert werden. Das DNN-Verhaltensvorhersagemodell kann auch durch überwachtes oder unüberwachtes Lernen auf der Grundlage von Fahrzeugeingabedaten der Operation eines Host-Fahrzeugs und/oder erfassten Daten über eine Umgebung des Host-Fahrzeugs trainiert werden.
Die Datenspeichervorrichtung 32 ist nicht auf Steuerdaten beschränkt, da auch andere Daten in der Datenspeichervorrichtung 32 gespeichert sein können. Beispielsweise können in der Datenspeichervorrichtung 32 auch Routeninformationen gespeichert sein, d.h. eine Reihe von Straßensegmenten (die geografisch mit einer oder mehreren der definierten Karten verknüpft sind), die zusammen eine Route definieren, die der Benutzer nehmen kann, um von einem Startort (z. B. dem aktuellen Standort des Benutzers) zu einem Zielort zu gelangen. Wie zu erkennen ist, kann die Datenspeichervorrichtung 32 Teil der Steuerung 34, getrennt von der Steuerung 34 oder Teil der Steuerung 34 und Teil eines separaten Systems sein.
Die Steuerung 34 implementiert das durch RL oder für das DNN erstellte Logikmodell auf der Grundlage des DNN-Verhaltensmodells, das mit einem Satz von Werten trainiert wurde, und beinhaltet mindestens einen Prozessor 44 und eine computerlesbare Speichervorrichtung oder -medium 46. Der Prozessor 44 kann jeder beliebige kundenspezifische oder handelsübliche Prozessor sein, eine Zentralprozessoreinheit (CPU), eine Grafikverarbeitungseinheit (GPU), ein Hilfsprozessor unter mehreren Prozessoren, die mit der Steuerung 34 verbunden sind, ein Mikroprozessor auf Halbleiterbasis (in Form eines Mikrochips oder Chipsets), eine beliebige Kombination davon oder allgemein eine beliebige Vorrichtung zum Ausführen von Anweisungen. Die computerlesbare Speichervorrichtung oder -medium 46 kann flüchtige und nicht-flüchtige Speicher umfassen, z. B. Nur-Lese-Speicher (ROM), Direktzugriffsspeicher (RAM) und Keep-Alive-Speicher (KAM). KAM ist ein dauerhafter oder nichtflüchtiger Speicher, der zur Speicherung verschiedener Betriebsvariablen verwendet werden kann, während der Prozessor 44 ausgeschaltet ist. Die computerlesbare Speichervorrichtung oder -medium 46 kann unter Verwendung einer beliebigen Anzahl bekannter Speichervorrichtungen wie PROMs (programmierbarer Festwertspeicher), EPROMs (elektrisches PROM), EEPROMs (elektrisch löschbares PROM), Flash-Speicher oder anderer elektrischer, magnetischer, optischer oder kombinierter Speichervorrichtungen implementiert sein, die in der Lage sind, Daten zu speichern, von denen einige ausführbare Anweisungen darstellen, die von der Steuerung 34 beim Steuern des Fahrzeugs 10 verwendet werden.
Die Anweisungen können eines oder mehrere separate Programme beinhalten, von denen jedes eine geordnete Auflistung von ausführbaren Anweisungen zum Implementieren logischer Funktionen enthält. Die Anweisungen, wenn sie von dem Prozessor 44 ausgeführt werden, empfangen und verarbeiten Signale von dem Sensorsystem 28, führen Logik, Berechnungen, Verfahren und/oder Algorithmen zum automatischen Steuern der Komponenten des Fahrzeugs 10 durch und erzeugen Steuersignale, die an das Aktuatorsystem 30 übertragen werden, um die Komponenten des Fahrzeugs 10 auf der Grundlage der Logik, der Berechnungen, der Verfahren und/oder der Algorithmen automatisch zu steuern. Obwohl in 1 nur eine Steuerung 34 dargestellt ist, können Ausführungsformen des Fahrzeugs 10 jede beliebige Anzahl von Steuerungen 34 beinhalten, die über ein beliebiges geeignetes Kommunikationsmedium oder eine Kombination von Kommunikationsmedien kommunizieren und zusammenarbeiten, um die Sensorsignale zu verarbeiten, Logik, Berechnungen, Verfahren und/oder Algorithmen durchzuführen und Steuersignale zu erzeugen, um Funktionen des Fahrzeugs 10 automatisch zu steuern.
Das Kommunikationssystem 36 ist so konfiguriert, drahtlos Informationen zu und von anderen Entitäten 48, wie z.B., ohne darauf beschränkt zu sein, anderen Fahrzeugen („V2V“-Kommunikation), der Infrastruktur („V2I“-Kommunikation), entfernten Transportsystemen und/oder Benutzervorrichtungen (ausführlicher in Bezug auf 2 beschrieben), zu übermitteln. In einer beispielhaften Ausführungsform ist das Kommunikationssystem 36 ein drahtloses Kommunikationssystem, das konfiguriert ist, über ein drahtloses lokales Netzwerk (WLAN) unter Verwendung von IEEE 802.11-Standards oder unter Verwendung von Mobilfunkkommunikation zu kommunizieren. Zusätzliche oder alternative Kommunikationsmethoden, wie z.B. ein dedizierter Kurzstrecken-Kommunikationskanal (DSRC), werden jedoch im Rahmen der vorliegenden Offenbarung ebenfalls berücksichtigt. DSRC-Kanäle beziehen sich auf ein- oder zweiseitige drahtlose Kommunikationskanäle mit kurzer bis mittlerer Reichweite, die speziell für den Einsatz in Kraftfahrzeugen entwickelt wurden, sowie auf eine Reihe von Protokollen und Standards.
In verschiedenen Ausführungsformen wird das Kommunikationssystem 36 für die Kommunikation zwischen der Steuerung 34 verwendet, einschließlich Daten, die sich auf einen projizierten zukünftigen Weg des Fahrzeugs 10 beziehen, einschließlich projizierter zukünftiger Lenkanweisungen. In verschiedenen Ausführungsformen kann das Kommunikationssystem 36 auch die Kommunikation zwischen dem Lenksteuersystem 84 und/oder anderen Systemen und/oder Geräten ermöglichen.
In bestimmten Ausführungsformen ist das Kommunikationssystem 36 ferner für die Kommunikation zwischen dem Sensorsystem 28, der Eingabevorricht 27, dem Aktuatorsystem 30, einer oder mehrerer Steuerungen (z. B. der Steuerung 34) und/oder mehreren anderen Systemen und/oder Vorrichtungen konfiguriert. Beispielsweise kann das Kommunikationssystem 36 jede beliebige Kombination aus einem Controller Area Network (CAN)-Bus und/oder einer direkten Verdrahtung zwischen dem Sensorsystem 28, dem Aktuatorsystem 30, einer oder mehreren Steuerungen 34 und/oder einem oder mehreren anderen Systemen und/oder Vorrichtungen umfassen. In verschiedenen Ausführungsformen kann das Kommunikationssystem 36 einen oder mehrere Transceiver für die Kommunikation mit einer oder mehreren Vorrichtungen und/oder Systemen des Fahrzeugs 10, Vorrichtungen der Passagiere (z. B. dem Benutzervorrichtung 54 von 2) und/oder einer oder mehreren Quellen für Ferninformationen (z.B. GPS-Daten, Verkehrsinformationen, Wetterinformationen usw.) beinhalten.
Mit Bezug auf 2 ist ein Diagramm eines adaptiven Geschwindigkeitsregelsystems (ACC) 200 dargestellt, das unter Verwendung des dynamischen neuronalen Netzwerks zur Vorhersage des Fahrerverhaltens eines Fahrzeugsteuersystems in Übereinstimmung mit verschiedenen Ausführungsformen implementiert sein kann. Das System 200 beinhaltet gesetzte Eingaben von Fahrzeugsensoren 205 (wie in 1 beschrieben), die beispielsweise Eingaben von Radar, Kamera, Lidar usw. beinhalten, sowie Eingaben 210 aus der Umgebung (umgebende Bereiche des Fahrzeugs) und Fahrzeuginstrumentendaten. Die Eingaben 210 werden von einem Zustandsabschätzungsmodul 220 empfangen, das ein Online-Lernmodul 215 bildet. Die Eingaben 210 werden von einem Fahreranpassungsmodul 225 empfangen, welches das Online-Lernmodul 215 bildet. Das Online-Lernmodul 215 erzeugt eine Online-Korrektur für das Fahrerwunsch-Anpassungsmodul 230. Der ACC-Steuerbefehl 255 wird von dem Fahrerwunsch-Anpassungsmodul 230 empfangen. Das Fahrerwunsch-Anpassungsmodul 230 korreliert mit der Fahrersteuerung, indem es mit dem Fahrersteuermodul 235 korreliert, und speichert die Korrelationsinformationen und die neue Einstellung in dem neuronalen Netzwerk 240. Das Fahrerwunsch-Anpassungsmodul 230 führt eine Sicherheitsüberprüfung über die ACC-Steuer-Sicherheitsüberprüfung 245 durch.
In einer beispielhaften Ausführungsform wird die ACC-Steuer-Sicherheitsüberprüfung für eine Online-Anpassung implementiert. Die Quantifizierungsfunktion der Sicherheitsüberprüfung ist wie folgt definiert: V_safety = d^-2 + (v_ACC - v_est)². Sie ist V_safety = 0, wenn nur v_ACC = v_est und d → oo; sonst V_safety >0. Der Wunsch ist, die ACC-Steuerung zu verbessern und zu erreichen, dass V_safety -7 0. In anderen Fällen V_safety » 0 was ein Hinweis darauf ist, dass die implementierte Steuerung angepasst werden muss oder nicht richtig funktioniert.
Zur Berechnung von V_safety ohne die ACC-Steuerung des Host-Fahrzeugs instabil zu machen oder die Leistung zu verschlechtern, kann das gleiche oder ein ähnliches ACC-Drehmoment auf ein Fahrzeugdynamikmodell angewendet werden und ein v_Aprx = ƒ(τ_Acc, v_est, ...) kann berechnet werden. Die Fahrzeugdynamik kann dann für ein Modell auf der Grundlage einer Geschwindigkeits-Sicherheitsmessung wie folgt überprüft werden: V_{safety, Aprx} = (d + Δ(v_Aprx))^-2 + (v_ACC - v_est)²- Daher kann die Sicherheit überprüft werden, wenn Folgendes zutrifft, was darauf hinweist, dass der Befehl des adaptiven Steuerungsverfahrens der ACC als sicher gilt und verbessert werden kann (die Sicherheitsüberprüfung kann auch anzeigen, dass V_safety,Aprx nicht ansteigend ist, $\frac{d}{dt} V_{s a f e t y, A p r x} \leq 0$
).
Bei der Sicherheitsüberprüfung ist das Ziel in der Regel, die ACC-Steuerung zu verbessern und V_safety → 0 zu erfüllen. Die Offline-Daten werden auch über das Offline-Datenmodul 250 an das Fahrerwunsch-Anpassungsmodul 230 gesendet.
3 ist ein Diagramm, das die Komponenten eines adaptiven Geschwindigkeitsregelsystems veranschaulicht, das unter Verwendung des neuronalen Netzwerks implementiert sein kann, um das Fahrerverhalten eines Fahrzeugsteuersystems gemäß verschiedenen Ausführungsformen, die in den 1-2 dargestellt sind, vorherzusagen. In 3 werden die Informationen über die dynamischen Betriebsparameter des Zielfahrzeugs und des Host-Fahrzeugs von dem Quantifizierungsmodul 310 empfangen und quantifiziert, was Schritte zur Quantifizierung von Zielfahrzeugparametern und zur Erzeugung von Informationen über den stationären Zustand des Zielfahrzeugs aus den gesammelten Informationen der Vorwärtswahrnehmung und der Analyse umfasst.
Die quantifizierten Informationen und die Informationen über den stationären Zustand werden von einem Datenlernmodul 305 analysiert, um sie zu quantifizieren und an das Zustandsabschätzungsmodul 325 zu senden. Das Zustandsabschätzungsmodul 325 implementiert die Funktion s_i = ƒ(v_ACC, v_est, τ_Driver, τ_ACC, τ _Acc, b, ...) um die Zustände des Zielfahrzeugs und des Host-Fahrzeugs zu bestimmen. Die Zustandsabschätzung basiert auf den Parametern Geschwindigkeit, wie von v_ACC bestimmt, geschätzter Geschwindigkeit v_est, dem Fahrerdrehmoment τ_Driver und dem ACC-Drehmoment τ_ACC sowie dem Zeitvektor des ACC-Drehmoments τ _Acc und dem Zeitvektor des erkannten Bremslichts des Zielfahrzeugs (b), und anderen Parameter. Darüber hinaus ist die Belohnungsfunktion R_ij zwischen der Steuerung des Host-Fahrzeugs und des Zielfahrzeugs $R_{i j} = \sum_{k = 0}^{k = n} R_{k} .$
Beim Berechnen der Belohnungsfunktion R_ij werden die Zustände des Zielfahrzeugs und des Host-Fahrzeugs ermittelt und über die Eingabe 345 empfangen.
In einer beispielhaften Ausführungsform wird für einen Satz von Belohnungsfunktionen R zur Bestimmung der Belohnungsfunktion (R₁ to R₄) wie folgt dargestellt: R₁ = (τ_ACC - τ_Driver )^-2 , R₂ = Faltung(τ _Acc * b), R₃ = d², und R₄ = (v_ACC - v_est)^-2 zu R_n.
Dieses Schätzungsmodell ermöglicht es der Lern-Belohnungsfunktion des ACC sich bestmöglich mit der Fahrweise des Fahrers zu korrelieren, Fahrerprofil. Für jede „Fahrer-ID“ kann ein Fahrerprofil erlernt und gespeichert werden.
Das Q-Lernmodul 340 kann die Q-Matrix Q(i,j) = αR_ij + (1 - α)Q(i,j) aktualisieren, nachdem die Richtlinienaktion 350 überprüft wurde. Die ACC-Steuer-Sicherheitsüberprüfung 355 prüft die Geschwindigkeit des Host-Fahrzeugs auf $\frac{d}{dt} V_{s a f e t y, A p r x} < 0.$
Nach der Sicherheitsüberprüfung kann dann die entsprechende Steueraktion 360 angewendet werden.
4 zeigt ein beispielhaftes Diagramm von Belohnungsfunktionen zur Verwendung in dem Steuerverfahren des in den 1-3 dargestellten adaptiven Geschwindigkeitsregelsystems in Übereinstimmung mit verschiedenen Ausführungsformen. In 4 beinhaltet das beispielhafte Diagramm ein Host-Fahrzeug 405 und ein Zielfahrzeug 410 mit einem Satz von Belohnungsfunktionen, die berechnet werden aus R₁ Fahrerfeedback, R₂ Indikation, R₃ Abstand, und R₄ ACC-Leistungsfähigkeit, wobei die R_i Belohnungsfunktionen sind, die mit jeder Umgebung oder jedem Zustand assoziiert sind.
5. ist ein beispielhaftes Diagramm, das den potenziellen Nutzen einer beispielhaften Verwendung des in 1-3 dargestellten adaptiven Geschwindigkeitsregelsystems gemäß verschiedenen Ausführungsformen veranschaulicht. Das Diagramm in 5 zeigt eine beispielhafte Ausführungsform des potenziellen Nutzens eines Host-Fahrzeugs mit dem adaptiven ACC-System, das initiiert wird, um auf einen Bremslichtstatus in einem Zielfahrzeug zu reagieren, indem das Achsendrehmoment des Host-Fahrzeugs reduziert wird, was zu einer sanfteren Reaktion auf das Bremslicht führt oder diese erleichtert. Die Verzögerungsrate des Zielfahrzeugs ist entsprechend flacher.
6 ist ein beispielhaftes Flussdiagramm, das die Schritte zur Verwendung in dem in 1-3 dargestellten adaptiven Geschwindigkeitsregelsystem in Übereinstimmung mit verschiedenen Ausführungsformen veranschaulicht.
In 6 zeigt das Flussdiagramm 600 in Schritt 610 das Identifizieren von Straßengeometrien und Umgebungsfaktoren durch das Ausführen der adaptiven Geschwindigkeitsregelung, um eine Reihe von Fahrzeugeingaben über die Betriebsumgebung eines Host-Fahrzeugs und die aktuellen Operationen zu erhalten. Als nächstes wird in Schritt 620 das gewünschte Verhalten des Fahrers erlernt, um auf verschiedene Zustände des Zielfahrzeugs zu reagieren, indem ein Zielfahrzeug identifiziert wird, das in der Umgebung des Host-Fahrzeugs operiert, und ein Satz von Zielfahrzeugparametern über das Zielfahrzeug werden quantifiziert, die aus den erfassten Eingaben abgeleitet werden. Zusätzlich wird eine Modellierung einer Zustandsabschätzung des Host-Fahrzeugs und des Zielfahrzeugs durch Erzeugen eines Satzes von Geschwindigkeitsberechnungen und Drehmomentberechnungen für jedes Fahrzeug und Erzeugen eines Satzes von Ergebnissen aus mindestens einer Belohnungsfunktion auf der Grundlage einer oder mehrerer modellierter Zustandsabschätzungen des Host-Fahrzeugs und des Zielfahrzeugs vorgenommen. Anschließend wird der Satz von Ergebnissen mit den im DNN enthaltenen Daten zum Fahrerverhalten verarbeitet, um eine oder mehrere Steueraktionen mit den Daten zum Fahrerverhalten zu korrelieren.
In einer beispielhaften Ausführungsform wird der Verfolgungsabstand für ein Zielfahrzeug quantifiziert, um das Fahrverhalten des Fahrers im Host-Fahrzeug zu modellieren. Bei Schritt 630 wird die gewünschte Verhaltensmatrix mit aktualisierten Daten auf der Grundlage von generierten Sätzen von Ergebnissen aus der Belohnungsfunktion aufgebaut, um ein Profil des Fahrerverhaltens zu erstellen. Bei Schritt 640 wird das ACC-System implementiert, um die Verfolgungsabstände durch Bereitstellung einer gewünschten Beschleunigungs- und Verzögerungsrate anzupassen. Das ACC-System führt die erforderlichen Steuermaßnahmen für den Betrieb des Host-Fahrzeugs durch Berechnen der Belohnungsfunktion unter Verwendung eines Satzes von Parametern für Geschwindigkeits- und Drehmomentberechnungen und Schätzungen der Beschleunigung und Geschwindigkeit des Host-Fahrzeugs und des Zielfahrzeugs durch.
In verschiedenen beispielhaften Ausführungsformen kann die implementierte Fahrerverhalten-Vorhersagemodelllogik in einem Offline-Training erstellt werden, das von überwachten oder unbeaufsichtigten Lernprozessen abgeleitet ist, und sie kann unter Verwendung anderer neuronaler Netzwerke aktiviert werden. Beispielsweise können die anderen neuronalen Netzwerke trainierte neuronale Faltungsnetzwerke (Engl.: Convolution Neural Network, CNN) und/oder rekurrente neuronale Netze (Engl.: Recurrent Neural Network, RNN) beinhalten, bei denen eine ähnliche Methodik angewendet und in Fahrzeugsteuervorgängen verwendet werden kann. Darüber hinaus können alternative Ausführungsformen in Betracht gezogen werden, die ein neuronales Netzwerk umfassen, das aus mehreren Schichten (d.h. 3 Schichten) eines neuronalen Faltungsnetzwerks (CNN) und auch mit dichten Schichten (d.h. 2 dichten Schichten) besteht, die offline trainiert wurden und die Steuerung von Operationen des ACC in Koordination mit dem in 1 dargestellten System gemäß verschiedenen Ausführungsformen ermöglichen.
Das dynamische neuronale Netzwerk wird verwendet, um die ACC-Steuerung über Drehmoment- und Drehzahlcharakteristiken zu informieren, und ist als bereits trainiertes neuronales Netzwerk konfiguriert. Daher ist in bestimmten Ausführungsformen der Prozess des Drehmomentvorhersagesystems nur in einem Betriebsmodus konfiguriert. In verschiedenen Ausführungsformen wird das dynamische neuronale Netzwerk beispielsweise in einem Trainingsmodus trainiert, bevor es im Fahrzeug (oder in anderen Fahrzeugen) eingesetzt oder bereitgestellt wird. Sobald das dynamische neuronale Netzwerk trainiert ist, kann es in einem Fahrzeug (z.B. dem Fahrzeug 10 von 1) in einem Betriebsmodus implementiert werden, in dem das Fahrzeug autonom, teilautonom oder manuell betrieben wird.
In verschiedenen alternativen Ausführungsbeispielen kann das neuronale Netzwerk auch sowohl im Trainingsmodus als auch im Betriebsmodus in einem Fahrzeug implementiert und während einer anfänglichen Betriebsperiode in Verbindung mit der Anwendung einer Zeitverzögerung oder einer ähnlichen Methodik für Drehmomentsteuerungsvorhersagen trainiert werden. Auch kann ein Fahrzeug ausschließlich im Betriebsmodus mit neuronalen Netzwerken betrieben werden, die bereits über einen Trainingsmodus desselben Fahrzeugs und/oder anderer Fahrzeuge in verschiedenen Ausführungsformen trainiert wurden.
Wie bereits kurz erwähnt, können die verschiedenen oben beschriebenen Module und Systeme als eines oder mehrere maschinelle Lernmodelle implementiert sein, die überwachtes, unbeaufsichtigtes, halbüberwachtes oder Verstärkungslemen durchlaufen. Solche Modelle können trainiert werden, um Klassifizierung (z. B. binäre oder Multiklassenklassifizierung), Regression, Clustering, Dimensionalitätsreduktion und/oder solche Schritte durchzuführen. Beispiele für solche Modelle beinhalten ohne Einschränkung künstliche neuronale Netzwerke (Engl.: Artificial Neural Network, ANN) (wie beispielsweise rekurrente neuronale Netzwerke (RNN) und neuronale Faltungsnetzwerke (CNN)), Entscheidungsbaummodelle (z. B. Klassifizierungs- und Regressionsbäume (Engl.: Classification And Regression Trees, CART)), Ensemble-Lernmodelle (z. B. Boosting, Bootstrapped-Aggregation, Gradient-Boosting-Maschinen und Random Forests), Bayes'sche Netzwerkmodelle (z. B., Naive Bayes), Hauptkomponentenanalyse (Engl.: Principle Component Analysis, PCA), Support-Vektor-Maschinen (SVM), Clustering-Modelle (wie K-nächster-Nachbar, K-Durchschnitt, Erwartungsmaximierung, hierarchisches Clustering usw.) und Modelle der linearen Diskriminanzanalyse.
Es sei darauf hingewiesen, dass das Verfahren der 1-6 eine beliebige Anzahl zusätzlicher oder alternativer Schritte beinhalten kann, dass die in den 1-6 dargestellten Schritte nicht in der dargestellten Reihenfolge ausgeführt werden müssen und dass das Verfahren der 1-6 in ein umfassenderes Verfahren oder einen Prozess mit zusätzlicher, hierin nicht näher beschriebener Funktionalität integriert sein kann. Darüber hinaus können einer oder mehrere der in den 1-6 dargestellten Schritte bei einer Ausführungsform des in den 1-6 dargestellten Verfahrens weggelassen werden, solange die beabsichtigte Gesamtfunktionalität erhalten bleibt.
Die vorstehende detaillierte Beschreibung ist lediglich illustrativer Natur und soll weder die Ausführungsformen des Gegenstands noch die Anwendung und Verwendung solcher Ausführungsformen einschränken. Wie hierin verwendet, bedeutet das Wort „beispielhaft“ „als Beispiel, Instanz oder Illustration dienend“. Jede hierin als beispielhaft beschriebene Implementierung ist nicht notwendigerweise als bevorzugt oder vorteilhaft gegenüber anderen Implementierungen zu verstehen. Darüber hinaus besteht nicht die Absicht, an eine ausdrückliche oder stillschweigende Theorie gebunden zu sein, die in dem vorangehenden technischen Gebiet, dem Hintergrund oder der detaillierten Beschreibung dargestellt ist.
Obwohl in der vorangegangenen detaillierten Beschreibung mindestens eine beispielhafte Ausführungsform vorgestellt wurde, sollte erkannt werden, dass eine Vielzahl von Varianten existiert. Es sollte auch erkannt werden, dass die beispielhafte Ausführungsform oder die beispielhaften Ausführungsformen nur Beispiele sind und nicht dazu gedacht sind, den Umfang, die Anwendbarkeit oder die Konfiguration der Offenbarung in irgendeiner Weise zu begrenzen. Vielmehr soll die vorstehende detaillierte Beschreibung dem Fachmann eine praktische Anleitung für die Umsetzung der beispielhaften Ausführungsform oder der beispielhaften Ausführungsformen geben.
Es versteht sich, dass verschiedene Änderungen in der Funktion und der Anordnung der Elemente vorgenommen werden können, ohne dass der Umfang der Offenbarung, wie er in den beigefügten Ansprüchen und deren gesetzlichen Äquivalenten dargelegt ist, verlassen wird.

Claims

Ein Verfahren zum Implementieren einer adaptiven Geschwindigkeitsregelung, ACC, das durch Verstärkungslemen, RL, implementiert wird und Folgendes umfasst: Ausführen einer adaptiven Geschwindigkeitsregelung durch einen Prozessor, um einen Satz von Fahrzeugeingaben über die Betriebsumgebung und die aktuellen Operationen eines Host-Fahrzeugs zu erhalten; Identifizieren eines Zielfahrzeugs, das in der Umgebung des Host-Fahrzeugs operiert, und Quantifizieren eines Satzes von Zielfahrzeugparametern über das Zielfahrzeug, die von erfassten Eingaben abgeleitet werden, durch den Prozessor; Modellieren einer Zustandsabschätzung des Host-Fahrzeugs und des Zielfahrzeugs durch Erzeugen eines Satzes von Geschwindigkeitsberechnungen und Drehmomentberechnungen über jedes Fahrzeug durch den Prozessor; Erzeugen eines Satzes von Ergebnissen aus mindestens einer Belohnungsfunktion, welche auf einer oder mehreren modellierten Zustandsabschätzungen des Host-Fahrzeugs und des Zielfahrzeugs basiert, durch den Prozessor; und Verarbeiten des Satzes von Ergebnissen mit durch das RL ermittelten Daten zum Fahrerverhalten, um eine oder mehrere Steueraktion mit den Daten zum Fahrerverhalten zu korrelieren.
Das Verfahren nach Anspruch 1, ferner umfassend: Anwenden, durch den Prozessor, mindestens einer Steueraktion, die mit den durch RL etablierten Daten zum Fahrerverhalten korreliert ist, um mindestens eine Operation der adaptiven Geschwindigkeitsregelung des Host-Fahrzeugs anzupassen.
Das Verfahren nach Anspruch 2, ferner umfassend: Anpassen, durch den Prozessor, der mindestens einen Steueraktion, die mit den durch RL ermittelten Daten zum Fahrerverhalten korreliert ist, auf der Grundlage einer Steuer-Sicherheitsüberprüfung.
Das Verfahren nach Anspruch 3, ferner umfassend: Aktualisieren, durch den Prozessor, von Daten einer Lernmatrix auf der Grundlage des erzeugten Satzes von Ergebnissen aus der mindestens einen Belohnungsfunktion, um ein Profil des Fahrerverhaltens zu erstellen.
Das Verfahren nach Anspruch 4, ferner umfassend: Berechnen der Belohnungsfunktion durch den Prozessor unter Verwendung eines Parametersatzes, der Geschwindigkeitsberechnungen und Drehmomentberechnungen von Schätzungen der Beschleunigung und der Geschwindigkeit der Host- und Zielfahrzeuge umfasst.
Das Verfahren nach Anspruch 5, ferner umfassend: Anpassen eines oder mehrerer Abstände zwischen dem Host-Fahrzeug und dem Zielfahrzeug durch den Prozessor, basierend auf dem gelernten Fahrerverhalten, das in den Daten der Lernmatrix enthalten ist.
Das Verfahren nach Anspruch 6, wobei die Steuer-Sicherheitsüberprüfung eine Geschwindigkeitsdifferenz zwischen einer sicheren Geschwindigkeit und einer Schätzung der Geschwindigkeit des Zielfahrzeugs und des Basisfahrzeugs umfasst.
Ein System, umfassend: einen Satz von Eingaben, die von einem Prozessor erhalten werden, die einen Satz von Fahrzeugeingaben einer oder mehrerer Messeingaben einer Operation eines Host-Fahrzeugs und erfasste Eingaben einer Betriebsumgebung über ein Host-Fahrzeug umfassen, die verwendet werden, um Steueroperationen eines adaptiven Geschwindigkeitsregelungssystems, ACC-System, auszuführen, welches durch Verstärkungslemen, RL, implementiert ist und in dem Host-Fahrzeug enthalten ist; wobei das ACC-System des Fahrzeugs durch ein Fahrerverhalten-Vorhersagemodell instruiert wird, welches durch den Prozessor implementiert und durch RL begründet ist, welches die Erwartungen des Fahrers online lernt und ein neuronales Netzwerk, NN, verwendet, um den Satz von Fahrzeugeingaben zu verarbeiten, um die Steuerfunktionen anzupassen; wobei der Prozessor konfiguriert ist, ein in der Umgebung des Host-Fahrzeugs operierendes Zielfahrzeug zu identifizieren, um einen Satz von Zielfahrzeugparametern über das Zielfahrzeug zu quantifizieren, die von erfassten Eingaben abgeleitet sind; wobei der Prozessor konfiguriert ist, eine Zustandsabschätzung des Host-Fahrzeugs und des Zielfahrzeugs auf der Grundlage eines Satzes von Geschwindigkeitsberechnungen und Drehmomentberechnungen für jedes Fahrzeug zu modellieren; wobei der Prozessor konfiguriert ist, einen Satz von Ergebnissen aus mindestens einer Belohnungsfunktion auf der Grundlage einer oder mehrerer Zustandsabschätzungen des Host-Fahrzeugs und des Zielfahrzeugs zu erzeugen; und wobei der Prozessor konfiguriert ist, den Satz von Ergebnissen mit den durch RL ermittelten Daten zum Fahrerverhalten zu verarbeiten, um eine oder mehrere Steueraktionen mit den Daten zum Fahrerverhalten zu korrelieren.
Das System nach Anspruch 8, ferner umfassend: wobei der Prozessor konfiguriert ist, mindestens eine Steueraktion anzuwenden, die mit den durch RL ermittelten Daten zum Fahrerverhalten zu korrelieren, um mindestens eine Steueraktion des ACC-Systems des Host-Fahrzeugs anzupassen; wobei der Prozessor konfiguriert ist, die mindestens eine Steueraktion, die mit den durch RL ermittelten Daten zum Fahrerverhalten korreliert ist, auf der Grundlage einer Steuer-Sicherheitsüberprüfung anzupassen; und wobei der Prozessor konfiguriert ist, die mindestens eine Steueraktion, die mit den Daten des NN zum Fahrerverhalten korreliert ist, auf der Grundlage einer Steuer-Sicherheitsüberprüfung anzupassen;
Das System nach Anspruch 9, ferner umfassend: wobei der Prozessor konfiguriert ist, die Belohnungsfunktion unter Verwendung eines Parametersatzes zu berechnen, der Geschwindigkeitsberechnungen und Drehmomentberechnungen von Schätzungen der Beschleunigung und Geschwindigkeit des Host-Fahrzeugs und des Zielfahrzeugs umfasst; wobei der Prozessor konfiguriert ist, einen oder mehrere Abstände zwischen dem Host-Fahrzeug und dem Zielfahrzeug auf der Grundlage des in den Daten der Lernmatrix enthaltenen gelernten Fahrerverhaltens anzupassen; wobei die Steuer-Sicherheitsüberprüfung eine Geschwindigkeitsdifferenz zwischen einer sicheren Geschwindigkeit und einer Schätzung der Geschwindigkeit des Ziel-Fahrzeugs und des Host-Fahrzeugs umfasst.