DE102018133576A1

DE102018133576A1 - Trajektorienplaner mit dynamischem kostenlernen für autonomes fahren

Info

Publication number: DE102018133576A1
Application number: DE102018133576.8A
Authority: DE
Inventors: Sayyed Rouholla Jafari Tafti; Guangyu J. Zou; Marcus J. Huber; Upali P. Mudalige
Original assignee: GM Global Technology Operations LLC
Current assignee: GM Global Technology Operations LLC
Priority date: 2018-01-02
Filing date: 2018-12-21
Publication date: 2019-07-04
Also published as: US20190204842A1; CN109990794A

Abstract

Ein Fahrzeug, System und Verfahren zum autonomen Navigieren des Fahrzeugs. Eine Referenztrajektorie zum Navigieren eines Trainingsverkehrsszenarios entlang eines Straßenabschnitts wird an einem Prozessor des Fahrzeugs empfangen. Der Prozessor ermittelt einen Koeffizienten für eine Kostenfunktion, die einer Kandidatentrajektorie zugeordnet ist, welche die Referenztrajektorie simuliert. Der ermittelte Koeffizient wird einem neuronalen Netz bereitgestellt, um das neuronale Netz zu trainieren. Das trainierte neuronale Netz erzeugt eine Navigationstrajektorie zum Navigieren des Fahrzeugs unter Verwendung eines durch das neuronale Netz bestimmten Kostenkoeffizienten. Das Fahrzeug wird unter Verwendung der Navigationstrajektorie entlang des Straßenabschnitts navigiert.

Description

EINLEITUNG
Die Offenbarung bezieht sich auf Systeme zur autonomen Navigation eines Fahrzeugs, insbesondere auf Systeme und Verfahren zum Trainieren eines neuronalen Netzes zur Auswahl einer Trajektorie zum Navigieren in dynamischen Straßen- und Verkehrsszenarien.
Autonome Fahrzeuge verwenden Bewegungsplanungssysteme, die Trajektorien zum Navigieren des Fahrzeugs erzeugen. Die meisten Bewegungsplanungssysteme finden eine optimale Trajektorie für ein Fahrzeug über einen Straßenabschnitt, indem sie die mit der Trajektorie verbundenen Kostenfunktionen bestimmen. Es ist jedoch oft schwierig, eine Trajektorie zu erzeugen, die menschenähnliche Fahren simuliert und gleichzeitig über eine Vielzahl von verschiedenen Straßenszenarien mit nur einer oder sogar mehreren Kostenfunktionen bedienbar ist. Dementsprechend ist es wünschenswert, einen Ansatz für die Trajektorienplanung bereitzustellen, der optimale Trajektorien dynamisch für verschiedene Straßenszenarien erlernt.
KURZDARSTELLUNG
In einer exemplarischen Ausführungsform wird ein Verfahren zum autonomen Navigieren eines Fahrzeugs offenbart. Das Verfahren beinhaltet das Empfangen einer Referenztrajektorie zum Navigieren eines Trainingsverkehrsszenarios entlang eines Straßenabschnitts an einem Prozessor, das Ermitteln eines Koeffizienten für eine Kostenfunktion, die mit einer Kandidatentrajektorie verbunden ist, welche die Referenztrajektorie simuliert, das Bereitstellen des bestimmten Koeffizienten an ein neuronales Netzwerk, um das neuronale Netzwerk zu trainieren, und Erzeugen einer Navigationstrajektorie unter Verwendung des trainierten neuronalen Netzwerks zum Navigieren des Fahrzeugs unter Verwendung eines geeigneten Kostenkoeffizienten, der durch das neuronale Netzwerk bestimmt wird. Das Fahrzeug wird unter Verwendung der Navigationstrajektorie entlang des Straßenabschnitts navigiert.
Neben einem oder mehreren der hierin beschriebenen Merkmale wird der Straßenabschnitt durch eine Suchgrafik dargestellt, die zum Trainieren des neuronalen Netzwerks verwendet wird, wobei die Kandidatentrajektorie auf die Suchgrafik beschränkt ist. Die Suchgrafik kann Fahrzeugzustandsdaten und Daten für Objekte entlang des Straßenabschnitts beinhalten. Die der Kandidatentrajektorie zugeordnete Kostenfunktion ist abhängig von Objekten im Trainingsverkehrsszenario.
Das Bestimmen des Koeffizienten beinhaltet das Bestimmen der Kosten, die der Referenztrajektorie zugeordnet sind, und das Bestimmen des Koeffizienten, für den die der Kandidatentrajektorie zugeordnete Kostenfunktion einen Kostenwert ausgibt, der innerhalb eines ausgewählten Kriteriums der Kosten liegt, die der Referenztrajektorie zugeordnet sind. In verschiedenen Ausführungsformen wird der Koeffizient der Kostenfunktion so gewählt, dass eine optimale Trajektorie mit minimalen Kosten bereitgestellt wird, die der Referenztrajektorie entspricht.
In einer anderen exemplarischen Ausführungsform wird ein System zum Navigieren eines autonomen Fahrzeugs offenbart. Das System beinhaltet einen Prozessor, der zum Empfangen einer Referenztrajektorie zum Navigieren eines Trainingsverkehrsszenarios entlang eines Straßenabschnitts, zum Bestimmen eines Koeffizienten für eine Kostenfunktion, die einer Kandidatentrajektorie zugeordnet ist, welche die Referenztrajektorie simuliert, zum Bereitstellen des bestimmten Koeffizienten an ein neuronales Netzwerk zum Trainieren des neuronalen Netzwerks und zum Erzeugen einer Navigationstrajektorie zum Navigieren des Fahrzeugs unter Verwendung eines geeigneten, durch das neuronale Netzwerk bestimmten Kostenkoeffizienten konfiguriert ist. Der Prozessor ist ferner konfiguriert, um das Fahrzeug entlang des Straßenabschnitts unter Verwendung der Navigationstrajektorie zu navigieren.
Neben einem oder mehreren der hierin beschriebenen Merkmale ist der Prozessor ferner konfiguriert, um den Straßenabschnitt über eine Suchgrafik mit der auf die Suchgrafik begrenzten Kandidatentrajektorie darzustellen und das neuronale Netz mit der Suchgrafik als Eingabe zu trainieren. Die Suchgrafik beinhaltet Fahrzeugzustandsdaten und Daten für Objekte entlang des Straßenabschnitts. Die der Kandidatentrajektorie zugeordnete Kostenfunktion ist abhängig von Objekten im Verkehrsszenario.
Der Prozessor ist ferner konfiguriert, um den Koeffizienten zu bestimmen, bei welchem die der Kandidatentrajektorie zugeordneten Kosten innerhalb eines ausgewählten Kriteriums für die der Referenztrajektorie zugeordneten Kosten liegen. Der Prozessor ist ferner konfiguriert, um die Koeffizienten der Kostenfunktion zu bestimmen, die eine optimale Trajektorie mit minimalen Kosten bereitstellt, die der Referenztrajektorie nahe kommt, und um das neuronale Netz unter Verwendung der bestimmten Koeffizienten zu trainieren.
In noch einer anderen exemplarischen Ausführungsform wird ein autonomes Fahrzeug offenbart. Das Fahrzeug beinhaltet einen Prozessor, der konfiguriert ist, um eine Referenztrajektorie zum Navigieren eines Trainingsverkehrsszenarios entlang eines Straßenabschnitts zu empfangen, einen Koeffizienten für Kosten zu bestimmen, der einer Kandidatentrajektorie zugeordnet ist, welche die Referenztrajektorie simuliert, den bestimmten Koeffizienten einem neuronalen Netz zum Trainieren des neuronalen Netzes bereitzustellen, eine Navigationstrajektorie zum Navigieren des Fahrzeugs unter Verwendung geeigneter, durch das trainierte neuronale Netz bestimmter Kostenkoeffizienten zu erzeugen, und das Fahrzeug entlang des Straßenabschnitts unter Verwendung der Navigationstrajektorie zu steuern.
Neben einem oder mehreren der hierin beschriebenen Merkmale stellt der Prozessor den Straßenabschnitt über eine Suchgrafik dar, wobei die Kandidatentrajektorie auf die Suchgrafik beschränkt ist und das neuronale Netz über die Suchgrafik trainiert wird. Die der Kandidatentrajektorie zugeordnete Kostenfunktion ist abhängig von Objekten im Verkehrsszenario. Der Prozessor bestimmt den Koeffizienten, bei welchem die der Kandidatentrajektorie zugeordneten Kosten innerhalb eines ausgewählten Kriteriums für die der Referenztraj ektorie zugeordneten Kosten liegen. Der Prozessor bestimmt die Koeffizienten der Kostenfunktion, die eine optimale Trajektorie mit minimalen Kosten bereitstellt, die der Referenztrajektorie nahe kommt, und trainiert das neuronale Netz unter Verwendung der bestimmten Koeffizienten.
Das Fahrzeug beinhaltet einen Sensor, der einen Zustand des Fahrzeugs und eines Echtzeit-Verkehrsszenarios mit dem Fahrzeug erkennt, und das neuronale Netz erzeugt Kostenkoeffizienten, die für das erkannte Echtzeit-Verkehrsszenario geeignet sind, und erzeugt die Navigationstrajektorie aus den erzeugten Kostenkoeffizienten.
Die oben genannten Eigenschaften und Vorteile sowie anderen Eigenschaften und Funktionen der vorliegenden Offenbarung gehen aus der folgenden ausführlichen Beschreibung in Verbindung mit den zugehörigen Zeichnungen ohne Weiteres hervor.
Figurenliste
Andere Merkmale, Vorteile und Einzelheiten erscheinen, nur exemplarisch, in der folgenden ausführlichen Beschreibung der Ausführungsformen, wobei sich die ausführliche Beschreibung auf die Zeichnungen bezieht, wobei gilt:

1 veranschaulicht ein Trajektorienplanungssystem, das im Allgemeinen einem Fahrzeug gemäß verschiedenen Ausführungsformen zugeordnet ist;
2 stellt eine Draufsicht eines veranschaulichenden Verkehrsszenarios dar, das von einem Trägerfahrzeug angetroffen werden kann oder als Trainingsszenario verwendet werden kann;
3 stellt ein schematisches Diagramm dar, das einen Datenfluss zum Auffinden der Kostenfunktionskoeffizienten zum Trainieren eines tiefen neuronalen Netzes (DNN) in einer Ausführungsform darstellt;
4 stellt ein schematisches Diagramm zum Trainieren des DNN zu einem ausgewählten Verkehrsszenario in einer Ausführungsform dar;
5 stellt ein schematisches Diagramm eines Datenflusses zur Verwendung eines trainierten neuronalen Netzes im Betrieb eines Fahrzeugs dar, um ein Verkehrsmuster in einer Ausführungsform zu steuern; und
6 stellt ein Flussdiagramm dar, das ein Verfahren zum Navigieren eines ausgewählten Verkehrsszenarios gemäß einer Ausführungsform veranschaulicht.

AUSFÜHRLICHE BESCHREIBUNG
Die folgende Beschreibung ist lediglich exemplarischer Natur und nicht dazu gedacht, die vorliegende Offenbarung in ihren An- oder Verwendungen zu beschränken. Es sollte verstanden werden, dass in den Zeichnungen entsprechende Bezugszeichen gleiche oder entsprechende Teile und Merkmale bezeichnen.
Unter Bezugnahme auf 1 ist ein bei 100 allgemein dargestelltes Trajektorienplanungssystem dargestellt, das einem autonomen Fahrzeug 10 gemäß verschiedenen Ausführungsformen zugeordnet ist. Im Allgemeinen bestimmt das System 100 einen Trajektorienplan für das automatisierte Fahren. Wie in 1 dargestellt, beinhaltet das autonome Fahrzeug 10 im Allgemeinen ein Fahrgestell 12, eine Karosserie 14, Vorderräder 16 und Hinterräder 18. Die Karosserie 14 ist auf dem Fahrgestell 12 angeordnet und umhüllt im Wesentlichen die anderen Komponenten des autonomen Fahrzeugs 10. Die Karosserie 14 und das Fahrgestell 12 können gemeinsam eine Karosseriestruktur bilden. Die Räder 16-18 sind jeweils mit dem Fahrgestell 12 in der Nähe einer jeweiligen Ecke der Karosserie 14 drehbar verbunden.
In verschiedenen Ausführungsformen ist das autonome Fahrzeug 10 ein autonomes Fahrzeug und das Trajektorienplanungssystem 100 ist in das autonome Fahrzeug 10 (nachfolgend als das autonomes Fahrzeug 10 bezeichnet) integriert. Das autonome Fahrzeug 10 ist beispielsweise ein Fahrzeug, das automatisch gesteuert wird, um Passagiere von einem Ort zum anderen zu befördern. Das Fahrzeug 10 ist in der veranschaulichten Ausführungsform als Pkw dargestellt, es sollte jedoch beachtet werden, dass auch jedes andere Fahrzeug, einschließlich Lastwagen, Sportfahrzeuge (SUVs), Freizeitfahrzeuge (RVs), Schiffe, Flugzeuge usw. verwendet werden können. In einer exemplarischen Ausführungsform ist das autonome Fahrzeug 10 ein sogenanntes Level-Vier oder Level-Fünf Automatisierungssystem. Ein Level-Vier-System zeigt eine „hohe Automatisierung“ unter Bezugnahme auf die Fahrmodus-spezifische Leistung durch ein automatisiertes Fahrsystem aller Aspekte der dynamischen Fahraufgabe an, selbst wenn ein menschlicher Fahrer nicht angemessen auf eine Anforderung einzugreifen, reagiert. Ein Level-Fünf-System zeigt eine „Vollautomatisierung“ an und verweist auf die Vollzeitleistung eines automatisierten Fahrsystems aller Aspekte der dynamischen Fahraufgabe unter allen Fahrbahn- und Umgebungsbedingungen, die von einem menschlichen Fahrer verwaltet werden können.
Wie dargestellt, beinhaltet das autonome Fahrzeug 10 im Allgemeinen ein Antriebssystem 20, ein Übertragungssystem 22, ein Lenksystem 24, ein Bremssystem 26, ein Sensorsystem 28, ein Stellantriebsystem 30, mindestens einen Datenspeicher 32, mindestens eine Steuerung 34 und ein Kommunikationssystem 36. Das Antriebssystem 20 kann in verschiedenen Ausführungsformen einen Verbrennungsmotor, eine elektrische Maschine, wie beispielsweise einen Traktionsmotor und/oder ein Brennstoffzellenantriebssystem, beinhalten. Das Übertragungssystem 22 ist dazu konfiguriert, Leistung vom Antriebssystem 20 zu den Fahrzeugrädern 16-18 gemäß den wählbaren Übersetzungen zu übertragen. Gemäß verschiedenen Ausführungsformen kann das Getriebesystem 22 ein Stufenverhältnis-Automatikgetriebe, ein stufenlos verstellbares Getriebe oder ein anderes geeignetes Getriebe beinhalten. Das Bremssystem 26 ist dazu konfiguriert, den Fahrzeugrädern 16-18 ein Bremsmoment bereitzustellen. Das Bremssystem 26 kann in verschiedenen Ausführungsformen Reibungsbremsen, Brake-by-Wire, ein regeneratives Bremssystem, wie beispielsweise eine elektrische Maschine und/oder andere geeignete Bremssysteme beinhalten. Das Lenksystem 24 beeinflusst die Position der Fahrzeugräder 16-18. Während in einigen Ausführungsformen innerhalb des Umfangs der vorliegenden Offenbarung zur Veranschaulichung als ein Lenkrad dargestellt, kann das Lenksystem 24 kein Lenkrad beinhalten.
Das Sensorsystem 28 beinhaltet eine oder mehrere Sensorvorrichtungen 40a-40n, die beobachtbare Zustände der äußeren Umgebung und/oder der inneren Umgebung des autonomen Fahrzeugs 10 erfassen. Die Sensorvorrichtungen 40a-40n können Radargeräte, Lidare, globale Positionierungssysteme, optische Kameras, Wärmebildkameras, Ultraschallsensoren und/oder andere Sensoren beinhalten, sind aber nicht darauf beschränkt. Das Stellgliedsystem 30 beinhaltet eine oder mehrere Stellantriebs-Vorrichtungen 42a-42n, die ein oder mehrere Fahrzeugmerkmale, wie zum Beispiel das Antriebssystem 20, das Getriebesystem 22, das Lenksystem 24 und das Bremssystem 26, steuern, jedoch nicht darauf beschränkt sind. In verschiedenen Ausführungsformen können die Fahrzeugmerkmale ferner Innen- und/oder Außenfahrzeugmerkmale, wie beispielsweise Türen, einen Kofferraum und Innenraummerkmale, wie z. B. Luft, Musik, Beleuchtung usw., beinhalten, sind jedoch nicht auf diese beschränkt (nicht nummeriert).
Die Datenspeichervorrichtung 32 speichert Daten zur Verwendung beim automatischen Steuern des autonomen Fahrzeugs 10. In verschiedenen Ausführungsformen speichert die Datenspeichervorrichtung 32 definierte Landkarten der navigierbaren Umgebung. In verschiedenen Ausführungsformen werden die definierten Landkarten vordefiniert und von einem entfernten System (in weiteren Einzelheiten in Bezug auf 2 beschrieben) erhalten. So können beispielsweise die definierten Karten durch das entfernte System zusammengesetzt und dem autonomen Fahrzeug 10 (drahtlos und/oder drahtgebunden) mitgeteilt und in der Datenspeichervorrichtung 32 gespeichert werden. Wie ersichtlich, kann die Datenspeichervorrichtung 32 ein Teil der Steuerung 34, von der Steuerung 34 getrennt, oder ein Teil der Steuerung 34 und Teil eines separaten Systems sein.
Die Steuerung 34 beinhaltet mindestens einen Prozessor 44 und eine computerlesbare Speichervorrichtung oder Medien 46. Der Prozessor 44 kann eine Spezialanfertigung oder ein handelsüblicher Prozessor sein, eine Zentraleinheit (CPU), eine Grafikprozessoreinheit (GPU) unter mehreren Prozessoren verbunden mit der Steuerung 34, ein Mikroprozessor auf Halbleiterbasis (in Form eines Mikrochips oder Chip-Satzes), ein Makroprozessor, eine Kombination derselben oder allgemein jede beliebige Vorrichtung zur Ausführung von Anweisungen. Die computerlesbare Speichervorrichtung oder Medien 46 können flüchtige und nicht-flüchtige Speicher in einem Nur-Lese-Speicher (ROM), einem Speicher mit direktem Zugriff (RAM) und einem Keep-Alive-Memory (KAM) beinhalten. KAM ist ein persistenter oder nicht-flüchtiger Speicher, der verwendet werden kann, um verschiedene Betriebsvariablen zu speichern, während der Prozessor 44 ausgeschaltet ist. Die computerlesbare Speichervorrichtung oder Medien 46 können unter Verwendung einer beliebigen einer Anzahl an bekannten Speichervorrichtungen, wie beispielsweise PROMs (programmierbarer Nur-Lese-Speicher), EPROMs (elektrische PROM), EEPROMs (elektrisch löschbarer PROM), Flash-Speicher oder beliebige andere elektrischen, magnetischen, optischen oder kombinierten Speichervorrichtungen implementiert werden, die Daten speichern können, von denen einige ausführbare Anweisungen darstellen, die von der Steuerung 34 beim Steuern des autonomen Fahrzeugs 10 verwendet werden.
Die Anweisungen können ein oder mehrere separate Programme beinhalten, von denen jede eine geordnete Auflistung von ausführbaren Anweisungen zum Implementieren von logischen Funktionen umfasst. Die Anweisungen empfangen und verarbeiten, wenn diese durch den Prozessor 44 ausgeführt werden, Signale vom Sensorsystem 28, führen Logik, Berechnungen, Verfahren und/oder Algorithmen zur automatischen Steuerung der Komponenten des autonomen Fahrzeugs 10 durch und erzeugen Steuersignale an das Stellantriebssystem 30, um die Komponenten des autonomen Fahrzeugs 10 basierend auf der Logik, den Berechnungen, den Verfahren und/oder Algorithmen automatisch zu steuern. Obwohl in 1 nur eine Steuerung 34 dargestellt ist, können Ausführungsformen des autonomen Fahrzeugs 10 eine beliebige Anzahl an Steuerungen 34 beinhalten, die über ein geeignetes Kommunikationsmedium oder eine Kombination von Kommunikationsmedien kommunizieren und zusammenwirken, um die Sensorsignale zu verarbeiten, Logiken, Berechnungen, Verfahren und/oder Algorithmen durchzuführen, und Steuersignale zu erzeugen, um die Funktionen des autonomen Fahrzeugs 10 automatisch zu steuern.
In verschiedenen Ausführungsvarianten werden eine oder mehrere Anweisungen der Steuerung 34 im Trajektorienplanungssystem 100 abgebildet und erzeugen bei der Ausführung durch den Prozessor 44 eine Trajektorienausgabe, die kinematische und dynamische Randbedingungen der Umgebung berücksichtigt. Die Anweisungen empfangen beispielsweise als Eingabe Prozesssignale und Kartendaten. Die Anweisungen führen einen graphenbasierten Ansatz mit einer benutzerdefinierten Kostenfunktion durch, um verschiedene Straßenszenarien sowohl auf Stadt- als auch auf Autobahnen zu handhaben.
Das Kommunikationssystem 36 ist konfiguriert, um Informationen drahtlos an und von anderen Einheiten 48, wie beispielsweise, jedoch nicht beschränkt auf andere Fahrzeuge („V2V“-Kommunikation,) Infrastruktur („V2I“-Kommunikation), entfernte Systeme und/oder persönliche Vorrichtungen (in Bezug auf 2 näher beschrieben), zu übermitteln. In einer exemplarischen Ausführungsform ist das drahtlose Kommunikationssystem 36 dazu konfiguriert, über ein drahtloses lokales Netzwerk (WLAN) unter Verwendung des IEEE 802.11-Standards, über Bluetooth oder mittels einer mobilen Datenkommunikation zu kommunizieren. Im Geltungsbereich der vorliegenden Offenbarung werden jedoch auch zusätzliche oder alternative Kommunikationsverfahren, wie beispielsweise ein dedizierter Nahbereichskommunikations-(DSRC)-Kanal, berücksichtigt. DSRC-Kanäle beziehen sich auf Einweg- oder Zweiwege-Kurzstrecken- bis Mittelklasse-Funkkommunikationskanäle, die speziell für den Automobilbau und einen entsprechenden Satz von Protokollen und Standards entwickelt wurden.
Das autonome Fahrzeug 10 beinhaltet ein System zum autonomen Navigieren durch ein ausgewähltes Straßenszenario oder ein ausgewähltes Verkehrsszenario über einen Straßenabschnitt. Das System betreibt und trainiert ein neuronales Netz zum Fahren in Bezug auf eine Vielzahl von Verkehrsszenarien, Straßenszenarien usw. und verwendet dann das trainierte neuronale Netz zum Fahren in realen Straßen- und Verkehrsszenarien. Das Trainingsverfahren beinhaltet das Sammeln von Trainingsdaten für ein gewünschtes menschenähnliches Fahren in verschiedenen Straßenszenarien und das Erzeugen eines Suchdiagramms basierend auf Eingaben in ein Trajektorienplanungssystem 100. Für die Suchgrafik ist eine Kostenfunktion definiert, die den Kostenwert für jede Trajektorie definiert, um die Suchgrafik von einem Startpunkt der Suchgrafik zu einem Endpunkt der Suchgrafik zu durchlaufen. Die Kostenfunktion beinhaltet verschiedene vordefinierte Kostenelemente und unterschiedliche Kostenkoeffizienten, welche die Gewichte für jede Kostenkomponente festlegen. Eine Kostenkomponente kann zugeordnete oder berechnete Energiekosten oder Energieaufwendungen des Fahrzeugs bei einer Kollision mit anderen Objekten auf der Straße sein, oder zugeordnete oder berechnete Energiekosten oder Energieaufwendungen für Lenkung, Spurwechsel, Geschwindigkeitsänderung usw. Eine gewünschte Trajektorie des Fahrzeugs in gesammelten Trainingsdaten wird dann verwendet, um die entsprechenden Kostenfunktionskoeffizienten zu finden, die zu einer Trajektorie mit minimalen Kosten oder einer Trajektorie mit im Wesentlichen minimalen Kosten führen, die sich in der Nähe der gewünschten Trajektorie befindet, die durch die grafische Suche bestimmt wurde. Die Werte der Koeffizienten können dann in einer Datenbank gespeichert und zum Trainieren des tiefen neuronalen Netzes verwendet werden. In einer tatsächlichen Fahrsituation kann das System ein tatsächliches Verkehrsszenario erkennen, das dem Trainingsverkehrsszenario entspricht oder im Wesentlichen entspricht, und berechnet die richtigen Koeffizienten, um eine Trajektorie für ein erkanntes Verkehrsszenario zu konstruieren und das Fahrzeug entlang der konstruierten Trajektorie zu navigieren.
2 zeigt eine Draufsicht 200 eines veranschaulichenden Verkehrsszenarios, das von einem Trägerfahrzeug angetroffen werden kann oder als Trainingsszenario verwendet werden kann. Die Draufsicht 200 zeigt ein Trägerfahrzeug (HV) 204, das mit 35 Stundenkilometern (km/h) auf einer Mittelspur einer dreispurigen Straße 202 fährt. Die dreispurige Straße 202 beinhaltet eine linke Spur 202a, die mittlere Spur 202b und eine rechte Spur 202c. Das HV 204 befindet sich ganz links auf der Seite. Mehrere entfernte Objekte befinden sich auch auf der Straße 202 und stellen Hindernisse für das Trägerfahrzeug 204 dar, um seinen Bestimmungsort zu erreichen, z. B. den rechten Rand der Seite. Insbesondere befindet sich das Zielfahrzeug 1 (TV1) auf der mittleren Spur 202b und fährt mit Null km/h (stehend), das Zielfahrzeug 2 (TV2) befindet sich im linken Gebiet 202a und fährt mit Null km/h (stehend), und das Zielfahrzeug 3 (TV3) befindet sich auf der rechten Spur 202c und fährt mit 35 km/h.
Das HV 204 kann bei der Navigation auf der dreispurigen Straße 202 verschiedene Trajektorien (T1, T2, T3) berücksichtigen. Die Auswahl der zu berücksichtigenden Trajektorie hängt jedoch von den Verkehrsbedingungen und den Kosten oder Aufwendungen ab, die mit der Traj ektorie für den jeweiligen Verkehrszustand verbunden sind. Ein mit einer Traj ektorie verbundener Kosten- oder Energieaufwand kann auf mehreren Elementen basieren, wie beispielsweise Straßenzustand, Verkehrssituation usw. So kann beispielsweise ein Energieaufwand durch den Spurwechsel oder durch die Notwendigkeit, das Fahrzeug zu lenken, entstehen. Darüber hinaus kann ein Energieaufwand entstehen, wenn eine Trajektorie fortgesetzt wird, die das Trägerfahrzeug 204 mit einem beliebigen Zielfahrzeug in Kontakt bringt oder das Fahrzeug von der Straße fährt.
Zur Veranschaulichung ist zunächst ein Verkehrsszenario zu betrachten, in dem das HV 204 das einzige Fahrzeug auf der Straße ist. Das HV 204 wählt höchstwahrscheinlich die Trajektorie T2 (Fahren entlang der Mittellinie 202b ohne Spurwechsel), da dies die Steuerung des HV 104 verhältnismäßig kostengünstig beaufschlagt, da kein Spurwechsel usw. erforderlich ist. Die Trajektorie T1 beinhaltet den Wechsel auf die linke Spur 202b und verursacht Kosten durch den Spurwechsel. Die Traj ektorie T3 beinhaltet den Wechsel auf die rechte Spur 2023 und verursacht Kosten durch den Spurwechsel. Somit weist die Trajektorie T2 die niedrigsten Kosten auf und ist daher die gewählte Trajektorie.
Bei der Betrachtung des speziell in 2 dargestellten Verkehrsszenarios sind die Fahrzeuge TV1, TV2 und TV3 berücksichtigt. Durch das Fahren entlang der Trajektorie T2 fährt das HV 204 entlang der mittleren Spur 202b, bis es auf TV1 trifft, was ein unerwünschtes Ergebnis ist. Die Kostenberechnungen sind so angesiedelt, dass mit einer Kollision hohe Kosten verbunden sind, wobei die Kosten in einigen Fällen als unendlich eingestuft werden können. Daher sind mit der Trajektorie T2 hohe Kosten verbunden. Andererseits kann das HV 204 durch das Fahren entlang der Trajektorie T1 entlang der mittleren Fahrspur 202b fahren, um TV2 zu passieren, auf die linke Fahrspur 202a wechseln und dann an TV1 vorbeifahren und so erfolgreich durch den Verkehr navigieren. Obwohl Kosten durch Spurwechsel, Beschleunigung, Verzögerung usw. entstehen, fallen keine Kosten durch Kollisionen an. Daher sind die Kosten im Zusammenhang mit der Trajektorie T1 relativ gering. Die Trajektorie T3 scheint eine unerreichbare Trajektorie zu sein, da das HV 104 und TV3 mit der gleichen Geschwindigkeit fahren und verhindern, dass das HV 204 TV3 überholt, um vor TV3 auf die rechte Spur 202c zu wechseln. Somit können mit der Trajektorie T3 auch hohe Kosten verbunden sein. Der Vergleich der Trajektorienkosten bewirkt, dass für dieses Szenario die Trajektorie T1 gewählt wird.
3 zeigt ein schematisches Diagramm 300, das einen Datenfluss zum Trainieren eines neuronalen Netzes in einer Ausführungsform veranschaulicht. Das Diagramm 300 beinhaltet ein Trainingsszenario, mit dem das neuronale Netz trainiert wird. Es ist zu verstehen, dass zum Trainieren von mehreren möglichen Straßen- oder Verkehrsszenarien eine Vielzahl von Trainingsszenarien verwendet werden muss. Die Trainingsszenarien können sich durch Anzahl, Position und Geschwindigkeit der Zielfahrzeuge, Straßenzustand, Straßenkrümmung sowie verschiedene Zustände des Trägerfahrzeugs unterscheiden.
Das Trainingsszenario stellt Eingaben für das Traj ektorienplanungssystem 100 in Form von Daten 304 bereit, wie beispielsweise Zustandsdaten 304a, Straßenszenariendaten 304b, Verhaltensdaten 304c und Objektfusionsdaten 304d. Die Zustandsdaten 304a („HV-Zustände“) beinhalten Parameter des Trägerfahrzeugs, wie beispielsweise Position, Geschwindigkeit, Ausrichtung, Beschleunigung usw. des Trägerfahrzeugs. Straßenszenariendaten 304b stellen Informationen bezüglich der Straßenabschnittsgrenzen und -geometrie, einschließlich Länge, Breite, Anzahl der Fahrspuren, Krümmung usw., sowie eine Standard-Trajektorie bereit. Verhaltensdaten 304c stellen eine dynamische Führung des Trägerfahrzeugs bereit, wie beispielsweise die kinematische Fähigkeit des Trägerfahrzeugs, zu beschleunigen, zu verlangsamen, nach links abzubiegen, nach rechts abzubiegen, in eine linke Spur zu wechseln, in eine rechte Spur zu wechseln usw. Die Objektfusionsdaten 304d beinhalten beispielsweise die Anzahl, Positionen und Geschwindigkeiten der Zielfahrzeuge (TV1, TV2, TV3).
Eine Suchgrafik 306 wird unter Verwendung der Zustandsdaten 304a, der Straßenszenariodaten 304b und der Verhaltensdaten 304c als eine Rasterdarstellung mit verschiedenen Trajektorien für das Trägerfahrzeug 104 zum Durchfahren des Verkehrsszenarios gebildet. Die Suchgrafik 306 wird ohne Berücksichtigung auf das Vorhandensein von Zielfahrzeugen oder anderen Objekten erstellt. Rasterpositionen zeigen mögliche Positionen für das Trägerfahrzeug an, während es sich auf der Straße von einer Startposition des Rasters (allgemein links) zu einer Endposition des Rasters (allgemein rechts) bewegt. Es entstehen Kosten, wenn sich das Trägerfahrzeug entlang von Rasterpunkten bewegt. Jede Bewegung zwischen den Rasterpunkten weist entsprechende Kosten auf, und die Kosten für eine Trajektorie entlang des Rasters sind die Summe der Kosten für jede Bewegung entlang der Rasterpunkte, aus denen die Trajektorie besteht. Zielfahrzeuge können dann der Suchgrafik hinzugefügt werden, sodass die Position und Geschwindigkeit der Zielfahrzeuge zum Ermitteln der Kosten dieser Trajektorien herangezogen werden.
Sobald die Suchgrafik 306 berechnet ist, wird eine Referenztrajektorie 310 des Trägerfahrzeugs 104 bereitgestellt, die während einer gewünschten menschenähnlichen Fahrt oder einer computergestützten Fahrt zum Navigieren durch das Verkehrsszenario gesammelt wurde. Die Referenztrajektorie 310 wird über die Suchgrafik 306 gelegt und eine optimale Trajektorie 312 in der Suchgrafik 306, die der Referenztrajektorie 310 am nächsten liegt, wird bestimmt. Die Kostenfunktionskoeffizienten 308, welche die Gewichtungen für jede Kostenkomponente festlegen, werden dann so ermittelt, dass die Suche in der Grafik 306 mit dieser Kostenfunktion zur optimalen Trajektorie 312 mit minimalem Kostenwert unter allen Kandidatentrajektorien in der Suchgrafik 306 führt. Das Trainieren des neuronalen Netzes wird unter Verwendung der Suchgrafik 306 und der Kostenkoeffizienten 308 implementiert.
In einer Ausführungsform ist die Kostenfunktion zum Auffinden einer optimalen Trajektorie 312 in der Suchgrafik 306 definiert, wobei das Verhältnis zwischen Kostenfunktion und Kostenkomponenten dargestellt ist in Gl. (1): $C_{T r a j e k t o r i e} = \sum_{i} \propto_{i} C_{i}$

wobei C_Trajektorie die Kostenfunktion ist, die jeder Kandidatentrajektorie zugeordnet ist, C_i eine Kostenkomponente ist, die Kosten anzeigt, die einer Trajektorie zugeordnet sind, und α_i ein Koeffizient ist, der der Kostenkomponente ith zugeordnet ist. Die Koeffizienten α_i sind inbegriffen, um die Gewichtung jeder Kostenkomponente in den Gesamtkosten jeder Kandidatentrajektorie zu bestimmen. Das tiefe neuronale Netz wird trainiert, um diese Koeffizienten α_i für verschiedene Straßenszenarien und Verkehrsbedingungen zu lernen. 4 zeigt ein schematisches Diagramm 400 zum Trainieren des tiefen neuronalen Netzes zu einem ausgewählten Verkehrsszenario in einer Ausführungsform. Es werden Protokolldaten 304 bereitgestellt, wie beispielsweise Fahrzeugzustandsdaten 304a, Straßenszenariendaten 304b, Verhaltensdaten 304c und Objektfusionsdaten 304d. Die Protokolldaten werden verwendet, um eine Suchgrafik 306 zu erzeugen. Die protokollierten Fahrzeugzustandsdaten 304a können verwendet werden, um eine gefahrene Referenztrajektorie 310 für das Fahrzeug zu bestimmen. Aus der Suchgrafik 306 und der Referenztrajektorie 310 werden dann die Kostenkoeffizienten 308 ermittelt. Die Suchgrafik 306 und die Kostenkoeffizienten 308 werden dann dem tiefen neuronalen Netz 402 bereitgestellt, um das neuronale Netz 402 für das ausgewählte Verkehrsszenario zu trainieren.
5 stellt ein schematisches Diagramm 500 eines Datenflusses zur Verwendung eines trainierten neuronalen Netzes im Betrieb eines Fahrzeugs dar, um ein Verkehrsmuster in einer Ausführungsform zu steuern. Das Fahrzeug erfasst verschiedene Daten 504, wie beispielsweise die Fahrzeugzustandsdaten 504a, die Straßenszenariodaten 504b, die Verhaltensdaten 504c und die Objektfusionsdaten 504d, während sich das Fahrzeug in einem Verkehrsszenario mit Sensoren am Trägerfahrzeug befindet. Diese Parameter 504 werden zum Bilden einer Suchgrafik 506 bereitgestellt. Die Suchgrafik 506 wird dem trainierten tiefen neuronalen Netz 402 bereitgestellt, das die korrekten Kostenfunktionskoeffizienten 508 ausgibt. Diese Kostenkoeffizienten werden verwendet, um die Grafik 506 zu durchsuchen, und so die optimale Mindestkosten-Trajektorie 508 zu finden. Die optimale Trajektorie 508 wird dann verwendet, um eine sichere und glatte Endtrajektorie 510 zu bestimmen, welche die kinematischen Beschränkungen des Trägerfahrzeugs erfüllt. Die endgültige Trajektorie 510 wird dann der Steuerung bereitgestellt, um das Fahrzeug durch das aktuelle Straßenszenario zu navigieren.
Somit beinhaltet das Navigieren des Fahrzeugs ein Trainingsszenario, das einen Prozessor beinhaltet, der ein Trainingsverkehrsszenario sowie eine Referenztrajektorie empfängt, die zum Navigieren des Trainingsverkehrsszenarios geeignet ist. Der Prozessor ermittelt mehrere Koeffizienten, die einer Kostenfunktion zugeordnet sind. Die Koeffizienten werden in einer Weise bestimmt, die zu einer optimalen Trajektorie mit minimalen Kosten führt, indem die Grafik durchsucht wird, die der Referenztrajektorie entspricht oder ihr nahe kommt. Die ermittelten Koeffizienten- und Suchdiagramme sowie verschiedene Parameter, welche die Suchdiagramme parametrisieren, wie beispielsweise die Kinematik des Fahrzeugs und Objekte entlang des Straßenabschnitts, werden einem tiefen neuronalen Netz zum Trainieren des neuronalen Netzes bereitgestellt. Aus dem trainierten neuronalen Netz wird dann eine Navigationstrajektorie für Echtzeit-Verkehrsszenarien erzeugt. Ein Sensor kann ein Echtzeit-Verkehrsszenario erkennen, für das Echtzeit-Verkehrsszenario geeignete Koeffizienten erzeugen und die Navigationstrajektorie aus den erzeugten Kostenkoeffizienten erzeugen.
6 stellt ein Flussdiagramm 600 dar, das ein Verfahren zum Navigieren eines ausgewählten Verkehrsszenarios gemäß einer Ausführungsform veranschaulicht. Das Verfahren beginnt bei Feld 602 und geht weiter zu Feld 604, wobei Sensoren am Fahrzeug verwendet werden, um Eingaben wie Umgebungsbedingungen des Fahrzeugs, wie Straßenparameter und Verkehrsszenarien, wie die Position der Fremdobjekte und Fahrzeuge, deren Reichweite, Azimut und Relativgeschwindigkeit zu erhalten. In Feld 606 überprüft der Prozessor die Eingaben, um zu ermitteln, ob sie gültig sind. Wenn die Eingaben nicht gültig sind, kehrt der Prozess zu Feld 604 zurück, um neue Eingaben zu erhalten. Wenn die Eingaben als gültig angesehen werden, fährt das Verfahren mit Feld 608 fort. In Feld 608 wird eine Suchgrafik erzeugt. In Feld 610 ermittelt das Verfahren, ob die Suchgrafik eine gültige Suchgrafik ist. Wenn die Suchgrafik nicht gültig ist, kehrt das Verfahren zurück, um Eingaben in Feld 604 zu erhalten. Wenn die Suchgrafik gültig ist, fährt das Verfahren mit Feld 612 fort, in dem das neuronale Netz die Kostenfunktionskoeffizienten berechnet. In Feld 614 ermittelt das Verfahren, ob die Koeffizienten gültig sind oder nicht. Wenn die Koeffizienten nicht gültig sind, kehrt das Verfahren zu Feld 604 zurück, um neue Eingaben zu erhalten. Wenn die Koeffizienten gültig sind, fährt das Verfahren mit Feld 616 fort. In Feld 616 wird die Grafik durchsucht, um einen optimalen Weg zu finden. In Feld 618 wird ermittelt, ob der optimale Weg gültig ist oder nicht. Wenn der optimale Weg nicht gültig ist, kehrt das Verfahren zu Feld 604 zurück, um neue Eingaben zu erhalten. Wenn der optimale Weg gültig ist, fährt das Verfahren mit Feld 620 fort. In Feld 620 wird der optimale Weg geglättet, um eine geglättete Trajektorie über die Straße zu bilden. Die geglättete Trajektorie ist ein Weg innerhalb des Sicherheitskorridors mit minimaler Krümmung und Krümmungsrate. Die geglättete Trajektorie vermeidet unter anderem übermäßige Querbeschleunigung oder Ruckeln während der Fahrt. In Feld 622 erzeugt das Verfahren aus der geglätteten Trajektorie eine lokale Trajektorie. Die lokale Trajektorie unterscheidet sich von der geglätteten dadurch, dass sie kinematische Beschränkungen, wie Kontinuität in Position, Kurs, Krümmung und Geschwindigkeit für das Trägerfahrzeug erfüllt. In Feld 624 wird ermittelt, ob die lokale Trajektorie sicher und realisierbar ist oder nicht. Wenn ermittelt wird, dass die lokale Trajektorie nicht sicher oder nicht durchführbar ist, kehrt das Verfahren zu Feld 604 zurück. Wenn ermittelt wird, dass die lokale Trajektorie sicher und durchführbar ist, wird die Trajektorie an die Steuerung in Feld 626 gesendet, um das Fahrzeug mit der lokalen Trajektorie zu steuern.
Während die obige Offenbarung mit Bezug auf exemplarische Ausführungsformen beschrieben wurde, werden Fachleute verstehen, dass unterschiedliche Änderungen vorgenommen und die einzelnen Teile durch entsprechende andere Teile ausgetauscht werden können, ohne vom Umfang der Offenbarung abzuweichen. Darüber hinaus können viele Modifikationen vorgenommen werden, um eine bestimmte Materialsituation an die Lehren der Offenbarung anzupassen, ohne von deren wesentlichem Umfang abzuweichen. Daher ist vorgesehen, dass die Erfindung nicht auf die offenbarten speziellen Ausführungsformen eingeschränkt sein soll, sondern dass sie auch alle Ausführungsformen beinhaltet, die innerhalb des Umfangs der Anmeldung fallen.

Claims

Verfahren zum autonomen Navigieren eines Fahrzeugs, Folgendes umfassend: Empfangen einer Referenztrajektorie zum Navigieren eines Trainingsverkehrsszenarios entlang eines Straßenabschnitts an einem Prozessor; Bestimmen eines Koeffizienten für eine Kostenfunktion, die einer Kandidatentrajektorie zugeordnet ist, welche die Referenztrajektorie simuliert, an einem Prozessor; das Bereitstellen des ermittelten Koeffizienten zu einem neuronalen Netz, um das neuronale Netz zu trainieren; Erzeugen einer Navigationstrajektorie zum Navigieren des Fahrzeugs unter Verwendung eines geeigneten Kostenkoeffizienten, der durch das neuronale Netz bestimmt wird; und Navigieren des Fahrzeugs entlang des Straßenabschnitts unter Verwendung der Navigationstraj ektorie.
Verfahren nach Anspruch 1, ferner umfassend das Darstellen des Straßenabschnitts über eine Suchgrafik, worin die Kandidatentrajektorie auf die Suchgrafik beschränkt ist, und das Trainieren des neuronalen Netzes unter Verwendung der Suchgrafik.
Verfahren nach Anspruch 1, worin das Bestimmen des Koeffizienten ferner das Bestimmen der Kosten, die der Referenztrajektorie zugeordnet sind, und das Bestimmen des Koeffizienten, für den die Kostenfunktion, die der Kandidatentrajektorie zugeordnet ist, einen Kostenwert ausgibt, der innerhalb eines ausgewählten Kriteriums der Kosten liegt, die der Referenztrajektorie zugeordnet sind.
Verfahren nach Anspruch 1, ferner umfassend das Bestimmen des Koeffizienten der Kostenfunktion, der eine optimale Trajektorie mit minimalen Kosten bereitstellt, die der Referenztrajektorie nahe kommt.
Autonomes Fahrzeug, umfassend: einen Prozessor, konfiguriert zum: Empfangen einer Referenztrajektorie zum Navigieren eines Trainingsverkehrsszenarios entlang eines Straßenabschnitts; Bestimmen eines Koeffizienten für eine Kostenfunktion, die einer Kandidatentrajektorie zugeordnet ist, welche die Referenztrajektorie simuliert; Bereitstellen des bestimmten Koeffizienten an ein neuronales Netz zum Trainieren des neuronalen Netzes; Erzeugen einer Navigationstrajektorie zum Navigieren des Fahrzeugs unter Verwendung geeigneter Kostenkoeffizienten, der durch das trainierte neuronale Netz bestimmt wird; und Navigieren des Fahrzeugs entlang des Straßenabschnitts unter Verwendung der Navigationstraj ektorie.
Verfahren nach Anspruch 5, worin der Prozessor ferner konfiguriert ist, um den Straßenabschnitt über eine Suchgrafik darzustellen, wobei die Kandidatentrajektorie auf die Suchgrafik beschränkt ist, und um das neuronale Netz unter Verwendung der Suchgrafik zu trainieren.
Fahrzeug nach Anspruch 5, worin die der Kandidatentrajektorie zugeordnete Kostenfunktion von Objekten im Verkehrsszenario abhängig ist.
Fahrzeug nach Anspruch 5, worin der Prozessor ferner konfiguriert ist, um den Koeffizienten zu bestimmen, bei welchem die der Kandidatentrajektorie zugeordneten Kosten innerhalb eines ausgewählten Kriteriums einer der Referenztrajektorie zugeordneten Kosten liegen.
Fahrzeug nach Anspruch 5, worin der Prozessor ferner konfiguriert ist, um die Koeffizienten der Kostenfunktion zu ermitteln, die eine minimale kostenoptimale Traj ektorie bereitstellt, die der Referenztrajektorie angenähert ist, und das neuronale Netz unter Verwendung der bestimmten Koeffizienten trainiert.
Fahrzeug nach Anspruch 5, ferner umfassend einen Sensor, der einen Zustand des Fahrzeugs und ein Echtzeit-Verkehrsszenario mit dem Fahrzeug erfasst, worin das neuronale Netz ferner konfiguriert ist, um Kostenkoeffizienten zu erzeugen, die für das erfasste Echtzeit-Verkehrsszenario geeignet sind, und die Navigationstrajektorie aus den erzeugten Kostenkoeffizienten erzeugt.