-
Die Erfindung betrifft ein Verfahren und eine entsprechende Vorrichtung zur Auswahl eines Fahrmanövers für die automatisierte Quer- und/oder Längsführung eines Fahrzeugs.
-
Fahrzeuge (insbesondere Straßenkraftfahrzeuge) weisen verstärkt teil- oder hochautomatisierte Fahrfunktionen auf. Ein zentraler Aspekt einer teil- oder hochautomatisierten Fahrfunktion ist die Planung einer möglichst optimalen Trajektorie des Fahrzeugs, durch die Kollisionen mit anderen Verkehrsteilnehmern vermieden werden, durch die ein möglichst hoher Fahrkomfort ermöglicht wird und/oder die es ermöglichen, möglichst schnell einen bestimmten Zielzustand zu erreichen.
-
Für ein komplexes Fahrmanöver eines Fahrzeugs ist es typischerweise nicht möglich, eine detaillierte Trajektorie zu planen, die das Fahrzeug von einem aktuellen Anfangszustand in einen gewünschten Zielzustand überführt. In einer beispielhaften Fahrsituation kann sich das Fahrzeug auf einer Autobahn hinter einem relativ langsam fahrenden Vorderfahrzeug befinden (was dem Anfangszustand des Fahrzeugs entspricht). Das Fahrzeug möchte an einer vorausliegenden Ausfahrt von der Autobahn abfahren (was dem Zielzustand des Fahrzeugs entspricht). Ihm Rahmen der Manöverplanung ist zu ermitteln, ob es sich für das Fahrzeug lohnt, das langsam fahrende Vorderfahrzeug zu überholen (was einem ersten möglichen Fahrmanöver entspricht) oder ob es im Sinne einer bestimmten Kostenfunktion vorteilhaft ist, bis zur Ausfahrt hinter dem langsam fahrenden Vorderfahrzeug herzufahren (was einem zweiten möglichen Fahrmanöver entspricht). Aufgrund der Tatsache, dass dem Fahrzeug typischerweise keine Sensordaten für den gesamten Verlauf der möglichen Fahrmanöver zur Verfügung stehen, ist es typischerweise nicht möglich, die möglichen Fahrmanöver in Detail zu planen. Meist können nur die ersten Sekunden (z.B. 5 Sekunden) eines Fahrmanövers zuverlässig geplant werden. Des Weiteren ist die Planung von relativ langen Fahrmanövern typischerweise mit einem relativ hohen Rechenaufwand verbunden (und somit ggf. mit den vorhandenen Rechenressourcen eines Fahrzeugs nicht durchführbar).
-
Das vorliegende Dokument befasst sich mit der technischen Aufgabe, auch für komplexe und/oder langwierige Fahrmanöver in zuverlässiger, effizienter und präziser Weise automatisierte Fahrentscheidungen zu ermöglichen.
-
Die Aufgabe wird durch jeweils durch die unabhängigen Ansprüche gelöst. Vorteilhafte Ausführungsformen werden u.a. in den abhängigen Ansprüchen beschrieben. Es wird darauf hingewiesen, dass zusätzliche Merkmale eines von einem unabhängigen Patentanspruch abhängigen Patentanspruchs ohne die Merkmale des unabhängigen Patentanspruchs oder nur in Kombination mit einer Teilmenge der Merkmale des unabhängigen Patentanspruchs eine eigene und von der Kombination sämtlicher Merkmale des unabhängigen Patentanspruchs unabhängige Erfindung bilden können, die zum Gegenstand eines unabhängigen Anspruchs, einer Teilungsanmeldung oder einer Nachanmeldung gemacht werden kann. Dies gilt in gleicher Weise für in der Beschreibung beschriebene technische Lehren, die eine von den Merkmalen der unabhängigen Patentansprüche unabhängige Erfindung bilden können.
-
Gemäß einem Aspekt wird ein Verfahren zur Auswahl eines möglichen Fahrmanövers für ein Fahrzeug beschrieben. Das Verfahren umfasst das Ermitteln einer Mehrzahl von möglichen Fahrmanövern, um ein Fahrzeug von einem Anfangszustand in einen Zielzustand zu überführen. Dabei kann ein mögliches Fahrmanöver z.B. umfassen: ein oder mehrere Spurwechsel des Fahrzeugs auf einer mehrspurigen Fahrbahn; einen Überholvorgang des Fahrzeugs; und/oder eine Geschwindigkeitsänderung des Fahrzeugs innerhalb einer Fahrspur. Die unterschiedlichen möglichen Fahrmanöver können sich z.B. zumindest teilweise in der jeweiligen Anzahl von Spurwechseln unterscheiden. Die unterschiedlichen Fahrmanöver können auf Basis von Sensordaten von ein oder mehreren Umfeldsensoren ermittelt werden. Des Weiteren kann digitale Karteninformation in Bezug auf einen Verlauf der von dem Fahrzeug befahrenen Fahrbahn und/oder in Bezug auf ein Straßennetz bei der Ermittlung der unterschiedlichen Fahrmanöver berücksichtigt werden.
-
Außerdem umfasst das Verfahren das Planen, für jedes der Mehrzahl von Fahrmanövern, einer Teil-Trajektorie, durch die das Fahrzeug von dem Anfangszustand in einen jeweiligen Zwischenzustand überführt werden kann. Die Zwischenzustände können dabei für die unterschiedlichen Fahrmanöver zumindest teilweise unterschiedlich sein. Des Weiteren kann das Verfahren umfassen, das Ermitteln, für jede der Mehrzahl von Teil-Trajektorien, eines mit der jeweiligen Teil-Trajektorie assoziierten Teil-Kostenwertes.
-
Dabei können die Teil-Trajektorien und die assoziierten Teil-Kostenwerte modell-basiert ermittelt werden. Insbesondere kann ein Zustandsmodell des Fahrzeugs verwendet werden, um die Teil-Trajektorien zu ermitteln. Der Anfangszustand des Fahrzeugs kann z.B. Anfangswerte für eine Vielzahl von Zustandsgrößen des Fahrzeugs umfassen. Die Vielzahl von Zustandsgrößen können eine Position x
1(k) des Fahrzeugs, eine Geschwindigkeit ẋ
1(k) des Fahrzeugs, eine Beschleunigung ẍ
1(k) des Fahrzeugs und/oder einen Ruck
des Fahrzeugs umfassen. Der Anfangszustand kann auf Basis von Sensordaten von ein oder mehreren Sensoren des Fahrzeugs ermittelt werden.
-
Das Planen einer Teil-Trajektorie für ein mögliches Fahrmanöver kann umfassen, das Ermitteln eines Zwischenzustands für das mögliche Fahrmanöver. Dabei kann der Zwischenzustand Werte für ein oder mehrere der Vielzahl von Zustandsgrößen des Fahrzeugs umfassen. Beispielsweise kann der Zwischenzustand eine Position des Fahrzeugs auf einer benachbarten Fahrspur anzeigen, wenn das mögliche Fahrmanöver einen Spurwechsel umfasst.
-
Des Weiteren kann das Planen einer Teil-Trajektorie für ein mögliches Fahrmanöver umfassen, das Bestimmen, als Teil-Trajektorie für das mögliche Fahrmanöver, einer zeitlichen Sequenz von Werten der Vielzahl von Zustandsgrößen, die den Anfangszustand in den Zwischenzustand des möglichen Fahrmanövers überführt. Dabei kann die zeitliche Sequenz von Werten der Vielzahl von Zustandsgrößen in Abhängigkeit von einem Zustandsmodell des Fahrzeugs ermittelt werden. So kann in präziser und zuverlässiger Weise eine Teil-Trajektorie für ein Fahrmanöver geplant werden, die durch das Fahrzeug umgesetzt werden kann.
-
Insbesondere können im Rahmen der Planung einer Teil-Trajektorie für ein mögliches Fahrmanöver eine Vielzahl von Trajektorienkandidaten ermittelt werden, mit denen das Fahrzeug von dem Anfangszustand in den Zwischenzustand des möglichen Fahrmanövers überführt werden kann. Des Weiteren können für jeden der Vielzahl von Trajektorienkandidaten Werte einer Kostenfunktion ermittelt werden. Es kann dann in Abhängigkeit von den Werten der Kostenfunktion der Vielzahl von Trajektorienkandidaten ein Trajektorienkandidaten als Teil-Trajektorie für das mögliche Fahrmanöver ausgewählt werden. Des Weiteren kann der Teil-Kostenwert für die geplante Teil-Trajektorie des möglichen Fahrmanövers auf Basis des Wertes der Kostenfunktion für der ausgewählten Trajektorienkandidaten ermittelt werden. Insbesondere kann der Wert der Kostenfunktion für den ausgewählten Trajektorienkandidaten als Teil-Kostenwert für die geplante Teil-Trajektorie verwendet werden. So können in besonders präziser Weise Teil-Trajektorien und assoziierte Teil-Kostenwerte ermittelt werden.
-
Außerdem umfasst das Verfahren das Ermitteln, für jedes der Mehrzahl von Fahrmanövern, eines Rest-Kostenwertes für eine Rest-Trajektorie, durch die das Fahrzeug von dem jeweiligen Zwischenzustand in den Zielzustand überführt werden kann. Dabei können die Rest-Kostenwerte (ggf. allein) auf Basis von Kostendaten, insbesondere auf Basis von angelernten bzw. auf Erfahrung basierenden Kostendaten, ermittelt werden. Für den Rest eines möglichen Fahrmanövers (ausgehend von dem geplanten Zwischenzustand) kann somit auf eine modell-basierte Planung einer Rest-Trajektorie verzichtet werden. Vielmehr können die Rest-Kostenwerte für den Rest eines möglichen Fahrmanövers auf Basis von Erfahrungswerten in Bezug auf die Kostenwerte von Rest-Trajektorien ermittelt werden. Zu diesem Zweck können die Kostendaten auf Basis von tatsächlich mit einem Fahrzeug gefahrenen Trajektorien ermittelt worden sein. Beispielsweise können die Kostendaten mittels einer Maschine-Lern-Methode angelernt worden sein. In einem bevorzugten Beispiel wurden bzw. werden die Kostendaten mittels einer Reinforcement-Learning-Methode ermittelt. Alternativ oder ergänzend können die Kostendaten auf Basis eines neuronalen Netzwerks ermittelt werden.
-
Wie oben dargelegt, kann bei der Ermittlung der Rest-Kostenwerte für die Rest-Trajektorien der unterschiedlichen möglichen Fahrmanöver auf eine (modell-basierte) Planung der Rest-Trajektorien verzichtet werden. Insbesondere kann die Ermittlung der Rest-Kostenwerte für die Rest-Trajektorien ohne Kenntnis der jeweiligen Rest-Trajektorien erfolgen. Es kann somit auf die Ermittlung einer zeitlichen Sequenz von Zustandsvektoren des Fahrzeugs, durch die das Fahrzeug von dem Zwischenzustand in den Zielzustand überführt wird, verzichtet werden.
-
Vielmehr kann eine Rest-Trajektorie (ggf. allein bzw. ausschließlich) durch ein oder mehrere Trajektorienparameter beschrieben werden. Der Rest-Kostenwert für eine Rest-Trajektorie kann dann (ggf. allein bzw. ausschließlich) auf Basis der Parameterwerte der ein oder mehreren Trajektorienparameter ermittelt werden, durch die die Rest-Trajektorie beschrieben wird.
-
Beispielhafte Trajektorienparameter sind dabei: die Anzahl von Fahrspuren, die zwischen dem Zwischenzustand und dem Zielzustand überquert werden müssen; die (Längs-) Geschwindigkeit des Fahrzeugs in dem Zwischenzustand; die örtliche Distanz, insbesondere die Distanz in Längsrichtung des Fahrzeugs, zwischen dem Zwischenzustand und dem Zielzustand; und/oder die maximal zulässige Geschwindigkeit auf der von dem Fahrzeug befahrenen Fahrbahn; und/oder der aktuelle Verkehrsfluss auf der von dem Fahrzeug befahrenen Fahrbahn; und/oder die aktuelle Geschwindigkeit, insbesondere die Durchschnittsgeschwindigkeit, auf Fahrspuren, insbesondere auf ein oder mehreren benachbarten Fahrspuren, der von dem Fahrzeug befahrenen Fahrbahn.
-
Die Kostendaten können dann für unterschiedliche Parameterwerte der ein oder mehreren Trajektorienparameter, insbesondere für unterschiedliche Kombinationen von Parameterwerten der ein oder mehreren Trajektorienparameter, jeweils einen Rest-Kostenwert anzeigen. So können in präziser und effizienter Weise, auf Basis von Erfahrungswerten, Rest-Kostenwerte für die Rest-Trajektorien der unterschiedlichen möglichen Fahrmanöver ermittelt werden.
-
Die Kostendaten können beispielsweise durch ein neuronales Netzwerk berechnet bzw. bereitgestellt werden, wobei das neuronale Netzwerk eingerichtet ist, einer Kombination von Parameterwerten einen Rest-Kostenwert zuzuweisen. Die Kostendaten können alternativ oder ergänzend in einer Tabelle bereitgestellt werden. Alternativ oder ergänzend können die Kostendaten mittels ein oder mehrerer Regeln, z.B. mittels ein oder mehrerer mathematischer Formeln, bereitgestellt werden.
-
Wie oben dargelegt, können die Kostendaten auf Basis von konkreten Erfahrungen während des Betriebs des Fahrzeugs und/oder während des Betriebs von ein oder mehreren anderen Fahrzeugen angelernt werden. Die gelernten Kostendaten können auf Basis der Interaktion eines Fahrzeugs mit der Umgebung aktualisiert werden (z.B. mittels Reinforcement Learning). Dabei können bereits angelernte Werte immer weiter angelernt bzw. immer weiter upgedatet werden,
-
Zum Anlernen und/oder Updaten der Kostendaten können beispielsweise Trainingsdaten bereitgestellt werden. Die Trainingsdaten können eine Vielzahl von Trainings-Datensätzen umfassen. Dabei kann ein Trainings-Datensatz eine bestimmte Kombination von Parameterwerten der ein oder mehreren Trajektorienparametern sowie einen konkreten Rest-Kostenwert umfassen, der sich für ein konkretes Fahrmanöver bei Vorliegen der bestimmten Kombination von Parameterwerten der ein oder mehreren Trajektorienparametern ergeben hat.
-
Außerdem umfasst das Verfahren das Auswählen eines der Mehrzahl von möglichen Fahrmanövern auf Basis der Teil-Kostenwerte und der Rest-Kostenwerte für die Mehrzahl von möglichen Fahrmanövern. Insbesondere kann für jedes der Mehrzahl von möglichen Fahrmanövern, eine (ggf. gewichte) Summe des jeweiligen Teil-Kostenwertes und des jeweiligen Rest-Kostenwertes ermittelt werden. Es kann dann ein mögliches Fahrmanöver auf Basis der (ggf. gewichteten) Summen für die Vielzahl von möglichen Fahrmanövern ausgewählt werden, insbesondere als das mögliche Fahrmanöver aus der Mehrzahl von möglichen Fahrmanövern mit der höchsten oder der niedrigsten (ggf. gewichteten) Summe.
-
Das Verfahren ermöglicht es somit, die Genauigkeit der modell-basierten Trajektorienplanung mit Erfahrungswerten aus gefahrenen Trajektorien zu verknüpfen, um in effizienter, zuverlässiger und präziser Weise Fahrmanöver für ein zumindest teilweise autonom fahrendes Fahrzeug auszuwählen. Dabei kann in Abhängigkeit von einem ausgewählten möglichen Fahrmanöver, insbesondere auf Basis der für ein ausgewähltes mögliches Fahrmanöver geplanten Teil-Trajektorie, ein zumindest teilweise automatisiertes (Längs- und/oder Quer-) Führen des Fahrzeugs erfolgen.
-
Ein mögliches Fahrmanöver kann sich über einen derart langen Zeitraum und/oder über eine derart lange Distanz erstrecken, dass ausgehend von dem Anfangszustand des Fahrzeugs nur für einen anfänglichen Teil des möglichen Fahrmanövers Sensordaten von ein oder mehreren Umfeldsensoren des Fahrzeugs erfasst werden können. Dabei kann die Teil-Trajektorie eines möglichen Fahrmanövers auf einen Bereich begrenzt sein, für den die ein oder mehreren Umfeldsensoren des Fahrzeugs Sensordaten bereitstellen können. Alternativ oder ergänzend kann sich dabei die Teil-Trajektorie eines möglichen Fahrmanövers über den gesamten Bereich erstrecken, für den die ein oder mehreren Umfeldsensoren des Fahrzeugs Sensordaten bereitstellen können. Es können somit in zuverlässiger Weise relativ lange und/oder komplexe Fahrmanöver betrachtet werden.
-
Der Teil-Kostenwert einer Teil-Trajektorie und/oder der Rest-Kostenwert einer Rest-Trajektorie können (jeweils) von einer Kostenfunktion abhängen. Dabei kann die Kostenfunktion umfassen: einen Term in Bezug auf den Komfort der jeweiligen Trajektorie (für einen Insassen des Fahrzeugs); einen Term in Bezug auf die Sicherheit der jeweiligen Trajektorie (z.B. in Bezug auf eine mögliche Kollision des Fahrzeugs mit einem anderen Verkehrsteilnehmer); einen Term in Bezug auf die Güte, mit der der (geplante) Zwischenzustand bzw. der Zielzustand erreicht werden; und/oder einen Term, der von der Abweichung zwischen der Geschwindigkeit des Fahrzeugs und der maximal zulässigen Geschwindigkeit abhängt. Durch die Berücksichtigung einer Kostenfunktion mit ein oder mehreren Termen können ausgewogene Teil-Trajektorien geplant und/oder ausgewogene Fahrmanöver ausgewählt werden.
-
Das Verfahren kann an einer Sequenz von aufeinanderfolgenden Zeitpunkten wiederholt werden (z.B. mit einer bestimmten Wiederholfrequenz, etwa 1Hz, 10Hz oder mehr). Alternativ oder ergänzend kann das Verfahren ggf. nur dann ausgeführt werden, wenn ermittelt wird, dass mehrere mögliche Fahrmanöver zur Auswahl stehen.
-
Wie bereits oben dargelegt, überführt ein mögliches Fahrmanöver ein Fahrzeug von einem Anfangszustand über einen Zwischenzustand in einen Zielzustand. Dabei kann der Anfangszustand durch Werte von mehreren der o.g. Zustandsgrößen des Fahrzeugs beschrieben werden. Des Weiteren kann der Zwischenzustand durch Werte von (insbesondere den gleichen) mehreren Zustandsgrößen des Fahrzeugs beschrieben werden. Der zeitliche Verlauf des Übergangs der Zustandsgrößen von dem Anfangszustand in den Zwischenzustand kann durch die geplante Teil-Trajektorie des möglichen Fahrmanövers beschrieben werden (mit einer bestimmten Abtastrate). Beispielsweise kann die geplante Teil-Trajektorie Werte der mehreren Zustandsgrößen an verschiedenen Abtastzeitpunkten zwischen dem Anfangszustand und dem Zwischenzustand anzeigen. Die Abtastzeitpunkte können z.B. einen zeitlichen Abstand von 1 Sekunde, 100ms, 10ms oder weniger aufweisen.
-
Der Zielzustand kann durch Werte von ein oder mehreren Zustandsgrößen (ggf. nur durch die Position) des Fahrzeugs beschrieben werden. Dabei erfolgt keine Planung des zeitlichen Verlaufs des Übergangs der ein oder mehreren Zustandsgrößen von dem Zwischenzustand in den Zielzustand. Vielmehr wird eine zu absolvierende Rest-Trajektorie (ggf. allein bzw. ausschließlich) durch Parameterwerte von ein oder mehreren Trajektorienparametern beschrieben. Die ein oder mehreren Trajektorienparameter können die Fahraufgabe beschreiben, die von dem Fahrzeug im Rahmen der zu absolvierenden Rest-Trajektorie zu bewältigen ist. Dabei zeigen die ein oder mehreren Trajektorienparameter jedoch keine zeitliche Sequenz von Werten der ein oder mehreren Zustandsgrößen an, die das Fahrzeug bei dem Übergang von dem Zwischenzustand in den Zielzustand aufweist.
-
Gemäß einem weiteren Aspekt wird eine Vorrichtung (z.B. ein Steuergerät) für ein Fahrzeug beschrieben. Die Vorrichtung ist eingerichtet, eine Mehrzahl von möglichen Fahrmanövern zu ermitteln, um ein Fahrzeug von einem Anfangszustand in einen Zielzustand zu überführen. Außerdem ist die Vorrichtung eingerichtet, für jedes der Mehrzahl von Fahrmanövern eine Teil-Trajektorie zu planen, durch die das Fahrzeug von dem Anfangszustand in einen jeweiligen Zwischenzustand überführt werden kann. Des Weiteren ist die Vorrichtung eingerichtet, für jede der Mehrzahl von Teil-Trajektorien einen mit der jeweiligen Teil-Trajektorie assoziierten Teil-Kostenwert zu ermitteln. Ferner ist die Vorrichtung eingerichtet, für jedes der Mehrzahl von Fahrmanövern einen Rest-Kostenwert für eine Rest-Trajektorie zu ermitteln, durch die das Fahrzeug von dem jeweiligen Zwischenzustand in den Zielzustand überführt werden kann. Dabei können die Rest-Kostenwerte auf Basis von (angelernten und/oder auf Erfahrung basierenden) Kostendaten ermittelt werden. Insbesondere kann eine Rest-Trajektorie durch Parameterwerte von ein oder mehreren Trajektorienparametern beschrieben werden. Der Rest-Kostenwert für eine Rest-Trajektorie kann dann auf Basis der Parameterwerte der ein oder mehreren Trajektorienparameter ermittelt werden, durch die die Rest-Trajektorie beschrieben wird.
-
Außerdem ist die Vorrichtung eingerichtet, eines der Mehrzahl von möglichen Fahrmanövern auf Basis der Teil-Kostenwerte und der Rest-Kostenwerte für die Mehrzahl von möglichen Fahrmanövern auszuwählen.
-
Gemäß einem weiteren Aspekt wird ein Straßenkraftfahrzeug (insbesondere ein Personenkraftwagen oder ein Lastkraftwagen oder ein Bus) beschrieben, das die in diesem Dokument beschriebene Vorrichtung umfasst.
-
Gemäß einem weiteren Aspekt wird ein Software (SW) Programm beschrieben. Das SW Programm kann eingerichtet werden, um auf einem Prozessor (z.B. auf einem Steuergerät eines Fahrzeugs) ausgeführt zu werden, und um dadurch eines der in diesem Dokument beschriebenen Verfahren auszuführen.
-
Gemäß einem weiteren Aspekt wird ein Speichermedium beschrieben. Das Speichermedium kann ein SW Programm umfassen, welches eingerichtet ist, um auf einem Prozessor ausgeführt zu werden, und um dadurch eines der in diesem Dokument beschriebenen Verfahren auszuführen.
-
Es ist zu beachten, dass die in diesem Dokument beschriebenen Verfahren, Vorrichtungen und Systeme sowohl alleine, als auch in Kombination mit anderen in diesem Dokument beschriebenen Verfahren, Vorrichtungen und Systemen verwendet werden können. Des Weiteren können jegliche Aspekte der in diesem Dokument beschriebenen Verfahren, Vorrichtungen und Systemen in vielfältiger Weise miteinander kombiniert werden. Insbesondere können die Merkmale der Ansprüche in vielfältiger Weise miteinander kombiniert werden.
-
Im Weiteren wird die Erfindung anhand von Ausführungsbeispielen näher beschrieben. Dabei zeigen
- 1a eine beispielhafte Verkehrssituation mit (Gesamt-) Trajektorien für unterschiedliche mögliche Fahrmanöver;
- 1b eine beispielhafte Verkehrssituation mit einer Teil-Trajektorie für ein mögliches Fahrmanöver;
- 2 ein Ablaufdiagramm eines beispielhaften Verfahrens zur Ermittlung einer Teil-Trajektorie;
- 3 eine beispielhafte Transformation in ein Koordinatensystem relativ zu einer Referenzlinie eines Fahrzeugs; und
- 4 ein Ablaufdiagramm eines beispielhaften Verfahrens zur Auswahl eines möglichen Fahrmanövers aus einer Mehrzahl von möglichen Fahrmanövern.
-
Wie eingangs dargelegt, befasst sich das vorliegende Dokument mit der technischen Aufgabe, in effizienter und präziser Weise optimierte Entscheidungen in Bezug auf mögliche Fahrmanöver zu treffen, um eine sichere, automatisierte Längs- und/oder Querführung für ein Fahrzeug (welches auch als Ego-Fahrzeug bezeichnet wird) zu ermöglichen. In diesem Zusammenhang zeigt 1a eine beispielhafte Verkehrssituation. Das Ego-Fahrzeug 100 fährt auf einer mehrspurigen Fahrbahn 110 (z.B. auf einer Autobahn). Ein Fahrzeug 101 auf der gleichen Fahrspur 111 der Fahrbahn 110 vor dem Ego-Fahrzeug 100 (d.h. ein Fahrzeug 101 auf der Ego-Fahrspur 111) kann ggf. eine relativ geringe Fahrgeschwindigkeit aufweisen. Das Ego-Fahrzeug 100 hat das langfristige Ziel, auf einer vorausliegenden Abfahrtsspur 113 von der Autobahn 110 abzufahren.
-
Das Ego-Fahrzeug 100 weist somit einen aktuellen Anfangszustand 131 auf und möchte am Ende eines Fahrmanövers einen bestimmten Zielzustand 132 aufweisen. Ein Zustand 131, 132 kann dabei durch einen Zustandsvektor beschrieben werden, der z.B. in Bezug auf die Querführung den Querversatz bzw. die Position quer zu der Fahrbahn 110 bzw. die Fahrspur 111, 112, 113 umfasst. In Bezug auf die Längsführung kann der Zustandsvektor die Position des Fahrzeugs 100 auf der Längsachse der Fahrbahn 110 umfassen. Weitere mögliche Elemente eines Zustandsvektors sind die (Quer- und/oder Längs-) Geschwindigkeit, die (Quer- und/oder Längs-) Beschleunigung, etc.
-
Für die in 1a dargestellte Fahrsituation besteht für das Ego-Fahrzeug 100 die Möglichkeit, auf die zweite Fahrspur 112 zu wechseln, um das Vorderfahrzeug 101 zu überholen. Dabei ist eine Kollision mit anderen Fahrzeugen 102, 103 zu vermeiden. Anschließend muss das Ego-Fahrzeug 100 wieder auf die erste Fahrspur 111 und schließlich auf die Abfahrtsspur 113 wechseln. 1a zeigt die mit diesem ersten möglichen Fahrmanöver assoziierte erste mögliche Trajektorie 121. Des Weiteren besteht für das Ego-Fahrzeug 100 die Möglichkeit, auf der ersten Fahrspur 111 hinter dem Vorderfahrzeug 101 zu verbleiben, und dann auf die Abfahrspur 113 zu wechseln. 1a zeigt die mit diesem zweiten möglichen Fahrmanöver assoziierte zweite mögliche Trajektorie 122.
-
Die Trajektorien 121, 122 für die unterschiedlichen Fahrmanöver können sich über einen relativ langen Zeitraum und/oder über eine relativ lange Distanz erstrecken, so dass es typischerweise nicht möglich ist, die Trajektorien 121, 122 im Detail zu planen. Insbesondere stehen typischerweise keine Sensordaten von Umfeldsensoren des Ego-Fahrzeugs 100 für den gesamten Bereich der Trajektorien 121, 122 der möglichen Fahrmanöver zur Verfügung. Dennoch sollte es einem zumindest teilweise automatisiert fahrenden Fahrzeug 100 ermöglicht werden, eine optimierte Entscheidung in Bezug auf eines der möglichen Fahrmanöver zu treffen.
-
Um unterschiedliche mögliche Fahrmanöver zuverlässig bewerten zu können, kann die Trajektorie 121, 122 eines Fahrmanövers in eine Teil-Trajektorie und in eine Rest-Trajektorie unterteilt werden. Die Teil-Trajektorie führt das Fahrzeug 100 von dem Anfangszustand 131 zu einem Zwischenzustand und kann im Detail mittels einer Trajektorienplanungs-Methode geplant werden. Des Weiteren kann ein Teil-Kostenwert einer Kostenfunktion für die Teil-Trajektorie ermittelt werden. Die Rest-Trajektorie führt das Fahrzeug 100 ausgehend von dem Zwischenzustand zu dem Zielzustand 132. Die Rest-Trajektorie kann typischerweise nicht im Detail geplant werden. Es kann jedoch anhand von Kostendaten, die auf Erfahrungswerten basieren, ein Rest-Kostenwert für die Rest-Trajektorie ermittelt werden. Die Kostendaten können z.B. mittels einer Methode für maschinelles Lernen (z.B. mittels bestärkendem Lernen oder verstärkenden Lernen (englisch, reinforcement leaming)) ermittelt werden.
-
So können für jedes mögliche Fahrmanöver ein oder mehrere Teil-Trajektorien geplant sowie Teil-Kosten und Rest-Kosten ermittelt werden. Auf Basis der Teil-Kosten und der Rest-Kosten der unterschiedlichen möglichen Fahrmanöver kann dann eines der möglichen Fahrmanöver selektiert werden. Insbesondere kann das mögliche Fahrmanöver ausgewählt werden, durch das die jeweilige (ggf. gewichtete) Summe aus Teil-Kosten und Rest-Kosten reduziert, insbesondere minimiert, wird.
-
1a zeigt eine beispielhafte Teil-Trajektorie 141 für ein mögliches Fahrmanöver, wobei die Teil-Trajektorie 141 das Fahrzeug 100 von dem Anfangszustand 131 in einen Zwischenzustand 142 überführt. Insbesondere kann eine Teil-Trajektorie 141 ermittelt werden, die ein oder mehrere Rand- bzw. Nebenbedingungen erfüllt. Bei der Ermittlung einer Teil-Trajektorie 141 können u.a. fahrdynamische Aspekte berücksichtigt werden. Insbesondere kann in Abhängigkeit von ein oder mehreren Fahrzeugparametern und/oder in Abhängigkeit von einer aktuellen Fahrsituation eine Teil-Trajektorie 141 ermittelt werden, die mit dem Fahrzeug 100 realistisch gefahren werden kann. Dabei kann eine vom Fahrzeug 100 umsetzbare Krümmung berücksichtigt werden. Weitere Beispiele für Fahrzeugparameter, die berücksichtigt werden können, sind eine (bei der aktuellen Fahrsituation umsetzbare) Quer- und/oder Längsbeschleunigung oder Verzögerung des Fahrzeugs 100.
-
Des Weiteren wird eine Teil-Trajektorie 141 typischerweise derart ermittelt, dass mit der Teil-Trajektorie 141 eine Kollision mit den detektierten Objekten bzw. Hindernissen 101, 102, 103 in der Umgebung des Ego-Fahrzeugs 100 vermieden werden kann. Die so ermittelte Teil-Trajektorie 141 kann dann an ein oder mehrere Regler für die Querführung und/oder die Längsführung des Fahrzeugs 100 übergeben werden, und von den ein oder mehreren Reglern für die Querführung und/oder die Längsführung des Fahrzeugs 100 verwendet werden.
-
Die Ermittlung einer Teil-Trajektorie 141 erfolgt bevorzugt in einem gekrümmten Koordinatensystem, relativ zu einem Fahrbahnverlauf. Das in diesem Dokument beschriebene Verfahren zur Ermittlung bzw. zur Aktualisierung einer Trajektorie kann daher den Schritt umfassen, Zustandsdaten bzw. Werte von Zustandsgrößen des Fahrzeugs 100 (wie z.B. die Position des Fahrzeugs 100, einen Gierwinkel des Fahrzeugs 100 und/oder einen Lenkwinkel des Fahrzeugs 100) aus einem kartesischen Koordinatensystem in ein (gekrümmtes) Frenet-Koordinatensystem zu transformieren.
-
Die Entkrümmung des Fahrbahnverlaufs (durch ein gekrümmtes Koordinatensystem) ist beispielhaft in 3 dargestellt. Für die Entkrümmung werden Messsignale bzgl. des Zustands des Fahrzeugs 100 in ein Fahrspurkoordinatensystem transformiert. Die Trajektorienplanung selbst findet damit nicht in einem kartesischen Koordinatensystem 301 statt, sondern in einem Frenet-Koordinatensystem. Das Frenet-Koordinatensystem wird bezüglich einer Referenzkurve 300 (z.B. der Fahrspurmitte eines Fahrbahnverlaufs) beschrieben. Die Fahrzeugposition wird damit durch die Variablen s(t) 303 in Längsrichtung und d(t) 302 in Querrichtung beschrieben. s(t) und d(t) beschreiben die Längs- bzw. Quergeschwindigkeit und s̈(t) und d̈(t) beschreiben die Längs- bzw. Querbeschleunigung.
-
Sowohl die Fahrzeugeigenbewegung als auch die zu berücksichtigenden Verkehrsteilnehmer bzw. Objekte 101, 102, 103 können im Frenet-Koordinatensystem berücksichtigt werden. Anschaulich entspricht diese Transformation der Entkrümmung des Koordinatensystems 301 und erlaubt so die getrennte Optimierung der Längs- und Querbewegung des Fahrzeugs 100. Nach Ermittlung einer Teil-Trajektorie 141 (d.h. nach Ermittlung einer zeitlichen Sequenz von Werten der Zustandsgrößen des Fahrzeugs 100), können die ermittelten Werte der Zustandsgrößen wieder in das kartesische Koordinatensystem 301 rücktransformiert werden, bevor sie zur Regelung der Längs- und Querführung des Fahrzeugs 100 verwendet werden.
-
Die Quer- und Längsbewegung eines Fahrzeugs
100 lässt sich als Optimalsteuerproblem mit Ausgang s(t) = x
1(t) (im Falle der Längsplanung) bzw. d(t) = x
1(t) (im Falle der Querplanung) eines Integratorsystems (d.h. eines Modells der Dynamik eines Fahrzeugs
100) beschreiben. Dabei ist x
1(t) eine erste Zustandsgröße des Fahrzeugs
100, welche die Position des Fahrzeugs
100 (in Längsrichtung bzw. in Querrichtung) beschreibt. Als Eingang des Integratorsystems können der Ruck
(d.h. die 3
te Ableitung der Zustandsgröße x
1(t)) und/oder die Ableitung des Rucks
(d.h. die 4
te Ableitung der Zustandsgröße x
1(t)) definiert werden.
-
Ein beispielhaftes Integratorsystem bzw. Zustandsmodell eines Fahrzeugs
100 kann wie folgt definiert werden:
wobei die Eingangsgröße u der Ableitung des Rucks
entspricht. Der Zustand eines Fahrzeugs
100 zu einem bestimmten Zeitpunkt t kann durch den Zustandsvektor x
T = [x
1, x
2, x
3, x
4] beschrieben werden, wobei x
2(t) = ẋ
1(t), x
3(t) = ẋ
2(t) und x
4(t) = ẋ
3(t) ist.
-
Es kann nun eine Trajektorie, d.h. eine zeitliche Abfolge von Zuständen x(t) bzw. im zeitdiskreten Bereich x(k), mit k = 1, ...., Nlon, wobei Nlon der Planungshorizont ist, ermittelt werden. Der Planungshorizont kann z.B. 5 Sekunden, 10 Sekunden oder mehr sein. Die einzelnen Zeitpunkte können einen Abstands von 100ms, 50ms, 20ms oder weniger zueinander aufweisen. Im Rahmen der Planung einer Trajektorie kann die Zustands-Abfolge x(k) ermittelt werden, durch die eine Kosten- bzw. Gütefunktion reduziert, insbesondere minimiert, bzw. optimiert wird. Dabei kann in der Kostenfunktion vorgegeben werden, dass das Fahrzeug 100 am Ende des Planungshorizonts eine bestimmte Zwischenposition (als Teil eines bestimmten Zwischenzustands 142) aufweist. Alternativ oder ergänzend kann vorgegeben werden, dass die Zustands-Abfolge ein oder mehrere Komfortkriterien (z.B. in Bezug auf den Ruck) erfüllt.
-
Zur Berechnung einer Quer-Trajektorie kann als gewünschter Zwischenpunkt einer Trajektorie ein Zielbereich dziel vorgegeben werden, der z.B. einen Bereich auf einer benachbarten Fahrspur anzeigt (wie in 1b dargestellt). Dieser Zielbereich kann z.B. als gewünschte Zwischenposition des Zwischenzustands x(tf) bzw. x(Nlon) 142 festgelegt werden, ggf. mit x1(tf) = x1 (Nlon) = dziel. Dabei können sich der Planungshorizont für die Planung einer Quer-Trajektorie und der Planungshorizont für die Planung einer Längs-Trajektorie voneinander unterscheiden. Typischerweise ist der Planungshorizont für eine Quer-Trajektorie kürzer als für eine Längs-Trajektorie (z.B. 6s vs. 10s).
-
Als Quer-Auswahlmaß oder als Quer-Gütemaß für die Ermittlung einer Teil-Trajektorie
11 für die Querführung des Fahrzeugs
100 kann z.B. folgende Funktion verwendet (insbesondere reduziert bzw. minimiert) werden:
-
Dabei bewertet der erste Ausdruck die Entwicklung der Ableitung des Rucks entlang der Teil-Trajektorie 141 (und damit den Komfort). Der zweite Ausdruck bewertet die Abweichung der Zwischenposition d(tf) von der Zielposition dziel. Des Weiteren bewertet der dritte Ausdruck die zeitliche Länge der Teil-Trajektorie 141. Über die Gewichtungsfaktoren kq1 und kq2 kann die Ausprägung der Teil-Trajektorie 141 beeinflusst werden.
-
Die Längsplanung kann in ähnlicher Weise erfolgen. Für die Längsplanung kann z.B. folgendes Längs-Auswahlmaß bzw. Längs-Gütefunktional verwendet (insbesondere reduziert bzw. minimiert) werden
insbesondere wenn eine bestimmte Zielposition s
ziel als Zwischenzustand
142 erreicht werden soll. Alternativ kann das folgende Längs-Auswahlmaß bzw. Längs-Gütefunktional verwendet werden
insbesondere wenn eine bestimmte Zielgeschwindigkeit s
ziel als Zwischenzustand
142 erreicht werden soll.
-
Es kann somit eine Vielzahl von (Längs- und/oder Quer-) Trajektorienkandidaten für die Teil-Trajektorie 141 ermittelt werden, wobei jeder Trajektorienkandidat den Zustand x des Fahrzeugs 100, insbesondere die Position s(k) des Fahrzeugs 100, an einer Vielzahl von Abtastzeitpunkten k, mit k = 1, ...., Nlon, anzeigt, wobei Nlon der Planungshorizont ist. Es ist dann zu überprüfen, welcher der Vielzahl von Trajektorienkandidaten ein oder mehrere Nebenbedingungen in Bezug auf Hindernisse, insbesondere in Bezug auf andere Fahrzeuge 101, 102, 103, erfüllt. Insbesondere können die Vielzahl von ermittelten Trajektorienkandidaten gemäß einem steigenden Wert des jeweiligen Güte- bzw. Kostenfunktionals sortiert sein. Es kann der Trajektorienkandidaten aus der Vielzahl von Trajektorienkandidaten als Teil-Trajektorie 141 ausgewählt werden, der die ein oder mehreren Nebenbedingungen in Bezug auf Hindernisse 101, 102, 103 erfüllt und dabei einen möglichst niedrigen bzw. optimalen Wert des Güte- bzw. Kostenfunktionals aufweist.
-
Es kann somit an einem bestimmten Zeitpunkt n eine optimale Teil-Trajektorie 141 xopt(k), mit k = 1, ... ., Nlon, ermittelt werden. Die optimale Teil-Trajektorie 141 kann an dem bestimmten Zeitpunkt zur automatisierten Längs- und/oder Querführung des Fahrzeugs 100 verwendet werden.
-
Der Prozess der Ermittlung einer jeweils optimalen Teil-Trajektorie 141, d.h. insbesondere das in 2 dargestellte Verfahren 200, kann für eine Sequenz von Zeitpunkten n wiederholt werden. Dabei kann an jedem Zeitpunkt n
- • der jeweils aktuelle Anfangszustand x(0) 131 bestimmt werden (Schritt 201);
- • der gewünschte Zwischenzustand bzw. Zwischenpunkt x(Nlon) 142 vorgegeben werden (Schritt 202); und
- • mittels des oben beschriebenen Optimierungsverfahrens eine optimale Teil-Trajektorie xopt(k) 141, mit k = 1, ...., Nlon, ermittelt werden (Schritt 203).
-
Für ein mögliches Fahrmanöver kann somit eine (Längs- und/oder Quer-) Teil-Trajektorie 141 ermittelt werden, durch die eine (Längs- und/oder Quer-) Kostenfunktion reduziert, insbesondere minimiert, wird. Des Weiteren kann ein Teil-Kostenwert der (Längs- und/oder Quer-) Kostenfunktion ermittelt werden.
-
Das Fahrzeug 100 befindet sich nach Durchführung der Teil-Trajektorie 141 in einem Zwischenzustand 142. Der Zwischenzustand 142 kann die (Längs- und/oder Quer-) Position, Geschwindigkeit und/oder Beschleunigung des Fahrzeugs 100 während eines möglichen Fahrmanövers anzeigen. Das Fahrzeug 100 muss dann noch entlang einer (typischerweise nicht planbaren) Rest-Trajektorie von dem Zwischenzustand 142 in den Zielzustand 132 überführt werden, um das mögliche Fahrmanöver abzuschließen. Der Rest-Kostenwert für das Überführen des Fahrzeugs 100 von dem Zwischenzustand 142 in den Zielzustand 132 kann auf Basis von Kostendaten ermittelt werden.
-
Die Kostendaten können für unterschiedliche Rest-Trajektorien unterschiedliche Rest-Kostenwerte anzeigen. Dabei können die unterschiedlichen Rest-Trajektorien durch Trajektorienparameter beschrieben werden. Beispielhafte Trajektorienparameter sind:
- • die Anzahl von Fahrspuren 111, 112, 113, die zwischen dem Zwischenzustand 142 und dem Zielzustand 132 liegen;
- • die Distanz und/oder die Zeit, die für die Durchführung der Rest-Trajektorie zur Verfügung steht; und
- • die Geschwindigkeit des Fahrzeugs 100 (bei dem Zwischenzustand 142).
-
Die Kostendaten können für unterschiedliche Parameterwerte von ein oder mehreren Trajektorienparametern unterschiedliche Rest-Kostenwerte anzeigen. Die Kostendaten können dabei mittels einer Maschine-Lern-Methode (ggf. kontinuierlich) angelernt werden. Insbesondere kann auf Basis von tatsächlich gefahrenen Trajektorien des Fahrzeugs 100 ermittelt werden, welche Kosten sich bei den tatsächlich gefahrenen Trajektorien des Fahrzeug 100 ergeben haben. Die Kosten bzw. die zugrundeliegende Kostenfunktion kann dabei abhängig sein von,
- • dem Komfort der Rest-Trajektorie;
- • der Sicherheit der Rest-Trajektorie; und/oder
- • der Zuverlässigkeit, mit der die Rest-Trajektorie erfolgreich umgesetzt werden kann.
-
Eine bevorzugte Methode zum Anlernen der Kostendaten ist reinforcement leaming.
-
Es können somit an einem bestimmten Zeitpunkt für eine Mehrzahl von möglichen Fahrmanövern jeweils ein Teil-Kostenwert und ein Rest-Kostenwert ermittelt werden. Es kann dann das Fahrmanöver ausgewählt und eingeleitet werden, das die geringste (gewichtete) Summe aus Teil-Kostenwert und Rest-Kostenwert aufweist.
-
4 zeigt ein Ablaufdiagramm eines beispielhaften Verfahrens 400 zur Auswahl eines möglichen Fahrmanövers für ein Fahrzeug 100. Das Verfahren 400 kann durch eine Steuereinheit bzw. eine Vorrichtung des Fahrzeugs 100 ausgeführt werden. Das Verfahren 400 umfasst das Ermitteln 401 einer Mehrzahl von möglichen Fahrmanövern, um ein Fahrzeug 100 von einem Anfangszustand 131 in einen Zielzustand 132 zu überführen. Beispielsweise kann ein erstes Fahrmanöver einen Überholvorgang umfassen, während ein zweites Fahrmanöver ein Abbremsen des Fahrzeugs 100 in der gleichen Fahrspur 111 umfasst.
-
Außerdem umfasst das Verfahren 400 das Planen 402, für jedes der Mehrzahl von Fahrmanövern, einer Teil-Trajektorie 141, durch die das Fahrzeug 100 von dem Anfangszustand 131 in einen jeweiligen Zwischenzustand 132 überführt werden kann. Die Teil-Trajektorien 141 könnend dabei modell-basiert ermittelt werden, insbesondere auf Basis eines Zustandsmodells des Fahrzeugs 100. Zur Ermittlung der Teil-Trajektorien 11 für die unterschiedlichen Fahrmanöver kann das in diesem Dokument beschriebene Verfahren 200 zur Trajektorienplanung verwendet werden.
-
Des Weiteren umfasst das Verfahren 400 das Ermitteln 403, für jede der Mehrzahl von Teil-Trajektorien 141, eines mit der jeweiligen Teil-Trajektorie 141 assoziierten Teil-Kostenwertes. Der Teil-Kostenwert für eine Teil-Trajektorie 141 kann dabei im Rahmen des Verfahrens 200 zur Trajektorienplanung ermittelt werden.
-
Das Verfahren 400 umfasst ferner das Ermitteln 404, für jedes der Mehrzahl von Fahrmanövern, eines Rest-Kostenwertes für eine Rest-Trajektorie, durch die das Fahrzeug 100 von dem jeweiligen Zwischenzustand 142 in den Zielzustand 132 überführt werden kann. Dabei können die Rest-Kostenwerte für die unterschiedlichen möglichen Fahrmanöver (ggf. allein) auf Basis von Kostendaten, insbesondere auf Basis von im Vorfeld angelernten und/oder auf Erfahrung basierenden Kostendaten, ermittelt werden. Insbesondere können die Rest-Kostenwerte ermittelt werden, ohne dass es erforderlich ist, die entsprechenden Rest-Trajektorien zu planen. Vielmehr kann es ausreichend sein, die Rest-Trajektorien jeweils durch eine Kombination von Parameterwerten von ein oder mehreren Trajektorienparametern zu beschreiben. Die Kostendaten können dann für die unterschiedlichen Kombinationen von Parameterwerten den jeweiligen Rest-Kostenwert anzeigen. Der Rest-Kostenwert für eine Rest-Trajektorie kann somit (ggf. allein) auf Basis der Parameterwerte der ein oder mehreren Trajektorienparameter ermittelt werden, durch die die Rest-Trajektorie beschrieben wird.
-
Des Weiteren umfasst das Verfahren 400 das Auswählen 405 eines der Mehrzahl von möglichen Fahrmanövern auf Basis der Teil-Kostenwerte und der Rest-Kostenwerte für die Mehrzahl von möglichen Fahrmanövern.
-
Durch die in diesem Dokument beschriebenen Maßnahmen kann eine optimierte Entscheidung in Bezug auf mögliche Fahrmanöver ermöglicht werden. Dabei können eine modell-basierte (Trajektorien-) Planung und kumulierte Erfahrungen aus der Vergangenheit in vorteilhafter Weise kombiniert werden.
-
Die vorliegende Erfindung ist nicht auf die gezeigten Ausführungsbeispiele beschränkt. Insbesondere ist zu beachten, dass die Beschreibung und die Figuren nur das Prinzip der vorgeschlagenen Verfahren, Vorrichtungen und Systeme veranschaulichen sollen.