EP4359274A1

EP4359274A1 - Verfahren zur trajektorienoptimierung

Info

Publication number: EP4359274A1
Application number: EP22758420.8A
Authority: EP
Inventors: Nicolas Stein; Hendrik DEUSCH
Original assignee: Continental Automotive Technologies GmbH
Current assignee: Aumovio Germany GmbH
Priority date: 2021-06-25
Filing date: 2022-06-21
Publication date: 2024-05-01
Also published as: JP2024523157A; WO2022268274A1; DE102021206588A1; CN117500708A

Abstract

Die Erfindung betrifft ein Verfahren zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen, wobei das Verfahren die folgenden Schritte aufweist: - Abfahren einer Fahrstrecke (FS) von einer Startposition (SP) zu einer Zielposition (ZP) durch einen menschlichen Fahrer mittels eines Fahrzeugs (F) (S10); - Erfassen von Umgebungsinformationen durch eine Sensorik des Fahrzeugs (F) während des Abfahrens der Fahrstrecke (FS) (S11); - Abspeichern von Informationen zu einer befahrbaren Fahrgasse basierend auf den Umgebungsinformationen (S12); - Ermitteln einer Fahrtrajektorie basierend auf Informationen zur befahrbaren Fahrgasse mittels einer Recheneinheit des Fahrzeugs (F), die eine Strategie des bestärkenden Lernens implementiert (S13); - Abspeichern der ermittelten Fahrtrajektorie (S14).

Description

Beschreibung

Verfahren zur Trajektorienoptimierung

Die Erfindung betrifft ein Verfahren zur Trajektorienoptimierung bei wiederkehrenden Fahrsituationen, insbesondere bei wiederkehrenden Parksituationen.

Teilautomatisierte oder automatisierte Parkfunktionen von Fahrzeugen sind bereits bekannt. Dabei wird beispielsweise eine vom menschlichen Fahrer manuell abgefahrene Trajektorie von einer Startposition zu einem Parkplatz als Zielposition einschließlich des Einparkmanövers und die detektierte Umgebung gespeichert. Basierend auf diesen gespeicherten Informationen kann zu einem späteren Zeitpunkt die gespeicherte Trajektorie abgefahren werden.

Nachteilig hierbei ist, dass sich die Trajektorie lediglich so abfahren lässt, wie sie ursprünglich abgespeichert wurde. Da die vom menschlichen Fahrer abgefahrene Trajektorie oft nicht optimal bezüglich der Länge, der Zeit und/oder dem Lenkwinkel ist und diese manuell abgefahrene Trajektorie die Grundlage für den automatisierten Fahrvorgang bildet, ist auch die automatisiert abgefahrene Trajektorie häufig nicht optimal hinsichtlich der vorgenannten Trajektorieneigenschaften.

Ausgehend hiervon ist es Aufgabe der Erfindung, ein Verfahren zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen anzugeben, das verbesserte Trajektorieneigenschaften für die automatisiert abgefahrene Fahrstrecke bietet.

Die Aufgabe wird durch ein Verfahren mit den Merkmalen des unabhängigen Patentanspruchs 1 gelöst. Bevorzugte Ausführungsformen sind Gegenstand der Unteransprüche. Ein System zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen ist Gegenstand des nebengeordneten Patentanspruchs 15.

Gemäß einem ersten Aspekt bezieht sich die Erfindung auf ein Verfahren zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen. Das Verfahren weist die folgenden Schritte auf:

Zunächst wird eine Fahrstrecke von einer Startposition zu einer Zielposition durch einen menschlichen Fahrer mittels eines Fahrzeugs abgefahren. Diese Fahrstrecke bezieht sich auf die wiederkehrende Fahrsituation, d.h. wird zukünftig öfter durchfahren, beispielsweise als Parkvorgang zu Flause, am Arbeitsplatz etc.

Während des Abfahrens der Fahrstrecke werden Umgebungsinformationen durch eine Sensorik des Fahrzeugs erfasst. Die Sensorik kann durch jegliche Fahrzeugsensorik gebildet werden, über die die Umgebung der Fahrstrecke erfassbar ist und daraus die kollisionsfrei befahrbare Fahrgasse ermittelt werden kann. Beispielsweise kann die Sensorik einen oder mehrere Ultraschallsensoren, zumindest eine Kamera, zumindest einen Radarsensor und/oder zumindest einen LIDAR- Sensor umfassen.

Nach dem Erfassen der Umgebungsinformationen werden Informationen zu einer befahrbaren Fahrgasse basierend auf diesen Umgebungsinformationen erzeugt und abgespeichert. Damit wird der Bereich bzw. Fahrschlauch festgelegt, innerhalb dem die Trajektorienplanung erfolgen kann.

Basierend auf den Informationen zur befahrbaren Fahrgasse wird eine Fahrtrajektorie mittels einer Recheneinheit des Fahrzeugs ermittelt. Die Recheneinheit implementiert dabei eine Strategie des bestärkenden Lernens, d.h. es wird über mehrere iterative Versuchstrajektorien, eine Beurteilung der Versuchstrajektorien und eine Rückmeldung an das lernende System, ob sich die Trajektorieneigenschaften der aktuell berechneten Versuchstrajektorie gegenüber einer früheren Versuchstrajektorie verbessert haben, eine Fahrtrajektorie gesucht, die verbesserte Trajektorieneigenschaften aufweist.

Zuletzt erfolgt ein Abspeichern der ermittelten Fahrtrajektorie, um basierend auf dieser Fahrtrajektorie zukünftig die Fahrstrecke automatisiert oder teilautomatisiert mittels eines Fahrassistenzsystems abfahren zu können. Dabei kann sich der Fahrer außerhalb des Fahrzeugs befinden, d.h. das Fahrzeug fährt beispielsweise selbstständig zur Parkposition.

Der technische Vorteil des erfindungsgemäßen Verfahrens besteht darin, dass durch das bestärkende Lernverfahren keine komplexen Trainingsdaten zum Erzeugen einer optimierten Fahrtrajektorie nötig sind, sondern lediglich zumindest einmal die Fahrstrecke von einer Startposition zu einer Zielposition durch den menschlichen Fahrer abgefahren werden muss, um die befahrbare Fahrgasse zu bestimmen. Das Auffinden einer optimierten Fahrgasse erfolgt dann über bestärkendes Lernen. Dies hat den Vorteil, dass die durch die Optimierung zu bestimmende Fahrtrajektorie nicht durch die Güte der Trainingsdaten limitiert ist, sondern durch das bestärkende Lernen eine Fahrtrajektorie ermittelt werden kann, die besser ist als die vom menschlichen Fahrer gefahrene Fahrtrajektorie.

Gemäß einem Ausführungsbeispiel sind in der Recheneinheit ein Agent und ein Bewertungssystem implementiert. Der Agent ist dazu konfiguriert, ohne Trainingsdaten eine Fahrtrajektorie zu bestimmen, die im Hinblick auf vorgegebene Trajektorieneigenschaften optimiert ist. Eine vom Agenten berechnete Fahrtrajektorie wird durch das Bewertungssystem basierend auf Trajektorieneigenschaften beurteilt und abhängig vom Beurteilungsergebnis wird eine neue Fahrtrajektorie berechnet. Dadurch können beeinflusst durch das Beurteilungsergebnis neue Fahrtrajektorien berechnet und dadurch Fahrtrajektorien mit besseren Trajektorieneigenschaften erzeugt werden.

Gemäß einem Ausführungsbeispiel werden mehrere unterschiedliche Trajektorieneigenschaften zur Beurteilung einer Trajektorie herangezogen. Vorzugsweise können die unterschiedlichen Trajektorieneigenschaften verschieden gewichtet werden. Die Berechnung einer neuen Trajektorie kann unter einer oder mehreren Vorgaben erfolgen, und zwar derart, dass eine oder mehrere Trajektorieneigenschaften verbessert werden. Dies kann beispielsweise derart erfolgen, dass eine oder mehrere Trajektorieneigenschaften verbessert und andere Trajektorieneigenschaften verschlechtert werden. So kann beispielsweise eine sehr lange Trajektorie dadurch verbessert werden, dass die Trajektorienlänge verkleinert wird, um schneller zur Zielposition zu gelangen.

Gemäß einem Ausführungsbeispiel berechnet der Agent iterativ neue Fahrtrajektorien derart, dass das Beurteilungsergebnis gesteigert wird. Dabei fließen vorzugsweise mehrere unterschiedliche Trajektorieneigenschaften, beispielsweise mit unterschiedlicher Gewichtung, in die Beurteilung ein. Dadurch kann über mehrere Iterationsschritte hinweg die Trajektorie verbessert werden.

Gemäß einem Ausführungsbeispiel umfasst das Bewertungssystem eine Belohnungsfunktion, die zu einer berechneten Fahrtrajektorie eine positive oder negative Belohnung berechnet. Diese Belohnung ist eine Feedbackinformation für den Agenten, der die nachfolgenden Trajektorienberechnungen beeinflusst. Dadurch kann der Agent derart beeinflusst werden, dass sukzessive Trajektorien mit besseren Trajektorieneigenschaften und damit einem besseren Beurteilungsergebnis berechnet werden.

Gemäß einem Ausführungsbeispiel berechnet der Agent iterativ Fahrtrajektorien derart, dass eine nachfolgende Fahrtrajektorie eine höhere positive Belohnung erhält als eine vorherige Fahrtrajektorie. Damit kann sukzessive die Qualität der Fahrtrajektorien verbessert und durch das bestärkende Lernverfahren eine finale Fahrtrajektorie ermittelt werden, die hinreichend gute Trajektorieneigenschaften aufweist.

Gemäß einem Ausführungsbeispiel umfassen die zur Beurteilung einer Fahrtrajektorie verwendeten Trajektorieneigenschaften die Zeit zum Durchfahren der Fahrtrajektorie, die Wegstrecke der Fahrtrajektorie, Informationen zu Lenkwinkeländerungen, Informationen zur Längsbeschleunigung und/oder Informationen zur Querbeschleunigung. Mittels dieser Trajektorieneigenschaften können die Fahrtrajektorien objektiv beurteilt werden, und zwar angelehnt an die Wahrnehmung eines menschlichen Fahrers.

Gemäß einem Ausführungsbeispiel wird die Fahrstrecke von der Startposition zu der Zielposition mehrfach abgefahren. Dies können ausschließlich mehrere vom menschlichen Fahrer durchgeführte Fahrvorgänge sein oder aber zumindest teilweise auch automatisiert durchgeführte Fahrvorgänge. Dabei werden Umgebungsinformationen durch eine Sensorik des Fahrzeugs erfasst und Informationen zur befahrbaren Fahrgasse ermittelt und gespeichert. Durch ein mehrfaches Abfahren der Fahrstrecke können umfassendere Umgebungsinformationen erhalten werden, so dass eine verbesserte Trajektorienbestimmung erfolgen kann.

Gemäß einem Ausführungsbeispiel werden mehrere zeitlich nacheinander ermittelte Umgebungsinformationen und/oder Informationen zur befahrbaren Fahrgasse kombiniert, und diese kombinierten Informationen zur befahrbaren Fahrgasse werden zum Ermitteln einer Fahrtrajektorie herangezogen. Durch diese Fusion von Umgebungsinformationen bzw. Fahrgasseninformationen kann eine modifizierte, insbesondere größere Fahrgasse erhalten werden. Auf Basis dieser modifizierten Fahrgasse wird ein größerer Freiraum für die Berechnung von Fahrtrajektorien erhalten.

Gemäß einem Ausführungsbeispiel wird beim Durchfahren der Fahrstrecke von dem Startpunkt zu dem Zielpunkt fortlaufend eine Umgebungserfassung vollzogen und das Ermitteln einer Fahrtrajektorie durch bestärkendes Lernen wird neu vollzogen, wenn anhand der erfassten Umgebungsinformationen erkennbar ist, dass sich die Informationen zur befahrbaren Fahrgasse durch statische Objekte verändert hat. Dadurch kann sichergestellt werden, dass die Fahrtrajektorie an statische Veränderungen der befahrbaren Fahrgasse, beispielsweise durch eine bauliche Veränderung, fortlaufend angepasst wird.

Gemäß einem Ausführungsbeispiel wird die Fahrstrecke von der Startposition zur Zielposition basierend auf der ermittelten Fahrtrajektorie automatisiert durchfahren. Von der ermittelten Fahrtrajektorie wird dann abgewichen, wenn ein Hindernis auf der ermittelten Fahrtrajektorie detektiert wird. Dadurch ist es möglich, situationsbezogen auf temporäre Veränderungen der befahrbaren Fahrgasse zu reagieren und durch Ausweichen Kollisionen zu vermeiden.

Gemäß einem Ausführungsbeispiel ermittelt die Recheneinheit mehrere unterschiedliche optimierte Fahrtrajektorien mittels der Strategie des bestärkenden Lernens und eine Fahrtrajektorie dieser optimierten Fahrtrajektorien wird basierend auf einem oder mehreren Zielkriterien auswählt. Dadurch kann erreicht werden, dass in Fällen, in denen mehrere unterschiedliche optimierte Fahrtrajektorien ermittelt werden können, diejenige optimierte Fahrtrajektorie verwendet wird, die vorgegebene Beurteilungskriterien am besten erfüllt. Gemäß einem weiteren Aspekt betrifft die Erfindung ein System zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen umfassend eine in einem Fahrzeug vorgesehene Recheneinheit. Das Verfahren weist die folgenden Schritte auf:

- Erfassen von Umgebungsinformationen durch eine Sensorik des Fahrzeugs während des Abfahrens der Fahrstrecke von einer

Startposition zu einer Zielposition durch einen menschlichen Fahrer;

- Abspeichern von Informationen zu einer befahrbaren Fahrgasse basierend auf den Umgebungsinformationen;

- Ermitteln einer Fahrtrajektorie basierend auf Informationen zur befahrbaren Fahrgasse mittels der Recheneinheit, die eine Strategie des bestärkenden Lernens implementiert;

- Abspeichern der ermittelten Fahrtrajektorie in einer Speichereinheit.

Die Ausdrücke „näherungsweise“, „im Wesentlichen“ oder „etwa“ bedeuten im Sinne der Erfindung Abweichungen vom jeweils exakten Wert um +/- 10%, bevorzugt um +/- 5% und/oder Abweichungen in Form von für die Funktion unbedeutenden Änderungen.

Weiterbildungen, Vorteile und Anwendungsmöglichkeiten der Erfindung ergeben sich auch aus der nachfolgenden Beschreibung von Ausführungsbeispielen und aus den Figuren. Dabei sind alle beschriebenen und/oder bildlich dargestellten Merkmale für sich oder in beliebiger Kombination grundsätzlich Gegenstand der Erfindung, unabhängig von ihrer Zusammenfassung in den Ansprüchen oder deren Rückbeziehung. Auch wird der Inhalt der Ansprüche zu einem Bestandteil der Beschreibung gemacht. Die Erfindung wird im Folgenden anhand der Figuren an Ausführungsbeispielen näher erläutert. Es zeigen:

Fig. 1 beispielhaft eine Draufsichtdarstellung einer Fahrstrecke einer wiederkehrenden Fahrsituation; und

Fig. 2 beispielhaft ein Blockdiagramm, das die Verfahrensschritte zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen verdeutlicht.

Figur 1 zeigt beispielhaft und grob schematisch ein Fahrzeug F zu Beginn einer wiederkehrenden Fahrsituation, die durch eine Fahrstrecke FS von einer Startposition SP zu einer Zielposition ZP beschrieben ist. Eine solche Fahrstrecke FS kann beispielsweise die Strecke zwischen einer Grundstückszufahrt und einer am Grundstück vorgesehenen Parkposition, beispielsweise einem Garagenstellplatz, sein.

Um diese Fahrstrecke FS automatisiert durchfahren zu können, ist es nötig, eine Fahrtrajektorie durch eine Recheneinheit des Fahrzeugs F zu berechnen, entlang derer das Fahrzeug F von der Startposition SP zur Zielposition ZP fährt.

Für die Berechnung der Fahrtrajektorie ist es nötig, dass Informationen über die Umgebung im Bereich der Fahrstrecke FS vorhanden sind, um basierend darauf den frei befahrbaren Bereich, nachfolgend auch als Fahrschlauch bezeichnet, zu kennen.

Zur Bestimmung des Fahrschlauchs weist das Fahrzeug F eine Sensorik auf, mittels der die Umgebungsinformationen erfassbar sind. Die Sensorik kann beispielsweise Ultraschallsensoren, eine oder mehrere Kameras, einen oder mehrere Radarsensoren und/oder einen oder mehrere LIDAR- Sensoren umfassen. Um die Umgebungsinformationen entlang der Fahrstrecke FS initial bestimmen zu können, ist es nötig, dass die Fahrstrecke FS zunächst zumindest einmal durch den menschlichen Fahrer abgefahren wird, d.h. von der Startposition SP zur Zielposition ZP. Bei diesem Durchfahren können die Umgebungsinformationen durch die Sensorik des Fahrzeugs F erfasst und damit der befahrbare Fahrschlauch ermittelt werden.

Nachdem der befahrbare Fahrschlauch bestimmt ist, kann eine Berechnung einer Fahrtrajektorie von der Startposition SP zur Zielposition ZP erfolgen. Dies erfolgt vorzugsweise durch einen Trajektorienplaner, der in einer Rechnereinheit des Fahrzeugs implementiert ist.

Die Rechnereinheit ist zum maschinellen Lernen konfiguriert, und zwar nach dem Prinzip des bestärkenden Lernens (engl. Reinforcement learning). Hierbei weist die Rechnereinheit einen Agenten auf, der ohne Trainingsdaten eine Fahrtrajektorie bestimmen kann, die im Hinblick auf vorgegebene Trajektorieneigenschaften optimiert ist. In anderen Worten implementiert die Rechnereinheit kein überwachtes Lernverfahren, das auf einem Satz von Trainingsdaten basiert.

Zudem ist ein Bewertungssystem vorgesehen, das zur Beurteilung einer berechneten Fahrtrajektorie basierend auf vorgegebenen Trajektorieneigenschaften ausgebildet ist. Je nachdem, wie gut die berechnete Fahrtrajektorie die vorgegebenen Trajektorieneigenschaften erfüllt, wird durch das Bewertungssystem eine positive oder negative Belohnung bereitgestellt. Insbesondere generiert das Bewertungssystem eine positive Belohnung, wenn die Trajektorieneigenschaften einer neu berechneten Fahrtrajektorie besser sind als die Trajektorieneigenschaften einer vorher berechneten Trajektorie. Im umgekehrten Fall generiert das Bewertungssystem beispielsweise eine negative Belohnung, wenn die Trajektorieneigenschaften einer neu berechneten Fahrtrajektorie schlechter sind als die Trajektorieneigenschaften einer vorher berechneten Trajektorie. Die vorher berechnete Trajektorie kann dabei jeweils die direkt vorher berechnete Trajektorie sein, oder es kann auf eine Trajektorie zurückgegriffen werden, die bereits länger zurückliegend berechnet wurde.

Basierend auf den positiven bzw. negativen Belohnungen lernt der Agent selbstständig, wie eine Fahrtrajektorie verändert werden muss, um positive Belohnungen zu erhalten. Anhand der Belohnungen kann eine Nutzenfunktion ermittelt werden, die angibt, welchen Wert eine Trajektorieneigenschaft in Bezug auf den Erhalt einer positiven Belohnung hat. Dadurch ist es möglich, eine gezielte Verbesserung der Trajektorieneigenschaften zu erreichen.

Vorzugsweise wird der Prozess zur Ermittlung einer Fahrtrajektorie zunächst dann eingeleitet, wenn zu einer sich wiederholenden Fahrsituation ein befahrbarer Fahrschlauch zur Verfügung steht. Beispielsweise kann die Berechnung direkt nach dem Erreichen der Zielposition ZP eingeleitet werden. Vorzugsweise wird die Berechnung von Fahrtrajektorien so lange vollzogen, bis eine hinreichend gute Fahrtrajektorie ermittelt werden konnte. Es können hierbei ein oder mehrere Abbruchkriterien definiert sein, basierend auf denen die iterative Trajektorienoptimierung beendet wird.

Die Trajektorieneigenschaften, basierend auf denen die Beurteilung der Fahrtrajektorien erfolgt, können beispielsweise die Zeit zum Durchfahren der Fahrtrajektorie, die Wegstrecke der Fahrtrajektorie, Informationen zur Lenkwinkeländerung, Informationen zur Längsbeschleunigung und/oder Informationen zur Querbeschleunigung sein.

Vorzugsweise wird die Fahrstrecke FS zwischen der Startposition SP und der Zielposition ZP mehrmals durchfahren, um dabei Umgebungsinformationen zu erfassen. Dadurch lassen sich zeitlich hintereinander unterschiedliche Umgebungsinformationen erfassen. Diese können miteinander kombiniert bzw. fusioniert werden, um basierend darauf verbesserte Informationen zur befahrbaren Fahrgasse zu erhalten. Diese verbesserten Informationen können anschließend als Basis für die Berechnung der Fahrtrajektorie verwendet werden. Der Vorteil liegt darin, dass mit jeder zusätzlich gefahrenen Trajektorie, insbesondere manuell gefahrenen Trajektorie, der befahrbare Fahrschlauch vergrößert werden kann und damit auch ein höheres Potential für eine Optimierung der Fahrtrajektorie durch das bestärkende Lernen besteht.

Es erfolgt auch bei dem automatisierten Befahren der Fahrstrecke FS auf der Grundlage einer vorher berechneten Fahrtrajektorie eine Umgebungserfassung. Diese erfolgt zum einen mit dem Ziel, dass auf der Fahrtrajektorie befindliche hinderliche Objekte erfasst werden und das Fahrzeug diesen ausweichen bzw. davor anhalten kann. Zum anderen erfolgt die Umgebungserfassung beim automatisierten Befahren auch aus dem Grund, dass neue stationäre Objekte auf einem vorher als befahrbar detektierten Fahrschlauch erkannt werden und damit eine neue Trajektorienoptimierung durch bestärkendes Lernen unter Berücksichtigung des veränderten Fahrschlauchs möglich wird. Mit anderen Worten wird kann damit bei einer Veränderung der befahrbaren Fahrgasse die Berechnung der Fahrtrajektorie erneut durchgeführt werden, um basierend auf der veränderten Umgebungssituation eine optimierte Fahrtrajektorie zu ermitteln.

Es kann Vorkommen, dass die Optimierung der Fahrtrajektorie durch bestärkendes Lernen nicht zu einem globalen Optimum der Fahrtrajektorie führt, sondern lediglich zu einem lokalen Optimum. Daher kann vorzugsweise die Trajektorienoptimierung mehrfach erfolgen, beispielsweise basierend auf anderen Optimierungskriterien, um mehrere unterschiedliche optimierte Fahrtrajektorien zu erhalten. Anschließend können diese unterschiedlichen optimierten Fahrtrajektorien miteinander verglichen werden. Insbesondere können die unterschiedlichen optimierten Fahrtrajektorien basierend auf vorgegebenen Kriterien wie beispielsweise Zeit zum Durchfahren der Fahrtrajektorie, Wegstrecke der Fahrtrajektorie, Informationen zur Lenkwinkeländerung, Informationen zur Längsbeschleunigung und/oder Informationen zur Querbeschleunigung miteinander verglichen werden, um eine finale Fahrtrajektorie zu bestimmen, die anschließend für die autonome Fahrfunktion verwendet wird. Die autonome Fahrfunktion kann insbesondere „trainiertes Parken“ bei einer wiederkehrenden Parksituation sein.

Fig. 2 zeigt ein Diagramm, das die Verfahrensschritte zur Ermittlung der Fahrtrajektorie verdeutlicht.

Zunächst wird eine Fahrstrecke von einer Startposition zu einer Zielposition durch einen menschlichen Fahrer mittels eines Fahrzeugs abgefahren (S10).

Während des Abfahrens der Fahrstrecke werden Umgebungsinformationen durch eine Sensorik des Fahrzeugs erfasst (S11).

Anschließend werden Informationen zu einer befahrbaren Fahrgasse basierend auf den Umgebungsinformationen des Fahrzeugs abgespeichert (S12).

Daraufhin wird eine Fahrtrajektorie basierend auf Informationen zur befahrbaren Fahrgasse mittels einer Recheneinheit des Fahrzeugs ermittelt (S13). Die Recheneinheit implementiert dabei eine Strategie des bestärkenden Lernens, bei dem eine berechnete Fahrtrajektorie basierend auf Trajektorieneigenschaften beurteilt und iterativ optimiert wird, und zwar derart, dass versucht wird, durch die Iterationsschritte Trajektorieneigenschaften der Fahrtrajektorie sukzessive zu verbessern.

Zuletzt erfolgt ein Abspeichern der ermittelten Fahrtrajektorie (S14). Dadurch kann die ermittelte Fahrtrajektorie zum automatisierten Befahren der wiederkehrenden Fahrsituation verwendet werden.

Die Erfindung wurde voranstehend an Ausführungsbeispielen beschrieben. Es versteht sich, dass zahlreiche Änderungen sowie Abwandlungen möglich sind, ohne dass dadurch der durch die Patentansprüche definierte Schutzbereich verlassen wird.

Bezugszeichenliste F Fahrzeug

FS Fahrstrecke

SP Startposition

ZP Zielposition

Claims

Patentansprüche

1 ) Verfahren zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen, wobei das Verfahren die folgenden Schritte aufweist:

- Abfahren einer Fahrstrecke (FS) von einer Startposition (SP) zu einer Zielposition (ZP) durch einen menschlichen Fahrer mittels eines Fahrzeugs (F) (S10);

- Erfassen von Umgebungsinformationen durch eine Sensorik des Fahrzeugs (F) während des Abfahrens der Fahrstrecke (FS) (S11);

- Abspeichern von Informationen zu einer befahrbaren Fahrgasse basierend auf den Umgebungsinformationen (S12);

- Ermitteln einer Fahrtrajektorie basierend auf Informationen zur befahrbaren Fahrgasse mittels einer Recheneinheit des Fahrzeugs (F), die eine Strategie des bestärkenden Lernens implementiert (S13);

- Abspeichern der ermittelten Fahrtrajektorie (S14).

2) Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass in der Recheneinheit ein Agent und ein Bewertungssystem implementiert sind, dass eine vom Agenten berechnete Fahrtrajektorie durch das Bewertungssystem basierend auf Trajektorieneigenschaften beurteilt wird und abhängig vom Beurteilungsergebnis eine neue Fahrtrajektorie berechnet wird.

3) Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass mehrere unterschiedliche Trajektorieneigenschaften zur Beurteilung einer Trajektorie herangezogen werden und die Berechnung einer neuen Fahrtrajektorie unter einer oder mehreren Vorgaben erfolgt, und zwar derart, dass eine oder mehrere Trajektorieneigenschaften verbessert werden. 4) Verfahren nach Anspruch 2 oder 3, dadurch gekennzeichnet, dass der Agent iterativ neue Fahrtrajektorien derart berechnet, dass das Beurteilungsergebnis gesteigert wird.

5) Verfahren nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, dass das Bewertungssystem eine Belohnungsfunktion umfasst, die zu einer berechneten Fahrtrajektorie eine positive oder negative Belohnung berechnet.

6) Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass durch den Agenten eine nachfolgende Fahrtrajektorie auf Basis der Flöhe ihrer Belohnung ausgewählt wird.

7) Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die zur Beurteilung einer Fahrtrajektorie verwendeten Trajektorieneigenschaften die Zeit zum Durchfahren der Fahrtrajektorie, die Wegstrecke der Fahrtrajektorie, Informationen zu Lenkwinkeländerungen, Informationen zur Längsbeschleunigung und/oder Informationen zur Querbeschleunigung umfassen.

8) Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Fahrstrecke (FS) von der Startposition (SP) zu der Zielposition (ZP) mehrfach abgefahren wird und dabei Umgebungsinformationen durch eine Sensorik des Fahrzeugs (F) erfasst und Informationen zur befahrbaren Fahrgasse ermittelt und gespeichert werden.

9) Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass mehrere zeitlich nacheinander ermittelte Informationen zur befahrbaren Fahrgasse kombiniert werden, und diese kombinierten Informationen zur befahrbaren Fahrgasse zum Ermitteln einer Fahrtrajektorie herangezogen werden. 10) Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass beim Durchfahren der Fahrstrecke von dem Startpunkt zu dem Zielpunkt fortlaufend eine Umgebungserfassung vollzogen wird und das Ermitteln einer Fahrtrajektorie durch bestärkendes Lernen neu vollzogen wird, wenn anhand der erfassten Umgebungsinformationen erkennbar ist, dass sich die Informationen zur befahrbaren Fahrgasse durch statische Objekte verändert hat.

11 ) Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass basierend auf der ermittelten Fahrtrajektorie die Fahrstrecke (FS) von der Startposition (SP) zur Zielposition (ZP) automatisiert durchfahren wird und von der ermittelten Fahrtrajektorie abgewichen wird, wenn ein Hindernis auf der ermittelten Fahrtrajektorie detektiert wird.

12) Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Recheneinheit mehrere unterschiedliche optimierte Fahrtrajektorien mittels der Strategie des bestärkenden Lernens ermittelt und eine Fahrtrajektorie dieser optimierten Fahrtrajektorien basierend auf einem oder mehreren Zielkriterien auswählt.

13) System zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen umfassend eine in einem Fahrzeug (F) vorgesehene Recheneinheit, wobei das Verfahren die folgenden Schritte aufweist:

- Erfassen von Umgebungsinformationen durch eine Sensorik des Fahrzeugs (F) während des Abfahrens der Fahrstrecke (FS) von einer Startposition (SP) zu einer Zielposition (ZP) durch einen menschlichen Fahrer;

- Abspeichern von Informationen zu einer befahrbaren Fahrgasse basierend auf den Umgebungsinformationen; - Ermitteln einer Fahrtrajektorie basierend auf Informationen zur befahrbaren Fahrgasse mittels der Recheneinheit, die eine Strategie des bestärkenden Lernens implementiert;

- Abspeichern der ermittelten Fahrtrajektorie in einer Speichereinheit.