DE102020215302A1 - Dynamikabhängige Verhaltensplanung für zumindest teilweise automatisiert fahrende Fahrzeuge - Google Patents

Dynamikabhängige Verhaltensplanung für zumindest teilweise automatisiert fahrende Fahrzeuge Download PDF

Info

Publication number
DE102020215302A1
DE102020215302A1 DE102020215302.7A DE102020215302A DE102020215302A1 DE 102020215302 A1 DE102020215302 A1 DE 102020215302A1 DE 102020215302 A DE102020215302 A DE 102020215302A DE 102020215302 A1 DE102020215302 A1 DE 102020215302A1
Authority
DE
Germany
Prior art keywords
maneuver
vehicle
driving
learning
target vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102020215302.7A
Other languages
English (en)
Inventor
Seyed Jalal Etesami
Martin Stoll
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE102020215302.7A priority Critical patent/DE102020215302A1/de
Priority to US18/252,457 priority patent/US20240001955A1/en
Priority to CN202180081437.0A priority patent/CN116547186A/zh
Priority to PCT/EP2021/083643 priority patent/WO2022117588A1/de
Publication of DE102020215302A1 publication Critical patent/DE102020215302A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/0098Details of control systems ensuring comfort, safety or stability not otherwise provided for
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/08Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
    • B60W30/09Taking automatic action to avoid collision, e.g. braking and steering
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/14Adaptive cruise control
    • B60W30/16Control of distance between vehicles, e.g. keeping a distance to preceding vehicle
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/18Propelling the vehicle
    • B60W30/18009Propelling the vehicle related to particular drive situations
    • B60W30/18163Lane change; Overtaking manoeuvres
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0002Automatic control, details of type of controller or control system architecture
    • B60W2050/0018Method for the design of a control system
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0001Details of the control system
    • B60W2050/0019Control system elements or transfer functions
    • B60W2050/0028Mathematical models, e.g. for simulation
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0062Adapting control system settings
    • B60W2050/0075Automatic parameter input, automatic initialising or calibrating means
    • B60W2050/0083Setting, resetting, calibration

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)
  • Traffic Control Systems (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

Verfahren (100) zum Trainieren eines Verhaltensplaners (3) für ein zumindest teilweise automatisiert fahrendes Zielfahrzeug (2) auf der Basis von Beobachtungsdaten (4) der Kinematik und/oder Dynamik, die während mindestens einer Testfahrt mit einem Testfahrzeug (1) aufgenommen wurden, mit den Schritten:• aus den Beobachtungsdaten (4) wird mindestens ein Fahrmanöver (5) identifiziert (110), welches das Testfahrzeug (1) von einem Anfangszustand (5a) in einen Endzustand (5b) überführt;• der Manöverendzeitpunkt (6), zu dem das Testfahrzeug (1) den Endzustand (5b) erreicht, wird ermittelt (120);• aus einem Dynamikmodell (7) des Zielfahrzeugs (2) wird eine Manöverdauer (8) abgerufen (130), die das Zielfahrzeug (2) für die Durchführung des identifizierten Fahrmanövers (5) benötigt;• Beobachtungsdaten (4) aus einem Zeitintervall, dessen Ende durch den Manöverendzeitpunkt (6) gegeben ist und dessen Beginn um die Manöverdauer (8) vor dem Manöverendzeitpunkt (6) liegt, werden mit dem identifizieren Fahrmanöver (5) gelabelt (140); mit den gelabelten Beobachtungsdaten (4) wird der Verhaltensplaner (3) darauf trainiert (150), Beobachtungsdaten (4), die einen Zustand des Zielfahrzeugs (2) anzeigen, auf mindestens ein durchzuführendes Fahrmanöver (5) abzubilden.

Description

  • Die vorliegende Erfindung betrifft die Planung von Fahrmanövern für zumindest teilweise automatisiert fahrende Fahrzeuge .
  • Stand der Technik
  • Ein zumindest teilweise automatisiert fahrendes Fahrzeug erfasst fortwährend die Situation, in der es sich befindet, um die Planung von Fahrmanövern für die nähere Zukunft Änderungen dieser Situation anzupassen. Änderungen der Situation, auf die das Fahrzeug reagieren muss, können beispielsweise dadurch bedingt sein, dass das Fahrzeug sich an einen anderen Ort mit anderen Gegebenheiten bewegt. Aber auch Bewegungen anderer Objekte, wie etwa anderer Verkehrsteilnehmer, können die Situation maßgeblich ändern und eine Reaktion erforderlich machen. Die DE 10 2018 210 280 A1 offenbart ein Verfahren, mit dem die Trajektorien von Fremdobjekten prognostiziert werden können, so dass die Trajektorie des eigenen Fahrzeugs entsprechend angepasst werden kann.
  • Auf der Manöverebene trifft ein Verhaltensplaner ausgehend von einer Repräsentation der Situation, in der das Fahrzeug sich befindet, die Entscheidung für ein durchzuführendes Fahrmanöver, wie etwa einen Spurwechsel oder ein Überholmanöver. Die getroffene Entscheidung wird dann an einen Bewegungsplaner weitergereicht. Dieser Bewegungsplaner hat die Aufgabe, eine geeignete Trajektorie für das Fahrzeug zu finden und das Fahrzeug durch Einwirken auf Aktoren dazu zu veranlassen, diese Trajektorie abzufahren.
  • Offenbarung der Erfindung
  • Im Rahmen der Erfindung wurde ein Verfahren zum Trainieren eines Verhaltensplaners für ein zumindest teilweise automatisiertes Fahrzeug entwickelt. Dieses Verfahren verwendet Beobachtungsdaten der Kinematik und/oder Dynamik, die während mindestens einer Testfahrt mit einem Testfahrzeug aufgenommen wurden.
  • Zur Unterscheidung von diesem Testfahrzeug wird das zumindest teilweise automatisierte Fahrzeug im Folgenden als „Zielfahrzeug“ bezeichnet. In der Regel werden die Testfahrten unter der Kontrolle eines menschlichen Fahrers absolviert. Das Testfahrzeug muss dann ein Fahrzeug sein, das für die Steuerung durch einen menschlichen Fahrer ausgelegt ist. Insbesondere vollständig automatisiert fahrende Fahrzeuge sind meistens nicht dafür ausgelegt, wahlweise automatisiert oder von einem menschlichen Fahrer gesteuert zu werden.
  • Aus den Beobachtungsdaten wird mindestens ein Fahrmanöver identifiziert, welches das Testfahrzeug von einem Anfangszustand in einen Endzustand überführt. Weiterhin wird der Manöverendzeitpunkt, zu dem das Testfahrzeug den Endzustand erreicht, ermittelt. Hierfür können beliebige vorhandene Mittel verwendet werden.
  • Aus einem Dynamikmodell des Zielfahrzeugs wird eine Manöverdauer abgerufen, die das Zielfahrzeug für die Durchführung des identifizierten Fahrmanövers benötigt. In dem Dynamikmodell ist somit insbesondere die Fahrphysik des Zielfahrzeugs verkörpert, die darüber bestimmt, wie schnell das Zielfahrzeug auf eine entsprechende Anforderung hin seine Kinematik ändern kann.
  • Beobachtungsdaten aus einem Zeitintervall, dessen Ende durch den Manöverendzeitpunkt gegeben ist und dessen Beginn um die Manöverdauer vor dem Manöverendzeitpunkt liegt, werden mit dem identifizieren Fahrmanöver gelabelt. Das bedeutet, dass das Zielfahrzeug, wenn es mit dem identifizierten Fahrmanöver zum ermittelten Manöverendzeitpunkt den durch die Beobachtungsdaten gegebenen Endzustand erreichen soll, innerhalb dieses Zeitintervalls das identifizierte Fahrmanöver ausführen muss.
  • Mit den gelabelten Beobachtungsdaten wird der Verhaltensplaner darauf trainiert, Beobachtungsdaten, die einen Zustand des Zielfahrzeugs anzeigen, auf mindestens ein durchzuführendes Fahrmanöver abzubilden. Dabei muss dieser Zustand des Zielfahrzeugs nicht auf Informationen über die Kinematik und/oder Dynamik des Zielfahrzeugs beschränkt sein, sondern kann auch weitere Informationen über die Situation, in der sich das Zielfahrzeug befindet, enthalten.
  • Beispielsweise können die Beobachtungsdaten anzeigen, dass das Testfahrzeug sich von hinten einem anderen, langsamer vorausfahrenden Fahrzeug nähert. Der Fahrer des Testfahrzeugs hat zu einem bestimmten Zeitpunkt die Spur gewechselt, um das vorausfahrende Fahrzeug zu überholen. Der Verhaltensplaner wird nun darauf trainiert, in der gleichen Situation das Überholmanöver zu dem Zeitpunkt zu beginnen, zu dem dies auf Grund der Fahrphysik des Zielfahrzeugs nötig bzw. angemessen ist.
  • Es wurde erkannt, dass sich die Dynamik des Zielfahrzeugs in der Regel deutlich von der Dynamik des Testfahrzeugs unterscheidet. Dies liegt unter anderem daran, dass automatisiert fahrende Fahrzeuge konstruktiv anders aufgebaut sind als Testfahrzeuge, die von menschlichen Fahrern gesteuert werden. Zugleich unterliegt der automatisierte Fahrbetrieb in vielerlei Hinsicht besonderen regulatorischen Auflagen. So sind beispielsweise Beschleunigungen und Verzögerungen betragsmäßig limitiert, und auch Spurwechsel müssen gemächlicher durchgeführt werden als dies ein menschlicher Fahrer tun würde. Durch die Nutzung des Dynamikmodells können die mit dem Testfahrzeug erhobenen Beobachtungsdaten auf die Gegebenheiten des Zielfahrzeugs „übersetzt“ werden. Damit kann der Verhaltensplaner darauf trainiert werden, unter diesen neuen Gegebenheiten den gewünschten Erfolg zu erzielen, nämlich zu dem gegebenen Manöverendzeitpunkt ein bestimmtes Fahrmanöver abgeschlossen zu haben.
  • Das Dynamikmodell nimmt den Testfahrten zugleich eine durch den persönlichen Fahrstil des menschlichen Testfahrers bedingte subjektive Komponente. Derartige Fahrstile unterscheiden sich hauptsächlich in der Dynamik, mit der beispielsweise ein Überholvorgang durchgeführt wird. Der bloße Weg, den das Testfahrzeug verfolgt, ist hingegen mehr oder weniger vorgegeben und durch den individuellen Fahrstil nur in geringem Umfang änderbar.
  • Mit Hilfe des Dynamikmodells lässt sich der Verhaltensplaner weiterhin nachtrainieren oder umtrainieren, wenn sich die Fahrphysik des Zielfahrzeugs im Nachhinein ändert. Wird beispielsweise ein Anhänger an das Zielfahrzeug angehängt, ändern sich sowohl die Massenträgheit als auch der Luftwiderstand des Zielfahrzeugs. Weiterhin unterliegen etwa abrupte Richtungswechsel zusätzlichen Einschränkungen, damit der Anhänger nicht abreißt oder umkippt. Um den Verhaltensplaner an das Fahren mit Anhänger anzupassen, ist lediglich ein neues Dynamikmodell erforderlich. Mit diesem Dynamikmodell und den bereits vorhandenen Beobachtungsdaten kann der Verhaltensplaner entsprechend trainiert werden. Das „Einfahren“ zusätzlicher Beobachtungsdaten mit einem Testfahrzeug mit Anhänger entfällt.
  • Ein derartiges Nachtrainieren oder Umtrainieren kann auch beispielsweise während der Entwicklung eines automatisiert fahrenden Zielfahrzeugs erforderlich werden. Wenn beispielsweise die automatisierte Fahrfunktion einerseits und die Karosserie andererseits parallel zueinander entwickelt werden, können zu einem Zeitpunkt, zu dem die automatisierte Fahrfunktion schon zu einem großen Teil trainiert ist, noch konstruktive Änderungen am Fahrzeug nötig werden. Wird das Zielfahrzeug beispielsweise batterieelektrisch angetrieben, kann es gewünscht sein, ein leicht verändertes Fahrzeugmodell bereitzustellen, in dem eine zweite Antriebsbatterie für eine deutlich größere Reichweite sorgt. Diese zweite Antriebsbatterie fügt dem Zielfahrzeug an einer bestimmten Stelle ein erhebliches Gewicht hinzu. Dieses Gewicht verändert die Massenträgheit sowie die Trägheitsmomente des Zielfahrzeugs. Möglicherweise wird auch der Schwerpunkt des Zielfahrzeugs verschoben. Derartige Veränderungen wirken sich auf die Fahrphysik des Zielfahrzeugs aus.
  • Schließlich wird es auch erleichtert, den Verhaltensplaner auf bestimmte widrige Witterungsbedingungen, wie etwa extreme Glätte, zu trainieren. Derartige Bedingungen treten vergleichsweise selten auf, so dass es schwierig wäre, ein umfangreiches Pensum an Testfahrten unter diesen Bedingungen zu wiederholen. Ein neues Dynamikmodell für diese Bedingungen, mit denen dann die vorhandenen Beobachtungsdaten „übersetzt“ werden können, ist hingegen mit deutlich weniger Testfahrten erhältlich.
  • Das hier beschriebene automatisierte Labeln ist weiterhin auch dann vorteilhaft, wenn die Dynamik des Zielfahrzeugs zwar identisch mit der Dynamik des Testfahrzeugs ist, aber ein geplantes Verhalten grundsätzlich mit Latenzen umgesetzt wird. So kann beispielsweise das auf Umfelddaten vom Zeitpunkt t geplante Verhalten mit einer Verzögerung a, also erst zu einem Zeitpunkt t+a, an die Aktorik kommuniziert werden. Es kann dann eine weitere Verzögerung b eintreten, so dass das geplante Verhalten erst zu einem Zeitpunkt t+a+b in der tatsächlich abgefahrenen Trajektorie sichtbar wird. Die in der Literatur häufig genutzte Näherung, dass das Verhalten bzw. Manöver aus direkt aufeinander folgenden Beobachtungen abgeleitet und korrekt gelabelt werden kann, ist dann nicht mehr gültig.
  • In einer besonders vorteilhaften Ausgestaltung wird das Fahrmanöver mit einem trainierten Klassifikatormodell identifiziert. Dieses Klassifikatormodell bildet eine Zeitreihe von Beobachtungsdaten auf mindestens ein Fahrmanöver ab, das mit dieser Zeitreihe im Einklang steht. Derartige Klassifikatormodelle sind im Wesentlichen unabhängig von den Gegebenheiten konkreter Fahrzeuge, da das durchgeführte Fahrmanöver hauptsächlich durch die reine Kinematik festgelegt ist. Das Klassifikatormodell kann beispielsweise ein Machine Learning-Modell sein. Dies ist jedoch nicht zwingend erforderlich.
  • In einer weiteren vorteilhaften Ausgestaltung wird ein Dynamikmodell des Zielfahrzeugs gewählt, das dazu ausgebildet ist, eine Kombination aus einem Anfangszustand des Zielfahrzeugs und einer Angabe eines Fahrmanövers auf eine Manöverdauer abzubilden. Viele Fahrmanöver können ausgehend von vielen Anfangszuständen gestartet werden, wobei die erforderliche Manöverdauer vom Anfangszustand abhängt. So dauert etwa eine Änderung der Geschwindigkeit von 100 km/h auf 200 km/h länger als die anfängliche Beschleunigung von 0 km/h auf 100 km/h, weil zu der anfänglich eingebrachten kinetischen Energie noch einmal das Dreifache hinzukommt und außerdem noch der Luftwiderstand quadratisch mit der Geschwindigkeit zunimmt.
  • Die Kombination, die von dem Dynamikmodell auf die Manöverdauer abgebildet wird, kann weiterhin zusätzlich mindestens einen einstellbaren Parameter des Verhaltensplaners des Zielfahrzeugs enthalten. So kann beispielsweise ein Verhaltensplaner für ein batterieelektrisches Fahrzeug einen Sport-Modus mit spritziger Beschleunigung und maximaler Geschwindigkeit und einen Eco-Modus mit gemächlicherer Beschleunigung und Geschwindigkeit, dafür aber größerer Reichweite haben. Darüber hinaus kann auch jedes einzelne Fahrmanöver selbst parametriert sein.
  • Mindestens ein Fahrmanöver kann beispielsweise
    • • einen Spurwechsel auf eine benachbarte Fahrspur; und/oder
    • • eine Änderung der Fahrgeschwindigkeit um einen vorgegebenen Betrag; und/oder
    • • das Anhalten des Fahrzeugs an einer definierten Stelle; und/oder
    • • das Hinterherfahren hinter einem Fremdfahrzeug; und/oder
    • • eine Notbremsung des Fahrzeugs
    umfassen. Dabei kann etwa die Änderung der Fahrgeschwindigkeit oder die Notbremsung mit der jeweils maximal möglichen Beschleunigung bzw. Verzögerung parametriert sein. Das Hinterherfahren hinter einem Fremdfahrzeug kann beispielsweise mit einem zeitlichen oder räumlichen Soll-Abstand zum Fremdfahrzeug parametriert sein.
  • Mit dem Training des Verhaltensplaners wird letztendlich das Ziel verfolgt, dass das zumindest teilweise automatisierte Fahrzeug in möglichst vielen verschiedenen Situationen das Verhalten zeigt, das der jeweiligen Situation angemessen und für den übrigen Verkehr nicht übermäßig überraschend ist. Daher bezieht sich die Erfindung auch auf ein Verfahren mit der vollständigen Wirkkette bis hin zur Ansteuerung des Fahrzeugs.
  • Dieses Verfahren beginnt damit, dass ein Verhaltensplaner für das zumindest teilweise automatisierte Fahrzeug mit dem zuvor beschriebenen Verfahren trainiert wird. Mit mindestens einem Sensor des Fahrzeugs werden anschließend Beobachtungsdaten der Kinematik und/oder Dynamik des Fahrzeugs erfasst. Zusätzlich können die Beobachtungsdaten auch beispielsweise Informationen aus der Umgebung des Fahrzeugs und/oder Informationen, die anhand der aktuellen Position des Fahrzeugs aus einer digitalen Karte abgerufen werden, enthalten. So sind viele Fahrmanöver nur dann möglich, wenn die Verkehrssituation es zulässt und beispielsweise der Teil des Verkehrsraums, in den das Fahrzeug einfahren soll, frei ist.
  • Die Beobachtungsdaten werden mit dem Verhaltensplaner auf mindestens ein durchzuführendes Fahrmanöver abgebildet. Mindestens ein auf die Fahrdynamik des Fahrzeugs wirkender Aktor wird anschließend so angesteuert, dass das Fahrzeug das Fahrmanöver ausführt.
  • Die Erfindung bezieht sich auch auf ein weiteres Verfahren zum Trainieren eines Dynamikmodells eines Zielfahrzeugs für den Einsatz beim Training eines Verhaltensplaners.
  • Unter dem Dynamikmodell wird insbesondere ein Machine Learning-Modell verstanden. Ein Machine Learning-Modell verkörpert eine mit anpassbaren Parametern parametrierte Funktion mit großer Kraft zur Verallgemeinerung. Die Parameter können beim Training eines Machine Learning-Modells insbesondere dergestalt angepasst werden, dass bei Eingabe von Lern-Eingaben in das Modell die zu den Lern-Eingaben gehörigen, vorab bekannten Soll-Ausgaben möglichst gut reproduziert werden. Das Machine Learning-Modell kann insbesondere ein künstliches neuronales Netzwerk, KNN, beinhalten, und/oder es kann ein KNN sein.
  • Im Rahmen dieses Verfahrens werden Lern-Anfangszustände und Lern-Fahrmanöver bereitgestellt. Ausgehend von den Lern-Anfangszuständen werden die Lern-Fahrmanöver an dem Zielfahrzeug, und/oder an einem Simulationsmodell des Zielfahrzeugs, durchgeführt. Hierbei wird die Zeitdauer erfasst, die für die Durchführung der Lern-Fahrmanöver jeweils benötigt wird.
  • Diese Zeitdauer wird als Lern-Manöverdauer festgelegt und bildet somit die „ground truth“ für das Training des Dynamikmodells.
  • Für das eigentliche Training werden die Lern-Anfangszustände und Lern-Fahrmanöver dem Dynamikmodell zugeführt und von dem Dynamikmodell jeweils auf eine Manöverdauer abgebildet. Die Übereinstimmung der hierbei erhaltenen Manöverdauer mit der zum jeweiligen Lern-Anfangszustand und Lern-Fahrmanöver gehörenden Lern-Manöverdauer wird mit einer vorgegebenen Kostenfunktion bewertet. Parameter, die das Verhalten des Dynamikmodells charakterisieren, werden optimiert mit dem Ziel, dass die weitere Verarbeitung von Lern-Anfangszuständen und Lern-Fahrmanövern zu einer besseren Bewertung durch die Kostenfunktion führt.
  • Der Katalog der insgesamt zur Verfügung stehenden Fahrmanöver ist vorab mehr oder weniger festgelegt. Völlig ungesehene Fahrmanöver werden im späteren Fahrbetrieb des Zielfahrzeugs nicht auftreten. Hingegen werden im späteren Fahrbetrieb viel mehr Anfangszustände auftreten als Lern-Anfangszustände während des Trainings verwendet wurden. Die Kraft des Dynamikmodells zur Verallgemeinerung kann also genutzt werden, um auch für bislang ungesehene Anfangszustände zutreffende Manöverdauern vorherzusagen.
  • Weitere, die Erfindung verbessernde Maßnahmen werden nachstehend gemeinsam mit der Beschreibung der bevorzugten Ausführungsbeispiele der Erfindung anhand von Figuren näher dargestellt.
  • Ausführungsbeispiele
  • Es zeigt:
    • 1 Ausführungsbeispiel des Verfahrens 100 zum Trainieren eines Verhaltensplaners 3;
    • 2 Ausführungsbeispiel des Verfahrens 200 mit der vollständigen Wirkkette bis zur Ansteuerung des Fahrzeugs 2;
    • 3 Ausführungsbeispiel des Verfahrens 300 zum Trainieren eines Dynamikmodells 7.
  • 1 ist ein schematisches Ablaufdiagramm eines Ausführungsbeispiels des Verfahrens 100 zum Trainieren eines Verhaltensplaners 3 für ein zumindest teilweise automatisiert fahrendes Zielfahrzeug 2. Für das Training werden Beobachtungsdaten 4 der Kinematik und/oder Dynamik, die während mindestens einer Testfahrt mit einem Testfahrzeug 1 aufgenommen wurden, verwendet.
  • In Schritt 110 wird aus den Beobachtungsdaten 4 mindestens ein Fahrmanöver 5 identifiziert, welches das Testfahrzeug 1 von einem Anfangszustand 5a in einen Endzustand 5b überführt. Dabei kann gemäß Block 111 insbesondere beispielsweise das Fahrmanöver 5 mit einem trainierten Klassifikatormodell identifiziert werden. Dieses Klassifikatormodell bildet eine Zeitreihe von Beobachtungsdaten 4 auf mindestens ein Fahrmanöver 5 ab, das mit dieser Zeitreihe im Einklang steht.
  • In Schritt 120 wird der Manöverendzeitpunkt 6, zu dem das Testfahrzeug 1 den Endzustand 5b erreicht, ermittelt. In Schritt 130 wird aus einem Dynamikmodell 7 des Zielfahrzeugs 2 eine Manöverdauer 8 abgerufen, die das Zielfahrzeug 2 für die Durchführung des identifizierten Fahrmanövers 5 benötigt. Hierbei kann insbesondere beispielsweise gemäß Block 131 ein Dynamikmodell 7 des Zielfahrzeugs 2 gewählt werden, das dazu ausgebildet ist, eine Kombination aus einem Anfangszustand 5a des Zielfahrzeugs 2 und einer Angabe eines Fahrmanövers 5 auf eine Manöverdauer 8 abzubilden.
  • In Schritt 140 werden Beobachtungsdaten 4 aus einem Zeitintervall, dessen Ende durch den Manöverendzeitpunkt 6 gegeben ist und dessen Beginn um die Manöverdauer 8 vor dem Manöverendzeitpunkt 6 liegt, mit dem identifizieren Fahrmanöver 5 gelabelt. Mit den gelabelten Beobachtungsdaten 4 wird in Schritt 150 der Verhaltensplaner 3 darauf trainiert, Beobachtungsdaten 4, die einen Zustand des Zielfahrzeugs 2 anzeigen, auf mindestens ein durchzuführendes Fahrmanöver 5 abzubilden.
  • 2 ist ein schematisches Ablaufdiagramm eines Ausführungsbeispiels des Verfahrens 200 mit der vollständigen Wirkkette bis zur Ansteuerung eines zumindest teilweise automatisiert fahrenden Fahrzeugs 2.
  • In Schritt 210 wird ein Verhaltensplaner 3 für das Fahrzeug 2 mit dem zuvor beschriebenen Verfahren (100) nach einem der Ansprüche 1 bis 5 trainiert. In Schritt 220 werden mit mindestens einem Sensor 2a des Fahrzeugs 2 Beobachtungsdaten 4 der Kinematik und/oder Dynamik des Fahrzeugs 2 erfasst.
  • In Schritt 230 werden die Beobachtungsdaten 4 mit dem Verhaltensplaner 3 auf mindestens ein durchzuführendes Fahrmanöver 5 abgebildet. mindestens ein auf die Fahrdynamik des Fahrzeugs 2 wirkender Aktor 2b wird in Schritt 240 so angesteuert, dass das Fahrzeug 2 das Fahrmanöver 5 durchführt.
  • 3 ist ein schematisches Ablaufdiagramm eines Ausführungsbeispiels des Verfahrens 300 zum Trainieren eines Dynamikmodells 7 eines Zielfahrzeugs 2.
  • In Schritt 310 werden es werden Lern-Anfangszustände 5a' und Lern-Fahrmanöver 5' bereitgestellt. In Schritt 320 werden ausgehend von den Lern-Anfangszuständen 5a' die Lern-Fahrmanöver 5' an dem Zielfahrzeug 2, und/oder an einem Simulationsmodell des Zielfahrzeugs 2, durchgeführt. Die für die Durchführung der Lern-Fahrmanöver 5' jeweils benötigte Zeitdauer wird in Schritt 330 ermittelt und als Lern-Manöverdauer 8' festgelegt.
  • In Schritt 340 werden die Lern-Anfangszustände 5a' und Lern-Fahrmanöver 5' dem Dynamikmodell 7 zugeführt und von dem Dynamikmodell 7 jeweils auf eine Manöverdauer 8 abgebildet. Die Übereinstimmung der Manöverdauer 8 mit der zum jeweiligen Lern-Anfangszustand 5a' und Lern-Fahrmanöver 5' gehörenden Lern-Manöverdauer 8' wird in Schritt 350 mit einer vorgegebenen Kostenfunktion 9 bewertet. Parameter 7a, die das Verhalten des Dynamikmodells 7 charakterisieren, werden in Schritt 360 optimiert mit dem Ziel, dass die weitere Verarbeitung von Lern-Anfangszuständen 5a' und Lern-Fahrmanövern 5' zu einer besseren Bewertung 9a durch die Kostenfunktion 9 führt. Der fertig trainierte Zustand der Parameter 7a ist mit dem Bezugszeichen 7a* bezeichnet.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • DE 102018210280 A1 [0002]

Claims (10)

  1. Verfahren (100) zum Trainieren eines Verhaltensplaners (3) für ein zumindest teilweise automatisiert fahrendes Zielfahrzeug (2) auf der Basis von Beobachtungsdaten (4) der Kinematik und/oder Dynamik, die während mindestens einer Testfahrt mit einem Testfahrzeug (1) aufgenommen wurden, mit den Schritten: • aus den Beobachtungsdaten (4) wird mindestens ein Fahrmanöver (5) identifiziert (110), welches das Testfahrzeug (1) von einem Anfangszustand (5a) in einen Endzustand (5b) überführt; • der Manöverendzeitpunkt (6), zu dem das Testfahrzeug (1) den Endzustand (5b) erreicht, wird ermittelt (120); • aus einem Dynamikmodell (7) des Zielfahrzeugs (2) wird eine Manöverdauer (8) abgerufen (130), die das Zielfahrzeug (2) für die Durchführung des identifizierten Fahrmanövers (5) benötigt; • Beobachtungsdaten (4) aus einem Zeitintervall, dessen Ende durch den Manöverendzeitpunkt (6) gegeben ist und dessen Beginn um die Manöverdauer (8) vor dem Manöverendzeitpunkt (6) liegt, werden mit dem identifizieren Fahrmanöver (5) gelabelt (140); • mit den gelabelten Beobachtungsdaten (4) wird der Verhaltensplaner (3) darauf trainiert (150), Beobachtungsdaten (4), die einen Zustand des Zielfahrzeugs (2) anzeigen, auf mindestens ein durchzuführendes Fahrmanöver (5) abzubilden.
  2. Verfahren (100) nach Anspruch 1, wobei das Fahrmanöver (5) mit einem trainierten Klassifikatormodell identifiziert wird (111), wobei dieses Klassifikatormodell eine Zeitreihe von Beobachtungsdaten (4) auf mindestens ein Fahrmanöver (5) abbildet, das mit dieser Zeitreihe im Einklang steht.
  3. Verfahren (100) nach einem der Ansprüche 1 bis 2, wobei ein Dynamikmodell (7) des Zielfahrzeugs (2) gewählt wird (131), das dazu ausgebildet ist, eine Kombination aus einem Anfangszustand (5a) des Zielfahrzeugs (2) und einer Angabe eines Fahrmanövers (5) auf eine Manöverdauer (8) abzubilden.
  4. Verfahren (100) nach Anspruch 3, wobei die Kombination zusätzlich mindestens einen einstellbaren Parameter des Verhaltensplaners (3) des Zielfahrzeugs (2) enthält.
  5. Verfahren (100) nach einem der Ansprüche 1 bis 4, wobei mindestens ein Fahrmanöver (5) • einen Spurwechsel auf eine benachbarte Fahrspur; und/oder • eine Änderung der Fahrgeschwindigkeit um einen vorgegebenen Betrag; und/oder • das Anhalten des Fahrzeugs an einer definierten Stelle; und/oder • das Hinterherfahren hinter einem Fremdfahrzeug; und/oder • eine Notbremsung des Fahrzeugs umfasst.
  6. Verfahren (200) mit den Schritten: • ein Verhaltensplaner (3) für ein zumindest teilweise automatisiert fahrendes Fahrzeug (2) wird mit dem Verfahren (100) nach einem der Ansprüche 1 bis 5 trainiert (210); • mit mindestens einem Sensor (2a) des Fahrzeugs (2) werden Beobachtungsdaten (4) der Kinematik und/oder Dynamik des Fahrzeugs (2) erfasst (220); • die Beobachtungsdaten (4) werden mit dem Verhaltensplaner (3) auf mindestens ein durchzuführendes Fahrmanöver (5) abgebildet (230); • mindestens ein auf die Fahrdynamik des Fahrzeugs (2) wirkender Aktor (2b) wird so angesteuert (240), dass das Fahrzeug (2) das Fahrmanöver (5) durchführt.
  7. Verfahren (300) zum Trainieren eines Dynamikmodells (7) eines Zielfahrzeugs (2) für den Einsatz in dem Verfahren (100) nach einem der Ansprüche 1 bis 5 mit den Schritten: • es werden Lern-Anfangszustände (5a') und Lern-Fahrmanöver (5') bereitgestellt (310); • ausgehend von den Lern-Anfangszuständen (5a') werden die Lern-Fahrmanöver (5') an dem Zielfahrzeug (2), und/oder an einem Simulationsmodell des Zielfahrzeugs (2), durchgeführt (320); • die für die Durchführung der Lern-Fahrmanöver (5') jeweils benötigte Zeitdauer wird ermittelt und als Lern-Manöverdauer (8') festgelegt (330); • die Lern-Anfangszustände (5a') und Lern-Fahrmanöver (5') werden dem Dynamikmodell (7) zugeführt und von dem Dynamikmodell (7) jeweils auf eine Manöverdauer (8) abgebildet (340); • die Übereinstimmung der Manöverdauer (8) mit der zum jeweiligen Lern-Anfangszustand (5a') und Lern-Fahrmanöver (5') gehörenden Lern-Manöverdauer (8') wird mit einer vorgegebenen Kostenfunktion (9) bewertet (350); • Parameter (7a), die das Verhalten des Dynamikmodells (7) charakterisieren, werden optimiert (360) mit dem Ziel, dass die weitere Verarbeitung von Lern-Anfangszuständen (5a') und Lern-Fahrmanövern (5') zu einer besseren Bewertung (9a) durch die Kostenfunktion (9) führt.
  8. Computerprogramm, enthaltend maschinenlesbare Anweisungen, die, wenn sie auf einem oder mehreren Computern ausgeführt werden, den oder die Computer dazu veranlassen, ein Verfahren (100, 200, 300) nach einem der Ansprüche 1 bis 7 auszuführen.
  9. Maschinenlesbarer Datenträger und/oder Downloadprodukt mit dem Computerprogramm nach Anspruch 8.
  10. Computer mit dem Computerprogramm nach Anspruch 8, und/oder mit dem maschinenlesbaren Datenträger und/oder Downloadprodukt nach Anspruch 9.
DE102020215302.7A 2020-12-03 2020-12-03 Dynamikabhängige Verhaltensplanung für zumindest teilweise automatisiert fahrende Fahrzeuge Pending DE102020215302A1 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE102020215302.7A DE102020215302A1 (de) 2020-12-03 2020-12-03 Dynamikabhängige Verhaltensplanung für zumindest teilweise automatisiert fahrende Fahrzeuge
US18/252,457 US20240001955A1 (en) 2020-12-03 2021-11-30 Dynamics-Dependent Behavioral Planning for at least Partially Self-Driving Vehicles
CN202180081437.0A CN116547186A (zh) 2020-12-03 2021-11-30 针对至少部分自动化行驶的车辆的与动力学有关的行为规划
PCT/EP2021/083643 WO2022117588A1 (de) 2020-12-03 2021-11-30 Dynamikabhängige verhaltensplanung für zumindest teilweise automatisiert fahrende fahrzeuge

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102020215302.7A DE102020215302A1 (de) 2020-12-03 2020-12-03 Dynamikabhängige Verhaltensplanung für zumindest teilweise automatisiert fahrende Fahrzeuge

Publications (1)

Publication Number Publication Date
DE102020215302A1 true DE102020215302A1 (de) 2022-06-09

Family

ID=78829765

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102020215302.7A Pending DE102020215302A1 (de) 2020-12-03 2020-12-03 Dynamikabhängige Verhaltensplanung für zumindest teilweise automatisiert fahrende Fahrzeuge

Country Status (4)

Country Link
US (1) US20240001955A1 (de)
CN (1) CN116547186A (de)
DE (1) DE102020215302A1 (de)
WO (1) WO2022117588A1 (de)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018210280A1 (de) 2018-06-25 2020-01-02 Robert Bosch Gmbh Anpassung der Trajektorie eines Ego-Fahrzeugs an bewegte Fremdobjekte

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018217004A1 (de) * 2017-10-12 2019-04-18 Honda Motor Co., Ltd. Autonome Fahrzeugstrategiegenerierung
EP3688675B1 (de) * 2017-10-27 2024-05-08 DeepMind Technologies Limited Verteilungsverstärkungslernen für kontinuierliche steuerungsaufgaben
US11117584B2 (en) * 2018-04-27 2021-09-14 Honda Motor Co., Ltd. Merge behavior systems and methods for mainline vehicles
US10776542B2 (en) * 2019-01-30 2020-09-15 StradVision, Inc. Method and device for calibrating physics engine of virtual world simulator to be used for learning of deep learning-based device, and a learning method and learning device for real state network used therefor
DE102019206052A1 (de) * 2019-04-26 2020-10-29 Robert Bosch Gmbh Situationsadaptives Trainieren eines trainierbaren Moduls mit aktivem Lernen

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018210280A1 (de) 2018-06-25 2020-01-02 Robert Bosch Gmbh Anpassung der Trajektorie eines Ego-Fahrzeugs an bewegte Fremdobjekte

Also Published As

Publication number Publication date
US20240001955A1 (en) 2024-01-04
CN116547186A (zh) 2023-08-04
WO2022117588A1 (de) 2022-06-09

Similar Documents

Publication Publication Date Title
EP3625788A1 (de) Verfahren zum betreiben einer fahrerassistenzvorrichtung eines kraftfahrzeugs, fahrerassistenzvorrichtung und kraftfahrzeug
DE102009014153A1 (de) Querführungsassistenz zur Unterstützung des Fahrers eines Kraftfahrzeugs
EP3811351A1 (de) Anpassung der trajektorie eines ego-fahrzeugs an bewegte fremdobjekte
WO2008022845A1 (de) Fahrerassistenzsystem
EP3243717B1 (de) Kraftfahrzeug-steuervorrichtung und verfahren zum betreiben der steuervorrichtung zum autonomen führen eines kraftfahrzeugs
DE102019118366A1 (de) Verfahren sowie Steuergerät für ein System zum Steuern eines Kraftfahrzeugs
DE102016202590A1 (de) Verfahren und Vorrichtung zum Betreiben eines automatisierten Kraftfahrzeugs
DE102019216836A1 (de) Verfahren zum Trainieren wenigstens eines Algorithmus für ein Steuergerät eines Kraftfahrzeugs, Computerprogrammprodukt sowie Kraftfahrzeug
DE102016215528A1 (de) Automatisiertes Betreiben eines Kraftfahrzeugs
DE102019219241A1 (de) Verfahren zum Erstellen eines Verkehrsteilnehmeralgorithmus zur Computersimulation von Verkehrsteilnehmern, Verfahren zum Trainieren wenigstens eines Algorithmus für ein Steuergerät eines Kraftfahrzeugs, Computerprogrammprodukt sowie Kraftfahrzeug
DE102020215324A1 (de) Auswahl von Fahrmanövern für zumindest teilweise automatisiert fahrende Fahrzeuge
DE102009023489A1 (de) Verfahren und Vorrichtung zur Geschwindigkeitsregelung eines Fahrzeugs
DE102016205260A1 (de) Verfahren zur automatisierten Anpassung der Geschwindigkeit eines Fahrzeugs
DE102020001182A1 (de) Reichweitenprognose
DE102011088768B4 (de) Kraftfahrzeug mit mindestens einem fahrstabilitätsbezogenen Fahrerassistenzsystem
DE102014018450A1 (de) Verfahren und System zum Trainieren des Fahrverhaltens von Kfz-Fahrern
WO2010045903A1 (de) Vorrichtung und verfahren zur steuerung und/oder regelung eines fahrzeugs unter verwendung von informationen über fahrzeuge benachbarter fahrspuren
DE102018007293A1 (de) Verfahren zum Betrieb eines im autonomen Fahrbetrieb fahrenden Fahrzeuges
DE102021000792A1 (de) Verfahren zum Betrieb eines Fahrzeuges
DE102020215302A1 (de) Dynamikabhängige Verhaltensplanung für zumindest teilweise automatisiert fahrende Fahrzeuge
DE102020202540A1 (de) Verfahren zum Trainieren wenigstens eines Algorithmus für ein Steuergerät eines Kraftfahrzeugs, Computerprogrammprodukt sowie Kraftfahrzeug
DE102013209787A1 (de) Verfahren zur Fahrertypbestimmung und Steuerungseinrichtung
DE102022100664A1 (de) Verfahren, Steuervorrichtung und Computerprogramm zum Steuern einer Längsführung eines Fahrzeugs
DE102020207897A1 (de) Situationsangepasste Ansteuerung für Fahrassistenzsysteme und Systeme zum zumindest teilweise automatisierten Führen von Fahrzeugen
DE102016014883A1 (de) Verfahren zum Erstellen einer Schaltprognose für eine Ampel