DE102018210280A1 - Anpassung der Trajektorie eines Ego-Fahrzeugs an bewegte Fremdobjekte - Google Patents

Anpassung der Trajektorie eines Ego-Fahrzeugs an bewegte Fremdobjekte Download PDF

Info

Publication number
DE102018210280A1
DE102018210280A1 DE102018210280.5A DE102018210280A DE102018210280A1 DE 102018210280 A1 DE102018210280 A1 DE 102018210280A1 DE 102018210280 A DE102018210280 A DE 102018210280A DE 102018210280 A1 DE102018210280 A1 DE 102018210280A1
Authority
DE
Germany
Prior art keywords
foreign objects
ego vehicle
movement
determined
vehicle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102018210280.5A
Other languages
English (en)
Inventor
Seyed Jalal Etesami
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE102018210280.5A priority Critical patent/DE102018210280A1/de
Priority to US15/734,415 priority patent/US11858506B2/en
Priority to CN201980042562.3A priority patent/CN112292719B/zh
Priority to EP19727327.9A priority patent/EP3811351A1/de
Priority to PCT/EP2019/063232 priority patent/WO2020001867A1/de
Publication of DE102018210280A1 publication Critical patent/DE102018210280A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units, or advanced driver assistance systems for ensuring comfort, stability and safety or drive control systems for propelling or retarding the vehicle
    • B60W30/08Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
    • B60W30/095Predicting travel path or likelihood of collision
    • B60W30/0956Predicting travel path or likelihood of collision the prediction being responsive to traffic or environmental parameters
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • B60W60/0011Planning or execution of driving tasks involving control alternatives for a single driving scenario, e.g. planning several paths to avoid obstacles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/092Reinforcement learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/16Anti-collision systems
    • G08G1/166Anti-collision systems for active traffic, e.g. moving vehicles, pedestrians, bikes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2554/00Input parameters relating to objects
    • B60W2554/40Dynamic objects, e.g. animals, windblown objects
    • B60W2554/404Characteristics
    • B60W2554/4049Relationship among other objects, e.g. converging dynamic objects
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2556/00Input parameters relating to data
    • B60W2556/20Data confidence level
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2556/00Input parameters relating to data
    • B60W2556/45External transmission of data to or from the vehicle
    • B60W2556/65Data transmitted between vehicles

Abstract

Verfahren (100, 200) zur Vorhersage der Trajektorien (2a-4a) von Fremdobjekten (2-4) im Umfeld (11) eines Ego-Fahrzeugs (1), sowie zur Bestimmung einer daran angepassten eigenen künftigen Trajektorie (1a) für das Ego-Fahrzeug (1), mit den Schritten:• die Fremdobjekte (2-4) werden identifiziert (110);• es wird ermittelt (120), auf welches Nahziel (2b-4b) die Bewegung eines jeden der Fremdobjekte (2-4) hinführt und nach welchen grundlegenden Regeln (2c-4c) diese Bewegung abläuft;• es wird ermittelt (130), auf welches Nahziel (1b) die Bewegung des Ego-Fahrzeugs (1) hinführt und nach welchen grundlegenden Regeln (1c) diese Bewegung abläuft;• für das Ego-Fahrzeug (1) sowie für die Fremdobjekte (2-4) wird jeweils eine Gütefunktion Raufgestellt (140);• für das Ego-Fahrzeug (1) sowie für die Fremdobjekte (2-4) wird jeweils ein Gütemaß Qaufgestellt (150);• es werden diejenigen optimalen Bewegungsstrategien πdes Ego-Fahrzeugs und der Fremdobjekte (2-4) ermittelt (160), die die Gütemaße Q1-4 maximieren;• aus den optimalen Bewegungsstrategien πwerden die gesuchten Trajektorien (1a-4a) ermittelt (170).Verfahren (300) zur Steuerung des Ego-Fahrzeugs 1.Zugehöriges Computerprogramm.

Description

  • Die vorliegende Erfindung betrifft die Trajektorienplanung für das zumindest teilweise automatisierte Verfahren insbesondere im Mischverkehr mit menschlich gesteuerten Fremdobjekten.
  • Stand der Technik
  • Fahrzeuge, die sich zumindest teilweise automatisiert im Straßenverkehr bewegen, werden nicht schlagartig die von Menschen gesteuerten Fahrzeuge verdrängen und auch nicht auf separaten Trassen vom menschlich gesteuerten Verkehr isoliert sein. Vielmehr werden sich diese Fahrzeuge im Mischverkehr mit menschlich gesteuerten Fremdobjekten sicher bewegen müssen, wobei diese Fremdobjekte auch etwa Fußgänger als schwächere Verkehrsteilnehmer umfassen. Bei menschlich gesteuerten Fremdobjekten besteht immer eine Unsicherheit dahingehend, welche Bewegungsaktion diese Fremdobjekte als nächstes durchführen. Ein Steuerungssystem für das zumindest teilweise automatisierte Fahren ist also darauf angewiesen, sich das künftige Verhalten von Fremdobjekten zumindest teilweise aus der Beobachtung des bisherigen Verhaltens zu erschließen.
  • Die WO 2017/197 170 A1 offenbart eine Steuereinheit für eine bewegte autonome Einheit, die ein Roboter oder auch ein Fahrzeug sein kann. Die Steuereinheit bestimmt zunächst eine Grundtrajektorie, mit der das primäre Ziel der autonomen Einheit, wie etwa ein Fahrtziel, verfolgt wird. Anschließend wird die Grundtrajektorie durch ein Sicherheitsmodul dahingehend abgewandelt, dass eine Kollision mit Menschen oder anderen menschlich gesteuerten Einheiten vermieden wird. Hierzu werden die jeweiligen menschlich gesteuerten Bewegungen vorhergesagt.
  • Offenbarung der Erfindung
  • Im Rahmen der Erfindung wurde ein Verfahren zur Vorhersage der Trajektorien von Fremdobjekten im Umfeld eines Ego-Fahrzeugs, sowie zur Bestimmung einer daran angepassten eigenen künftigen Trajektorie für das Ego-Fahrzeug, entwickelt.
  • Das Ego-Fahrzeug ist dasjenige Fahrzeug, auf dessen Trajektorie eingewirkt werden soll, um eine Kollision mit den Fremdobjekten zu vermeiden. Die Fremdobjekte können insbesondere Menschen oder von Menschen gesteuerte Fahrzeuge sein, wie etwa herkömmliche Kraftfahrzeuge oder Fahrräder. Es kommen aber auch nicht oder nur eingeschränkt steuerbare Fremdobjekte in Betracht, wie etwa ein Fahrzeug, das nach dem Abstellen am Hang wegrollt, oder ein Anhänger, der sich von seinem Zugfahrzeug losgerissen hat.
  • Die Fremdobjekte werden zunächst identifiziert. Hierzu kann eine Zeitreihe physikalischer Beobachtungen des Umfelds herangezogen werden, wie beispielsweise eine Abfolge von Kamerabildern oder eine Abfolge von Ereignissen, die ein ereignisbasierter Sensor ausgibt. Es können alternativ oder auch in Kombination Informationen herangezogen werden, die über eine Drahtlosschnittstelle des Fahrzeugs empfangen wurden. Diese Informationen können von den Fremdobjekten selbst übermittelt werden, beispielsweise über eine Vehicle-to-Vehicle (V2V)-Schnittstelle. Die Informationen können aber auch von einer Infrastruktur übermittelt werden, beispielsweise über eine Vehicle-to-Infrastructure (V2I)-Schnittstelle.
  • Identifizieren bedeutet in diesem Zusammenhang, zumindest zu erfassen, welche Fremdobjekte im Umfeld des Ego-Fahrzeugs unabhängig voneinander bewegbar sind. In diesem Zusammenhang auch zu erfassen, worum es sich bei den Fremdobjekten im Einzelnen handelt, ist vorteilhaft, aber nicht zwingend erforderlich.
  • Es wird ermittelt, auf welches Nahziel die Bewegung eines jeden der Fremdobjekte hinführt und nach welchen grundlegenden Regeln diese Bewegung abläuft. Wie diese Ermittlung im Einzelnen durchgeführt wird, richtet sich danach, welche Informationen verfügbar sind. So kann beispielsweise allein aus dem Zeitverlauf der Trajektorie extrapoliert werden, dass bestimmte Nahziele wahrscheinlicher sind als andere. Je mehr zusätzliche Information verwendet wird, desto genauer wird die Vorhersage des Nahziels. Wird beispielsweise erkannt, dass ein Fahrzeug als Fremdobjekt einen Blinker gesetzt hat, dann ist mit hoher Wahrscheinlichkeit ein Abbiegevorgang geplant. Ein Fahrzeug als Fremdobjekt kann aber auch beispielsweise sein aktuelles Nah- oder gar Fernziel direkt per V2V-Kommunikation kundtun.
  • Die grundlegenden Regeln, nach denen die Bewegung der Fremdobjekte abläuft, können insbesondere die Regeln der Straßenverkehrsordnung umfassen und auch vom Typ der Fremdobjekte abhängen. So müssen beispielsweise Fahrzeuge die Fahrbahn benutzen und von zwei Fahrbahnen die rechte. Fußgänger sind hingegen beispielsweise gehalten, auf Gehwegen zu gehen und, wenn Überwege wie Ampeln oder Zebrastreifen für das Überqueren der Fahrbahn vorhanden sind, diese auch zu benutzen.
  • Es wird weiterhin ermittelt, auf welches Nahziel die Bewegung des Ego-Fahrzeugs hinführt und nach welchen grundlegenden Regeln diese Bewegung abläuft. Die grundlegenden Regeln können hier insbesondere wieder die Regeln der Straßenverkehrsordnung umfassen und müssen nicht in allen Situationen gleich sein. So ist beispielsweise die zulässige Höchstgeschwindigkeit gesondert begrenzt, wenn das Fahrzeug einen Anhänger zieht oder mit Schneeketten fährt. Die Ermittlung der grundlegenden Regeln kann also beispielsweise auch eine Analyse der Konfiguration des Ego-Fahrzeugs umfassen.
  • Sowohl für das Ego-Fahrzeug als auch für die Fremdobjekte wird jeweils eine Gütefunktion R1-4 aufgestellt, die einer aus den aktuellen Zuständen des Ego-Fahrzeugs und der Fremdobjekte gebildeten Gesamtsituation x und einer möglichen nächsten Bewegungsaktion a1-4 ein Maß dafür zuordnet, wie gut die Aktion a1-4 in der aktuellen Gesamtsituation x für den jeweils betrachteten Verkehrsteilnehmer ist. Die Gütefunktion R1-4 kann insbesondere beispielsweise ein Maß dafür beinhalten, inwieweit die Bewegungsaktion a1-4 in der Situation x auf die Erreichung des jeweiligen Nahziels und auf die Einhaltung der Regeln hinarbeitet. Dabei sind die von 1 bis 4 reichenden numerischen Indizes nicht einschränkend in Bezug auf die Anzahl der behandelbaren Fremdobjekte zu verstehen, sondern lediglich illustrativ, um das Verfahren anhand eines Beispiels erläutern zu können. Allgemein kann auch von Gütefunktionen Ri und nächsten Bewegungsaktionen ai gesprochen werden.
  • Der Begriff „Zustände“ umfasst allgemein diejenigen Größen, mit denen der Beitrag des Ego-Fahrzeugs, bzw. der Fremdobjekte, zur Verkehrssituation charakterisiert werden kann. Die Zustände können insbesondere Positionen oder auch Zeitableitungen hiervon, also etwa Geschwindigkeiten und Beschleunigungen, umfassen.
  • Sowohl für das Ego-Fahrzeug als auch für die Fremdobjekte wird jeweils ein Gütemaß Q1-4 aufgestellt, das der Gesamtsituation x und der möglichen nächsten Bewegungsaktion a1-4 zusätzlich zum Wert R1-4 (x,a1-4) auch den Erwartungswert E(P(x')) einer Verteilung der Wahrscheinlichkeiten P(x') von Zustandsänderungen x' zuordnet, mit denen die übrigen Verkehrsteilnehmer auf die nächste Bewegungsaktion a1-4 reagieren. Beispielsweise kann das Gütemaß Q1-4 eine gewichtete Summe aus dem Wert R1-4 (x,a1-4) der Gütefunktion und dem Erwartungswert E(P(x')) sein.
  • Es werden diejenigen optimalen Bewegungsstrategien π1-4 des Ego-Fahrzeugs und der Fremdobjekte ermittelt, die die Gütemaße Q1-4 maximieren. Aus den optimalen Bewegungsstrategien π 1-4 werden die gesuchten Trajektorien des Ego-Fahrzeugs und der Fremdobjekte ermittelt.
  • Dabei umfasst der Begriff der Bewegungsstrategie allgemein jede Funktion π1-4 , die einer Gesamtsituation x und einer nächsten Bewegungsaktion a1-4 einen Zahlenwert π1-4 (x,a1-4) zuordnet. Der Begriff ist also gegenüber dem üblichen Sprachgebrauch, in dem er mit deterministischen Regeln assoziiert wird, verallgemeinert. Eine deterministische Regel kann beispielsweise angeben, dass bei Vorliegen einer bestimmten Gesamtsituation x genau eine nächste Bewegungsaktion a1-4 vom Ego-Fahrzeug durchgeführt werden soll bzw. von den Fremdobjekten vollführt wird.
  • Es wurde erkannt, dass insbesondere das Verhalten der Fremdobjekte nicht immer deterministischen Regeln folgt. Wird das Fremdobjekt beispielsweise von einem Menschen gesteuert, so ist die Steuerung zwar intelligent, aber führt nicht zwangsläufig auf genau diejenige Bewegungsaktion, die zur Verfolgung des jeweiligen Nahziels optimal ist. Dies gilt selbst dann, wenn ein menschlicher Fahrer sich grundsätzlich für das richtige Fahrmanöver entscheidet. So kann beispielsweise das Linksabbiegen von einer Straße, auf der hierfür kein Fahrweg explizit markiert ist, um die ideale Fahrlinie herum streuen. Auch wird das Fahrzeug bei einer Vielzahl von Bremsungen vor einer roten Ampel zwar jedes Mal in etwa an der Haltelinie zum Stehen kommen, aber der Zeitverlauf der Geschwindigkeit kann unterschiedlich sein. Der Fahrer kann beispielsweise anfangs mal stärker und mal schwächer auf das Bremspedal treten und den Bremsdruck später unbewusst nachregeln, um am Ende am richtigen Ort zum Stehen zu kommen. Eine tiefere Ursache hierfür liegt darin, dass die Fahraufgabe insgesamt zu komplex ist, um vollständig bewusst durchgeführt zu werden. Um das Multitasking überhaupt mit der geforderten Geschwindigkeit bewältigen zu können, muss ein lernender Fahrer bestimmte Vorgänge zunächst ins Unterbewusstsein „automatisieren“.
  • Selbst das korrekte Verhalten eines Fußgängers ist nicht vollständig deterministisch. Wenn der Fußgänger beispielsweise die Fahrbahn überquert, wird er dies nicht immer genau im rechten Winkel zur Fahrtrichtung tun, sondern mit einer zufälligen Abweichung hiervon.
  • Erst recht folgt das Verhalten der Fremdobjekte nicht mehr deterministischen Regeln, wenn sich ein steuernder Mensch falsch entscheidet. So ist etwa das Setzen des rechten Blinkers keine Garantie dafür, dass der Fahrer tatsächlich aus einer Vorfahrtstraße nach rechts in die nächste Straße einbiegen und gegenüber einem anderen Fahrzeug, das aus dieser Straße kommt, auf seine Vorfahrt verzichten wird. Vielmehr kann auch der Fall eintreten, dass der Fahrer geradeaus weiterfährt, nachdem er feststellt, dass er sich geirrt hat und erst eine Straße später rechts abbiegen muss. Auch kann ein menschlicher Fahrer etwa nicht auf ein Objekt reagieren, dass sich im toten Winkel seiner Spiegel versteckt. Auch setzen sich immer wieder Fußgänger bewusst über die Pflicht zur Benutzung gesicherter Überwege, bzw. über die Wartepflicht bei roter Ampel, hinweg.
  • Weiterhin ist selbst das Verhalten des Ego-Fahrzeugs in gewisser Weise probabilistisch. Wird etwa zum Anhalten ein bestimmter Bremsdruck auf die Bremszylinder der Bremsanlage gegeben, so kann die dadurch bewirkte Verzögerung des Ego-Fahrzeugs beispielsweise abhängig vom Zustand der Fahrbahn sowie von Temperatur und Wassergehalt der Bremsflüssigkeit variieren.
  • Indem nun die Zustandsänderungen der übrigen Verkehrsteilnehmer zu einer Wahrscheinlichkeitsverteilung P(x') verallgemeinert sind und indem die Bewegungsstrategien π1-4 aller Verkehrsteilnehmer ebenfalls probabilistisch sein können, kann die Reaktion des Ego-Fahrzeugs auf die Gesamtsituation x somit so verfeinert werden, dass sie mit einer höheren Wahrscheinlichkeit tatsächlich verkehrsgerecht ist und insbesondere Kollisionen vermeidet. In gewisser Weise wird also das vorausschauende Fahren, das ein jeder menschlicher Fahrer in der Fahrschule lernen muss, technisch nachgebildet, damit ein System für das zumindest teilweise automatisierte Fahren die Fahraufgabe mindestens so gut bewältigen kann wie ein menschlicher Fahrer.
  • In einer besonders vorteilhaften Ausgestaltung werden Gütemaße Q1-4 gewählt, deren Optima bezüglich der Bewegungsstrategien π1-4 durch das Bellman-Optimum gegeben sind. Dies ist in gewisser Weise eine Kombination aus rekursiver Definition und wechselseitiger Kopplung der Gütemaße Q1-4 .
  • Beispielsweise können bei unendlichem Zeithorizont die Gütemaße Qi im fertig optimierten Endzustand Q* die Form Q i * ( x , a i ) = R i ( x , a i ) + γ E π * ( i ) ( V i * ( x ' ) | x , a i )
    Figure DE102018210280A1_0001
    haben, worin die π*(-i) die optimalen Bewegungsstrategien der anderen Verkehrsteilnehmer sind, deren Index ein anderer ist als i und V i * ( x ' ) = softmax  a ' Q i * ( x ' , a ' ) .
    Figure DE102018210280A1_0002
  • Der Erwartungswert E läuft über die probabilistischen Zustandsübergänge und die Strategien der anderen Verkehrsteilnehmer, deren Index ein anderer ist als i. Er ist gegeben durch E = a i , x P ( x ' | x , a ) π * ( a i | x ) V i * ( x )
    Figure DE102018210280A1_0003
  • In einer weiteren besonders vorteilhaften Ausgestaltung werden die optimalen Bewegungsstrategien π1-4 unter der Voraussetzung ermittelt, dass sie bei gleicher Vorgeschichte Ht unabhängig voneinander sind: π * ( a i ( t ) | H t ) = j i π j * ( a j ( t ) | H t )
    Figure DE102018210280A1_0004
  • Wenn nun weiterhin eine Boltzmann-Gibbs-Verteilung als Verteilung der Wahrscheinlichkeiten P(x') von Zustandsänderungen x' gewählt wird, dann wählen die Verkehrsteilnehmer ihre Bewegungsstrategie jeweils nach dem Prinzip der maximalen Entropie: π i * ( a j ( t ) | H t ) exp ( Q i * ( x ( t ) , a j ( t ) ) )
    Figure DE102018210280A1_0005
  • Die Gleichungen (1) bis (3) bilden einen Satz von M gekoppelten Gleichungen, wobei M die Anzahl der betrachteten Verkehrsteilnehmer ist. Die Gleichungen können zusammengefasst werden als Q i * = T i ( Q i * , Q i ) ,   i [ M ]
    Figure DE102018210280A1_0006
  • Hierin ist Ti die rechte Seite von Gleichung (1). Gleichung (4) hat genau eine optimale Lösung Qi*, die erhältlich ist mit dem folgenden Algorithmus:
    Figure DE102018210280A1_0007
    Figure DE102018210280A1_0008
  • Wenn der Zeithorizont endlich ist, ist das Problem leicht unterschiedlich. Die Gütefunktion Q des i-ten Verkehrsteilnehmers hat im fertig optimierten Zustand zum Zeitschritt τ ∈ [t,t+T] die Form Q i τ ( x , a i ) : = R i ( x , a i ) + E π τ ( i ) ( V i τ + 1 ( x ' ) | x , a i )
    Figure DE102018210280A1_0009
    V i τ + 1 ( x ' ) = softmax a '  Q i τ + 1 ( x ' , a ' )
    Figure DE102018210280A1_0010
    mit der Randbedingung, dass V i t + T ( x ) = R i , F ( x )
    Figure DE102018210280A1_0011
    der Wert der Gütefunktion Ri im finalen optimierten Zustand am Ende des Zeithorizonts ist. Analog zum Fall des endlichen Zeithorizonts hängt der Erwartungswert wieder von den Strategien der übrigen Verkehrsteilnehmer ab, die wiederum vorteilhaft Boltzmann-verteilt sind: π i τ ( a j | x ) j i exp ( Q j τ ( x , a j ) ) .
    Figure DE102018210280A1_0012
  • Daher kann Gleichung (5) geschrieben werden als: Q i τ = U i ( Q i τ , V i τ + 1 ) ,   i [ M ] ,
    Figure DE102018210280A1_0013
    worin Ui die rechte Seite von Gleichung (5) ist. Eine optimale Lösung ist beispielsweise mit dem folgenden Algorithmus erhältlich:
    Figure DE102018210280A1_0014
    Figure DE102018210280A1_0015
  • Im Rahmen der Erfindung wurde ein weiteres Verfahren zur Vorhersage der Trajektorien von Fremdobjekten im Umfeld eines Ego-Fahrzeugs, sowie zur Bestimmung einer daran angepassten eigenen künftigen Trajektorie für das Ego-Fahrzeug, entwickelt. Dieses Verfahren beginnt zunächst wie das zuvor beschriebene Verfahren, d.h. die Fremdobjekte werden identifiziert, und es werden die Nahziele und die grundlegenden Regeln der Bewegung sowohl für das Ego-Fahrzeug als auch für die Fremdobjekte ermittelt.
  • Im Unterschied zu dem zuvor beschriebenen Verfahren wird sowohl für das Ego-Fahrzeug als auch für die Fremdobjekte jeweils eine Merkmalsfunktion F1-4 aufgestellt dergestalt, dass die Anwendung von F1-4 auf einen Satz θ1-4 noch freier Parameter eine Gütefunktion R1-4 liefert, wobei diese Gütefunktion R1-4 einer aus den aktuellen Zuständen des Ego-Fahrzeugs und der Fremdobjekte gebildeten Gesamtsituation x und einer möglichen nächsten Bewegungsaktion a1-4 ein Maß dafür zuordnet, wie gut die Aktion a1-4 in der aktuellen Gesamtsituation x für den jeweils betrachteten Verkehrsteilnehmer ist. Die Gütefunktion R1-4 kann insbesondere beispielsweise ein Maß dafür beinhalten, inwieweit die Bewegungsaktion a1-4 in der Situation x auf die Erreichung des jeweiligen Nahziels und auf die Einhaltung der Regeln hinarbeitet.
  • Die Merkmalsfunktion F1-4 kann beispielsweise Eigenschaften und Ziele des jeweiligen Verkehrsteilnehmers verkörpern, wie etwa der Zielort, auf den sich ein Fußgänger hinbewegt, oder auch dessen Gehgeschwindigkeit. Bei einem Fahrzeug kann neben dem Zielort beispielsweise die Anforderung, dass die Fahrt sicher, flüssig und komfortabel verlaufen soll, in die Merkmalsfunktion F1-4 eingehen. Die Merkmalsfunktion F1-4 kann also insbesondere beispielsweise aus mehreren Anteilen zusammengesetzt sein, die sich auf unterschiedliche Ziele beziehen, wobei diese Ziele auch gegenläufig sein können. Der Satz θ1-4 von Parametern kann dann beispielsweise die Gewichte verkörpern, mit denen unterschiedliche Ziele und Anforderungen in der letztendlichen Gütefunktion R1-4 enthalten sind. Der Satz θ1-4 von Parametern kann insbesondere beispielsweise als Vektor von Parametern vorliegen und beispielsweise Koeffizienten enthalten, mit denen eine Linearkombination aus unterschiedlichen in der Merkmalsfunktion F1-4 enthaltenen Zielen in die Gütefunktion R1-4 eingeht.
  • Die Bewegungsstrategien π1-4 des Ego-Fahrzeugs und der Fremdobjekte werden als diejenigen Strategien ermittelt, die zu einer maximalen kausalen Entropie H(a1-4||x) der Bewegungsaktionen a1-4 des Ego-Fahrzeugs und der Fremdobjekte in der Gesamtsituation x führen. Aus den Bewegungsstrategien π1-4 werden die gesuchten Trajektorien ermittelt.
  • Das letztendlich erhaltene Ergebnis weist die gleichen Vorteile auf wie das gemäß dem zuvor beschriebenen Verfahren erhaltene Ergebnis. Der Vorteil speziell dieses Verfahrens ist, dass für die Bestimmung des Parametersatzes θ1-4 noch weniger Information über die jeweiligen Verkehrsteilnehmer benötigt wird als für die direkte Bestimmung der Gütefunktion R1-4 . Jede Zusatzinformation, gleich aus welcher Quelle, kann aber auf der anderen Seite im Parametersatz θ1-4 berücksichtigt werden. Die freien Parameter θ1-4 werden bei der Optimierung in Abhängigkeit der Bewegungsstrategien π1-4 bestimmt.
  • Die kausale Entropie H(a1-4||x) kann geschrieben werden als H ( a 1 4 x ) = E a , x [ t T log  π t   ( a ( t ) | H t ) ] .
    Figure DE102018210280A1_0016
  • Vorteilhaft wird das Maximum der kausalen Entropie H(a1-4∥x) in Bezug auf die Bewegungsstrategien π1-4 unter der Randbedingung ermittelt, dass sowohl für das Ego-Fahrzeug als auch für die Fremdobjekte der Erwartungswert der jeweiligen Merkmalsfunktion F1-4 über alle möglichen Gesamtsituationen x und alle möglichen nächsten Bewegungsaktionen a1-4 gleich dem Mittelwert der empirisch in den bisherigen Trajektorien beobachteten Merkmalsfunktionen F1-4 ist. Dieser Mittelwert kann insbesondere über alle bislang empirisch beobachteten Situationen x und Bewegungen a1-4 gebildet werden: E a i , x [ F i ( x , a i ) ] = E ˜ a i , x [ F i ( x , a i ) ] i , π i t ( a i ( t ) | H t ) 0 i ,   a i ( t ) ,   H t , a i ( t ) π i t ( a i ( t ) | H t ) = 1 i ,   H t .
    Figure DE102018210280A1_0017
  • In Verbindung mit den weiteren Randbedingungen, dass die optimalen Bewegungsstrategien π1-4 bei gleicher Vorgeschichte Ht unabhängig voneinander sind und dass sie jeweils statistisch um eine Strategie verteilt sind, die die jeweilige Gütefunktion R1-4 maximiert, kann unter Verwendung von E a i , x = [ F i ( x , a i ) ] = t T E [ F i ( x ( t ) , a i ( t ) ) ]
    Figure DE102018210280A1_0018
    eine rekursive Lösung für Gleichung (7) angegeben werden: π i τ = 1 Z i ( τ ) exp ( W i τ ( H τ , a i ( τ ) ) ,
    Figure DE102018210280A1_0019
    W i τ ( H τ , a i ( τ ) ) = θ i T F i ( x ( τ ) , a i ( τ ) ) + E π τ ( i ) [ log  Z i ( τ + 1 ) ] ,
    Figure DE102018210280A1_0020
    log  Z i ( τ ) = softmax a '   W i τ ( H τ , a ' ) ,
    Figure DE102018210280A1_0021
    log  Z i ( T ) = softmax a '   θ i T F i ( x ( T ) , a ) .
    Figure DE102018210280A1_0022
  • Hierin ist π i t = j i π j t .
    Figure DE102018210280A1_0023
  • Die Randbedingung ist Zi(T+1)=1 für alle Verkehrsteilnehmer.
  • Die rekursive Lösung ist ähnlich zu dem fertig optimierten Gütemaß Q gemäß Gleichung (5). Wi τ(Hτ,ai(τ)) spielt die Rolle des Gütemaßes Qi, und die Gütefunktionen Ri sind als Linearkombination aus den Merkmalsfunktionen Fi zusammengesetzt.
  • Letztendlich kann also aus der Perspektive des Ego-Fahrzeugs ein „inverse reinforcement learning“ betrieben werden, d.h., bei Kenntnis der Gütefunktion R1 des Ego-Fahrzeugs können allein aus der Beobachtung der übrigen Verkehrsteilnehmer deren Gütefunktionen R2-4 erschlossen werden. Dies kann beispielsweise mit dem folgenden Algorithmus geschehen:
    Figure DE102018210280A1_0024
  • In einer weiteren besonders vorteilhaften Ausgestaltung werden die Fremdobjekte jeweils hinsichtlich ihres Typs klassifiziert, und die jeweilige Gütefunktion R2-4 , bzw. die jeweilige Merkmalsfunktion F2-4 , wird anhand dieses Typs ausgewählt. Auf diese Weise kann die Ermittlung der letztendlichen Trajektorien der Fremdobjekte, und somit auch der daran angepassten Trajektorie des Ego-Fahrzeugs, schneller konvergieren und zu einem genaueren Ergebnis gelangen. Wie zuvor erläutert, können insbesondere die grundlegenden Regeln der Bewegung vom Typ des Objekts abhängen. Die Klassifikation kann anhand der physikalischen Beobachtungen, und/oder anhand der über die Drahtlosschnittstelle empfangenen Informationen, vorgenommen werden.
  • Wie zuvor erläutert, ist die Ermittlung der an das Vorhandensein bewegter Fremdobjekte angepassten Trajektorie des Ego-Fahrzeugs kein Selbstzweck, sondern hat zum Ziel, die Tauglichkeit zumindest teilweise automatisiert fahrender Fahrzeuge speziell für den gemischten Verkehr mit von Menschen gesteuerten Fremdobjekten zu verbessern. Daher bezieht sich die Erfindung auch auf ein Verfahren zur Steuerung eines Ego-Fahrzeugs in einer Verkehrssituation mit bewegten Fremdobjekten im Umfeld des Ego-Fahrzeugs.
  • Bei diesem Verfahren wird die an das Verhalten der Fremdobjekte angepasste Trajektorie des Ego-Fahrzeugs mit einem der zuvor beschriebenen Verfahren ermittelt. Die angepasste Trajektorie wird an einen Bewegungsplaner des Ego-Fahrzeugs übermittelt. Durch den Bewegungsplaner wird ein Ansteuerprogramm für ein Antriebssystem, ein Lenksystem und/oder ein Bremssystem des Ego-Fahrzeugs ermittelt, wobei das Ansteuerprogramm dazu ausgebildet ist, das tatsächliche Verhalten des Fahrzeugs im Rahmen der Systemgrenzen bestmöglich in Übereinstimmung mit der ermittelten Trajektorie zu bringen.
  • Das Antriebssystem, Lenksystem und/oder Bremssystem wird entsprechend dem Ansteuerprogramm angesteuert.
  • Das Verfahren kann in einem beliebigen bereits vorhandenen Steuergerät des Ego-Fahrzeugs implementiert werden, da dank der internen Vernetzung mittels CAN-Bus typischerweise von jedem Ort im Fahrzeug aus Zugang zu den mit einer Sensorik erfassten oder über die Drahtlosschnittstelle bezogenen Informationen über Fremdobjekte im Fahrzeugumfeld besteht. Ebenso kann der Bewegungsplaner über den CAN-Bus von jedem Ort im Fahrzeug aus angesteuert werden. Das Verfahren kann beispielsweise in Form einer Software implementiert sein, die als Update oder Upgrade für ein solches Steuergerät verkaufbar ist und insofern ein eigenes Produkt darstellt. Daher bezieht sich die Erfindung auch auf ein Computerprogramm mit maschinenlesbaren Anweisungen, die, wenn sie auf einem Computer, und/oder auf einem Steuergerät, ausgeführt werden, den Computer, und/oder das Steuergerät, dazu veranlassen, ein von der Erfindung bereitgestelltes Verfahren auszuführen. Ebenso bezieht sich die Erfindung auch auf einen maschinenlesbaren Datenträger oder ein Downloadprodukt mit dem Computerprogramm.
  • Weitere, die Erfindung verbessernde Maßnahmen werden nachstehend gemeinsam mit der Beschreibung der bevorzugten Ausführungsbeispiele der Erfindung anhand von Figuren näher dargestellt.
  • Figurenliste
  • Es zeigt:
    • 1 Ausführungsbeispiel des Verfahrens 100;
    • 2 Ausführungsbeispiel des Verfahrens 200;
    • 3 Ausführungsbeispiel des Verfahrens 300;
    • 4 Beispielhafte Verkehrsszene mit Ego-Fahrzeug 1 und drei menschengesteuerten Fremdobjekten 2-4.
  • 1 zeigt ein Ausführungsbeispiel des Verfahrens 100. In Schritt 110 wird eine Zeitreihe 11a-11c physikalischer Beobachtungen des Umfelds 11 des in 1 nicht eingezeichneten Ego-Fahrzeugs 1 zusammen mit Informationen 12a, die über die Drahtlosschnittstelle 12 empfangen wurden, verarbeitet. Diese Informationen 12a stammen von den Fremdobjekten 2-4 im Fahrzeugumfeld 11 selbst, und/oder von einer Infrastruktur 5. In Schritt 110 werden die Fremdobjekte 2-4 identifiziert, d.h. es wird festgestellt, dass drei Fremdobjekte 2-4 vorhanden sind, die sich in unterschiedlicher Weise bewegen.
  • Die Fremdobjekte 2-4 werden im optionalen Schritt 115 nach Typen 2d-4d klassifiziert. In Schritt 120 werden die von den Fremdobjekten 2-4 jeweils angestrebten Nahziele 2b-4b prognostiziert, und es werden die grundlegenden Regeln 2c-4c ermittelt, nach denen die Bewegung der Fremdobjekte 2-4 abläuft. Analog hierzu wird in Schritt 130 ermittelt, auf welches Nahziel 1b die Bewegung des Ego-Fahrzeugs 1 hinführt und nach welchen grundlegenden Regeln 1c diese Bewegung abläuft.
  • In Schritt 140 wird für das Ego-Fahrzeug 1 sowie für die Fremdobjekte 2-4 auf der Basis der vorhandenen Informationen die jeweilige Gütefunktion R1-4 aufgestellt, wobei gemäß dem optionalen Teilschritt 141 der jeweilige Typ 2d-4d des Fremdobjekts 2-4 herangezogen werden kann, wenn dieser im optionalen Schritt 115 bestimmt wurde.
  • In Schritt 150 werden die Gütefunktionen R1-4 zu Gütemaßen Q1-4 erweitert, die zusätzlich auch den Erwartungswert E(P(x')) einer Verteilung der Wahrscheinlichkeiten P(x') von Zustandsänderungen x' enthält und insofern auch die Gütemaße Q1-4 untereinander koppelt. Dabei werden gemäß Teilschritt 151 Gütemaße Q1-4 gewählt, deren Optima bezüglich der Bewegungsstrategien π1-4 durch das Bellman-Optimum gegeben sind. Gemäß Teilschritt 152 wird eine Boltzmann-Gibbs-Verteilung als Verteilung der Wahrscheinlichkeiten P(x') von Zustandsänderungen x' gewählt.
  • In Schritt 160 werden diejenigen Bewegungsstrategien π1-4 des Ego-Fahrzeugs und der Fremdobjekte 2-4 ermittelt, die die Gütemaße Q1-4 maximieren. Hieraus werden schließlich in Schritt 170 die gesuchten Trajektorien 2a-4a der Fremdobjekte 2-4 sowie die hieran angepasste Soll-Trajektorie 1a des Ego-Fahrzeugs 1 ermittelt.
  • 2 zeigt ein Ausführungsbeispiel des Verfahrens 200. Die Schritte 210, 215, 220 und 230 sind identisch mit den Schritten 110, 115, 120 und 130 des Verfahrens 100.
  • In Schritt 240 des Verfahrens 200 wird im Unterschied zu Schritt 140 des Verfahrens 100 keine vollständige Gütefunktion R1-4 bestimmt, sondern Merkmalsfunktionen F1-4 , die mit einem Satz θ1-4 noch freier Parameter parametrisiert sind und erst in Verbindung mit diesen Parametern θ1-4 die vollständige Gütefunktion R1-4 bilden. Sofern in Schritt 215 die Typen 2d-4d der Fremdobjekte 2-4 bestimmt wurden, können diese im optionalen Teilschritt 241 zur Auswahl der jeweiligen Merkmalsfunktion F2-4 herangezogen werden.
  • In Schritt 250 werden die Bewegungsstrategien π1-4 des Ego-Fahrzeugs und der Fremdobjekte werden als diejenigen Strategien ermittelt, die die maximale kausale Entropie maximieren. Zugleich werden auch die Parameter θ1-4 der Merkmalsfunktionen F1-4 bestimmt. Dabei wird gemäß Teilschritt 251 eine Randbedingung vorgegeben, die eine rekursive Bestimmung der Bewegungsstrategien π1-4 ermöglicht.
  • In Schritt 260 werden, analog zu Schritt 170 des Verfahrens 100, aus den Bewegungsstrategien π1-4 die gesuchten Trajektorien 2a-4a der Fremdobjekte 2-4 sowie die hieran angepasste Soll-Trajektorie 1a des Ego-Fahrzeugs 1 ermittelt.
  • 3 zeigt ein Ausführungsbeispiel des Verfahrens 300. In Schritt 310 wird mit dem Verfahren 100 oder 200 die an das Verhalten der Fremdobjekte 2-4 im Umfeld 11 des Ego-Fahrzeugs 1 angepasste Soll-Trajektorie 1a für das Ego-Fahrzeug 1 ermittelt. Diese angepasste Trajektorie 1a wird in Schritt 320 an den Bewegungsplaner 13 des Ego-Fahrzeugs 1 übermittelt. In Schritt 330 wird durch den Bewegungsplaner 13 ein Ansteuerprogramm 13a für ein Antriebssystem 24, ein Lenksystem 15 und/oder ein Bremssystem 16 des Ego-Fahrzeugs 1 ermittelt.
  • In diesem Zusammenhang ist wichtig, dass sich der Begriff der Trajektorie allgemein auf eine Bahn in kombinierten Raum- und Zeitkoordinaten bezieht. Das bedeutet, dass eine Trajektorie nicht nur durch eine Änderung der Bewegungsrichtung geändert werden kann, sondern auch durch eine Änderung der Geschwindigkeit, wie etwa ein Abbremsen, Warten und späteres erneutes Anfahren.
  • In Schritt 340 wird das Antriebssystem 14, das Lenksystem 15, bzw. das Bremssystem 16, entsprechend dem Ansteuerprogramm 13a angesteuert.
  • 4 zeigt eine komplexe Verkehrsszene, in der die beschriebenen Verfahren 100, 200, 300 vorteilhaft eingesetzt werden können. Auf dem rechten Fahrstreifen einer Straße 50 fährt das Ego-Fahrzeug 1 geradeaus in Richtung des Nahziels 1b.
  • Das erste Fremdobjekt 2 ist ein weiteres Fahrzeug, dessen Blinker 2e anzeigt, dass sein Fahrer in die zum Nahziel 2b des Fahrzeugs 2 führende Seitenstraße 51 abzubiegen beabsichtigt. Das zweite Fremdobjekt 3 ist ein weiteres Fahrzeug, das aus Sicht des Ego-Fahrzeugs 1 auf der Gegenfahrbahn der Straße 50 geradeaus unterwegs ist in Richtung seines Nahziels 3b. Das dritte Fremdobjekt 4 ist ein Fußgänger, der ein Nahziel 4b auf der aus seiner Sicht gegenüberliegenden Seite der Straße 50 ansteuert.
  • In der in 4 dargestellten Situation muss der Fußgänger 4 den Überweg 52 über die Straße 50 benutzen, was zugleich den Fahrer des Fahrzeugs 3 zum Warten verpflichtet. Daher kann im Prinzip der Fahrer des Fahrzeugs 2 direkt beschleunigen und wie beabsichtigt links abbiegen, was für seine schnelle Erreichung des Nahziels 2b optimal wäre. Dementsprechend hätte das Ego-Fahrzeug 1 in seiner Fahrspur freie Fahrt zumindest bis zum Überweg 52. Ein Steuerungsverfahren unter der vereinfachenden Annahme, dass der Fahrer des Fahrzeugs 2 das für ihn Optimale tun wird, würde also das Ego-Fahrzeug 1 beschleunigen. Wenn nun aber der Fahrer des Fahrzeugs 2 die Situation dahingehend falsch einschätzt, dass er zuerst das Fahrzeug 3 im Gegenverkehr vorbeilassen muss (was ohne den Fußgänger 4 auf dem Überweg 52 ja auch richtig wäre), fährt das Ego-Fahrzeug von hinten auf das Fahrzeug 2 auf. Die Verfahren gemäß der Erfindung ermöglichen es, derartige Unsicherheiten zu berücksichtigen. So kann beispielsweise die Geschwindigkeit für die Weiterfahrt so weit beschränkt werden, dass für den Fall, dass das Fahrzeug 2 tatsächlich stehenbleibt, ein Zusammenstoß noch mit einer Vollbremsung verhindert werden kann.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • WO 2017/197170 A1 [0003]

Claims (10)

  1. Verfahren (100) zur Vorhersage der Trajektorien (2a-4a) von Fremdobjekten (2-4) im Umfeld (11) eines Ego-Fahrzeugs (1), sowie zur Bestimmung einer daran angepassten eigenen künftigen Trajektorie (1a) für das Ego-Fahrzeug (1), mit den Schritten: • aus einer Zeitreihe (11a-11c) physikalischer Beobachtungen des Umfelds (11), und/oder aus über eine Drahtlosschnittstelle (12) des Fahrzeugs (1) von den Fremdobjekten (2-4) selbst und/oder von einer Infrastruktur (5) empfangenen Informationen (12a), werden die Fremdobjekte (2-4) identifiziert (110); • es wird ermittelt (120), auf welches Nahziel (2b-4b) die Bewegung eines jeden der Fremdobjekte (2-4) hinführt und nach welchen grundlegenden Regeln (2c-4c) diese Bewegung abläuft; • es wird ermittelt (130), auf welches Nahziel (1b) die Bewegung des Ego-Fahrzeugs (1) hinführt und nach welchen grundlegenden Regeln (1c) diese Bewegung abläuft; • für das Ego-Fahrzeug (1) sowie für die Fremdobjekte (2-4) wird jeweils eine Gütefunktion R1-4 aufgestellt (140), die einer aus den aktuellen Zuständen des Ego-Fahrzeugs (1) und der Fremdobjekte (2-4) gebildeten Gesamtsituation x und einer möglichen nächsten Bewegungsaktion a1-4 ein Maß dafür zuordnet, wie gut die Aktion a1-4 in der aktuellen Gesamtsituation x für den jeweils betrachteten Verkehrsteilnehmer (1-4) ist; • für das Ego-Fahrzeug (1) sowie für die Fremdobjekte (2-4) wird jeweils ein Gütemaß Q1-4 aufgestellt (150), das der Gesamtsituation x und der möglichen nächsten Bewegungsaktion a1-4 zusätzlich zum Wert R1-4(x,a1-4) auch den Erwartungswert E(P(x')) einer Verteilung der Wahrscheinlichkeiten P(x') von Zustandsänderungen x' zuordnet, mit denen die übrigen Verkehrsteilnehmer (2-4; 1, 3, 4; 1-3) auf die nächste Bewegungsaktion a1-4 reagieren; • es werden diejenigen optimalen Bewegungsstrategien π1-4 des Ego-Fahrzeugs und der Fremdobjekte (2-4) ermittelt (160), die die Gütemaße Q1-4 maximieren; • aus den optimalen Bewegungsstrategien π1-4 werden die gesuchten Trajektorien (1a-4a) ermittelt (170).
  2. Verfahren (100) nach Anspruch 1, wobei Gütemaße Q1-4 gewählt werden (151), deren Optima bezüglich der Bewegungsstrategien π1-4 durch das Bellman-Optimum gegeben sind.
  3. Verfahren (100) nach einem der Ansprüche 1 bis 2, wobei eine Boltzmann-Gibbs-Verteilung als Verteilung der Wahrscheinlichkeiten P(x') von Zustandsänderungen x' gewählt wird (152).
  4. Verfahren (200) zur Vorhersage der Trajektorien (2a-4a) von Fremdobjekten (2-4) im Umfeld (11) eines Ego-Fahrzeugs (1), sowie zur Bestimmung einer daran angepassten eigenen künftigen Trajektorie (1a) für das Ego-Fahrzeug (1), mit den Schritten: • aus einer Zeitreihe (11a-11c) physikalischer Beobachtungen des Umfelds (11), und/oder aus über eine Drahtlosschnittstelle (12) des Fahrzeugs (1) von den Fremdobjekten (2-4) selbst und/oder von einer Infrastruktur (5) empfangenen Informationen (12a), werden die Fremdobjekte (2-4) identifiziert (210); • es wird ermittelt (220), auf welches Nahziel (2b-4b) die Bewegung eines jeden der Fremdobjekte (2-4) hinführt und nach welchen grundlegenden Regeln (2c-4c) diese Bewegung abläuft; • es wird ermittelt (230), auf welches Nahziel (1b) die Bewegung des Ego-Fahrzeugs (1) hinführt und nach welchen grundlegenden Regeln (1c) diese Bewegung abläuft; • für das Ego-Fahrzeug (1) sowie für die Fremdobjekte (2-4) wird jeweils eine Merkmalsfunktion F1-4 aufgestellt (240) dergestalt, dass die Anwendung von F1-4 auf einen Satz θ1-4 noch freier Parameter eine Gütefunktion R1-4 liefert, wobei diese Gütefunktion R1-4 einer aus den aktuellen Zuständen des Ego-Fahrzeugs (1) und der Fremdobjekte (2-4) gebildeten Gesamtsituation x und einer möglichen nächsten Bewegungsaktion a1-4 ein Maß dafür zuordnet, wie gut die Aktion a1-4 in der aktuellen Gesamtsituation x für den jeweils betrachteten Verkehrsteilnehmer (1-4) ist; • die Bewegungsstrategien π1-4 des Ego-Fahrzeugs (1) und der Fremdobjekte (2-4) werden als diejenigen Strategien ermittelt (250), die zu einer maximalen kausalen Entropie H(a1-4||x) der Bewegungsaktionen a1-4 des Ego-Fahrzeugs (1) und der Fremdobjekte (2-4) in der Gesamtsituation x führen; • aus den Bewegungsstrategien π1-4 werden die gesuchten Trajektorien (1a-4a) ermittelt (260).
  5. Verfahren (200) nach Anspruch 4, wobei das Maximum der kausalen Entropie H(a1-4||x) in Bezug auf die Bewegungsstrategien π1-4 unter der Randbedingung ermittelt wird (251), dass sowohl für das Ego-Fahrzeug (1) als auch für die Fremdobjekte (2-4) der Erwartungswert der jeweiligen Merkmalsfunktion F1-4 über alle möglichen Gesamtsituationen x und alle möglichen nächsten Bewegungsaktionen a1-4 gleich dem Mittelwert der empirisch in den bisherigen Trajektorien beobachteten Merkmalsfunktionen F1-4 ist.
  6. Verfahren (100, 200) nach einem der Ansprüche 1 bis 5, wobei die optimalen Bewegungsstrategien π1-4 unter der Randbedingung ermittelt werden (160, 250), dass sie bei gleicher Vorgeschichte Ht unabhängig voneinander sind.
  7. Verfahren (100, 200) nach einem der Ansprüche 1 bis 6, wobei die optimalen Bewegungsstrategien π1-4 unter der Randbedingung ermittelt werden (160, 250), dass sie jeweils statistisch um eine Strategie verteilt sind, die die jeweilige Gütefunktion R1-4 maximiert.
  8. Verfahren (100, 200) nach einem der Ansprüche 1 bis 7, wobei die Fremdobjekte (2-4) jeweils hinsichtlich ihres Typs (2d-4d) klassifiziert werden (115, 215) und wobei die jeweilige Gütefunktion R2-4, bzw. die jeweilige Merkmalsfunktion F2-4, anhand dieses Typs (2d-4d) ausgewählt wird (141, 241).
  9. Verfahren (300) zur Steuerung eines Ego-Fahrzeugs (1) in einer Verkehrssituation mit bewegten Fremdobjekten (2-4) im Umfeld des Ego-Fahrzeugs (1) mit den Schritten: • die an das Verhalten der Fremdobjekte (2-4) angepasste Trajektorie (1a) des Ego-Fahrzeugs (1) wird mit einem Verfahren (100, 200) nach einem der Ansprüche 1 bis 8 ermittelt (310); • die angepasste Trajektorie (1a) wird an einen Bewegungsplaner (13) des Ego-Fahrzeugs (1) übermittelt (320); • durch den Bewegungsplaner (13) wird ein Ansteuerprogramm (13a) für ein Antriebssystem (14), ein Lenksystem (15) und/oder ein Bremssystem (16) des Ego-Fahrzeugs (1) ermittelt (330), wobei das Ansteuerprogramm (13a) dazu ausgebildet ist, das tatsächliche Verhalten des Fahrzeugs (1) im Rahmen der Systemgrenzen bestmöglich in Übereinstimmung mit der Trajektorie (1a) zu bringen; • das Antriebssystem (14), Lenksystem (15) und/oder Bremssystem (16) wird entsprechend dem Ansteuerprogramm (13a) angesteuert (340).
  10. Computerprogramm, enthaltend maschinenlesbare Anweisungen, die, wenn sie auf einem Computer, und/oder auf einem Steuergerät, ausgeführt werden, den Computer, und/oder das Steuergerät, dazu veranlassen, ein Verfahren (100, 200, 300) nach einem der Ansprüche 1 bis 9 auszuführen.
DE102018210280.5A 2018-06-25 2018-06-25 Anpassung der Trajektorie eines Ego-Fahrzeugs an bewegte Fremdobjekte Pending DE102018210280A1 (de)

Priority Applications (5)

Application Number Priority Date Filing Date Title
DE102018210280.5A DE102018210280A1 (de) 2018-06-25 2018-06-25 Anpassung der Trajektorie eines Ego-Fahrzeugs an bewegte Fremdobjekte
US15/734,415 US11858506B2 (en) 2018-06-25 2019-05-22 Adaptation of the trajectory of an ego vehicle to moving extraneous objects
CN201980042562.3A CN112292719B (zh) 2018-06-25 2019-05-22 使自我车辆的轨迹与运动的外来对象适配
EP19727327.9A EP3811351A1 (de) 2018-06-25 2019-05-22 Anpassung der trajektorie eines ego-fahrzeugs an bewegte fremdobjekte
PCT/EP2019/063232 WO2020001867A1 (de) 2018-06-25 2019-05-22 Anpassung der trajektorie eines ego-fahrzeugs an bewegte fremdobjekte

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102018210280.5A DE102018210280A1 (de) 2018-06-25 2018-06-25 Anpassung der Trajektorie eines Ego-Fahrzeugs an bewegte Fremdobjekte

Publications (1)

Publication Number Publication Date
DE102018210280A1 true DE102018210280A1 (de) 2020-01-02

Family

ID=66676497

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102018210280.5A Pending DE102018210280A1 (de) 2018-06-25 2018-06-25 Anpassung der Trajektorie eines Ego-Fahrzeugs an bewegte Fremdobjekte

Country Status (5)

Country Link
US (1) US11858506B2 (de)
EP (1) EP3811351A1 (de)
CN (1) CN112292719B (de)
DE (1) DE102018210280A1 (de)
WO (1) WO2020001867A1 (de)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113219962A (zh) * 2021-02-26 2021-08-06 北京航空航天大学合肥创新研究院(北京航空航天大学合肥研究生院) 一种面向混行队列跟驰安全的控制方法、系统及存储介质
EP3866074A1 (de) 2020-02-14 2021-08-18 Robert Bosch GmbH Verfahren und vorrichtung zur steuerung eines roboters
DE102020208080A1 (de) 2020-06-30 2021-12-30 Robert Bosch Gesellschaft mit beschränkter Haftung Erkennung von Objekten in Bildern unter Äquivarianz oder Invarianz gegenüber der Objektgröße
DE102020207897A1 (de) 2020-06-25 2021-12-30 Robert Bosch Gesellschaft mit beschränkter Haftung Situationsangepasste Ansteuerung für Fahrassistenzsysteme und Systeme zum zumindest teilweise automatisierten Führen von Fahrzeugen
DE102020215324A1 (de) 2020-12-03 2022-06-09 Robert Bosch Gesellschaft mit beschränkter Haftung Auswahl von Fahrmanövern für zumindest teilweise automatisiert fahrende Fahrzeuge
WO2022117588A1 (de) 2020-12-03 2022-06-09 Robert Bosch Gmbh Dynamikabhängige verhaltensplanung für zumindest teilweise automatisiert fahrende fahrzeuge
DE102021206014A1 (de) 2021-06-14 2022-12-15 Robert Bosch Gesellschaft mit beschränkter Haftung Bewegungsvorhersage für Verkehrsteilnehmer

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3413082B1 (de) * 2017-06-09 2020-01-01 Veoneer Sweden AB Fahrzeugsystem zur detektion von entgegenkommenden fahrzeugen
US11458987B2 (en) 2020-02-26 2022-10-04 Honda Motor Co., Ltd. Driver-centric risk assessment: risk object identification via causal inference with intent-aware driving models
US11544935B2 (en) * 2020-02-26 2023-01-03 Honda Motor Co., Ltd. System for risk object identification via causal inference and method thereof

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017197170A1 (en) 2016-05-12 2017-11-16 The Regents Of The University Of California Safely controlling an autonomous entity in presence of intelligent agents

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPS123702A0 (en) * 2002-03-22 2002-04-18 Nahla, Ibrahim S. Mr The train navigtion and control system (TNCS) for multiple tracks
DE102008005305A1 (de) * 2008-01-21 2009-07-23 Bayerische Motoren Werke Aktiengesellschaft Verfahren zur Beeinflussung der Bewegung eines Fahrzeugs
DE102008005310A1 (de) * 2008-01-21 2009-07-23 Bayerische Motoren Werke Aktiengesellschaft Verfahren zur Beeinflussung der Bewegung eines Fahrzeugs bei vorzeitigem Erkennen einer unvermeidbaren Kollision mit einem Hindernis
JP4561863B2 (ja) * 2008-04-07 2010-10-13 トヨタ自動車株式会社 移動体進路推定装置
DE102008062916A1 (de) 2008-12-23 2010-06-24 Continental Safety Engineering International Gmbh Verfahren zur Ermittlung einer Kollisionswahrscheinlichkeit eines Fahrzeuges mit einem Lebewesen
US8244408B2 (en) 2009-03-09 2012-08-14 GM Global Technology Operations LLC Method to assess risk associated with operating an autonomic vehicle control system
US8259994B1 (en) * 2010-09-14 2012-09-04 Google Inc. Using image and laser constraints to obtain consistent and improved pose estimates in vehicle pose databases
GB201116961D0 (en) * 2011-09-30 2011-11-16 Bae Systems Plc Fast calibration for lidars
EP2615598B1 (de) 2012-01-11 2017-12-06 Honda Research Institute Europe GmbH Fahrzeug mit Rechnereinrichtung zur Überwachung und Vorhersage von Verkehrsteilnehmerobjekten
DE102013225057A1 (de) * 2013-12-05 2015-06-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum steuern eines fahrzeugs, vorrichtung zum erzeugen von steuersignalen für ein fahrzeug und fahrzeug
DE102014201382A1 (de) 2014-01-27 2015-07-30 Robert Bosch Gmbh Verfahren zum Betreiben eines Fahrerassistenzsystems und Fahrerassistenzsystem
EP2950294B1 (de) * 2014-05-30 2019-05-08 Honda Research Institute Europe GmbH Verfahren und Fahrzeug mit fortschrittlichem Fahrerassistenzsystem zur risikobasierten Verkehrsszenenanalyse
DE102015221626A1 (de) * 2015-11-04 2017-05-04 Bayerische Motoren Werke Aktiengesellschaft Verfahren zur Ermittlung einer Fahrzeug-Trajektorie entlang einer Referenzkurve
WO2017120336A2 (en) 2016-01-05 2017-07-13 Mobileye Vision Technologies Ltd. Trained navigational system with imposed constraints
WO2017139507A1 (en) * 2016-02-09 2017-08-17 Google Inc. Reinforcement learning using advantage estimates
US11364899B2 (en) * 2017-06-02 2022-06-21 Toyota Motor Europe Driving assistance method and system
US10935982B2 (en) * 2017-10-04 2021-03-02 Huawei Technologies Co., Ltd. Method of selection of an action for an object using a neural network
JP6992182B2 (ja) * 2017-11-30 2022-01-13 ニッサン ノース アメリカ,インク 自律走行車両運行管理計画

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017197170A1 (en) 2016-05-12 2017-11-16 The Regents Of The University Of California Safely controlling an autonomous entity in presence of intelligent agents

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11738463B2 (en) 2020-02-14 2023-08-29 Robert Bosch Gmbh Method and device for controlling a robot
EP3866074A1 (de) 2020-02-14 2021-08-18 Robert Bosch GmbH Verfahren und vorrichtung zur steuerung eines roboters
DE102020207897A1 (de) 2020-06-25 2021-12-30 Robert Bosch Gesellschaft mit beschränkter Haftung Situationsangepasste Ansteuerung für Fahrassistenzsysteme und Systeme zum zumindest teilweise automatisierten Führen von Fahrzeugen
DE102020208080A1 (de) 2020-06-30 2021-12-30 Robert Bosch Gesellschaft mit beschränkter Haftung Erkennung von Objekten in Bildern unter Äquivarianz oder Invarianz gegenüber der Objektgröße
US11886995B2 (en) 2020-06-30 2024-01-30 Robert Bosch Gmbh Recognition of objects in images with equivariance or invariance in relation to the object size
WO2022117586A2 (de) 2020-12-03 2022-06-09 Robert Bosch Gmbh Auswahl von fahrmanövern für zumindest teilweise automatisiert fahrende fahrzeuge
DE102020215302A1 (de) 2020-12-03 2022-06-09 Robert Bosch Gesellschaft mit beschränkter Haftung Dynamikabhängige Verhaltensplanung für zumindest teilweise automatisiert fahrende Fahrzeuge
WO2022117588A1 (de) 2020-12-03 2022-06-09 Robert Bosch Gmbh Dynamikabhängige verhaltensplanung für zumindest teilweise automatisiert fahrende fahrzeuge
DE102020215324A1 (de) 2020-12-03 2022-06-09 Robert Bosch Gesellschaft mit beschränkter Haftung Auswahl von Fahrmanövern für zumindest teilweise automatisiert fahrende Fahrzeuge
CN113219962A (zh) * 2021-02-26 2021-08-06 北京航空航天大学合肥创新研究院(北京航空航天大学合肥研究生院) 一种面向混行队列跟驰安全的控制方法、系统及存储介质
CN113219962B (zh) * 2021-02-26 2023-02-28 北京航空航天大学合肥创新研究院(北京航空航天大学合肥研究生院) 一种面向混行队列跟驰安全的控制方法、系统及存储介质
DE102021206014A1 (de) 2021-06-14 2022-12-15 Robert Bosch Gesellschaft mit beschränkter Haftung Bewegungsvorhersage für Verkehrsteilnehmer
WO2022263175A1 (de) 2021-06-14 2022-12-22 Robert Bosch Gmbh Bewegungsvorhersage für verkehrsteilnehmer

Also Published As

Publication number Publication date
CN112292719A (zh) 2021-01-29
US11858506B2 (en) 2024-01-02
EP3811351A1 (de) 2021-04-28
US20210171061A1 (en) 2021-06-10
CN112292719B (zh) 2023-01-31
WO2020001867A1 (de) 2020-01-02

Similar Documents

Publication Publication Date Title
DE102018210280A1 (de) Anpassung der Trajektorie eines Ego-Fahrzeugs an bewegte Fremdobjekte
DE102019104974A1 (de) Verfahren sowie System zum Bestimmen eines Fahrmanövers
EP2771227B1 (de) Verfahren zum führen eines fahrzeugs und fahrerassistenzsystem
EP2907120B1 (de) Schätzung des strassentyps mithilfe von sensorbasierten umfelddaten
EP3176046A1 (de) Verfahren und vorrichtung in einem kraftfahrzeug zum automatisierten fahren
DE102016205152A1 (de) Fahrerassistenzsystem zum Unterstützen eines Fahrers beim Führen eines Fahrzeugs
DE102017115988A1 (de) Modifizieren einer Trajektorie abhängig von einer Objektklassifizierung
DE102015208790A1 (de) Bestimmen einer Trajektorie für ein Fahrzeug
DE102019118366A1 (de) Verfahren sowie Steuergerät für ein System zum Steuern eines Kraftfahrzeugs
EP1096457B2 (de) Verfahren und Einrichtung zur elektronischen Erkennung von Verkehrszeichen
DE102018111070B4 (de) Verfahren zum Betreiben eines Kraftfahrzeugs zur Verbesserung von Arbeitsbedingungen von Auswerteeinheiten des Kraftfahrzeugs, Steuersystem zum Durchführen eines derartigen Verfahrens sowie Kraftfahrzeug mit einem derartigen Steuersystem
DE102014003343A1 (de) Verfahren zum Ermitteln eines Spurwechselbedarfs eines Systemfahrzeugs
DE102019216836A1 (de) Verfahren zum Trainieren wenigstens eines Algorithmus für ein Steuergerät eines Kraftfahrzeugs, Computerprogrammprodukt sowie Kraftfahrzeug
DE102012008660A1 (de) Verfahren zur Unterstützung eines Fahrers beim Führen eines Fahrzeugs
DE102017118651A1 (de) Verfahren und System zur Kollisionsvermeidung eines Fahrzeugs
WO2018215242A2 (de) Verfahren zur ermittlung einer fahranweisung
DE102020131949A1 (de) System und verfahren zum erlernen einer fahrerpräferenz und zum anpassen einer spurzentrierungssteuerung an ein fahrerverhalten
WO2020069812A1 (de) Verfahren zum zumindest teilautomatisierten führen eines kraftfahrzeugs auf einer fahrbahn
DE102017200580A1 (de) Verfahren zur Optimierung einer Manöverplanung für autonom fahrende Fahrzeuge
DE102016210760A1 (de) Verfahren zur Interaktion zwischen einem Fahrzeug und Verkehrsteilnehmer
DE102020211971A1 (de) Fahrzeugtrajektorienvorhersage unter verwendung von strassentopologie und verkehrsteilnehmer-objektzuständen
EP3994040B1 (de) Verfahren zum koordinieren von verkehrsteilnehmern durch eine servervorrichtung sowie eine servervorrichtung und eine steuerschaltung zum durchführen des verfahrens
DE102021000792A1 (de) Verfahren zum Betrieb eines Fahrzeuges
DE102019215141B4 (de) Verfahren zum Prognostizieren einer zukünftigen Verkehrssituation in einer Umgebung eines Kraftfahrzeugs durch Bestimmen mehrerer in sich konsistenter Gesamtszenarios für unterschiedliche Verkehrsteilnehmer; Kraftfahrzeug
DE102019008896A1 (de) Computerimplementiertes Verfahren zur Planung eines Fahrmanövers eines autonom fahrenden Kraftfahrzeugs, Computerprogrammprodukt sowie Kraftfahrzeug