EP4359274A1 - Verfahren zur trajektorienoptimierung - Google Patents

Verfahren zur trajektorienoptimierung

Info

Publication number
EP4359274A1
EP4359274A1 EP22758420.8A EP22758420A EP4359274A1 EP 4359274 A1 EP4359274 A1 EP 4359274A1 EP 22758420 A EP22758420 A EP 22758420A EP 4359274 A1 EP4359274 A1 EP 4359274A1
Authority
EP
European Patent Office
Prior art keywords
trajectory
driving
information
travel
route
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
EP22758420.8A
Other languages
English (en)
French (fr)
Inventor
Nicolas Stein
Hendrik DEUSCH
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aumovio Germany GmbH
Original Assignee
Continental Automotive Technologies GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Continental Automotive Technologies GmbH filed Critical Continental Automotive Technologies GmbH
Publication of EP4359274A1 publication Critical patent/EP4359274A1/de
Pending legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B62LAND VEHICLES FOR TRAVELLING OTHERWISE THAN ON RAILS
    • B62DMOTOR VEHICLES; TRAILERS
    • B62D15/00Steering not otherwise provided for
    • B62D15/02Steering position indicators ; Steering position determination; Steering aids
    • B62D15/027Parking aids, e.g. instruction means
    • B62D15/0285Parking performed automatically
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/06Automatic manoeuvring for parking
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles
    • B60W60/001Planning or execution of driving tasks
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0212Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory
    • G05D1/0221Control of position or course in two dimensions specially adapted to land vehicles with means for defining a desired trajectory involving a learning process
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Definitions

  • the invention relates to a method for trajectory optimization in recurring driving situations, in particular in recurring parking situations.
  • a trajectory traveled manually by the human driver from a starting position to a parking space is stored as the target position, including the parking maneuver and the detected surroundings. Based on this stored information, the stored trajectory can be traversed at a later point in time.
  • the disadvantage here is that the trajectory can only be followed as it was originally stored. Since the trajectory driven by the human driver is often not optimal in terms of length, time and/or the steering angle, and this manually driven trajectory forms the basis for the automated driving process, the automatically driven trajectory is often not optimal with regard to the aforementioned trajectory properties.
  • the invention relates to a method for determining a driving trajectory for recurring driving situations.
  • the procedure has the following steps:
  • a route is traveled from a starting position to a target position by a human driver using a vehicle.
  • This route refers to the recurring driving situation, i.e. it will be driven through more often in the future, for example when parking to a whimper, at work, etc.
  • the sensor system can be formed by any vehicle sensor system, via which the environment of the route can be detected and the collision-free driving lane can be determined therefrom.
  • the sensor system can include one or more ultrasonic sensors, at least one camera, at least one radar sensor and/or at least one LIDAR sensor.
  • information about a traffic lane that can be driven on is generated and stored based on this environmental information. This defines the area or driving path within which the trajectory can be planned.
  • a driving trajectory is determined by means of a computing unit of the vehicle based on the information on the driving lane that can be driven on.
  • the computing unit implements a strategy of reinforcement learning, ie it is over several iterative test trajectories, a Assessment of the test trajectories and feedback to the learning system as to whether the trajectory properties of the currently calculated test trajectory have improved compared to a previous test trajectory, a driving trajectory is sought that has improved trajectory properties.
  • the determined travel trajectory is stored in order to be able to drive the route automatically or partially automatically using a driver assistance system based on this travel trajectory in the future.
  • the driver can be outside the vehicle, i.e. the vehicle drives itself to the parking position, for example.
  • the technical advantage of the method according to the invention is that the reinforcement learning method does not require complex training data to generate an optimized driving trajectory, but rather the human driver only has to travel the route at least once from a starting position to a target position in order to find the passable lane determine. An optimized tramline is then found by means of reinforcement learning.
  • This has the advantage that the driving trajectory to be determined by the optimization is not limited by the quality of the training data, but a driving trajectory that is better than the driving trajectory driven by the human driver can be determined by the reinforcement learning.
  • an agent and an evaluation system are implemented in the computing unit.
  • the agent is configured to determine a travel trajectory without training data, which is optimized with regard to predefined trajectory properties.
  • a travel trajectory calculated by the agent is assessed by the rating system based on trajectory properties and depending on the A new travel trajectory is calculated based on the assessment result.
  • new travel trajectories can be calculated, influenced by the assessment result, and travel trajectories with better trajectory properties can thereby be generated.
  • a number of different trajectory properties are used to assess a trajectory.
  • the different trajectory properties can preferably be weighted differently.
  • a new trajectory can be calculated under one or more specifications, in such a way that one or more trajectory properties are improved. This can be done, for example, in such a way that one or more trajectory properties are improved and other trajectory properties are degraded. For example, a very long trajectory can be improved by reducing the trajectory length in order to reach the target position more quickly.
  • the agent iteratively calculates new travel trajectories in such a way that the assessment result is increased.
  • a number of different trajectory properties are preferably included in the assessment. As a result, the trajectory can be improved over several iteration steps.
  • the evaluation system includes a reward function that calculates a positive or negative reward for a calculated travel trajectory.
  • This reward is feedback information for the agent, which influences subsequent trajectory calculations.
  • the agent can be influenced in such a way that successive trajectories with better Trajectory properties and thus a better assessment result are calculated.
  • the agent iteratively calculates travel trajectories such that a subsequent travel trajectory receives a higher positive reward than a previous travel trajectory.
  • the quality of the travel trajectories can thus be successively improved and a final travel trajectory which has sufficiently good trajectory properties can be determined by the reinforcing learning method.
  • the trajectory properties used to assess a driving trajectory include the time required to travel through the driving trajectory, the distance covered by the driving trajectory, information about steering angle changes, information about longitudinal acceleration and/or information about lateral acceleration.
  • the travel trajectories can be assessed objectively by means of these trajectory properties, based on the perception of a human driver.
  • the route from the starting position to the target position is traversed several times. This can exclusively be a number of driving processes carried out by the human driver or driving processes that are also carried out at least partially in an automated manner. Information about the surroundings is recorded by a sensor system in the vehicle and information about the lane that can be driven on is determined and stored. More comprehensive environmental information can be obtained by driving along the route several times, so that an improved trajectory determination can take place.
  • This fusion of environmental information or tramline information allows a modified, in particular larger, tramline to be obtained. Based on this modified tramline, there is more freedom for the calculation of travel trajectories.
  • the environment when driving through the route from the starting point to the destination, the environment is continuously detected and a driving trajectory is determined by reinforcement learning if it can be seen from the detected environmental information that the information on the trafficable lane has changed due to static objects . It can thereby be ensured that the travel trajectory is continuously adapted to static changes in the driving lane that can be driven on, for example as a result of a structural change.
  • the route from the starting position to the target position is driven through automatically based on the determined travel trajectory. There is a deviation from the determined travel trajectory when an obstacle is detected on the determined travel trajectory. This makes it possible to react situation-specifically to temporary changes in the passable lane and avoid collisions by avoiding collisions.
  • the computing unit determines a number of different optimized driving trajectories using the reinforcement learning strategy, and a driving trajectory from these optimized driving trajectories is selected based on one or more target criteria. In this way it can be achieved that in cases in which several different optimized driving trajectories can be determined, that optimized travel trajectory is used that best meets the specified assessment criteria.
  • the invention relates to a system for determining a driving trajectory for recurring driving situations, comprising a computing unit provided in a vehicle. The procedure has the following steps:
  • FIG. 2 shows an example of a block diagram that explains the method steps for determining a driving trajectory for recurring driving situations.
  • FIG. 1 shows an example and a rough schematic of a vehicle F at the start of a recurring driving situation that is described by a route FS from a starting position SP to a target position ZP.
  • a route FS can be, for example, the route between a property access road and a parking position provided on the property, for example a garage parking space.
  • a computing unit of the vehicle F In order to be able to drive through this route FS automatically, it is necessary for a computing unit of the vehicle F to calculate a travel trajectory, along which the vehicle F travels from the starting position SP to the target position ZP.
  • the driving trajectory it is necessary that information about the environment in the area of the driving route FS is available in order to know the freely navigable area based on this, also referred to below as the driving path.
  • the vehicle F has a sensor system, by means of which the environmental information can be recorded.
  • the sensor system can include, for example, ultrasonic sensors, one or more cameras, one or more radar sensors and/or one or more LIDAR sensors.
  • the route FS it is necessary for the route FS to be traveled at least once by the human driver, ie from the starting position SP to the target position ZP.
  • the environmental information can be recorded by the sensors of the vehicle F and the driving path that can be driven on can thus be determined.
  • a travel trajectory from the starting position SP to the target position ZP can be calculated. This is preferably done by a trajectory planner that is implemented in a computer unit of the vehicle.
  • the computer unit is configured for machine learning, based on the principle of reinforcement learning.
  • the computer unit has an agent that can determine a travel trajectory without training data, which is optimized with regard to predefined trajectory properties.
  • the computer unit does not implement a supervised learning method based on a set of training data.
  • an evaluation system which is designed to evaluate a calculated travel trajectory based on predefined trajectory properties. Depending on how well the calculated driving trajectory fulfills the specified trajectory properties, a positive or negative reward is provided by the evaluation system.
  • the rating system generates a positive reward if the trajectory properties of a newly calculated travel trajectory are better than the trajectory properties of a previously calculated trajectory.
  • the rating system generates a negative reward, for example, if the trajectory properties of a newly calculated driving trajectory are worse than the trajectory properties of a previously calculated trajectory.
  • the previously calculated trajectory can in each case be the trajectory calculated directly beforehand, or a trajectory can be used that was calculated a long time ago.
  • the agent Based on the positive or negative rewards, the agent independently learns how a driving trajectory has to be changed in order to receive positive rewards.
  • the rewards can be used to derive a utility function that represents the value of a trajectory property in relation to receiving a positive reward. This makes it possible to achieve a targeted improvement in the trajectory properties.
  • the process for determining a travel trajectory is preferably initially initiated when a driving path that can be driven on is available for a repeated driving situation. For example, the calculation can be initiated immediately after reaching the target position ZP. Travel trajectories are preferably calculated until a sufficiently good travel trajectory can be determined. One or more termination criteria can be defined here, based on which the iterative trajectory optimization is terminated.
  • the trajectory properties on which the assessment of the travel trajectories is based can be, for example, the time to travel through the travel trajectory, the distance of the travel trajectory, information about the steering angle change, information about the longitudinal acceleration and/or information about the lateral acceleration.
  • the route FS is preferably traversed several times between the starting position SP and the target position ZP in order to capture environmental information. As a result, different environmental information can be recorded in chronological succession. These can be combined or merged with each other in order to obtain improved information on the traffic lane that can be driven on. This improved information can then be used as a basis for calculating the driving trajectory.
  • the advantage lies in the fact that with each additional trajectory driven, in particular manually driven trajectory, the driving path that can be driven on can be enlarged and thus there is also a higher potential for optimizing the driving trajectory through reinforcement learning.
  • a detection of the surroundings also takes place when driving along the route FS automatically on the basis of a previously calculated driving trajectory. On the one hand, this is done with the aim that obstructive objects located on the travel trajectory are detected and the vehicle can avoid them or stop in front of them.
  • the environment is also detected during automated driving because new stationary objects are recognized on a driving path that was previously detected as passable, and thus a new trajectory optimization through reinforcement learning, taking into account the changed driving path, becomes possible. In other words, the calculation of the travel trajectory can be carried out again when the driving lane that can be driven on changes, in order to determine an optimized travel trajectory based on the changed environmental situation.
  • the trajectory optimization can preferably take place several times, for example based on other optimization criteria, in order to obtain several different optimized travel trajectories. Afterward these different optimized driving trajectories can be compared with each other.
  • the different optimized driving trajectories can be compared with each other based on predetermined criteria such as time to drive through the driving trajectory, distance of the driving trajectory, information about the steering angle change, information about the longitudinal acceleration and/or information about the lateral acceleration in order to determine a final driving trajectory, which is then used for the autonomous driving function is used.
  • the autonomous driving function can be “trained parking” in a recurring parking situation.
  • FIG. 2 shows a diagram that explains the method steps for determining the travel trajectory.
  • a route is traveled from a start position to a target position by a human driver using a vehicle (S10).
  • a travel trajectory is then determined based on information on the traffic lane that can be driven on by means of a computing unit in the vehicle (S13).
  • the computing unit implements a strategy of reinforcement learning, in which a calculated travel trajectory is assessed based on trajectory properties and iteratively optimized, specifically in such a way that an attempt is made to successively improve the trajectory properties of the travel trajectory through the iteration steps.
  • the determined driving trajectory is stored (S14). As a result, the driving trajectory determined can be used for automated driving in the recurring driving situation.

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Combustion & Propulsion (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Human Computer Interaction (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Traffic Control Systems (AREA)
  • Navigation (AREA)
  • Control Of Driving Devices And Active Controlling Of Vehicle (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen, wobei das Verfahren die folgenden Schritte aufweist: - Abfahren einer Fahrstrecke (FS) von einer Startposition (SP) zu einer Zielposition (ZP) durch einen menschlichen Fahrer mittels eines Fahrzeugs (F) (S10); - Erfassen von Umgebungsinformationen durch eine Sensorik des Fahrzeugs (F) während des Abfahrens der Fahrstrecke (FS) (S11); - Abspeichern von Informationen zu einer befahrbaren Fahrgasse basierend auf den Umgebungsinformationen (S12); - Ermitteln einer Fahrtrajektorie basierend auf Informationen zur befahrbaren Fahrgasse mittels einer Recheneinheit des Fahrzeugs (F), die eine Strategie des bestärkenden Lernens implementiert (S13); - Abspeichern der ermittelten Fahrtrajektorie (S14).

Description

Beschreibung
Verfahren zur Trajektorienoptimierung
Die Erfindung betrifft ein Verfahren zur Trajektorienoptimierung bei wiederkehrenden Fahrsituationen, insbesondere bei wiederkehrenden Parksituationen.
Teilautomatisierte oder automatisierte Parkfunktionen von Fahrzeugen sind bereits bekannt. Dabei wird beispielsweise eine vom menschlichen Fahrer manuell abgefahrene Trajektorie von einer Startposition zu einem Parkplatz als Zielposition einschließlich des Einparkmanövers und die detektierte Umgebung gespeichert. Basierend auf diesen gespeicherten Informationen kann zu einem späteren Zeitpunkt die gespeicherte Trajektorie abgefahren werden.
Nachteilig hierbei ist, dass sich die Trajektorie lediglich so abfahren lässt, wie sie ursprünglich abgespeichert wurde. Da die vom menschlichen Fahrer abgefahrene Trajektorie oft nicht optimal bezüglich der Länge, der Zeit und/oder dem Lenkwinkel ist und diese manuell abgefahrene Trajektorie die Grundlage für den automatisierten Fahrvorgang bildet, ist auch die automatisiert abgefahrene Trajektorie häufig nicht optimal hinsichtlich der vorgenannten Trajektorieneigenschaften.
Ausgehend hiervon ist es Aufgabe der Erfindung, ein Verfahren zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen anzugeben, das verbesserte Trajektorieneigenschaften für die automatisiert abgefahrene Fahrstrecke bietet.
Die Aufgabe wird durch ein Verfahren mit den Merkmalen des unabhängigen Patentanspruchs 1 gelöst. Bevorzugte Ausführungsformen sind Gegenstand der Unteransprüche. Ein System zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen ist Gegenstand des nebengeordneten Patentanspruchs 15.
Gemäß einem ersten Aspekt bezieht sich die Erfindung auf ein Verfahren zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen. Das Verfahren weist die folgenden Schritte auf:
Zunächst wird eine Fahrstrecke von einer Startposition zu einer Zielposition durch einen menschlichen Fahrer mittels eines Fahrzeugs abgefahren. Diese Fahrstrecke bezieht sich auf die wiederkehrende Fahrsituation, d.h. wird zukünftig öfter durchfahren, beispielsweise als Parkvorgang zu Flause, am Arbeitsplatz etc.
Während des Abfahrens der Fahrstrecke werden Umgebungsinformationen durch eine Sensorik des Fahrzeugs erfasst. Die Sensorik kann durch jegliche Fahrzeugsensorik gebildet werden, über die die Umgebung der Fahrstrecke erfassbar ist und daraus die kollisionsfrei befahrbare Fahrgasse ermittelt werden kann. Beispielsweise kann die Sensorik einen oder mehrere Ultraschallsensoren, zumindest eine Kamera, zumindest einen Radarsensor und/oder zumindest einen LIDAR- Sensor umfassen.
Nach dem Erfassen der Umgebungsinformationen werden Informationen zu einer befahrbaren Fahrgasse basierend auf diesen Umgebungsinformationen erzeugt und abgespeichert. Damit wird der Bereich bzw. Fahrschlauch festgelegt, innerhalb dem die Trajektorienplanung erfolgen kann.
Basierend auf den Informationen zur befahrbaren Fahrgasse wird eine Fahrtrajektorie mittels einer Recheneinheit des Fahrzeugs ermittelt. Die Recheneinheit implementiert dabei eine Strategie des bestärkenden Lernens, d.h. es wird über mehrere iterative Versuchstrajektorien, eine Beurteilung der Versuchstrajektorien und eine Rückmeldung an das lernende System, ob sich die Trajektorieneigenschaften der aktuell berechneten Versuchstrajektorie gegenüber einer früheren Versuchstrajektorie verbessert haben, eine Fahrtrajektorie gesucht, die verbesserte Trajektorieneigenschaften aufweist.
Zuletzt erfolgt ein Abspeichern der ermittelten Fahrtrajektorie, um basierend auf dieser Fahrtrajektorie zukünftig die Fahrstrecke automatisiert oder teilautomatisiert mittels eines Fahrassistenzsystems abfahren zu können. Dabei kann sich der Fahrer außerhalb des Fahrzeugs befinden, d.h. das Fahrzeug fährt beispielsweise selbstständig zur Parkposition.
Der technische Vorteil des erfindungsgemäßen Verfahrens besteht darin, dass durch das bestärkende Lernverfahren keine komplexen Trainingsdaten zum Erzeugen einer optimierten Fahrtrajektorie nötig sind, sondern lediglich zumindest einmal die Fahrstrecke von einer Startposition zu einer Zielposition durch den menschlichen Fahrer abgefahren werden muss, um die befahrbare Fahrgasse zu bestimmen. Das Auffinden einer optimierten Fahrgasse erfolgt dann über bestärkendes Lernen. Dies hat den Vorteil, dass die durch die Optimierung zu bestimmende Fahrtrajektorie nicht durch die Güte der Trainingsdaten limitiert ist, sondern durch das bestärkende Lernen eine Fahrtrajektorie ermittelt werden kann, die besser ist als die vom menschlichen Fahrer gefahrene Fahrtrajektorie.
Gemäß einem Ausführungsbeispiel sind in der Recheneinheit ein Agent und ein Bewertungssystem implementiert. Der Agent ist dazu konfiguriert, ohne Trainingsdaten eine Fahrtrajektorie zu bestimmen, die im Hinblick auf vorgegebene Trajektorieneigenschaften optimiert ist. Eine vom Agenten berechnete Fahrtrajektorie wird durch das Bewertungssystem basierend auf Trajektorieneigenschaften beurteilt und abhängig vom Beurteilungsergebnis wird eine neue Fahrtrajektorie berechnet. Dadurch können beeinflusst durch das Beurteilungsergebnis neue Fahrtrajektorien berechnet und dadurch Fahrtrajektorien mit besseren Trajektorieneigenschaften erzeugt werden.
Gemäß einem Ausführungsbeispiel werden mehrere unterschiedliche Trajektorieneigenschaften zur Beurteilung einer Trajektorie herangezogen. Vorzugsweise können die unterschiedlichen Trajektorieneigenschaften verschieden gewichtet werden. Die Berechnung einer neuen Trajektorie kann unter einer oder mehreren Vorgaben erfolgen, und zwar derart, dass eine oder mehrere Trajektorieneigenschaften verbessert werden. Dies kann beispielsweise derart erfolgen, dass eine oder mehrere Trajektorieneigenschaften verbessert und andere Trajektorieneigenschaften verschlechtert werden. So kann beispielsweise eine sehr lange Trajektorie dadurch verbessert werden, dass die Trajektorienlänge verkleinert wird, um schneller zur Zielposition zu gelangen.
Gemäß einem Ausführungsbeispiel berechnet der Agent iterativ neue Fahrtrajektorien derart, dass das Beurteilungsergebnis gesteigert wird. Dabei fließen vorzugsweise mehrere unterschiedliche Trajektorieneigenschaften, beispielsweise mit unterschiedlicher Gewichtung, in die Beurteilung ein. Dadurch kann über mehrere Iterationsschritte hinweg die Trajektorie verbessert werden.
Gemäß einem Ausführungsbeispiel umfasst das Bewertungssystem eine Belohnungsfunktion, die zu einer berechneten Fahrtrajektorie eine positive oder negative Belohnung berechnet. Diese Belohnung ist eine Feedbackinformation für den Agenten, der die nachfolgenden Trajektorienberechnungen beeinflusst. Dadurch kann der Agent derart beeinflusst werden, dass sukzessive Trajektorien mit besseren Trajektorieneigenschaften und damit einem besseren Beurteilungsergebnis berechnet werden.
Gemäß einem Ausführungsbeispiel berechnet der Agent iterativ Fahrtrajektorien derart, dass eine nachfolgende Fahrtrajektorie eine höhere positive Belohnung erhält als eine vorherige Fahrtrajektorie. Damit kann sukzessive die Qualität der Fahrtrajektorien verbessert und durch das bestärkende Lernverfahren eine finale Fahrtrajektorie ermittelt werden, die hinreichend gute Trajektorieneigenschaften aufweist.
Gemäß einem Ausführungsbeispiel umfassen die zur Beurteilung einer Fahrtrajektorie verwendeten Trajektorieneigenschaften die Zeit zum Durchfahren der Fahrtrajektorie, die Wegstrecke der Fahrtrajektorie, Informationen zu Lenkwinkeländerungen, Informationen zur Längsbeschleunigung und/oder Informationen zur Querbeschleunigung. Mittels dieser Trajektorieneigenschaften können die Fahrtrajektorien objektiv beurteilt werden, und zwar angelehnt an die Wahrnehmung eines menschlichen Fahrers.
Gemäß einem Ausführungsbeispiel wird die Fahrstrecke von der Startposition zu der Zielposition mehrfach abgefahren. Dies können ausschließlich mehrere vom menschlichen Fahrer durchgeführte Fahrvorgänge sein oder aber zumindest teilweise auch automatisiert durchgeführte Fahrvorgänge. Dabei werden Umgebungsinformationen durch eine Sensorik des Fahrzeugs erfasst und Informationen zur befahrbaren Fahrgasse ermittelt und gespeichert. Durch ein mehrfaches Abfahren der Fahrstrecke können umfassendere Umgebungsinformationen erhalten werden, so dass eine verbesserte Trajektorienbestimmung erfolgen kann.
Gemäß einem Ausführungsbeispiel werden mehrere zeitlich nacheinander ermittelte Umgebungsinformationen und/oder Informationen zur befahrbaren Fahrgasse kombiniert, und diese kombinierten Informationen zur befahrbaren Fahrgasse werden zum Ermitteln einer Fahrtrajektorie herangezogen. Durch diese Fusion von Umgebungsinformationen bzw. Fahrgasseninformationen kann eine modifizierte, insbesondere größere Fahrgasse erhalten werden. Auf Basis dieser modifizierten Fahrgasse wird ein größerer Freiraum für die Berechnung von Fahrtrajektorien erhalten.
Gemäß einem Ausführungsbeispiel wird beim Durchfahren der Fahrstrecke von dem Startpunkt zu dem Zielpunkt fortlaufend eine Umgebungserfassung vollzogen und das Ermitteln einer Fahrtrajektorie durch bestärkendes Lernen wird neu vollzogen, wenn anhand der erfassten Umgebungsinformationen erkennbar ist, dass sich die Informationen zur befahrbaren Fahrgasse durch statische Objekte verändert hat. Dadurch kann sichergestellt werden, dass die Fahrtrajektorie an statische Veränderungen der befahrbaren Fahrgasse, beispielsweise durch eine bauliche Veränderung, fortlaufend angepasst wird.
Gemäß einem Ausführungsbeispiel wird die Fahrstrecke von der Startposition zur Zielposition basierend auf der ermittelten Fahrtrajektorie automatisiert durchfahren. Von der ermittelten Fahrtrajektorie wird dann abgewichen, wenn ein Hindernis auf der ermittelten Fahrtrajektorie detektiert wird. Dadurch ist es möglich, situationsbezogen auf temporäre Veränderungen der befahrbaren Fahrgasse zu reagieren und durch Ausweichen Kollisionen zu vermeiden.
Gemäß einem Ausführungsbeispiel ermittelt die Recheneinheit mehrere unterschiedliche optimierte Fahrtrajektorien mittels der Strategie des bestärkenden Lernens und eine Fahrtrajektorie dieser optimierten Fahrtrajektorien wird basierend auf einem oder mehreren Zielkriterien auswählt. Dadurch kann erreicht werden, dass in Fällen, in denen mehrere unterschiedliche optimierte Fahrtrajektorien ermittelt werden können, diejenige optimierte Fahrtrajektorie verwendet wird, die vorgegebene Beurteilungskriterien am besten erfüllt. Gemäß einem weiteren Aspekt betrifft die Erfindung ein System zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen umfassend eine in einem Fahrzeug vorgesehene Recheneinheit. Das Verfahren weist die folgenden Schritte auf:
- Erfassen von Umgebungsinformationen durch eine Sensorik des Fahrzeugs während des Abfahrens der Fahrstrecke von einer
Startposition zu einer Zielposition durch einen menschlichen Fahrer;
- Abspeichern von Informationen zu einer befahrbaren Fahrgasse basierend auf den Umgebungsinformationen;
- Ermitteln einer Fahrtrajektorie basierend auf Informationen zur befahrbaren Fahrgasse mittels der Recheneinheit, die eine Strategie des bestärkenden Lernens implementiert;
- Abspeichern der ermittelten Fahrtrajektorie in einer Speichereinheit.
Die Ausdrücke „näherungsweise“, „im Wesentlichen“ oder „etwa“ bedeuten im Sinne der Erfindung Abweichungen vom jeweils exakten Wert um +/- 10%, bevorzugt um +/- 5% und/oder Abweichungen in Form von für die Funktion unbedeutenden Änderungen.
Weiterbildungen, Vorteile und Anwendungsmöglichkeiten der Erfindung ergeben sich auch aus der nachfolgenden Beschreibung von Ausführungsbeispielen und aus den Figuren. Dabei sind alle beschriebenen und/oder bildlich dargestellten Merkmale für sich oder in beliebiger Kombination grundsätzlich Gegenstand der Erfindung, unabhängig von ihrer Zusammenfassung in den Ansprüchen oder deren Rückbeziehung. Auch wird der Inhalt der Ansprüche zu einem Bestandteil der Beschreibung gemacht. Die Erfindung wird im Folgenden anhand der Figuren an Ausführungsbeispielen näher erläutert. Es zeigen:
Fig. 1 beispielhaft eine Draufsichtdarstellung einer Fahrstrecke einer wiederkehrenden Fahrsituation; und
Fig. 2 beispielhaft ein Blockdiagramm, das die Verfahrensschritte zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen verdeutlicht.
Figur 1 zeigt beispielhaft und grob schematisch ein Fahrzeug F zu Beginn einer wiederkehrenden Fahrsituation, die durch eine Fahrstrecke FS von einer Startposition SP zu einer Zielposition ZP beschrieben ist. Eine solche Fahrstrecke FS kann beispielsweise die Strecke zwischen einer Grundstückszufahrt und einer am Grundstück vorgesehenen Parkposition, beispielsweise einem Garagenstellplatz, sein.
Um diese Fahrstrecke FS automatisiert durchfahren zu können, ist es nötig, eine Fahrtrajektorie durch eine Recheneinheit des Fahrzeugs F zu berechnen, entlang derer das Fahrzeug F von der Startposition SP zur Zielposition ZP fährt.
Für die Berechnung der Fahrtrajektorie ist es nötig, dass Informationen über die Umgebung im Bereich der Fahrstrecke FS vorhanden sind, um basierend darauf den frei befahrbaren Bereich, nachfolgend auch als Fahrschlauch bezeichnet, zu kennen.
Zur Bestimmung des Fahrschlauchs weist das Fahrzeug F eine Sensorik auf, mittels der die Umgebungsinformationen erfassbar sind. Die Sensorik kann beispielsweise Ultraschallsensoren, eine oder mehrere Kameras, einen oder mehrere Radarsensoren und/oder einen oder mehrere LIDAR- Sensoren umfassen. Um die Umgebungsinformationen entlang der Fahrstrecke FS initial bestimmen zu können, ist es nötig, dass die Fahrstrecke FS zunächst zumindest einmal durch den menschlichen Fahrer abgefahren wird, d.h. von der Startposition SP zur Zielposition ZP. Bei diesem Durchfahren können die Umgebungsinformationen durch die Sensorik des Fahrzeugs F erfasst und damit der befahrbare Fahrschlauch ermittelt werden.
Nachdem der befahrbare Fahrschlauch bestimmt ist, kann eine Berechnung einer Fahrtrajektorie von der Startposition SP zur Zielposition ZP erfolgen. Dies erfolgt vorzugsweise durch einen Trajektorienplaner, der in einer Rechnereinheit des Fahrzeugs implementiert ist.
Die Rechnereinheit ist zum maschinellen Lernen konfiguriert, und zwar nach dem Prinzip des bestärkenden Lernens (engl. Reinforcement learning). Hierbei weist die Rechnereinheit einen Agenten auf, der ohne Trainingsdaten eine Fahrtrajektorie bestimmen kann, die im Hinblick auf vorgegebene Trajektorieneigenschaften optimiert ist. In anderen Worten implementiert die Rechnereinheit kein überwachtes Lernverfahren, das auf einem Satz von Trainingsdaten basiert.
Zudem ist ein Bewertungssystem vorgesehen, das zur Beurteilung einer berechneten Fahrtrajektorie basierend auf vorgegebenen Trajektorieneigenschaften ausgebildet ist. Je nachdem, wie gut die berechnete Fahrtrajektorie die vorgegebenen Trajektorieneigenschaften erfüllt, wird durch das Bewertungssystem eine positive oder negative Belohnung bereitgestellt. Insbesondere generiert das Bewertungssystem eine positive Belohnung, wenn die Trajektorieneigenschaften einer neu berechneten Fahrtrajektorie besser sind als die Trajektorieneigenschaften einer vorher berechneten Trajektorie. Im umgekehrten Fall generiert das Bewertungssystem beispielsweise eine negative Belohnung, wenn die Trajektorieneigenschaften einer neu berechneten Fahrtrajektorie schlechter sind als die Trajektorieneigenschaften einer vorher berechneten Trajektorie. Die vorher berechnete Trajektorie kann dabei jeweils die direkt vorher berechnete Trajektorie sein, oder es kann auf eine Trajektorie zurückgegriffen werden, die bereits länger zurückliegend berechnet wurde.
Basierend auf den positiven bzw. negativen Belohnungen lernt der Agent selbstständig, wie eine Fahrtrajektorie verändert werden muss, um positive Belohnungen zu erhalten. Anhand der Belohnungen kann eine Nutzenfunktion ermittelt werden, die angibt, welchen Wert eine Trajektorieneigenschaft in Bezug auf den Erhalt einer positiven Belohnung hat. Dadurch ist es möglich, eine gezielte Verbesserung der Trajektorieneigenschaften zu erreichen.
Vorzugsweise wird der Prozess zur Ermittlung einer Fahrtrajektorie zunächst dann eingeleitet, wenn zu einer sich wiederholenden Fahrsituation ein befahrbarer Fahrschlauch zur Verfügung steht. Beispielsweise kann die Berechnung direkt nach dem Erreichen der Zielposition ZP eingeleitet werden. Vorzugsweise wird die Berechnung von Fahrtrajektorien so lange vollzogen, bis eine hinreichend gute Fahrtrajektorie ermittelt werden konnte. Es können hierbei ein oder mehrere Abbruchkriterien definiert sein, basierend auf denen die iterative Trajektorienoptimierung beendet wird.
Die Trajektorieneigenschaften, basierend auf denen die Beurteilung der Fahrtrajektorien erfolgt, können beispielsweise die Zeit zum Durchfahren der Fahrtrajektorie, die Wegstrecke der Fahrtrajektorie, Informationen zur Lenkwinkeländerung, Informationen zur Längsbeschleunigung und/oder Informationen zur Querbeschleunigung sein.
Vorzugsweise wird die Fahrstrecke FS zwischen der Startposition SP und der Zielposition ZP mehrmals durchfahren, um dabei Umgebungsinformationen zu erfassen. Dadurch lassen sich zeitlich hintereinander unterschiedliche Umgebungsinformationen erfassen. Diese können miteinander kombiniert bzw. fusioniert werden, um basierend darauf verbesserte Informationen zur befahrbaren Fahrgasse zu erhalten. Diese verbesserten Informationen können anschließend als Basis für die Berechnung der Fahrtrajektorie verwendet werden. Der Vorteil liegt darin, dass mit jeder zusätzlich gefahrenen Trajektorie, insbesondere manuell gefahrenen Trajektorie, der befahrbare Fahrschlauch vergrößert werden kann und damit auch ein höheres Potential für eine Optimierung der Fahrtrajektorie durch das bestärkende Lernen besteht.
Es erfolgt auch bei dem automatisierten Befahren der Fahrstrecke FS auf der Grundlage einer vorher berechneten Fahrtrajektorie eine Umgebungserfassung. Diese erfolgt zum einen mit dem Ziel, dass auf der Fahrtrajektorie befindliche hinderliche Objekte erfasst werden und das Fahrzeug diesen ausweichen bzw. davor anhalten kann. Zum anderen erfolgt die Umgebungserfassung beim automatisierten Befahren auch aus dem Grund, dass neue stationäre Objekte auf einem vorher als befahrbar detektierten Fahrschlauch erkannt werden und damit eine neue Trajektorienoptimierung durch bestärkendes Lernen unter Berücksichtigung des veränderten Fahrschlauchs möglich wird. Mit anderen Worten wird kann damit bei einer Veränderung der befahrbaren Fahrgasse die Berechnung der Fahrtrajektorie erneut durchgeführt werden, um basierend auf der veränderten Umgebungssituation eine optimierte Fahrtrajektorie zu ermitteln.
Es kann Vorkommen, dass die Optimierung der Fahrtrajektorie durch bestärkendes Lernen nicht zu einem globalen Optimum der Fahrtrajektorie führt, sondern lediglich zu einem lokalen Optimum. Daher kann vorzugsweise die Trajektorienoptimierung mehrfach erfolgen, beispielsweise basierend auf anderen Optimierungskriterien, um mehrere unterschiedliche optimierte Fahrtrajektorien zu erhalten. Anschließend können diese unterschiedlichen optimierten Fahrtrajektorien miteinander verglichen werden. Insbesondere können die unterschiedlichen optimierten Fahrtrajektorien basierend auf vorgegebenen Kriterien wie beispielsweise Zeit zum Durchfahren der Fahrtrajektorie, Wegstrecke der Fahrtrajektorie, Informationen zur Lenkwinkeländerung, Informationen zur Längsbeschleunigung und/oder Informationen zur Querbeschleunigung miteinander verglichen werden, um eine finale Fahrtrajektorie zu bestimmen, die anschließend für die autonome Fahrfunktion verwendet wird. Die autonome Fahrfunktion kann insbesondere „trainiertes Parken“ bei einer wiederkehrenden Parksituation sein.
Fig. 2 zeigt ein Diagramm, das die Verfahrensschritte zur Ermittlung der Fahrtrajektorie verdeutlicht.
Zunächst wird eine Fahrstrecke von einer Startposition zu einer Zielposition durch einen menschlichen Fahrer mittels eines Fahrzeugs abgefahren (S10).
Während des Abfahrens der Fahrstrecke werden Umgebungsinformationen durch eine Sensorik des Fahrzeugs erfasst (S11).
Anschließend werden Informationen zu einer befahrbaren Fahrgasse basierend auf den Umgebungsinformationen des Fahrzeugs abgespeichert (S12).
Daraufhin wird eine Fahrtrajektorie basierend auf Informationen zur befahrbaren Fahrgasse mittels einer Recheneinheit des Fahrzeugs ermittelt (S13). Die Recheneinheit implementiert dabei eine Strategie des bestärkenden Lernens, bei dem eine berechnete Fahrtrajektorie basierend auf Trajektorieneigenschaften beurteilt und iterativ optimiert wird, und zwar derart, dass versucht wird, durch die Iterationsschritte Trajektorieneigenschaften der Fahrtrajektorie sukzessive zu verbessern.
Zuletzt erfolgt ein Abspeichern der ermittelten Fahrtrajektorie (S14). Dadurch kann die ermittelte Fahrtrajektorie zum automatisierten Befahren der wiederkehrenden Fahrsituation verwendet werden.
Die Erfindung wurde voranstehend an Ausführungsbeispielen beschrieben. Es versteht sich, dass zahlreiche Änderungen sowie Abwandlungen möglich sind, ohne dass dadurch der durch die Patentansprüche definierte Schutzbereich verlassen wird.
Bezugszeichenliste F Fahrzeug
FS Fahrstrecke
SP Startposition
ZP Zielposition

Claims

Patentansprüche
1 ) Verfahren zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen, wobei das Verfahren die folgenden Schritte aufweist:
- Abfahren einer Fahrstrecke (FS) von einer Startposition (SP) zu einer Zielposition (ZP) durch einen menschlichen Fahrer mittels eines Fahrzeugs (F) (S10);
- Erfassen von Umgebungsinformationen durch eine Sensorik des Fahrzeugs (F) während des Abfahrens der Fahrstrecke (FS) (S11);
- Abspeichern von Informationen zu einer befahrbaren Fahrgasse basierend auf den Umgebungsinformationen (S12);
- Ermitteln einer Fahrtrajektorie basierend auf Informationen zur befahrbaren Fahrgasse mittels einer Recheneinheit des Fahrzeugs (F), die eine Strategie des bestärkenden Lernens implementiert (S13);
- Abspeichern der ermittelten Fahrtrajektorie (S14).
2) Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass in der Recheneinheit ein Agent und ein Bewertungssystem implementiert sind, dass eine vom Agenten berechnete Fahrtrajektorie durch das Bewertungssystem basierend auf Trajektorieneigenschaften beurteilt wird und abhängig vom Beurteilungsergebnis eine neue Fahrtrajektorie berechnet wird.
3) Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass mehrere unterschiedliche Trajektorieneigenschaften zur Beurteilung einer Trajektorie herangezogen werden und die Berechnung einer neuen Fahrtrajektorie unter einer oder mehreren Vorgaben erfolgt, und zwar derart, dass eine oder mehrere Trajektorieneigenschaften verbessert werden. 4) Verfahren nach Anspruch 2 oder 3, dadurch gekennzeichnet, dass der Agent iterativ neue Fahrtrajektorien derart berechnet, dass das Beurteilungsergebnis gesteigert wird.
5) Verfahren nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, dass das Bewertungssystem eine Belohnungsfunktion umfasst, die zu einer berechneten Fahrtrajektorie eine positive oder negative Belohnung berechnet.
6) Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass durch den Agenten eine nachfolgende Fahrtrajektorie auf Basis der Flöhe ihrer Belohnung ausgewählt wird.
7) Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die zur Beurteilung einer Fahrtrajektorie verwendeten Trajektorieneigenschaften die Zeit zum Durchfahren der Fahrtrajektorie, die Wegstrecke der Fahrtrajektorie, Informationen zu Lenkwinkeländerungen, Informationen zur Längsbeschleunigung und/oder Informationen zur Querbeschleunigung umfassen.
8) Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Fahrstrecke (FS) von der Startposition (SP) zu der Zielposition (ZP) mehrfach abgefahren wird und dabei Umgebungsinformationen durch eine Sensorik des Fahrzeugs (F) erfasst und Informationen zur befahrbaren Fahrgasse ermittelt und gespeichert werden.
9) Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass mehrere zeitlich nacheinander ermittelte Informationen zur befahrbaren Fahrgasse kombiniert werden, und diese kombinierten Informationen zur befahrbaren Fahrgasse zum Ermitteln einer Fahrtrajektorie herangezogen werden. 10) Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass beim Durchfahren der Fahrstrecke von dem Startpunkt zu dem Zielpunkt fortlaufend eine Umgebungserfassung vollzogen wird und das Ermitteln einer Fahrtrajektorie durch bestärkendes Lernen neu vollzogen wird, wenn anhand der erfassten Umgebungsinformationen erkennbar ist, dass sich die Informationen zur befahrbaren Fahrgasse durch statische Objekte verändert hat.
11 ) Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass basierend auf der ermittelten Fahrtrajektorie die Fahrstrecke (FS) von der Startposition (SP) zur Zielposition (ZP) automatisiert durchfahren wird und von der ermittelten Fahrtrajektorie abgewichen wird, wenn ein Hindernis auf der ermittelten Fahrtrajektorie detektiert wird.
12) Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Recheneinheit mehrere unterschiedliche optimierte Fahrtrajektorien mittels der Strategie des bestärkenden Lernens ermittelt und eine Fahrtrajektorie dieser optimierten Fahrtrajektorien basierend auf einem oder mehreren Zielkriterien auswählt.
13) System zur Ermittlung einer Fahrtrajektorie für wiederkehrende Fahrsituationen umfassend eine in einem Fahrzeug (F) vorgesehene Recheneinheit, wobei das Verfahren die folgenden Schritte aufweist:
- Erfassen von Umgebungsinformationen durch eine Sensorik des Fahrzeugs (F) während des Abfahrens der Fahrstrecke (FS) von einer Startposition (SP) zu einer Zielposition (ZP) durch einen menschlichen Fahrer;
- Abspeichern von Informationen zu einer befahrbaren Fahrgasse basierend auf den Umgebungsinformationen; - Ermitteln einer Fahrtrajektorie basierend auf Informationen zur befahrbaren Fahrgasse mittels der Recheneinheit, die eine Strategie des bestärkenden Lernens implementiert;
- Abspeichern der ermittelten Fahrtrajektorie in einer Speichereinheit.
EP22758420.8A 2021-06-25 2022-06-21 Verfahren zur trajektorienoptimierung Pending EP4359274A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102021206588.0A DE102021206588A1 (de) 2021-06-25 2021-06-25 Verfahren zur Trajektorienoptimierung
PCT/DE2022/200136 WO2022268274A1 (de) 2021-06-25 2022-06-21 Verfahren zur trajektorienoptimierung

Publications (1)

Publication Number Publication Date
EP4359274A1 true EP4359274A1 (de) 2024-05-01

Family

ID=83059126

Family Applications (1)

Application Number Title Priority Date Filing Date
EP22758420.8A Pending EP4359274A1 (de) 2021-06-25 2022-06-21 Verfahren zur trajektorienoptimierung

Country Status (5)

Country Link
EP (1) EP4359274A1 (de)
JP (1) JP2024523157A (de)
CN (1) CN117500708A (de)
DE (1) DE102021206588A1 (de)
WO (1) WO2022268274A1 (de)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102023117282A1 (de) 2023-06-30 2025-01-02 Valeo Schalter Und Sensoren Gmbh Verfahren zum Betreiben einer zumindest assistierten Parkfunktion für ein Fahrzeug
CN118818957A (zh) * 2024-05-27 2024-10-22 北京科技大学 一种依托强化学习的pid轨迹跟踪控制方法及装置
DE102024210476A1 (de) 2024-10-30 2026-04-30 Robert Bosch Gesellschaft mit beschränkter Haftung Berechnung einer Zielpose bei automatisierten Parkvorgängen mit individueller Anpassung mittels Maschinellen Lernens

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018063250A1 (en) * 2016-09-29 2018-04-05 The Charles Stark Draper Laboratory, Inc. Autonomous vehicle with modular architecture
JP7047770B2 (ja) * 2016-12-14 2022-04-05 ソニーグループ株式会社 情報処理装置及び情報処理方法
DE102017110020A1 (de) 2017-05-10 2018-11-15 Valeo Schalter Und Sensoren Gmbh Verfahren zum Betreiben eines Fahrerassistenzsystems eines Kraftfahrzeugs zum Manövrieren des Kraftfahrzeugs in einem fahrbaren Bereich, Fahrerassistenzsystem sowie Kraftfahrzeug
DE102017115810A1 (de) * 2017-07-13 2019-01-17 Valeo Schalter Und Sensoren Gmbh Autonomes Parken eines Fahrzeugs basierend auf einem befahrbaren Bereich
CN108860139B (zh) * 2018-04-11 2019-11-29 浙江零跑科技有限公司 一种基于深度增强学习的自动泊车轨迹规划方法
DE102018129556B4 (de) * 2018-11-23 2025-08-28 Valeo Schalter Und Sensoren Gmbh Verfahren zum wenigstens teilautonomen Fahren eines Fahrzeugs im Rahmen eines Parkvorgangs
DE102019101040A1 (de) * 2019-01-16 2020-07-16 Valeo Schalter Und Sensoren Gmbh Verfahren zum Trainieren einer Trajektorie für ein Fahrzeug, sowie elektronisches Fahrzeugführungssystem
US11467591B2 (en) * 2019-05-15 2022-10-11 Baidu Usa Llc Online agent using reinforcement learning to plan an open space trajectory for autonomous vehicles
DE102019115712A1 (de) * 2019-06-11 2020-12-17 Valeo Schalter Und Sensoren Gmbh Trajektorienoptimierung für eine gefahrene Trajektorie
CN111098852B (zh) 2019-12-02 2021-03-12 北京交通大学 一种基于强化学习的泊车路径规划方法
CN112180373B (zh) * 2020-09-18 2024-04-19 纵目科技(上海)股份有限公司 一种多传感器融合的智能泊车系统和方法

Also Published As

Publication number Publication date
JP2024523157A (ja) 2024-06-28
WO2022268274A1 (de) 2022-12-29
DE102021206588A1 (de) 2022-12-29
CN117500708A (zh) 2024-02-02

Similar Documents

Publication Publication Date Title
DE102015108605B4 (de) Fahrspurwechselpfad-Planungsalgorithmus für ein autonom fahrendes Fahrzeug
EP3224118B1 (de) Verfahren und vorrichtung zum assistierten führen eines fahrzeugs
EP3224117B1 (de) Verfahren und vorrichtung zum assistierten führen eines fahrzeugs
DE102017115988A1 (de) Modifizieren einer Trajektorie abhängig von einer Objektklassifizierung
DE102016211183A1 (de) Verfahren, Vorrichtung und System zum Ausführen einer automatisierten Fahrt eines Fahrzeugs unter Beteiligung mindestens eines weiteren Fahrzeugs
DE102009060169A1 (de) Automatisches Vorwärtseinparken in Kopfparklücken
DE102016203086A1 (de) Verfahren und Vorrichtung zur Fahrerassistenz
EP4359274A1 (de) Verfahren zur trajektorienoptimierung
DE102019118366A1 (de) Verfahren sowie Steuergerät für ein System zum Steuern eines Kraftfahrzeugs
EP3824247A1 (de) Verfahren und system zum bestimmen einer position eines fahrzeugs
EP3911555B1 (de) Verfahren zum trainieren einer trajektorie für ein fahrzeug, sowie elektronisches fahrzeugführungssystem
DE102007009745A1 (de) Einparkhalbautomat
EP3703997B1 (de) Parkassistenz für ein kraftfahrzeug zum parken auf öffentlichem und privatem grund
DE102009040373A1 (de) Verfahren zum Durchführen eines zumindest semi-autonomen Parkvorgangs eines Fahrzeugs und Parkassistenzsystem
DE102020117767A1 (de) Trajektorienplanung für ein autonomes Fahrmanöver eines Ego-Fahrzeugs
DE102021206708B4 (de) Verfahren zum Umplanen einer Parktrajektorie
EP4412882B1 (de) Verfahren zur planung einer trajektorie eines fahrmanövers eines kraftfahrzeugs, computerprogrammprodukt, computerlesbares speichermedium sowie fahrzeug
WO2024027885A1 (de) Verfahren und parkassistenzvorrichtung zum dynamischen planen einer parktrajektorie eines fahrzeugs während eines zumindest teilautomatisch vollzogenen parkvorgangs
EP2974944A1 (de) Verfahren zum unterstützen eines fahrers beim einparken eines kraftfahrzeugs, fahrerassistenzsystem sowie kraftfahrzeug
EP4029763B1 (de) Verfahren zum betreiben eines kraftfahrzeugs sowie kraftfahrzeug
DE19601831C5 (de) Verfahren zur Erkennung von relevanten Objekten
DE102022208059B3 (de) Verfahren zum Ermitteln einer eine Parklücke beschreibenden Umfeldinformation mithilfe eines faltenden neuronalen Netzes
DE102014110173A1 (de) Verfahren zum Unterstützen eines Fahrers beim Einparken eines Kraftfahrzeugs, Fahrerassistenzsystem sowie Kraftfahrzeug
DE102023200695A1 (de) Verfahren zum Betreiben eines Fahrzeuges, Computerprogrammprodukt sowie Fahrzeug
DE102022212523A1 (de) Verfahren zum Planen eines menschenähnlichen Einparkvorgangs eines Kraftfahrzeugs, elektronische Recheneinrichtung für ein Kraftfahrzeug sowie Kraftfahrzeug

Legal Events

Date Code Title Description
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: UNKNOWN

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE

PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: REQUEST FOR EXAMINATION WAS MADE

17P Request for examination filed

Effective date: 20240125

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

DAV Request for validation of the european patent (deleted)
DAX Request for extension of the european patent (deleted)
STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: EXAMINATION IS IN PROGRESS

17Q First examination report despatched

Effective date: 20250219

RAP3 Party data changed (applicant data changed or rights of an application transferred)

Owner name: AUMOVIO GERMANY GMBH