WO2021165113A1 - Verfahren zum trainieren wenigstens eines algorithmus für ein steuergerät eines kraftfahrzeugs, verfahren zur optimierung eines verkehrsflusses in einer region, computerprogrammprodukt sowie kraftfahrzeug - Google Patents

Verfahren zum trainieren wenigstens eines algorithmus für ein steuergerät eines kraftfahrzeugs, verfahren zur optimierung eines verkehrsflusses in einer region, computerprogrammprodukt sowie kraftfahrzeug Download PDF

Info

Publication number
WO2021165113A1
WO2021165113A1 PCT/EP2021/053181 EP2021053181W WO2021165113A1 WO 2021165113 A1 WO2021165113 A1 WO 2021165113A1 EP 2021053181 W EP2021053181 W EP 2021053181W WO 2021165113 A1 WO2021165113 A1 WO 2021165113A1
Authority
WO
WIPO (PCT)
Prior art keywords
motor vehicle
traffic
mission
algorithm
simulation environment
Prior art date
Application number
PCT/EP2021/053181
Other languages
English (en)
French (fr)
Inventor
Ulrich Eberle
Christoph THIEM
Original Assignee
Psa Automobiles Sa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Psa Automobiles Sa filed Critical Psa Automobiles Sa
Priority to EP21704766.1A priority Critical patent/EP4107590A1/de
Priority to CN202180015176.2A priority patent/CN115136081A/zh
Publication of WO2021165113A1 publication Critical patent/WO2021165113A1/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0088Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Definitions

  • a method for training at least one algorithm for a control unit of a motor vehicle, a method for optimizing a traffic flow in a region, a computer program product and a motor vehicle are described here.
  • a method for operating a vehicle is known from DE 102017 007468 A1, measurement data of a road traffic situation being determined and a future road traffic situation being determined in a traffic simulation based on the measurement data.
  • the measurement data are determined by means of the vehicle's own determination units for the vehicle and / or at least one other vehicle involved in the road traffic situation and sent to a central processing unit.
  • the central computing unit is used to carry out the traffic simulation for a predetermined time horizon and, depending on the results of the traffic simulation, the central computing unit determines vehicle parameters and sends them to the vehicle and / or the at least one other vehicle that when the vehicle parameters are set meter a driving style of the vehicle and / or the at least one further vehicle is adapted to promote a traffic flow.
  • the task arises of developing methods for training at least one algorithm for a control unit of a motor vehicle, methods for optimizing traffic flow in a region, computer program products and motor vehicles of the type mentioned in such a way that the traffic flow can be better regulated in highly polluted regions.
  • the object is achieved by a method for training at least one algorithm for a control unit of a motor vehicle according to claim 1, a method for optimizing a traffic flow in a region according to the independent claim 9, a computer program product according to the independent claim 11 and a motor vehicle according to the independent claim 12. Further developments and developments are the subject of the dependent claims.
  • a method for training at least one algorithm for a control unit of a motor vehicle is described below, the control unit being provided for implementing an automated or autonomous driving function with intervention in units of the motor vehicle on the basis of input data using the at least one algorithm, with the algorithm is trained by a self-learning neural network, comprising the following steps: a) providing a computer program product module for the automated or autonomous driving function, the computer program product module containing the algorithm to be trained and the self-learning neural network, b) providing a simulation environment with simulation parameters, wherein the simulation environment contains map data of a real existing application area, the motor vehicle, the behavior of the motor vehicle being determined by a rule set, c) providing real-time traffic data d it real existing application area as well as re-enactment of the traffic situation in the simulation environment; d) Determining traffic focal points on the basis of the real-time traffic data on the basis of a traffic flow metric; e) providing a mission for the motor vehicle in which the motor vehicle drives in front of at least one other simulated motor vehicle;
  • a corresponding traffic flow metric can be, for example, an average speed that should correspond to a certain minimum speed as far as possible.
  • a minimum speed can be specified or derived from theoretical considerations, for example taking into account the particularities of a relevant region, for example taking into account applicable maximum speeds. Parameters such as traffic lights can also be taken into account.
  • a corresponding traffic focus can be an area in which the traffic flows particularly poorly.
  • Such an area can be, for example, an area with many entrances and exits and / or an area with many traffic lights.
  • step g) (i) is reached, another mission is selected and the method is repeated with the other mission.
  • a mission represents driving a route from at least one starting point to at least one destination point across a traffic focus.
  • the route via a corresponding traffic focus depicts a real deployment scenario, namely the routing of traffic by using a corresponding automatically driving lead vehicle.
  • the real-time traffic data contain infrastructure information.
  • infrastructure information it is possible to map the traffic situation more realistically and to train the algorithm on other factors that are specified by the traffic infrastructure, for example the duration of individual traffic light phases in and the synchronization of the same in the given traffic focus area.
  • an optimization algorithm is used in order to minimize deviations between the simulation environment and the real-time traffic data.
  • the traffic simulation can map a real traffic situation in the operational area more precisely.
  • the traffic flow metric contains an average speed during the mission.
  • the average speed during the mission is a suitable metric to analyze traffic flow.
  • the algorithm is trained by means of a reinforcing learning algorithm.
  • Reinforcing learning algorithms are particularly suitable for optimization tasks like this one.
  • Another independent subject matter relates to a device for training at least one algorithm for a control unit of a motor vehicle, the control unit being provided for implementing an automated or autonomous driving function by intervening in units of the motor vehicle on the basis of input data using the at least one algorithm , the algorithm being trained by a self-learning neural network, the device being designed to carry out the following steps: a) Providing a computer program product module for the automated or autonomous driving function, the computer program product module containing the algorithm to be trained and the self-learning neural Network contains, b) providing a simulation environment with simulation parameters, wherein the simulation environment contains map data of a real existing application area, the motor vehicle, wherein a behavior of the motor vehicle by a Rule set is determined, c) provision of real-time traffic data of the real existing application area as well as re-enactment of the traffic situation in the simulation environment; d) Determining traffic focal points on the basis of the real-time traffic data on the basis of a
  • the device is set up to select another mission and to repeat the method with the other mission when step i) is reached.
  • a mission involves driving a route from at least one starting point to at least one Represents the destination point across a traffic focal point.
  • the real-time traffic data contain infrastructure information.
  • the device is set up to vary the mission by changing parameters of the traffic situation in the simulation environment and to carry out the method with the modified mission.
  • the device is set up to use an optimization algorithm when reproducing the traffic situation in the simulation environment in order to minimize deviations between the simulation environment and the real-time traffic data.
  • the traffic flow metric contains an average speed during the mission.
  • the device is set up to train the algorithm by means of a reinforcing learning algorithm.
  • Another independent subject matter relates to a method for optimizing a traffic flow in a region, wherein at least one leading vehicle is used to regulate the driving behavior of vehicles driving behind the leading vehicle by the leading vehicle, wherein the at least one leading vehicle is an autonomous vehicle, wherein the at least one lead vehicle is controlled by means of an algorithm that has been trained according to the method described above.
  • infrastructure information e.g. information on traffic light switching, lane regulation or the like
  • Another independent subject relates to a lead vehicle for optimizing a traffic flow by regulating the driving behavior of vehicles driving behind the lead vehicle in a region, the at least one lead vehicle being an autonomously driving vehicle, the at least one lead vehicle having an algorithm controlling the lead vehicle having, which is trained according to the method described above.
  • the at least one lead vehicle has means for receiving infrastructure information from an infrastructure controller, the lead vehicle being set up to adapt its driving behavior to the received infrastructure information.
  • Another independent subject matter relates to a computer program product with a computer-readable storage medium on which instructions are embedded which, when executed by at least one computing unit, have the effect that the at least computing unit is set up to carry out the method of the aforementioned type.
  • the method can be carried out on one or more processing units distributed so that certain method steps are carried out on one processing unit and other process steps are carried out on at least one other processing unit, with calculated data being able to be transmitted between the processing units if necessary.
  • Another independent subject matter relates to a motor vehicle with a computer program product of the type described above.
  • Fig. 1 is a plan view of a motor vehicle
  • Figure 2 shows a computer program product module
  • FIG. 3 shows a road map of a real existing application area
  • FIG. 4 shows a flow chart of a training method.
  • Fig. 1 shows a motor vehicle 2, which is set up for automated or autonomous driving.
  • the motor vehicle 2 is provided as a guide vehicle for regulating traffic at traffic focal points.
  • the motor vehicle 2 has a control unit 4 with a computing unit 6 and a memory 8.
  • a computer program product is stored in the memory 8 and is described in more detail below in connection with FIGS.
  • the control unit 4 is connected, on the one hand, to a number of environmental sensors that allow the current position of the motor vehicle 2 and the respective traffic situation to be recorded. These include environmental sensors 10, 11 at the front of the motor vehicle 2, environmental sensors 12, 13 at the rear of the motor vehicle 2, a camera 14 and a GPS module 16.
  • the environmental sensors 10 to 13 can, for example, radar, lidar and / or Include ultrasonic sensors.
  • sensors for detecting the state of the motor vehicle 2 are provided, including wheel speed sensors 16 and acceleration sensors 18, which are connected to the control unit 4. With the aid of this motor vehicle sensor system, the current state of motor vehicle 2 can be reliably detected.
  • a communication device 20 is provided, which is designed for wireless communication with remote computers or data centers in order to receive infrastructure information from them, i.e. information about traffic light phases, traffic volume in certain regions, etc., in order to use this information when planning a journey.
  • the communication device 20 can send and receive data and use common standards such as LTE, 3G, 4G or the like for this purpose. Communication can also take place directly with active objects in the infrastructure via Car2X communication options, for example with communication-capable traffic lights.
  • the computing unit 6 has loaded the computer program product stored in the memory 8 and executes it. On the basis of an algorithm and the input signals, the computing unit 6 decides on the control of the motor vehicle 2, which the computing unit 6 would achieve by intervening in the steering 22, engine control 24 and brakes 26, which are each connected to the control unit 4.
  • Data from sensors 10 to 18 are continuously temporarily stored in memory 8 and discarded after a predetermined period of time so that these environmental data can be available for further evaluation.
  • the algorithm was trained according to the method described below.
  • FIG. 2 shows a computer program product 28 with a computer program product module 30.
  • the computer program product module 30 has a self-learning neural network 32 that trains an algorithm 34.
  • the self-learning neural network 32 learns according to methods of reinforcement learning, d. H.
  • the algorithm 34 By varying the algorithm 34, the neural network 32 tries to obtain rewards for improved behavior in accordance with one or more metrics or standards, that is to say for improvements to the algorithm 34.
  • the algorithm 34 can essentially consist of a complex filter with a matrix of values, usually called weights by those skilled in the art, that define a filter function that determines the behavior of the algorithm 34 as a function of input variables that are presently recorded by the environmental sensors 10 to 18 are determined and control signals for controlling the motor vehicle 2 are generated.
  • the computer program product module 30 can be used both in the motor vehicle 2 and outside the motor vehicle 2. It is thus possible to train the computer program product module 30 both in a real environment and in a simulation environment. In particular, according to the teaching described here, the training begins in a simulation environment, since this is safer than training in a real environment.
  • the computer program product module 30 is set up to set up and evaluate a metric that is to be improved.
  • such a metric is, for example, an average speed for passing a traffic focal point, i.e. an area in which the traffic flows particularly poorly, at least at certain times.
  • the metric can be considered fulfilled and another mission can be selected and the algorithm can be further trained on the basis of the other mission or the Algorithm can be frozen in terms of this metric. It can then either be optimized with regard to another metric and trained further, or the algorithm can be tested in a real environment.
  • a certain threshold e.g. a speed of a column led behind the motor vehicle 2 used as the lead vehicle is greater than a limit speed
  • FIG. 3 shows a simulation environment 38 an area of an actually existing intersection 40.
  • the intersection 40 represents a traffic focal point at which the traffic flows particularly poorly at rush hour.
  • the autonomously driving motor vehicle 2 is used, the driving style of which is optimized for an optimal flow of traffic, in this case a maximum possible average speed vd.
  • the motor vehicle 2 represents a guide vehicle which regulates the driving behavior of road users driving behind the guide vehicle 2, here a motorcyclist 42 and motor vehicles 44, 46.
  • the vehicles 42, 44, 46 cannot travel faster than the motor vehicle 2.
  • the motor vehicle 2 not only regulates the speed of the following vehicles 42, 44 and 46, but also the other behavior, in particular the braking behavior of the corresponding vehicles 42, 44 and 46, for example by limiting a maximum deceleration of the motor vehicle 2, that is to say by especially Gentle driving. This can reduce the likelihood that the column of vehicles 42, 44 and 46 will brake too hard and the flow of traffic will come to a standstill as a result.
  • the motor vehicle 2 can communicate with a traffic infrastructure, here a traffic light 48, by means of its communication device. This makes it possible to adapt the Fahrge speed to the corresponding traffic light phases in order to always drive through traffic lights at the beginning of a green phase.
  • a traffic infrastructure here a traffic light 48
  • the computer program product module contains the algorithm to be trained and a self-learning neural network.
  • a simulation environment is then made available on the basis of real map data.
  • the simulation environment can also contain other road users and their missions.
  • a mission is determined in the simulation environment.
  • the mission can be the driving of a specific route from a starting point to a destination point through a traffic focus.
  • the simulation is then carried out and an average speed is determined.
  • the average speed is compared with an average speed to be achieved as a traffic flow metric.
  • the process can be repeated using other missions and the algorithm can be used more universally.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Automation & Control Theory (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Traffic Control Systems (AREA)

Abstract

Beschrieben wird ein Verfahren zum Trainieren wenigstens eines Algorithmus für ein Steuergerät eines Kraftfahrzeugs durch ein selbstlernendes neuronales Netz beschrieben mit folgenden Schritten: Bereitstellen einer Simulationsumgebung mit Kartendaten eines real existierenden Einsatzgebiets, wobei ein Verhalten des Kraftfahrzeugs durch einen Regelsatz bestimmt ist, Bereitstellen von Echtzeit-Verkehrsdaten des real existierenden Einsatzgebiets sowie Nachstellen der Verkehrssituation in der Simulationsumgebung; Bereitstellen einer Mission für das Kraftfahrzeug, in der das Kraftfahrzeug vor wenigstens einem weiteren simulierten Kraftfahrzeug fährt; Durchführen einer Simulation der Mission in der Simulationsumgebung, Bestimmen der Verkehrsflussmetrik der Mission, wobei wenn die Verkehrsflussmetrik unter einem Schwellwert liegt, Modifizieren des wenigstens einen Algorithmus und/oder des wenigstens einen Regelsatzes und Wiederholen der Mission, oder wenn die Verkehrsflussmetrik über dem Schwellwert liegt, Klassifizieren der Mission als erfolgreich.

Description

VERFAHREN ZUM TRAINIEREN WENIGSTENS EINES ALGORITHMUS FÜR EIN STEUERGERÄT EINES KRAFTFAHRZEUGS, VERFAHREN ZUR OPTIMIERUNG EINES VERKEHRSFLUSSES IN EINER REGION, COMPUTERPROGRAMMPRODUKT SOWIE KRAFTFAHRZEUG
Vorliegend werden ein Verfahren zum Trainieren wenigstens eines Algorithmus für ein Steuergerät eines Kraftfahrzeugs, ein Verfahren zur Optimierung eines Verkehrsflusses in einer Region, ein Computerprogrammprodukt sowie ein Kraftfahrzeug beschrieben.
Verfahren zum Trainieren wenigstens eines Algorithmus für ein Steuergerät eines Kraft fahrzeugs, Verfahren zur Optimierung eines Verkehrsflusses in einer Region, Computer programmprodukte sowie Kraftfahrzeuge der eingangs genannten Art sind im Stand der Technik bekannt. Die ersten teilautomatisiert fahrenden Kraftfahrzeuge (entspricht SAE Level 2 gemäß SAE J3016) sind in den vergangenen Jahren zur Serienreife gelangt. Au tomatisiert (entspricht SAE Level >=3 gemäß SAE J3016) bzw., autonom (entspricht SAE Level 4/5 gemäß SAE J3016) fahrende Kraftfahrzeuge müssen anhand vielfältiger Vorga ben, zum Beispiel Fahrziel und Einhaltung gängiger Verkehrsregeln, mit maximaler Si cherheit auf unbekannte Verkehrssituationen selbständig reagieren können. Da die Ver kehrswirklichkeit aufgrund der Unvorhersehbarkeit des Verhaltens anderer Verkehrsteil nehmer, insbesondere menschlicher Verkehrsteilnehmer, hoch komplex ist, gilt es als na hezu unmöglich, entsprechende Steuergeräte von Kraftfahrzeugen mit herkömmlichen Methoden und auf der Grundlage von menschengemachten Regeln zu programmieren.
Zur Bewältigung komplexer Probleme mittels Computern ist es darüber hinaus bekannt, mit Methoden des maschinellen Lernens bzw. der künstlichen Intelligenz Algorithmen zu entwickeln bzw. sich durch selbstlernende neuronale Netze entwickeln zu lassen. Solche Algorithmen können einerseits maßvoller auf komplexe Verkehrssituationen reagieren als traditionelle Algorithmen. Andererseits ist es mithilfe künstlicher Intelligenz prinzipiell mög lich, die Algorithmen während des Entwicklungsprozesses und im Alltag durch ständiges Lernen weiterzuentwickeln und kontinuierlich zu verbessern. Alternativ kann ein Stand des Algorithmus nach der Beendigung einer Trainingsphase im Entwicklungsprozess und einer Validierung durch den Hersteller eingefroren werden.
Insbesondere urbane Regionen, aber auch Verkehrsknotenpunkte auf Autobahnen, leiden zumindest zu Stoßzeiten unter starkem Verkehrsaufkommen, insbesondere im Berufsver kehr. Diese Problematik wird zum Teil durch die zu diesen Zeiten allgemein hohe Ver kehrsdichte, zum anderen aber auch durch Verhalten von menschlichen Verkehrsteilneh mern ausgelöst. Menschliche Verkehrsteilnehmer neigen zu Handlungsweisen, die Staus eher verstärken als verhindern, zum Beispiel, wenn eine Geschwindigkeitsbegrenzung zur Reduktion der Verkehrsmasse zu schnell gefahren wird, da kein Hindernis sichtbar scheint.
Darüber hinaus ist es bekannt, den Verkehrsfluss anhand von Führungsfahrzeugen zu re geln, beispielsweise von Fahrern mit staatlichem Auftrag, beispielsweise der Polizei. Mit hilfe von Führungsfahrzeugen ist es möglich, den Verkehrsfluss in stark belasteten Regio nen effektiver zu regulieren als durch Geschwindigkeitsbegrenzungen allein und damit insgesamt die Durchschnittsgeschwindigkeit einer entsprechenden regulierten Kolonne zu erhöhen.
Aus der DE 102017 007468 A1 ist ein Verfahren zum Betrieb eines Fahrzeugs bekannt, wobei Messdaten einer Straßenverkehrssituation ermittelt werden und in einer Verkehrssi mulation anhand der Messdaten eine zukünftige Straßenverkehrssituation ermittelt wird. Die Messdaten werden mittels fahrzeugeigener Ermittlungseinheiten für das Fahrzeug und/oder zumindest ein in die Straßenverkehrssituation involviertes weiteres Fahrzeug er mittelt und an eine zentrale Recheneinheit übersendet. Mittels der zentralen Rechenein heit wird die Verkehrssimulation für einen vorgegebenen Zeithorizont durchgeführt und in Abhängigkeit von Ergebnissen der Verkehrssimulation werden mittels der zentralen Re cheneinheit Fahrzeugparameter derart ermittelt und an das Fahrzeug und/oder das zu mindest eine weitere Fahrzeug übersendet, dass bei einer Einstellung der Fahrzeugpara meter eine Fahrweise des Fahrzeugs und/oder des zumindest einen weiteren Fahrzeugs zur Förderung eines Verkehrsflusses angepasst wird.
Somit stellt sich die Aufgabe, Verfahren zum Trainieren wenigstens eines Algorithmus für ein Steuergerät eines Kraftfahrzeugs, Verfahren zur Optimierung eines Verkehrsflusses in einer Region, Computerprogrammprodukte sowie Kraftfahrzeuge der eingangs genannten Art dahingehend weiterzubilden, dass der Verkehrsfluss in hoch belasteten Regionen bes ser geregelt werden kann. Die Aufgabe wird gelöst durch ein Verfahren zum Trainieren wenigstens eines Algorith mus für ein Steuergerät eines Kraftfahrzeugs gemäß Anspruch 1, ein Verfahren zur Opti mierung eines Verkehrsflusses in einer Region gemäß dem nebengeordneten Anspruch 9, ein Computerprogrammprodukt gemäß dem nebengeordneten Anspruch 11 sowie ein Kraftfahrzeug gemäß dem nebengeordneten Anspruch 12. Weiterführende Ausgestaltun gen und Weiterbildungen sind Gegenstand der abhängigen Ansprüche.
Nachfolgend wird ein Verfahren zum Trainieren wenigstens eines Algorithmus für ein Steuergerät eines Kraftfahrzeugs beschrieben, wobei das Steuergerät zur Umsetzung ei ner automatisierten bzw. autonomen Fahrfunktion unter Eingriff in Aggregate des Kraft fahrzeugs auf der Grundlage von Eingangsdaten unter Verwendung des wenigstens einen Algorithmus vorgesehen ist, wobei der Algorithmus durch ein selbstlernendes neuronales Netz trainiert wird, umfassend folgende Schritte: a) Bereitstellen eines Computerprogrammproduktmoduls für die automatisierte bzw. autonome Fahrfunktion, wobei das Computerprogrammproduktmodul den zu trai nierenden Algorithmus und das selbstlernende neuronale Netz enthält, b) Bereitstellen einer Simulationsumgebung mit Simulationsparametern, wobei die Simulationsumgebung Kartendaten eines real existierenden Einsatzgebiets, das Kraftfahrzeug enthält, wobei ein Verhalten des Kraftfahrzeugs durch einen Regel satz bestimmt ist, c) Bereitstellen von Echtzeit-Verkehrsdaten des real existierenden Einsatzgebiets so wie Nachstellen der Verkehrssituation in der Simulationsumgebung; d) Bestimmen von Verkehrsbrennpunkten anhand der Echtzeit-Verkehrsdaten an hand einer Verkehrsflussmetrik; e) Bereitstellen einer Mission für das Kraftfahrzeug, in der das Kraftfahrzeug vor we nigstens einem weiteren simulierten Kraftfahrzeug fährt; f) Durchführen einer Simulation der Mission in der Simulationsumgebung; g) Bestimmen der Verkehrsflussmetrik der Mission, wobei
(i) wenn die Verkehrsflussmetrik unter einem Schwellwert liegt, Modifizieren des wenigstens einen Algorithmus und/oder des wenigstens einen Regelsatzes und Wiederholen der Mission, oder
(ii) wenn die Verkehrsflussmetrik über dem Schwellwert liegt, Klassifizieren der Mission als erfolgreich. Mit einem entsprechenden Algorithmus ausgerüstete Kraftfahrzeuge können als effiziente Führungsfahrzeuge verwendet werden, da der von ihnen angewendete Algorithmus da rauf trainiert ist, den Verkehrsfluss an Verkehrsbrennpunkten dadurch zu verbessern, dass dahinter fahrende konventionelle, von Menschen gefahrene Kraftfahrzeuge zu einem Verkehrsfluss begünstigenden Verhalten gezwungen werden.
Eine entsprechende Verkehrsflussmetrik kann beispielsweise eine Durchschnittsge schwindigkeit sein, die möglichst einer gewissen Mindestgeschwindigkeit entsprechen soll. Eine derartige Mindestgeschwindigkeit kann vorgegeben sein oder aus theoretischen Überlegungen abgeleitet werden, beispielsweise unter Berücksichtigung der Besonderhei ten einer betreffenden Region, beispielsweise unter Berücksichtigung von geltenden Höchstgeschwindigkeiten. Auch können Parameter wie Ampelanlagen Berücksichtigung finden.
Ein entsprechender Verkehrsbrennpunkt kann ein Bereich sein, indem der Verkehr beson ders schlecht fließt. Ein solcher Bereich kann beispielsweise ein Bereich mit vielen Zu fahrten und Abfahrten sein und/oder ein Bereich mit vielen Ampelanlagen.
In einer ersten weiterführenden Ausgestaltung kann vorgesehen sein, dass, wenn Schritt g) (i) erreicht ist, eine andere Mission ausgewählt und das Verfahren mit der anderen Mis sion wiederholt wird.
Durch das wiederholen des Verfahrens mit einer anderen Mission kann eine Überspeziali sierung des Algorithmus vermieden werden.
In einer weiteren weiterführenden Ausgestaltung kann vorgesehen sein, dass eine Mis sion das Abfahren einer Route von wenigstens einem Startpunkt zu wenigstens einem Zielpunkt über einen Verkehrsbrennpunkt hinweg darstellt.
Die Route über einen entsprechenden Verkehrsbrennpunkt bildet ein reales Einsatzsze nario ab, nämlich das Leiten des Verkehrs durch Verwendung eines entsprechenden au tomatisiert fahrenden Leitfahrzeugs.
In einer weiteren weiterführenden Ausgestaltung kann vorgesehen sein, dass die Echt zeit-Verkehrsdaten Infrastrukturinformationen beinhalten. Durch Einbeziehen von Infrastrukturinformationen ist es möglich, das Verkehrsgeschehen realistischer abzubilden und den Algorithmus auf weitere Faktoren zu trainieren, die von der Verkehrsinfrastruktur vorgegeben sind, beispielsweise die Zeitdauer einzelner Ampel phasen im und die Synchronisierung derselben in dem vorgegebenen Verkehrsbrenn punktgebiet.
In einer weiteren weiterführenden Ausgestaltung kann vorgesehen sein, dass die Mission durch Änderung von Parametern der Verkehrssituation in der Simulationsumgebung vari iert wird und das Verfahren mit der modifizierten Mission durchgeführt wird.
Durch Veränderung der Parameter kann eine Überspezialisierung des Algorithmus verhin dert werden.
In einer weiteren weiterführenden Ausgestaltung kann vorgesehen sein, dass beim Nach stellen der Verkehrssituation in der Simulationsumgebung ein Optimierungsalgorithmus verwendet wird, um Abweichungen zwischen der Simulationsumgebung und den Echtzeit- Verkehrsdaten zu minimieren.
Durch Verwendung eines Optimierungsalgorithmus kann erreicht werden, dass die Ver kehrssimulation ein reales Verkehrsgeschehen im Einsatzgebiet präziser abbilden kann.
In einer weiteren weiterführenden Ausgestaltung kann vorgesehen sein, dass die Ver kehrsflussmetrik eine Durchschnittsgeschwindigkeit während der Mission enthält.
Die Durchschnittsgeschwindigkeit während der Mission ist eine geeignete Metrik, um den Verkehrsfluss zu analysieren.
In einer weiteren weiterführenden Ausgestaltung kann vorgesehen sein, dass der Algorith mus mittels eines verstärkenden Lernen-Algorithmus trainiert wird.
Verstärkende Lernen-Algorithmen eignen sich besonders für Optimierungsaufgaben wie die vorliegende. Ein weiterer unabhängiger Gegenstand betrifft eine Vorrichtung zum Trainieren wenigs tens eines Algorithmus für ein Steuergerät eines Kraftfahrzeugs, wobei das Steuergerät zur Umsetzung einer automatisierten bzw. autonomen Fahrfunktion unter Eingriff in Ag gregate des Kraftfahrzeugs auf der Grundlage von Eingangsdaten unter Verwendung des wenigstens einen Algorithmus vorgesehen ist, wobei der Algorithmus durch ein selbstler nendes neuronales Netz trainiert wird, wobei die Vorrichtung dazu ausgebildet ist, fol gende Schritte durchzuführen: a) Bereitstellen eines Computerprogrammproduktmoduls für die automatisierte bzw. autonome Fahrfunktion, wobei das Computerprogrammproduktmodul den zu trai nierenden Algorithmus und das selbstlernende neuronale Netz enthält, b) Bereitstellen einer Simulationsumgebung mit Simulationsparametern, wobei die Simulationsumgebung Kartendaten eines real existierenden Einsatzgebiets, das Kraftfahrzeug enthält, wobei ein Verhalten des Kraftfahrzeugs durch einen Regel satz bestimmt ist, c) Bereitstellen von Echtzeit-Verkehrsdaten des real existierenden Einsatzgebiets so wie Nachstellen der Verkehrssituation in der Simulationsumgebung; d) Bestimmen von Verkehrsbrennpunkten anhand der Echtzeit-Verkehrsdaten an hand einer Verkehrsflussmetrik; e) Bereitstellen einer Mission für das Kraftfahrzeug, in der das Kraftfahrzeug vor we nigstens einem weiteren simulierten Kraftfahrzeug fährt; f) Durchführen einer Simulation der Mission in der Simulationsumgebung; g) Bestimmen der Verkehrsflussmetrik der Mission, wobei
(i) wenn die Verkehrsflussmetrik unter einem Schwellwert liegt, Modifizieren des wenigstens einen Algorithmus und/oder des wenigstens einen Regelsatzes und Wiederholen der Mission, oder
(ii) wenn die Verkehrsflussmetrik über dem Schwellwert liegt, Klassifizieren der Mission als erfolgreich.
In einer ersten weiterführenden Ausgestaltung kann vorgesehen sein, dass die Vorrich tung dazu eingerichtet ist, eine andere Mission auszuwählen und das Verfahren mit der anderen Mission zu wiederholen, wenn Schritt i) erreicht ist.
In einerweiteren weiterführenden Ausgestaltung kann vorgesehen sein, dass eine Mis sion das Abfahren einer Route von wenigstens einem Startpunkt zu wenigstens einem Zielpunkt über einen Verkehrsbrennpunkt hinweg darstellt.
In einer weiteren weiterführenden Ausgestaltung kann vorgesehen sein, dass die Echt zeit-Verkehrsdaten Infrastrukturinformationen beinhalten.
In einer weiteren weiterführenden Ausgestaltung kann vorgesehen sein, dass die Vorrich tung dazu eingerichtet ist, die Mission durch Änderung von Parametern der Verkehrssitua tion in der Simulationsumgebung zu variieren und das Verfahren mit der modifizierten Mission durchzuführen.
In einer weiteren weiterführenden Ausgestaltung kann vorgesehen sein, dass die Vorrich tung dazu eingerichtet ist beim Nachstellen der Verkehrssituation in der Simulationsumge bung ein Optimierungsalgorithmus zu verwenden, um Abweichungen zwischen der Simu lationsumgebung und den Echtzeit-Verkehrsdaten zu minimieren.
In einer weiteren weiterführenden Ausgestaltung kann vorgesehen sein, dass die Ver kehrsflussmetrik eine Durchschnittsgeschwindigkeit während der Mission enthält.
In einer weiteren weiterführenden Ausgestaltung kann vorgesehen sein, dass die Vorrich tung dazu eingerichtet ist, den Algorithmus mittels eines verstärkenden Lernen-Algorith mus zu trainieren.
Ein weiterer unabhängiger Gegenstand betrifft ein Verfahren zur Optimierung eines Ver kehrsflusses in einer Region, wobei wenigstens ein Führungsfahrzeug verwendet wird, um Fahrverhalten von hinter dem Führungsfahrzeug fahrenden Kraftfahrzeuge durch das Führungsfahrzeug zu regulieren, wobei das wenigstens eine Führungsfahrzeug ein auto nom fahrendes Kraftfahrzeug ist, wobei das wenigstens eine Führungsfahrzeug mittels ei nes Algorithmus gesteuert wird, der nach dem zuvor beschriebenen Verfahren trainiert wurde.
Mithilfe eines entsprechenden autonom fahrenden Führungsfahrzeugs ist es möglich, den Verkehrsfluss an Verkehrsbrennpunkten effektiv zu regeln.
In einer ersten weiterführenden Ausgestaltung kann vorgesehen sein, dass das wenigs tens eine Führungsfahrzeug von einer Infrastruktursteuerung Infrastrukturinformationen erhält, wobei das Führungsfahrzeug sein Fahrverhalten an die empfangenen Infrastruktur informationen anpasst.
Durch die Verwendung von Infrastrukturinformationen, z.B. Informationen zu Ampelschal tungen, Spurregelungen oder dergleichen, ist es möglich, den Verkehrsfluss effizienter zu regeln, da das Führungsfahrzeug seine Fahrweise auf die gegebenen Umstände anpas sen kann, zum Beispiel um möglichst viele Ampeln bei Grün zu überfahren.
Ein weiterer unabhängiger Gegenstand betrifft ein Führungsfahrzeug zur Optimierung ei nes Verkehrsflusses durch Regulieren des Fahrverhaltens von hinter dem Führungsfahr zeug fahrenden Kraftfahrzeugen in einer Region, wobei das wenigstens eine Führungs fahrzeug ein autonom fahrendes Kraftfahrzeug ist, wobei das wenigstens eine Führungs fahrzeug einen das Führungsfahrzeug steuernden Algorithmus aufweist, wobei der nach dem zuvor beschriebenen Verfahren trainiert ist.
In einer weiteren weiterführenden Ausgestaltung kann vorgesehen sein, dass das wenigs tens eine Führungsfahrzeug Mittel zum Empfang von Infrastrukturinformationen von einer Infrastruktursteuerung aufweist, wobei das Führungsfahrzeug dazu eingerichtet ist, sein Fahrverhalten an die empfangenen Infrastrukturinformationen anzupassen.
Ein weiterer unabhängiger Gegenstand betrifft ein Computerprogrammprodukt, mit einem computerlesbaren Speichermedium, auf dem Befehle eingebettet sind, die, wenn sie von wenigstens einer Recheneinheit ausgeführt werden, bewirken, dass die wenigstens Re cheneinheit dazu eingerichtet ist, das Verfahren der vorgenannten Art auszuführen.
Das Verfahren kann auf einer oder auf mehreren Recheneinheiten verteilt ausgeführt wer den, sodass bestimmte Verfahrensschritte auf der einen Recheneinheit und andere Ver fahrensschritte auf wenigstens einer weiteren Recheneinheit ausgeführt werden, wobei berechnete Daten sofern notwendig zwischen den Recheneinheiten übermittelt werden können.
Ein weiterer unabhängiger Gegenstand betrifft ein Kraftfahrzeug mit einem Computerpro grammprodukt der zuvor beschriebenen Art.
Weitere Merkmale und Einzelheiten ergeben sich aus der nachfolgenden Beschreibung, in der - gegebenenfalls unter Bezug auf die Zeichnung - zumindest ein Ausführungsbei spiel im Einzelnen beschrieben ist. Beschriebene und/oder bildlich dargestellte Merkmale bilden für sich oder in beliebiger, sinnvoller Kombination den Gegenstand, gegebenenfalls auch unabhängig von den Ansprüchen, und können insbesondere zusätzlich auch Gegen stand einer oder mehrerer separater Anmeldung/en sein. Gleiche, ähnliche und/oder funk tionsgleiche Teile sind mit gleichen Bezugszeichen versehen. Dabei zeigen schematisch:
Fig. 1 eine Draufsicht auf ein Kraftfahrzeug;
Fig. 2 ein Computerprogrammproduktmodul;
Fig. 3 eine Straßenkarte eines real existierenden Einsatzgebiets, sowie Fig. 4 ein Ablaufdiagramm eines Trainingsverfahrens.
Fig. 1 zeigt ein Kraftfahrzeug 2, das zum automatisierten bzw. autonomen Fahren einge richtet ist. Das Kraftfahrzeug 2 ist als Führungsfahrzeug zur Regelung von Verkehr an Verkehrsbrennpunkten vorgesehen.
Das Kraftfahrzeug 2 weist ein Steuergerät 4 mit einer Recheneinheit 6 und einem Spei cher 8 auf. Im Speicher 8 ist ein Computerprogrammprodukt gespeichert, das im Nachfol genden im Zusammenhang mit den Fig. 2 bis 4 noch eingehender beschrieben wird.
Das Steuergerät 4 ist einerseits mit einer Reihe von Umgebungssensoren verbunden, die eine Erfassung der aktuellen Lage des Kraftfahrzeugs 2 sowie der jeweiligen Verkehrssi tuation erlauben. Hierzu zählen Umgebungssensoren 10, 11 an der Front des Kraftfahr zeugs 2, Umgebungssensoren 12, 13 am Heck des Kraftfahrzeugs 2, eine Kamera 14 so wie ein GPS-Modul 16. Die Umgebungssensoren 10 bis 13 können z.B. Radar-, Lidar- und/oder Ultraschallsensoren umfassen.
Des Weiteren sind Sensoren zur Erfassung des Zustands des Kraftfahrzeugs 2 vorgese hen, unter anderem Raddrehzahlsensoren 16 und Beschleunigungssensoren 18, die mit dem Steuergerät 4 verbunden sind. Mithilfe dieser Kraftfahrzeugsensorik kann der mo mentane Zustand des Kraftfahrzeuges 2 zuverlässig erfasst werden. Des Weiteren ist eine Kommunikationsvorrichtung 20 vorgesehen, die zur drahtlosen Kommunikation mit entfernt angeordneten Rechnern oder Rechenzentren ausgebildet ist, um von diesen Infrastrukturinformationen zu erhalten, also Informationen über Ampelpha sen, Verkehrsaufkommen in bestimmten Regionen etc., um diese Informationen bei einer Fahrplanung zu verwerten. Die Kommunikationsvorrichtung 20 kann Daten senden und empfangen und dazu gängige Standards wie LTE, 3G, 4G oder dergleichen verwenden. Die Kommunikation kann über Car2X-Kommunikationsmöglichkeiten auch direkt mit akti ven Objekten in der Infrastruktur stattfinden, zum Beispiel mit kommunikationsfähigen Am pelanlagen.
Während des Betriebs des Kraftfahrzeugs 2 hat die Recheneinheit 6 das im Speicher 8 abgelegte Computerprogrammprodukt geladen und führt dieses aus. Auf der Grundlage eines Algorithmus und der Eingangssignale entscheidet die Recheneinheit 6 über die Steuerung des Kraftfahrzeugs 2, die die Recheneinheit 6 über Eingriff in die Lenkung 22, Motorsteuerung 24 sowie Bremsen 26 erreichen würde, die jeweils mit dem Steuergerät 4 verbunden sind.
Daten der Sensoren 10 bis 18 werden fortlaufend im Speicher 8 zwischengespeichert und nach einer vorgegebenen Zeitdauer verworfen, damit diese Umgebungsdaten zur weite ren Auswertung zur Verfügung stehen können.
Der Algorithmus wurde nach dem nachfolgend beschriebenen Verfahren trainiert.
Fig. 2 zeigt ein Computerprogrammprodukt 28 mit einem Computerprogrammproduktmo dul 30.
Das Computerprogrammproduktmodul 30 weist ein selbstlernendes neuronales Netz 32 auf, das einen Algorithmus 34 trainiert. Das selbstlernende neuronale Netz 32 lernt nach Methoden des bestärkenden Lernens, d. h. das neuronale Netz 32 versucht durch Varia tion des Algorithmus 34, Belohnungen für ein verbessertes Verhalten entsprechend einer oder mehrerer Metriken oder Maßstäbe, also für Verbesserungen des Algorithmus 34, zu erhalten.
In alternativen Ausführungsbeispielen können auch andere bekannte Lernverfahren des überwachten und unüberwachten Lernens, sowie Kombinationen dieser Lernverfahren verwendet werden.
Der Algorithmus 34 kann im Wesentlichen ein komplexer Filter mit einer Matrix aus Wer ten, in der Regel von Fachmännern Gewichte genannt, bestehen, die eine Filterfunktion definieren, die das Verhalten des Algorithmus 34 abhängig von Eingangsgrößen, welche vorliegend über die Umgebungssensoren 10 bis 18 aufgenommen werden, bestimmt und Steuersignale zur Steuerung des Kraftfahrzeugs 2 generiert.
Das Computerprogrammproduktmodul 30 kann sowohl im Kraftfahrzeug 2 als auch au ßerhalb des Kraftfahrzeugs 2 zum Einsatz gebracht werden. Somit ist es möglich, das Computerprogrammproduktmodul 30 sowohl in einer realen Umgebung als auch in einer Simulationsumgebung zu trainieren. Insbesondere beginnt das Training gemäß der hier beschriebenen Lehre in einer Simulationsumgebung, da dies sicherer ist als ein Training in einer realen Umgebung.
Das Computerprogrammproduktmodul 30 ist dazu eingerichtet, eine Metrik aufzustellen und auszuwerten, die verbessert werden soll.
Eine solche Metrik ist im vorliegenden Fall beispielsweise eine Durchschnittsgeschwindig keit zum Passieren eines Verkehrsbrennpunktes, also eines Bereiches, in dem der Ver kehr zumindest zu bestimmten Zeiten besonders schlecht fließt.
Wenn die Metrik eine gewisse Schwelle überschritten hat, z.B. eine Geschwindigkeit einer hinter dem als Führungsfahrzeug eingesetzten Kraftfahrzeug 2 geführten Kolonne größer als eine Grenzgeschwindigkeit, kann die Metrik als erfüllt gelten und eine andere Mission ausgewählt und der Algorithmus anhand der anderen Mission weiter trainiert werden oder der Algorithmus kann hinsichtlich dieser Metrik eingefroren werden. Dann kann entweder hinsichtlich einer anderen Metrik optimiert und weiter trainiert werden oder der Algorith mus kann in einer realen Umgebung getestet werden.
Fig. 3 zeigt eine Simulationsumgebung 38 ein Areal einer real existierenden Kreuzung 40.
Die Kreuzung 40 stellt einen Verkehrsbrennpunkt dar, an dem der Verkehr zu Stoßzeiten besonders schlecht fließt. Zur Verbesserung des Verkehrsflusses wird das autonom fahrende Kraftfahrzeug 2 ver wendet, dessen Fahrweise auf einen optimalen Verkehrsfluss hin optimiert ist, vorliegend eine größtmögliche Durchschnittsgeschwindigkeit vd. Das Kraftfahrzeug 2 stellt ein Füh rungsfahrzeug dar, welches das das Fahrverhalten von hinter dem Führungsfahrzeug 2 fahrenden Verkehrsteilnehmern, hier einem Motorradfahrer 42 sowie Kraftfahrzeugen 44, 46 reguliert. Die Fahrzeuge 42, 44, 46 können nicht schneller fahren als das Kraftfahrzeug 2.
Das Kraftfahrzeug 2 reguliert jedoch nicht nur die Geschwindigkeit der nachfolgenden Fahrzeuge 42, 44 und 46, sondern auch das andere Verhalten, insbesondere das Brems verhalten der entsprechenden Fahrzeuge 42, 44 und 46, beispielsweise durch Limitierung einer maximalen Verzögerung des Kraftfahrzeugs 2, also durch besonders sanftes Fah ren. Hierdurch kann die Wahrscheinlichkeit reduziert werden, dass die Kolonne aus den Fahrzeugen 42, 44 und 46 zu stark bremst und dadurch der Verkehrsfluss ins Stocken ge rät.
Das Kraftfahrzeug 2 kann mittels seiner Kommunikationsvorrichtung mit einer Verkehrsinf rastruktur, hier einer Ampel 48 kommunizieren. Hierdurch ist es möglich, die Fahrge schwindigkeit an die entsprechenden Ampelphasen anzupassen, um möglichst stets zu Beginn einer Grünphase über Ampeln zu fahren.
Fig. 4 zeigt ein Ablaufdiagramm des Verfahrens.
Zunächst wird nach dem Start das Computerprogrammproduktmodul bereitgestellt. Das Computerprogrammproduktmodul beinhaltet den zu trainierenden Algorithmus und ein selbstlernendes neuronales Netz.
Anschließend wird auf der Basis von realen Kartendaten eine Simulationsumgebung be reitgestellt. Die Simulationsumgebung kann neben Straßen und bestimmten Regeln auch andere Verkehrsteilnehmer nebst deren Missionen enthalten.
In einem weiteren Schritt wird eine Mission in der Simulationsumgebung bestimmt. Die Mission kann, wie im Zusammenhang mit Fig. 3 gezeigt, das Abfahren einer bestimmten Route von einem Startpunkt zu einem Zielpunkt durch einen Verkehrsbrennpunkt sein. Sodann wird die Simulation durchgeführt und eine Durchschnittsgeschwindigkeit be stimmt. Die Durchschnittsgeschwindigkeit wird mit einer zu erreichenden Durchschnittsge schwindigkeit als Verkehrsflussmetrik verglichen. Hierdurch ist es möglich, durch Verstär- kendes-Lernen-Verfahren das Fahrverhalten des autonom fahrenden Kraftfahrzeuges 2, das den entsprechenden Algorithmus 34 verwendet, so zu optimieren, dass das entspre chende autonom fahrende Kraftfahrzeug 2 als Führungsfahrzeug verwendet werden kann.
Wird die entsprechende Metrik erreicht, kann das Verfahren anhand von anderen Missio nen wiederholt werden und der Algorithmus wird universeller einsetzbar.
Obwohl der Gegenstand im Detail durch Ausführungsbeispiele näher illustriert und erläu tert wurde, so ist die Erfindung nicht durch die offenbarten Beispiele eingeschränkt und andere Variationen können vom Fachmann hieraus abgeleitet werden. Es ist daher klar, dass eine Vielzahl von Variationsmöglichkeiten existiert. Es ist ebenfalls klar, dass bei spielhaft genannte Ausführungsformen nur Beispiele darstellen, die nicht in irgendeiner Weise als Begrenzung etwa des Schutzbereichs, der Anwendungsmöglichkeiten oder der Konfiguration der Erfindung aufzufassen sind. Vielmehr versetzen die vorhergehende Be schreibung und die Figurenbeschreibung den Fachmann in die Lage, die beispielhaften Ausführungsformen konkret umzusetzen, wobei der Fachmann in Kenntnis des offenbar ten Erfindungsgedankens vielfältige Änderungen beispielsweise hinsichtlich der Funktion oder der Anordnung einzelner, in einer beispielhaften Ausführungsform genannter Ele mente vornehmen kann, ohne den Schutzbereich zu verlassen, der durch die Ansprüche und deren rechtliche Entsprechungen, wie etwa einer weitergehenden Erläuterung in der Beschreibung, definiert wird.
Bezugszeichenliste
2 Kraftfahrzeug
4 Steuergerät
6 Recheneinheit
8 Speicher
10 Umgebungssensor
11 Umgebungssensor
12 Umgebungssensor
13 Umgebungssensor
14 Kamera
15 GPS-Modul
16 Raddrehzahlsensor
18 Beschleunigungssensor
20 Kommunikationsvorrichtung
22 Lenkung
24 Motorsteuerung
26 Bremsen
28 Computerprogrammprodukt
30 Computerprogrammproduktmodul
32 neuronales Netz
34 Algorithmus
38 Simulationsumgebung
40 Kreuzung
42 Motorrad
44 Kraftfahrzeug
46 Kraftfahrzeug
48 Ampel vd Durchschnittsgeschwindigkeit

Claims

Patentansprüche
1. Verfahren zum Trainieren wenigstens eines Algorithmus (34) für ein Steuergerät (4) eines Kraftfahrzeugs (2), wobei das Steuergerät (4) zur Umsetzung einer automati sierten bzw. autonomen Fahrfunktion unter Eingriff in Aggregate (22, 24, 26) des Kraftfahrzeugs (2) auf der Grundlage von Eingangsdaten unter Verwendung des wenigstens einen Algorithmus (34) vorgesehen ist, wobei der Algorithmus (34) durch ein selbstlernendes neuronales Netz (32) trainiert wird, umfassend folgende Schritte: a) Bereitstellen eines Computerprogrammproduktmoduls (30) für die automatisierte bzw. autonome Fahrfunktion, wobei das Computerprogrammproduktmodul (30) den zu trainierenden Algorithmus (34) und das selbstlernende neuronale Netz (32) ent hält, b) Bereitstellen einer Simulationsumgebung (38) mit Simulationsparametern, wobei die Simulationsumgebung (38) Kartendaten (38) eines real existierenden Einsatzge biets (40), wobei ein Verhalten des Kraftfahrzeugs (2) durch einen Regelsatz be stimmt ist, c) Bereitstellen von Echtzeit-Verkehrsdaten des real existierenden Einsatzgebiets (40) sowie Nachstellen der Verkehrssituation in der Simulationsumgebung (38); d) Bestimmen von Verkehrsbrennpunkten (40) anhand der Echtzeit-Verkehrsdaten anhand einer Verkehrsflussmetrik (vd), e) Bereitstellen einer Mission für das Kraftfahrzeug (2), in der das Kraftfahrzeug (2) vor wenigstens einem weiteren simulierten Kraftfahrzeug (2) fährt; f) Durchführen einer Simulation der Mission in der Simulationsumgebung (38); g) Bestimmen der Verkehrsflussmetrik (vd) der Mission, wobei
(i) wenn die Verkehrsflussmetrik (vd) unter einem Schwellwert liegt, Modifizieren des wenigstens einen Algorithmus (38) und/oder des wenigstens einen Regelsatzes und Wiederholen der Mission, oder
(ii) wenn die Verkehrsflussmetrik (vd) über dem Schwellwert liegt, Klassifizieren der Mission als erfolgreich.
2. Verfahren nach Anspruch 1 , wobei, wenn Schritt g) (i) erreicht ist, eine andere Mis sion ausgewählt und das Verfahren mit der anderen Mission wiederholt wird.
3. Verfahren nach Anspruch 1 oder 2, wobei eine Mission das Abfahren einer Route von wenigstens einem Startpunkt zu wenigstens einem Zielpunkt über einen Ver kehrsbrennpunkt (40) hinweg darstellt.
4. Verfahren nach einem der vorangegangenen Ansprüche, wobei die Echtzeit-Ver kehrsdaten Infrastrukturinformationen beinhalten.
5. Verfahren nach einem der vorangegangenen Ansprüche, wobei die Mission durch Änderung von Parametern der Verkehrssituation in der Simulationsumgebung vari iert wird und das Verfahren mit der modifizierten Mission durchgeführt wird.
6. Verfahren nach einem der vorangegangenen Ansprüche, wobei beim Nachstellen der Verkehrssituation in der Simulationsumgebung ein Optimierungsalgorithmus verwendet wird, um Abweichungen zwischen der Simulationsumgebung und den Echtzeit-Verkehrsdaten zu minimieren.
7. Verfahren nach einem der vorangegangenen Ansprüche, wobei die Verkehrsfluss metrik eine Durchschnittsgeschwindigkeit während der Mission enthält.
8. Verfahren nach einem der vorangegangenen Ansprüche, wobei der Algorithmus mit tels eines verstärkenden Lernen-Algorithmus trainiert wird.
9. Verfahren zur Optimierung eines Verkehrsflusses in einer Region, wobei wenigstens ein Führungsfahrzeug (2) verwendet wird, um Fahrverhalten von hinter dem Füh rungsfahrzeug (2) fahrenden Kraftfahrzeuge (42, 44, 46) durch das Führungsfahr zeug (2) zu regulieren, wobei das wenigstens eine Führungsfahrzeug (2) ein auto nom fahrendes Kraftfahrzeug (2) ist, wobei das wenigstens eine Führungsfahrzeug (2) mittels eines Algorithmus (34) gesteuert wird, der nach dem zuvor beschriebe nen Verfahren trainiert wurde.
10. Verfahren nach Anspruch 9, wobei das wenigstens eine Führungsfahrzeug (2) von einer Infrastruktursteuerung Infrastrukturinformationen erhält, wobei das Führungs fahrzeug (2) sein Fahrverhalten an die empfangenen Infrastrukturinformationen an passt.
11. Computerprogrammprodukt, mit einem computerlesbaren Speichermedium (8), auf dem Befehle eingebettet sind, die, wenn sie von wenigstens einer Recheneinheit (6) ausgeführt werden, bewirken, dass die wenigstens eine Recheneinheit (6) dazu ein gerichtet ist, das Verfahren nach einem der vorangegangenen Ansprüche 1 bis 10 auszuführen.
12. Kraftfahrzeug mit einem Computerprogrammprodukt nach Anspruch 11.
PCT/EP2021/053181 2020-02-17 2021-02-10 Verfahren zum trainieren wenigstens eines algorithmus für ein steuergerät eines kraftfahrzeugs, verfahren zur optimierung eines verkehrsflusses in einer region, computerprogrammprodukt sowie kraftfahrzeug WO2021165113A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP21704766.1A EP4107590A1 (de) 2020-02-17 2021-02-10 Verfahren zum trainieren wenigstens eines algorithmus für ein steuergerät eines kraftfahrzeugs, verfahren zur optimierung eines verkehrsflusses in einer region, computerprogrammprodukt sowie kraftfahrzeug
CN202180015176.2A CN115136081A (zh) 2020-02-17 2021-02-10 用于训练用于机动车的控制器的至少一个算法的方法、用于优化区域中的交通流的方法、计算机程序产品以及机动车

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102020201931.2 2020-02-17
DE102020201931.2A DE102020201931A1 (de) 2020-02-17 2020-02-17 Verfahren zum Trainieren wenigstens eines Algorithmus für ein Steuergerät eines Kraftfahrzeugs, Verfahren zur Optimierung eines Verkehrsflusses in einer Region, Computerprogrammprodukt sowie Kraftfahrzeug

Publications (1)

Publication Number Publication Date
WO2021165113A1 true WO2021165113A1 (de) 2021-08-26

Family

ID=74591993

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2021/053181 WO2021165113A1 (de) 2020-02-17 2021-02-10 Verfahren zum trainieren wenigstens eines algorithmus für ein steuergerät eines kraftfahrzeugs, verfahren zur optimierung eines verkehrsflusses in einer region, computerprogrammprodukt sowie kraftfahrzeug

Country Status (4)

Country Link
EP (1) EP4107590A1 (de)
CN (1) CN115136081A (de)
DE (1) DE102020201931A1 (de)
WO (1) WO2021165113A1 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102022106338A1 (de) 2022-03-18 2023-09-21 Joynext Gmbh Anpassen eines Fahrverhaltens eines autonomen Fahrzeugs
DE102022113744A1 (de) 2022-05-31 2023-11-30 ASFINAG Maut Service GmbH Verfahren zum Erzeugen eines Datensatzes

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102017007468A1 (de) 2017-08-08 2018-04-19 Daimler Ag Verfahren zum Betrieb eines Fahrzeugs
DE102017007136A1 (de) * 2017-07-27 2019-01-31 Opel Automobile Gmbh Verfahren und Vorrichtung zum Trainieren selbstlernender Algorithmen für ein automatisiert fahrbares Fahrzeug
DE102018216719A1 (de) * 2017-10-06 2019-04-11 Honda Motor Co., Ltd. Schlüsselbildbasierter autonomer Fahrzeugbetrieb
CN109709956A (zh) * 2018-12-26 2019-05-03 同济大学 一种自动驾驶车辆速度控制多目标优化的跟驰算法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102017200180A1 (de) 2017-01-09 2018-07-12 Bayerische Motoren Werke Aktiengesellschaft Verfahren und Testeinheit zur Bewegungsprognose von Verkehrsteilnehmern bei einer passiv betriebenen Fahrzeugfunktion
DE102017212166A1 (de) 2017-07-17 2019-01-17 Audi Ag Verfahren zum Betrieb von Start-Stopp-Systemen in Kraftfahrzeugen und Kommunikationssystem

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102017007136A1 (de) * 2017-07-27 2019-01-31 Opel Automobile Gmbh Verfahren und Vorrichtung zum Trainieren selbstlernender Algorithmen für ein automatisiert fahrbares Fahrzeug
DE102017007468A1 (de) 2017-08-08 2018-04-19 Daimler Ag Verfahren zum Betrieb eines Fahrzeugs
DE102018216719A1 (de) * 2017-10-06 2019-04-11 Honda Motor Co., Ltd. Schlüsselbildbasierter autonomer Fahrzeugbetrieb
CN109709956A (zh) * 2018-12-26 2019-05-03 同济大学 一种自动驾驶车辆速度控制多目标优化的跟驰算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BAKIBILLAH A S M ET AL: "Event-Driven Stochastic Eco-Driving Strategy at Signalized Intersections From Self-Driving Data", IEEE TRANSACTIONS ON VEHICULAR TECHNOLOGY, IEEE SERVICE CENTER, PISCATAWAY, NJ, US, vol. 68, no. 9, 1 September 2019 (2019-09-01), pages 8557 - 8569, XP011746069, ISSN: 0018-9545, [retrieved on 20190916], DOI: 10.1109/TVT.2019.2931519 *
CATHY WU ET AL: "Flow: Architecture and Benchmarking for Reinforcement Learning in Traffic Control", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 16 October 2017 (2017-10-16), XP080829046 *

Also Published As

Publication number Publication date
DE102020201931A1 (de) 2021-08-19
EP4107590A1 (de) 2022-12-28
CN115136081A (zh) 2022-09-30

Similar Documents

Publication Publication Date Title
EP3970077B1 (de) Verfahren zum trainieren wenigstens eines algorithmus für ein steuergerät eines kraftfahrzeugs, computerprogrammprodukt, kraftfahrzeug sowie system
DE102019104974A1 (de) Verfahren sowie System zum Bestimmen eines Fahrmanövers
WO2017167801A1 (de) Fahrerassistenzsystem zum unterstützen eines fahrers beim führen eines fahrzeugs
DE102019203712B4 (de) Verfahren zum Trainieren wenigstens eines Algorithmus für ein Steuergerät eines Kraftfahrzeugs, Computerprogrammprodukt, Kraftfahrzeug sowie System
EP4052178A1 (de) Verfahren zum trainieren wenigstens eines algorithmus für ein steuergerät eines kraftfahrzeugs, computerprogrammprodukt sowie kraftfahrzeug
DE102016007899B4 (de) Verfahren zum Betreiben einer Einrichtung zur Verkehrssituationsanalyse, Kraftfahrzeug und Datenverarbeitungseinrichtung
EP4073778B1 (de) Trainieren wenigstens eines algorithmus für ein steuergerät eines kraftfahrzeugs, computerprogrammprodukt sowie kraftfahrzeug
DE102018206805B3 (de) Verfahren, Vorrichtung und Computerprogramm zum Prädizieren einer zukünftigen Bewegung eines Objekts
EP4111438A1 (de) Verfahren zum trainieren wenigstens eines algorithmus für ein steuergerät eines kraftfahrzeugs, computerprogrammprodukt sowie kraftfahrzeug
AT523834B1 (de) Verfahren und System zum Testen eines Fahrerassistenzsystems
EP4107590A1 (de) Verfahren zum trainieren wenigstens eines algorithmus für ein steuergerät eines kraftfahrzeugs, verfahren zur optimierung eines verkehrsflusses in einer region, computerprogrammprodukt sowie kraftfahrzeug
DE102021111686A1 (de) Navigationstrajektorie mit verstärkendem lernen für ein ego-fahrzeug in einem navigationsnetzwerk
DE102018133457B4 (de) Verfahren und System zum Bereitstellen von Umgebungsdaten
WO2020069812A1 (de) Verfahren zum zumindest teilautomatisierten führen eines kraftfahrzeugs auf einer fahrbahn
DE102016117136A1 (de) Verfahren zum Bestimmen eines Fahrverhaltens eines Fahrers eines Kraftfahrzeugs zum Betrieb eines Fahrerassistenzsystems des Kraftfahrzeugs, Fahrerassistenzsystem sowie Kraftfahrzeug
WO2020108839A1 (de) Situationsabhängige berechnung einer soll-fahrzeuggeschwindigkeit
DE102019214931A1 (de) Steuerung eines Fahrzeugs
WO2022184363A1 (de) Computerimplementiertes verfahren zum trainieren wenigstens eines algorithmus für eine steuereinheit eines kraftfahrzeugs, computerprogrammprodukt, steuereinheit sowie kraftfahrzeug
EP2881925B1 (de) Kraftfahrzeug
DE102023208690B3 (de) Verfahren zum Erzeugen eines Längsführungs-Modells für ein Fahrzeug zur Ermittlung wenigstens einer Längsführungsgröße zur Längsführung des Fahrzeugs und Längsführungsprofil-Ermittlungseinrichtung
EP4309141A1 (de) Verfahren, computerprogramm, steuereinheit sowie kraftfahrzeug zum durchführen einer automatisierten fahrfunktion
WO2023117161A1 (de) Verfahren und prozessorschaltung zur verbrauchsoptimierung von vollautomatisierten oder teilautomatisierten fahrmanövern eines kraftfahrzeugs sowie entsprechend ausgestattetes kraftfahrzeug und system
WO2024056895A1 (de) Verfahren zum infrastrukturgestützten assistieren eines kraftfahrzeugs
WO2023245217A1 (de) Verfahren zum trainieren eines künstlichen neuronalen netzes eines fahrermodells
DE102018207806A1 (de) Situationsspezifische Anpassung der Kurvengeschwindigkeiten im automatischen Längsführungsbetrieb

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21704766

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2021704766

Country of ref document: EP

Effective date: 20220919