DE102022107846A1 - Method, system and computer program product for creating parameterized scenarios - Google Patents

Method, system and computer program product for creating parameterized scenarios Download PDF

Info

Publication number
DE102022107846A1
DE102022107846A1 DE102022107846.9A DE102022107846A DE102022107846A1 DE 102022107846 A1 DE102022107846 A1 DE 102022107846A1 DE 102022107846 A DE102022107846 A DE 102022107846A DE 102022107846 A1 DE102022107846 A1 DE 102022107846A1
Authority
DE
Germany
Prior art keywords
parameterized
scenario
scenarios
szp
grp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102022107846.9A
Other languages
German (de)
Inventor
Moritz Markofsky
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dr Ing HCF Porsche AG
Original Assignee
Dr Ing HCF Porsche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dr Ing HCF Porsche AG filed Critical Dr Ing HCF Porsche AG
Priority to DE102022107846.9A priority Critical patent/DE102022107846A1/en
Publication of DE102022107846A1 publication Critical patent/DE102022107846A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/092Reinforcement learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/15Vehicle, aircraft or watercraft design

Abstract

Die Erfindung betrifft ein Verfahren zur Erstellung von parametrisierten Szenarien, insbesondere für das Testen und Trainieren von Fahrassistenzsysteme und automatisierten Fahrfunktionen, wobei ein Szenario ein Verkehrsgeschehen in einer zeitlichen Sequenz darstellt. Das Verfahren umfasst die Verfahrensschritte:- Generieren einer Mehrzahl von parametrisierten Grundbausteinen von Szenen und Ereignissen für zumindest ein parametrisiertes Szenario;- Weitergeben der Mehrzahl von parametrisierten Grundbausteinen an ein Lernverstärkungsmodul;- Erstellen zumindest eines parametrisierten Szenarios von dem Lernverstärkungsmodul;- Festlegen von Wertebereichen für die Parameterwerte der Parameter der Grundbausteine des parametrisierten Szenarios;- Erstellen einer Menge von konkreten Szenarien aus dem zumindest einen parametrisierten Szenario;- Simulieren einer Menge von simulierten konkreten Szenarien aus der Menge von konkreten Szenarien;- Generieren einer Menge von realen Szenarien;- Vergleichen der Menge von realen Szenarien mit der Menge von simulierten konkreten Szenarien;- Berechnen von zumindest einem relevanten parametrisierten Szenario von dem Lernverstärkungsmodul;- Ausgeben des zumindest einen relevanten parametrisierten Szenarios für Test- und Trainingszwecke.The invention relates to a method for creating parameterized scenarios, in particular for testing and training driving assistance systems and automated driving functions, wherein a scenario represents a traffic event in a temporal sequence. The method includes the method steps: - Generating a plurality of parameterized basic building blocks of scenes and events for at least one parameterized scenario; - Passing on the plurality of parameterized basic building blocks to a learning reinforcement module; - Creating at least one parameterized scenario from the learning reinforcement module; - Setting value ranges for the Parameter values of the parameters of the basic building blocks of the parameterized scenario; - Creating a set of concrete scenarios from the at least one parameterized scenario; - Simulating a set of simulated concrete scenarios from the set of concrete scenarios; - Generating a set of real scenarios; - Comparing the set of real scenarios with the set of simulated concrete scenarios; - calculating at least one relevant parameterized scenario from the learning reinforcement module; - outputting the at least one relevant parameterized scenario for testing and training purposes.

Description

Die Erfindung betrifft ein Verfahren, ein System und ein Computerprogrammprodukt zur Erstellung von parametrisierten Szenarien, insbesondere für das Testen und Trainieren von Fahrassistenzsystemen und automatisierten Fahrfunktionen.The invention relates to a method, a system and a computer program product for creating parameterized scenarios, in particular for testing and training driving assistance systems and automated driving functions.

Der Trend zu Fahrerassistenzsystemen (engl. Advanced Driver Assistance System, ADAS) und hochautomatisierten Fahrfunktionen (HAF) bei Kraftfahrzeugen, aber auch bei Luftfahrzeugen oder Wasserfahrzeugen erfordert umfangreiche Absicherungsstrategien, da die Verantwortung über die Fahrzeugführung nicht mehr uneingeschränkt beim Fahrer liegt, sondern aktive Funktionen von Rechnereinheiten im Fahrzeug übernommen werden. Daher muss sichergestellt werden, dass autonom sich bewegende Objekte eine sehr geringere Fehlerrate beim Fahrverhalten aufweisen. Die Erkennung und Klassifizierung von Objekten und die Interpretation von Verkehrsszenarien im Umfeld eines Fahrzeugs sind wichtige Voraussetzungen für eine sichere Funktionsfähigkeit von Fahrerassistenzsystemen und automatisierten Fahrfunktionen. Hierfür ist das gezielte Testen und Trainieren der Fahrerassistenzsysteme und automatisierten Fahrfunktionen sowohl mit Extrem- und Ausnahmesituationen (engl. Corner-Cases) als auch mit alltäglichen Situationen erforderlich. Derartige Extremsituationen ergeben sich durch eine besondere Kombination von verschiedenen Faktoren. Beispiele hierfür sind infrastrukturelle Besonderheiten wie beispielsweise der Straßentyp, die Randbebauung an einer Straße, die Qualität der Markierungen aber auch Umgebungsbedingungen wie beispielsweise Witterungsbedingungen, die Tages- und die Jahreszeit. Des Weiteren spielen das Verhalten der anderen Verkehrsteilnehmer, die geographische Topographie und die Wetterverhältnisse eine große Rolle.The trend towards driver assistance systems (Advanced Driver Assistance System, ADAS) and highly automated driving functions (HAF) in motor vehicles, but also in aircraft or watercraft, requires extensive safety strategies, since responsibility for vehicle control no longer lies entirely with the driver, but rather active functions Computer units in the vehicle are taken over. Therefore, it must be ensured that autonomously moving objects have a very low error rate in driving behavior. The detection and classification of objects and the interpretation of traffic scenarios in the area around a vehicle are important prerequisites for the safe functionality of driver assistance systems and automated driving functions. This requires targeted testing and training of driver assistance systems and automated driving functions both in extreme and exceptional situations (corner cases) as well as in everyday situations. Such extreme situations arise from a special combination of different factors. Examples of this are infrastructural features such as the type of road, the development on the edge of a road, the quality of the markings but also environmental conditions such as weather conditions, the time of day and the season. The behavior of other road users, the geographical topography and the weather conditions also play a major role.

Verkehrstechnische Ausnahmesituationen sind jedoch in der realen Welt schwierig zu finden, da einige Ereignisse und Situationen nur selten auftreten. Darüber hinaus ist eine Auswertung von verfügbaren Verkehrsdaten, beispielsweise Daten von zur Datensammlung eingesetzten Testfahrzeugen, nicht immer einfach, da die relevanten Daten oftmals nicht ausreichend klassifiziert und daher schwierig auffindbar sind.However, exceptional traffic situations are difficult to find in the real world because some events and situations occur only rarely. In addition, evaluating available traffic data, for example data from test vehicles used to collect data, is not always easy because the relevant data is often not sufficiently classified and is therefore difficult to find.

Für das Testen und Trainieren von Fahrfunktionen und automatisierten Fahrfunktionen werden daher zunehmend simulierte Verkehrsszenarien verwendet. Allerdings werden diese simulierten Szenarien derzeit manuell erstellt und dies ist mit einem hohen Zeit- und Arbeitsaufwand verbunden. Da die manuelle Erstellung von simulierten Szenarien zeitintensiv ist, werden zudem nicht alle möglichen in der Realität auftretenden Szenarien abgedeckt, so dass der erforderliche Katalog von zur Verfügung stehenden Szenarien unvollständig ist.Simulated traffic scenarios are therefore increasingly being used to test and train driving functions and automated driving functions. However, these simulated scenarios are currently created manually and this requires a lot of time and effort. Since the manual creation of simulated scenarios is time-consuming, not all possible scenarios that occur in reality are covered, so that the required catalog of available scenarios is incomplete.

Die WO 2020/083996 A1 offenbart ein Verfahren zum Testen eines Fahrerassistenzsystems für ein Fahrzeug in einer Prüfumgebung. Es werden Verkehrsszenario-Beschreibungen ermittelt, die in einer Verkehrsszenario-Datei abgelegt werden und durch die Eingabe eines Benutzers abgerufen werden können. Zudem wird ein Testfall basierend auf der ausgewählten Verkehrsszenario-Beschreibung und einem vorgegebenen Wert für einen Parameter erzeugt.The WO 2020/083996 A1 discloses a method for testing a driver assistance system for a vehicle in a test environment. Traffic scenario descriptions are determined, which are stored in a traffic scenario file and can be accessed by a user's input. In addition, a test case is created based on the selected traffic scenario description and a specified value for a parameter.

Die US 11137763 B2 offenbart ein automatisiertes Fahrsystem, welches mit Hilfe automatisch generierter Simulationsszenarien simuliert und validiert werden kann. Eine große Anzahl von simulierten Szenarien wird erzeugt, indem eine Vielzahl von aufgezeichneten realen Szenarien mit einem oder mehreren extrahierten Datenströmen ergänzt wird.The US 11137763 B2 discloses an automated driving system that can be simulated and validated using automatically generated simulation scenarios. A large number of simulated scenarios are generated by supplementing a variety of recorded real-world scenarios with one or more extracted data streams.

Die EP 3 066 529 B1 offenbart ein Verfahren zur Validierung eines Fahrerassistenzsystems eines Kraftfahrzeugs, wobei für ein vorgegebenes Testszenario durch Testparameter definierte Tests durchlaufen werden. Während eines ersten Tests wird zumindest ein Testparameter bestimmt und zur Erstellung eines zweiten Tests wird der erste Test derart abgeändert, dass der Testparameter innerhalb eines ihm zugeordneten kritischen Bereichs, innerhalb dessen eine Fahrerassistenzsystem aktiv in das Fahrgeschehen eingreifen kann, verändert wird. Für das vorgegebene Testszenario wird der zweite Test durchgeführt, um das Fahrassistenzsystem zu validieren.The EP 3 066 529 B1 discloses a method for validating a driver assistance system of a motor vehicle, with tests defined by test parameters being carried out for a given test scenario. During a first test, at least one test parameter is determined and to create a second test, the first test is modified in such a way that the test parameter is changed within a critical range assigned to it, within which a driver assistance system can actively intervene in the driving situation. For the specified test scenario, the second test is carried out to validate the driving assistance system.

Die DE 10 2013 003944 A1 offenbart ein Verfahren zum Bereitstellen von Kraftfahrzeug-Fahrassistenzfunktionalitäten basierend auf einem Katalog aus Straßenszenarien.The DE 10 2013 003944 A1 discloses a method for providing motor vehicle driving assistance functionalities based on a catalog of road scenarios.

Die DE 10 2007 053500 A1 offenbart ein Verfahren zur Bewertung eines zur Verwendung bei Kraftfahrzeugen vorgesehenen vorausschauenden Sicherheitssystems zur Unfallvermeidung, wobei das Sicherheitssystem in Abhängigkeit von zumindest einer Rekonstruktion eines Unfalls, der einen Bezug zu diesem Sicherheitssystem aufweist, bewertet wird.The DE 10 2007 053500 A1 discloses a method for evaluating a predictive safety system for accident avoidance intended for use in motor vehicles, the safety system being evaluated as a function of at least one reconstruction of an accident that has a reference to this safety system.

Die DE 10 2006 044086 B4 offenbart ein Verfahren zur Simulation von Verkehrssituationen, wobei auf einer Anzeigeeinheit virtuell erzeugte Verkehrssituationen bildhaft angezeigt werden.The DE 10 2006 044086 B4 discloses a method for simulating traffic situations, wherein virtually generated traffic situations are displayed graphically on a display unit.

Die der Erfindung zu Grunde liegende Aufgabe besteht nun darin, Möglichkeiten zur verbesserten Erstellung von parametrisierten Szenarien anzugeben, die eine große Bandbreite von realen Verkehrsszenarien genau und wirklichkeitstreu wiedergeben und insbesondere für das Testen und Trainieren von Fahrassistenzsystemen und automatisierten Fahrfunktionen eingesetzt werden können.The object on which the invention is based is to provide options for the improved creation of parameterized scenarios that cover a wide range of real ones Reproduce traffic scenarios accurately and realistically and can be used in particular for testing and training driving assistance systems and automated driving functions.

Diese Aufgabe wird hinsichtlich eines Verfahrens durch die Merkmale des Patentanspruchs 1, hinsichtlich eines Systems durch die Merkmale des Patentanspruchs 10, und hinsichtlich eines Computerprogrammprodukts durch die Merkmale des Patentanspruchs 15 erfindungsgemäß gelöst. Die weiteren Ansprüche betreffen bevorzugte Ausgestaltungen der Erfindung.This object is achieved according to the invention with regard to a method by the features of patent claim 1, with regard to a system by the features of patent claim 10, and with regard to a computer program product by the features of patent claim 15. The further claims relate to preferred embodiments of the invention.

Durch die vorliegende Erfindung wird eine verbesserte Erstellung von parametrisierten Verkehrsszenarien durch die Strukturierung von Szenarien in Grundbausteine, die verschiedene Szenen und Ereignisse darstellen, und die Verwendung eines Lernverstärkungs-Algorithmus ermöglicht. Hierdurch werden simulierte Szenarien erzeugt, die eine große Bandbreite von realen Verkehrsszenarien abdecken und insbesondere auch kritische Verkehrssituationen abbilden, so dass sie insbesondere für das Testen und Trainieren von Fahrassistenzsystemen und automatisierten Fahrfunktionen eingesetzt werden können und damit deren Sicherheit und Einsatzmöglichkeiten erhöhen.The present invention enables improved creation of parameterized traffic scenarios by structuring scenarios into basic building blocks representing various scenes and events and using a learning reinforcement algorithm. This creates simulated scenarios that cover a wide range of real traffic scenarios and, in particular, also depict critical traffic situations, so that they can be used in particular for testing and training driver assistance systems and automated driving functions, thereby increasing their safety and possible uses.

Gemäß einem ersten Aspekt stellt die Erfindung ein Verfahren zur Erstellung von parametrisierten Szenarien, insbesondere für das Testen und Trainieren von Fahrassistenzsystemen und automatisierten Fahrfunktionen, bereit. Ein parametrisiertes Szenario stellt ein Verkehrsgeschehen in einer zeitlichen Sequenz dar und ist als eine Folge von Szenen beginnend mit einer Startszene und von Ereignissen beschreibbar, wobei eine Szene und ein Ereignis jeweils durch zumindest einen Grundbaustein abgebildet werden, der durch eine Auswahl von Parametern und zugehörigen Parameterwerten definiert ist. Als ein parametrisiertes Szenario wird ein Szenario bzw. als parametrisierter Grundbaustein ein Grundbaustein bezeichnet, bei dem die Parameter und zugehörigen Parameterwerte frei wählbar sind, und als konkretes Szenario wird ein Szenario bzw. als konkreter Grundbaustein ein Grundbaustein bezeichnet wird, bei dem die Parameter und zugehörigen Parameterwerte festgelegt sind. Das Verfahren umfasst die folgenden Verfahrensschritte:

  • - Generieren einer Mehrzahl von parametrisierten Grundbausteinen von Szenen und Ereignissen für zumindest ein parametrisiertes Szenario durch ein Eingabemodul, wobei das Eingabemodul eine Softwareapplikation verwendet;
  • - Weitergeben der Mehrzahl von parametrisierten Grundbausteinen an ein Lernverstärkungsmodul mit einem Lernverstärkungs-Agenten;
  • - Erstellen zumindest eines parametrisierten Szenarios durch Auswählen zumindest eines Grundbausteins von dem Lernverstärkungsmodul;
  • - Festlegen von Wertebereichen für die Parameterwerte der Parameter der Grundbausteine des parametrisierten Szenarios;
  • - Erstellen einer Menge von konkreten Szenarien aus dem zumindest einen parametrisierten Szenario durch Bestimmen von konkreten Parameterwerten der Parameter der Grundbausteine innerhalb der festgelegten Wertebereiche;
  • - Simulieren in einer Menge von simulierten konkreten Szenarien aus der Menge von konkreten Szenarien;
  • - Generieren einer Menge von realen Szenarien von dem Eingabemodul mittels der Softwareapplikation aus Sensorsignalen von Sensoren, wobei die Sensorsignale der Sensoren in Echtzeit an das Eingabemodul übermittelt werden und/oder aus einer Datenbank abrufbar sind;
  • - Vergleichen der Menge von realen Szenarien mit der Menge von simulierten konkreten Szenarien;
  • - Berechnen von zumindest einem relevanten parametrisierten Szenario von dem Lernverstärkungsmodul;
  • - Ausgeben des zumindest einen relevanten parametrisierten Szenarios für Test- und Trainingszwecke.
According to a first aspect, the invention provides a method for creating parameterized scenarios, in particular for testing and training driving assistance systems and automated driving functions. A parameterized scenario represents a traffic event in a temporal sequence and can be described as a sequence of scenes starting with a starting scene and events, with a scene and an event each being represented by at least one basic module, which is determined by a selection of parameters and associated parameter values is defined. A parameterized scenario is a scenario or a parameterized basic building block is a basic building block in which the parameters and associated parameter values are freely selectable, and a concrete scenario is a scenario or a concrete basic building block is a basic building block in which the parameters and associated Parameter values are set. The procedure includes the following procedural steps:
  • - Generating a plurality of parameterized basic building blocks of scenes and events for at least one parameterized scenario through an input module, the input module using a software application;
  • - passing on the plurality of parameterized basic building blocks to a learning reinforcement module with a learning reinforcement agent;
  • - Creating at least one parameterized scenario by selecting at least one basic building block from the learning reinforcement module;
  • - defining value ranges for the parameter values of the parameters of the basic blocks of the parameterized scenario;
  • - Creating a set of concrete scenarios from the at least one parameterized scenario by determining concrete parameter values of the parameters of the basic building blocks within the specified value ranges;
  • - Simulate in a set of simulated concrete scenarios from the set of concrete scenarios;
  • - Generating a set of real scenarios from the input module using the software application from sensor signals from sensors, the sensor signals from the sensors being transmitted to the input module in real time and/or being retrievable from a database;
  • - Comparing the set of real scenarios with the set of simulated concrete scenarios;
  • - Calculating at least one relevant parameterized scenario from the learning reinforcement module;
  • - Outputting the at least one relevant parameterized scenario for testing and training purposes.

In einer Weiterentwicklung ist vorgesehen, dass das Berechnen des zumindest einen relevanten parametrisierten Szenarios die folgenden Verfahrensschritte umfasst:

  • - Zuordnen einer ersten Belohnung für das Vergleichsergebnis zwischen der Menge von realen Szenarien und der Menge von simulierten konkreten Szenarien;
  • - Auswählen einer Berechnungsfunktion und/oder einer Aktion von dem Lernverstärkungs-Agenten basierend auf der Belohnung;
  • - Berechnen eines modifizierten parametrisierten Szenarios mittels der ausgewählten Berechnungsfunktion und/oder Aktion durch Modifizierung zumindest eines parametrisierten Grundbausteins;
  • - Generieren einer Menge von modifizierten simulierten konkreten Szenarien aus dem zumindest einen modifizieren parametrisierten Szenario;
  • - Vergleichen der Menge von realen Szenarien mit der Menge von modifizierten simulierten konkreten Szenarien;
  • - Zuordnen einer zweiten Belohnung für das Vergleichsergebnis;
  • - Anpassen einer Richtlinie des Lernverstärkungs-Agenten basierend auf der zweiten Belohnung, wobei bei einer Konvergenz der Richtlinie keine weitere Berechnungsfunktion und/oder Aktion durchgeführt wird, und bei einer Nicht-Konvergenz der Richtlinie eine weitere Berechnungsfunktion und/oder eine weitere Aktion für ein weiteres modifiziertes parametrisiertes Szenario mit einer Modifizierung zumindest eines weiteren parametrisierten Grundbausteins von dem Lernverstärkungs-Agenten ausgewählt wird, solange bis ein relevantes parametrisierten Szenario berechnet ist.
In a further development it is provided that the calculation of the at least one relevant parameterized scenario includes the following procedural steps:
  • - assigning a first reward for the comparison result between the set of real scenarios and the set of simulated concrete scenarios;
  • - selecting a calculation function and/or an action from the learning reinforcement agent based on the reward;
  • - Calculating a modified parameterized scenario using the selected calculation function and/or action by modifying at least one parameterized basic building block;
  • - Generating a set of modified simulated concrete scenarios from the at least one modified parameterized scenario;
  • - Comparing the set of real scenarios with the set of modified simulated concrete scenarios;
  • - Assign a second reward for the comparison result;
  • - Adjusting a policy of the learning reinforcement agent based on the second reward, whereby if the policy converges, no further calculation function and/or action is performed, and if the policy does not converge, another calculation function and/or action is performed for another modified parameterized scenario with a modification of at least one further parameterized basic building block is selected by the learning reinforcement agent until a relevant parameterized scenario is calculated.

In einer vorteilhaften Ausführungsform ist vorgesehen, dass ein Parameter ein bewegliches Objekt wie ein Kraftfahrzeug, ein unbewegliches Objekt wie ein Gebäude, eine Straßenkonfiguration wie eine Autobahn, eine Geschwindigkeit, eine Beschleunigung, ein Straßenschild, eine Ampel, einen Tunnel, einen Kreisverkehr, eine Abbiegespur, eine Beschleunigung, eine Richtung, eine Winkel, einen Radius, einen Ort, ein Verkehrsaufkommen, eine topographische Struktur wie eine Steigung, eine Uhrzeit, eine Temperatur, einen Niederschlagswert, eine Witterung und/oder eine Jahreszeit darstellt.In an advantageous embodiment it is provided that a parameter is a moving object such as a motor vehicle, an immovable object such as a building, a road configuration such as a highway, a speed, an acceleration, a street sign, a traffic light, a tunnel, a roundabout, a turning lane , an acceleration, a direction, an angle, a radius, a location, a traffic volume, a topographical structure such as a slope, a time, a temperature, a precipitation value, a weather and/or a season.

Insbesondere ist vorgesehen, dass die Sensoren als Radarsysteme, LIDAR-Systeme zur optischen Abstands- und Geschwindigkeitsmessung, bildaufnehmende 2D/3D-Kameras im sichtbaren, IR- und/oder UV-Bereich, GPS-Systeme, Beschleunigungssensoren, Geschwindigkeitssensoren, kapazitive Sensoren, induktive Sensoren, Niederschlagssensoren und/oder Temperatursensoren ausgebildet sind.In particular, it is intended that the sensors be used as radar systems, LIDAR systems for optical distance and speed measurement, image-recording 2D/3D cameras in the visible, IR and/or UV range, GPS systems, acceleration sensors, speed sensors, capacitive sensors, inductive Sensors, precipitation sensors and / or temperature sensors are formed.

Vorteilhafterweise verwendet die Softwareapplikation zur Generierung der parametrisierten Grundbausteine Algorithmen der künstlichen Intelligenz.Advantageously, the software application uses artificial intelligence algorithms to generate the parameterized basic modules.

In einer weiteren Ausführungsform ist vorgesehen, dass die Algorithmen der künstlichen Intelligenz zum Extrahieren und Klassifizieren von Parametern und Parameterwerten zur Erstellung der parametrisierten Grundbausteine aus eingegebenen Daten und Sensorsignalen der Sensoren zumindest ein neuronales Netzwerk verwenden.In a further embodiment, it is provided that the artificial intelligence algorithms use at least one neural network to extract and classify parameters and parameter values to create the parameterized basic building blocks from input data and sensor signals from the sensors.

Insbesondere ist das neuronale Netzwerk als tiefes neuronales Netzwerk, als gefaltetes neuronales Netzwerk (Convolutional Neural Network (CNN)) und/oder als rückgekoppeltes Netzwerk (engl. Recurrent Neural Network (RNN)) ausgebildet.In particular, the neural network is designed as a deep neural network, as a convolutional neural network (CNN) and/or as a feedback network (Recurrent Neural Network (RNN)).

In einer weiteren Ausführungsform ist vorgesehen, dass die Softwareapplikation zumindest einen Encoder und/oder zumindest einen Decoder verwendet.In a further embodiment it is provided that the software application uses at least one encoder and/or at least one decoder.

In einer Weiterentwicklung ist vorgesehen, dass zumindest ein Algorithmus des Lernverstärkungs-Agenten (320) als Markow-Entscheidungsprozess, Temporal Difference Learning (TD-Learning), Q-Learning, SARSA, Monte-Carlo-Simulation oder Actor-Critic ausgebildet ist.In a further development, it is provided that at least one algorithm of the learning reinforcement agent (320) is designed as a Markov decision process, temporal difference learning (TD-learning), Q-learning, SARSA, Monte Carlo simulation or actor-critic.

Gemäß einem zweiten Aspekt stellt die Erfindung ein System zur Erstellung von parametrisierten Szenarien, insbesondere für das Testen und Trainieren von Fahrassistenzsystemen und automatisierten Fahrfunktionen, bereit. Ein parametrisiertes Szenario stellt ein Verkehrsgeschehen in einer zeitlichen Sequenz dar und ist als eine Folge von Szenen beginnend mit einer Startszene und von Ereignissen beschreibbar, wobei eine Szene und ein Ereignis jeweils durch zumindest einen Grundbaustein abbildbar ist, der durch eine Auswahl von Parametern und zugehörigen Parameterwerten bestimmbar sind. Als parametrisiertes Szenario wird ein Szenario bzw. als parametrisierter Grundbaustein wird ein Grundbaustein bezeichnet, bei dem die Parameter und zugehörigen Parameterwerte frei wählbar sind, und als konkretes Szenario wird ein Szenario bzw. als konkreter Grundbaustein wird ein Grundbaustein bezeichnet, bei dem die Parameter und zugehörigen Parameterwerte festgelegt sind. Das System umfasst ein Eingabemodul, ein Lernverstärkungsmodul mit einem Lernverstärkungs-Agenten, ein Variationsmodul, ein Simulationsmodul, ein Vergleichsmodul und ein Ausgabemodul. Das Eingabemodul ist ausgebildet, eine Mehrzahl von parametrisierten Grundbausteinen von Szenen und Ereignissen für zumindest ein parametrisiertes Szenario mittels einer Softwareapplikation zu generieren und die Mehrzahl von parametrisierten Grundbausteinen an das Lernverstärkungsmodul weiterzugeben. Das Lernverstärkungsmodul ist ausgebildet, zumindest ein parametrisiertes Szenario durch Auswählen zumindest eines Grundbausteins zu erstellen und Wertebereichen für die Parameterwerte der Parameter der Grundbausteine des parametrisierten Szenarios festzulegen. Das Variationsmodul ist ausgebildet, eine Menge von konkreten Szenarien aus dem zumindest einen parametrisierten Szenario durch Bestimmen von konkreten Parameterwerte der Parameter der Grundbausteine innerhalb der festgelegten Wertebereiche zu erstellen. Das Simulationsmodul ist ausgebildet, aus der Menge von konkreten Szenarien eine Menge von simulierten konkreten Szenarien zu simulieren. Das Eingabemodul ist ausgebildet, eine Menge von realen Szenarien mittels der Softwareapplikation aus Sensorsignalen von Sensoren, die in Echtzeit an das Eingabemodul übermittelt werden und/oder aus einer Datenbank abrufbar sind, zu generieren. Das Vergleichsmodul ist ausgebildet, die Menge von realen Szenarien mit der Menge von simulierten konkreten Szenarien zu vergleichen. Das Lernverstärkungsmodul ist ausgebildet, zumindest ein relevantes parametrisiertes Szenario zu berechnen. Das Ausgabemodul ist ausgebildet, das zumindest eine relevante parametrisierte Szenario für Test- und Trainingszwecke auszugeben.According to a second aspect, the invention provides a system for creating parameterized scenarios, in particular for testing and training driving assistance systems and automated driving functions. A parameterized scenario represents a traffic event in a temporal sequence and can be described as a sequence of scenes starting with a starting scene and events, whereby a scene and an event can each be represented by at least one basic module, which is determined by a selection of parameters and associated parameter values are determinable. A parameterized scenario is a scenario or a parameterized basic building block is a basic building block in which the parameters and associated parameter values are freely selectable, and a concrete scenario is a scenario or a concrete basic building block is a basic building block in which the parameters and associated Parameter values are set. The system includes an input module, a learning reinforcement module with a learning reinforcement agent, a variation module, a simulation module, a comparison module and an output module. The input module is designed to generate a plurality of parameterized basic building blocks of scenes and events for at least one parameterized scenario using a software application and to pass on the plurality of parameterized basic building blocks to the learning reinforcement module. The learning reinforcement module is designed to create at least one parameterized scenario by selecting at least one basic building block and to specify value ranges for the parameter values of the parameters of the basic building blocks of the parameterized scenario. The variation module is designed to create a set of concrete scenarios from the at least one parameterized scenario by determining concrete parameter values of the parameters of the basic building blocks within the specified value ranges. The simulation module is designed to simulate a set of simulated concrete scenarios from the set of concrete scenarios. The input module is designed using a set of real-world scenarios to generate the software application from sensor signals from sensors that are transmitted to the input module in real time and/or can be retrieved from a database. The comparison module is designed to compare the set of real scenarios with the set of simulated concrete scenarios. The learning reinforcement module is designed to calculate at least one relevant parameterized scenario. The output module is designed to output the at least one relevant parameterized scenario for testing and training purposes.

In einer Weiterentwicklung ist vorgesehen, dass ein Parameter ein bewegliches Objekt wie ein Kraftfahrzeug, ein unbewegliches Objekt wie ein Gebäude, eine Straßenkonfiguration wie eine Autobahn, eine Geschwindigkeit, eine Beschleunigung, ein Straßenschild, eine Ampel, einen Tunnel, einen Kreisverkehr, eine Abbiegespur, eine Beschleunigung, eine Richtung, eine Winkel, einen Radius, einen Ort, ein Verkehrsaufkommen, eine topographische Struktur wie eine Steigung, eine Uhrzeit, eine Temperatur, einen Niederschlagswert, eine Witterung und/oder eine Jahreszeit darstellt.In a further development, a parameter is provided for a moving object such as a motor vehicle, an immovable object such as a building, a road configuration such as a highway, a speed, an acceleration, a street sign, a traffic light, a tunnel, a roundabout, a turning lane, represents an acceleration, a direction, an angle, a radius, a location, a traffic volume, a topographical structure such as a slope, a time, a temperature, a precipitation value, a weather and/or a season.

In einer weiteren Ausführungsform ist vorgesehen, dass die Sensoren als Radarsysteme, LIDAR-Systeme zur optischen Abstands- und Geschwindigkeitsmessung, bildaufnehmende 2D/3D-Kameras im sichtbaren Bereich, im IR- und/oder UV-Bereich, GPS-Systeme, Beschleunigungssensoren, Geschwindigkeitssensoren, kapazitive Sensoren, induktive Sensoren, Niederschlagssensoren und/oder Temperatursensoren ausgebildet sind.In a further embodiment it is provided that the sensors are radar systems, LIDAR systems for optical distance and speed measurement, image-recording 2D/3D cameras in the visible range, in the IR and/or UV range, GPS systems, acceleration sensors, speed sensors , capacitive sensors, inductive sensors, precipitation sensors and / or temperature sensors are formed.

In einer vorteilhaften Ausführungsform ist vorgesehen, dass die Softwareapplikation Algorithmen der künstlichen Intelligenz zum Extrahieren und Klassifizieren von Parametern und Parameterwerten aus eingegebenen Daten und Sensorsignalen der Sensoren für die Generierung der parametrisierten Grundbausteine verwendet.In an advantageous embodiment, it is provided that the software application uses artificial intelligence algorithms to extract and classify parameters and parameter values from input data and sensor signals from the sensors for generating the parameterized basic blocks.

Vorteilhafterweise ist zumindest ein Algorithmus des Lernverstärkungs-Agenten als Markow-Entscheidungsprozess, Temporal Difference Learning (TD-Learning), Q-Learning, SARSA, Monte-Carlo-Simulation oder Actor-Critic ausgebildet.Advantageously, at least one algorithm of the learning reinforcement agent is designed as a Markov decision process, temporal difference learning (TD-learning), Q-learning, SARSA, Monte Carlo simulation or actor-critic.

Gemäß einem dritten Aspekt stellt die Erfindung ein Computerprogrammprodukt bereit, das einen ausführbaren Programmcode umfasst, der derart konfiguriert ist, dass er bei seiner Ausführung das Verfahren gemäß dem ersten Aspekt ausführt.According to a third aspect, the invention provides a computer program product comprising executable program code configured to, when executed, carry out the method according to the first aspect.

Nachfolgend wird die Erfindung anhand von in der Zeichnung dargestellten Ausführungsbeispielen näher erläutert.The invention is explained in more detail below using exemplary embodiments shown in the drawing.

Dabei zeigt:

  • 1 ein Blockdiagramm zur Erläuterung eines Ausführungsbeispiels eines erfindungsgemäßen Systems;
  • 2 eine schematische Darstellung eines Graphen;
  • 3 eine schematische Darstellung einer zeitlichen Sequenz von Grundbausteinen von Szenen und Ereignissen eines Szenarios;
  • 4 ein Flussdiagramm zur Erläuterung der einzelnen Verfahrensschritte eines erfindungsgemäßen Verfahrens;
  • 5 ein Blockdiagramm eines Computerprogrammprodukt gemäß einer Ausführungsform des dritten Aspekts der Erfindung.
This shows:
  • 1 a block diagram to explain an exemplary embodiment of a system according to the invention;
  • 2 a schematic representation of a graph;
  • 3 a schematic representation of a temporal sequence of basic building blocks of scenes and events of a scenario;
  • 4 a flowchart to explain the individual method steps of a method according to the invention;
  • 5 a block diagram of a computer program product according to an embodiment of the third aspect of the invention.

Zusätzliche Kennzeichen, Aspekte und Vorteile der Erfindung oder ihrer Ausführungsbeispiele werden in der nachfolgenden Beschreibung in Verbindung mit den Ansprüchen erläutert.Additional features, aspects and advantages of the invention or its embodiments are explained in the following description in conjunction with the claims.

Als Szenario wird im Rahmen der Erfindung ein Verkehrsgeschehen in einer zeitlichen Sequenz bezeichnet. Ein Beispiel für ein Szenario ist das Befahren einer Autobahnbrücke, das Abbiegen auf einer Abbiegespur, das Durchfahren eines Tunnels, das Einbiegen in einen Kreisverkehr oder das Halten vor einem Fußgängerübergang. Darüber hinaus können spezifische Sichtverhältnisse beispielsweise aufgrund der Dämmerung oder einer hohen Sonnenlichteinstrahlung sowie Umweltbedingungen wie das Wetter und die Jahreszeit, das Verkehrsaufkommen sowie bestimmte geographische topographische Verhältnisse ein Szenario beeinflussen. Beispielsweise kann ein Überholvorgang als ein Szenario beschrieben werden, bei dem ein erstes Fahrzeug sich zunächst hinter einem anderen Fahrzeug befindet, dann einen Spurwechsel auf die andere Fahrbahn durchführt und die Geschwindigkeit erhöht, um das andere Fahrzeug zu überholen. Zudem spielen die Jahreszeit und die Wetterverhältnisse eine Rolle, da bei Starkregen und Glätte die Straßenverhältnisse anders sind als an einem sonnigen Sommertag.In the context of the invention, a scenario is a traffic event in a temporal sequence. An example of a scenario is driving on a highway bridge, turning in a turning lane, driving through a tunnel, turning into a roundabout or stopping in front of a pedestrian crossing. In addition, specific visibility conditions, for example due to twilight or high levels of sunlight, as well as environmental conditions such as the weather and season, traffic volume and certain geographical topographical conditions can influence a scenario. For example, an overtaking operation can be described as a scenario in which a first vehicle is initially behind another vehicle, then changes lanes to the other lane and increases speed in order to overtake the other vehicle. The season and weather conditions also play a role, as road conditions are different in heavy rain and slippery conditions than on a sunny summer day.

Für das Training von Fahrfunktionen und automatisierten Fahrfunktionen werden daher zunehmend simulierte Verkehrsszenarien verwendet, die durch Programmierung erstellt werden. Als ein parametrisiertes Szenario wird im Rahmen der Erfindung ein Szenario bezeichnet, das insbesondere in einem maschinenlesbaren Code geschrieben ist. Ein parametrisiertes Szenario SZp kann durch verschiedene Parameter P1, P2, ..., Pn aus einer Menge von möglichen Parametern Pi und zugehörigen Parameterwerten PV1, PV2, ...,PVn aus einer Menge von möglichen Parameterwerten PVi definiert werden. Die Parameterwerte PVi legen den Wertebereich eines Parameters Pi fest. Die Parameter Pi umfassen beispielsweise ein bewegliches Objekt wie ein Kraftfahrzeug, ein unbewegliches Objekt wie ein Gebäude, eine Straßenkonfiguration wie eine Autobahn, eine Geschwindigkeit, ein Straßenschild, eine Ampel, einen Tunnel, einen Kreisverkehr, eine Abbiegespur, eine Beschleunigung, eine Richtung, einen Winkel, einen Radius, einen Ort, ein Verkehrsaufkommen, eine topographische Struktur wie eine Steigung, eine Uhrzeit, eine Temperatur, einen Niederschlagswert, eine Witterung, eine Jahreszeit. Als Parameter Pi werden somit im Rahmen der Erfindung Eigenschaften und Merkmale eines Szenarios bezeichnet.Simulated traffic scenarios that are created through programming are therefore increasingly being used to train driving functions and automated driving functions. In the context of the invention, a parameterized scenario refers to a scenario that is written in particular in a machine-readable code. A parameterized scenario SZp can be defined by various parameters P 1 , P 2 , ..., P n from a set of possible parameters P i and associated parameter values PV 1 , PV 2 , ..., PV n from a set of possible parameter values PV i can be defined. The parameter values PV i determine the value range rich of a parameter P i . The parameters P i include, for example, a moving object such as a motor vehicle, an immovable object such as a building, a road configuration such as a highway, a speed, a street sign, a traffic light, a tunnel, a roundabout, a turning lane, an acceleration, a direction, an angle, a radius, a location, a traffic volume, a topographical structure such as a slope, a time, a temperature, a precipitation value, a weather condition, a season. Within the scope of the invention, parameters P i are therefore referred to as properties and features of a scenario.

Im Rahmen der vorliegenden Erfindung wird zwischen einem konkreten Szenario SZc und einem parametrisierten Szenario SZp unterschieden. Als ein konkretes Szenario SZc wird ein Szenario SZ bezeichnet, bei dem die Parameter Pi und die zugehörigen Parameterwerte PVi bzw. Wertebereiche der Parameterwerte PVi festgelegt sind. Als ein parametrisiertes Szenario SZp wird im Rahmen dieser Erfindung ein Szenario definiert, bei dem sowohl die Parameter Pi als auch die zugehörigen Parameterwerte PVi nicht alle festgelegt sind. Bei beiden Szenarien, dem konkreten Szenario SZc als auch dem parametrisierten Szenario SZp, handelt es sich jeweils um Szenarien, die insbesondere in einem maschinenlesbaren Code geschrieben sind. Bei einem simulierten konkreten Szenario SZsc handelt es sich um eine Sammlung von simulierten Messwerten, die simulierte konkrete Trajektorien und Signale eines sich bewegenden Objekts, insbesondere eines Kraftfahrzeugs, widerspiegeln. Im Rahmen der Erfindung werden diese simulierten konkreten Trajektorien mit realen Trajektorien verglichen, um durch diesen Vergleich festzustellen, ob die simulierten konkreten Trajektorien in der Lage sind, reale Trajektorien abzubilden. Erfindungsgemäß wird für den Vergleich zwischen den simulierten konkreten Trajektorien mit den realen Trajektorien ein Lernverstärkungs-Agent eingesetzt.In the context of the present invention, a distinction is made between a concrete scenario SZc and a parameterized scenario SZp. A scenario SZ in which the parameters P i and the associated parameter values PV i or value ranges of the parameter values PV i are defined is referred to as a concrete scenario SZc. In the context of this invention, a parameterized scenario SZp is defined as a scenario in which both the parameters P i and the associated parameter values PV i are not all fixed. Both scenarios, the concrete scenario SZc and the parameterized scenario SZp, are scenarios that are written in particular in machine-readable code. A simulated concrete scenario SZsc is a collection of simulated measured values that reflect simulated concrete trajectories and signals of a moving object, in particular a motor vehicle. Within the scope of the invention, these simulated concrete trajectories are compared with real trajectories in order to use this comparison to determine whether the simulated concrete trajectories are able to represent real trajectories. According to the invention, a learning reinforcement agent is used for the comparison between the simulated concrete trajectories with the real trajectories.

Durch die Kombination von verschiedenen Parametern Pi und den zugehörigen Parameterwerten PVi kann somit eine Menge an simulierten konkreten Szenarien SZsci erstellt werden, die beispielsweise für das Testen und Trainieren zumindest eines Fahrassistenzsystems und/oder zumindest einer automatisierten Fahrfunktion verwendet werden können. Das Testen und Trainieren von Fahrassistenzsystemen und automatisierten Fahrfunktionen kann wiederum mittels Simulationstechniken erfolgen. Allerdings ist ein solcher Katalog für die Praxis nur bedingt geeignet, da zwar eine große Datenmenge entsteht, aber die Relevanz der einzelnen simulierten konkreten Szenarien SZsc insbesondere zum Testen und Trainieren von Fahrassistenzsystemen nicht unmittelbar ersichtlich ist. Daher ist es erforderlich, durch eine geeignete Auswahl diejenigen relevanten parametrisierten Szenarien SZpi festzulegen, die eine möglichst hohe Anzahl von im Straßenverkehr real auftretenden Szenarien abdecken. Diese Anzahl von Verkehrssituationen wird auch als „Operational Design Domain“ bezeichnet. Fahrassistenzsysteme und automatisierte Fahrfunktionen müssen in der Lage sein, diese bestimmte Anzahl von Verkehrssituationen zu beherrschen.By combining different parameters P i and the associated parameter values PV i , a set of simulated concrete scenarios SZsc i can be created, which can be used, for example, for testing and training at least one driving assistance system and/or at least one automated driving function. The testing and training of driving assistance systems and automated driving functions can in turn be done using simulation techniques. However, such a catalog is only suitable to a limited extent in practice, since although a large amount of data is created, the relevance of the individual simulated concrete scenarios SZsc, in particular for testing and training driving assistance systems, is not immediately obvious. It is therefore necessary to use a suitable selection to determine those relevant parameterized scenarios SZp i that cover the highest possible number of scenarios that actually occur in road traffic. This number of traffic situations is also referred to as the “Operational Design Domain”. Driving assistance systems and automated driving functions must be able to handle this specific number of traffic situations.

Hierfür stellt die Erfindung ein System 100 zur Erstellung von parametrisierten Szenarien SZp bereit, die insbesondere für das Testen und das Trainieren von Fahrassistenzsystemen und automatisierten Fahrfunktionen eingesetzt werden können. Das erfindungsgemäße System 100 beruht auf Methoden des verstärkenden Lernens (engl. reinforcement learning) und ist in der 1 schematisch dargestellt. Das System 100 umfasst ein Eingabemodul 200, ein Lernverstärkungsmodul 300 mit einem Lernverstärkungs-Agenten (LV-Agenten) 320, ein Variationsmodul 400, ein Simulationsmodul 420, ein Vergleichsmodul 440 und ein Ausgabemodul 450.For this purpose, the invention provides a system 100 for creating parameterized scenarios SZp, which can be used in particular for testing and training driving assistance systems and automated driving functions. The system 100 according to the invention is based on methods of reinforcement learning and is in the 1 shown schematically. The system 100 includes an input module 200, a learning reinforcement module 300 with a learning reinforcement agent (LV agent) 320, a variation module 400, a simulation module 420, a comparison module 440 and an output module 450.

Das Eingabemodul 200, das Lernverstärkungsmodul 300, das Variationsmodul 400, das Simulationsmodul 420, das Vergleichsmodul 440 und das Ausgabemodul 450 können jeweils mit einem Prozessor und/oder einer Speichereinheit versehen sein.The input module 200, the learning reinforcement module 300, the variation module 400, the simulation module 420, the comparison module 440 and the output module 450 can each be provided with a processor and/or a memory unit.

Unter einem „Prozessor“ kann im Zusammenhang mit der Erfindung beispielsweise eine Maschine oder eine elektronische Schaltung verstanden werden. Bei einem Prozessor kann es sich insbesondere um einen Hauptprozessor (engl. Central Processing Unit, CPU), einen Mikroprozessor oder einen Mikrocontroller, beispielsweise eine anwendungsspezifische integrierte Schaltung oder einen digitalen Signalprozessor, möglicherweise in Kombination mit einer Speichereinheit zum Speichern von Programmbefehlen, etc. handeln. Auch kann unter einem Prozessor ein virtualisierter Prozessor, eine virtuelle Maschine oder eine Soft-CPU verstanden werden. Es kann sich beispielsweise auch um einen programmierbaren Prozessor handeln, der mit Konfigurationsschritten zur Ausführung des genannten erfindungsgemäßen Verfahrens ausgerüstet wird oder mit Konfigurationsschritten derart konfiguriert ist, dass der programmierbare Prozessor die erfindungsgemäßen Merkmale des Verfahrens, der Entität, der Module, oder anderer Aspekte und/oder Teilaspekte der Erfindung realisiert. Insbesondere kann der Prozessor hochparallele Recheneinheiten und leistungsfähige Grafikmodule enthalten.In connection with the invention, a “processor” can be understood to mean, for example, a machine or an electronic circuit. A processor can in particular be a main processor (Central Processing Unit, CPU), a microprocessor or a microcontroller, for example an application-specific integrated circuit or a digital signal processor, possibly in combination with a memory unit for storing program instructions, etc . A processor can also be understood as a virtualized processor, a virtual machine or a soft CPU. For example, it can also be a programmable processor that is equipped with configuration steps for carrying out the said method according to the invention or is configured with configuration steps in such a way that the programmable processor has the features of the method, the entity, the modules, or other aspects and/or other aspects according to the invention. or partial aspects of the invention are realized. In particular, the processor can contain highly parallel computing units and powerful graphics modules.

Unter einer „Speichereinheit“ oder „Speichermodul“ und dergleichen kann im Zusammenhang mit der Erfindung beispielsweise ein flüchtiger Speicher in Form eines Arbeitsspeichers (engl. Random-Access Memory (RAM)) oder ein dauerhafter Speicher wie eine Festplatte oder ein Datenträger oder z. B. ein wechselbares Speichermodul verstanden werden. Es kann sich bei dem Speichermodul aber auch um eine cloudbasierte Speicherlösung handeln.In connection with the invention, a “memory unit” or “memory module” and the like can, for example, mean a volatile memory in the form of a random access memory (RAM) or permanent storage such as a hard drive or data carrier or e.g. B. a replaceable memory module can be understood. The storage module can also be a cloud-based storage solution.

Unter einem „Modul“ kann im Zusammenhang mit der Erfindung beispielsweise ein Prozessor und/oder eine Speichereinheit zum Speichern von Programmbefehlen verstanden werden. Beispielsweise ist der Prozessor speziell dazu eingerichtet, die Programmbefehle derart auszuführen, damit der Prozessor und/oder die Steuereinheit Funktionen ausführt, um das erfindungsgemäße Verfahren oder einen Schritt des erfindungsgemäßen Verfahrens zu implementieren oder realisieren.In connection with the invention, a “module” can be understood to mean, for example, a processor and/or a memory unit for storing program instructions. For example, the processor is specifically set up to execute the program instructions in such a way that the processor and/or the control unit executes functions in order to implement or realize the method according to the invention or a step of the method according to the invention.

Das Eingabemodul 200 kann in einem Computer, einem Tablet, einem Smartphone, etc. integriert sein und weist eine Benutzerschnittstelle 220 zur Eingabe von Daten wie Bildern, Graphiken, Diagrammen, Zeitreihen, etc. auf.The input module 200 can be integrated into a computer, a tablet, a smartphone, etc. and has a user interface 220 for inputting data such as images, graphics, diagrams, time series, etc.

Zudem ist das Eingabemodul 200 mit Sensoren 500 verbunden, die Daten von Verkehrsteilnehmern wie insbesondere Kraftfahrzeugen sowie weiteren Objekten und einer Verkehrsumgebung erfassen und an das Eingabemodul 200 übermitteln. Die Sensoren 500 können insbesondere als Radarsysteme, LIDAR-Systeme zur optischen Abstands- und Geschwindigkeitsmessung, bildaufnehmende 2D/3D-Kameras im sichtbaren, IR- und/oder UV-Bereich, und/oder GPS-Systeme ausgebildet sein. Des Weiteren können Beschleunigungssensoren, Geschwindigkeitssensoren, kapazitive Sensoren, induktive Sensoren, Niederschlagssensoren und/oder Temperatursensoren, etc. vorgesehen sein.In addition, the input module 200 is connected to sensors 500, which record data from road users, such as motor vehicles in particular, as well as other objects and a traffic environment and transmit it to the input module 200. The sensors 500 can in particular be designed as radar systems, LIDAR systems for optical distance and speed measurement, image-recording 2D/3D cameras in the visible, IR and/or UV range, and/or GPS systems. Furthermore, acceleration sensors, speed sensors, capacitive sensors, inductive sensors, precipitation sensors and/or temperature sensors, etc. can be provided.

Des Weiteren kann das Eingabemodul 200 mit zumindest einer Datenbank 520 verbunden sein. In der Datenbank 520 sind insbesondere historische Daten in Form von Bildern, Graphiken, Zeitreihen, Kenngrößen, etc. gespeichert. So können beispielsweise Zielgrößen und Zielwerte in der Datenbank 520 abgelegt sein, die einen Sicherheitsstandard definieren. Unter „Datenbank“ ist sowohl ein Speicheralgorithmus als auch die Hardware in Form einer Speichereinheit zu verstehen. Insbesondere kann die Datenbank 520 als Cloud-Computing-Infrastruktur 700 ausgebildet sein.Furthermore, the input module 200 can be connected to at least one database 520. In particular, historical data in the form of images, graphics, time series, parameters, etc. are stored in the database 520. For example, target variables and target values can be stored in the database 520, which define a security standard. “Database” means both a storage algorithm and the hardware in the form of a storage unit. In particular, the database 520 can be designed as a cloud computing infrastructure 700.

Unter „Daten“ sind im Zusammenhang mit der Erfindung sowohl Rohdaten als auch bereits aufbereitete Daten zu verstehen.In connection with the invention, “data” means both raw data and data that has already been prepared.

Im Rahmen der Erfindung umfasst ein parametrisiertes Szenario SZp eine zeitliche Folge von Zeitintervallen Δt1, Δt2.,..., Δtn, in denen jeweils verschiedene Szenen und Ereignisse stattfinden. Ein parametrisiertes Szenario SZp beginnt mit einer Startszene und entwickelt sich dann durch auftretende Ereignisse weiter, aus denen im zeitlichen Verlauf neue Folgeszenen entstehen. Die Startszene wird somit durch ein oder mehrere Ereignisse verändert. Bei einem Ereignis kann es sich sowohl um eine von einem Verkehrsteilnehmer aktiv ausgelöste Reaktion wie eine Beschleunigung handeln als auch um ein Ereignis, das zyklisch wiederkehrt, wie beispielsweise die Schaltvorgänge einer Ampel. Die Startszene und die einzelnen Folgeszenen umfassen somit jeweils nur ein kleines Zeitintervall Δt bzw. eine Momentaufnahme, während ein parametrisiertes Szenario SZp eine längere Zeitspanne umfasst. In einer Graphendarstellung können die Ereignisse als Kanten und die einzelnen Szenen als Knoten eines Graphen dargestellt werden, wie dies in der 2 veranschaulicht istWithin the scope of the invention, a parameterized scenario SZp comprises a temporal sequence of time intervals Δt 1 , Δt 2 .,..., Δt n , in which different scenes and events take place. A parameterized scenario SZp begins with a starting scene and then develops further through occurring events, from which new subsequent scenes emerge over time. The starting scene is thus changed by one or more events. An event can be a reaction actively triggered by a road user, such as an acceleration, or an event that recurs cyclically, such as the switching of a traffic light. The start scene and the individual subsequent scenes therefore only cover a small time interval Δt or a snapshot, while a parameterized scenario SZp covers a longer period of time. In a graph representation, the events can be represented as edges and the individual scenes as nodes of a graph, as in the 2 is illustrated

Um die Elemente und Eigenschaften der Startszene, der Ereignisse und der nachfolgenden Szenen zu beschreiben, werden Grundbausteine GR verwendet. Ein Grundbaustein GR1 kann beispielsweise die Beschreibung einer Straßenführung mithilfe von Online-Kartenmaterial enthalten. Ein anderer Grundbaustein GR2 kann die Verkehrsinfrastruktur wie Ampeln und Verkehrsschilder darstellen und ein dritter Grundbaustein GR3 kann für temporäre Veränderungen wie Baustellen und Bahnübergänge vorgesehen sein. Ein vierter Grundbaustein GR4 kann sich auf Verkehrsteilnehmer wie Kraftfahrzeuge, LKWs, Radfahrer und Fußgänger beziehen. Ein fünfter Grundbaustein GR5 kann die Umgebungsbedingungen wie das Wetter und die Jahreszeit abbilden und ein sechster Grundbaustein GR6 beschreibt eine Telekommunikationsinfrastruktur. Dies sind Beispiele für mögliche Grundbausteine GRi. Darüber hinaus können weitere Grundbausteine GRk für Szenen vorgesehen sein, die hier nicht erwähnt sind.Basic building blocks GR are used to describe the elements and properties of the start scene, the events and the subsequent scenes. A basic building block GR 1 can, for example, contain the description of a street route using online maps. Another basic building block GR 2 can represent the traffic infrastructure such as traffic lights and traffic signs and a third basic building block GR 3 can be intended for temporary changes such as construction sites and railway crossings. A fourth basic building block, GR 4, can refer to road users such as motor vehicles, trucks, cyclists and pedestrians. A fifth basic building block GR 5 can map the environmental conditions such as the weather and the season and a sixth basic building block GR 6 describes a telecommunications infrastructure. These are examples of possible basic building blocks GR i . In addition, further basic building blocks GR k can be provided for scenes that are not mentioned here.

Bei einem Ereignis kann es sich beispielsweise um ein Überholmanöver eines Verkehrsteilnehmers, einen Beschleunigungsvorgang oder Bremsvorgang, das Umschalten einer Ampel, das Abbiegen in eine andere Straße, etc. handeln. Ein Ereignis kann aber auch Fehler in den Grundbausteinen GRi der Startszene oder von Folgeszenen, wie beispielsweise Fehler im online Kartenmaterial, umfassen. Diese Ereignisse werden gleichfalls erfindungsgemäß durch Grundbausteine GRk dargestellt.An event can, for example, be an overtaking maneuver by a road user, an acceleration or braking process, a traffic light changing, turning onto another street, etc. However, an event can also include errors in the basic building blocks GR i of the starting scene or subsequent scenes, such as errors in the online map material. These events are also represented according to the invention by basic building blocks GR k .

Erfindungsgemäß ist vorgesehen, dass die verschiedenen Grundbausteine GRi durch Parameter Pi und den zugehörigen Parameterwerten PVi parametrisiert werden. Beispielsweise kann ein Spurwechselmanöver eines anderen Verkehrsteilnehmers durch die longitudinale und laterale Geschwindigkeit während des Spurwechsels sowie die Richtung des Spurwechsels parametrisiert werden. Ein auf diese Weise parametrisierter Grundbaustein GRp kann durch Veränderung der Parameter Pi und der zugehörigen Parameterwerte PVi variiert werden und deckt somit eine Vielzahl von konkreten Grundbausteinen GRc ab. Wie bei den Szenarien wird als ein parametrisierter Grundbaustein GRp ein Grundbaustein definiert, bei dem sowohl die Parameter Pi als auch die zugehörigen Parameterwerte PVi nicht alle festgelegt sind. Als ein konkreter Grundbaustein GRc wird ein Grundbaustein bezeichnet, bei dem die Parameter Pi und die zugehörigen Parameterwerte PVi bzw. Wertebereiche der Parameterwerte PVi festgelegt sind. Beispielsweise ist bei einem konkreten Grundbaustein GRc die Geschwindigkeit eines Fahrzeugs festgelegt, während diese bei einem parametrisierten Grundbaustein GRp innerhalb eines Wertebereichs, beispielsweise zwischen 50 km/h und 150 km/h, variieren kann.According to the invention it is provided that the various basic blocks GR i are parameterized by parameters P i and the associated parameter values PV i . For example, a lane change maneuver by another road user can be determined by the longitudinal and lateral speed during the lane change as well the direction of the lane change can be parameterized. A basic building block GRp parameterized in this way can be varied by changing the parameters P i and the associated parameter values PV i and thus covers a large number of specific basic building blocks GRc. As with the scenarios, a parameterized basic building block GRp is defined as a basic building block in which both the parameters P i and the associated parameter values PV i are not all fixed. A concrete basic building block GRc is a basic building block in which the parameters P i and the associated parameter values PV i or value ranges of the parameter values PV i are defined. For example, in a specific basic building block GRc the speed of a vehicle is fixed, while in a parameterized basic building block GRp this can vary within a value range, for example between 50 km/h and 150 km/h.

Da ein parametrisiertes Szenario SZp sich in einer zeitlichen Sequenz dynamisch und unstrukturiert ändert, kann es somit als eine Folge von Grundbausteinen GRi beginnend mit der Startszene und den nachfolgenden Ereignissen beschrieben werden. Die Zusammensetzung der Grundbausteine GRi ändert sich in jedem Zeitabschnitt Δti. Wie beispielhaft in der 3 dargestellt, beginnt ein parametrisiertes Szenario SZp zu einem Zeitpunkt t0 mit einer Startszene, die mit den beiden Grundbausteinen GR1 und GR2 beschrieben werden kann. Daran schließt sich zu einem Zeitpunkt t1 ein erstes Ereignis an, das aus den Grundbausteinen GR3 und GR4 besteht. Zu einem weiteren Zeitpunkt t2 findet ein zweites Ereignis statt, das aus den Grundbausteinen GR4, GR5 und GR6 besteht. Der Grundbaustein GR4 des zweiten Ereignisses und des ersten Ereignisses sind identisch, womit verdeutlicht wird, dass ein Grundbaustein GRi sich über mehr als einen Zeitabschnitt dti erstrecken kann, wie dies beispielhaft für den Grundbaustein GR4 des ersten Ereignisses dargestellt ist. Zum nächsten Zeitpunkt t3 ereignet sich ein drittes Ereignis, das aus einem Grundbaustein GR7 besteht. Ein parametrisiertes Szenario SZp setzt sich somit mosaikartig in einer zeitlichen Sequenz aus Grundbausteinen GRp zusammen, deren Parameter Pi und zugehörige Parameterwerte PVi innerhalb vorgegebener Randbedingungen variiert werden können. Die Wahl des Wertes für den Zeitabschnitt Δt, der für Änderungen der Ereignisse vorgesehen ist, hat einen Einfluss auf die Auflösung und Genauigkeit des dargestellten Szenarios. Je kürzer der Zeitabschnitt Δt gewählt wird, umso genauer kann ein parametrisiertes Szenario SZp ein in der Realität tatsächlich stattfindendes Szenario SZ abbilden. Vorzugsweise ist die Länge der Zeitintervalle Δt1,Δt2., ...,Δtn konstant. Es kann aber auch vorgesehen sein, dass die Länge in Abhängigkeit von den jeweiligen Szenen und Ereignissen dynamisch variiert. Typischerweise liegt der Wert eines Zeitintervalls Δti im Bereich von hundert Millisekunden.Since a parameterized scenario SZp changes dynamically and unstructured in a time sequence, it can therefore be described as a sequence of basic building blocks GR i starting with the start scene and the subsequent events. The composition of the basic building blocks GR i changes in every time period Δt i . As exemplified in the 3 shown, a parameterized scenario SZp begins at a time t 0 with a start scene that can be described with the two basic blocks GR 1 and GR 2 . This is followed at a time t 1 by a first event which consists of the basic building blocks GR 3 and GR 4 . At a further time t 2, a second event takes place, which consists of the basic building blocks GR 4 , GR 5 and GR 6 . The basic building block GR 4 of the second event and the first event are identical, which makes it clear that a basic building block GR i can extend over more than one time period dt i , as is shown as an example for the basic building block GR 4 of the first event. At the next time t 3, a third event occurs, which consists of a basic building block GR 7 . A parameterized scenario SZp is thus composed in a mosaic manner in a temporal sequence of basic building blocks GR p , whose parameters P i and associated parameter values PV i can be varied within predetermined boundary conditions. The choice of the value of the time period Δt intended for changes in events has an influence on the resolution and accuracy of the presented scenario. The shorter the time period Δt is chosen, the more accurately a parameterized scenario SZp can represent a scenario SZ that actually takes place in reality. Preferably, the length of the time intervals Δt 1 , Δt 2 ., ..., Δt n is constant. However, it can also be provided that the length varies dynamically depending on the respective scenes and events. Typically, the value of a time interval Δt i is in the range of one hundred milliseconds.

Durch die Auswahl von verschiedenen parametrisierten Grundbausteinen GRpi von Szenen und Ereignissen und deren Zusammenfügen in einer zeitlichen Sequenz kann somit eine Menge von parametrisierten Szenarien SZpi erstellt werden.By selecting different parameterized basic building blocks GRp i of scenes and events and combining them in a temporal sequence, a set of parameterized scenarios SZp i can be created.

Diese parametrisierten Grundbausteine GRp1, GRp2, ..., GRpn ∈ GRpi werden von dem Eingabemodul 200 mittels einer Softwareapplikation 240 aus eingegebenen Daten generiert. Die Softwareapplikation 240 verwendet insbesondere Algorithmen der künstlichen Intelligenz zur Generierung der parametrisierten Grundbausteine GRpi, wobei es sich beispielsweise um Encoder und Decoder mit neuronalen Netzen handeln kann. Durch die Erstellung einer Menge von parametrisierten Grundbausteinen GRp1, GRp2, ..., GRpn ∈ GRpi wird ein Baukasten zur Verfügung gestellt, mit dem nun parametrisierte Szenarien SZpi entwickelt werden können. Um diejenigen parametrisierten Szenarien SZpk aus einer Vielzahl von möglichen parametrisierten Szenarien herauszufiltern, die reale Verkehrsszenarien möglichst genau und konkret abbilden, wird der Baukasten mit der Menge von parametrisierten Grundbausteinen GRp1, GRp2, ..., GRpn ∈ GRpi dem Lernverstärkungsmodul 300 übergeben.These parameterized basic blocks GRp 1 , GRp 2 , ..., GRp n ∈ GRp i are generated from input data by the input module 200 using a software application 240. The software application 240 uses in particular artificial intelligence algorithms to generate the parameterized basic building blocks GRp i , which can be, for example, encoders and decoders with neural networks. By creating a set of parameterized basic building blocks GRp 1 , GRp 2 , ..., GRp n ∈ GRp i , a construction kit is made available with which parameterized scenarios SZp i can now be developed. In order to filter out those parameterized scenarios SZp k from a large number of possible parameterized scenarios that represent real traffic scenarios as precisely and concretely as possible, the construction kit with the set of parameterized basic building blocks GRp 1 , GRp 2 , ..., GRp n ∈ GRp i is added to the learning reinforcement module 300 handed over.

Erfindungsgemäß berechnet das Lernverstärkungsmodul 300 aus dieser Menge von parametrisierten Bausteinen GRpi für die Startszene und die folgenden Ereignisse eines Szenarios nun diejenigen parametrisierten Szenarien SZpk, die für Simulationsanwendungen, insbesondere für das Testen und das Trainieren von Fahrassistenzsystemen und automatisierten Fahrfunktionen relevant sind und sinnvoll eingesetzt werden können. Mit SZpi mit dem Index „i“ werden somit im Folgenden alle möglichen aus den parametrisierten Bausteinen GRpi zusammensetzbaren parametrisierten Szenarien bezeichnet, während mit SZpk mit dem Index „k“ die von dem Lernverstärkungsmodul 300 berechneten parametrisierten Szenarien bezeichnet werden, die für Test- und Trainingsaufgaben relevant sind.According to the invention, the learning reinforcement module 300 now calculates from this set of parameterized building blocks GRp i for the starting scene and the following events of a scenario those parameterized scenarios SZp k that are relevant for simulation applications, in particular for testing and training driving assistance systems and automated driving functions, and are used sensibly can be. In the following, SZp i with the index “i” denotes all possible parameterized scenarios that can be assembled from the parameterized building blocks GRp i , while SZp k with the index “k” denotes the parameterized scenarios calculated by the learning reinforcement module 300, which are used for testing - and training tasks are relevant.

Die von dem Eingabemodul 200 generierten parametrisierten Bausteinen GRpi insbesondere in Form von maschinenlesbaren Datenformaten werden mittels Kommunikationsverbindungen wie beispielsweise ein CAN-Bus-System (Controller Area Network) an das Lernverstärkungsmodul 300 weitergeleitet. Es können aber auch drahtlose Verbindungen vorgesehen sein. Eine drahtlose Kommunikationsverbindung ist insbesondere als Mobilfunkverbindung und/oder einer Nahfeldkommunikationsverbindung wie Bluetooth®, Ethernet, NFC (near field communication) oder Wi-Fi® ausgebildet.The parameterized blocks GRp i generated by the input module 200, in particular in the form of machine-readable data formats, are forwarded to the learning reinforcement module 300 by means of communication connections such as a CAN bus system (Controller Area Network). However, wireless connections can also be provided. A wireless communication connection is designed in particular as a mobile radio connection and/or a near-field communication connection such as Bluetooth® , Ethernet, NFC (near field communication) or Wi-Fi®.

Von dem Lernverstärkungsmodul 300 werden aus diesen parametrisierten Bausteinen GRpi relevante parametrisierte Szenarien SZpk berechnet, die für weitere Anwendungen wie das Testen und Trainieren von Fahrassistenzsystemen geeignet sind. Darüber hinaus sind weitere Anwendungen wie die Erprobung eines Prüfgeländes möglich. Hierzu wählt das Lernverstärkungsmodul 300 passende parametrisierte Grundbausteine GRpi aus dem Baukasten aus und variiert die Parameter Pi und die zugehörigen Parameterwerte PVi der jeweils ausgewählten parametrisierten Grundbausteine GRpi. Die berechneten parametrisierten Szenarien SZpk werden von einem Ausgabemodul 400 ausgegeben.The learning reinforcement module 300 calculates relevant parameterized scenarios SZp k from these parameterized building blocks GRp i , which are suitable for further applications such as testing and training of driving assistance systems. In addition, other applications such as testing a test site are possible. For this purpose, the learning reinforcement module 300 selects suitable parameterized basic building blocks GRp i from the modular system and varies the parameters P i and the associated parameter values PV i of the respectively selected parameterized basic building blocks GRp i . The calculated parameterized scenarios SZp k are output by an output module 400.

Das Lernverstärkungsmodul 300 erstellt zumindest ein parametrisiertes Szenario SZpi durch Auswählen zumindest eines Grundbausteins GRpi und legt Wertebereiche (Minimum - Maximum) für die Parameterwerte PV1, PV2, ..., PVn der Parameter P1, P2, ..., Pn der Grundbausteine GRpi des parametrisierten Szenarios SZpi fest. Aus diesem parametrisierten Szenario SZpi generiert das Variationsmodul 400 eine Menge von konkreten Szenarien SZci durch Bestimmen von konkreten Parameterwerten PV1, PV2, ..., PVn der Parameter P1, P2, ..., Pn der Grundbausteine GRpi innerhalb der vom Lernverstärkungsmodul 300 festgelegten Wertebereiche. Aus dieser Menge von konkreten Szenarien SZci wird von dem Simulationsmodul 420 eine Menge von simulierten konkreten Szenarien SZsci simuliert.The learning reinforcement module 300 creates at least one parameterized scenario SZp i by selecting at least one basic building block GRp i and sets value ranges (minimum - maximum) for the parameter values PV 1 , PV 2 , ..., PV n of the parameters P 1 , P 2 , .. ., P n of the basic blocks GRp i of the parameterized scenario SZp i . From this parameterized scenario SZp i, the variation module 400 generates a set of concrete scenarios SZc i by determining concrete parameter values PV 1 , PV 2 , ..., PV n of the parameters P 1 , P 2 , ..., P n of the basic blocks GRp i within the value ranges specified by the learning reinforcement module 300. From this set of concrete scenarios SZc i, the simulation module 420 simulates a set of simulated concrete scenarios SZsc i .

Die Menge von simulierten konkreten Szenarien SZsci wird mit einer Menge von realen Szenarien SZri von dem Vergleichsmodul 440 verglichen. Dabei werden insbesondere die Fahrzeug-Trajektorien der realen Szenarien SZri mit simulierten Fahrzeug-Trajektorien der simulierten konkreten Szenarien SZsci verglichen, um festzustellen, ob die simulierten Fahrzeug-Trajektorien das reale Fahrgeschehen korrekt abbilden. Die Menge von realen Szenarien SZri wurde von dem Eingabemodul 200 insbesondere mittels der Softwareapplikation 240 aus Sensorsignalen von Sensoren 500 generiert, wobei die Sensorsignale der Sensoren 500 in Echtzeit an das Eingabemodul 200 übermittelt werden und/oder aus einer Datenbank 520 abrufbar sind. Aufgrund des Vergleichs wird von dem Lernverstärkungsmodul 300 mittels des Lernverstärkungs-Agenten 320 zumindest ein relevantes parametrisiertes Szenario SZpk berechnet, das von dem Ausgabemodul 450 für Test- und Trainingszwecke ausgegeben wird.The set of simulated concrete scenarios SZsc i is compared with a set of real scenarios SZr i by the comparison module 440. In particular, the vehicle trajectories of the real scenarios SZr i are compared with simulated vehicle trajectories of the simulated concrete scenarios SZsc i in order to determine whether the simulated vehicle trajectories correctly reflect the real driving events. The set of real scenarios SZr i was generated by the input module 200, in particular by means of the software application 240, from sensor signals from sensors 500, the sensor signals from the sensors 500 being transmitted to the input module 200 in real time and/or being retrievable from a database 520. Based on the comparison, at least one relevant parameterized scenario SZp k is calculated by the learning reinforcement module 300 using the learning reinforcement agent 320, which is output by the output module 450 for testing and training purposes.

Das verstärkende Lernen beruht darauf, dass der Lernverstärkungs-Agent (LV-Agent) 320 für einen bestimmten Zustand si ∈ S aus einer Menge verfügbarer Zustände zumindest eine Aktion ai ∈ A aus einer Menge verfügbarer Aktionen auswählt. Die Wahl der ausgewählten Aktion ai basiert auf einer Strategie bzw. Richtlinie (engl.: policy). Für die ausgewählte Aktion ai erhält der LV-Agent 320 eine Belohnung (engl.: reward) ri ∈ R.Reinforcement learning relies on the learning reinforcement agent (LV agent) 320 selecting at least one action a i ∈ A from a set of available actions for a particular state s i ∈ S. The choice of the selected action a i is based on a strategy or policy. For the selected action a i , the LV agent 320 receives a reward r i ∈ R.

Erfindungsgemäß stellt für den LV-Agenten 320 ein parametrisiertes Szenario SZpi bestehend aus einer Vielzahl von parametrisierten Grundbausteinen GRpi einen Zustand si dar. Die Strategie wird auf der Grundlage der erhaltenen Belohnungen ri von dem LV-Agenten 320 angepasst. In der Strategie ist festgelegt, welche Aktion ai ∈ A aus der Menge verfügbarer Aktionen für einen bestimmten Zustand si ∈ S aus der Menge verfügbarer Zustände ausgewählt werden soll. Hierdurch wird ein neuer Zustand si+1 erzeugt, für den der LV-Agent 320 eine neue Belohnung ri+1 erhält. Eine Strategie legt somit die Zuordnung zwischen einem Zustand si und einer Aktion ai fest, so dass die Strategie die Wahl der auszuführenden Aktion ai für einen Zustand si angibt. Das Ziel des LV-Agenten 320 besteht darin, die erzielten Belohnungen ri, ri+1, ..., rt+n zu maximieren.According to the invention, a parameterized scenario SZp i consisting of a large number of parameterized basic building blocks GRp i represents a state s i for the LV agent 320. The strategy is adapted by the LV agent 320 based on the rewards r i received. The strategy specifies which action a i ∈ A should be selected from the set of available actions for a certain state s i ∈ S from the set of available states. This creates a new state s i+1 , for which the LV agent 320 receives a new reward r i+1 . A strategy thus specifies the association between a state s i and an action a i , so that the strategy specifies the choice of the action a i to be carried out for a state s i . The goal of the LV agent 320 is to maximize the achieved rewards r i , r i+1 , ..., r t+n .

Durch eine Aktion ai wird beispielsweise eine Auswahl eines parametrisierten Grundbausteins GRpi und/oder eine Modifizierung eines Parameters Pi und/oder eine Anpassung eines Wertebereichs eines Parameterwertes PVi ∈ PV aus der Menge von Parameterwerten für zumindest einen Parameter Pi eines parametrisierten Grundbausteins GRpi des parametrisierten Szenarios SZpi, auf das sich die Aktion ai bezieht, vorgenommen. Vorzugsweise handelt es sich bei der Aktion ai um eine der Aktionen A(+), A(0) und A(-). Bei einer positiven Aktion A(+) kann es sich um eine Aktion handeln, bei der ein weiterer parametrisierter Grundbaustein GRi und/oder ein Parameter Pi hinzufügt und/oder der Wertebereich eines Parameter PVi erhöht wird, bei einer neutralen Aktion A(0) kann es sich um eine Aktion handeln, bei der die parametrisierten Grundbausteine GRi und/oder die Parameter Pi und/oder die Parameterwertebereiche PVi unverändert bleiben, während bei einer negativen Aktion A(-) ein parametrisierter Grundbaustein GRi und/oder ein Parameter Pi entfernt und/oder ein Parameterwertebereich PVi verringert werden kann.An action a i, for example, results in a selection of a parameterized basic building block GRp i and/or a modification of a parameter P i and/or an adjustment of a value range of a parameter value PV i ∈ PV from the set of parameter values for at least one parameter P i of a parameterized basic building block GRp i of the parameterized scenario SZp i to which the action a i refers. Preferably, the action a i is one of the actions A(+), A(0) and A(-). A positive action A(+) can be an action in which a further parameterized basic building block GR i and/or a parameter P i is added and/or the value range of a parameter PV i is increased, in the case of a neutral action A( 0) it can be an action in which the parameterized basic building blocks GR i and/or the parameters P i and/or the parameter value ranges PV i remain unchanged, while in the case of a negative action A(-) a parameterized basic building block GR i and/or or a parameter P i can be removed and/or a parameter value range PV i can be reduced.

In dem Zustandsmodul 350 wird durch Vergleich eine Abweichung Δ zwischen einem Zielzustand st und dem berechneten Zustand si berechnet. Dem Grad der Abweichung Δ zwischen dem berechneten Wert für den Zustand si und dem Zielwert des Zustands st wird eine Belohnung ri zugeordnet. Der Endzustand ist erreicht, wenn die berechneten Zustände si gleich oder größer als die ZielZustände st sind.In the state module 350, a deviation Δ between a target state s t and the calculated state s i is calculated by comparison. A reward r i is assigned to the degree of deviation Δ between the calculated value for state s i and the target value for state s t . The final state is reached when the calculated states s i are equal to or greater than the target states s t .

Vorzugsweise wird als Algorithmus für den LV-Agenten 320 ein Markov-Entscheidungsprozess verwendet. Es kann aber auch vorgesehen sein, einen Temporal Difference Learning (TD-Learning) Algorithmus zu verwenden. Ein LV-Agent 320 mit einem TD-Learning-Algorithmus nimmt die Anpassung der Aktionen A(+), A(0), A(-) nicht erst dann vor, wenn er die Belohnung erhält, sondern nach jeder Aktion ai auf Basis einer geschätzten erwarteten Belohnung. Des Weiteren sind auch Algorithmen wie Q-Learning, SARSA, Actor-Critic oder auch Monte-Carlo-Simulationen denkbar. Mit diesen Algorithmen ist eine dynamische Programmierung und eine Anpassung der Strategie des LV-Agenten 320 durch Iterationsverfahren möglich.Preferably, a Markov decision process is used as the algorithm for the LV agent 320. However, it can also be planned to use temporal difference learning (TD learning). Algorithm to use. An LV agent 320 with a TD learning algorithm adjusts the actions A(+), A(0), A(-) not only when it receives the reward, but after each action a i based an estimated expected reward. Furthermore, algorithms such as Q-Learning, SARSA, Actor-Critic or Monte Carlo simulations are also conceivable. With these algorithms, dynamic programming and adaptation of the strategy of the LV agent 320 is possible through iteration processes.

Darüber hinaus enthält der LV-Agent 320 Berechnungsverfahren und Algorithmen fi für mathematische Regressionsverfahren oder physikalische Modellberechnungen, die eine Korrelation zwischen ausgewählten Parametern Pi ∈ P aus einer Menge von Parametern und ausgewählten Parameterwertebereichen PVi ∈ PV aus einer Menge von Parameterwerten und den Ziel-Zuständen st beschreiben. Bei den mathematischen Funktionen ft kann es sich um statistische Verfahren wie Mittelwerte, Minimal- und Maximalwerte, Lookup Tabellen, Modelle zu Erwartungswerten, lineare Regressionsverfahren, Gauß-Prozesse, Fast Fourier Transformationen, Integral- und Differentialrechnungen und/oder Markov-Verfahren handeln. Zudem können Wahrscheinlichkeitsverfahren wie Monte Carlo-Verfahren, Temporal Difference Learning, aber auch erweiterte Kalman-Filter, radiale Basisfunktionen, Datenfelder, und/oder ein oder mehrere konvergente neuronale Netzwerke, tiefe neuronale Netzwerke, rückgekoppelte/rekurrente neuronale Netzwerke oder gefaltete Netzwerke (engl. convolutional neural network) verwendet werden. Basierend auf den Aktionen ai und den Belohnungen ri wählt der LV-Agent 320 für einen Zustand si eine oder mehrere dieser Berechnungsfunktionen fi aus.In addition, the LV agent 320 contains calculation methods and algorithms f i for mathematical regression methods or physical model calculations that establish a correlation between selected parameters P i ∈ P from a set of parameters and selected parameter value ranges PV i ∈ PV from a set of parameter values and the target -Describe states. The mathematical functions f t can be statistical methods such as mean values, minimum and maximum values, lookup tables, models for expected values, linear regression methods, Gaussian processes, fast Fourier transformations, integral and differential calculations and/or Markov methods. In addition, probability methods such as Monte Carlo methods, temporal difference learning, but also extended Kalman filters, radial basis functions, data fields, and/or one or more convergent neural networks, deep neural networks, feedback/recurrent neural networks or convolutional networks can be used. convolutional neural network) can be used. Based on the actions a i and the rewards r i , the LV agent 320 selects one or more of these calculation functions f i for a state s i .

Ein neuronales Netzwerk besteht aus Neuronen, die in mehreren Schichten angeordnet und unterschiedlich miteinander verbunden sind. Ein Neuron ist in der Lage, an seinem Eingang Informationen von außerhalb oder von einem anderen Neuron entgegenzunehmen, die Information in einer bestimmten Art zu bewerten und sie in veränderter Form am Neuronen-Ausgang an ein weiteres Neuron weiterzuleiten oder als Endergebnis auszugeben. Hidden-Neuronen sind zwischen den Input-Neuronen und Output-Neuronen angeordnet. Je nach Netzwerktyp können mehrere Schichten von Hidden-Neuronen vorhanden sein. Sie sorgen für die Weiterleitung und Verarbeitung der Informationen. Output-Neuronen liefern schließlich ein Ergebnis und geben dieses an die Außenwelt aus. Durch die Anordnung und die Verknüpfung der Neuronen entstehen verschiedene Typen von neuronalen Netzwerken wie vorwärtsgerichtete Netzwerke (engl. feedforward neural network (RNN)) ohne Rückkopplung, rückgekoppelte Netzwerke (engl. recurrent neural network) mit Rückkopplung oder gefaltete neuronale Netze (engl. convolutional neural networks (CNN)). Ein gefaltetes neuronales Netzwerk besitzt mehrere Faltungsschichten und ist für maschinelles Lernen und Anwendungen im Bereich der Mustererkennung und Bilderkennung sehr gut geeignet. Die Netzwerke lassen sich durch unbeaufsichtigtes oder überwachtes Lernen trainieren.A neural network consists of neurons arranged in several layers and connected to each other in different ways. A neuron is able to receive information from outside or from another neuron at its input, evaluate the information in a certain way and forward it in a modified form to another neuron at the neuron output or output it as the end result. Hidden neurons are located between the input neurons and output neurons. Depending on the network type, there may be multiple layers of hidden neurons. They ensure the forwarding and processing of the information. Output neurons ultimately deliver a result and output it to the outside world. The arrangement and connection of the neurons creates different types of neural networks such as feedforward neural networks (RNN) without feedback, recurrent neural networks with feedback or convolutional neural networks networks (CNN)). A convolutional neural network has multiple convolution layers and is very suitable for machine learning and applications in the field of pattern recognition and image recognition. The networks can be trained using unsupervised or supervised learning.

Im Rahmen der vorliegenden Erfindung handelt es sich bei den Zielzuständen st1, st2, ... . , stn um reale Szenarien SZri, die aus Sensorsignalen der Sensoren 500 insbesondere durch die Softwareapplikation 240 des Eingabemoduls 200 ermittelt werden. Die Sensorsignale der Sensoren 500 können in Echtzeit gemessen und an das Eingabemodul 200 übermittelt werden. Es kann aber auch vorgesehen sein, dass die Daten der Sensorsignale der Sensoren 500 in der Datenbank 520 oder der Cloud-Computing-Infrastruktur 700 gespeichert sind, auf die das Eingabemodul 200 dann zugreift. In dem Eingabemodul 200 generiert die Softwareapplikation 240 aus den Sensorsignalen reale Szenarien SZri. Diese realen Szenarien SZri stellen die Zielzustände st1, st2, ...., stn des Lernverstärkungsmoduls 300 dar.In the context of the present invention, the target states are s t1 , s t2 , .... , s tn around real scenarios SZr i , which are determined from sensor signals from the sensors 500 in particular by the software application 240 of the input module 200. The sensor signals from the sensors 500 can be measured in real time and transmitted to the input module 200. However, it can also be provided that the data of the sensor signals from the sensors 500 are stored in the database 520 or the cloud computing infrastructure 700, which the input module 200 then accesses. In the input module 200, the software application 240 generates real scenarios SZr i from the sensor signals. These real scenarios SZr i represent the target states s t1 , s t2 , ...., s tn of the learning reinforcement module 300.

Das Ziel des Lernverstärkungs-Agenten 320 besteht somit in der Auswahl von parametrisierten Bausteinen GRpi und dem Festlegen von Parametern Pi und Parameterwertebereichen PVi, so dass alle realen Szenarien SZri durch die berechneten relevanten parametrisierten Szenarien SZpk abgebildet werden können. Aus den berechneten relevanten parametrisierten Szenarien SZpk ergeben sich durch Festlegen der Parameter Pi und der zugehörigen Parameterwerte PVi konkrete Szenarien SZck, die die im realen Straßenverkehr auftretenden realen Szenarien SZri genau und umfassend wiedergeben.The goal of the learning reinforcement agent 320 is therefore to select parameterized building blocks GRp i and to set parameters P i and parameter value ranges PV i so that all real scenarios SZr i can be represented by the calculated relevant parameterized scenarios SZp k . By setting the parameters P i and the associated parameter values PV i, concrete scenarios SZc k result from the calculated relevant parameterized scenarios SZp k , which accurately and comprehensively reproduce the real scenarios SZr i that occur in real road traffic.

Für die Berechnung der relevanten parametrisierten Szenarien SZpk wählt der LV-Agent 320 somit eine Berechnungsfunktion fi und/oder eine Aktion ai basierend auf einer Richtlinie für das parametrisierte Szenario SZpi, das für den LV-Agenten 320 den Zustand si darstellt. Mittels der ausgewählten Berechnungsfunktion fi und/oder der ausgewählten Aktion ai wird zumindest eine Modifizierung eines parametrisierten Grundbausteins GRpi vorgenommen, so dass ein modelliertes parametrisiertes Szenario SZpi+1 erstellt wird, das einen neuen Zustand si+1 darstellt. Der neue Zustand si+1 wird nun mit dem Zielzustand st1 verglichen und aus dem Vergleichsergebnis ergibt sich eine Abweichung Δ, der eine Belohnung ri+1 zugeordnet wird.For the calculation of the relevant parameterized scenarios SZp k, the LV agent 320 thus selects a calculation function f i and/or an action a i based on a guideline for the parameterized scenario SZp i , which represents the state s i for the LV agent 320 . Using the selected calculation function f i and/or the selected action a i , at least one modification of a parameterized basic building block GRp i is carried out, so that a modeled parameterized scenario SZp i+1 is created, which represents a new state s i+1 . The new state s i+1 is now compared with the target state st 1 and the comparison result produces a deviation Δ, to which a reward r i+1 is assigned.

Ist die Belohnung hoch, weist dies darauf hin, dass die Richtlinie des LV-Agenten 320 erfolgreich ist und konvergiert. Es muss daher keine weitere Aktion ai+1 bzw. Berechnungsfunktion fi+1 für den berechneten Zustand si+1 durchgeführt werden, da der berechnete Zustand si+1 bereits eine ausreichende Übereinstimmung mit einem realen Szenario SZri aufweist. Das modifizierte parametrisierte Szenario SZpi+1 kann somit als ein relevantes parametrisiertes Szenario SZpk betrachtet werden.If the reward is high, it indicates that the LV agent 320 policy is successful and converges. Therefore, no further action a i+1 or calculation function f i+1 needs to be carried out for the calculated state s i+1 , since the calculated nete state s i+1 already has sufficient correspondence with a real scenario SZr i . The modified parameterized scenario SZp i+1 can therefore be viewed as a relevant parameterized scenario SZp k .

Bei einer Nicht-Konvergenz der Richtlinie wird eine weitere Berechnungsfunktion fi+1 und/oder eine weitere Aktion ai+1 für einen weiteren Zustand si+2 mit einer Modifizierung zumindest eines weiteren parametrisierten Grundbausteins GRpi+1 von dem LV-Agenten 320 ausgewählt, solange bis der Zielzustand sti erreicht ist.If the policy does not converge, a further calculation function f i+1 and/or a further action a i+1 for a further state s i+2 with a modification of at least one further parameterized basic building block GRp i+1 from the LV agent 320 selected until the target state st i is reached.

Insbesondere ist vorgesehen, dass der LV-Agent 320 auf weitere parametrisierte Grundbausteine GRpi zur Erstellung eines parametrisierten Szenarios SZpk zugreifen kann, wenn die Abweichung zwischen einem gemessenen realen Szenario SZri und einem erstellten parametrisierten Szenario SZpi zu groß wird. Zudem können weitere Verknüpfungen zwischen verschiedenen parametrisierten Grundbausteinen GRpi und/oder parametrisierten Szenarien SZpi vorgesehen sein, die jeweils Zustände si für das Agieren des LV-Agenten 320 bilden.In particular, it is provided that the LV agent 320 can access further parameterized basic blocks GRp i to create a parameterized scenario SZp k if the deviation between a measured real scenario SZr i and a created parameterized scenario SZp i becomes too large. In addition, further links can be provided between different parameterized basic building blocks GRp i and/or parameterized scenarios SZp i , each of which forms states s i for the action of the LV agent 320.

Von dem Ausgabemodul 450 werden die berechneten parametrisierten Szenarien SZpk und die zugehörigen parametrisierten Grundbausteine GRpk als Ausgabedaten 455 ausgegeben. Zudem können die ermittelten Parameter Pk und zugehörigen Parameterwertebereiche PVk ausgegeben werden. Das Ausgabemodul 450 kann ebenfalls in einem Hardwaregerät wie einem Computer, einem Tablet, einem Smartphone, etc. integriert sein, wobei insbesondere das Hardwaregerät für das Eingabemodul 200 und das Ausgabemodul 450 identisch sind.The calculated parameterized scenarios SZp k and the associated parameterized basic blocks GRp k are output from the output module 450 as output data 455. In addition, the determined parameters P k and associated parameter value ranges PV k can be output. The output module 450 can also be integrated into a hardware device such as a computer, a tablet, a smartphone, etc., in particular the hardware device for the input module 200 and the output module 450 being identical.

Des Weiteren kann vorgesehen sein, dass die Ausgabedaten 455 direkt an eine Trainingssoftware weitergeleitet wird, wobei die Trainingssoftware insbesondere dazu ausgebildet ist, Fahrassistenzsysteme und automatisierte Fahrfunktionen zu testen und zu trainieren.Furthermore, it can be provided that the output data 455 is forwarded directly to training software, the training software being designed in particular to test and train driving assistance systems and automated driving functions.

Das Eingabemodul 200 und/oder das Lernverstärkungsmodul 300 können als selbstständige Rechnereinheiten oder als cloudbasierte Lösung ausgebildet sein. Die Datenbank 520 kann auch in der Cloud-Computing-Infrastruktur 700 integriert sein.The input module 200 and/or the learning reinforcement module 300 can be designed as independent computing units or as a cloud-based solution. The database 520 can also be integrated into the cloud computing infrastructure 700.

Da häufig ein schnelles Berechnungsergebnis angestrebt wird, um Fahrassistenzsysteme und automatisierte Fahrfunktionen schnell testen und trainieren zu können, ist für die Vielzahl von Rechenoperationen in dem Lernverstärkungsmodul 300 die Rechengeschwindigkeit entscheidend. Um eine Durchführung der Rechenoperationen in Echtzeit zu ermöglichen, ist die Verwendung einer Cloud-Computing-Infrastruktur 700 vorteilhaft. Hierdurch kann eine schnelle Berechnung gewährleistet werden, da cloudbasierte Lösungen den Vorteil von hohen und damit schnellen Rechenleistungen bieten. Für die Kommunikation des Eingabemoduls 200 mit der Cloud-Computing-Infrastruktur 700 wird insbesondere eine 5G-Mobilfunkverbindung verwendet, da auf diese Weise eine Datenübermittlung in Echtzeit erfolgen kann. Diese Geschwindigkeit bei der Datenübermittlung ist sinnvoll, wenn cloudbasierte Lösungen für die Verarbeitung der Daten verwendet werden.Since a fast calculation result is often sought in order to be able to quickly test and train driving assistance systems and automated driving functions, the calculation speed is crucial for the large number of calculation operations in the learning reinforcement module 300. In order to enable the computing operations to be carried out in real time, the use of a cloud computing infrastructure 700 is advantageous. This ensures fast calculations, as cloud-based solutions offer the advantage of high and therefore fast computing performance. In particular, a 5G mobile connection is used for the communication of the input module 200 with the cloud computing infrastructure 700, since data transmission can take place in real time in this way. This speed of data transfer makes sense when cloud-based solutions are used to process the data.

5G ist der Mobilfunkstandard der fünften Generation und zeichnet sich im Vergleich zum 4G-Mobilfunkstandard durch höhere Datenraten bis zu 10 Gbit/sec, der Nutzung höherer Frequenzbereiche wie beispielsweise 2100, 2600 oder 3600 Megahertz, eine erhöhte Frequenzkapazität und damit einen erhöhten Datendurchsatz und eine Echtzeitdatenübertragung aus, da bis zu eine Million Geräte pro Quadratkilometer gleichzeitig ansprechbar sind. Die Latenzzeiten betragen wenige Millisekunden bis unter 1 ms, so dass Echtzeitübertragungen von Daten und von Berechnungsergebnissen möglich sind. Die von dem Eingabemodul 200 generierten Daten können in Echtzeit an das in der Cloud-Computing-Infrastruktur 700 integrierte Lernverstärkungsmodul 300 gesendet werden.5G is the fifth generation mobile communications standard and, compared to the 4G mobile communications standard, is characterized by higher data rates of up to 10 Gbit/sec, the use of higher frequency ranges such as 2100, 2600 or 3600 megahertz, increased frequency capacity and thus increased data throughput and real-time data transmission because up to a million devices per square kilometer can be addressed simultaneously. The latency times range from a few milliseconds to less than 1 ms, so that real-time transmission of data and calculation results is possible. The data generated by the input module 200 can be sent in real time to the learning reinforcement module 300 integrated in the cloud computing infrastructure 700.

Um die Verbindung zu der Cloud-Computing-Infrastruktur 700 mittels einer Mobilfunkverbindung zu schützen, sind insbesondere kryptographische Verschlüsselungsverfahren vorgesehen.In order to protect the connection to the cloud computing infrastructure 700 using a mobile radio connection, cryptographic encryption methods are provided in particular.

In der Cloud-Computing-Infrastruktur 700 können insbesondere die Berechnungsergebnisse in Form von Zuständen, Aktionen, Belohnungen und Strategien gespeichert werden, die dann über das Internet verfügbar sind. Das Lernverstärkungsmodul 300, das Variationsmodul 400, das Simulationsmodul 420 und das Vergleichsmodul 440 verfügen hierzu über die erforderlichen technischen Schnittstellen und Protokolle für den Zugang zu der Cloud-Computing-Infrastruktur 700 bzw. sind selbst in der Cloud-Computing-Infrastruktur 700 integriert. Hierdurch kann die Recheneffizienz gesteigert werden, da die Zugriffsmöglichkeiten und die Zugriffsgeschwindigkeiten zu bereits berechneten Zuständen, Aktionen, Belohnungen und Strategien vereinfacht ist.In particular, the calculation results can be stored in the cloud computing infrastructure 700 in the form of states, actions, rewards and strategies, which are then available via the Internet. The learning reinforcement module 300, the variation module 400, the simulation module 420 and the comparison module 440 have the necessary technical interfaces and protocols for access to the cloud computing infrastructure 700 or are themselves integrated into the cloud computing infrastructure 700. This can increase computing efficiency because the access options and access speeds to already calculated states, actions, rewards and strategies are simplified.

In 4 sind die Verfahrensschritte zur Erstellung von relevanten Szenarien für Simulationszwecke dargestellt.In 4 The procedural steps for creating relevant scenarios for simulation purposes are shown.

In einem Schritt S10 wird eine Mehrzahl von parametrisierten Grundbausteinen GRp1, GRp2, ..., GRpn von Szenen und Ereignissen für zumindest ein parametrisiertes Szenario SZpi durch ein Eingabemodul 200 generiert, wobei das Eingabemodul 200 eine Softwareapplikation 240 verwendet.In a step S10, a plurality of parameterized basic blocks GRp 1 , GRp 2 , ..., GRp n of scenes and events for at least one parameterized scenario SZp i is generated by an input module 200, the input module 200 using a software application 240.

In einem Schritt S20 wird die Mehrzahl von parametrisierten Grundbausteinen GRp1, GRp2, ..., GRpn an ein Lernverstärkungsmodul 300 weitergegeben.In a step S20, the plurality of parameterized basic blocks GRp 1 , GRp 2 , ..., GRp n are passed on to a learning reinforcement module 300.

In einem Schritt S30 wird zumindest ein parametrisiertes Szenario SZpi durch Auswählen zumindest eines Grundbausteins GRpi von dem Lernverstärkungsmodul 300 erstellt.In a step S30, at least one parameterized scenario SZp i is created by the learning reinforcement module 300 by selecting at least one basic building block GRp i .

In einem Schritt S40 werden Wertebereichen für die Parameterwerte PV1, PV2,..., PVn der Parameter P1, P2, ..., Pn der Grundbausteine GRpi des parametrisierten Szenarios SZpi festgelegt.In a step S40, value ranges for the parameter values PV 1 , PV 2 ,..., PV n of the parameters P 1 , P 2 , ..., P n of the basic blocks GRp i of the parameterized scenario SZp i are defined.

In einem Schritt S50 wird eine Menge von konkreten Szenarien SZci aus dem zumindest einen parametrisierten Szenario SZpi durch Bestimmen der konkreten Parameterwerte PV1, PV2,..., PVn der Parameter P1, P2, ..., Pn der Grundbausteine GRpi innerhalb der festgelegten Wertebereiche erstellt.In a step S50, a set of concrete scenarios SZc i is selected from the at least one parameterized scenario SZp i by determining the concrete parameter values PV 1 , PV 2 ,..., PV n of the parameters P 1 , P 2 , ..., P n of the basic building blocks GRp i created within the specified value ranges.

In einem Schritt S60 wird die Menge von konkreten Szenarien SZci in eine Menge von simulierten konkreten Szenarien SZsci transformiert.In a step S60, the set of concrete scenarios SZc i is transformed into a set of simulated concrete scenarios SZsc i .

In einem Schritt S70 wird eine Menge von realen Szenarien SZri von dem Eingabemodul 200 mittels der Softwareapplikation 240 aus Sensorsignalen von Sensoren 500, die in Echtzeit an das Eingabemodul 200 übermittelt werden und/oder aus einer Datenbank 520 abrufbar sind, generiert.In a step S70, a set of real scenarios SZr i is generated by the input module 200 using the software application 240 from sensor signals from sensors 500, which are transmitted in real time to the input module 200 and/or can be retrieved from a database 520.

In einem Schritt S80 wird die Menge von simulierten konkreten Szenarien SZsci mit der Menge von realen Szenarien SZri verglichen.In a step S80, the set of simulated concrete scenarios SZsc i is compared with the set of real scenarios SZr i .

In einem Schritt S90 wird zumindest ein relevantes parametrisiertes Szenario SZpk von dem Lernverstärkungsmodul 300 berechnet.In a step S90, at least one relevant parameterized scenario SZp k is calculated by the learning reinforcement module 300.

In einem Schritt S100 wird das zumindest eine relevante parametrisierte Szenario SZpk für Test- und Trainingszwecke ausgegeben.In a step S100, the at least one relevant parameterized scenario SZp k is output for testing and training purposes.

5 stellt schematisch ein Computerprogrammprodukt 900 dar, das einen ausführbaren Programmcode 950 umfasst, der konfiguriert ist, das Verfahren gemäß dem ersten Aspekt der vorliegenden Erfindung auszuführen. 5 schematically illustrates a computer program product 900 that includes executable program code 950 configured to execute the method according to the first aspect of the present invention.

Mit dem Verfahren und dem System 100 gemäß der vorliegenden Erfindung wird eine Strukturierung von Szenarien durch Grundbausteine für verschiedene Szenen und Ereignisse durchgeführt. Die Szenarien setzen sich somit aus Szenen zusammen, welche durch Ereignisse miteinander verknüpft sind. Die Grundbausteine werden mit Hilfe von Parametern und zugehörigen Parameterwerten parametrisiert, wobei die Wahl der Parameter aus einer Menge von verfügbaren Parametern und der Parameterwerte aus einer Menge von verfügbaren Parameterwerten innerhalb gewisser Randbedingungen frei ist. Durch einen Lernverstärkungs-Agenten werden konkrete Parameter und Parameterwerte für die parametrisierten Grundbausteine und Szenarios ausgewählt, wobei der Lernverstärkung-Agent sich an realen Szenarien orientiert. Durch sukzessive Iteration und Optimierung können aus dem Pool von möglichen parametrisierten Szenarien SZpi diejenigen relevanten parametrisierten Szenarien SZpk berechnet werden, die für Test- und Trainingsaufgaben, beispielsweise für das Testen und Trainieren von Fahrassistenzsystemen eingesetzt werden können. Die parametrisierten Grundbausteine und parametrisierten Szenarien unterscheiden sich von realen Szenarien in der Weise, dass sie für Test- und Simulationsaufgaben universeller eingesetzt werden können, da sie die typischen Merkmale und Charakteristika eines bestimmten Szenario-Typs besser verdeutlichen als ein reales Szenario, das immer auch spezifische Merkmale umfasst, die über den jeweiligen Szenario-Typ hinausgehen.With the method and the system 100 according to the present invention, scenarios are structured using basic modules for different scenes and events. The scenarios are therefore made up of scenes that are linked to each other by events. The basic blocks are parameterized with the help of parameters and associated parameter values, with the choice of the parameters from a set of available parameters and the parameter values from a set of available parameter values being free within certain boundary conditions. A learning reinforcement agent selects specific parameters and parameter values for the parameterized basic building blocks and scenarios, whereby the learning reinforcement agent is based on real scenarios. Through successive iteration and optimization, those relevant parameterized scenarios SZp k can be calculated from the pool of possible parameterized scenarios SZp i , which can be used for test and training tasks, for example for testing and training driving assistance systems. The parameterized basic building blocks and parameterized scenarios differ from real scenarios in that they can be used more universally for test and simulation tasks, as they illustrate the typical features and characteristics of a certain scenario type better than a real scenario, which is always specific includes characteristics that go beyond the respective scenario type.

Durch den Einsatz von parametrisierten Szenarien kann daher die Sicherheit von Fahrassistenzsystemen und automatisierten Fahrfunktionen erhöht werden, da alle relevanten sicherheitskritischen Fahrsituationen durch parametrisierte Szenarien abgedeckt werden können. Durch Variation der Parameter und Parameterwerte können aus den berechneten relevanten parametrisierten Szenarien SZpk eine Vielzahl von konkreten Szenarien entwickelt werden. Zudem können Ressourcen eingespart werden, da sowohl das Abfahren von Teststrecken reduziert werden kann als auch die Programmierung von einzelnen konkreten Szenarien nicht erforderlich ist, da diese aus den berechneten parametrisierten Szenarien abgeleitet werden können. Darüber hinaus wird durch die Strukturierung der Szenarien in Grundbausteine ein modulares Vorgehen bei der Berechnung von relevanten parametrisierten Szenarien ermöglicht, wodurch eine effiziente Nutzung von Rechenleistung möglich ist.By using parameterized scenarios, the safety of driving assistance systems and automated driving functions can be increased, since all relevant safety-critical driving situations can be covered by parameterized scenarios. By varying the parameters and parameter values, a large number of concrete scenarios can be developed from the calculated relevant parameterized scenarios SZp k . In addition, resources can be saved because the driving on test routes can be reduced and the programming of individual concrete scenarios is not necessary since these can be derived from the calculated parameterized scenarios. In addition, structuring the scenarios into basic modules enables a modular approach to calculating relevant parameterized scenarios, which enables efficient use of computing power.

BezugszeichenReference symbols

100100
Systemsystem
200200
EingabemodulInput module
220220
BenutzerschnittstelleUser interface
240240
SoftwareapplikationSoftware application
300300
LernverstärkungsmodulLearning reinforcement module
320320
Lernverstärkungs-AgentLearning reinforcement agent
400400
VariationsmodulVariation module
420420
SimulationsmodulSimulation module
440440
VergleichsmodulComparison module
450450
AusgabemodulOutput module
455455
AusgabedatenOutput data
500500
SensorenSensors
520520
DatenbankDatabase
700700
Cloud-Computing-InfrastrukturCloud computing infrastructure
900900
ComputerprogrammproduktComputer program product
950950
ProgrammcodeProgram code

ZITATE ENTHALTEN IN DER BESCHREIBUNGQUOTES INCLUDED IN THE DESCRIPTION

Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of documents listed by the applicant was generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.

Zitierte PatentliteraturCited patent literature

  • WO 2020/083996 A1 [0005]WO 2020/083996 A1 [0005]
  • US 11137763 B2 [0006]US 11137763 B2 [0006]
  • EP 3066529 B1 [0007]EP 3066529 B1 [0007]
  • DE 102013003944 A1 [0008]DE 102013003944 A1 [0008]
  • DE 102007053500 A1 [0009]DE 102007053500 A1 [0009]
  • DE 102006044086 B4 [0010]DE 102006044086 B4 [0010]

Claims (15)

Verfahren zur Erstellung von parametrisierten Szenarien (SZp1, SZp2, ..., SZpn), insbesondere für das Testen und Trainieren von Fahrassistenzsystemen und automatisierten Fahrfunktionen, wobei ein parametrisiertes Szenario (SZpi) ein Verkehrsgeschehen in einer zeitlichen Sequenz darstellt und als eine Folge von Szenen beginnend mit einer Startszene und von Ereignissen beschreibbar ist, wobei eine Szene und ein Ereignis jeweils durch zumindest einen Grundbaustein (GRi) abgebildet werden, der durch eine Auswahl von Parametern (P1, P2, ..., Pn) und zugehörigen Parameterwerten (PV1, PV2, ..., PVn) definiert ist, und wobei als parametrisiertes Szenario (SZpi) ein Szenario bzw. als parametrisierter Grundbaustein (GRpi) ein Grundbaustein bezeichnet wird, bei dem die Parameter (P1,P2, ...,Pn) und zugehörigen Parameterwerte (PV1, PV2, ..., PVn) frei wählbar sind, und als konkretes Szenario (SZci) ein Szenario bzw. als konkreter Grundbaustein (GRci) ein Grundbaustein bezeichnet wird, bei dem die Parameter (P1, P2, ... , Pn) und zugehörigen Parameterwerte (PV1, PV2, ...,PVn) festgelegt sind, umfassend: - Generieren (S10) einer Mehrzahl von parametrisierten Grundbausteinen (GRp1, GRp2, ..., GRpn) von Szenen und Ereignissen für zumindest ein parametrisiertes Szenario (SZpi) durch ein Eingabemodul (200), wobei das Eingabemodul (200) eine Softwareapplikation (240) verwendet; - Weitergeben (S 20) der Mehrzahl von parametrisierten Grundbausteinen (GRp1, GRp2, ..., GRpn) an ein Lernverstärkungsmodul (300) mit einem Lernverstärkungs-Agenten (320); - Erstellen (S30) zumindest eines parametrisierten Szenarios (SZpi) durch Auswählen zumindest eines Grundbausteins (GRpi) von dem Lernverstärkungsmodul (300); - Festlegen (S40) von Wertebereichen für die Parameterwerte (PV1, PV2, ..., PVn) der Parameter (P1, P2, ..., Pn) der Grundbausteine (GRpi) des parametrisierten Szenarios (SZpi); - Erstellen (S50) einer Menge von konkreten Szenarien (SZci) aus dem zumindest einen parametrisierten Szenario (SZpi) durch Bestimmen von konkreten Parameterwerten (PV1,PV2, ..., PVn) der Parameter (P1,P2, ...,Pn) der Grundbausteine (GRpi) innerhalb der festgelegten Wertebereiche; - Simulieren (S60) einer Menge von simulierten konkreten Szenarien (SZsci) aus der Menge von konkreten Szenarien (SZci); - Generieren (S70) einer Menge von realen Szenarien (SZri) von dem Eingabemodul (200) mittels der Softwareapplikation (240) aus Sensorsignalen von Sensoren (500), wobei die Sensorsignale der Sensoren (500) in Echtzeit an das Eingabemodul (200) übermittelt werden und/oder aus einer Datenbank (520) abrufbar sind; - Vergleichen (S80) der Menge von realen Szenarien (SZri) mit der Menge von simulierten konkreten Szenarien (SZsci); - Berechnen (S90) von zumindest einem relevanten parametrisierten Szenario (SZpk) von dem Lernverstärkungsmodul (300); - Ausgeben (S100) des zumindest einen relevanten parametrisierten Szenarios (SZpk) für Test- und Trainingszwecke.Method for creating parameterized scenarios (SZp 1 , SZp 2 , ..., SZp n ), in particular for testing and training driving assistance systems and automated driving functions, wherein a parameterized scenario (SZp i ) represents a traffic event in a temporal sequence and as a sequence of scenes starting with a start scene and events can be described, with a scene and an event each being represented by at least one basic module (GR i ), which is determined by a selection of parameters (P 1 , P 2 , ..., P n ) and associated parameter values (PV 1 , PV 2 , ..., PV n ), and where a parameterized scenario (SZp i ) is a scenario or a parameterized basic building block (GRp i ) is a basic building block in which the Parameters (P 1 , P 2 , ..., P n ) and associated parameter values (PV 1 , PV 2 , ..., PV n ) are freely selectable, and as a concrete scenario (SZc i ) a scenario or as a concrete one Basic module (GRc i ) is a basic module in which the parameters (P 1 , P 2 , ... , P n ) and associated parameter values (PV 1 , PV 2 , ..., PV n ) are defined, comprising: - Generating (S10) a plurality of parameterized basic blocks (GRp 1 , GRp 2 , ..., GRp n ) of scenes and events for at least one parameterized scenario (SZp i ) by an input module (200), the input module (200) uses a software application (240); - Passing on (S 20) the plurality of parameterized basic blocks (GRp 1 , GRp 2 , ..., GRp n ) to a learning reinforcement module (300) with a learning reinforcement agent (320); - Creating (S30) at least one parameterized scenario (SZp i ) by selecting at least one basic building block (GRp i ) from the learning reinforcement module (300); - Determination (S40) of value ranges for the parameter values (PV 1 , PV 2 , ..., PV n ) of the parameters (P 1 , P 2 , ..., P n ) of the basic blocks (GRp i ) of the parameterized scenario ( SZp i ); - Creating (S50) a set of concrete scenarios (SZc i ) from the at least one parameterized scenario (SZp i ) by determining concrete parameter values (PV 1 , PV 2 , ..., PV n ) of the parameters (P 1 , P 2 , ...,P n ) of the basic building blocks (GRp i ) within the specified value ranges; - Simulating (S60) a set of simulated concrete scenarios (SZsc i ) from the set of concrete scenarios (SZc i ); - Generating (S70) a set of real scenarios (SZr i ) from the input module (200) using the software application (240) from sensor signals from sensors (500), the sensor signals from the sensors (500) being sent to the input module (200) in real time. are transmitted and/or can be accessed from a database (520); - Comparing (S80) the set of real scenarios (SZr i ) with the set of simulated concrete scenarios (SZsc i ); - Calculating (S90) at least one relevant parameterized scenario (SZp k ) from the learning reinforcement module (300); - Outputting (S100) the at least one relevant parameterized scenario (SZp k ) for testing and training purposes. Verfahren nach Anspruch 1, wobei das Berechnen des zumindest einen relevanten parametrisierten Szenarios (SZpk) die folgenden Verfahrensschritte umfasst: - Zuordnen einer ersten Belohnung (ri) für das Vergleichsergebnis zwischen der Menge von realen Szenarien (SZri) und der Menge von simulierten konkreten Szenarien (SZsci); - Auswählen einer Berechnungsfunktion (fi) und/oder einer Aktion (ai) von dem Lernverstärkungs-Agenten (320) basierend auf der Belohnung (ri); - Erstellen eines modifizierten parametrisierte Szenarios (SZci+1) mittels der ausgewählten Berechnungsfunktion (fi) und/oder Aktion (ai) durch Modifizierung zumindest eines parametrisierten Grundbausteins (GRpi+1); - Generieren einer Menge von modifizierten simulierten konkreten Szenarien (SZsci+1) aus dem zumindest einen modifizierten parametrisierten Szenario (SZpi+1); - Vergleichen der Menge von realen Szenarien (SZri) mit der Menge von modifizierten simulierten konkreten Szenarien (SZsci+1); - Zuordnen einer zweiten Belohnung (ri+1) für das Vergleichsergebnis; - Anpassen einer Richtlinie des Lernverstärkungs-Agenten (320) basierend auf der zweiten Belohnung (ri+1), wobei bei einer Konvergenz der Richtlinie keine weitere Berechnungsfunktion (fi+1) und/oder Aktion (ai+1) durchgeführt wird, und bei einer Nicht-Konvergenz der Richtlinie eine weitere Berechnungsfunktion (fi+1) und/oder eine weitere Aktion (ai+1) für ein weiteres modifiziertes parametrisiertes Szenarios (SZci+2) mit einer Modifizierung zumindest eines weiteren parametrisierten Grundbausteins (GRpi+2) von dem Lernverstärkungs-Agenten (320) ausgewählt wird, solange bis ein relevantes parametrisierten Szenario (SZpk) berechnet ist.Procedure according to Claim 1 , wherein calculating the at least one relevant parameterized scenario (SZp k ) includes the following method steps: - Assigning a first reward (r i ) for the comparison result between the set of real scenarios (SZr i ) and the set of simulated concrete scenarios (SZsc i ); - selecting a calculation function (fi ) and/or an action ( ai ) from the learning reinforcement agent (320) based on the reward (r i ); - Creating a modified parameterized scenario (SZc i+1 ) using the selected calculation function (fi ) and/or action (a i ) by modifying at least one parameterized basic building block (GRp i+1 ); - Generating a set of modified simulated concrete scenarios (SZsc i+1 ) from the at least one modified parameterized scenario (SZp i+1 ); - Comparing the set of real scenarios (SZr i ) with the set of modified simulated concrete scenarios (SZsc i+1 ); - assigning a second reward (r i+1 ) for the comparison result; - Adjusting a policy of the learning reinforcement agent (320) based on the second reward (r i+1 ), whereby no further calculation function (f i+1 ) and/or action (a i+1 ) is carried out when the policy converges , and in the event of non-convergence of the guideline, a further calculation function (f i+1 ) and/or a further action (a i+1 ) for a further modified parameterized scenario (SZc i+2 ) with a modification of at least one further parameterized basic building block (GRp i+2 ) is selected by the learning reinforcement agent (320) until a relevant parameterized scenario (SZp k ) is calculated. Verfahren nach Anspruch 1 oder 2, wobei ein Parameter (Pi) ein bewegliches Objekt wie ein Kraftfahrzeug, ein unbewegliches Objekt wie ein Gebäude, eine Straßenkonfiguration wie eine Autobahn, eine Geschwindigkeit, eine Beschleunigung, ein Straßenschild, eine Ampel, einen Tunnel, einen Kreisverkehr, eine Abbiegespur, eine Beschleunigung, eine Richtung, eine Winkel, einen Radius, einen Ort, ein Verkehrsaufkommen, eine topographische Struktur wie eine Steigung, eine Uhrzeit, eine Temperatur, einen Niederschlagswert, eine Witterung und/oder eine Jahreszeit darstellt.Procedure according to Claim 1 or 2 , where a parameter (P i ) is a moving object such as a motor vehicle, an immovable object such as a building, a road configuration such as a highway, a speed, an acceleration, a street sign, a traffic light, a tunnel, a roundabout, a turning lane, a Acceleration, a direction, an angle, a radius, a location, a traffic volume, a topographical structure such as a slope, a time, a temperature, a precipitation value, a weather and/or a season. Verfahren nach einem der Ansprüche 1 bis 3, wobei die Sensoren (500) als Radarsysteme, LIDAR-Systeme zur optischen Abstands- und Geschwindigkeitsmessung, bildaufnehmende 2D/3D-Kameras im sichtbaren, IR- und/oder UV-Bereich, GPS-Systeme, Beschleunigungssensoren, Geschwindigkeitssensoren, kapazitive Sensoren, induktive Sensoren, Niederschlagssensoren und/oder Temperatursensoren ausgebildet sind.Procedure according to one of the Claims 1 until 3 , whereby the sensors (500) are radar systems, LIDAR systems for optical distance and speed measurement, image-recording 2D/3D cameras in the visible, IR and/or UV range, GPS systems, acceleration sensors, speed sensors, capacitive sensors, inductive Sensors, precipitation sensors and / or temperature sensors are formed. Verfahren nach einem der Ansprüche 1 bis 4, wobei die Softwareapplikation (240) zur Generierung der parametrisierten Grundbausteine (GRpi) Algorithmen der künstlichen Intelligenz verwendet.Procedure according to one of the Claims 1 until 4 , whereby the software application (240) uses artificial intelligence algorithms to generate the parameterized basic building blocks (GRp i ). Verfahren nach Anspruch 5, wobei die Algorithmen der künstlichen Intelligenz zum Extrahieren und Klassifizieren von Parametern (Pi) und Parameterwerten (PVi) zur Erstellung der parametrisierten Grundbausteine (GRpi) aus eingegebenen Daten und Sensorsignalen der Sensoren (500) zumindest ein neuronales Netzwerk verwenden.Procedure according to Claim 5 , wherein the artificial intelligence algorithms for extracting and classifying parameters (P i ) and parameter values (PV i ) for creating the parameterized basic building blocks (GRp i ) from input data and sensor signals from the sensors (500) use at least one neural network. Verfahren nach Anspruch 6, wobei das neuronale Netzwerk als tiefes neuronales Netzwerk, als gefaltetes neuronales Netzwerk (Convolutional Neural Network (CNN)) und/oder als rückgekoppeltes Netzwerk (engl. Recurrent Neural Network (RNN)) ausgebildet ist.Procedure according to Claim 6 , whereby the neural network is designed as a deep neural network, as a convolutional neural network (CNN) and/or as a feedback network (Recurrent Neural Network (RNN)). Verfahren nach einem der Ansprüche 5 bis 7, wobei die Softwareapplikation (240) zumindest einen Encoder und/oder zumindest einen Decoder verwendet.Procedure according to one of the Claims 5 until 7 , wherein the software application (240) uses at least one encoder and / or at least one decoder. Verfahren nach einem der Ansprüche 1 bis 8, wobei zumindest ein Algorithmus des Lernverstärkungs-Agenten (320) als Markow-Entscheidungsprozess, Temporal Difference Learning (TD-Learning), Q-Learning, SARSA, Monte-Carlo-Simulation oder Actor-Critic ausgebildet ist.Procedure according to one of the Claims 1 until 8th , wherein at least one algorithm of the learning reinforcement agent (320) is designed as a Markov decision process, temporal difference learning (TD learning), Q-learning, SARSA, Monte Carlo simulation or actor-critic. System (100) zur Erstellung von parametrisierten Szenarien (SZp1, SZp2, ..., SZpn), insbesondere für das Testen und Trainieren von Fahrassistenzsystemen und automatisierten Fahrfunktionen, wobei ein parametrisiertes Szenario (SZpi) ein Verkehrsgeschehen in einer zeitlichen Sequenz darstellt und als eine Folge von Szenen beginnend mit einer Startszene und von Ereignissen beschreibbar ist, wobei eine Szene und ein Ereignis jeweils durch zumindest einen Grundbaustein (GRi) abbildbar ist, der durch eine Auswahl von Parametern (P1, P2, ..., Pn) und zugehörigen Parameterwerten (PV1, PV2, ..., PVn) bestimmbar sind, und wobei als parametrisiertes Szenario (SZpi) ein Szenario bzw. als parametrisierter Grundbaustein (GRpi) ein Grundbaustein bezeichnet wird, bei dem die Parameter (P1, P2, ..., Pn) und zugehörigen Parameterwerte (PV1, PV2, ..., PVn) frei wählbar sind, und als konkretes Szenario (SZci) ein Szenario bzw. als konkreter Grundbaustein (GRci) ein Grundbaustein bezeichnet wird, bei dem die Parameter (P1, P2, ..., Pn) und zugehörigen Parameterwerte (PV1, PV2, ..., PVn) festgelegt sind; umfassend ein Eingabemodul (200), ein Lernverstärkungsmodul (300) mit einem Lernverstärkungs-Agenten (320), ein Variationsmodul (400), ein Simulationsmodul (420), ein Vergleichsmodul (440) und ein Ausgabemodul (450), wobei das Eingabemodul (200) ausgebildet ist, eine Mehrzahl von parametrisierten Grundbausteinen (GRp1, GRp2, ..., GRpn) von Szenen und Ereignissen für zumindest ein parametrisiertes Szenario (SZpi) mittels einer Softwareapplikation (240) zu generieren und die Mehrzahl von parametrisierten Grundbausteinen (GRp1, GRp2, ..., GRpn) an das Lernverstärkungsmodul (300) weiterzugeben; wobei das Lernverstärkungsmodul (300) ausgebildet ist, zumindest ein parametrisierten Szenarios (SZpi) durch Auswählen zumindest eines Grundbausteins (GRpi) zu erstellen und Wertebereichen für die Parameterwerte (PV1, PV2,...,PVn) der Parameter (P1, P2, ..., Pn) der Grundbausteine (GRpi) des parametrisierten Szenarios (SZpi) legen; wobei das Variationsmodul (400) ausgebildet ist, eine Menge von konkreten Szenarien (SZci) aus dem zumindest einen parametrisierten Szenario (SZpi) durch Bestimmen von konkreten Parameterwerten (PV1, PV2, ..., PVn) der Parameter (P1,P2, ..., Pn) der Grundbausteine (GRpi) innerhalb der festgelegten Wertebereiche zu erstellen; wobei das Simulationsmodul (420) ausgebildet ist, aus der Menge von konkreten Szenarien (SZci) eine Menge von simulierten konkreten Szenarien (SZsci) zu simulieren; wobei das Eingabemodul (200) ausgebildet ist, eine Menge von realen Szenarien (SZri) mittels der Softwareapplikation (240) aus Sensorsignalen von Sensoren (500), die in Echtzeit an das Eingabemodul (200) übermittelt werden und/oder aus einer Datenbank (520) abrufbar sind, zu generieren; wobei das Vergleichsmodul (440) ausgebildet ist, die Menge von realen Szenarien (SZri) mit der Menge von simulierten konkreten Szenarien (SZsci) zu vergleichen; wobei das Lernverstärkungsmodul (300) ausgebildet ist, zumindest ein relevantes parametrisiertes Szenario (SZpk) zu berechnen; und wobei das Ausgabemodul (540) ausgebildet ist, das zumindest eine relevante parametrisierte Szenario (SZpk) für Test- und Trainingszwecke auszugeben.System (100) for creating parameterized scenarios (SZp 1 , SZp 2 , ..., SZp n ), in particular for testing and training driving assistance systems and automated driving functions, wherein a parameterized scenario (SZp i ) represents a traffic event in a temporal sequence and can be described as a sequence of scenes starting with a start scene and events, whereby a scene and an event can each be represented by at least one basic module (GR i ), which is determined by a selection of parameters (P 1 , P 2 , .. ., P n ) and associated parameter values (PV 1 , PV 2 , ..., PV n ) can be determined, and a scenario is referred to as a parameterized scenario (SZp i ) or a basic component as a parameterized basic module (GRp i ), in which the parameters (P 1 , P 2 , ..., P n ) and associated parameter values (PV 1 , PV 2 , ..., PV n ) are freely selectable, and as a concrete scenario (SZc i ) a scenario or . A concrete basic building block (GRc i ) is a basic building block in which the parameters (P 1 , P 2 , ..., P n ) and associated parameter values (PV 1 , PV 2 , ..., PV n ) are fixed ; comprising an input module (200), a learning reinforcement module (300) with a learning reinforcement agent (320), a variation module (400), a simulation module (420), a comparison module (440) and an output module (450), wherein the input module (200 ) is designed to generate a plurality of parameterized basic building blocks (GRp 1 , GRp 2 , ..., GRp n ) of scenes and events for at least one parameterized scenario (SZp i ) by means of a software application (240) and the plurality of parameterized basic building blocks (GRp 1 , GRp 2 , ..., GRp n ) to the learning reinforcement module (300); wherein the learning reinforcement module (300) is designed to create at least one parameterized scenario (SZp i ) by selecting at least one basic module (GRp i ) and value ranges for the parameter values (PV 1 , PV 2 ,...,PV n ) of the parameters ( P 1 , P 2 , ..., P n ) of the basic building blocks (GRp i ) of the parameterized scenario (SZp i ); wherein the variation module (400) is designed to generate a set of concrete scenarios (SZc i ) from the at least one parameterized scenario (SZp i ) by determining concrete parameter values (PV 1 , PV 2 , ..., PV n ) of the parameters ( P 1 ,P 2 , ..., P n ) of the basic building blocks (GRp i ) within the specified value ranges; wherein the simulation module (420) is designed to simulate a set of simulated concrete scenarios (SZc i ) from the set of concrete scenarios (SZc i ); wherein the input module (200) is designed to generate a set of real scenarios (SZr i ) using the software application (240) from sensor signals from sensors (500), which are transmitted in real time to the input module (200) and / or from a database ( 520) are available to generate; wherein the comparison module (440) is designed to compare the set of real scenarios (SZr i ) with the set of simulated concrete scenarios (SZsc i ); wherein the learning reinforcement module (300) is designed to calculate at least one relevant parameterized scenario (SZp k ); and wherein the output module (540) is designed to output the at least one relevant parameterized scenario (SZp k ) for testing and training purposes. System (100) nach Anspruch 10, wobei ein Parameter (Pi) ein bewegliches Objekt wie ein Kraftfahrzeug, ein unbewegliches Objekt wie ein Gebäude, eine Straßenkonfiguration wie eine Autobahn, eine Geschwindigkeit, eine Beschleunigung, ein Straßenschild, eine Ampel, einen Tunnel, einen Kreisverkehr, eine Abbiegespur, eine Beschleunigung, eine Richtung, eine Winkel, einen Radius, einen Ort, ein Verkehrsaufkommen, eine topographische Struktur wie eine Steigung, eine Uhrzeit, eine Temperatur, einen Niederschlagswert, eine Witterung und/oder eine Jahreszeit darstellt.System (100) after Claim 10 , where a parameter (P i ) is a moving object such as a motor vehicle, an immovable object such as a building, a road configuration such as a highway, a speed, an acceleration, a street sign, a traffic light, a tunnel, a roundabout, a turning lane, a Acceleration, a direction, an angle, a radius, a location, a traffic volume, a topography phical structure such as a gradient, a time, a temperature, a precipitation value, a weather and/or a season. System (100) nach Anspruch 10 oder 11, wobei die Sensoren (500) als Radarsysteme, LIDAR-Systeme zur optischen Abstands- und Geschwindigkeitsmessung, bildaufnehmende 2D/3D-Kameras im sichtbaren Bereich, im IR- und/oder UV-Bereich, GPS-Systeme, Beschleunigungssensoren, Geschwindigkeitssensoren, kapazitive Sensoren, induktive Sensoren, Niederschlagssensoren und/oder Temperatursensoren ausgebildet sind.System (100) after Claim 10 or 11 , whereby the sensors (500) are radar systems, LIDAR systems for optical distance and speed measurement, image-recording 2D/3D cameras in the visible range, in the IR and/or UV range, GPS systems, acceleration sensors, speed sensors, capacitive sensors , inductive sensors, precipitation sensors and / or temperature sensors are formed. System (100) nach einem der Ansprüche 10 bis 12, wobei die Softwareapplikation (240) Algorithmen der künstlichen Intelligenz zum Extrahieren und Klassifizieren von Parametern (Pi) und Parameterwerten (PVi) aus eingegebenen Daten und Sensorsignalen der Sensoren (500) für die Generierung der parametrisierten Grundbausteine (GRpi) verwendet.System (100) according to one of the Claims 10 until 12 , wherein the software application (240) uses artificial intelligence algorithms to extract and classify parameters (P i ) and parameter values (PV i ) from input data and sensor signals from the sensors (500) for generating the parameterized basic blocks (GRp i ). System (100) nach einem der Ansprüche 10 bis 13, wobei zumindest ein Algorithmus des Lernverstärkungs-Agenten (320) als Markow-Entscheidungsprozess, Temporal Difference Learning (TD-Learning), Q-Learning, SARSA, Monte-Carlo-Simulation oder Actor-Critic ausgebildet ist.System (100) according to one of the Claims 10 until 13 , wherein at least one algorithm of the learning reinforcement agent (320) is designed as a Markov decision process, temporal difference learning (TD learning), Q-learning, SARSA, Monte Carlo simulation or actor-critic. Computerprogrammprodukt (900), umfassend einen ausführbaren Programmcode (950), der so konfiguriert ist, dass er bei seiner Ausführung das Verfahren nach einem der Ansprüche 1 bis 9 ausführt.Computer program product (900), comprising an executable program code (950) which is configured so that, when executed, it implements the method according to one of Claims 1 until 9 executes.
DE102022107846.9A 2022-04-01 2022-04-01 Method, system and computer program product for creating parameterized scenarios Pending DE102022107846A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102022107846.9A DE102022107846A1 (en) 2022-04-01 2022-04-01 Method, system and computer program product for creating parameterized scenarios

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102022107846.9A DE102022107846A1 (en) 2022-04-01 2022-04-01 Method, system and computer program product for creating parameterized scenarios

Publications (1)

Publication Number Publication Date
DE102022107846A1 true DE102022107846A1 (en) 2023-10-05

Family

ID=88019267

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102022107846.9A Pending DE102022107846A1 (en) 2022-04-01 2022-04-01 Method, system and computer program product for creating parameterized scenarios

Country Status (1)

Country Link
DE (1) DE102022107846A1 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102007053500A1 (en) 2007-06-11 2008-12-18 Audi Ag Safety system assessing method for motor vehicle, involves assessing safety system based on reconstruction of accidents with respect to system, and performing realistic road trial with real and virtual components during reconstruction
DE102006044086B4 (en) 2006-09-20 2013-05-29 Audi Ag System and method for the simulation of traffic situations, in particular accident-critical dangerous situations, as well as a driving simulator
DE102013003944A1 (en) 2013-03-08 2014-09-11 Volkswagen Ag Method and device for providing driver assistance functionality
EP3066529B1 (en) 2013-11-05 2020-01-01 AVL List GmbH Virtual test optimization for driver assistance systems
WO2020083996A1 (en) 2018-10-24 2020-04-30 Avl List Gmbh Method and device for testing a driver assistance system
US11137763B2 (en) 2016-05-30 2021-10-05 Faraday & Future Inc. Generating and fusing traffic scenarios for automated driving systems

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102006044086B4 (en) 2006-09-20 2013-05-29 Audi Ag System and method for the simulation of traffic situations, in particular accident-critical dangerous situations, as well as a driving simulator
DE102007053500A1 (en) 2007-06-11 2008-12-18 Audi Ag Safety system assessing method for motor vehicle, involves assessing safety system based on reconstruction of accidents with respect to system, and performing realistic road trial with real and virtual components during reconstruction
DE102013003944A1 (en) 2013-03-08 2014-09-11 Volkswagen Ag Method and device for providing driver assistance functionality
EP3066529B1 (en) 2013-11-05 2020-01-01 AVL List GmbH Virtual test optimization for driver assistance systems
US11137763B2 (en) 2016-05-30 2021-10-05 Faraday & Future Inc. Generating and fusing traffic scenarios for automated driving systems
WO2020083996A1 (en) 2018-10-24 2020-04-30 Avl List Gmbh Method and device for testing a driver assistance system

Similar Documents

Publication Publication Date Title
EP3365741B1 (en) Method for fully automatic guidance of a vehicle system and corresponding motor vehicle
EP3765927B1 (en) Method for generating a training data record for training an artificial intelligence module for a control device of a vehicle
DE112017006530T5 (en) FEEDBACK FOR AN AUTONOMOUS VEHICLE
DE102019122826A1 (en) ADAPTIVE VEHICLE LEARNING
DE102007053501A1 (en) Method for developing and / or testing at least one safety and / or driver assistance system for a motor vehicle and simulation environment
DE102016007899B4 (en) Method for operating a device for traffic situation analysis, motor vehicle and data processing device
DE102018203583B4 (en) Method, driver assistance system and motor vehicle for the prediction of a position or a trajectory by means of a graph-based environment model
DE102022112059B3 (en) Method, system and computer program product for calibrating and validating a driver assistance system (ADAS) and/or an automated driving system (ADS)
WO2015135806A1 (en) Method and device for determining intersection parameters
EP3063732A1 (en) Situation analysis for a driver assistance system
DE102021211781A1 (en) VEHICLE OPERATION USING BEHAVIOR RULES CHECKS
EP3356766A1 (en) Method for updating an electronic card of a vehicle
DE102020130519A1 (en) VEHICLE OPERATING PARAMETERS
DE102022112060B3 (en) Scenario database for a method and a system for calibrating and validating a driver assistance system (ADAS) and/or an automated driving system (ADS)
DE102022102501B3 (en) Method, system and computer program product for determining an assessment of the functionality of a component of a motor vehicle
DE102022108677B3 (en) Method, system and computer program product for determining objective parameters for predicting a subjective evaluation of a driver assistance system and/or an automated driver assistance function
DE102022107845A1 (en) Method, system and computer program product for selecting concrete scenarios
DE102022107846A1 (en) Method, system and computer program product for creating parameterized scenarios
WO2023057014A1 (en) Method for planning a trajectory of a driving maneuver of a motor vehicle, computer program product, computer-readable storage medium, and vehicle
DE102019208735A1 (en) Method for operating a driver assistance system for a vehicle and a driver assistance system for a vehicle
DE102018216719A1 (en) Keyframe-based autonomous vehicle operation
DE102018209755A1 (en) Method, device, mobile user device and computer program for providing information for use in a vehicle, and method, device and computer program for using information in a vehicle
DE112020006532T5 (en) COMPUTER SYSTEM AND METHOD WITH END-TO-END MODELING FOR A SIMULATED TRAFFIC AGENT IN A SIMULATION ENVIRONMENT
DE102020122356A1 (en) LOCATION-BASED VEHICLE OPERATION
DE102021104077B3 (en) Method, system and computer program product for the automated generation of traffic data

Legal Events

Date Code Title Description
R012 Request for examination validly filed