DE102022207286B3 - Device and computer-implemented method for providing a trained machine learning agent designed to control a device, device and method for controlling a device and vehicle - Google Patents
Device and computer-implemented method for providing a trained machine learning agent designed to control a device, device and method for controlling a device and vehicle Download PDFInfo
- Publication number
- DE102022207286B3 DE102022207286B3 DE102022207286.3A DE102022207286A DE102022207286B3 DE 102022207286 B3 DE102022207286 B3 DE 102022207286B3 DE 102022207286 A DE102022207286 A DE 102022207286A DE 102022207286 B3 DE102022207286 B3 DE 102022207286B3
- Authority
- DE
- Germany
- Prior art keywords
- simulation
- agent
- machine learning
- event
- vehicle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000010801 machine learning Methods 0.000 title claims abstract description 57
- 238000004088 simulation Methods 0.000 claims abstract description 140
- 238000005259 measurement Methods 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 20
- 230000003993 interaction Effects 0.000 claims abstract description 19
- 230000004807 localization Effects 0.000 claims abstract description 11
- 239000008187 granular material Substances 0.000 claims description 19
- 230000006399 behavior Effects 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 239000003795 chemical substances by application Substances 0.000 description 82
- 230000009471 action Effects 0.000 description 15
- 238000004891 communication Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 239000004576 sand Substances 0.000 description 5
- 206010048669 Terminal state Diseases 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000001953 sensory effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000763 evoking effect Effects 0.000 description 2
- 239000011236 particulate material Substances 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 239000011435 rock Substances 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 210000002023 somite Anatomy 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B17/00—Systems involving the use of models or simulators of said systems
- G05B17/02—Systems involving the use of models or simulators of said systems electric
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
Abstract
Die Erfindung betrifft ein computer-implementiertes Verfahren zum Bereitstellen eines trainierten Maschinenlern-Agenten (135), der dafür ausgelegt ist, eine Einrichtung (100) zu steuern. Die Einrichtung (100) ist dafür ausgelegt, eine Aufgabe in einer Arbeitsumgebung zu lösen. Das Verfahren umfasst einen Schritt des Initialisierens eines ursprünglichen Maschinenlern-Agenten (112) in einem vortrainierten Zustand und einer Simulation (114) auf Ereignisbasis für einen Agenten (112, 135) zur Lösung der Aufgabe. Die Simulation (114) auf Ereignisbasis ist dafür ausgelegt, Informationen über Agent-Interaktionen mit der Arbeitsumgebung bereitzustellen. Das Verfahren umfasst außerdem einen Schritt des Erzeugens einer Hybrid-Simulation (122) durch Kombinieren der Simulation (112) auf Ereignisbasis und einer Lokalisierungssimulation auf Zeitbasis. Die Lokalisierungssimulation auf Zeitbasis umfasst ein Sensormodell und ein Fehlermodell. Das Sensormodell repräsentiert simulierte Messdaten, erhalten durch einen simulierten Sensor in vorbestimmten Zeitintervallen mit Bezug auf aus der Simulation 114 auf Ereignisbasis extrahierte Agent-Posen. Das Fehlermodell repräsentiert an dem simulierten Sensor wirkendes simuliertes Rauschen. Das Verfahren umfasst ferner einen Schritt des Trainierens des ursprünglichen Maschinenlern-Agenten (112) unter Verwendung der Hybrid-Simulation (122), um den trainierten Maschinenlern-Agenten (135) bereitzustellen.The invention relates to a computer-implemented method for providing a trained machine learning agent (135) that is designed to control a device (100). The device (100) is designed to solve a task in a work environment. The method includes a step of initializing an original machine learning agent (112) in a pre-trained state and an event-based simulation (114) for an agent (112, 135) to solve the task. The event-based simulation (114) is designed to provide information about agent interactions with the work environment. The method further includes a step of generating a hybrid simulation (122) by combining the event-based simulation (112) and a time-based localization simulation. The time-based localization simulation includes a sensor model and an error model. The sensor model represents simulated measurement data obtained by a simulated sensor at predetermined time intervals with respect to agent poses extracted from the simulation 114 on an event basis. The error model represents simulated noise acting on the simulated sensor. The method further includes a step of training the original machine learning agent (112) using the hybrid simulation (122) to provide the trained machine learning agent (135).
Description
Stand der TechnikState of the art
Die Erfindung betrifft eine Vorrichtung oder ein Verfahren gemäß den unabhängigen Ansprüchen. Außerdem ist ein Computerprogramm Gegenstand der vorliegenden Erfindung.The invention relates to a device or a method according to the independent claims. A computer program is also the subject of the present invention.
Zum Beispiel können Simulatoren oder Simulationen oft zum Trainieren von Maschinenlernmodellen verwendet werden. Grob gesagt, können Simulationen in zwei Typen aufgeteilt werden: ereignisgesteuert und zeitgesteuert. Ereignisgesteuerte Simulationen sind Simulationen, bei denen jede Transaktion in der Simulation durch ein Ereignis hervorgerufen wird. Zeitgesteuerte Simulationen simulieren ein System mit einigen in ihm installierten Sensoren. Bei dieser Art von Simulation wird jede Transaktion in der Simulation durch einen zugeordneten Zeitstempel und eine Aufzeichnung der simulierten Sensorinformationen hervorgerufen.For example, simulators or simulations can often be used to train machine learning models. Broadly speaking, simulations can be divided into two types: event-driven and time-driven. Event-driven simulations are simulations in which every transaction in the simulation is caused by an event. Timed simulations simulate a system with some sensors installed in it. In this type of simulation, each transaction in the simulation is evoked by an associated timestamp and a record of the simulated sensor information.
Eldabi T.: Systemic Characteristics to Support Hybrid Simulation Modeling. In:Proceedings of the 2021 Winter Simulation Conference, 2021, 1-10. https://ieeexplore. ieee. org/stamp/stamp.jsp?tp=&arnumber=9715534&tag=1, schlagen vor, dass zur Verbesserung und Beschleunigung der Entwicklung von hybriden Simulationsmodellen die Entscheidung zur Hybridisierung zum frühestmöglichen Zeitpunkt getroffen werden sollte, d. h. bei der Untersuchung des Systems und der Definition des Problems.Eldabi T.: Systemic Characteristics to Support Hybrid Simulation Modeling. In:Proceedings of the 2021 Winter Simulation Conference, 2021, 1-10. https://ieeexplore. eeeeeeeeeeeeeeeeeeeee. org/stamp/stamp.jsp?tp=&arnumber=9715534&tag=1, suggest that to improve and accelerate the development of hybrid simulation models, the decision to hybridize should be made at the earliest possible point, i.e. H. in examining the system and defining the problem.
Popovic, R. Kliment M., Trebuna P., Pekarcikova M.: Simulation as a Tool for Process Optimization of Logistic Systems. In: International Scientific Journal about Logistics, https://www.actalogistica.eu/issues/2015/111_2015_01_Popo_Trebuna_Pekarcikova.pdf, befassen sich mit der Simulation von Produktionsprozessen, insbesondere mit Tecnomatix Software. Tecnomatix Process Simulate ist für den Aufbau neuer oder die Modifizierung bestehender Produktionsprozesse konzipiert.Popovic, R. Kliment M., Trebuna P., Pekarcikova M.: Simulation as a Tool for Process Optimization of Logistic Systems. In: International Scientific Journal about Logistics, https://www.actalogistica.eu/issues/2015/111_2015_01_Popo_Trebuna_Pekarcikova.pdf, deal with the simulation of production processes, especially with Tecnomatix software. Tecnomatix Process Simulate is designed for setting up new or modifying existing production processes.
Wischnewski R., Roßmann J.: A New Hybrid Time-Based / Event-Based Simulation Method for Transport Systems Considering Physical Effects. In: IEEE Conference on Robotics, Automation and Mechatronics, 2010, 470-475. https://ieeexplore. ieee. org/sta m p/stamp .jsp?tp=&a rnumber=5513149&tag= 1, stellen eine hybride hierarchische zeit- und ereignisbasierte Methode vor, die die Vorteile beider Konzepte kombiniert. Die neuen Methoden ermöglichen eine 3-D-Simulation einschließlich physikalischer Effekte, ohne dass die Massen der Träger modelliert werden müssen.Wischnewski R., Roßmann J.: A New Hybrid Time-Based / Event-Based Simulation Method for Transport Systems Considering Physical Effects. In: IEEE Conference on Robotics, Automation and Mechatronics, 2010, 470-475. https://ieeexplore. eeeeeeeeeeeeeeeeeeeee. org/sta m p/stamp .jsp?tp=&a rnumber=5513149&tag= 1, present a hybrid hierarchical time- and event-based method that combines the advantages of both concepts. The new methods enable 3D simulation including physical effects without having to model the masses of the beams.
Kurzfassung der ErfindungSummary of the invention
Gegenüber diesem Stand der Technik stellt der hier dargestellte Ansatz ein Verfahren, eine dieses Verfahren verwendende Vorrichtung und ein entsprechendes Computerprogramm gemäß den Hauptansprüchen bereit. Vorteilhafte Ausführungsformen und Verbesserungen des im unabhängigen Anspruch definierten Gegenstands sind mittels der in den abhängigen Ansprüchen angegebenen Merkmale möglich.Compared to this prior art, the approach presented here provides a method, a device using this method and a corresponding computer program according to the main claims. Advantageous embodiments and improvements of the subject matter defined in the independent claim are possible by means of the features specified in the dependent claims.
Gemäß Ausführungsformen kann zum Beispiel eine Hybrid-Simulation bereitgestellt werden, die ereignisgesteuert und zeitgesteuert sein kann, zum Trainieren eines Maschinenlern-Agenten, der dafür ausgelegt ist, zum Beispiel eine Einrichtung wie ein autonomes Fahrzeug, einen Bulldozer usw. zu steuern. Eine solche Hybrid-Simulation, so wie sie hier vorgeschlagen wird, kann insbesondere Mittel zum Untersuchen von Betrachtungen eines Systems auf Zeitbasis, eingebettet in eine Simulation auf Ereignisbasis, bereitstellen, wobei diese zwei Arten von Simulationen entflochten bleiben können. Eine solche Entflechtung ist vorteilhaft, da Simulationen auf Ereignisbasis die Interaktion des Agenten und der Umgebung erfassen sollen, während Simulationen auf Zeitbasis spezifische Messeinrichtungen simulieren und sensorische Informationen und Zeitstempel für jede Zeitaufzeichnung in der simulierten Episode bereitstellen sollen.For example, according to embodiments, a hybrid simulation may be provided, which may be event-driven and time-driven, for training a machine learning agent designed to control, for example, a device such as an autonomous vehicle, a bulldozer, etc. In particular, such a hybrid simulation as proposed herein can provide a means for examining time-based system considerations embedded in an event-based simulation, whereby these two types of simulations can remain disentangled. Such disentanglement is advantageous because event-based simulations are intended to capture the interaction of the agent and the environment, while time-based simulations are intended to simulate specific measurement devices and provide sensory information and timestamps for each time record in the simulated episode.
Es wird ein computer-implementiertes Verfahren zum Bereitstellen eines trainierten Maschinenlern-Agenten, ausgelegt zum Steuern einer Vorrichtung, bereitgestellt, wobei die Einrichtung dafür ausgelegt ist, eine Aufgabe in einer Arbeitsumgebung zu lösen, wobei das Verfahren die folgenden Schritte umfasst:
- Initialisieren eines ursprünglichen Maschinenlern-Agenten in einem vortrainierten Zustand und einer Simulation auf Ereignisbasis für einen Agenten zur Lösung der Aufgabe, wobei die Simulation auf Ereignisbasis dafür ausgelegt ist, Informationen über Agent-Interaktionen mit der Arbeitsumgebung bereitzustellen;
- Erzeugen einer Hybrid-Simulation durch Kombinieren der Simulation auf Ereignisbasis und einer Lokalisierungssimulation auf Zeitbasis, wobei die Lokalisierungssimulation auf Zeitbasis ein Sensormodell und ein Fehlermodell umfasst, wobei das Sensormodell simulierte Messdaten, erhalten durch einen simulierten Sensor in vorbestimmten Zeitintervallen mit Bezug auf Agent-Posen, die aus der Simulation auf Ereignisbasis extrahiert werden, repräsentiert, wobei das Fehlermodell an dem simulierten Sensor wirkendes simuliertes Rauschen repräsentiert; und
- Trainieren des ursprünglichen Maschinenlern-Agenten unter Verwendung der Hybrid-Simulation, um den trainierten Maschinenlern-Agenten bereitzustellen.
- initializing an initial machine learning agent in a pre-trained state and an event-based simulation for an agent to solve the task, the event-based simulation being designed to provide information about agent interactions with the work environment;
- Generating a hybrid simulation by combining the event-based simulation and a time-based localization simulation, the time-based localization simulation comprising a sensor model and an error model, the sensor model including simulated measurement data obtained by a simulated sensor at predetermined time intervals with respect to agent poses, extracted from the event-based simulation, wherein the error model represents simulated noise acting on the simulated sensor; and
- Train the original machine learning agent using hybrid simulation to deploy the trained machine learning agent.
Die Einrichtung kann dafür ausgelegt sein, die Aufgabe auf mindestens teilweise autonome Weise zu lösen. Die Einrichtung kann zum Beispiel ein Fahrzeug, ein Roboter oder dergleichen sein. Der Maschinenlern- bzw. ML-Agent kann zum Beispiel ein Verstärkungslern- bzw. RL-Agent sein. Der Maschinenlern-Agent kann eine Strategie umfassen und/oder bewirken, die eine Reihe von Aktionen, eine Trajektorie und/oder dergleichen repräsentiert. Die Simulation auf Ereignisbasis kann eine auf Maschinenlernen basierende Simulation sein. Mindestens der Schritt des Trainierens kann wiederholt ausgeführt werden, wobei der ursprüngliche Maschinenlern-Agent wiederholt unter Verwendung der Hybrid-Simulation trainiert wird, um den trainierten Maschinenlern-Agenten bereitzustellen. Insbesondere können alle Schritte des Verfahrens wiederholt ausgeführt werden, wobei der trainierte Maschinenlern-Agent einer vorherigen Iteration der Schritte des Verfahrens zum ursprünglichen Maschinenlern-Agenten der folgenden Iteration der Schritte des Verfahrens wird. Der trainierte Maschinenlern-Agent kann dafür ausgelegt werden, mindestens eine Trajektorie für die Einrichtung zu planen. Der vortrainierte Zustand des ursprünglichen Maschinenlern-Agenten kann ein Zustand vor Training durch den Schritt des Trainings des Verfahrens zur Bereitstellung sein. Der ursprüngliche Maschinenlern-Agent kann bereits durch andere Verfahren trainiert worden sein.The device can be designed to solve the task in an at least partially autonomous manner. The device can be, for example, a vehicle, a robot or the like. The machine learning or ML agent can be, for example, a reinforcement learning or RL agent. The machine learning agent may include and/or effect a strategy that represents a series of actions, a trajectory, and/or the like. The event-based simulation can be a machine learning-based simulation. At least the step of training may be performed repeatedly, where the original machine learning agent is repeatedly trained using the hybrid simulation to provide the trained machine learning agent. In particular, all steps of the method can be executed repeatedly, with the trained machine learning agent of a previous iteration of the steps of the method becoming the original machine learning agent of the following iteration of the steps of the method. The trained machine learning agent can be designed to plan at least one trajectory for the facility. The pre-trained state of the original machine learning agent may be a state before training through the training step of the deployment method. The original machine learning agent may have already been trained using other methods.
Gemäß einer Ausführungsform können im Schritt des Erzeugens die Agent-Posen aus der Simulation auf Ereignisbasis extrahiert werden durch Erzeugen einer Trajektorie auf Zeitbasis aus einer Trajektorie aus der Simulation auf Ereignisbasis und durch Interpolieren der Agent-Posen aus der Trajektorie auf Zeitbasis gemäß den vorbestimmten Zeitintervallen, die einer Abtastfrequenz des simulierten Sensors entsprechen, wobei die simulierten Messdaten aus den Agent-Posen extrapoliert werden, wobei das Fehlermodell durch Addieren des simulierten Rauschens zu den simulierten Messdaten für jedes Zeitintervall auf das Sensormodell angewandt wird. Eine solche Ausführungsform hat den Vorteil, dass auf Zeit basierende Fähigkeiten auf realistische Weise zu der Simulation auf Ereignisbasis hinzugefügt werden können, wobei auch das Fehlermodell widergespiegelte Unbestimmtheiten berücksichtigt werden.According to one embodiment, in the generating step, the agent poses may be extracted from the event-based simulation by generating a time-based trajectory from a trajectory from the event-based simulation and by interpolating the agent poses from the time-based trajectory according to the predetermined time intervals, which correspond to a sampling frequency of the simulated sensor, the simulated measurement data being extrapolated from the agent poses, the error model being applied to the sensor model by adding the simulated noise to the simulated measurement data for each time interval. Such an embodiment has the advantage that time-based capabilities can be realistically added to the event-based simulation while also taking into account uncertainties reflected in the error model.
Gemäß einer Ausführungsform kann im Schritt des Trainings Entscheidungsfindungsleistungsfähigkeit des ursprünglichen Maschinenlern-Agenten evaluiert werden durch Betrachtung des Agent-Verhaltens auf der Basis der Simulation auf Ereignisbasis und des Agent-Verhaltens auf der Basis der Hybrid-Simulation. Diese Evaluierung kann durch Vergleichen des Agent-Verhaltens auf der Basis der Simulation auf Ereignisbasis mit dem Agentenverhalten auf der Basis der Hybrid-Simulation erfolgen. Eine solche Ausführungsform hat den Vorteil, dass aufgrund der Fähigkeiten der Entscheidungsfindung unter Unbestimmtheiten, so wie sie in der Hybrid-Simulation bereitgestellt werden, die Entscheidungsfindungsleistungsfähigkeit eines Maschinenlern-Agenten unter Unbestimmtheiten untersucht werden kann.According to one embodiment, in the step of training, decision-making performance of the original machine learning agent may be evaluated by considering the agent behavior based on the event-based simulation and the agent behavior based on the hybrid simulation. This evaluation can be done by comparing the agent behavior based on the event-based simulation with the agent behavior based on the hybrid simulation. Such an embodiment has the advantage that the decision-making performance of a machine learning agent under uncertainty can be examined due to the uncertainty decision-making capabilities provided in the hybrid simulation.
Außerdem wird hier ein Verfahren zum Steuern einer Einrichtung dargestellt, wobei die Einrichtung dafür ausgelegt ist, eine Aufgabe in einer Arbeitsumgebung zu lösen, wobei das Verfahren die folgenden Schritte umfasst:
- Bereitstellen eines trainierten Maschinenlern-Agenten gemäß einem Verfahren nach einem der vorhergehenden Ansprüche;
- Bestimmen eines Steuersignals unter Verwendung des trainierten Maschinenlern-Agenten; und
- Ausgeben des Steuersignals an mindestens einen Aktor der Einrichtung, um die Einrichtung zu steuern.
- Der trainierte Maschinenlern-Agent und somit das Steuersignal können dazu führen, dass sich die Einrichtung auf eine für die Lösung der Aufgabe geeignete Weise verhält.
- Providing a trained machine learning agent according to a method according to one of the preceding claims;
- determining a control signal using the trained machine learning agent; and
- Outputting the control signal to at least one actuator of the device in order to control the device.
- The trained machine learning agent and thus the control signal can cause the device to behave in a way that is suitable for solving the task.
Gemäß einer Ausführungsform beliebiger der hier dargestellten Verfahren kann die Einrichtung ein Geländefahrzeug sein, wobei die Einrichtung ein Geländefahrzeug ist, wobei die zu lösende Aufgabe Interaktion des Geländefahrzeugs mit körnigem Material in der Arbeitsumgebung umfasst. Das Fahrzeug oder Geländefahrzeug kann eine Planierraupe, ein Bulldozer, ein Verdichter, ein Dumper, ein Bagger, ein Baufahrzeug, eine schwere Maschine, ein Schwerlastfahrzeug oder eine andere Art von Fahrzeug sein, die eine Anzahl von Zuweisungen aufweist, die Interaktion mit der Umgebung, spezieller dem körnigen Material, umfassen. Beispiele für diese Arten von Zuweisungen oder Aktionen können Planieren, Abladen von körnigem Material, Verdichten einer Fläche, Entfernen von körnigem Material usw. sein. Das körnige Material kann Erde, Sand, Schnee, Schutt, Gestein und/oder ähnliches Teilchenmaterial umfassen. Der Agent kann mindestens eine für das Fahrzeug geplante zu befolgende Trajektorie umfassen.According to an embodiment of any of the methods presented herein, the device may be an off-road vehicle, the device being an off-road vehicle, the task to be solved comprising interaction of the off-road vehicle with granular material in the work environment. The vehicle or off-road vehicle may be a bulldozer, a bulldozer, a compactor, a dumper, an excavator, a construction vehicle, a heavy machinery, a heavy-duty vehicle or another type of vehicle that has a number of assignments that interact with the environment, more specifically the granular material. Examples of these types of assignments or actions may include grading, dumping granular material, compacting an area, removing granular material, etc. The granular material may include earth, sand, snow, rubble, rock and/or similar particulate material. The agent may include at least one trajectory planned for the vehicle to follow.
Jedes hier dargestellte Verfahren kann zum Beispiel in Software oder Hardware oder einer Mischung von Software und Hardware, zum Beispiel in einer Vorrichtung oder in einer Steuerung, implementiert werden.Each method presented here can be in software or hardware or a mixture of software and hardware, for example in a device or in a controller.
Der hier dargestellte Ansatz stellt auch eine Vorrichtung bereit, die dafür ausgelegt ist, die Schritte einer Variante eines hier dargestellten Verfahrens auszuführen, zu steuern oder durch entsprechende Mittel zu implementieren. Die der Erfindung zugrundeliegende Aufgabe kann schnell und effizient auch mittels dieser Ausführungsform der Erfindung in Form einer Vorrichtung gelöst werden.The approach presented here also provides a device that is designed to execute, control or implement the steps of a variant of a method presented here by appropriate means. The object on which the invention is based can be solved quickly and efficiently using this embodiment of the invention in the form of a device.
Zu diesem Zweck kann die Vorrichtung mindestens eine Recheneinheit zum Verarbeiten von Signalen oder Daten, mindestens eine Speicherungseinheit zum Speichern von Signalen oder Daten, mindestens eine Schnittstelle zu einem Sensor oder Aktor zum Lesen von Sensorsignalen aus dem Sensor oder Ausgeben von Daten oder Steuersignalen an den Aktor und/oder mindestens eine Kommunikationsschnittstelle zum Lesen oder Ausgeben von in einem Kommunikationsprotokoll eingebetteten Daten umfassen. Zum Beispiel kann die Recheneinheit ein Signalprozessor, ein Mikrocontroller oder dergleichen sein, wobei die Speicherungseinheit Flash-Speicherung, ein EEPROM oder eine magnetische Speicherungseinheit sein kann. Die Kommunikationsschnittstelle kann dafür ausgelegt sein, Daten auf drahtlose und/oder drahtgebundene Weise zu lesen oder auszugeben, wobei eine Kommunikationsschnittstelle, die zum Lesen oder Ausgeben von drahtgebundenen Daten fähig ist, Daten elektrisch oder optisch aus einer entsprechenden Datenübertragungsleitung lesen oder selbige zum Beispiel an eine entsprechende Datenübertragungsleitung ausgeben kann.For this purpose, the device can have at least one computing unit for processing signals or data, at least one storage unit for storing signals or data, at least one interface to a sensor or actuator for reading sensor signals from the sensor or outputting data or control signals to the actuator and/or include at least one communication interface for reading or outputting data embedded in a communication protocol. For example, the computing unit may be a signal processor, a microcontroller or the like, where the storage unit may be flash storage, an EEPROM or a magnetic storage unit. The communication interface may be configured to read or output data in a wireless and/or wired manner, wherein a communication interface capable of reading or outputting wired data reads data electrically or optically from or to a corresponding data transmission line, for example corresponding data transmission line can output.
Eine Vorrichtung kann als eine elektrische Einrichtung aufgefasst werden, die Sensorsignale verarbeitet und abhängig davon Steuer- und/oder Datensignale ausgibt. Die Vorrichtung kann eine in Hardware und/oder in Software realisierte Schnittstelle umfassen. Bei Realisierung in Hardware können die Schnittstellen zum Beispiel Teil eines sogenannten System-ASIC sein, das verschiedene Funktionen der Vorrichtung umfasst. Die Schnittstellen können jedoch auch verschiedene integrierte Schaltungen sein oder mindestens teilweise aus diskreten Komponenten bestehen. Bei Realisierung in Software können die Schnittstellen Softwaremodule sein, die zum Beispiel auf einem Mikrocontroller zusammen mit anderen Softwaremodulen realisiert sind.A device can be viewed as an electrical device that processes sensor signals and, depending on them, outputs control and/or data signals. The device can include an interface implemented in hardware and/or software. When implemented in hardware, the interfaces can, for example, be part of a so-called system ASIC, which includes various functions of the device. However, the interfaces can also be different integrated circuits or at least partially consist of discrete components. When implemented in software, the interfaces can be software modules that are implemented, for example, on a microcontroller together with other software modules.
Der hier dargestellte Ansatz stellt auch ein Fahrzeug bereit, wobei das Fahrzeug die hier dargestellte Vorrichtung umfasst.The approach shown here also provides a vehicle, the vehicle comprising the device shown here.
Das Fahrzeug kann auch mindestens einen Aktor umfassen. Der Aktor kann dafür ausgelegt sein, mindestens eine Komponente des Fahrzeugs zu bewegen, um das Verhalten des Fahrzeugs zu beeinflussen. Die Vorrichtung und der mindestens eine Aktor können zur Signalkommunikation oder Datenkommunikation miteinander verbunden sein.The vehicle can also include at least one actuator. The actuator may be configured to move at least one component of the vehicle to influence the behavior of the vehicle. The device and the at least one actuator can be connected to one another for signal communication or data communication.
Gemäß einer Ausführungsform kann das Fahrzeug ein Geländefahrzeug sein, wobei die Aufgabe Interaktion des Geländefahrzeugs mit körnigem Material in der Arbeitsumgebung umfassen kann. Das Fahrzeug oder Geländefahrzeug kann eine Planierraupe, ein Bulldozer, ein Verdichter, ein Dumper, ein Bagger, ein Baufahrzeug, eine schwere Maschine, ein Schwerlastfahrzeug oder eine andere Art von Fahrzeug sein, die eine Anzahl von Zuweisungen aufweist, die Interaktion mit der Umgebung, spezieller dem körnigen Material, umfassen. Beispiele für diese Arten von Zuweisungen oder Aktionen können Planieren, Abladen von körnigem Material, Verdichten einer Fläche, Entfernen von körnigem Material usw. sein. Das körnige Material kann Erde, Sand, Schnee, Schutt, Gestein und/oder ähnliches Teilchenmaterial umfassen. Der Agent kann mindestens eine für das Fahrzeug geplante zu befolgende Trajektorie umfassen.According to one embodiment, the vehicle may be an off-road vehicle, where the task may include interaction of the off-road vehicle with granular material in the work environment. The vehicle or off-road vehicle may be a bulldozer, a bulldozer, a compactor, a dumper, an excavator, a construction vehicle, a heavy machinery, a heavy-duty vehicle or another type of vehicle that has a number of assignments that interact with the environment, more specifically the granular material. Examples of these types of assignments or actions may include grading, dumping granular material, compacting an area, removing granular material, etc. The granular material may include earth, sand, snow, rubble, rock and/or similar particulate material. The agent may include at least one trajectory planned for the vehicle to follow.
Außerdem ist vorteilhaft ein Computerprogrammprodukt oder Computerprogramm mit Programmcode, der auf einem Maschinen-lesbaren Träger- oder Speicherungsmedium, wie etwa Halbleiterspeicherung, Festplattenspeicherung oder optischer Speicherung, gespeichert sein kann und verwendet wird, um die Schritte des Verfahrens nach einer der zuvor beschriebenen Ausführungsformen auszuführen, zu implementieren und/oder zu steuern, insbesondere, wenn das Programmprodukt oder das Programm auf einem Computer oder einer Vorrichtung ausgeführt wird.In addition, a computer program product or computer program with program code, which can be stored on a machine-readable carrier or storage medium, such as semiconductor storage, hard disk storage or optical storage, and is used to carry out the steps of the method according to one of the previously described embodiments, is advantageous. to implement and/or control, especially when the program product or program is executed on a computer or device.
Eine Ausführungsform kann als Upstream-Teil in einer Maschinenlern-Werkzeugkette verwendet werden. Das Verfahren zum Bereitstellen eines trainierten Maschinenlern-Agenten, ausgelegt zum Steuern einer Einrichtung, kann einen Kern-Maschinenlern-Algorithmus repräsentieren, mit dem die Datenqualität für das Lernen verbessert werden kann. Es kann als ein Verfahren zum Trainieren eines Maschinenlernsystems verwendet werden, das für im Folgenden erwähnte Anwendungen benutzt werden kann. Nachdem es auf diese Weise trainiert ist, kann ein Maschinenlernsystem dann wie im Folgenden skizziert in Downstream-Gebrauch genommen werden. Anders ausgedrückt, kann es verwendet werden, um algorithmische Agenten zu trainieren, die ähnlich wie Menschen beim Lösen oder Ausführen von Aufgaben arbeiten, wie etwa, aber ohne Beschränkung darauf, autonomes Fahren, Robotik, Steuerung und mehr. Ein Steuersignal zum Steuern eines physischen Systems, wie etwa eines Geländefahrzeugs, einer Computer-gesteuerten Maschine, wie eines Roboters, eines Fahrzeugs oder einer beliebigen anderen Einrichtung, kann berechnet oder erzeugt werden.One embodiment may be used as an upstream part in a machine learning toolchain. The method of providing a trained machine learning agent designed to control a device may represent a core machine learning algorithm that can improve data quality for learning. It can be used as a method for training a machine learning system that can be used for applications mentioned below. Once trained in this way, a machine learning system can then be put into downstream use as outlined below. In other words, it can be used to train algorithmic agents to perform similarly to humans in solving or executing tasks such as, but not limited to, autonomous driving, robotics, control, and more. A control signal for controlling a physical system, such as an off-road vehicle, under computer control th machine, such as a robot, a vehicle or any other device, can be calculated or generated.
Ausführungsformen des hier dargestellten Ansatzes werden in den Zeichnungen dargestellt und in der nachfolgenden Beschreibung ausführlicher erläutert.
-
1 zeigt eine schematische Ansicht einer Ausführungsform einer Vorrichtung in einem Fahrzeug; -
2 zeigt ein Flussdiagramm einer Ausführungsform eines Verfahrens zum Bereitstellen eines zum Steuern einer Einrichtung ausgelegten trainierten Maschinenlern-Agenten; -
3 zeigt ein Flussdiagramm einer Ausführungsform eines Verfahrens zum Steuern einer Einrichtung; -
4 zeigt schematische Darstellungen von Simulationen einer Menge von Aktionen einer Einrichtung zur Lösung einer Aufgabe in einer Arbeitsumgebung; und -
5 zeigt schematische Darstellungen einer Simulation einer Menge von Aktionen einer Einrichtung zur Lösung einer Aufgabe in einer Arbeitsumgebung.
-
1 shows a schematic view of an embodiment of a device in a vehicle; -
2 shows a flowchart of an embodiment of a method for providing a trained machine learning agent designed to control a device; -
3 shows a flowchart of an embodiment of a method for controlling a device; -
4 shows schematic representations of simulations of a set of actions of a device to solve a task in a work environment; and -
5 shows schematic representations of a simulation of a set of actions of a device to solve a task in a work environment.
In der folgenden Beschreibung vorteilhafter Ausführungsformen der vorliegenden Erfindung werden in den verschiedenen Figuren dargestellte ähnlich wirkende Elemente mit denselben oder ähnlichen Bezugszahlen bezeichnet, wobei wiederholte Beschreibung dieser Elemente ausgelassen werden soll.In the following description of advantageous embodiments of the present invention, similar acting elements shown in the various figures are referred to with the same or similar reference numbers, with repeated description of these elements being omitted.
Insbesondere ist das die Einrichtung beispielhaft repräsentierende Fahrzeug 100 hier ein Geländefahrzeug, zum Beispiel eine Planierraupe, ein Bulldozer, ein Verdichter, ein Dumper, ein Bagger, ein Baufahrzeug, eine schwere Maschine, ein Schwerlastfahrzeug oder eine andere Art von Fahrzeug sein, die eine Anzahl von Zuweisungen aufweist, die Interaktion mit der Umgebung, spezieller dem körnigen Material, umfassen. Bei anderen Ausführungsformen kann die Einrichtung eine computer-gesteuerte Maschine sein, wie etwa ein Roboter, eine andere Art von Fahrzeug oder eine beliebige andere Einrichtung.In particular, the
Das Fahrzeug 100 umfasst die Vorrichtung 105. Ferner umfasst das Fahrzeug 100 mindestens einen Aktor 102 zum Bewirken oder Ausführen einer Aktion des Fahrzeugs 100. Die Vorrichtung 105 und der Aktor 102 sind zur Signalkommunikation oder Datenkommunikation miteinander verbunden.The
Die Vorrichtung 105 umfasst eine Initialisierungseinheit 110, eine Erzeugungseinheit 120 und eine Trainingseinheit 130, die einen Bereitstellungsteil der Vorrichtung 105 repräsentieren, und gegebenenfalls auch eine Bestimmungseinheit 140 und eine Ausgabeeinheit 150, die einen Steuerteil der Vorrichtung 105 repräsentieren. Gemäß der Darstellung in
Die Initialisierungseinheit 110 ist ausgelegt zum Initialisieren eines ursprünglichen Maschinenlern-Agenten 112 in einem vortrainierten Zustand und einer Simulation 114 auf Ereignisbasis für einen Agenten, wie etwa den Agenten 112 und/oder 135 zur Lösung der Aufgabe. Die Simulation 114 auf Ereignisbasis ist ausgelegt zum Bereitstellen von Informationen bezüglich Agent-Interaktionen mit der Arbeitsumgebung. Die Initialisierungseinheit 110 ist auch ausgelegt zum Weiterleiten des ursprünglichen Maschinenlern-Agenten 112 und der Simulation 114 auf Ereignisbasis zu der Erzeugungseinheit 120. Die Erzeugungseinheit 120 ist ausgelegt zum Erzeugen einer Hybrid-Simulation 122 durch kombinieren der Simulation 114 auf Ereignisbasis und einer Lokalisierungssimulation auf Zeitbasis. Die Lokalisierungssimulation auf Zeitbasis umfasst ein Sensormodell und ein Fehlermodell. Das Sensormodell repräsentiert simulierte Messdaten, erhalten durch einen simulierten Sensor in vorbestimmten Zeitintervallen mit Bezug auf aus der Simulation 114 auf Ereignisbasis extrahierte Agent-Posen. Das Fehlermodell repräsentiert an dem simulierten Sensor wirkendes simuliertes Rauschen. Die Erzeugungseinheit 120 ist hier dafür ausgelegt, die Lokalisierungssimulation auf Zeitbasis oder die simulierten Messdaten aus der Simulation 140 auf Ereignisbasis zu erzeugen. Die Erzeugungseinheit 120 ist auch ausgelegt zum Weiterleiten des ursprünglichen Maschinenlern-Agenten 112 und der Hybrid-Simulation 122 zu der Trainingseinheit 130. Die Trainingseinheit 130 ist ausgelegt zum Trainieren des ursprünglichen Maschinenlern-Agenten 112 unter Verwendung der Hybrid-Simulation 122, um den trainierten Maschinenlern-Agenten 135 bereitzustellen.The initialization unit 110 is configured to initialize an original
Die Bestimmungseinheit 140 ist ausgelegt zum Empfangen oder Lesen des trainierten Maschinenlern-Agenten 135, der durch den Bereitstellungsteil der Vorrichtung 105 bereitgestellt wird. Die Bestimmungseinheit 140 ist außerdem dafür ausgelegt, unter Verwendung des trainierten Maschinenlern-Agenten 135 ein Steuersignal 145 zu bestimmen. Ferner ist die Bestimmungseinheit 140 dafür ausgelegt, das Steuersignal 145 zu der Ausgabeeinheit 150 weiterzuleiten. Die Ausgabeeinheit 150 ist ausgelegt zum Ausgeben des Steuersignals 145 an mindestens einen Aktor 102, um die Einrichtung, hier das Fahrzeug 100, zu steuern. Gemäß einer Ausführungsform kann der Steuerungsteil ein getrennter Teil sein, der von der Vorrichtung 105 verschieden ist.The determination unit 140 is designed to receive or read the trained
Gemäß einer Ausführungsform werden im Schritt 220 des Erzeugens der aus der Simulation auf Ereignisbasis extrahierten Agent-Posen durch Erzeugung einer Trajektorie auf Zeitbasis aus einer Trajektorie aus der Simulation auf Ereignisbasis und durch Interpolieren der Agent-Posen aus der Trajektorie auf Zeitbasis gemäß den vorbestimmten Zeitintervallen, die einer Abtastfrequenz des simulierten Sensors entsprechen. Außerdem werden die simulierten Messdaten aus den Agent-Posen extrapoliert. Ferner wird das Fehlermodell durch Addieren des simulierten Rauschens zu den simulierten Messdaten für jedes Zeitintervall auf das Sensormodell angewandt. Gemäß einer Ausführungsform wird in Schritt 230 des Trainings Entscheidungsfindungsleistungsfähigkeit des ursprünglichen Maschinenlern-Agenten durch Betrachtung eines Agent-Verhaltens auf der Basis der Simulation auf Ereignisbasis und des Agent-Verhaltens auf der Basis der Hybrid-Simulation evaluiert.According to one embodiment, in
Im Schritt 335 des Bereitstellens wird ein trainierter Maschinenlern-Agent durch Ausführen der Schritte des Verfahrens zum Bereitstellen wie in
Gemäß einer Ausführungsform ist die Einrichtung ein Geländefahrzeug und die zu lösende Aufgabe umfasst Interaktion des Geländefahrzeugs mit körnigem Material in der Arbeitsumgebung.According to one embodiment, the device is an off-road vehicle and the task to be solved includes interaction of the off-road vehicle with granular material in the work environment.
Die Einrichtung ist die Einrichtung wie in
Die Simulation in der ersten Darstellung 400A ist die in beliebigen der vorhergehenden Figuren erwähnte Simulation auf Ereignisbasis. Anders ausgedrückt, repräsentiert die Simulation in der ersten Darstellung 400A „echte“ Daten. Die erste Darstellung 400A zeigt einen Terminalzustand nach einer ersten Menge von durch die Einrichtung unternommenen Aktionen 401 A auf der Basis der Simulation auf Ereignisbasis. Die Simulation in der zweiten Darstellung 400B ist die in beliebigen der vorhergehenden Figuren erwähnte Hybrid-Simulation. Anders ausgedrückt, repräsentiert die Simulation in der zweiten Darstellung 400B „gemessene“ Daten. Die zweite Darstellung 400B zeigt einen Terminalzustand nach einer zweiten Menge von durch die Einrichtung unternommenen Aktionen 401 B auf der Basis der Hybrid-Simulation.The simulation in the
Spezieller und anders ausgedrückt, zeigt
Anders ausgedrückt, zeigt
Mit Bezug auf die oben erwähnten Figuren sollen Ausführungsformen der vorliegenden Erfindung, der Hintergrund von Ausführungsformen und Vorteile von Ausführungsformen anders ausgedrückt im Folgenden zusammengefasst werden.With reference to the above-mentioned figures, embodiments of the present invention, the background of embodiments and advantages of embodiments, in other words, will be summarized below.
Die ereignisgesteuerten Simulationen 114 sind Simulationen, bei denen jede Transaktion in der Simulation durch ein Ereignis hervorgerufen wird. Ein Beispiel für ein Ereignis wäre ein Auto, das in einer autonomen Fahranwendung die Bremsen betätigt. Ein anderes Beispiel wäre ein Rasenmäher, der sein Ziel erreicht hat, indem er alles Gras im Garten gemäht hat. Zeitgesteuerte Simulationen simulieren ein System mit einigen in ihm installierten Sensoren. Einer dieser Sensoren kann als der „Primärsensor“ betrachtet werden. Ein solcher Sensor kann in einer gewissen Abtastfrequenz aktiviert werden. Bei diesen Arten von Simulationen wird jede Transaktion in der Simulation durch einen zugeordneten Zeitstempel und eine Aufzeichnung der Informationen des simulierten Sensors bzw. der simulierten Sensoren hervorgerufen. Ein Beispiel ist eine IMU (Trägheitsmesseinheit), die dafür ausgelegt ist, Abtastwerte zum Beispiel mit 20 Abtastwerten pro Sekunde (SPS) bereitzustellen. In diesen Simulationen kann jeder Eintrag alle 50 Millisekunden bereitgestellt werden und kann die Informationen umfassen, die aufgezeichnet worden wären, wenn eine tatsächliche Messeinrichtung mit einer Aufzeichnungseinrichtung verbunden würde.The event-driven
Im vorliegenden Fall basiert die Simulation auf Ereignissen, da sie für das Training von Verstärkungslern- bzw. RL-Agenten, wie etwa des Agenten 112, ausgelegt ist. Im Allgemeinen sind zum Training von RL-Agenten Simulatoren oder Simulationen ereignisgesteuert, da sie Informationen über die Interaktion des Agenten mit der Umgebung bereitstellen sollen und keine spezifischen Sensorinformationen umfassen. Dementsprechend liefern sie keine mit Zeitstempeln gekoppelte Sensorinformationen. Außerdem müssen RL-Simulationen im Allgemeinen schnell sein, da sie viele Male zum Training des RL-Agenten 112 laufengelassen werden. Wie bereits erwähnt, basiert die Simulation auf Ereignissen, da sie RL-Agenten trainieren und die Informationen über die Interaktion zwischen dem Agenten und der Umgebung erfassen soll. Um Fähigkeiten der Entscheidungsfindung unter Unbestimmtheiten hinzuzufügen, werden Fähigkeiten auf Zeitbasis hinzugefügt. Dementsprechend wird für jede Sub-Verzögerung in der Trainingsepisode die Pose, d.h. Position und Lage, des Agenten aufgezeichnet. Diese Posen werden dann auf die gewünschte Abtastfrequenz einer bestimmten IMU interpoliert. Aus diesen Posen werden dann die simulierten Messungen einer IMU berechnet. Zu diesen „echten“ IMU-Messungen wird typisches Rauschen hinzugefügt. Als Ergebnis werden fehlerhafte Posen aufgezeichnet, und Unbestimmtheiten bezüglich der Pose des Agenten können betrachtet werden, und die Leistungsfähigkeit des Agenten unter diesen Unbestimmtheiten kann betrachtet werden.In this case, the simulation is event-based because it is designed for training reinforcement learning or RL agents, such as
Die Hybrid- oder kombinierte Simulation 122, die durch den oben erwähnten Prozess erhalten wird, ist in dem Sinne einzigartig, als sie Mittel zur Untersuchung von auf Zeit basierenden Betrachtungen eines Systems, eingebettet in einer Simulation 114 auf Ereignisbasis, bereitstellen kann. Diese beiden Arten von Simulationen bleiben hier entflochten. Eine solche Entflechtung ist erwünscht, da Simulationen 114 auf Ereignisbasis die Interaktion des Agenten und der Umgebung erfassen sollen, während Simulationen auf Zeitbasis spezifische Messeinrichtungen simulieren und sensorische Informationen und einen Zeitstempel für jede Zeitaufzeichnung der Episode bereitstellen sollen. Bei der Agent- und Umgebung-Interaktion werden Beobachtungen ot von der Umgebung erhalten, Aktionen at mit Bezug auf die Umgebung unternommen und als Reaktion darauf eine Belohnung r1 erhalten.The hybrid or combined
Auf der Basis einer Sub-Trajektorie aus einer Simulation 114 auf Ereignisbasis, wie etwa der in der ersten Darstellung 500A von
Dieser Prozess zum Kombinieren von zwei Arten von Simulationen, ausgeführt durch die Vorrichtung wie in
Immer wenn eine Ausführungsform eine Verknüpfung „und/oder“ zwischen einem ersten Merkmal und einem zweiten Merkmal umfasst, soll dies bedeuten, dass die Ausführungsform in einer ersten Variante sowohl das erste Merkmal als auch das zweite Merkmal umfasst und in einer weiteren Variante entweder das erste Merkmal oder das zweite Merkmal umfasst.Whenever an embodiment includes a link “and/or” between a first feature and a second feature, this is intended to mean that the embodiment includes both the first feature and the second feature in a first variant and either the first in a further variant Feature or the second feature includes.
Claims (10)
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102022207286.3A DE102022207286B3 (en) | 2022-07-18 | 2022-07-18 | Device and computer-implemented method for providing a trained machine learning agent designed to control a device, device and method for controlling a device and vehicle |
JP2023115834A JP2024012269A (en) | 2022-07-18 | 2023-07-14 | Apparatus and computer implemented method for providing machine learning agent that is designed and trained to control device, apparatus and method for controlling device, and vehicle |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102022207286.3A DE102022207286B3 (en) | 2022-07-18 | 2022-07-18 | Device and computer-implemented method for providing a trained machine learning agent designed to control a device, device and method for controlling a device and vehicle |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102022207286B3 true DE102022207286B3 (en) | 2023-09-28 |
Family
ID=87931049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102022207286.3A Active DE102022207286B3 (en) | 2022-07-18 | 2022-07-18 | Device and computer-implemented method for providing a trained machine learning agent designed to control a device, device and method for controlling a device and vehicle |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2024012269A (en) |
DE (1) | DE102022207286B3 (en) |
-
2022
- 2022-07-18 DE DE102022207286.3A patent/DE102022207286B3/en active Active
-
2023
- 2023-07-14 JP JP2023115834A patent/JP2024012269A/en active Pending
Non-Patent Citations (3)
Title |
---|
Eldabi T.: Systemic Characteristics to Support Hybrid Simulation Modeling. In: Proceedings of the 2021 Winter Simulation Conference, 2021, 1-10. https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9715534&tag=1 [abgerufen am 04.04.2023] |
Popovič, R. Kliment M., Trebuňa P., Pekarčíková M.: Simulation as a Tool for Process Optimization of Logistic Systems. In: International Scientific Journal about Logistics, 2, 2015, 3, 1-5. https://www.actalogistica.eu/issues/2015/III_2015_01_Popovic_Kliment_Trebuna_Pekarcikova.pdf [abgerufen am 04.04.2023] |
Wischnewski R., Roßmann J.: A New Hybrid Time-Based / Event-Based Simulation Method for Transport Systems Considering Physical Effects. In: IEEE Conference on Robotics, Automation and Mechatronics , 2010, 470-475. https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=5513149&tag=1 [abgerufen am 04.04.2023] |
Also Published As
Publication number | Publication date |
---|---|
JP2024012269A (en) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102005026040A1 (en) | Parameterization of a simulation working model | |
EP3757795A1 (en) | Method and device for optimal distribution of test cases to different test platforms | |
DE102019203712B4 (en) | Method for training at least one algorithm for a control unit of a motor vehicle, computer program product, motor vehicle and system | |
DE102019215903A1 (en) | Method and device for generating training data for a recognition model for recognizing objects in sensor data of a sensor, in particular of a vehicle, method for training and method for actuation | |
WO2017114883A1 (en) | Method for configuring a co-simulation for a total system | |
DE112020001543T5 (en) | Vehicle position detection device and parameter set generation device for detecting the vehicle position | |
DE102018220865A1 (en) | Method for training at least one algorithm for a control device of a motor vehicle, computer program product and motor vehicle | |
EP3271841A1 (en) | Method for computer-supported development of an overall system consisting of subsystems | |
DE102020214231A1 (en) | METHOD OF CONTROLLING A ROBOT DEVICE AND ROBOT CONTROLLER | |
DE102019212602A1 (en) | Method for the quantitative characterization of at least one temporal sequence of an object attribute error of an object | |
WO2019119011A1 (en) | Behaviour model of an environment sensor | |
EP3757792A2 (en) | Method and device for testing a system, for selecting real tests and for testing systems with machine learning components | |
DE102019134053A1 (en) | Process for the continuous validation of automated driving functions applied in driving tests | |
DE102022207286B3 (en) | Device and computer-implemented method for providing a trained machine learning agent designed to control a device, device and method for controlling a device and vehicle | |
DE102021110309A1 (en) | Method for modeling human driving behavior for training motion controllers based on a neural network | |
DE102017201796A1 (en) | Control device for determining a self-motion of a motor vehicle and motor vehicle and method for providing the control device | |
DE102021204797A1 (en) | Apparatus and method for learning a guideline for off-road vehicles for construction sites | |
EP2642359A1 (en) | Device for developing and method for creating a programm for an electronical control unit | |
EP3979009A1 (en) | Creation of a simplified model for xil systems | |
DE102018205660A1 (en) | Simulating statistically modeled sensor data | |
DE102021114768A1 (en) | Vehicle control using a neural network controller in combination with a model-based controller | |
DE102020123255A1 (en) | Robot control device | |
DE102016216268A1 (en) | GENERATION OF SENSOR DATA IN A VIRTUAL ROAD ENVIRONMENT | |
AT524822A1 (en) | Method for testing a driver assistance system of a vehicle | |
DE102020102996A1 (en) | Process for an integrated design for the modeling, simulation and testing of a real-time architecture within a model-based system and software development |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R163 | Identified publications notified | ||
R012 | Request for examination validly filed | ||
R016 | Response to examination communication | ||
R018 | Grant decision by examination section/examining division |