DE102023100839A1 - Computer-implemented, iterative method for adapting a machine learning model, data processing device, computer program and computer-readable storage medium - Google Patents

Computer-implemented, iterative method for adapting a machine learning model, data processing device, computer program and computer-readable storage medium Download PDF

Info

Publication number
DE102023100839A1
DE102023100839A1 DE102023100839.0A DE102023100839A DE102023100839A1 DE 102023100839 A1 DE102023100839 A1 DE 102023100839A1 DE 102023100839 A DE102023100839 A DE 102023100839A DE 102023100839 A1 DE102023100839 A1 DE 102023100839A1
Authority
DE
Germany
Prior art keywords
machine learning
learning model
iteration
data set
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102023100839.0A
Other languages
German (de)
Inventor
Milan Jonah Rohde
Anton Bruch
Hans-Arne Driescher
Alessandro Montesi
Peter Schlicht
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cariad SE
Original Assignee
Cariad SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cariad SE filed Critical Cariad SE
Priority to DE102023100839.0A priority Critical patent/DE102023100839A1/en
Publication of DE102023100839A1 publication Critical patent/DE102023100839A1/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

Die Erfindung betrifft ein computer-implementiertes, iteratives Verfahren zum Adaptieren eines maschinellen Lernmodells für ein Startszenario, wobei das maschinelle Lernmodell auf Grundlage eines Trainingsdatensatzes mit einer Mehrzahl von Datenpunkten mit einer Annotierung zum Trainieren des maschinellen Lernmodells für das Startszenario dazu trainiert ist, einem Eingangsdatenpunkt eine Annotierung aus der Mehrzahl von Klassen vorherzusagen.The invention relates to a computer-implemented, iterative method for adapting a machine learning model for a starting scenario, wherein the machine learning model is trained on the basis of a training data set with a plurality of data points with an annotation for training the machine learning model for the starting scenario to predict an annotation from the plurality of classes for an input data point.

Description

Die Erfindung betrifft ein computer-implementiertes, iteratives Verfahren zum Adaptieren eines maschinellen Lernmodells. Die Erfindung betrifft ferner eine Datenverarbeitungseinrichtung, ein Computerprogramm und ein computerlesbares Speichermedium.The invention relates to a computer-implemented, iterative method for adapting a machine learning model. The invention further relates to a data processing device, a computer program and a computer-readable storage medium.

Ausgangspunkt der Erfindung ist eine maschinelle Lern-(ML-)Anwendung, die beispielsweise zur Verwendung in einem Kraftfahrzeug entwickelt worden ist. Die ML-Anwendung kann eine Anwendung zum computerbasierten Sehen für eine Fahrassistenzfunktion oder zum autonomen Fahren sein. Die ML-Anwendung verarbeitet Eingangsdaten. Die Eingangsdaten können Daten von einem Sensor, beispielsweise Bilder oder Sequenzen von Bildern (Videos), sein. Die Aufgabe des ML-Modells kann beispielsweise die Objekterkennung (Klassifikation oder semantische Segmentierung) sein.The starting point of the invention is a machine learning (ML) application that has been developed, for example, for use in a motor vehicle. The ML application can be an application for computer-based vision for a driver assistance function or for autonomous driving. The ML application processes input data. The input data can be data from a sensor, for example images or sequences of images (videos). The task of the ML model can be, for example, object recognition (classification or semantic segmentation).

Angenommen, die ML-Anwendung wurde für ein Szenario A (Startszenario) entwickelt und soll an ein Szenario B (Zielszenario) adaptiert werden. Beispielhaft seien folgende Fälle genannt:

  • - Szenario A ist die Verwendung in Land 1 und Szenario B ist die Verwendung in Land 2;
  • - Szenario A ist die Verwendung in einer städtischen Umgebung und Szenario B ist die Verwendung in einer ländlichen Umgebung;
  • - Szenario A ist die Verwendung auf kleinen Feldwegen und Szenario B ist die Verwendung auf Fernverkehrsstraßen; oder
  • - Szenario A ist die Verwendung während des Tages und Szenario B ist die Verwendung während der Nacht.
Assume that the ML application was developed for a scenario A (start scenario) and is to be adapted to a scenario B (target scenario). The following cases are examples:
  • - Scenario A is use in country 1 and Scenario B is use in country 2;
  • - Scenario A is use in an urban environment and Scenario B is use in a rural environment;
  • - Scenario A is use on small country lanes and Scenario B is use on main roads; or
  • - Scenario A is use during the day and Scenario B is use during the night.

Das ML-Modell wurde mit einem Trainingsdatensatz trainiert, der für Szenario A gesammelt wurde. Die Herausforderung ist es, geeignete Trainingsdaten zum Trainieren des ML-Modells zu sammeln, um die Verwendung des ML-Modells auf Szenario B zu erweitern.The ML model was trained using a training dataset collected for Scenario A. The challenge is to collect suitable training data to train the ML model in order to extend the use of the ML model to Scenario B.

ML-Modelle können die Eigenschaft haben, dass sie zu unterschiedlichen Situationen „um die Trainingsdaten herum“ bereits verallgemeinern. Daher ist es nicht eindeutig feststellbar, für welche Aspekte des Szenarios B das ML-Modell funktioniert und für welche Aspekte in dem Szenario B zusätzliche Trainingsdaten gesammelt werden müssen. Dies ist insbesondere in einem frühen Vorbereitungsstadium eines Rollouts für Szenario B anspruchsvoll, da nur wenige oder gar keine Informationen darüber existieren, welche Daten gesammelt werden sollten.ML models can have the property that they already generalize to different situations "around the training data". Therefore, it is not clear for which aspects of scenario B the ML model works and for which aspects in scenario B additional training data must be collected. This is particularly challenging in an early preparation stage of a rollout for scenario B, since little or no information exists about which data should be collected.

Das Sammeln und Verarbeiten (inklusive des Klassifizierens) neuer Trainingsdaten kann umfangsreich sein. Daher ist es ein Ziel bevorzugter Ausgestaltungen der Erfindung, an ein Verständnis darüber zu gelangen, welche Trainingsdaten für Szenario B erforderlich sind. Alternativ kann man alle möglichen Daten für Szenario sammeln, was allerdings nicht befriedigend ist, weil sehr viele Daten möglicherweise nicht viel dazu beitragen, die bestehenden Daten für Szenario A zu ergänzen. Ein solches Verfahren kann ineffizient und rechenintensiv sein und würde sehr viel Zeit in Anspruch nehmen.Collecting and processing (including classifying) new training data can be extensive. Therefore, a goal of preferred embodiments of the invention is to gain an understanding of what training data is required for scenario B. Alternatively, one can collect all possible data for scenario B, but this is not satisfactory because a large amount of data may not contribute much to supplementing the existing data for scenario A. Such a process can be inefficient and computationally intensive and would take a very long time.

Mit dem Verständnis, welche Daten erforderlich sind, können die geeignete Daten gesammelt, dem bestehenden Trainingsdatensatz hinzugefügt und schließlich das ML-Modell zusätzlich für Szenario B trainiert werden.With an understanding of what data is required, the appropriate data can be collected, added to the existing training dataset, and finally the ML model can be additionally trained for scenario B.

Die US 2016 / 0 070 986 A1 , die US 2020 / 0 364 520 A1 und die US 2022 / 0 219 698 A1 sind Stand der Technik.The US 2016 / 0 070 986 A1 , the US 2020 / 0 364 520 A1 and the US 2022 / 0 219 698 A1 are state of the art.

Die Erfindung hat sich zur Aufgabe gestellt, ein effizientes, ressourcenschonendes und schnelles Verfahren zum Erweitern eines maschinellen Lernmodells für den Einsatz in einem vorgegebenen Zielszenario zu schaffen.The invention aims to provide an efficient, resource-saving and fast method for extending a machine learning model for use in a given target scenario.

Gemäß einem Aspekt schafft die Erfindung ein computer-implementiertes, iteratives Verfahren zum Adaptieren eines maschinellen Lernmodells, das für ein Startszenario vorgesehen oder sogar schon trainiert ist, an ein Zielszenario, wobei das maschinelle Lernmodell auf Grundlage eines Trainingsdatensatzes mit einer Mehrzahl von (dem Startszenario entstammenden) Datenpunkten mit einer Annotierung (d.h. es sind sogenannte gelabelte Datenpunkte) zum Trainieren des maschinellen Lernmodells für das Startszenario dazu trainierbar ist, einem Eingangsdatenpunkt eine Annotierung vorherzusagen oder zu inferieren, das Verfahren umfassend:

  1. a) In einem Iterationsschritt einer Iteration, Sammeln eines Adaptionsdatensatzes mit einer Mehrzahl von (dem Zielszenario entstammenden) Datenpunkten zum Trainieren des maschinellen Lernmodells für das Zielszenario;
  2. b) In dem Iterationsschritt der Iteration, Zuweisen einer Annotierung zu den jeweiligen Datenpunkten des gesammelten Adaptionsdatensatzes;
  3. c) In dem Iterationsschritt der Iteration, Testen des auf Grundlage des Trainingsdatensatzes (für das Startszenario) trainierten, maschinellen Lernmodells mit dem in dem Iterationsschritt gesammelten Adaptionsdatensatz oder einer Teilmenge davon, wobei die Datenpunkte des in dem Iterationsschritt gesammelten Adaptionsdatensatzes oder der Teilmenge davon jeweils als Eingangsdatenpunkt für das maschinelle Lernmodell dienen;
  4. d) Feststellen für jeden Eingangsdatenpunkt, ob die durch das in Schritt c) getestete, maschinelle Lernmodell vorhergesagte Annotierung zugewiesenen Annotierung entspricht;
  5. e) In einem weiteren Iterationsschritt der Iteration, Sammeln eines weiteren Adaptionsdatensatzes mit einer Mehrzahl von Datenpunkten zum Trainieren des maschinellen Lernmodells für das Zielszenario auf Grundlage der Feststellung in Schritt d) und Fortfahren mit Schritt b) in dem weiteren Iterationsschritt der Iteration mit dem weiteren Adaptionsdatensatz; und
  6. f) Beenden der Iteration durch Trainieren des maschinellen Lernmodells mit den Datenpunkten des Trainingsdatensatzes und den in den Iterationsschritten gesammelten Adaptionsdatensätzen zum Adaptieren des für das Startszenario vorgesehenen maschinellen Lernmodells an das Zielszenario.
According to one aspect, the invention provides a computer-implemented, iterative method for adapting a machine learning model, which is intended for a starting scenario or even already trained, to a target scenario, wherein the machine learning model can be trained on the basis of a training data set with a plurality of data points (originating from the starting scenario) with an annotation (ie they are so-called labeled data points) for training the machine learning model for the starting scenario to predict or infer an annotation for an input data point, the method comprising:
  1. a) In an iteration step of an iteration, collecting an adaptation dataset with a plurality of data points (originating from the target scenario) for training the machine learning model for the target scenario;
  2. b) In the iteration step of the iteration, assigning an annotation to the respective data points of the collected adaptation dataset;
  3. c) In the iteration step of the iteration, testing the machine learning model trained on the basis of the training data set (for the starting scenario) with the adaptation data set collected in the iteration step or a subset thereof, wherein the data points of the adaptation data set collected in the iteration step tion dataset or subset thereof serve as input data points for the machine learning model;
  4. d) determining, for each input data point, whether the annotation predicted by the machine learning model tested in step c) corresponds to the assigned annotation;
  5. e) In a further iteration step of the iteration, collecting a further adaptation data set with a plurality of data points for training the machine learning model for the target scenario based on the determination in step d) and continuing with step b) in the further iteration step of the iteration with the further adaptation data set; and
  6. f) Terminating the iteration by training the machine learning model with the data points of the training dataset and the adaptation datasets collected in the iteration steps to adapt the machine learning model intended for the start scenario to the target scenario.

Ein Vorteil des Verfahrens kann sein, dass nur Adaptionsdatensätze zum Trainieren gesammelt werden, die zum Adaptieren des maschinellen Lernmodells von dem Startszenario an das Zielszenario erforderlich und geeignet sind. Adaptionsdatensätze mit Datenpunkten, deren Annotierung durch das bestehende, trainierte maschinelle Lernmodell bereits ausreichend vorhergesagt werden, können unberücksichtigt bleiben. Somit wird eine Datenmenge der gesammelten Adaptionsdatensätze gering gehalten. Das Verfahren ermöglicht somit ein effizientes Adaptieren des maschinellen Lernmodells. Das Sammeln kann erfolgen, indem das Kraftfahrzeug oder zumindest ein anderes Testfahrzeug in Umgebungsszenarien betrieben wird, die den Datenpunkten mit Falscherkennung entsprechen, und dabei die weiteren Datenpunkte aufgezeichnet werden.One advantage of the method can be that only adaptation data sets are collected for training that are necessary and suitable for adapting the machine learning model from the starting scenario to the target scenario. Adaptation data sets with data points whose annotation is already sufficiently predicted by the existing, trained machine learning model can be disregarded. This keeps the amount of data in the collected adaptation data sets to a minimum. The method thus enables efficient adaptation of the machine learning model. The collection can be carried out by operating the motor vehicle or at least another test vehicle in environmental scenarios that correspond to the data points with false detection and recording the other data points.

Ein Datenpunkt kann einem Bild, einer Sequenz von Bildern (Video) oder sonstigen Daten entsprechen. Die Datenpunkte können von einem beliebigen Sensor aufgezeichnet worden sein. Beispielsweise können die Datenpunkte von einem Sensor in dem Kraftfahrzeug aufgezeichnet worden sein.A data point can correspond to an image, a sequence of images (video) or other data. The data points can have been recorded by any sensor. For example, the data points can have been recorded by a sensor in the motor vehicle.

Jeder Datenpunkt weist eine Annotierung auf. Entspricht der Datenpunkt beispielsweise einem Bild, kann als Annotierung des Datenpunktes jedem Pixel eine Klasse zugewiesen sein (wie bei der semantischen Segmentierung). Alternativ kann als Annotierung des Datenpunktes ein Ausschnitt (Bounding Box) definiert sein und diesem Ausschnitt eine Klasse zugewiesen sein. Eine Annotierung kann somit die Zuweisung des Datenpunkts oder eines Teils zu einer Klasse aus einer Mehrzahl von Klassen und/oder die Auswahl eines Teils des Datenpunktes sein. Allgemein werden Annotierungen im Bereich des „Supervised Machine Learning“ verwendet. Die Erfindung lässt sich insbesondere auf maschinellen Lernmodelle dieses Bereichs anwenden, aber auch auf beliebige maschinellen Lernmodelle.Each data point has an annotation. If the data point corresponds to an image, for example, each pixel can be assigned a class as an annotation of the data point (as in semantic segmentation). Alternatively, a section (bounding box) can be defined as an annotation of the data point and a class can be assigned to this section. An annotation can thus be the assignment of the data point or a part to a class from a plurality of classes and/or the selection of a part of the data point. Annotations are generally used in the field of "supervised machine learning". The invention can be applied in particular to machine learning models in this field, but also to any machine learning model.

Das maschinelle Lernmodell ist dazu trainierbar, eine Annotierung für einen Eingangsdatenpunkt vorherzusagen oder zu inferieren. Entspricht der Eingangsdatenpunkt beispielsweise wieder einem Bild, kann das maschinelle Lernmodell für jeden Pixel die Klasse bzw. den Ausschnitt und die jeweilige Klasse voraussagen. Das maschinelle Lernmodell prädiziert (inferiert) somit eine pixelweise Klassifizierung und/oder Objekterkennung (d.h. es führt z.B. das Prädizieren von Bounding Boxes durch, um zu erkennen, wo im Bild ein Objekt ist). Das maschinelle Lernmodell kann somit beispielsweise zur semantischen Segmentierung und/oder zur Objekterkennung verwendet werden.The machine learning model can be trained to predict or infer an annotation for an input data point. If the input data point corresponds to an image, for example, the machine learning model can predict the class or section and the respective class for each pixel. The machine learning model thus predicts (infers) a pixel-by-pixel classification and/or object recognition (i.e. it predicts bounding boxes, for example, to recognize where an object is in the image). The machine learning model can thus be used, for example, for semantic segmentation and/or object recognition.

Es ist bevorzugt, dass Schritt e) umfasst:

  • e1) falls in Schritt d) die vorhergesagte Annotierung von der zugewiesenen Annotierung für wenigstens einen oder einer vordefinierten Anzahl von Eingangsdatenpunkten abweicht, Sammeln des weiteren Adaptionsdatensatzes mit einer Mehrzahl von Datenpunkten, die der zugewiesenen Annotierung des wenigstens einen oder der vordefinierten Anzahl von abweichenden Eingangsdatenpunkten zuweisbar sind.
It is preferred that step e) comprises:
  • e1) if in step d) the predicted annotation deviates from the assigned annotation for at least one or a predefined number of input data points, collecting the further adaptation data set with a plurality of data points that are assignable to the assigned annotation of the at least one or the predefined number of deviating input data points.

Vorteilhafterweise werden weitere Adaptionsdatensätze gesammelt, wenn das bestehende, trainierte, maschinelle Lernmodell bei den Adaptionsdatensätzen schlechte Vorhersagen macht. Ein Maß, wie gut oder schlecht das maschinelle Lernmodell für einen Adaptionsdatensatz funktioniert, ist beispielsweise die Anzahl der Datenpunkte, für die die Annotierung im Vergleich zu der zugewiesenen Annotierung richtig bzw. falsch vorhergesagt wurde. Hier kann eine vordefinierte Anzahl eine Schwelle definieren, wobei bei Unterschreiten bzw. Überschreiten ein weiterer Adaptionsdatensatz mit einer Mehrzahl von Datenpunkten, die der zugewiesenen Annotierung der Eingangsdatenpunkte zuweisbar sind, gesammelt wird.Advantageously, additional adaptation data sets are collected if the existing, trained machine learning model makes poor predictions for the adaptation data sets. One measure of how well or poorly the machine learning model works for an adaptation data set is, for example, the number of data points for which the annotation was predicted correctly or incorrectly compared to the assigned annotation. Here, a predefined number can define a threshold, and if this is exceeded or not met, another adaptation data set is collected with a plurality of data points that can be assigned to the assigned annotation of the input data points.

Es ist bevorzugt, dass Schritt c) umfasst:

  • c1) Aufteilen des gesammelten Adaptionsdatensatzes in eine erste Teilmenge und eine zweite Teilmenge;
  • c2) Trainieren des maschinellen Lernmodells auf Grundlage des Trainingsdatensatzes und der ersten Teilmenge des gesammelten Adaptionsdatensatzes; und
  • c3) Testen des in Schritt c2) trainierten, maschinellen Lernmodells mit der zweiten Teilmenge des gesammelten Adaptionsdatensatzes.
It is preferred that step c) comprises:
  • c1) dividing the collected adaptation data set into a first subset and a second subset;
  • c2) training the machine learning model based on the training dataset and the first subset of the collected adaptation dataset; and
  • c3) Testing the machine learning model trained in step c2) with the second subset of the collected adaptation dataset.

Durch Aufteilen des Adaptionsdatensatzes in eine Teilmenge zum Trainieren und eine Teilmenge zum Testen kann das Verfahren noch effizienter gestaltet werden.By dividing the adaptation dataset into a subset for training and a subset for testing, the procedure can be made even more efficient.

Es ist bevorzugt, dass Schritt c) umfasst:

  • c4) Trainieren des maschinellen Lernmodells auf Grundlage des Trainingsdatensatzes und eines Adaptionsdatensatzes oder einer Teilmenge davon eines dem Iterationsschritt vorhergehenden Iterationsschritts.
It is preferred that step c) comprises:
  • c4) Training the machine learning model based on the training data set and an adaptation data set or a subset thereof from an iteration step preceding the iteration step.

Für Anwendungsfälle oder Anwendungssituationen, die sich bei dem Verfahren ergeben können und die hier nicht explizit beschrieben sind, kann vorgesehen sein, dass gemäß dem Verfahren eine Fehlermeldung und/oder eine Aufforderung zur Eingabe einer Nutzerrückmeldung ausgegeben und/oder eine Standardeinstellung und/oder ein vorbestimmter Initialzustand eingestellt wird.For use cases or application situations that may arise during the method and which are not explicitly described here, it may be provided that, in accordance with the method, an error message and/or a request to enter user feedback is issued and/or a default setting and/or a predetermined initial state is set.

Gemäß einem weiteren Aspekt schafft die Erfindung eine Verwendung des maschinellen Lernmodells, das für das Startszenario vorgesehen oder sogar schon trainiert ist, in einem Kraftfahrzeug.According to a further aspect, the invention provides a use of the machine learning model, which is intended for the start-up scenario or even already trained, in a motor vehicle.

Es ist bevorzugt, dass die Verwendung das Adaptieren des maschinellen Lernmodells gemäß einer der vorhergehenden Ausgestaltungen des Verfahrens umfasst.It is preferred that the use comprises adapting the machine learning model according to one of the preceding embodiments of the method.

Es ist bevorzugt, dass die Verwendung das Sammeln des Adaptionsdatensatzes mittels des Kraftfahrzeugs in dem Zielszenario umfasst.It is preferred that the use comprises collecting the adaptation data set by means of the motor vehicle in the target scenario.

Es ist bevorzugt, dass die Verwendung das Übertragen des adaptierten maschinellen Lernmodells an das Kraftfahrzeug umfasst.It is preferred that the use comprises transmitting the adapted machine learning model to the motor vehicle.

Es ist bevorzugt, dass die Verwendung das Anwenden des maschinellen Lernmodells in dem Zielszenario umfasst, insbesondere für die Objektdetektion von Objekten (z.B. Verkehrsteilnehmern) in einer Umgebung des Fahrzeug (sogenannte Computer-Vision-Anwendung).It is preferred that the use comprises applying the machine learning model in the target scenario, in particular for object detection of objects (e.g. road users) in an environment of the vehicle (so-called computer vision application).

Gemäß einem weiteren Aspekt schafft die Erfindung eine Datenverarbeitungseinrichtung, umfassend Mittel zur Ausführung des Verfahrens nach einer der vorhergehenden Ausgestaltungen.According to a further aspect, the invention provides a data processing device comprising means for carrying out the method according to one of the preceding embodiments.

Zu der Erfindung gehört auch die Datenverarbeitungseinrichtung oder die Prozessoreinrichtung, die dazu eingerichtet ist, eine Ausführungsform des erfindungsgemäßen Verfahrens durchzuführen. Die Prozessoreinrichtung kann hierzu zumindest einen Mikroprozessor und/oder zumindest einen Mikrocontroller und/oder zumindest einen FPGA (Field Programmable Gate Array) und/oder zumindest einen DSP (Digital Signal Processor) aufweisen. Des Weiteren kann die Prozessoreinrichtung Programmcode aufweisen, der dazu eingerichtet ist, bei Ausführen durch die Prozessoreinrichtung die Ausführungsform des erfindungsgemäßen Verfahrens durchzuführen. Der Programmcode kann in einem Datenspeicher der Prozessoreinrichtung gespeichert sein. Die Prozessorschaltung der Prozessoreinrichtung kann z.B. zumindest eine Schaltungsplatine und/oder zumindest ein SoC (System on Chip) aufweisen.The invention also includes the data processing device or the processor device, which is set up to carry out an embodiment of the method according to the invention. For this purpose, the processor device can have at least one microprocessor and/or at least one microcontroller and/or at least one FPGA (Field Programmable Gate Array) and/or at least one DSP (Digital Signal Processor). Furthermore, the processor device can have program code that is set up to carry out the embodiment of the method according to the invention when executed by the processor device. The program code can be stored in a data memory of the processor device. The processor circuit of the processor device can, for example, have at least one circuit board and/or at least one SoC (System on Chip).

Zu der Erfindung gehören auch Weiterbildungen der erfindungsgemäßen Datenverarbeitungseinrichtung, die Merkmale aufweisen, wie sie bereits im Zusammenhang mit den Weiterbildungen des erfindungsgemäßen Verfahrens beschrieben worden sind. Aus diesem Grund sind die entsprechenden Weiterbildungen der erfindungsgemäßen Datenverarbeitungseinrichtung hier nicht noch einmal beschrieben.The invention also includes further developments of the data processing device according to the invention, which have features as have already been described in connection with the further developments of the method according to the invention. For this reason, the corresponding further developments of the data processing device according to the invention are not described again here.

Gemäß einem weiteren Aspekt schafft die Erfindung ein Computerprogramm, umfassend Befehle, die bei der Ausführung des Programms durch einen Computer diesen veranlassen, die Schritte des Verfahrens nach einer der vorhergehenden Ausgestaltungen auszuführen.According to a further aspect, the invention provides a computer program comprising instructions which, when the program is executed by a computer, cause the computer to carry out the steps of the method according to one of the preceding embodiments.

Gemäß einem weiteren Aspekt schafft die Erfindung ein computerlesbares Speichermedium, auf dem das Computerprogramm gespeichert ist.According to a further aspect, the invention provides a computer-readable storage medium on which the computer program is stored.

Als eine weitere Lösung umfasst die Erfindung auch ein computerlesbares Speichermedium, umfassend Programmcode, der bei der Ausführung durch eine Prozessorschaltung eines Computers oder eines Computerverbunds diese veranlasst, eine Ausführungsform des erfindungsgemäßen Verfahrens auszuführen. Das Speichermedium kann z.B. zumindest teilweise als ein nichtflüchtiger Datenspeicher (z.B. als eine Flash-Speicher und/oder als SSD - solid state drive) und/oder zumindest teilweise als ein flüchtiger Datenspeicher (z.B. als ein RAM - random access memory) bereitgestellt sein. Das Speichermedium kann in der Prozessorschaltung in deren Datenspeicher angeordnet sein. Das Speichermedium kann aber auch beispielsweise als sogenannter Appstore-Server im Internet betrieben sein. Durch den Computer oder Computerverbund kann eine Prozessorschaltung mit zumindest einem Mikroprozessor bereitgestellt sein. Der Programmcode können als Binärcode oder Assembler und/oder als Quellcode einer Programmiersprache (z.B. C) und/oder als Programmskript (z.B. Python) bereitgestellt sein.As a further solution, the invention also includes a computer-readable storage medium, comprising program code which, when executed by a processor circuit of a computer or a computer network, causes it to carry out an embodiment of the method according to the invention. The storage medium can, for example, be provided at least partially as a non-volatile data memory (e.g. as a flash memory and/or as an SSD - solid state drive) and/or at least partially as a volatile data memory (e.g. as a RAM - random access memory). The storage medium can be arranged in the processor circuit in its data memory. The storage medium can also, for example, be operated as a so-called app store server on the Internet. The computer or computer network can provide a processor circuit with at least one microprocessor. The program code can be provided as binary code or assembler and/or as source code of a programming language (e.g. C) and/or as a program script (e.g. Python).

Die Erfindung umfasst auch die Kombinationen der Merkmale der beschriebenen Ausführungsformen. Die Erfindung umfasst also auch Realisierungen, die jeweils eine Kombination der Merkmale mehrerer der beschriebenen Ausführungsformen aufweisen, sofern die Ausführungsformen nicht als sich gegenseitig ausschließend beschrieben wurden.The invention also includes combinations of the features of the described embodiments. The invention therefore also includes implementations that each have a combination of the features of several of the described embodiments, provided that the embodiments have not been described as mutually exclusive.

Im Folgenden sind Ausführungsbeispiele der Erfindung beschrieben. Hierzu zeigt:

  • 1 eine Ausführungsform eines computer-implementierten, iterativen Verfahrens zum Adaptieren eines maschinellen Lernmodells für ein Startszenario an ein Zielszenario; und
  • 2 eine Ausführungsform eines Schrittes des Verfahrens gemäß 1.
Embodiments of the invention are described below.
  • 1 an embodiment of a computer-implemented, iterative method for adapting a machine learning model for a starting scenario to a target scenario; and
  • 2 an embodiment of a step of the method according to 1 .

Bei den im Folgenden erläuterten Ausführungsbeispielen handelt es sich um bevorzugte Ausführungsformen der Erfindung. Bei den Ausführungsbeispielen stellen die beschriebenen Komponenten der Ausführungsformen jeweils einzelne, unabhängig voneinander zu betrachtende Merkmale der Erfindung dar, welche die Erfindung jeweils auch unabhängig voneinander weiterbilden. Daher soll die Offenbarung auch andere als die dargestellten Kombinationen der Merkmale der Ausführungsformen umfassen. Des Weiteren sind die beschriebenen Ausführungsformen auch durch weitere der bereits beschriebenen Merkmale der Erfindung ergänzbar.The exemplary embodiments explained below are preferred embodiments of the invention. In the exemplary embodiments, the components of the embodiments described each represent individual features of the invention that are to be considered independently of one another and which also develop the invention independently of one another. Therefore, the disclosure should also include combinations of the features of the embodiments other than those shown. Furthermore, the described embodiments can also be supplemented by other features of the invention already described.

In den Figuren bezeichnen gleiche Bezugszeichen jeweils funktionsgleiche Elemente.In the figures, identical reference symbols designate functionally identical elements.

1 zeigt eine Ausführungsform eines computer-implementierten, iterativen Verfahrens zum Adaptieren eines maschinellen Lernmodells für ein Startszenario an ein Zielszenario. 1 shows an embodiment of a computer-implemented, iterative method for adapting a machine learning model for a starting scenario to a target scenario.

Das maschinelle Lernmodell kann unterschiedliche, trainierbare Lernalgorithmen umfassen. Das maschinelle Lernmodell kann in einem Kraftfahrzeug verwendet werden. Beispielsweise kann das maschinelle Lernmodell eine Bildanalyseanwendung in einem Kraftfahrzeug sein, um Funktionen eines Fahrassistenzsystems oder autonome Fahrfunktionen zu ermöglichen.The machine learning model may include different, trainable learning algorithms. The machine learning model may be used in a motor vehicle. For example, the machine learning model may be an image analysis application in a motor vehicle to enable driver assistance system functions or autonomous driving functions.

Das maschinelle Lernmodell ist auf Grundlage eines Trainingsdatensatzes mit einer Mehrzahl von annotierten Datenpunkten zum Trainieren des maschinellen Lernmodells für das Startszenario trainierbar.The machine learning model is trainable based on a training dataset with a plurality of annotated data points for training the machine learning model for the starting scenario.

Ein Datenpunkt kann einem Bild, einer Sequenz von Bildern (Video) oder sonstige Daten entspreechen. Die Datenpunkte können von einem beliebigen Sensor aufgezeichnet worden sein. Beispielsweise können die Datenpunkte von einem Sensor in dem Kraftfahrzeug aufgezeichnet worden sein.A data point can correspond to an image, a sequence of images (video) or other data. The data points can have been recorded by any sensor. For example, the data points can have been recorded by a sensor in the motor vehicle.

Die Datenpunkte weisen jeweils eine Annotierung auf. Eine Annotierung kann ein Feature oder Label eines Datenpunktes sein. Beispielsweise kann eine Annotierung ein Objekt in einem Datenpunkt kennzeichnen.Each data point has an annotation. An annotation can be a feature or label of a data point. For example, an annotation can identify an object in a data point.

Entspricht der Datenpunkt beispielsweise einem Bild, kann als Annotierung des Datenpunktes jedem Pixel eine Klasse zugewiesen sein (wie bei der semantischen Segmentierung). Alternativ kann als Annotierung des Datenpunktes ein Ausschnitt (Bounding Box) definiert sein und diesem Ausschnitt eine Klasse zugewiesen sein. Eine Annotierung kann somit die Zuweisung des Datenpunkts oder eines Teils zu einer Klasse und/oder die Auswahl eines Teils des Datenpunktes sein. Allgemein werden Annotierungen im Bereich des „Supervised Machine Learning“ verwendet. Die Erfindung lässt sich insbesondere auf maschinellen Lernmodelle dieses Bereichs anwenden, aber auch auf beliebige maschinellen Lernmodelle.If the data point corresponds to an image, for example, each pixel can be assigned a class as an annotation of the data point (as in semantic segmentation). Alternatively, a section (bounding box) can be defined as an annotation of the data point and a class can be assigned to this section. An annotation can thus be the assignment of the data point or a part to a class and/or the selection of a part of the data point. Annotations are generally used in the field of "supervised machine learning". The invention can be applied in particular to machine learning models in this field, but also to any machine learning model.

Das maschinelle Lernmodell kann beispielsweise zur semantischen Segmentierung und/oder zur Objekterkennung verwendet werden und.The machine learning model can be used, for example, for semantic segmentation and/or object recognition.

Das Startszenario kann beispielsweise eine Verwendung des maschinellen Lernmodells in einem Startland sein. Das Startszenario kann auch die Verwendung des maschinellen Lernmodells in einer Startumgebung, wie beispielsweise einer städtischen Umgebung, auf einem Feldweg, bei Tageslicht oder dergleichen sein.The launch scenario may, for example, be a use of the machine learning model in a launch country. The launch scenario may also be a use of the machine learning model in a launch environment, such as an urban environment, on a dirt road, in daylight, or the like.

Ist das maschinellen Lernmodell mit dem Trainingsdatensatz für das Startszenario trainiert, so kann das maschinelle Lernmodell einem Eingangsdatenpunkt eine Annotierung vorhersagen. Je besser das maschinelle Lernmodell für das Startszenario trainiert ist, desto besser kann die Vorhersage sein. Die Funktionsweise des maschinellen Lernmodells hängt somit von dem Trainingsdatensatz für das Startszenario ab.If the machine learning model is trained with the training data set for the starting scenario, the machine learning model can predict an annotation for an input data point. The better the machine learning model is trained for the starting scenario, the better the prediction can be. The functioning of the machine learning model therefore depends on the training data set for the starting scenario.

Ein Ziel bevorzugter Ausgestaltungen der Erfindung ist es, das für das Startszenario trainierte, maschinelle Lernmodell an ein Zielszenario zu adaptieren. An aim of preferred embodiments of the invention is to adapt the machine learning model trained for the start scenario to a target scenario.

Das Zielszenario kann beispielsweise eine Verwendung des maschinellen Lernmodells in einem Zielland sein, das sich von dem Startland unterscheidet. Das Zielszenario kann auch die Verwendung des maschinellen Lernmodells in einer Zielumgebung sein, die sich von der Startumgebung unterscheidet. Beispielsweise kann die Zielumgebung statt einer städtischen Umgebung eine ländliche Umgebung, statt einem Feldweg eine Fernverkehrsstraße sein, statt bei Tageslicht bei Nacht vorliegen oder dergleichen.The target scenario may, for example, be a use of the machine learning model in a target country that is different from the starting country. The target scenario may also be the use of the machine learning model in a target environment that is different from the starting environment. For example, the target environment may It could be a rural area rather than an urban area, a main road rather than a track, a night-time area rather than a daytime area, or something similar.

Zum Adaptieren des für das Startszenario trainierten, maschinelle Lernmodells an das Zielszenario ist wenigstens ein Adaptionsdatensatz mit Datenpunkten zum Trainieren für das Zielszenario erforderlich.To adapt the machine learning model trained for the start scenario to the target scenario, at least one adaptation dataset with data points for training for the target scenario is required.

In einem ersten Schritt S11 umfasst das Verfahren:

  • - In einem Iterationsschritt einer Iteration, Sammeln eines Adaptionsdatensatzes mit einer Mehrzahl von Datenpunkten zum Trainieren des maschinellen Lernmodells für das Zielszenario.
In a first step S11, the method comprises:
  • - In an iteration step of an iteration, collecting an adaptation dataset with a plurality of data points for training the machine learning model for the target scenario.

In dem Schritt S11 wird ein Adaptionsdatensatz mit Datenpunkten gesammelt, die sich zum Trainieren des maschinellen Lernmodells für das Zielszenario eignen. Der Adaptionsdatensatz umfasst bevorzugt eine im Vergleich zum Trainingsdatensatz geringe Menge von Datenpunkten. Der jeweilige Adaptionsdatensatz kann beispielsweise durch ein Kraftfahrzeug in dem Zielszenario gesammelt werden.In step S11, an adaptation data set is collected with data points that are suitable for training the machine learning model for the target scenario. The adaptation data set preferably comprises a small number of data points compared to the training data set. The respective adaptation data set can be collected, for example, by a motor vehicle in the target scenario.

In einem weiteren Schritt S12 umfasst das Verfahren:

  • - In dem Iterationsschritt der Iteration, Zuweisen einer Annotierung zu den jeweiligen Datenpunkten des gesammelten Adaptionsdatensatzes.
In a further step S12, the method comprises:
  • - In the iteration step of the iteration, assigning an annotation to the respective data points of the collected adaptation dataset.

Die Zuweisung der Annotierung kann manuell oder computer-implementiert durchgeführt werden. In dem Schritt S12 wird die ausgewählte Annotierung jeweils den Datenpunkten des gesammelten Adaptionsdatensatzes zugewiesen. Die Zuweisung kann durch das Kraftfahrzeug erfolgen.The annotation can be assigned manually or by computer. In step S12, the selected annotation is assigned to the data points of the collected adaptation data set. The assignment can be made by the motor vehicle.

In einem weiteren Schritt S13 umfasst das Verfahren:

  • - In dem Iterationsschritt der Iteration, Testen des auf Grundlage des Trainingsdatensatzes trainierten, maschinellen Lernmodells mit dem in dem Iterationsschritt gesammelten Adaptionsdatensatz oder einer Teilmenge davon, wobei die Datenpunkte des in dem Iterationsschritt gesammelten Adaptionsdatensatzes oder der Teilmenge davon jeweils als Eingangsdatenpunkt für das maschinelle Lernmodell dienen.
In a further step S13, the method comprises:
  • - In the iteration step of the iteration, testing the machine learning model trained on the basis of the training data set with the adaptation data set collected in the iteration step or a subset thereof, wherein the data points of the adaptation data set collected in the iteration step or the subset thereof each serve as input data point for the machine learning model.

Das maschinelle Lernmodell ist auf Grundlage des Trainingsdatensatzes trainiert. Zusätzlich kann das maschinelle Lernmodell auf Grundlage eines Adaptionsdatensatzes oder einer Teilmenge davon eines dem Iterationsschritt vorhergehenden Iterationsschritts trainiert sein. Das maschinelle Lernmodell wird mit dem in dem Iterationsschritt gesammelten Adaptionsdatensatz getestet. Das Testen kann durch das Kraftfahrzeug erfolgen.The machine learning model is trained on the basis of the training data set. In addition, the machine learning model can be trained on the basis of an adaptation data set or a subset thereof from an iteration step preceding the iteration step. The machine learning model is tested with the adaptation data set collected in the iteration step. The testing can be carried out by the motor vehicle.

In einem weiteren Schritt S14 umfasst das Verfahren:

  • - Feststellen für jeden Eingangsdatenpunkt, ob die durch das in Schritt S13 getestete, maschinelle Lernmodell vorhergesagte Annotierung der zugewiesenen Annotierung entspricht.
In a further step S14, the method comprises:
  • - Determining for each input data point whether the annotation predicted by the machine learning model tested in step S13 corresponds to the assigned annotation.

In einem weiteren Schritt S15 umfasst das Verfahren:

  • - In einem weiteren Iterationsschritt der Iteration, Sammeln eines weiteren Adaptionsdatensatzes mit einer Mehrzahl von Datenpunkten zum Trainieren des maschinellen Lernmodells für das Zielszenario auf Grundlage der Feststellung in Schritt S14 und Fortfahren mit Schritt S12 in dem weiteren Iterationsschritt der Iteration mit dem weiteren Adaptionsdatensatz.
In a further step S15, the method comprises:
  • - In a further iteration step of the iteration, collecting a further adaptation data set with a plurality of data points for training the machine learning model for the target scenario based on the determination in step S14 and continuing with step S12 in the further iteration step of the iteration with the further adaptation data set.

Die in Schritt S14 gemachte Feststellung wird somit in Schritt S15 dazu genutzt, einen weiteren Adaptionsdatensatz zu sammeln.The determination made in step S14 is thus used in step S15 to collect another adaptation data set.

Beispielsweise kann in Schritt S14 festgestellt werden, dass die vorhergesagten Annotierung der Eingangsdatenpunkte den zugewiesenen Annotierung entsprechen. Dies kann darauf hindeuten, dass die Annotierung der Datenpunkte des in dem Iterationsschritt gesammelten Adaptionsdatensatzes durch das bestehende, trainierte, maschinelle Lernmodell ausreichend vorhergesagt werden. Somit kann in dem Schritt S15 ein weiterer Adaptionsdatensatz gesammelt werden, der beispielsweise disjunkt zu dem in dem Iterationsschritt gesammelten Adaptionsdatensatz ist.For example, in step S14 it can be determined that the predicted annotations of the input data points correspond to the assigned annotations. This can indicate that the annotations of the data points of the adaptation data set collected in the iteration step are sufficiently predicted by the existing, trained machine learning model. Thus, in step S15, a further adaptation data set can be collected which is, for example, disjoint to the adaptation data set collected in the iteration step.

Beispielsweise kann in Schritt S14 auch festgestellt werden, dass die vorgesagten Annotierung der Eingangsdatenpunkte von den zugewiesenen Annotierung abweicht. Dies kann darauf hindeuten, dass die Annotierung der Datenpunkte des in dem Iterationsschritt gesammelten Adaptionsdatensatzes durch das bestehende, trainierte, maschinelle Lernmodell nicht ausreichend vorausgesagt werden. Dann kann ich dem Schritt S15 ein weiterer Adaptionsdatensatz gesammelt werden, der beispielsweise eine Mehrzahl von Datenpunkten umfasst, die der zugewiesenen Annotierung zuweisbar sind.For example, in step S14 it can also be determined that the predicted annotation of the input data points deviates from the assigned annotation. This can indicate that the annotation of the data points of the adaptation data set collected in the iteration step is not sufficiently predicted by the existing, trained, machine learning model. Then, in step S15, another adaptation data set can be collected, which for example comprises a plurality of data points that can be assigned to the assigned annotation.

Die Schritte S14 und S15 können durch das Kraftfahrzeug erfolgen.Steps S14 and S15 can be performed by the motor vehicle.

In einem weiteren Schritt S16 umfasst das Verfahren:

  • - Beenden der Iteration durch Trainieren des maschinellen Lernmodells mit den Datenpunkten des Trainingsdatensatzes und den in den Iterationsschritten gesammelten Adaptionsdatensätzen zum Adaptieren des maschinellen Lernmodells für das Startszenario an das Zielszenario.
In a further step S16, the method comprises:
  • - End the iteration by training the machine learning model with the data points of the training dataset and the adaptation datasets collected in the iteration steps to adapt the machine learning model for the start scenario to the target scenario.

Die Iteration kann beispielsweise beendet werden, wenn die gesammelten Adaptionssätze das Zielszenario ausreichend abdecken und/oder wenn die Klassen der Datenpunkte von weiteren gesammelten Adaptionsdatensatzes durch das bestehende, trainierte, maschinelle Lernmodell ausreichend vorhergesagt werden, d.h. wenn das Sammeln neuer Adaptionsdatensätze keinen weiteren Effekt bewirkt.For example, the iteration can be terminated when the collected adaptation sets sufficiently cover the target scenario and/or when the classes of data points from further collected adaptation data sets are sufficiently predicted by the existing trained machine learning model, i.e. when collecting new adaptation data sets has no further effect.

In einem oder mehreren Zwischenschritten kann das maschinelle Lernmodellen beispielsweise mit dem Trainingsdatensatz und den bereits gesammelten Adaptionsdatensätzen trainiert werden. Beim Trainieren des maschinellen Lernmodell können Koeffizienten des maschinellen Lernmodells angepasst werden. Ein Kriterium zum Beenden der Iteration kann auch die Situation sein, wenn beim Trainieren in einem weiteren Zwischenschritt beispielsweise keine signifikante Änderung der Koeffizienten mehr festgestellt werden kann.In one or more intermediate steps, the machine learning model can be trained, for example, with the training data set and the adaptation data sets that have already been collected. When training the machine learning model, coefficients of the machine learning model can be adjusted. A criterion for ending the iteration can also be the situation when, for example, no significant change in the coefficients can be detected during training in a further intermediate step.

Der Schritt S16 kann durch das Kraftfahrzeug erfolgen. Das adaptierte maschinelle Lernmodell kann schließlich zur Verwendung an ein weiteres Kraftfahrzeug in dem Zielszenario übertragen werden.Step S16 can be performed by the motor vehicle. The adapted machine learning model can finally be transferred to another motor vehicle for use in the target scenario.

2 zeigt eine Ausführungsform eines Schrittes des Verfahrens gemäß 1. 2 shows an embodiment of a step of the method according to 1 .

Der Schritt S13 kann die folgenden Schritte S21, S22 und S23 umfassen:

  • - Aufteilen des gesammelten Adaptionsdatensatzes in eine erste Teilmenge und eine zweite Teilmenge (Schritt S21);
  • - Trainieren des maschinellen Lernmodells auf Grundlage des Trainingsdatensatzes und der ersten Teilmenge des gesammelten Adaptionsdatensatzes (Schritt S22); und
  • - Testen des in Schritt S22 trainierten, maschinellen Lernmodells mit der zweiten Teilmenge des gesammelten Adaptionsdatensatzes (Schritt S23).
Step S13 may include the following steps S21, S22 and S23:
  • - dividing the collected adaptation data set into a first subset and a second subset (step S21);
  • - training the machine learning model based on the training data set and the first subset of the collected adaptation data set (step S22); and
  • - Testing the machine learning model trained in step S22 with the second subset of the collected adaptation dataset (step S23).

Die Erfindung umfasst auch eine Datenverarbeitungseinrichtung, umfassend Mittel zur Ausführung des Verfahrens. Die Erfindung umfasst auch ein Computerprogramm, umfassend Befehle, die bei der Ausführung des Programm durch einen Computer diesen veranlassen, die Schritte des Verfahren auszuführen. Des Weiteren umfasst die Erfindung auch computerlesbares Speichermedium, auf dem das Computerprogramm gespeichert ist.The invention also includes a data processing device comprising means for carrying out the method. The invention also includes a computer program comprising instructions which, when the program is executed by a computer, cause the computer to carry out the steps of the method. Furthermore, the invention also includes a computer-readable storage medium on which the computer program is stored.

Ein Lösungsprinzip bevorzugter Ausgestaltungen der Erfindung kann somit folgendermaßen zusammengefasst werden:

  • Die Daten für Szenario B (Zielszenario) werden iterativ gesammelt. Dabei wird nur ein kleiner Datensatz gesammelt und klassifiziert. Dieser Datensatz wird dann unter Verwendung des bestehenden ML-Modells für Szenario A (Startszenario) bewertet.
A solution principle of preferred embodiments of the invention can thus be summarized as follows:
  • The data for Scenario B (target scenario) is collected iteratively. Only a small dataset is collected and classified. This dataset is then evaluated using the existing ML model for Scenario A (start scenario).

Die gesammelten und klassifizierten Daten für Szenario B werden unter Verwendung des bestehenden ML-Modells für Szenario A bewertet. Mit anderen Worten werden alle gesammelten Daten als Bewertungssatz verwendet. Dies ermöglicht es, Datenpunkte und Fälle des Szenarios B zu identifizieren, für die das bestehende Modell nicht ausreichend funktioniert. Solche Fälle können Positionen, Orte, Objekte oder Umgebungen sein. Die Erkenntnisse werden dann für eine weitere Datensammlung genutzt (iterativer Ansatz).The collected and classified data for Scenario B is evaluated using the existing ML model for Scenario A. In other words, all collected data is used as an evaluation set. This allows identifying data points and cases of Scenario B for which the existing model does not work sufficiently. Such cases can be positions, locations, objects or environments. The findings are then used for further data collection (iterative approach).

Schließlich werden die gesammelten Daten zum Trainieren des ML-Modells verwendet. Hierdurch wird das bestehende ML-Modell und dessen Funktionalität für das Szenario A auf das Szenario B erweitert.Finally, the collected data is used to train the ML model. This extends the existing ML model and its functionality for scenario A to scenario B.

Ein weiteres Lösungsprinzip bevorzugter Ausgestaltungen der Erfindung kann folgendermaßen zusammengefasst werden:

  • Die Daten für Szenario B werden iterativ gesammelt. Dabei wird nur ein kleiner Datensatz gesammelt und klassifiziert. Dieser Datensatz wird dann unter Verwendung des bestehenden ML-Modells für Szenario A bewertet.
A further solution principle of preferred embodiments of the invention can be summarized as follows:
  • The data for Scenario B is collected iteratively, collecting and classifying only a small dataset. This dataset is then evaluated using the existing ML model for Scenario A.

Die gesammelten Daten werden in zwei Teilmengen aufgeteilt, die für Training und Bewertung verwendet werden (in beiden Fällen zusammen mit den bestehenden Trainingsdaten für Szenario A). Hierdurch erhält man ein Modell, für das neue Trainingsdaten verwendet wurden. Die Bewertungsdaten werden zur Bewertung des neuen Modells für Szenario B verwendet. Dies ermöglicht es, Datenpunkte und Fälle des Szenarios B zu identifizieren, für die das bestehende Modell nicht ausreichend funktioniert. Solche Fälle können Positionen, Orte, Objekte oder Umgebungen sein. Die Erkenntnisse werden dann für eine weitere Datensammlung genutzt (iterativer Ansatz).The collected data is split into two subsets that are used for training and evaluation (in both cases together with the existing training data for scenario A). This results in a model that has been used to train new data. The evaluation data is used to evaluate the new model for scenario B. This allows to identify data points and cases of scenario B for which the existing model does not work sufficiently. Such cases can be positions, places, objects or environments. The findings are then used for further data collection (iterative approach).

Schließlich werden die gesammelten Daten zum Trainieren des ML-Modells verwendet. Hierdurch wird das bestehende ML-Modell und dessen Funktionalität für das Szenario A auf das Szenario B erweitert.Finally, the collected data is used to train the ML model. This improves the existing ML model and its Functionality for scenario A extended to scenario B.

Insgesamt zeigen die Beispiele, wie eine maschinelle Lern-Domain-Adaptierung unter Sammeln und Klassifizieren von Daten bereitgestellt werden kann.Overall, the examples show how machine learning domain adaptation can be provided while collecting and classifying data.

ZITATE ENTHALTEN IN DER BESCHREIBUNGQUOTES INCLUDED IN THE DESCRIPTION

Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of documents listed by the applicant was generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA accepts no liability for any errors or omissions.

Zitierte PatentliteraturCited patent literature

  • US 20160070986 A1 [0008]US 20160070986 A1 [0008]
  • US 20200364520 A1 [0008]US 20200364520 A1 [0008]
  • US 20220219698 A1 [0008]US 20220219698 A1 [0008]

Claims (7)

Computer-implementiertes, iteratives Verfahren zum Adaptieren eines maschinellen Lernmodells für ein Startszenario an ein Zielszenario, wobei das maschinelle Lernmodell auf Grundlage eines Trainingsdatensatzes mit einer Mehrzahl von Datenpunkten mit einer jeweiligen Annotierung zum Trainieren des maschinellen Lernmodells für das Startszenario dazu trainierbar oder bereits trainiert ist, einem Eingangsdatenpunkt eine Annotierung vorherzusagen, das Verfahren umfassend: a) In einem Iterationsschritt einer Iteration, Sammeln eines Adaptionsdatensatzes mit einer Mehrzahl von Datenpunkten zum Trainieren des maschinellen Lernmodells für das Zielszenario; b) In dem Iterationsschritt der Iteration, Zuweisen einer Annotierung zu den jeweiligen Datenpunkten des gesammelten Adaptionsdatensatzes; c) In dem Iterationsschritt der Iteration, Testen des auf Grundlage des Trainingsdatensatzes trainierten, maschinellen Lernmodells mit dem in dem Iterationsschritt gesammelten Adaptionsdatensatz oder einer Teilmenge davon, wobei die Datenpunkte des in dem Iterationsschritt gesammelten Adaptionsdatensatzes oder der Teilmenge davon jeweils als Eingangsdatenpunkt für das maschinelle Lernmodell dienen; d) Feststellen für jeden Eingangsdatenpunkt, ob die durch das in Schritt c) getestete, maschinelle Lernmodell vorhergesagte Annotierung der zugewiesenen Annotierung entspricht; e) In einem weiteren Iterationsschritt der Iteration, Sammeln eines weiteren Adaptionsdatensatzes mit einer Mehrzahl von Datenpunkten zum Trainieren des maschinellen Lernmodells für das Zielszenario auf Grundlage der Feststellung in Schritt d) und Fortfahren mit Schritt b) in dem weiteren Iterationsschritt der Iteration mit dem weiteren Adaptionsdatensatz; und f) Beenden der Iteration durch Trainieren des maschinellen Lernmodells mit den Datenpunkten des Trainingsdatensatzes und den in den Iterationsschritten gesammelten Adaptionsdatensätzen zum Adaptieren des maschinellen Lernmodells für das Startszenario an das Zielszenario. Computer-implemented, iterative method for adapting a machine learning model for a starting scenario to a target scenario, wherein the machine learning model can be trained or is already trained to predict an annotation for an input data point based on a training data set with a plurality of data points with a respective annotation for training the machine learning model for the starting scenario, the method comprising: a) In an iteration step of an iteration, collecting an adaptation data set with a plurality of data points for training the machine learning model for the target scenario; b) In the iteration step of the iteration, assigning an annotation to the respective data points of the collected adaptation data set; c) In the iteration step of the iteration, testing the machine learning model trained on the basis of the training data set with the adaptation data set collected in the iteration step or a subset thereof, wherein the data points of the adaptation data set collected in the iteration step or the subset thereof each serve as an input data point for the machine learning model; d) Determining for each input data point whether the annotation predicted by the machine learning model tested in step c) corresponds to the assigned annotation; e) In a further iteration step of the iteration, collecting a further adaptation data set with a plurality of data points for training the machine learning model for the target scenario based on the determination in step d) and continuing with step b) in the further iteration step of the iteration with the further adaptation data set; and f) terminating the iteration by training the machine learning model with the data points of the training data set and the adaptation data sets collected in the iteration steps to adapt the machine learning model for the starting scenario to the target scenario. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass Schritt e) umfasst: e1) falls in Schritt d) die vorhergesagte Annotierung von der zugewiesenen Annotierung für wenigstens eine oder für eine vordefinierte Anzahl von Eingangsdatenpunkten abweicht, Sammeln des weiteren Adaptionsdatensatzes mit einer Mehrzahl von Datenpunkten, die der zugewiesenen Annotierung des wenigstens einen oder der vordefinierten Anzahl von abweichenden Eingangsdatenpunkten zuweisbar sind.Procedure according to Claim 1 , characterized in that step e) comprises: e1) if in step d) the predicted annotation deviates from the assigned annotation for at least one or for a predefined number of input data points, collecting the further adaptation data set with a plurality of data points that are assignable to the assigned annotation of the at least one or the predefined number of deviating input data points. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass Schritt c) umfasst: c1) Aufteilen des gesammelten Adaptionsdatensatzes in eine erste Teilmenge und eine zweite Teilmenge; c2) Trainieren des maschinellen Lernmodells auf Grundlage des Trainingsdatensatzes und der ersten Teilmenge des gesammelten Adaptionsdatensatzes; und c3) Testen des in Schritt c2) trainierten, maschinellen Lernmodells mit der zweiten Teilmenge des gesammelten Adaptionsdatensatzes.Method according to one of the preceding claims, characterized in that step c) comprises: c1) dividing the collected adaptation data set into a first subset and a second subset; c2) training the machine learning model based on the training data set and the first subset of the collected adaptation data set; and c3) testing the machine learning model trained in step c2) with the second subset of the collected adaptation data set. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass Schritt c) umfasst: c4) Trainieren des maschinellen Lernmodells auf Grundlage des Trainingsdatensatzes und eines Adaptionsdatensatzes oder einer Teilmenge davon eines dem Iterationsschritt vorhergehenden Iterationsschritts.Method according to one of the preceding claims, characterized in that step c) comprises: c4) training the machine learning model on the basis of the training data set and an adaptation data set or a subset thereof of an iteration step preceding the iteration step. Datenverarbeitungseinrichtung, umfassend Mittel zur Ausführung des Verfahrens nach einem der vorhergehenden Ansprüche.Data processing device comprising means for carrying out the method according to one of the preceding claims. Computerprogramm, umfassend Befehle, die bei der Ausführung des Programms durch einen Computer diesen veranlassen, die Schritte des Verfahrens nach einem der Ansprüche 1 bis 4 auszuführen.Computer program comprising instructions which, when executed by a computer, cause the computer to carry out the steps of the method according to one of the Claims 1 until 4 to execute. Computerlesbares Speichermedium, auf dem das Computerprogramm nach Anspruch 6 gespeichert ist.Computer-readable storage medium on which the computer program is Claim 6 is stored.
DE102023100839.0A 2023-01-16 2023-01-16 Computer-implemented, iterative method for adapting a machine learning model, data processing device, computer program and computer-readable storage medium Pending DE102023100839A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102023100839.0A DE102023100839A1 (en) 2023-01-16 2023-01-16 Computer-implemented, iterative method for adapting a machine learning model, data processing device, computer program and computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102023100839.0A DE102023100839A1 (en) 2023-01-16 2023-01-16 Computer-implemented, iterative method for adapting a machine learning model, data processing device, computer program and computer-readable storage medium

Publications (1)

Publication Number Publication Date
DE102023100839A1 true DE102023100839A1 (en) 2024-07-18

Family

ID=91667862

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102023100839.0A Pending DE102023100839A1 (en) 2023-01-16 2023-01-16 Computer-implemented, iterative method for adapting a machine learning model, data processing device, computer program and computer-readable storage medium

Country Status (1)

Country Link
DE (1) DE102023100839A1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160070986A1 (en) 2014-09-04 2016-03-10 Xerox Corporation Domain adaptation for image classification with class priors
US20200364520A1 (en) 2019-05-13 2020-11-19 International Business Machines Corporation Counter rare training date for artificial intelligence
WO2021214558A1 (en) 2020-04-21 2021-10-28 International Business Machines Corporation Iterative training of machine learning model
US20220219698A1 (en) 2021-01-12 2022-07-14 Ford Global Technologies, Llc Enhanced object detection

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160070986A1 (en) 2014-09-04 2016-03-10 Xerox Corporation Domain adaptation for image classification with class priors
US20200364520A1 (en) 2019-05-13 2020-11-19 International Business Machines Corporation Counter rare training date for artificial intelligence
WO2021214558A1 (en) 2020-04-21 2021-10-28 International Business Machines Corporation Iterative training of machine learning model
US20220219698A1 (en) 2021-01-12 2022-07-14 Ford Global Technologies, Llc Enhanced object detection

Similar Documents

Publication Publication Date Title
DE102018116036A1 (en) Training a deep convolutional neural network for individual routes
DE102017203276A1 (en) Method and device for determining a trajectory in off-road scenarios
DE102019204139A1 (en) Training for artificial neural networks with better utilization of the learning data sets
DE102020215200A1 (en) SYSTEM AND METHOD OF A METHOD FOR ROBUST ACTIVE LEARNING USING NOISE LABELS AND DOMAIN ADAPTION
DE102016124888A1 (en) A method for assisting a driver of a motor vehicle when parking using a driver assistance device, corresponding computer program product and driver assistance device
DE102018113621A1 (en) A method of training a convolutional neural network for processing image data for use in a driving support system
DE102016011378A1 (en) Method for self-localization of a vehicle
DE102017208994A1 (en) Method for determining result image data
DE102020203707A1 (en) Plausibility check of the output of neural classifier networks
DE102023100839A1 (en) Computer-implemented, iterative method for adapting a machine learning model, data processing device, computer program and computer-readable storage medium
DE102016225631A1 (en) Method and device for removing at least one landmark position of a landmark in a radar map
DE102019129107A1 (en) Method and system for image analysis using boundary detection
DE102018208481A1 (en) Estimate a course of a rail track
DE102020128952A1 (en) Method and assistance device for two-stage image-based scene recognition and motor vehicle
DE102021100791A1 (en) Method for determining training data for model improvement and data processing apparatus
DE102020208080A1 (en) Detection of objects in images under equivariance or invariance with respect to the object size
DE102019005825A1 (en) Method for generating training data for an electronic computing device external to the motor vehicle, and driver assistance system
DE102023004171A1 (en) Method for automatically assigning labels and/or objects to sensor data from a vehicle surroundings sensor system
DE102019219924B4 (en) Method and device for creating and providing a database with sensor data patches stored therein for use in quilting
DE102017214666A1 (en) Method and device for estimating a self-motion of a vehicle
DE102017216562A1 (en) Concept for determining occupancy states of parking spaces and for identifying a parked on a parking space motor vehicle
DE102017207958A1 (en) A method of generating training data for a machine learning based pattern recognition method for a motor vehicle, motor vehicle, method of operating a computing device, and system
DE102021110069A1 (en) Method, assistance device and motor vehicle for the semantic segmentation of a digital image and method for providing a correction model for the semantic segmentation
DE102022201161A1 (en) Object classification with a one-level meta-based object detector using class prototypes
DE102021210322A1 (en) Method for generating a data set for training and/or testing a machine learning algorithm based on an ensemble of data filters