DE102021208727A1 - Training a synthetic measurement data generator with improved variability control - Google Patents

Training a synthetic measurement data generator with improved variability control Download PDF

Info

Publication number
DE102021208727A1
DE102021208727A1 DE102021208727.2A DE102021208727A DE102021208727A1 DE 102021208727 A1 DE102021208727 A1 DE 102021208727A1 DE 102021208727 A DE102021208727 A DE 102021208727A DE 102021208727 A1 DE102021208727 A1 DE 102021208727A1
Authority
DE
Germany
Prior art keywords
samples
source
measurement data
generator
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102021208727.2A
Other languages
German (de)
Inventor
Andres Mauricio Munoz Delgado
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE102021208727.2A priority Critical patent/DE102021208727A1/en
Publication of DE102021208727A1 publication Critical patent/DE102021208727A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/772Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

Verfahren (100) zum Trainieren eines Generators (4), der Eingabe-Vektoren (22) aus einer latenten Verteilung (21) auf synthetische Messdaten (2) einer vorgegebenen Domäne abbildet, mit den Schritten:• es werden Samples (11) von Messdaten der vorgegebenen Domäne aus einer ersten Quelle (3a) als Real-Samples (1) beschafft (110);• es werden Samples (12) von Messdaten der vorgegebenen Domäne aus einer zweiten Quelle (3b), die auf die bereits aus der ersten Quelle (3a) beschafften Samples (11) konditioniert sind, als weitere Real-Samples (1) beschafft (120);• es werden Eingabe-Vektoren (22) aus der latenten Verteilung (21) gesampelt (130) und von dem Generator (4) auf Fake-Samples (2) mit synthetischen Messdaten abgebildet (140);• die Real-Samples (1) werden mit den Fake-Samples (2) zu einem Pool P vereinigt (150);• aus dem Pool P werden Samples P* gezogen (160) und von einem Diskriminator (5) dahingehend klassifiziert (170), ob es sich um Fake-Samples (2) handelt oder nicht;• Parameter (5a), die das Verhalten des Diskriminators (5) charakterisieren, werden optimiert (180) mit dem Ziel, dass die Klassifikationsgenauigkeit des Diskriminators (5) sich verbessert;• Parameter (4a), die das Verhalten des Generators (4) charakterisieren, werden optimiert (190) mit dem Ziel, dass die Klassifikationsgenauigkeit des Diskriminators (5) sich verschlechtert.Method (100) for training a generator (4) that maps input vectors (22) from a latent distribution (21) to synthetic measurement data (2) of a specified domain, with the steps: • samples (11) of measurement data are generated of the given domain from a first source (3a) as real samples (1) (110); (3a) acquired samples (11) are conditioned as further real samples (1) acquired (120); • input vectors (22) from the latent distribution (21) are sampled (130) and generated by the generator (4 ) are mapped onto fake samples (2) with synthetic measurement data (140);• the real samples (1) are combined with the fake samples (2) to form a pool P (150);• the pool P becomes samples P * drawn (160) and classified (170) by a discriminator (5) as to whether the samples are fake (2) or not;• parameters (5a ) that characterize the behavior of the discriminator (5) are optimized (180) with the aim that the classification accuracy of the discriminator (5) improves; • Parameters (4a) that characterize the behavior of the generator (4) are optimized (190) with the aim that the classification accuracy of the discriminator (5) deteriorates.

Description

Die vorliegende Erfindung betrifft Generatoren für synthetische Messdaten, die beispielsweise zur Erzeugung von Trainingsdaten für Bildklassifikatoren verwendet werden können.The present invention relates to synthetic measurement data generators that can be used, for example, to generate training data for image classifiers.

Stand der TechnikState of the art

Viele Fahrassistenzsysteme und Systeme für das zumindest teilweise automatisierte Fahren verarbeiten die von Sensoren eines Fahrzeugs aufgenommenen Messdaten mit Klassifikatoren zu Klassifikations-Scores in Bezug auf eine oder mehrere Klassen einer vorgegebenen Klassifikation. Auf der Basis dieser Klassifikations-Scores werden dann beispielsweise Entscheidungen über Eingriffe in die Fahrdynamik des Fahrzeugs getroffen.Many driver assistance systems and systems for at least partially automated driving process the measurement data recorded by sensors of a vehicle with classifiers to form classification scores in relation to one or more classes of a specified classification. On the basis of these classification scores, for example, decisions are then made about interventions in the driving dynamics of the vehicle.

Das Training derartiger Klassifikatoren erfordert Trainingsdaten mit einer großen Variabilität, damit der Klassifikator gut auf im Training bislang ungesehene Messdaten generalisieren kann. Das Aufnehmen von Trainingsdaten auf Testfahrten mit dem Fahrzeug und erst recht das größtenteils manuelle Labeln dieser Trainingsdaten mit Soll-Klassifikations-Scores sind zeitaufwändig und teuer.The training of such classifiers requires training data with a high degree of variability, so that the classifier can generalize well to measurement data previously unseen in the training. The recording of training data on test drives with the vehicle and especially the largely manual labeling of this training data with target classification scores are time-consuming and expensive.

Daher werden die Trainingsdaten häufig mit synthetisch generierten Trainingsdaten angereichert. So offenbart etwa die DE 10 2018 204 494 B3 ein Verfahren, mit dem Radarsignale synthetisch generiert werden können, um damit physikalisch aufgenommene Radarsignale für das Training eines Klassifikators anzureichern.Therefore, the training data is often enriched with synthetically generated training data. So reveals about the DE 10 2018 204 494 B3 a method with which radar signals can be generated synthetically in order to enrich physically recorded radar signals for training a classifier.

Offenbarung der ErfindungDisclosure of Invention

Im Rahmen der Erfindung wurde ein Verfahren zum Trainieren eines Generators entwickelt, der Eingabe-Vektoren aus einer latenten Verteilung auf synthetische Messdaten einer vorgegebenen Domäne abbildet. Die Domäne ist durch die jeweilige konkrete Anwendung vorgegeben und kann beispielsweise Bilder von Verkehrssituationen umfassen.As part of the invention, a method was developed for training a generator that maps input vectors from a latent distribution to synthetic measurement data of a specified domain. The domain is specified by the respective specific application and can include images of traffic situations, for example.

Hierbei kann die latente Verteilung insbesondere beispielsweise eine Zufallsverteilung sein. Unter „synthetischen Messdaten“ werden insbesondere Messdaten verstanden, die im Kontext einer vorgegebenen Anwendung so realistisch erscheinen, dass sie für die weitere Verarbeitung gleichberechtigt und auch in Mischungen mit tatsächlich durch einen oder mehrere Sensoren aufgenommenen Messdaten verwendet werden können. Diese weitere Verarbeitung kann insbesondere beispielsweise darin bestehen, dass die synthetischen Messdaten gemeinsam mit physikalisch aufgenommenen Messdaten als Trainingsdaten für einen Klassifikator herangezogen werden.In this case, the latent distribution can in particular be a random distribution, for example. "Synthetic measurement data" means in particular measurement data that appear so realistic in the context of a given application that they can be used for further processing on an equal footing and can also be used in mixtures with measurement data actually recorded by one or more sensors. This further processing can consist in particular, for example, in the synthetic measurement data being used together with physically recorded measurement data as training data for a classifier.

Im Rahmen des Verfahrens werden Samples von Messdaten der vorgegebenen Domäne aus einer ersten Quelle als Real-Samples beschafft. Als erste Quelle kann insbesondere beispielsweise eine Menge von mit mindestens einem Sensor erfassten Messdaten gewählt werden.As part of the method, samples of measurement data of the specified domain are procured from a first source as real samples. In particular, a set of measurement data recorded with at least one sensor can be selected as the first source.

Weiterhin werden Samples von Messdaten der vorgegebenen Domäne aus einer zweiten Quelle als weitere Real-Samples beschafft. Diese Samples sind auf die bereits aus der ersten Quelle beschafften Samples konditioniert. Das bedeutet im weitesten Sinne, dass die Auswahl der Samples aus der zweiten Quelle davon abhängt, welche Samples bereits aus der ersten Quelle beschafft wurden. Damit werden die aus der zweiten Quelle beschafften Samples zu einer logischen Erweiterung der Menge der aus der ersten Quelle beschafften Samples.Furthermore, samples of measurement data of the specified domain are procured from a second source as further real samples. These samples are conditioned to the samples already obtained from the first source. Broadly speaking, this means that the selection of samples from the second source depends on which samples have already been obtained from the first source. Thus, the samples obtained from the second source become a logical extension of the set of samples obtained from the first source.

Als zweite Quelle kann insbesondere beispielsweise eine synthetische Generierung und/oder Abwandlung von Messdaten gewählt werden. Diese synthetische Generierung und/oder Abwandlung kann insbesondere beispielsweise mit dem Ziel erfolgen, Messdaten bereitzustellen, die sich in Bezug auf mindestens einen Aspekt von den Messdaten aus der ersten Quelle unterscheiden. Als zweite Quelle kann aber auch beispielsweise eine Menge von mit mindestens einem weiteren Sensor erfassten Messdaten gewählt werden.In particular, a synthetic generation and/or modification of measurement data can be selected as the second source. This synthetic generation and/or modification can be carried out, for example, with the aim of providing measurement data that differ from the measurement data from the first source in at least one aspect. However, a set of measurement data recorded with at least one additional sensor can also be selected as the second source, for example.

In der Gesamtmenge der Real-Samples sorgt die Kombination aus der Nutzung zweier Quellen für die Samples in Verbindung mit der Konditionierung auf die Samples aus der ersten Quelle dafür, dass die Menge der Real-Samples insgesamt eine größere Variabilität aufweist, aber zugleich auch noch als eine Einheit auffassbar ist.In the total set of real samples, the combination of using two sources for the samples in connection with the conditioning on the samples from the first source ensures that the set of real samples shows greater variability overall, but at the same time more than a unit can be grasped.

Aus der latenten Verteilung werden Eingabe-Vektoren gesampelt und von dem Generator auf Fake-Samples mit synthetischen Messdaten abgebildet. Hierbei ist der Begriff „Fake“ nicht (ab)wertend zu verstehen, sondern als auf dem Fachgebiet der Generative Adversarial Networks, GAN, gebräuchliche Bezeichnung für Messdaten, die von einem zu trainierenden Generator erzeugt wurden. Umgekehrt ist auch die Bezeichnung „Real-Samples“ nicht so zu verstehe, dass all diese Samples ursprünglich von einem Sensor stammen müssen. Vielmehr sind hierunter diejenigen Samples zu verstehen, von denen die vom Generator erzeugten Samples möglichst schwer unterscheidbar sein sollen.Input vectors are sampled from the latent distribution and mapped to fake samples with synthetic measurement data by the generator. The term "fake" is not to be understood in a (derogatory) way, but as a term commonly used in the field of Generative Adversarial Networks, GAN, for measurement data that was generated by a generator to be trained. Conversely, the term "real samples" should not be understood to mean that all these samples originally have to come from one sensor. Rather, this means those samples from which the samples generated by the generator should be as difficult as possible to distinguish.

Die Real-Samples werden mit den Fake-Samples zu einem Pool P vereinigt. Aus diesem Pool P werden Samples P* gezogen und von einem Diskriminator dahingehend klassifiziert, ob es sich um Fake-Samples handelt oder nicht.The real samples are combined with the fake samples to form a pool P. Samples P* are drawn from this pool P and from one Discriminator classifies whether the samples are fake or not.

Parameter, die das Verhalten des Diskriminators charakterisieren, werden optimiert mit dem Ziel, dass die Klassifikationsgenauigkeit des Diskriminators sich verbessert. Es werden aber auch Parameter, die das Verhalten des Generators charakterisieren, optimiert mit dem Ziel, dass die Klassifikationsgenauigkeit des Diskriminators sich verschlechtert. Auf diese Weise wird der Generator dazu trainiert, qualitativ immer bessere „Fälschungen“ von Messdaten herzustellen, während der Diskriminator gleichzeitig darauf trainiert wird, immer besser zwischen rekonstruierten Real-Samples einerseits und Fake-Samples andererseits zu unterscheiden.Parameters characterizing the behavior of the discriminator are optimized with the aim of improving the classification accuracy of the discriminator. However, parameters that characterize the behavior of the generator are also optimized with the aim of deteriorating the classification accuracy of the discriminator. In this way, the generator is trained to produce “falsifications” of measurement data of ever better quality, while at the same time the discriminator is trained to better and better distinguish between reconstructed real samples on the one hand and fake samples on the other.

Dieses Training kann insbesondere beispielsweise auf der Gesamtmenge der Real-Samples durchgeführt werden. Für einen Trainingsschritt kann der Pool P dann beispielsweise neben einem Batch Fake-Samples auch einen Batch Real-Samples enthalten, der sowohl Samples aus der ersten Quelle als auch Samples aus der zweiten Quelle enthält. Es können aber auch beispielsweise abwechselnd Pools P verwendet werden, in denen ein Batch Fake-Samples jeweils nur mit einem Batch Samples aus der ersten Quelle, bzw. nur mit einem Batch Samples aus der zweiten Quelle, kombiniert sind. Die Samples aus beiden Quellen können somit jeweils ihre eigenen Updates von Gradienten der zu optimierenden Parameter bewirken. Die Real-Samples aus beiden Quellen können auch anhand einer beliebigen anderen Strategie miteinander kombiniert werden.In particular, this training can be carried out, for example, on the total set of real samples. For a training step, the pool P can then contain, for example, a batch of real samples in addition to a batch of fake samples, which contains both samples from the first source and samples from the second source. However, pools P can also be used alternately, for example, in which a batch of fake samples is combined only with a batch of samples from the first source or only with a batch of samples from the second source. The samples from both sources can thus each cause their own updates of gradients of the parameters to be optimized. The real samples from both sources can also be combined using any other strategy.

Die durch die Hinzunahme der Samples aus der zweiten Quelle hinzugewonnene Variabilität bewirkt, dass der Generator nicht mehr nur auf den durch die Samples aus der ersten Quelle definierten Moden von Trainingsdaten trainiert wird, sondern zusätzlich noch auf weiteren, durch die Samples aus der zweiten Quelle definierten Moden. Dadurch wird im Endeffekt auch die Variabilität in der Ausgabe des Generators erhöht. Die vom Generator erzeugten Messdaten konzentrieren sich also auch nicht mehr in einer oder wenigen Moden, sondern decken die vorgegebene Domäne der Messdaten insgesamt besser ab.The variability gained by adding the samples from the second source means that the generator is no longer only trained on the modes of training data defined by the samples from the first source, but also on others defined by the samples from the second source fashions. This effectively increases the variability in the output of the generator. The measurement data generated by the generator is therefore no longer concentrated in one or a few modes, but rather covers the specified domain of the measurement data better overall.

Dabei wird durch das Konditionieren auf die Samples aus der ersten Quelle insbesondere vermieden, dass die vorteilhafte Variabilität in den Trainingsdaten des Generators in eine In-sich-Widersprüchlichkeit dieser Trainingsdaten umschlägt. Beim Versuch, eine solche Widersprüchlichkeit aufzulösen und es „allen Trainingsdaten recht zu machen“, kann der Generator als „faulen Kompromiss“ Artefakte in die von ihm erzeugten synthetischen Messdaten einbringen. In Bildern als synthetischen Messdaten können sich derartige Artefakte beispielsweise in Texturen oder Formen manifestieren, die in realistischen Bildern nicht vorkommen, und/oder in den Bildern können Objekte bestimmter Klassen, die hierin eigentlich zu erwarten wären, fehlen. Derartige Spuren in den synthetischen Messdaten bieten dem Diskriminator einfache Ansatzpunkte, um ohne tiefergehende Analyse des semantischen Inhalts die Samples mit synthetischen Messdaten als solche zu identifizieren. Weiterhin bewirkt das Konditionieren auf die Samples aus der ersten Quelle, dass der Generator Samples aus der ersten und zweiten Quelle vorteilhaft in der gleichen Mode „durchmischt“ und beispielsweise nicht erkennt, dass synthetisch erzeugte Messdaten aus der zweiten Quelle beispielsweise „corner cases“ (wie etwa Beinahe-Unfall-Verkehrssituationen) oder Anomalien repräsentieren. Wenn der Generator hingegen Messdaten aus der zweiten Quelle (etwa synthetisch erzeugte Messdaten) in eine separate Gruppe einsortiert, ohne deren Beziehung zu den Sensordaten aus der ersten Quelle zu lernen, kann hierunter beispielsweise die Fähigkeit leiden, zuverlässig „corner cases“ zu erzeugen.The conditioning on the samples from the first source avoids in particular that the advantageous variability in the training data of the generator turns into an inherent contradiction of this training data. When trying to resolve such an inconsistency and "please all training data", the generator can introduce artifacts into the synthetic measurement data it generates as a "lazy compromise". In images as synthetic measurement data, such artifacts can manifest themselves, for example, in textures or shapes that do not occur in realistic images, and/or objects of specific classes that would actually be expected there can be missing in the images. Such traces in the synthetic measurement data offer the discriminator simple starting points to identify the samples with synthetic measurement data as such without in-depth analysis of the semantic content. Furthermore, the conditioning to the samples from the first source has the effect that the generator advantageously "mixes" samples from the first and second source in the same mode and, for example, does not recognize that synthetically generated measurement data from the second source, for example, contain "corner cases" (such as such as near-accident traffic situations) or represent anomalies. On the other hand, if the generator sorts measurement data from the second source (e.g. synthetically generated measurement data) into a separate group without learning their relationship to the sensor data from the first source, the ability to reliably generate "corner cases" can suffer as a result.

Wenn beispielsweise alle Samples aus der ersten Quelle Bilder herkömmlicher PKW sind, kann durch Hinzunahme von Samples, die Kombi-PKW, SUV und weitere Abwandlungen von PKW zeigen, aus einer zweiten Quelle die Variabilität der vom Generator erzeugten Bilder von Fahrzeugen verbessert werden. Wenn die Bilder aus der zweiten Quelle hingegen LKW, Busse, Schiffe oder Flugzeuge zeigen, gibt es kaum realistische Bilder, die insgesamt im Einklang mit einer Vereinigungsmenge aller Trainingsbilder stehen. Der Generator kann daher beispielsweise versuchen, ein Bild eines LKW durch Texturierung mit einem bestimmten Pixelmuster so „hinzubiegen“, dass es auch mit den PKW in den Trainingsbildern im Einklang steht. Ein Beispiel hierfür wäre ein LKW, auf dessen Aufbau ein PKW abgebildet ist. Generell gibt es bei einer Anfrage an den Generator, Bilder mit einer im Training selten bis gar nicht gesehenen Klasse oder Kombination von Klassen zu erzeugen, wenig Kontrolle über das Ergebnis. Der Generator könnte beispielsweise eine der Klassen, die partout nicht passen will, einfach unberücksichtigt lassen oder aber bei dem Versuch, alle angeforderten Klassen in einem einzigen Bild unterzubringen, ein im Ganzen unsinniges Bild erzeugen.For example, if all the samples from the first source are images of conventional automobiles, adding samples showing station wagons, SUVs and other modifications of automobiles from a second source can improve the variability of the generator generated images of vehicles. On the other hand, if the images from the second source show trucks, buses, ships or planes, there are hardly any realistic images that are overall consistent with a union of all training images. The generator can therefore try, for example, to "bend" an image of a truck by texturing it with a specific pixel pattern so that it is also consistent with the cars in the training images. An example of this would be a truck with a car depicted on its body. In general, when a request is made to the generator to generate images with a class or combination of classes that is rarely or never seen in training, there is little control over the result. For example, the generator could simply ignore one of the classes that absolutely doesn't want to fit, or it could produce an overall nonsensical image in an attempt to fit all requested classes into a single image.

In einer besonders vorteilhaften Ausgestaltung beinhaltet das Konditionieren der Samples aus der zweiten Quelle auf die Samples aus der ersten Quelle somit, dass die Samples aus der zweiten Quelle in Bezug auf eine oder mehrere vorgegebene Eigenschaften einer durch die Samples aus der ersten Quelle definierten Verteilung angehören, und/oder in Bezug auf diese eine oder mehrere Eigenschaften in sonstiger Weise zu den Samples aus der ersten Quelle ähnlich sind.In a particularly advantageous embodiment, the conditioning of the samples from the second source to the samples from the first source thus includes that the samples from the second source belong to a distribution defined by the samples from the first source with regard to one or more predetermined properties, and/or which are otherwise similar to the samples from the first source with respect to those one or more properties.

Wie zuvor erläutert, können insbesondere beispielsweise Bilder als Samples von Messdaten gewählt werden. Dann kann die vorgegebene Eigenschaft, bezüglich derer die Samples aus der zweiten Quelle auf die Samples aus der ersten Quelle konditioniert sind, beispielsweise

  • • die in den Bildern enthaltenen Farben;
  • • die in den Bildern enthaltenen Objektklassen; und/oder
  • • die in den Bildern enthaltenen Kombinationen von Objektklassen, umfassen.
As explained above, images can be selected as samples of measurement data, for example. Then the predetermined property with respect to which the samples from the second source are conditioned on the samples from the first source, e.g
  • • the colors contained in the images;
  • • the object classes contained in the images; and or
  • • include the combinations of object classes contained in the images.

In dem zuvor genannten Beispiel könnten also aus der zweiten Quelle Bilder anderer Typen von PKWs (etwa Kombi-PKW oder SUV) in vielen Varianten beschafft werden. Die Real-Samples würden sich dann insgesamt nur auf PKW beziehen.In the aforementioned example, images of other types of cars (e.g. station wagons or SUVs) in many variants could be obtained from the second source. The real samples would then only relate to passenger cars.

In einer weiteren vorteilhaften Ausgestaltung werden die Samples aus der zweiten Quelle so abgewandelt, dass sie im Hinblick auf mindestens eine vorgegebene Eigenschaft zu einem geringeren Grade einer durch die Samples aus der ersten Quelle definierten Verteilung angehören, und/oder in Bezug auf diese mindestens eine vorgegebene Eigenschaft in sonstiger Weise zu den Samples aus der ersten Quelle unähnlicher werden. Auf diese Weise kann die Tendenz verstärkt werden, dass die Samples aus der zweiten Quelle dem Generator noch etwas Neues beibringen, ohne dass sich aber grundlegende Widersprüche zu den Samples aus der ersten Quelle ergeben. Das Abwandeln ist insgesamt ein besonders einfacher Weg, weitere Real-Samples zu beschaffen, was es wiederum unwahrscheinlicher macht, dass der Generator einen Unterschied zwischen den von mindestens einem Sensor aufgenommenen Messdaten aus der ersten Quelle einerseits und synthetisch erzeugten Messdaten aus der zweiten Quelle andererseits erkennt.In a further advantageous embodiment, the samples from the second source are modified in such a way that they belong to a lesser extent to a distribution defined by the samples from the first source with regard to at least one predefined property, and/or in relation to this at least one predefined property property otherwise become more dissimilar to the samples from the first source. In this way, the tendency can be increased that the samples from the second source still teach the generator something new, but without resulting in fundamental contradictions to the samples from the first source. Overall, modifying is a particularly easy way to obtain more real samples, which in turn makes it less likely that the generator will recognize a difference between the measurement data recorded by at least one sensor from the first source on the one hand and synthetically generated measurement data from the second source on the other .

In dem zuvor genannten Beispiel können etwa die Formen und Farben der auf den Bildern aus der zweiten Quelle gezeigten PKW in weiten Grenzen verändert werden, ohne dass ein Zweifel daran entsteht, dass diese Bilder jeweils PKW zeigen.In the above example, the shapes and colors of the cars shown in the images from the second source can be changed within wide limits without there being any doubt that these images show cars in each case.

Das Abwandeln kann insbesondere beispielsweise beinhalten,

  • • den in den Bildern enthaltenen Farben eine oder mehrere Farben hinzuzufügen;
  • • den in den Bildern enthaltenen Objektklassen eine oder mehrere Objektklassen hinzuzufügen; und/oder
  • • den in den Bildern enthaltenen Kombinationen von Objektklassen eine oder mehrere Kombinationen hinzuzufügen.
The modification can include, for example,
  • • add one or more colors to the colors contained in the images;
  • • add one or more object classes to the object classes contained in the images; and or
  • • add one or more combinations to the combinations of object classes contained in the images.

In einer weiteren besonders vorteilhaften Ausgestaltung wird die Stärke des Abwandelns

  • • als Funktion der Epoche E, in der der Generator und der Diskriminator trainiert werden, und/oder
  • • als Funktion des Indexes T eines aktuellen Batches von Real-Samples, der in dieser Epoche E verarbeitet wird,
variiert. So können beispielsweise zu Beginn des Trainings nur leichte Abwandlungen zugelassen werden und erst im weiteren Trainingsverlauf stärkere Abwandlungen. Auf diese Weise kann die Wahrscheinlichkeit erhöht werden, dass das Training des Generators gerade zu Beginn in die richtige Richtung läuft.In a further particularly advantageous embodiment, the strength of the modification
  • • as a function of epoch E, in which the generator and the discriminator are trained, and/or
  • • as a function of the index T of a current batch of real samples processed in this epoch E,
varies. For example, only slight modifications can be allowed at the beginning of the training session and stronger modifications only as the training progresses. In this way, the probability can be increased that the training of the generator runs in the right direction, especially at the beginning.

In einer weiteren besonders vorteilhaften Ausgestaltung werden die Samples aus der zweiten Quelle zu mehreren Batches von Samples aus der ersten Quelle unabhängig voneinander ermittelt. Jeder einzelne Trainingsschritt verwendet einen bestimmten Batch von Samples. Damit jeder dieser Schritte in die richtige Richtung führt, kommt es darauf an, dass die Real-Samples innerhalb dieses Batches untereinander schlüssig sind, so dass aus diesem Batch eine Aussage für das nächste Update der Parameter des Generators gewonnen werden kann.In a further particularly advantageous embodiment, the samples from the second source are determined independently of one another for a plurality of batches of samples from the first source. Each individual training step uses a specific batch of samples. So that each of these steps leads in the right direction, it is important that the real samples within this batch are consistent with one another, so that a statement can be obtained from this batch for the next update of the generator parameters.

Wenn beispielsweise sowohl die Samples aus der ersten Quelle als auch die Samples aus der zweiten Quelle jeweils PKW, LKW und Busse in verschiedenen Varianten zeigen, können diese Samples optimal für das Training des Generators ausgenutzt werden, indem in einem Batch jeweils nur Bilder einer der Fahrzeugarten zusammengefasst werden. Wenn hingegen in einem Batch beispielsweise PKW und Busse gemischt werden, ist hieraus möglicherweise kein sinnvoller Trainingsschritt ableitbar.If, for example, both the samples from the first source and the samples from the second source each show different variants of cars, trucks and buses, these samples can be optimally used for training the generator by only including images of one of the vehicle types in a batch be summarized. If, on the other hand, cars and buses are mixed in a batch, it may not be possible to derive a meaningful training step from this.

In einer weiteren vorteilhaften Ausgestaltung werden die für das Training des Generators und des Diskriminators in einer vorgegebenen Anzahl Epochen benötigten Real-Samples vollständig im Voraus ermittelt, bevor mit dem Training des Generators und des Diskriminators begonnen wird. Auf diese Weise muss während des Trainings nicht auf die Bereitstellung neuer Samples aus der zweiten Quelle gewartet werden. Wenn die Samples aus der zweiten Quelle beispielsweise mit einem neuronalen Netzwerk synthetisch generiert werden, muss für die Bereitstellung jedes Samples dieses Netzwerk einmal in Vorwärtsrichtung durchlaufen werden.In a further advantageous embodiment, the real samples required for training the generator and the discriminator in a predetermined number of epochs are determined completely in advance, before training of the generator and the discriminator is started. In this way, there is no need to wait for the provision of new samples from the second source during training. If the samples from the second source are generated synthetically with a neural network, for example, this network must be traversed once in the forward direction in order to provide each sample.

Beispielsweise kann eine pseudozufällige Reihenfolge festgelegt werden, in der Batches von Samples aus der ersten Quelle bezogen werden. Zu jedem dieser Batches kann dann ein Batch von Samples aus der zweiten Quelle bezogen werden. Damit entsteht insgesamt eine Reihenfolge von Batches von Real-Samples, die jeweils Samples aus der ersten Quelle und Samples aus der zweiten Quelle enthalten. Die Batches können in einem Speicher gelagert und beim Training des Generators und des Diskriminators aus diesem Speicher abgerufen werden.For example, a pseudo-random order can be specified in which batches of samples are obtained from the first source. A batch of samples can then be obtained from the second source for each of these batches. This creates an overall sequence of batches of real samples, each containing samples from the first source and samples from the second source. The batches can be stored in a memory and retrieved from this memory when training the generator and the discriminator.

Wie zuvor erläutert, kann der Generator insbesondere dazu genutzt werden, synthetische Trainingsdaten für einen Klassifikator zu erzeugen. Daher werden in einer weiteren vorteilhaften Ausgestaltung mit dem fertig trainierten Generator weitere Eingabe-Vektoren aus der latenten Verteilung auf synthetische Messdaten der vorgegebenen Domäne abgebildet. Unter Heranziehung dieser synthetischen Messdaten als Trainingsdaten wird ein Klassifikator für Messdaten trainiert.As explained above, the generator can be used in particular to generate synthetic training data for a classifier. Therefore, in a further advantageous embodiment, further input vectors from the latent distribution are mapped onto synthetic measurement data of the specified domain with the completely trained generator. A classifier for measurement data is trained using this synthetic measurement data as training data.

Die synthetischen Messdaten können eine deutlich größere Variabilität abdecken als mit einem Sensor aufgenommene Messdaten allein. Insbesondere können hiermit Ungleichgewichte zwischen der Häufigkeit, mit der bestimmte Situationen in den Trainingsdaten vorkommen, einerseits und der Wichtigkeit dieser Situationen andererseits einnivelliert werden.The synthetic measurement data can cover a significantly greater variability than measurement data recorded with a sensor alone. In particular, imbalances between the frequency with which certain situations occur in the training data on the one hand and the importance of these situations on the other hand can be leveled out.

So ist beispielsweise damit zu rechnen, dass in Trainingsdaten mit Bildern von Verkehrssituationen die gängigsten Verkehrszeichen für die Vorfahrtregelung und die Geschwindigkeitsbeschränkung wesentlich häufiger vorkommen als beispielsweise ein Verkehrszeichen, das einen unbeschrankten Bahnübergang oder eine auf ein ungesichertes Ufer zuführende Straße ankündigt. Gleichwohl müssen gerade diese Zeichen, wenn sie denn vorkommen, absolut sicher erkannt werden, da eine Falscherkennung mit höherer Wahrscheinlichkeit schwerwiegende Folgen hat als beispielsweise die Falscherkennung einer Geschwindigkeitsbeschränkung.For example, it can be expected that in training data with images of traffic situations, the most common traffic signs for giving priority and speed limits will appear much more frequently than, for example, a traffic sign that announces an unguarded level crossing or a road leading to an unsecured bank. Nevertheless, precisely these signs, if they occur, must be recognized with absolute certainty, since incorrect recognition is more likely to have serious consequences than, for example, incorrect recognition of a speed limit.

Somit werden in einer weiteren besonders vorteilhaften Ausgestaltung dem trainierten Klassifikator weitere Messdaten zugeführt, die mit mindestens einem Sensor aufgenommen wurden. Der Klassifikator bildet dann diese Messdaten auf Klassifikations-Scores in Bezug auf eine oder mehrere Klassen ab. Aus den Klassifikations-Scores wird ein Ansteuersignal gebildet. Ein Fahrzeug, und/oder ein System für die Qualitätskontrolle von Produkten, und/oder ein System für die Überwachung von Bereichen, wird mit diesem Ansteuersignal angesteuert. Das Training des Klassifikators mit Trainingsdaten einer höheren Variabilität hat hier im Endeffekt die Wirkung, dass die Reaktion des angesteuerten technischen Systems auf die den Messdaten zugrunde liegende Situation mit einer höheren Wahrscheinlichkeit dieser Situation angemessen ist.Thus, in a further particularly advantageous embodiment, the trained classifier is supplied with further measurement data recorded with at least one sensor. The classifier then maps this measurement data to classification scores related to one or more classes. A control signal is formed from the classification scores. A vehicle and/or a system for product quality control and/or a system for monitoring areas is controlled with this control signal. The training of the classifier with training data of a higher variability ultimately has the effect that the reaction of the controlled technical system to the situation on which the measurement data is based is appropriate with a higher probability of this situation.

Das Verfahren kann insbesondere ganz oder teilweise computerimplementiert sein. Daher bezieht sich die Erfindung auch auf ein Computerprogramm mit maschinenlesbaren Anweisungen, die, wenn sie auf einem oder mehreren Computern ausgeführt werden, den oder die Computer dazu veranlassen, das beschriebene Verfahren auszuführen. In diesem Sinne sind auch Steuergeräte für Fahrzeuge und Embedded-Systeme für technische Geräte, die ebenfalls in der Lage sind, maschinenlesbare Anweisungen auszuführen, als Computer anzusehen.In particular, the method can be fully or partially computer-implemented. The invention therefore also relates to a computer program with machine-readable instructions which, when executed on one or more computers, cause the computer or computers to carry out the method described. In this sense, control devices for vehicles and embedded systems for technical devices that are also able to execute machine-readable instructions are also to be regarded as computers.

Ebenso bezieht sich die Erfindung auch auf einen maschinenlesbaren Datenträger und/oder auf ein Downloadprodukt mit dem Computerprogramm. Ein Downloadprodukt ist ein über ein Datennetzwerk übertragbares, d.h. von einem Benutzer des Datennetzwerks downloadbares, digitales Produkt, das beispielsweise in einem Online-Shop zum sofortigen Download feilgeboten werden kann.The invention also relates to a machine-readable data carrier and/or a download product with the computer program. A downloadable product is a digital product that can be transmitted over a data network, i.e. can be downloaded by a user of the data network and that can be offered for sale in an online shop for immediate download, for example.

Weiterhin kann ein Computer mit dem Computerprogramm, mit dem maschinenlesbaren Datenträger bzw. mit dem Downloadprodukt ausgerüstet sein.Furthermore, a computer can be equipped with the computer program, with the machine-readable data carrier or with the downloadable product.

Weitere, die Erfindung verbessernde Maßnahmen werden nachstehend gemeinsam mit der Beschreibung der bevorzugten Ausführungsbeispiele der Erfindung anhand von Figuren näher dargestellt.Further measures improving the invention are presented in more detail below together with the description of the preferred exemplary embodiments of the invention with the aid of figures.

Ausführungsbeispieleexemplary embodiments

Es zeigt:

  • 1 Ausführungsbeispiel des Verfahrens 100 zum Trainieren eines Generators 4;
  • 2 Beispiel für die Zusammenstellung von Real-Samples 1 mit Samples 11, 12 aus zwei Quellen 3a, 3b.
It shows:
  • 1 Embodiment of the method 100 for training a generator 4;
  • 2 Example of the compilation of real samples 1 with samples 11, 12 from two sources 3a, 3b.

1 ist ein schematisches Ablaufdiagramm eines Ausführungsbeispiels des Verfahrens 100 zum Trainieren eines Generators 4. Der Generator 4 bildet Eingabe-Vektoren 22 aus einer latenten Verteilung 21 auf synthetische Messdaten 2 ab. 1 FIG. 1 is a schematic flowchart of an embodiment of the method 100 for training a generator 4. The generator 4 maps input vectors 22 from a latent distribution 21 onto synthetic measurement data 2. FIG.

In Schritt 110 werden Samples 11 von Messdaten der vorgegebenen Domäne aus einer ersten Quelle 3a als Real-Samples 1 beschafft. Gemäß Block 111 können insbesondere beispielsweise Bilder als Samples 11 gewählt werden.In step 110, samples 11 of measurement data of the specified domain are procured as real samples 1 from a first source 3a. According to block 111, for example, images can be selected as samples 11 in particular.

In Schritt 120 werden Samples 12 von Messdaten der vorgegebenen Domäne aus einer zweiten Quelle 3b, die auf die bereits aus der ersten Quelle 3a beschafften Samples 11 konditioniert sind, als weitere Real-Samples 1 beschafft.In step 120, samples 12 of measurement data of the specified domain are obtained as further real samples 1 from a second source 3b, which are conditioned to the samples 11 already obtained from the first source 3a.

Gemäß Block 121 kann das Konditionieren der Samples 12 aus der zweiten Quelle 3b auf die Samples 11 aus der ersten Quelle 3a beinhalten, dass die Samples 12 aus der zweiten Quelle 3b in Bezug auf eine oder mehrere vorgegebene Eigenschaften einer durch die Samples 11 aus der ersten Quelle 3a definierten Verteilung angehören, und/oder in Bezug auf diese eine oder mehrere Eigenschaften in sonstiger Weise zu den Samples 11 aus der ersten Quelle 3a ähnlich sind.According to block 121, the conditioning of the samples 12 from the second source 3b to the samples 11 from the first source 3a can include that the samples 12 from the second source 3b with respect to one or more predetermined properties by the samples 11 from the first Belong to source 3a defined distribution, and/or are similar to the samples 11 from the first source 3a in relation to these one or more properties in any other way.

Diese vorgegebene Eigenschaft kann beispielsweise gemäß Block 121a

  • • die in Bildern enthaltenen Farben;
  • • die in Bildern enthaltenen Objektklassen; und/oder
  • • die in Bildern enthaltenen Kombinationen von Objektklassen,
umfassen.This predetermined property can, for example, according to block 121a
  • • the colors contained in images;
  • • the object classes contained in images; and or
  • • the combinations of object classes contained in images,
include.

Gemäß Block 122 können die Samples 12 aus der zweiten Quelle 3b so abgewandelt werden, dass sie im Hinblick auf mindestens eine vorgegebene Eigenschaft zu einem geringeren Grade einer durch die Samples 11 aus der ersten Quelle 3a definierten Verteilung angehören, und/oder in Bezug auf diese mindestens eine vorgegebene Eigenschaft in sonstiger Weise zu den Samples 11 aus der ersten Quelle 3a unähnlicher werden.According to block 122, the samples 12 from the second source 3b can be modified so that they belong to a lesser degree to a distribution defined by the samples 11 from the first source 3a and/or in relation to at least one predetermined property at least one predetermined property become more dissimilar in some other way to the samples 11 from the first source 3a.

Diese vorgegebene Eigenschaft kann beispielsweise gemäß Block 122a beinhalten,

  • • den in Bildern enthaltenen Farben eine oder mehrere Farben hinzuzufügen;
  • • den in Bildern enthaltenen Objektklassen eine oder mehrere Objektklassen hinzuzufügen; und/oder
  • • den in Bildern enthaltenen Kombinationen von Objektklassen eine oder mehrere Kombinationen hinzuzufügen.
This predetermined property can include, for example, according to block 122a,
  • • add one or more colors to the colors contained in images;
  • • add one or more object classes to the object classes contained in images; and or
  • • add one or more combinations to the combinations of object classes contained in images.

Die Stärke dieses Abwandelns kann gemäß Block 122b im Verlauf des Trainings variiert werden.The magnitude of this modification can be varied as block 122b progresses through training.

Gemäß Block 123 kann

  • • eine Menge von mit mindestens einem weiteren Sensor erfassten Messdaten, und/oder
  • • eine synthetische Generierung und/oder Abwandlung von Messdaten, als zweite Quelle 3b für Samples 12 gewählt werden.
According to block 123,
  • • a quantity of measurement data recorded with at least one further sensor, and/or
  • • a synthetic generation and/or modification of measurement data, can be selected as the second source 3b for samples 12.

Gemäß Block 124 können die Samples 12 aus der zweiten Quelle 3b zu mehreren Batches von Samples 11 aus der ersten Quelle 3a unabhängig voneinander ermittelt werden.According to block 124, the samples 12 from the second source 3b can be determined independently of one another for a plurality of batches of samples 11 from the first source 3a.

In Schritt 130 werden Eingabe-Vektoren 22 aus der latenten Verteilung 21 gesampelt.In step 130, input vectors 22 from the latent distribution 21 are sampled.

In Schritt 140 werden die Eingabe-Vektoren 22 von dem Generator 4 auf Fake-Samples 2 mit synthetischen Messdaten abgebildet.In step 140 the input vectors 22 are mapped by the generator 4 onto fake samples 2 with synthetic measurement data.

In Schritt 150 werden die rekonstruierten Real-Samples 1' mit den Fake-Samples 2 zu einem Pool P vereinigt.In step 150, the reconstructed real samples 1' are combined with the fake samples 2 to form a pool P.

In Schritt 160 werden aus dem Pool P Samples P* gezogen.In step 160, samples P* are drawn from the pool P.

In Schritt 170 werden die Samples P* von einem Diskriminator 5 dahingehend klassifiziert, ob es sich um Fake-Samples 2 handelt oder nicht. In dem in 1 gezeigten Beispiel kann jedes Sample P* entweder Real-Sample 1 oder Fake-Sample 2 sein.In step 170, the samples P* are classified by a discriminator 5 as to whether they are fake samples 2 or not. in the in 1 example shown, each sample P* can be either real sample 1 or fake sample 2.

In Schritt 180 werden Parameter 5a, die das Verhalten des Diskriminators 5 charakterisieren, optimiert mit dem Ziel, dass die Klassifikationsgenauigkeit des Diskriminators 5 sich verbessert. Der fertig trainierte Zustand der Parameter 5a ist mit dem Bezugszeichen 5a* bezeichnet.In step 180, parameters 5a, which characterize the behavior of discriminator 5, are optimized with the aim of improving the classification accuracy of discriminator 5. The fully trained state of the parameters 5a is denoted by the reference symbol 5a*.

In Schritt 190 werden Parameter 4a, die das Verhalten des Generators 4 charakterisieren, optimiert mit dem Ziel, dass die Klassifikationsgenauigkeit des Diskriminators 5 sich verschlechtert. Der fertig trainierte Zustand der Parameter 4a ist mit dem Bezugszeichen 4a* bezeichnet. Diese Parameter 4a* definieren den fertig trainierten Generator 4.In step 190, parameters 4a, which characterize the behavior of generator 4, are optimized with the aim that the classification accuracy of discriminator 5 deteriorates. The fully trained state of the parameters 4a is denoted by the reference symbol 4a*. These parameters 4a* define the completely trained generator 4.

In Schritt 210 werden mit dem fertig trainierten Generator 4* weitere Eingabe-Vektoren 22 aus der latenten Verteilung 21 auf synthetische Messdaten 2 der vorgegebenen Domäne abgebildet.In step 210, further input vectors 22 from the latent distribution 21 are mapped onto synthetic measurement data 2 of the specified domain using the completely trained generator 4*.

In Schritt 220 wird unter Heranziehung dieser synthetischen Messdaten 2 als Trainingsdaten ein Klassifikator 6 für Messdaten trainiert. Der fertig trainierte Zustand dieses Klassifikators 6 ist mit dem Bezugszeichen 6* bezeichnet.In step 220, a classifier 6 for measurement data is trained using this synthetic measurement data 2 as training data. The fully trained state of this classifier 6 is denoted by the reference symbol 6*.

In Schritt 230 werden dem trainierten Klassifikator 6* weitere Messdaten 11' zugeführt, die mit mindestens einem Sensor aufgenommen wurden. Daraufhin bildet der Klassifikator diese Messdaten 11' auf Klassifikations-Scores 6a-6c in Bezug auf eine oder mehrere Klassen ab.In step 230, the trained classifier 6* is supplied with further measurement data 11', which were recorded with at least one sensor. The classifier then forms this measurement data 11' on classification scores 6a-6c in relation to one or more classes.

In Schritt 240 wird aus den Klassifikations-Scores 6a-6c ein Ansteuersignal gebildet.In step 240, a control signal is formed from the classification scores 6a-6c.

In Schritt 250 wird ein Fahrzeug 50, und/oder ein System 60 für die Qualitätskontrolle von Produkten, und/oder ein System 70 für die Überwachung von Bereichen, mit diesem Ansteuersignal 240a angesteuert.In step 250, a vehicle 50 and/or a system 60 for product quality control and/or a system 70 for monitoring areas is controlled with this control signal 240a.

In 2 ist beispielhaft veranschaulicht, wie Samples 11, 12 aus zwei Quellen zu einer Menge von Real-Samples 1 zusammengestellt werden können.In 2 is an example of how samples 11, 12 from two sources can be combined into a set of real samples 1.

Die erste Quelle 3a ist eine Menge von mit mindestens einem Sensor aufgenommenen Bildern a, b, c von PKW.The first source 3a is a set of images a, b, c of cars recorded with at least one sensor.

Die zweite Quelle 3b ist eine Menge von synthetisch generierten Bildern d, e, f, g, h und i von Fahrzeugen verschiedener Typen. Die Bilder d, e und h zeigen verschiedene Typen von PKW, die sich von den in den Bildern a, b und c gezeigten PKW deutlich unterscheiden. Bild f zeigt einen LKW, Bild g zeigt ein Schiff, und Bild i zeigt einen Schulbus.The second source 3b is a set of synthetically generated images d, e, f, g, h and i of vehicles of different types. Pictures d, e and h show different types of cars, which differ significantly from the cars shown in pictures a, b and c. Picture f shows a truck, picture g shows a ship, and picture i shows a school bus.

In dem in 2 gezeigten Beispiel ist es sehr sinnvoll, die Bilder a, b und c als Samples 11 aus der ersten Quelle 3a mit den Bildern d, e und h zu einer Gesamt-Menge von Real-Samples 1 zu vereinigen. Wird der Generator 4 hiermit trainiert, wird seine Fähigkeit, Bilder von PKWs mit einer größeren Variabilität zu erzeugen, deutlich verbessert. Genau dies geschieht, wenn die Auswahl der Samples 12 aus der zweiten Quelle 3b auf die bereits vorhandenen Samples 11 aus der ersten Quelle 3a konditioniert wird.in the in 2 In the example shown, it makes a lot of sense to combine the images a, b and c as samples 11 from the first source 3a with the images d, e and h to form a total set of real samples 1. If the generator 4 is trained in this way, its ability to generate images of cars with greater variability is significantly improved. This is exactly what happens when the selection of the samples 12 from the second source 3b is conditioned to the samples 11 already present from the first source 3a.

Hingegen würde sich die Qualität der vom Generator 4 erzeugten Bilder möglicherweise verschlechtern, wenn er mit einer Kombination aus den Bildern a, b und c und einem oder mehreren der Bilder f (LKW), g (Schiff) oder i (Schulbus) trainiert würde. Wie zuvor erläutert, wäre dann die Menge der Trainingsbilder für den Generator 4 in sich widersprüchlich. Dies könnte dazu führen, dass der Generator 4 Artefakte in die erzeugten Bilder einbringt, um die Widersprüche irgendwie aufzulösen und es „allen Trainingsbildern einigermaßen recht zu machen“.On the other hand, the quality of the images generated by generator 4 would possibly deteriorate if it were trained with a combination of images a, b and c and one or more of images f (truck), g (ship) or i (school bus). As previously explained, the set of training images for generator 4 would then be self-contradictory. This could result in Generator 4 introducing artifacts into the generated images in order to somehow resolve the contradictions and "make all training images more or less right".

ZITATE ENTHALTEN IN DER BESCHREIBUNGQUOTES INCLUDED IN DESCRIPTION

Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of documents cited by the applicant was generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.

Zitierte PatentliteraturPatent Literature Cited

  • DE 102018204494 B3 [0004]DE 102018204494 B3 [0004]

Claims (16)

Verfahren (100) zum Trainieren eines Generators (4), der Eingabe-Vektoren (22) aus einer latenten Verteilung (21) auf synthetische Messdaten (2) einer vorgegebenen Domäne abbildet, mit den Schritten: • es werden Samples (11) von Messdaten der vorgegebenen Domäne aus einer ersten Quelle (3a) als Real-Samples (1) beschafft (110); • es werden Samples (12) von Messdaten der vorgegebenen Domäne aus einer zweiten Quelle (3b), die auf die bereits aus der ersten Quelle (3a) beschafften Samples (11) konditioniert sind, als weitere Real-Samples (1) beschafft (120); • es werden Eingabe-Vektoren (22) aus der latenten Verteilung (21) gesampelt (130) und von dem Generator (4) auf Fake-Samples (2) mit synthetischen Messdaten abgebildet (140); • die Real-Samples (1) werden mit den Fake-Samples (2) zu einem Pool P vereinigt (150); • aus dem Pool P werden Samples P* gezogen (160) und von einem Diskriminator (5) dahingehend klassifiziert (170), ob es sich um Fake-Samples (2) handelt oder nicht; • Parameter (5a), die das Verhalten des Diskriminators (5) charakterisieren, werden optimiert (180) mit dem Ziel, dass die Klassifikationsgenauigkeit des Diskriminators (5) sich verbessert; • Parameter (4a), die das Verhalten des Generators (4) charakterisieren, werden optimiert (190) mit dem Ziel, dass die Klassifikationsgenauigkeit des Diskriminators (5) sich verschlechtert.Method (100) for training a generator (4), which maps input vectors (22) from a latent distribution (21) onto synthetic measurement data (2) of a specified domain, with the steps: • Samples (11) of measurement data of the specified domain are procured (110) from a first source (3a) as real samples (1); • Samples (12) of measurement data of the specified domain from a second source (3b), which are conditioned to the samples (11) already procured from the first source (3a), are procured as further real samples (1) (120 ); • input vectors (22) are sampled (130) from the latent distribution (21) and mapped (140) by the generator (4) to fake samples (2) with synthetic measurement data; • the real samples (1) are combined with the fake samples (2) to form a pool P (150); • Samples P* are drawn from the pool P (160) and classified (170) by a discriminator (5) as to whether they are fake samples (2) or not; • Parameters (5a) characterizing the behavior of the discriminator (5) are optimized (180) with the aim of improving the classification accuracy of the discriminator (5); • Parameters (4a), which characterize the behavior of the generator (4), are optimized (190) with the aim that the classification accuracy of the discriminator (5) deteriorates. Verfahren (100) nach Anspruch 1, wobei das Konditionieren der Samples (12) aus der zweiten Quelle (3b) auf die Samples (11) aus der ersten Quelle (3a) beinhaltet (121), dass die Samples (12) aus der zweiten Quelle (3b) in Bezug auf eine oder mehrere vorgegebene Eigenschaften einer durch die Samples (11) aus der ersten Quelle (3a) definierten Verteilung angehören, und/oder in Bezug auf diese eine oder mehrere Eigenschaften in sonstiger Weise zu den Samples (11) aus der ersten Quelle (3a) ähnlich sind.Method (100) according to claim 1 , wherein the conditioning of the samples (12) from the second source (3b) to the samples (11) from the first source (3a) includes (121) that the samples (12) from the second source (3b) with respect to belong to one or more predetermined properties of a distribution defined by the samples (11) from the first source (3a), and/or in relation to these one or more properties in some other way to the samples (11) from the first source (3a) are similar. Verfahren (100) nach einem der Ansprüche 1 bis 2, wobei Bilder als Samples (11, 12) von Messdaten gewählt werden (111).Method (100) according to any one of Claims 1 until 2 , images being selected (111) as samples (11, 12) of measurement data. Verfahren (100) nach Anspruch 2 und 3, wobei die vorgegebene Eigenschaft • die in den Bildern enthaltenen Farben; • die in den Bildern enthaltenen Objektklassen; und/oder • die in den Bildern enthaltenen Kombinationen von Objektklassen, umfasst (121a).Method (100) according to claim 2 and 3 , where the given property • the colors contained in the images; • the object classes contained in the images; and/or • the combinations of object classes contained in the images (121a). Verfahren (100) nach einem der Ansprüche 1 bis 4, wobei die Samples (12) aus der zweiten Quelle (3b) so abgewandelt werden (122), dass sie im Hinblick auf mindestens eine vorgegebene Eigenschaft zu einem geringeren Grade einer durch die Samples (11) aus der ersten Quelle (3a) definierten Verteilung angehören, und/oder in Bezug auf diese mindestens eine vorgegebene Eigenschaft in sonstiger Weise zu den Samples (11) aus der ersten Quelle (3a) unähnlicher werden.Method (100) according to any one of Claims 1 until 4 , wherein the samples (12) from the second source (3b) are modified (122) in such a way that, with regard to at least one predetermined property, they are to a lesser degree of a distribution defined by the samples (11) from the first source (3a). belong and/or become more dissimilar to the samples (11) from the first source (3a) in relation to this at least one predetermined property. Verfahren (100) nach Anspruch 3 und 5, wobei das Abwandeln beinhaltet (122a), • den in den Bildern enthaltenen Farben eine oder mehrere Farben hinzuzufügen; • den in den Bildern enthaltenen Objektklassen eine oder mehrere Objektklassen hinzuzufügen; und/oder • den in den Bildern enthaltenen Kombinationen von Objektklassen eine oder mehrere Kombinationen hinzuzufügen.Method (100) according to claim 3 and 5 wherein the modifying includes (122a) • adding one or more colors to the colors contained in the images; • add one or more object classes to the object classes contained in the images; and/or • to add one or more combinations to the combinations of object classes contained in the images. Verfahren (100) nach einem der Ansprüche 5 bis 6, wobei die Stärke des Abwandelns • als Funktion der Epoche E, in der der Generator (4) und der Diskriminator (5) trainiert werden, und/oder • als Funktion des Indexes T eines aktuellen Batches von Real-Samples (1), der in dieser Epoche E verarbeitet wird, variiert wird (122b).Method (100) according to any one of Claims 5 until 6 , where the strength of the modification • as a function of the epoch E, in which the generator (4) and the discriminator (5) are trained, and/or • as a function of the index T of a current batch of real samples (1), the processed in this epoch E is varied (122b). Verfahren (100) nach einem der Ansprüche 1 bis 7, wobei eine Menge von mit mindestens einem Sensor erfassten Messdaten als erste Quelle (3a) für Samples (11) gewählt wird (113).Method (100) according to any one of Claims 1 until 7 , A set of measurement data recorded with at least one sensor being selected as the first source (3a) for samples (11) (113). Verfahren (100) nach einem der Ansprüche 1 bis 8, wobei • eine Menge von mit mindestens einem weiteren Sensor erfassten Messdaten, und/oder • eine synthetische Generierung und/oder Abwandlung von Messdaten, als zweite Quelle (3b) für Samples (12) gewählt wird (123).Method (100) according to any one of Claims 1 until 8th , wherein • a quantity of measurement data recorded with at least one further sensor, and/or • a synthetic generation and/or modification of measurement data is selected as the second source (3b) for samples (12) (123). Verfahren (100) nach einem der Ansprüche 1 bis 9, wobei die Samples (12) aus der zweiten Quelle (3b) zu mehreren Batches von Samples (11) aus der ersten Quelle (3a) unabhängig voneinander ermittelt werden (124).Method (100) according to any one of Claims 1 until 9 , wherein the samples (12) from the second source (3b) to several batches of samples (11) from the first source (3a) are determined independently (124). Verfahren (100) nach einem der Ansprüche 1 bis 10, wobei die für das Training des Generators (4) und des Diskriminators (5) in einer vorgegebenen Anzahl Epochen benötigten Real-Samples (1) vollständig im Voraus ermittelt werden (155), bevor mit dem Training des Generators (4) und des Diskriminators (5) begonnen wird.Method (100) according to any one of Claims 1 until 10 , wherein the real samples (1) required for training the generator (4) and the discriminator (5) in a predetermined number of epochs are determined completely in advance (155) before training the generator (4) and the discriminator (5) is started. Verfahren (100) nach einem der Ansprüche 1 bis 11, wobei • mit dem fertig trainierten Generator (4*) weitere Eingabe-Vektoren (22) aus der latenten Verteilung (21) auf synthetische Messdaten (2) der vorgegebenen Domäne abgebildet werden (210) und • unter Heranziehung dieser synthetischen Messdaten (2) als Trainingsdaten ein Klassifikator (6) für Messdaten trainiert wird (220).Method (100) according to any one of Claims 1 until 11 , where • further input vectors (22) from the latent distribution with the completely trained generator (4*). (21) are mapped onto synthetic measurement data (2) of the specified domain (210) and • using this synthetic measurement data (2) as training data, a classifier (6) for measurement data is trained (220). Verfahren (100) nach Anspruch 12, wobei • dem trainierten Klassifikator (6*) weitere Messdaten (11') zugeführt werden (230), die mit mindestens einem Sensor aufgenommen wurden, so dass der Klassifikator diese Messdaten (11') auf Klassifikations-Scores (6a-6c) in Bezug auf eine oder mehrere Klassen abbildet; • aus den Klassifikations-Scores (6a-6c) ein Ansteuersignal (240a) gebildet wird (240); und • ein Fahrzeug (50), und/oder ein System (60) für die Qualitätskontrolle von Produkten, und/oder ein System (70) für die Überwachung von Bereichen, mit diesem Ansteuersignal (240a) angesteuert wird (250).Method (100) according to claim 12 , where • the trained classifier (6*) is supplied with further measurement data (11') (230), which were recorded with at least one sensor, so that the classifier can convert this measurement data (11') to classification scores (6a-6c) in depicts reference to one or more classes; • a control signal (240a) is formed (240) from the classification scores (6a-6c); and • a vehicle (50), and/or a system (60) for product quality control, and/or a system (70) for monitoring areas, is controlled (250) with this control signal (240a). Computerprogramm, enthaltend maschinenlesbare Anweisungen, die, wenn sie von einem oder mehreren Computern ausgeführt werden, den oder die Computer dazu veranlassen, das Verfahren (100) nach einem der Ansprüche 1 bis 13 auszuführen.Computer program containing machine-readable instructions which, when executed by one or more computers, cause the computer or computers to perform the method (100) according to any one of Claims 1 until 13 to execute. Maschinenlesbarer Datenträger mit dem Computerprogramm nach Anspruch 14.Machine-readable data carrier with the computer program Claim 14 . Ein oder mehrere Computer mit dem Computerprogramm nach Anspruch 14, und/oder mit dem maschinenlesbaren Datenträger und/oder Downloadprodukt nach Anspruch 15.One or more computers with the computer program after Claim 14 , and/or with the machine-readable data medium and/or download product claim 15 .
DE102021208727.2A 2021-08-10 2021-08-10 Training a synthetic measurement data generator with improved variability control Pending DE102021208727A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102021208727.2A DE102021208727A1 (en) 2021-08-10 2021-08-10 Training a synthetic measurement data generator with improved variability control

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102021208727.2A DE102021208727A1 (en) 2021-08-10 2021-08-10 Training a synthetic measurement data generator with improved variability control

Publications (1)

Publication Number Publication Date
DE102021208727A1 true DE102021208727A1 (en) 2023-02-16

Family

ID=85039849

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102021208727.2A Pending DE102021208727A1 (en) 2021-08-10 2021-08-10 Training a synthetic measurement data generator with improved variability control

Country Status (1)

Country Link
DE (1) DE102021208727A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102018204494B3 (en) 2018-03-23 2019-08-14 Robert Bosch Gmbh Generation of synthetic radar signals
US20210192594A1 (en) 2018-02-15 2021-06-24 Adobe Inc. Deep generation of user-customized items

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210192594A1 (en) 2018-02-15 2021-06-24 Adobe Inc. Deep generation of user-customized items
DE102018204494B3 (en) 2018-03-23 2019-08-14 Robert Bosch Gmbh Generation of synthetic radar signals

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LIU, X., Hsieh, C.-J.: Rob-gan: Generator, discriminator, and adversarial attacker. In: Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2019. S. 11234-11243. (online abrufbar über URL: https://openaccess.thecvf.com/content_CVPR_2019/papers/Liu_Rob-GAN_Generator_Discriminator_and_Adversarial_Attacker_CVPR_2019_paper.pdf)
TRAN, N.-T., et al.: On data augmentation for gan training. In: IEEE Transactions on Image Processing, 2021, 30. Jg., S. 1882-1897. doi: 10.1109/TIP.2021.3049346
ZHAO, S., et al.: Differentiable augmentation for data-efficient gan training. In: Advances in Neural Information Processing Systems, 2020, 33. Jg., S. 7559-7570. (inhaltsgleiche Version mit den Dokumentenseiten 1 – 12 online abrufbar über https://proceedings.neurips.cc/paper/2020/file/55479c55ebd1efd3ff125f1337100388-Paper.pdf)
ZHAO, Z., et al.: Image augmentations for gan training. In: arXiv preprint arXiv:2006.02595, 2020. S. 1-20. doi: 10.48550/arXiv.2006.02595

Similar Documents

Publication Publication Date Title
DE102012107886A1 (en) Method for the electronic detection of traffic signs
DE102021208727A1 (en) Training a synthetic measurement data generator with improved variability control
DE102020211483A1 (en) Method for testing a sensor system of a motor vehicle
DE102017201796A1 (en) Control device for determining a self-motion of a motor vehicle and motor vehicle and method for providing the control device
DE102016214599A1 (en) Method for detecting traffic signs in motor vehicles
DE102019209554A1 (en) Method for testing the robustness of a simulatable technical system, computer program, machine-readable storage medium and device as well as a technical system
DE102021214464B3 (en) Evaluation of generators to produce realistic images
DE102020211863A1 (en) Method and device for determining an electronic horizon for an assistance device for a vehicle
DE102020206990A1 (en) Device for processing sensor data and training methods
DE102020005467A1 (en) Process for making anonymized, ADAS-relevant vehicle data available
DE102016107530A1 (en) Regulation speed indicator of a vehicle
DE102020005827A1 (en) Method for updating map data for a navigation device of an autonomously driving vehicle
EP2087316A1 (en) Storage medium on which geographical data for a geographical area are stored in combined form as map units, method for generating a map from the geographical data, and navigation apparatus
DE102021208726A1 (en) Training a generator for synthetic measurement data with augmented training data
DE102018221625A1 (en) Transfer of additional information between camera systems
DE102022208480A1 (en) Method for evaluating a trained deep neural network
DE102022113744A1 (en) Method for creating a data set
DE102022200139A1 (en) Process for optimizing the perception of the environment for a driving support system using additional reference sensors
DE102023002770A1 (en) Method for operating a projection device of a vehicle and corresponding projection device
DE102023121575A1 (en) ELECTRONIC DEVICE, VEHICLE AND PROGRAM
DE102005047086A1 (en) Non-convex polygon`s presentability simplifying method for use in navigation system, involves replacing determined partial polygons if combined polygon is convex, removing dividing line from set and repeating steps until set is empty
DE102020215989A1 (en) Method for updating a digital map
DE102021003677A1 (en) Method for improving traffic sign recognition
DE102009009099A1 (en) Potential parking space detecting method for vehicle, involves carrying out search about coordinates of parking space in regional map, where coordinates of parking space is represented between coordinates of parking barriers in map
DE102021207151A1 (en) Evaluation of generators to produce realistic images

Legal Events

Date Code Title Description
R079 Amendment of ipc main class

Free format text: PREVIOUS MAIN CLASS: G06K0009660000

Ipc: G06V0030194000

R163 Identified publications notified