-
Die Erfindung betrifft ein Steuergerät zum Erzeugen von Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens und insbesondere ein Steuergerät, welches ausgebildet ist, auf einfache Art und Weise und mit geringem Ressourcenverbrauch zusätzliche Trainingsdaten zu erzeugen.
-
Algorithmen zum maschinellen Lernen basieren darauf, dass Verfahren der Statistik verwendet werden, um eine Datenverarbeitungsanlage derart zu trainieren, dass diese eine bestimmte Aufgabe ausführen kann, ohne dass diese ursprünglich explizit hierzu programmiert wurde. Das Ziel des maschinellen Lernens besteht dabei darin, Algorithmen zu konstruieren, die aus Daten lernen und Vorhersagen treffen können. Diese Algorithmen erstellen mathematische Modelle, mit denen beispielsweise Daten klassifiziert werden können.
-
Dabei kann ein zu modellierendes System beispielsweise durch Messungen erfasst, wobei anhand von Messwerten beispielsweise ein empirisches Modell erstellt werden und ein Algorithmus des maschinellen Lernens entsprechend trainiert werden kann. Hierbei kann es jedoch beispielsweise zu Situationen kommen, in denen es unmöglich ist, einen zu modellierenden Prozess beziehungsweise ein zu modellierendes System vollständig durchzumessen.
-
Dies kann jedoch zur Folge haben, dass für die empirische Modellbildung beziehungsweise das entsprechende Trainieren des Algorithmus des maschinellen Lernens nur partielle Daten aus einem Teilraum zur Verfügung stehen, wobei jedoch im Betrieb auch Prozesszustände auftreten können, die durch diese Trainingsdaten nicht erfasst sind.
-
Als Lösung dieses Problems wurden Augmentationsverfahren vorgeschlagen, das heißt Verfahren zur Erzeugung zusätzlicher Trainingsdaten. Als nachteilig erweist sich bei bekannten Augmentationsverfahren jedoch, dass diese sehr komplex sind und viele Computerressourcen, insbesondere Speicher- und Prozessorkapazitäten erfordern, so dass diese mit gewöhnlichen Datenverarbeitungsanlagen nur schwer zu realisieren sind.
-
Aus der Druckschrift
US 2019/0354895 A1 ist ein Verfahren zum Erlernen einer Datenergänzungsstrategie zum Trainieren eines Algorithmus des maschinellen Lernens bekannt, wobei Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens empfangen und mehrere Datenergänzungsstrategie bestimmt werden, indem eine aktuelle Datenergänzungsstrategie basierend auf Qualitätsparametern vorheriger Datenergänzungsstrategie erzeugt wird, der Algorithmus des maschinellen Lernens basierend auf der aktuellen Datenergänzungsstrategie trainiert wird und Qualitätsparameter bezüglich der aktuellen Datenergänzungsstrategie bestimmt werden nachdem der Algorithmus des maschinellen Lernens basierend auf der aktuellen Datenergänzungsstrategie trainiert wurde, wobei anschließend eine Datenergänzungsstrategie basierend auf den Qualitätsparametern der einzelnen Datenergänzungsstrategien ausgewählt wird.
-
Der Erfindung liegt somit die Aufgabe zugrunde, ein verbessertes Steuergerät zum Erzeugen von Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens anzugeben.
-
Die Aufgabe wird mit einem Steuergerät zum Erzeugen von Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens gemäß den Merkmalen des Anspruchs 1 gelöst.
-
Vorteilhafte Ausführungsformen und Weiterbildungen ergeben sich aus den Unteransprüchen sowie aus der Beschreibung unter Bezugnahme auf die Figuren.
-
Offenbarung der Erfindung
-
Gemäß einer Ausführungsform der Erfindung wird diese Aufgabe gelöst durch ein Steuergerät zum Erzeugen von Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens, wobei das Steuergerät eine erste Bereitstellungseinheit, welche ausgebildet ist, erste Trainingsdaten bereitzustellen, eine Erzeugungseinheit, welche ausgebildet ist, zusätzliche Trainingsdaten aus zumindest einem Teil der ersten Trainingsdaten zu erzeugen, wobei die zusätzlichen Trainingsdaten durch die Erzeugungseinheit erzeugt werden, indem auf alle in dem zumindest einen Teil der ersten Trainingsdaten enthaltenen Trainingsdaten jeweils eine zufällig aus einer Menge von möglichen Augmentationsfunktionen ausgewählte Augmentationsfunktion angewendet wird, und eine zweite Bereitstellungseinheit, welche ausgebildet ist, die ersten Trainingsdaten und die zusätzlichen Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens bereitzustellen, aufweist.
-
Unter Augmentation werden hierbei Verfahren zum Erweitern beziehungsweise Ergänzen von Eingangsdaten, insbesondere von Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens verstanden, wobei insbesondere weitere beziehungsweise zusätzliche Daten durch Vervielfältigen und Variieren der Eingangsdaten erzeugt werden. Die Funktionen, welche dabei auf die Eingangsdaten angewendet werden um die zusätzlichen Daten zu erzeugen werden dabei als Augmentationsfunktionen, bezeichnet, wobei die Gesamtheit der Augmentationsfunktionen die Menge von möglichen Augmentationsfunktionen bildet.
-
Die Trainingsdaten bilden dabei einen Datensatz um den Algorithmus des maschinellen Lernens derart zu trainieren, dass dieser anschließend möglichst alle Zustände eines modellierten Systems beziehungsweise modellierten Prozesses abdeckt.
-
Das Steuergerät und insbesondere die Erzeugungseinheit sind somit derart ausgebildet, dass die zusätzlichen Trainingsdaten durch jeweiliges einfaches Anwenden einer einzigen Augmentationsfunktion auf die ersten Trainingsdaten erzeugt werden, ohne dass hier aufwendig und ressourcenintensiv zunächst beispielsweise Datenergänzungsstrategien erlernt werden müssen. Somit können auf einfache Art und Weise und mit geringem Ressourcenverbrauch zusätzliche Trainingsdaten erzeugt werden, so dass das Steuergerät auch auf gewöhnlichen Datenverarbeitungsanlagen ausgebildet beziehungsweise durch diese realisiert sein kann. Im Vergleich mit anderen Steuergeräten, welche ausgebildet sind, Augmentationsverfahren auszuführen, zeigt sich zudem, dass das Steuergerät derart ausgebildet ist, dass bei der Erzeugung von zusätzlichen Trainingsdaten sehr zuverlässig gute Ergebnisse erzielt werden können. Insgesamt wird somit ein verbessertes Steuergerät zum Erzeugen von Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens angegeben.
-
In einer Ausführungsform ist die Erzeugungseinheit dabei insbesondere ausgebildet, zusätzliche Trainingsdaten aus dem zumindest einen Teil der ersten Trainingsdaten zu erzeugen, indem weiter für alle in dem zumindest einen Teil der ersten Trainingsdaten enthaltenen Trainingsdaten jeweils ein Stärkegrad für die Augmentationsfunktion aus einer Menge von möglichen Stärkegraden zufällig ausgewählt wird und für alle in dem zumindest einen Teil der ersten Trainingsdaten enthaltenen Trainingsdaten jeweils zusätzliche Trainingsdaten durch Anwenden der entsprechenden, zufällig ausgewählten Augmentationsfunktion auf die Trainingsdaten unter Verwendung des entsprechenden, zufällig ausgewählten Stärkegrades erzeugt werden.
-
Unter Stärkegrad für die Augmentationsfunktion wird hierbei ein Stärkegrad der jeweils auf die Trainingsdaten angewendeten Augmentationsfunktion verstanden, das heißt wie stark beziehungsweise mit welcher Stärke jeweils die entsprechende, zufällig ausgewählte Augmentationsfunktion angewendet wird. Beispielsweise kann der Stärkegrad angeben, um wieviel Grad ein Bild zu gedreht werden soll, falls es sich bei den ersten Trainingsdaten um Bilddaten und bei einer entsprechenden Augmentationsfunktion um ein Drehen von Bilddaten handelt. Die Gesamtheit aller möglichen Stärkegrade bildet dabei wiederum die Menge aller möglichen Stärkegrade. Dass die zusätzlichen Trainingsdaten dabei unter Verwendung des entsprechenden, zufällig ausgewählten Stärkegrades erzeugt werden, bedeutet dabei somit, dass der zufällig ausgewählte Stärkegrad bei der Anwendung der entsprechenden, zufällig ausgewählten Augmentationsfunktion berücksichtigt wird.
-
Somit können das Steuergerät und insbesondere die Erzeugungseinheit weiter insbesondere auch derart ausgebildet sein, dass, wie bei bekannten Augmentationsverfahren üblich, zusätzliche Parameter beim Erzeugen von zusätzlichen Trainingsdaten berücksichtigt beziehungsweise herangezogen werden könne, ohne dass diese zusätzlichen Trainingsdaten jedoch zuvor aufwendig und ressourcenintensiv erlernt werden müssen.
-
Weiter können alle Elemente der Menge von möglichen Augmentationsfunktionen jeweils dieselbe Wahrscheinlichkeit ausgewählt zu werden aufweisen und/oder können alle Elemente der Menge von möglichen Stärkegraden jeweils dieselbe Wahrscheinlichkeit ausgewählt zu werden aufweisen. Hierdurch wird ermöglicht, dass ach einer gewissen Zeit jede mögliche Augmentationsfunktion und jeder mögliche Stärkegrad in etwa gleichhäufig angewendet wurden und die zusätzlichen Trainingsdaten vorgegebene beziehungsweise voreingestellte Kriterien möglichst genau widerspiegeln.
-
Zudem kann es sich bei den ersten Trainingsdaten um Bilddaten handeln.
-
Dabei können die Augmentationsfunktionen eine Solarisation von Bilddaten, eine Posterisation von Bilddaten, eine Helligkeitsänderung von Bilddaten, eine Scherung von Bilddaten, eine Drehung von Bilddaten, eine Kontraständerung von Bilddaten, und/oder ein Ausschneiden von zumindest einem Teil aus Bilddaten aufweisen.
-
Unter Solarisation von Bilddaten wird dabei eine Verfremdung von Bilddaten durch starke Überbelichtung verstanden.
-
Unter Posterisation wird weiter eine Tonwerttrennung beziehungsweise der fotographische Effekt der Tontrennung bei gleichzeitiger Tonwertreduktion verstanden.
-
Unter Helligkeitsänderung wird weiter eine Anpassung der Helligkeit der Bilddaten verstanden.
-
Unter Scherung wird weiter eine affine Abbildung einer Ebene auf sich selbst verstanden, wobei eine Scherung beispielsweise ein Rechteck auf ein Parallelogramm abbildet.
-
Drehung bedeutet ferner, dass die Bilddaten um eine Drehachse gedreht werden.
-
Eine Kontraständerung bewirkt weiter eine Anpassung der Farbtiefe beziehungsweise des Unterschiedes zwischen hellen und dunklen Bereichen in den Bilddaten verstanden.
-
Ein Ausschneiden von zumindest einem Teil aus Bilddaten bewirkt ferner, dass in den entsprechenden Bilddaten jeweils zumindest ein Teil entfernt wurde.
-
Da derartige Augmentationsfunktionen bekannt sind, kann das Steuergerät somit ausgebildet sein, die ergänzenden Trainingsdaten auf einfache Art und Weise basierend auf bekannten Augmentationsfunktionen zu realisieren, ohne dass zunächst aufwendig und ressourcenintensiv Augmentationsfunktionen implementiert werden müssten.
-
Mit einer weiteren Ausführungsform der Erfindung wird weiter auch ein Steuergerät zum Trainieren eines Algorithmus des maschinellen Lernens angegeben, wobei das Steuergerät ausgebildet ist, den Algorithmus des maschinellen Lernens basierend auf durch ein obenstehend beschriebenes Steuergerät zum Erzeugen von Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens erzeugten Trainingsdaten zu trainieren.
-
Ein derartiges Steuergerät hat den Vorteil, dass dieses ausgebildet ist, den Algorithmus des maschinellen Lernens basierend auf einem verbesserten Datensatz beziehungsweise einem verbesserten Satz an Trainingsdaten zu trainieren. Insbesondere ist das Steuergerät dabei derart ausgebildet, dass zusätzlichen Trainingsdaten durch einfaches Anwenden einer einzigen Augmentationsfunktion auf die ersten Trainingsdaten erzeugt werden, ohne dass hier aufwendig und ressourcenintensiv zunächst beispielsweise Datenergänzungsstrategien erlernt werden müssen. Somit können auf einfache Art und Weise und mit geringem Ressourcenverbrauch zusätzliche Trainingsdaten erzeugt werden, so dass das Steuergerät auch auf gewöhnlichen Datenverarbeitungsanlagen ausgebildet beziehungsweise durch diese realisiert sein kann. Im Vergleich mit anderen Augmentationsverfahren zeigt sich zudem, dass dabei bei der Erzeugung von zusätzlichen Trainingsdaten sehr zuverlässig gute Ergebnisse erzielt werden können.
-
Bei dem Algorithmus zum maschinellen Lernen kann es sich dabei beispielsweise um einen Algorithmus zur Bildklassifikation oder einen Algorithmus zur Objekterkennung handeln. Insbesondere kann dabei basierend auf dem erzeugten Trainingsdatensatz Einfluss auf eine an das Trainieren anschließende Klassifizierung durch den Algorithmus des maschinellen Lernens genommen werden und insbesondere eine anschließende Klassifizierung durch den Algorithmus des maschinellen Lernens optimiert werden.
-
Mit einer weiteren Ausführungsform der Erfindung wird ferner auch ein Steuergerät zum Klassifizieren von Bilddaten angegeben, wobei das Steuergerät ausgebildet ist, Bilddaten unter Verwendung eines Algorithmus zum maschinellen Lernen zu klassifizieren, und wobei der Algorithmus zum maschinellen Lernen unter Verwendung eines obenstehend beschriebenen Steuergeräts trainiert wurde.
-
Insbesondere kann das Steuergerät dabei verwendet werden, um Bilddaten, insbesondere digitale Bilddaten auf der Grundlage von Low-level-Merkmalen, beispielsweise Kanten oder Pixelattributen, zu klassifizieren. Dabei kann weiter ein Bildverarbeitungsalgorithmus verwendet werden, um ein Klassifizierungsergebnis, welches sich auf entsprechende Low-Ievel Merkmale konzentriert, zu analysieren.
-
Somit wird ein Steuergerät zum Klassifizieren von Bilddaten angegeben, welches auf einem Algorithmus des maschinellen Lernens basiert, der auf einem verbesserten Trainingsdatensatz trainiert wurde. Insbesondere wurden dabei zusätzliche Trainingsdaten durch einfaches Anwenden einer einzigen Augmentationsfunktion auf die ersten Trainingsdaten erzeugt, ohne dass hier aufwendig und ressourcenintensiv zunächst beispielsweise Datenergänzungsstrategien erlernt werden mussten. Somit konnten auf einfache Art und Weise und mit geringem Ressourcenverbrauch zusätzliche Trainingsdaten erzeugt werden, so dass das Steuergerät insbesondere auch auf gewöhnlichen Datenverarbeitungsanlagen ausgebildet beziehungsweise durch diese realisiert sein kann. Im Vergleich mit anderen Augmentationsverfahren zeigt sich zudem, dass dabei bei der Erzeugung von zusätzlichen Trainingsdaten sehr zuverlässig gute Ergebnisse erzielt werden können.
-
Zusammenfassend ist festzustellen, dass mit der vorliegenden Erfindung ein verbessertes Steuergerät zum Erzeugen von Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens angegeben.
-
Insbesondere wird ein Steuergerät angegeben, welches derart ausgebildet ist, dass die zusätzlichen Trainingsdaten durch einfaches Anwenden einer einzigen Augmentationsfunktion auf erste Trainingsdaten erzeugt werden, ohne dass hier aufwendig und ressourcenintensiv zunächst beispielsweise Datenergänzungsstrategien erlernt werden müssen. Somit können auf einfache Art und Weise und mit geringem Ressourcenverbrauch zusätzliche Trainingsdaten erzeugt werden, so dass das Steuergerät auch auf gewöhnlichen Datenverarbeitungsanlagen ausgebildet beziehungsweise durch diese realisiert sein kann. Im Vergleich mit anderen Steuergeräten, welche ausgebildet sind, Augmentationsverfahren auszuführen, zeigt sich zudem, dass das Steuergerät derart ausgebildet ist, dass bei der Erzeugung von zusätzlichen Trainingsdaten sehr zuverlässig gute Ergebnisse erzielt werden können.
-
Die zusätzlichen Trainingsdaten können ferner auch durch ein im Folgenden angegebenes und mit Ziffern durchnummeriertes Verfahren erzeugt werden.
- 1. Verfahren zum Erzeugen von Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens, wobei das Verfahren folgende Schritte aufweist:
- - Bereitstellen von ersten Trainingsdaten;
- - Erzeugen zusätzlicher Trainingsdaten aus zumindest einem Teil der ersten Trainingsdaten, wobei die zusätzlichen Trainingsdaten erzeugt werden, indem auf alle in dem zumindest einen Teil der ersten Trainingsdaten enthaltenen Trainingsdaten jeweils eine zufällig aus einer Menge von möglichen Augmentationsfunktionen ausgewählte Augmentationsfunktion angewendet wird; und
- - Bereitstellen der ersten Trainingsdaten und der zusätzlichen Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens.
- 2. Verfahren nach Ziffer 1, wobei der Schritt des Erzeugens zusätzlicher Trainingsdaten aus dem zumindest einen Teil der ersten Trainingsdaten weiter für alle in dem zumindest einen Teil der ersten Trainingsdaten enthaltenen Trainingsdaten jeweils ein zufälliges Auswählen eines Stärkegrades für die Augmentationsfunktion aus einer Menge von möglichen Stärkegraden und ein Erzeugen von zusätzlichen Trainingsdaten durch Anwenden der entsprechenden, zufällig ausgewählten Augmentationsfunktion auf die Trainingsdaten unter Verwendung des entsprechenden, zufällig ausgewählten Stärkegrades aufweist.
- 3. Verfahren nach Ziffer 2, wobei alle Elemente der Menge von möglichen Augmentationsfunktionen jeweils dieselbe Wahrscheinlichkeit ausgewählt zu werden aufweisen und/oder alle Elemente der Menge von möglichen Stärkegraden jeweils dieselbe Wahrscheinlichkeit ausgewählt zu werden aufweisen.
- 4. Verfahren nach einer der Ziffern 1 bis 3, wobei es sich bei den ersten Trainingsdaten um Bilddaten handelt.
- 5. Verfahren nach Ziffer 4, wobei die Augmentationsfunktionen eine Solarisation von Bilddaten, eine Posterisation von Bilddaten, eine Helligkeitsänderung von Bilddaten, eine Scherung von Bilddaten, eine Drehung von Bilddaten, eine Kontraständerung von Bilddaten, und/oder ein Ausschneiden von zumindest einem Teil von Bilddaten aufweisen.
- 6. Verfahren zum Trainieren eines Algorithmus des maschinellen Lernens, wobei der Algorithmus des maschinellen Lernens basierend auf durch ein Verfahren zum Erzeugen von Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens nach einer der Ziffern 1 bis 5 erzeugten Trainingsdaten trainiert wird.
- 7. Verfahren nach Ziffer 6, wobei es sich bei dem Algorithmus des maschinellen Lernens um einen Algorithmus zur Bildklassifikation oder einen Algorithmus zur Objekterkennung handelt.
- 8. Verfahren zum Klassifizieren von Bilddaten, wobei die Bilddaten unter Verwendung eines Algorithmus des maschinellen Lernens klassifiziert werden, und wobei der Algorithmus des maschinellen Lernens unter Verwendung eines Verfahrens nach Ziffer 7 trainiert wurde.
-
Die beschriebenen Ausgestaltungen und Weiterbildungen lassen sich beliebig miteinander kombinieren.
-
Weitere mögliche Ausgestaltungen, Weiterbildungen und Implementierungen der Erfindung umfassen auch nicht explizit genannte Kombinationen von zuvor oder im Folgenden bezüglich der Ausführungsbeispiele beschriebenen Merkmale der Erfindung.
-
Figurenliste
-
Die beiliegenden Zeichnungen sollen ein weiteres Verständnis der Ausführungsformen der Erfindung vermitteln. Sie veranschaulichen Ausführungsformen und dienen im Zusammenhang mit der Beschreibung der Erklärung von Prinzipien und Konzepten der Erfindung.
-
Andere Ausführungsformen und viele der genannten Vorteile ergeben sich im Hinblick auf die Zeichnungen. Die dargestellten Elemente der Zeichnungen sind nicht notwendigerweise maßstabsgetreu zueinander gezeigt.
-
Es zeigen:
- 1. zeigt ein Flussdiagramm eines Verfahrens zum Erzeugen von Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens gemäß einem Beispiel;
- 2. zeigt ein Blockschaltbild eines Steuergeräts zum Trainieren eines Algorithmus des maschinellen Lernens gemäß Ausführungsformen der Erfindung.
-
In den Figuren der Zeichnungen bezeichnen gleiche Bezugszeichen gleiche oder funktionsgleiche Elemente, Bauteile oder Komponenten, soweit nichts Gegenteiliges angegeben ist.
-
1 zeigt ein Flussdiagramm eines Verfahrens 1 zum Erzeugen von Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens gemäß einem Beispiel.
-
Algorithmen zum maschinellen Lernen basieren darauf, dass Verfahren der Statistik verwendet werden, um eine Datenverarbeitungsanlage derart zu trainieren, dass diese eine bestimmte Aufgabe ausführen kann, ohne dass diese ursprünglich explizit hierzu programmiert wurde. Das Ziel des maschinellen Lernens besteht dabei darin, Algorithmen zu konstruieren, die aus Daten lernen und Vorhersagen treffen können. Diese Algorithmen erstellen mathematische Modelle, mit denen beispielsweise Daten klassifiziert werden können.
-
Dabei kann ein zu modellierendes System beispielsweise durch Messungen erfasst, wobei anhand von Messwerten beispielsweise ein empirisches Modell erstellt werden und ein Algorithmus des maschinellen Lernens entsprechend trainiert werden kann. Hierbei kann es jedoch beispielsweise zu Situationen kommen, in denen es unmöglich ist, einen zu modellierenden Prozess beziehungsweise ein zu modellierendes System vollständig durchzumessen. Dies kann jedoch zur Folge haben, dass für die empirische Modellbildung beziehungsweise das entsprechende Trainieren des Algorithmus des maschinellen Lernens nur partielle Daten aus einem Teilraum zur Verfügung stehen, wobei jedoch im Betrieb auch Prozesszustände auftreten können, die durch diese Trainingsdaten nicht erfasst sind.
-
Als Lösung dieses Problems wurden Augmentationsverfahren vorgeschlagen, das heißt Verfahren zur Erzeugung zusätzlicher Trainingsdaten. Als nachteilig erweist sich bei bekannten Augmentationsverfahren jedoch, dass diese sehr komplex sind und viele Computerressourcen, insbesondere Speicher- und Prozessorkapazitäten erfordern, so dass diese mit gewöhnlichen Datenverarbeitungsanlagen nur schwer zu realisieren sind.
-
Gemäß dem Beispiel der 1 wird ein Verfahren 1 zum Erzeugen von Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens angegeben, wobei zunächst in einem Schritt 2 erste Trainingsdaten bereitgestellt werden. In einem Schritt 3 wird dann zufällig eine Augmentationsfunktion aus einer Menge von möglichen Augmentationsfunktionen ausgewählt und in einem folgenden Schritt 4 werden zusätzliche Trainingsdaten erzeugt, indem auf Trainingsdaten aus den ersten Trainingsdaten, beispielsweise ein Bild innerhalb der ersten Trainingsdaten, die entsprechende, zufällig ausgewählte Augmentationsfunktion angewendet wird. In einem Schritt 5 werden die ersten Trainingsdaten und die zusätzlichen Trainingsdaten dann zum Trainieren des Algorithmus des maschinellen Lernens bereitgestellt.
-
Insgesamt zeigt 1 somit ein Beispiel eines Verfahrens 1 zum Erzeugen von Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens, mit welchem zusätzliche Trainingsdaten durch einfaches Anwenden einer einzigen Augmentationsfunktion auf die ersten Trainingsdaten erzeugt werden, ohne dass hier aufwendig und ressourcenintensiv zunächst beispielsweise Datenergänzungsstrategien erlernt werden müssen. Im Vergleich mit anderen Augmentationsverfahren zeigt sich zudem, dass durch das Verfahren 1 sehr zuverlässig gute Ergebnisse erzielt werden können.
-
1 zeigt dabei weiter einen Schritt 6 eines zufälligen Auswählens eines Stärkegrades für die Augmentationsfunktion aus einer Menge von möglichen Stärkegraden, wobei die zusätzlichen Trainingsdaten in dem Schritt 4 durch Anwenden der entsprechenden, in Schritt 2 zufällig ausgewählten Augmentationsfunktion auf die Trainingsdaten unter Verwendung des entsprechenden, in Schritt 6 zufällig ausgewählten Stärkegrades aufweist. Anzumerken ist dabei jedoch, dass nicht bei allen Augmentationen ein Stärkegrad angewendet werden muss, das heißt in Schritt 6 auch ein Stärkegrad von null ausgewählt werden kann.
-
Gemäß dem Beispiel der 1 weisen dabei zudem alle Elemente der Menge von möglichen Augmentationsfunktionen jeweils dieselbe Wahrscheinlichkeit ausgewählt zu werden auf und weisen alle Elemente der Menge von möglichen Stärkegraden jeweils dieselbe Wahrscheinlichkeit ausgewählt zu werden auf.
-
Zudem handelt es sich bei den ersten Trainingsdaten um Bilddaten, wobei die Augmentationsfunktionen eine Solarisation von Bilddaten, eine Posterisation von Bilddaten, eine Helligkeitsänderung von Bilddaten, eine Scherung von Bilddaten, eine Drehung von Bilddaten, eine Kontraständerung von Bilddaten, und/oder ein Ausschneiden von zumindest einem Teil von Bilddaten aufweisen.
-
2 zeigt ein Blockschaltbild eines Steuergeräts 10 zum Trainieren eines Algorithmus des maschinellen Lernens gemäß Ausführungsformen der Erfindung.
-
Wie 2 zeigt, weist das Steuergerät 10 dabei eine Trainingseinheit 11 zum Trainieren eines Algorithmus des maschinellen Lernens sowie ein Steuergerät 12 zum Erzeugen von Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens auf, wobei die Trainingseinheit 11 ausgebildet ist, durch das Steuergerät 12 erzeugte Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens zu verwenden.
-
Die Trainingseinheit kann dabei beispielsweise basierend auf in einem Speicher hinterlegten und durch einen Prozessor ausführbaren Code realisiert werden.
-
Gemäß den Ausführungsformen der 2 weist das Steuergerät 12 zum Erzeugen von Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens dabei eine erste Bereitstellungseinheit 13, welche ausgebildet ist, erste Trainingsdaten bereitzustellen, eine Erzeugungseinheit 14, welche ausgebildet ist, zusätzliche Trainingsdaten aus zumindest einem Teil der ersten Trainingsdaten zu erzeugen, wobei die zusätzlichen Trainingsdaten durch die Erzeugungseinheit 14 erzeugt werden, indem auf alle in dem zumindest einen Teil der ersten Trainingsdaten enthaltenen Trainingsdaten jeweils eine zufällig aus einer Menge von möglichen Augmentationsfunktionen ausgewählte Augmentationsfunktion angewendet wird, und eine zweite Bereitstellungseinheit 15, welche ausgebildet ist, die ersten Trainingsdaten und die zusätzlichen Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens bereitzustellen, auf.
-
Das Steuergerät 12 zum Erzeugen von Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens und insbesondere die Erzeugungseinheit 14 sind somit derart ausgebildet, dass die zusätzlichen Trainingsdaten durch jeweiliges einfaches Anwenden einer einzigen Augmentationsfunktion auf die ersten Trainingsdaten erzeugt werden, ohne dass hier aufwendig und ressourcenintensiv zunächst beispielsweise Datenergänzungsstrategien erlernt werden müssen. Somit können auf einfache Art und Weise und mit geringem Ressourcenverbrauch zusätzliche Trainingsdaten erzeugt werden, so dass das Steuergerät 12 auch auf gewöhnlichen Datenverarbeitungsanlagen ausgebildet beziehungsweise durch diese realisiert sein kann. Im Vergleich mit anderen Steuergeräten, welche ausgebildet sind, Augmentationsverfahren auszuführen, zeigt sich zudem, dass das Steuergerät 12 derart ausgebildet ist, dass bei der Erzeugung von zusätzlichen Trainingsdaten sehr zuverlässig gute Ergebnisse erzielt werden können.
-
Insgesamt wird somit ein verbessertes Steuergerät 12 zum Erzeugen von Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens angegeben.
-
Bei den ersten Trainingsdaten handelt es sich dabei insbesondere um in einem Speicher 16 hinterlegte, ursprünglich bereitgestellte Trainingsdaten beziehungsweise Stichproben zum Trainieren des Algorithmus des maschinellen Lernens, wobei das Steuergerät 12 zum Erzeugen von Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens ausgebildet ist, die in dem Speicher 16 hinterlegten Daten derart zu verarbeiten, dass ein schlussendlich zum Trainieren des Algorithmus des maschinellen Lernens noch weitere, aus den ersten Trainingsdaten abgeleitete zusätzliche Trainingsdaten zur Verfügung stehen
-
Die Erzeugungseinheit kann dabei beispielsweise wiederum basierend auf in einem Speicher hinterlegten und durch einen Prozessor ausführbaren Code realisiert werden. Bei der zweiten Bereitstellungseinheit kann es sich ferner um einen Transmitter handeln, welcher ausgebildet ist, die ersten Trainingsdaten und die erzeugten zusätzlichen Trainingsdaten beziehungsweise den schlussendlichen Datensatz an Trainingsdaten an die Trainingseinheit zu übermitteln.
-
Gemäß den Ausführungsformen der 2 ist die Erzeugungseinheit 14 zudem ausgebildet, zusätzliche Trainingsdaten aus dem zumindest einen Teil der ersten Trainingsdaten zu erzeugen, indem weiter für alle in dem zumindest einen Teil der ersten Trainingsdaten enthaltenen Trainingsdaten jeweils ein Stärkegrad für die Augmentationsfunktion aus einer Menge von möglichen Stärkegraden zufällig ausgewählt wird und zusätzliche Trainingsdaten durch Anwenden der entsprechenden, zufällig ausgewählten Augmentationsfunktion auf die Trainingsdaten unter Verwendung des entsprechenden, zufällig ausgewählten Stärkegrades erzeugt werden.
-
Gemäß den Ausführungsformen der 2 weisen dabei zudem wiederum alle Elemente der Menge von möglichen Augmentationsfunktionen jeweils dieselbe Wahrscheinlichkeit ausgewählt zu werden auf und weisen alle Elemente der Menge von möglichen Stärkegraden ebenfalls jeweils dieselbe Wahrscheinlichkeit ausgewählt zu werden auf.
-
Zudem handelt es sich bei den ersten Trainingsdaten um Bilddaten, beispielsweise um digitale Bilddaten, Videodaten, Radar-Daten, LIDAR-Daten, Ultraschall-Daten, aus Bewegungsdaten gewonnene Bilddaten, oder um Wärmebilder.
-
Die Augmentationsfunktionen weisen zudem wiederum eine Solarisation von Bilddaten, eine Posterisation von Bilddaten, eine Helligkeitsänderung von Bilddaten, eine Scherung von Bilddaten, eine Drehung von Bilddaten, eine Kontraständerung von Bilddaten, und ein Ausschneiden von zumindest einem Teil von Bilddaten auf. Da derartige Augmentationsfunktionen bekannt sind, ist das Steuergerät 12 somit ausgebildet, die ergänzenden, zusätzlichen Trainingsdaten auf einfache Art und Weise basierend auf bekannten Augmentationsfunktionen zu realisieren, ohne dass zunächst aufwendig und ressourcenintensiv Augmentationsfunktionen implementiert werden müssten.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- US 2019/0354895 A1 [0006]