EP4356305A1

EP4356305A1 - Verfahren zum übertragen eines netzwerkverhaltens eines trainierten startnetzwerkes auf ein zielnetzwerk ohne verwendung eines originaldatensatzes

Info

Publication number: EP4356305A1
Application number: EP22737408.9A
Authority: EP
Inventors: Erik Engelhardt
Original assignee: Basler AG
Current assignee: Basler AG
Priority date: 2021-06-15
Filing date: 2022-06-15
Publication date: 2024-04-24
Also published as: DE102021115425A1; WO2022263554A1

Abstract

Die Erfindung betrifft ein Verfahren zur Bereitstellung von Hyperparametern zur Erzeugung von künstlichen Bildern, umfassend das Erstellen eines initialen Hyperparametersatzes, Erstellen eines initialen Bilddatensatzes, Erzeugen eines Bilddatensatzes mittels eines bildoptimierten Verfahrens in Abhängigkeit des Hyperparametersatzes, Prüfen des erzeugten Bilddatensatzes auf ein vorbestimmtes Abbruchkriterium, Anpassen des Hyperparametersatzes und erneutes Durchführen des bildoptimierten Verfahrens mit geänderten Hyperparametern, wenn die Prüfung ergibt, dass das Abbruchkriterium nicht erfüllt ist, oder Bereitstellen des angepassten Hyperparametersatzes als erster Hyperparametersatz, wenn die Prüfung ergibt, dass das Abbruchkriterium erfüllt ist.

Description

Verfahren zum Übertragen eines Netzwerkverhaltens eines trainierten Startnetzwerkes auf ein Zielnetzwerk ohne Verwendung eines Originaldatensatzes

Die vorliegende Erfindung betrifft ein Verfahren zur Bereitstellung von Hyperparametern zur Erzeugung von künstlichen Bildern. Zudem betrifft die vorliegende Erfindung ein Verfahren zum Erstellen eines synthetischen Bilddatensatzes. Die vorliegende Erfindung betrifft auch ein Verfahren zum Übertragen eines Netzwerkverhaltens eines Startnetzwerkes auf ein Zielnetzwerk. Zudem betrifft die vorliegende Erfindung ein Berechnungssystem und ein Übertragungssystem zum Übertragen eines Netzwerkverhaltens eines Startnetzwerkes auf ein Zielnetzwerk.

Künstliche neuronale Netze (KNNs) sind Stand der Technik für viele Anwendungen und haben Marktreife für industrielle Anwendungen erlangt, beispielsweise im Bereich Compu- ter Vision.

Moderne Architekturen von KNNs, die als Netzwerkarchitekturen bezeichnet werden können, sind beispielsweise das Residual Network (ResNet) oder das VGG Network (z.B. VGG-16). Diese beiden künstlichen neuronalen Netze sind der Klasse der Convolutional Neural Networks (CNN) zuzuordnen. Modernen KNNs erreichen für Problemstellungen der Klassifikation oder Detektion auf komplexen Datensätzen mit einigen hundert bis tausend Klassen, eine gute Performance. Solche neuronalen Netze können auch als tiefe KNNs bezeichnet werden.

Problematisch bei solchen modernen Architekturen von KNNs ist jedoch, dass diese für den Einsatz in der Industrie und im Besonderen für Echtzeitanwendungen teilweise unge- eignet sind. Industrielle Echtzeitanwendungen werden üblicherweise auf ressourcenbeschränkter Hardware implementiert, was eine Implementierung von großen Architekturen auf dieser Hardware herausfordernd macht. Große Architekturen können zwar sehr genau sein, führen aber viele Rechenoperationen bei der Inferenz durch. Die Inferenz mit einem tiefen KNN kann deshalb für Echtzeitanwendungen zu lange dauern. Inferenz bezeichnet in diesem Zusammenhang eine Schlussfolgerung, die mit einem künstlichen neuronalen Netz, automatisiert aus Daten gewonnen wurde. Ein ungünstiger Effekt dieser Architekturen bzw. KNNs ist auch, dass sie viel Energie verbrauchen, da viele Rechenoperationen durchgeführt werden müssen. Die Langsamkeit der tiefen KNNs und der Rechenaufwand bis die Inferenz erfolgt ist, stellt somit ein Problem für industrielle Anwendungen dar. Ein Beispiel für ein problematisches Anwendungsgebiet sind Stückgutprozesse, bei denen mehrere hundert Werkstücke pro Sekunde verarbeitet werden. Ein weiteres Problem ist, dass die Architektur von tiefen KNNs zum Teil nicht auf einer echtzeitfähigen Hardware implementieren werden kann, wie zum Beispiel auf einem FPGA. Dies liegt zum einen daran, dass echtzeitfähige Hardware üblicherweise sehr begrenzte Speicher bzw. Speicherkapazitäten aufweisen, sodass tiefe KNNs nicht in den Speicher der Hardware geladen werden können. Zum anderen reicht die Rechenleistung der echtzeitfähigen Hardware üblicherweise nicht aus, um die Vielzahl von notwendigen Rechenoperationen in Echtzeit ausführen zu können.

Neben diesen rein technischen Problemen gibt es auch weitere Probleme bei einem Einsatz von KNNs für industrielle Anwendungen. Da Endkunden oft kein tiefgreifendes Knowhow bezüglich der Zielhardware und teilweise auch bezüglich des Trainings von KNNs haben, wird das Finden und Trainieren dieser angepassten Architektur oft von einem Dienstleister übernommen, beispielsweise vom dem Hersteller der echtzeitfähigen Hardware. Für die Dienstleiter besteht dabei aber das Problem, dass er für die Implementierung eines angepassten KNNs dass auf einer echtzeitfähigen Hardware implementiert werden kann, einen Trainingsdatensatz vom Kunden benötigt, um für den Kunden ein KNN trainie- ren zu können.

Problematisch ist dabei, dass der Kunde einen Trainingsdatensatz für den Dienstleister oft nicht zur Verfügung stellen kann oder darf. Gründe hierfür können unter anderem der Schutz seines Knowhows sein oder, beispielsweise bei medizinischen Datensätzen, datenschutzrechtliche Bedenken. Was der Kunde aber üblicherweise bereitstellen kann, ist ein trainiertes KNN, das allerdings für echtzeitfähige Hardware nicht geeignet ist. Teilweise sind Kunden nämlich in der Lage, populäre Architekturen zum Lösen ihrer Probleme eigenständig mit ihrem Datensatz zu trainieren, da vortrainierte Netzwerke leicht erhältlich sind und die Kunden selber hohe Testgenauigkeiten mit den populären Architekturen erreichen können. Der Kunde kann so- mit ein trainiertes KNN bereitstellen, das der Kunde selbstständig mit einem Trainingsdatensatz trainiert hat. Dieses KNN wird nachfolgend als Startnetzwerk oder als Ausgangsnetzwerk bezeichnet. Der Trainingsdatensatz mit dem der Kunde das Startnetzwerk trainiert hat, wird als Originaldatensatz bezeichnet. Ausgangspunkt der vorliegenden Überlegungen ist somit, dass ein vom Kunden trainiertes KNN bereitgestellt wird, das mit einem Originaldatensatz vom Kunden selbstständig trainiert wurde und der Originaldatensatz des Kunden nicht zur Verfügung steht, um ein Zielnetzwerk zu trainieren. Erste Ansätze wie der Transfer von Wissen von einem trainierten Starnetzwerk auf ein Zielnetzwerk ohne die Verwendung eines Originaldatensatzes erfolgt, sind bereits bekannt. Die bekannten Verfahren sind allerdings sehr rechenaufwendig, das heißt, es werden unnötige Ressourcen wie Strom oder Zeit verbraucht.

Hinzu kommt, dass es bei der Übertragung von Wissen von einem trainierten Starnetzwerk auf ein Zielnetzwerk zu Genauigkeitsverlusten des Zielnetzwerkes kommen kann, beispielsweise, wenn das Zielnetzwerk eine andere Architektur aufweist als das Ausgangsnetzwerk. Dieser negative Effekt ist besonders groß, wenn die Zielnetzarchitektur kleiner ist als die Ausgangsnetzarchitektur.

Die vorliegende Erfindung bezieht sich somit auf die spezielle technische Implementierung des Transfers eines Verhaltens bzw. von Wissen von einem ersten künstlichen neuronalen Netz auf ein zweites künstliches neuronales Netz. Es wird also darauf abgezielt, dass das zweite KNN das gleiche Verhalten aufweisen soll, wie das erste KNN. Das Verhalten eines KNNs wird dabei als Netzwerkverhalten bezeichnet und kann auch synonym als Wissen eines KNN aufgefasst werden. Der Transfer eines Netzwerkverhaltens bzw. von Wissen kann in diesem Zusammenhang auch synonym als Übertragung eines Regelverhaltens aufgefasst werden. Es versteht sich, dass das Netzwerkverhalten bzw. das Wissen eines KNN in den Gewichten bzw. in den Schichten des KNN implementiert ist.

Die vorliegende Erfindung betrifft demnach grundsätzlich alle speziellen Technologiefelder in denen künstliche neuronale Netze zum Einsatz kommen, besonders betrifft die vorlie- gende Erfindung aber Technologiefelder in denen echtzeitfähige Hardware zum Einsatz kommt oder kommen soll, auf der ein KNN implementiert ist oder implementiert werden soll.

In dem Recherchebericht der prioritätsbegründenden Anmeldung wurden die folgenden Dokumente vom Deutschen Patent- und Markenamt genannt: US 2021/0142177 A1 und STAMOULIS, Dimitrios S. [et al.]: Hyperpower: Power-and Memory-Constrained Hyper- Parameter Optimization for Neural Networks. In: 2018 Design, Automation & Test in Eu- rope Conference & Exhibition (DATE), IEEE, 2018; S. 19-24. Aufgabe der vorliegenden Erfindung ist es deshalb, eines der oben genannten Probleme zu adressieren, den allgemeinen Stand der Technik zu verbessern oder eine Alternative zu bisher Bekanntem bereitzustellen. Insbesondere soll eine Lösung bereitgestellt werden mit der eine ressourcenschonende und verlustarme Übertragung von Wissen von einem ersten trainierten künstlichen neuronalen Netz auf ein zweites künstliches neuronales Netz erfolgen kann.

Erfindungsgemäß wird somit ein Verfahren gemäß Anspruch 1 vorgeschlagen.

Demnach wird ein Verfahren zur Bereitstellung von Hyperparametern zur Erzeugung von künstlichen Bildern vorgeschlagen. Es wird also ein Verfahren vorgeschlagen, in dem Hy- perparameter bestimmt bzw. berechnet werden. Hyperparameter sind grundsätzlich bekannt. Ein Hyperparameter im Bereich des maschinellen Lernens ist ein Parameter, der zur Steuerung eines Trainingsalgorithmus bzw. Trainingsverfahrens verwendet wird. Dessen Wert wird im Gegensatz zu anderen Parametern vordem eigentlichen Training eines KNN festgelegt. Es sind eine Vielzahl von Hyperparameter bekannt, wie zum Beispiel eine Lernrate, eine Epochenanzahl, eine Anzahl von versteckten Schichten, eine Stapelgröße von Samples (engl. „Batchsize“), Bestrafungsterme oder Faktoren in einer Kostenfunktion. Anderer Parameter, die beispielsweise durch das Training bestimmt werden, sind keine Hyperparameter, wie zum Beispiel die Knotengewichte eines KNN oder Werte innerhalb eines Faltungskernels einer Faltungsschicht, die ebenfalls als Knotengewichte aufgefasst werden können.

Die bestimmten bzw. berechneten Hyperparameter werden bereitgestellt, zum Beispiel in Form eines Datensatzes. Auf Basis der bereitgestellten Hyperparameter werden anschließend künstliche Bilder erzeugt. Künstliche Bilder sind dabei Bilder in Form von Bilddaten, die mit einem Algorithmus synthetisch erzeugt werden. Das Verfahren umfasst dabei als einen ersten Schritt, dass ein initialer Hyperparametersatz erstellt wird. Es wird also vorgeschlagen, dass ein erster Satz Hyperparameter erstellt wird, der als Grundlage für eine anschließende Optimierung dient. Die Optimierung ist auch als Tuning bekannt. Der Hyperparametersatz ist entsprechend veränderbar ausgebildet. Der initiale Hyperparametersatz dient als Ausgangspunkt bzw. erster Parametersatz, der für die weiteren Schritte das Verfahrens verwendet und angepasst wird.

Das Verfahren umfasst als einen zweiten Schritt, das Erstellen eines initialen Bilddatensatzes. Der Bilddatensatz liegt in Form von Samples vor und ist auch als Batch bekannt. Es wird also vorgeschlagen, dass ein erster Satz von Bildern erstellt wird, die eine vorgegebene Größe und ein vorgegebenes Format aufweisen können. Als erster Bilddatensatz können beispielsweise Zufallsbilder mit einer festgelegten Größe erstellt werden, dessen Pixelwerte zufällig generiert wurden. Der initiale Bilddatensatz dient ebenfalls als Ausgangspunkt bzw. erster Bilddatensatz, der für die weiteren Schritte das Verfahrens verwendet und angepasst wird. In einem weiteren Schritt wird vorgeschlagen, dass ein Bilddatensatz mittels eines bildoptimierten Verfahrens in Abhängigkeit des Hyperparametersatzes erzeugt wird.

Wie zuvor beschrieben, liegt dem vorgeschlagenen Verfahren die Einschränkung zu Grunde, dass ein originaler Datensatz bzw. Originaldatensatz nicht zur Verfügung steht, um das Zielnetzwerk direkt mit dem Originaldatensatz trainieren zu können. Da der origi- nale Datensatz nicht zur Verfügung steht, ist somit eine Generierung synthetischer Bilder erforderlich, die aus dem Wissen des trainierten Startnetzwerkes erzeugt werden, das beispielsweise in den Gewichten des trainierten Startnetzwerkes implementiert ist. Verfahren zur Erzeugung von künstlichen Bildern sind dabei bereits bekannt.

Eine mögliche Einteilung der in diesem Kontext bestehenden Bildgenerierungsverfahren ist eine Einteilung in generatorbasierte und bildoptimierende Verfahren. Bei generatorbasierten Verfahren wird ein sogenanntes Generatornetzwerk verwendet, das mit den im Startnetzwerk enthaltenen Informationen trainiert wird. Anschließend können mit dem Generatornetzwerk synthetische Bilder erzeugt werden. Bei bildoptimierenden Verfahren wird auf ein Generatornetzwerk G verzichtet. Stattdessen werden die Bilder direkt, anhand einer entsprechenden Kostenfunktion und einem Ziellabel optimiert, z. B. mit einem Gradientenabstiegsverfahren.

Vorliegend wird somit ein bildoptimierten Verfahren vorgeschlagen, bei dem anstatt der Gewichte eines Generatornetzwerkes, Pixel von Bildern eines Bilddatensatzes iterativ optimiert werden, um eine Kostenfunktion zu minimieren. Weiter wird vorgeschlagen, dass in dem bildoptimierten Verfahren ein Startnetzwerk verwendet wird. Das Startnetzwerk ist dabei ein trainiertes neuronales Netzwerk, das mit einem Originaldatensatz trainiert wurde und das durch eine Startnetzarchitektur und Startnetzgewichte gekennzeichnet ist, insbesondere wie zuvor beschrieben. Beispiele für eine Startnetzarchitektur sind zum Beispiel die zuvor beschriebenen Netzwerkarchitekturen, wie ein Residual Network (z.B. ein ResNet50) oder ein VGG Network (z.B. VGG16 oder VGG11). Die Zahlen neben den Typenbezeichnungen der KNNs, zeigen dabei die Anzahl der versteckten Schichten an. Ein ResNet50 ist also ein Residual Network mit 50 versteckten Schichten. Es wird demnach vorgeschlagen, die gespeicherten Informationen, die in dem trainierten Startnetzwerk vorhanden sind, z. B. in den Startnetzgewichten, für die Optimierung des Bilddatensatzes zu verwenden. Es wird also nicht das Starnetzwerk selber optimiert, sondern ein Bilddatensatz wird optimiert. Zudem wird vorgeschlagen, dass dem Startnetzwerk wenigstens ein Ziellabel für das bildoptimierte Verfahren vorgegeben wird. Das Ziellabel ist ein vorgegebenes Label bzw. ein Zielwert, den das Ausgangsnetzwerk als Ausgabe einstellen soll. Als Ziellabel können beispielsweise sogenannte Softlabel oder One-Hot-kodierte Label eingestellt werden. Das Ziellabel ist auch als Target bekannt und kann als ein einzustellender Zielwert im Sinne eines Sollwertes aufgefasst werden.

Ein Ziellabel weist für jeden Ausgangsknoten bzw. für jede Klasse einen Zielwert auf.

Die Zielwerte des Ziellabels können dabei beliebig eingestellt werden. Durch eine Veränderung des Ziellabels bzw. Anpassung der Zielwerte des Ziellabels können unterschiedliche synthetische Bilder erzeugt werden. Weiter wird vorgeschlagen, dass das bildoptimierte Verfahren den ersten Schritt umfasst, dass der Bilddatensatz durch das Startnetzwerk propagiert. Es wird also vorgeschlagen, dass der Bilddatensatz bzw. dessen Samples durch das Startnetzwerk propagieren, also die Samples des Bilddatensatzes die Schichten des Startnetzwerkes durchlaufen. Es versteht sich, dass sich das Propagieren auf die Vorwärtsrichtung bezieht, also, dass die Bild- daten an einer Eingangsschicht des Startnetzwerkes eingegeben werden und anschließend durch die Zwischenschichten das Startnetzwerkes zur Ausgangsschicht propagieren, um an den Ausgangsknoten der Ausgangsschicht jeweils wenigstens einen Schätzwert mit dem Startnetzwerk zu erzeugen. Das Bild bzw. der Bilddatensatz wird mit dem Startnetzwerk demnach klassifiziert und das Startnetzwerk gibt an seiner Ausgangsschicht einen oder mehrere Schätzwerte aus. Die Anzahl an Schätzwerten die an der Ausgangsschicht ausgegeben werden, richtet sich in bekannter Weise danach, wie viele unterschiedliche Klassen mit dem Startnetzwerk erkannt werden sollen.

Anschließend wird in einem zweiten Schritt des bildoptimierten Verfahrens vorgeschlagen, dass der Bilddatensatz mittels Rückwärtspropagation zur Minimierung einer Kostenfunk- tion angepasst wird. Es wird also vorgeschlagen direkt die Pixel der Bilder des Bilddatensatzes iterativ zu optimieren, um eine Kostenfunktion zu minimieren. Rückwärtspropagation ist auch als Backpropagation bekannt. Es beschreibt ein verbreitetes Verfahren für das Anlernen von künstlichen neuronalen Netzen. Es gehört zur Gruppe der überwachten Lernverfahren.

Die Minimierung erfolgt dabei so, dass eine Abweichung eines oder mehrerer Schätzwerte des Startnetzwerkes mit dem vorgegebenen Ziellabel verglichen werden und anschließend durch Anpassung des Bilddatensatzes die Abweichung zwischen dem Ziellabel und dem Schätzwert des Ausgangsnetzes minimiert wird.

Vereinfacht ausgedrückt wird also der initiale Bilddatensatz solange angepasst, bis ein synthetisches Bild aus dem Wissen entstanden ist, das in dem trainierten Startnetzwerk implementiert ist. Der initiale Bilddatensatz kann beispielsweise als Satz von verrauschten Zufallsbildern ausgebildet sein und wird dann anschließend durch Minimierung der Kostenfunktion zu einem natürlich aussehenden Bilderdatensatz optimiert, der die zu klassifizierenden Klassen enthält.

Es wird also nicht das Startnetzwerk selber angepasst, sondern, um ein Beispiel zu geben, werden die Bilder des Bilddatensatzes solange angepasst, bis das Startnetzwerk die angepassten Bilder einer Klasse oder mehreren Klassen zuordnet, die über das Ziellabel vorgegeben wird bzw. werden.

Als weiteren Schritt umfasst das Verfahren den Schritt, dass der erzeugte Bilddatensatz auf das Vorliegen eines vorbestimmten Abbruchkriteriums geprüft wird. Vorbestimmt kann auch als festgelegt aufgefasst werden.

Das Abbruchkriterium kann beispielsweise ein automatisiertes Abbruchkriterium sein, wie ein Schwellwert.

In einer besonders bevorzugten Ausführungsform liegt ein automatisiertes Abbruchkriterium vor, wenn ein Wert einer zu minimierenden Kostenfunktion kleiner ist als ein zuvor definierter Schwellenwert; zusätzlich oder alternativ, liegt ein automatisiertes Abbruchkriterium vor, wenn das Startnetzwerk die synthetischen Bilder mit einer festgelegten Genauigkeit klassifiziert; und zusätzlich oder alternativ, liegt ein automatisiertes Abbruchkriterium vor, wenn Pixel der angepassten Bilder des Bilddatensatzes vorbestimmte statistischen Eigenschaft aufweisen, wie eine vordefinierte Verteilungsfunktion oder eine vordefinierte Varianz.

Es kommt auch in Betracht, dass der erzeugte Bilddatensatz ausgegeben wird, wenn ein manuelles Abbruchkriterium erfüllt ist. Ein Beispiel für ein manuelles Abbruchkriterium ist eine optische Prüfung des Bilddatensatzes, z. B. auf Artefakt in dem Bilddatensatz. Zur optischen Prüfung kann der Bilddatensatz an einer Anzeigeeinheit ausgegeben werden, wie ein Userdisplay.

Es versteht sich, dass auch eine Mischform der zuvor beschriebenen Abbruchkriterien in Betracht kommt, also mehrere Prüfkriterien implementiert wurden. Damit können Falschausgaben reduziert werden.

In einem weiteren Schritt wird vorgeschlagen, dass der Hyperparametersatz angepasst wird und das bildoptimierte Verfahren mit geänderten Hyperparametern erneutes durchgeführt wird, wenn die Prüfung ergibt, dass das Abbruchkriterium nicht erfüllt ist. Es wird also vorgeschlagen, dass eine Anpassung der Hyperparameter erfolgt, wenn das vorbestimmte Abbruchkriterium nicht erfüllt ist, also zum Beispiel ein Schwellenwert nicht ausgelöst wird.

Das zuvor beschriebene Verfahren betrifft demnach die sogenannte Hyperparameteroptimierung. Diese Optimierung ist auch als Hyperparametertuning bekannt und bezeichnet die Suche nach optimalen Hyperparametern.

Das Anpassen des Hyperparametersatzes kann dabei manuell oder automatisiert erfolgen.

Ein manuelles Anpassen kann beispielsweise erfolgen, indem ein ausgewählter Hyperparameter aus dem Hyperparametersatz mit einer manuellen Eingabe verändert wird.

Ein automatisiertes Anpassen kann beispielsweise erfolgen, indem ein Anpassungsalgo- rithmus ausgeführt wird, der die Hyperparameter des Hyperparametersatzes automatisiert anpasst. Beispielsweise für solche Anpassungsalgorithmen sind eine Rastersuche (engl. „Grid Search“), eine Zufallssuche (engl. „Random Search“), eine Bayessche Optimierung (engl. „Bayesian Optimization“) oder evolutionäre Algorithmen.

Wenn die Prüfung ergibt, dass das vorbestimmte Abbruch kriterium erfüllt ist, wird der an- gepasste Hyperparametersatz als erster Hyperparametersatz bereitgestellt. Der Hyperparametersatz kann synonym als Hyperparameterdatensatz aufgefasst werden, da der Satz von Hyperparametern als Datensatz vorliegt.

Besonders wird zudem vorgeschlagen, dass in dem bildoptimierten Verfahren ausschließlich das Startnetzwerk verwendet wird. Es wird somit vorgeschlagen, dass die Hyperpara- meteroptimierung nur mit dem Startnetzwerk durchgeführt, also ohne ein weiteres künstliches neuronales Netz durchgeführt wird. Ausschließlich abhängig von dem Startnetzwerk kann also so aufgefasst werden, dass für die Bestimmung der Hyperparameter nur ein einziges neuronales Netz verwendet wird, nämlich das Startnetzwerk.

Dabei wird auch vorgeschlagen, dass das Verfahren zur Bereitstellung der Hyperparame- ter als eigenständiger und getrennter Berechnungsprozess mit einer Berechnungseinheit durchgeführt wird.

Beispielsweise kann eine Berechnungseinheit eine GPU sein, die zur Bereitstellung von Hyperparametern zur Erzeugung von künstlichen Bilder eingerichtet ist, und die in einem ersten Berechnungsprozess den ersten Hyperparametersatz ausschließlich in Abhängig- keit des Startnetzwerkes erzeugt. So kann in vorteilhafter Weise der gesamte Speicherder GPU für die Bestimmung des ersten Hyperparametersatz genutzt werden, da keine Speicherkapazitäten, z.B. für ein weiteres KNN benötigt wird. Damit ist eine schnellere Bestimmung der Hyperparameter möglich.

Dem vorgeschlagenen Verfahren liegt nämlich die Erkenntnis zu Grunde, dass in bildopti- mierten Verfahren eine Hyperparameteroptimierung ohne ein zusätzliches neuronales Netzwerk erfolgen kann.

Zudem kann der rechenaufwendige Prozess zur Bestimmung von Hyperparametern getrennt in einem eigenständigen Berechnungsprozess ausgeführt werden und entsprechend optimiert werden. Es wird zusätzlicher Speicherplatz frei, wenn kein weiteres neuronales Netzwerk als das Startnetzwerk verwendet wird. Dieser freie Speicher kann für die Berechnungen des ersten Hyperparametersatzes genutzt werden. Im Vergleich zu bekannten bild- optimierten Verfahren können die Hyperparameter somit schneller bestimmt werden und Ressourcen wie Strom und Zeit eingespart werden.

Das Merkmal das bildoptimierte Verfahren ausschließlich abhängig ist von dem Startnetz- werk leistet somit den technischen Beitrag, dass weniger Speicher in einer Berechnungseinheit belegt wird und der freie Speicher somit für andere Berechnungsschritte genutzt werden kann. Damit wird die Berechnung schneller, kann eigenständig optimiert werden oder sogar ausgelagert werden.

Vorzugsweise wird vorgeschlagen, dass das Ziellabel als Softlabel ausgebildet ist. Label welche nicht One-Hot-kodiert sind, werden dabei als Softlabel bezeichnet. Es wurde vorliegend erkannt, dass eine Verwendung von Softlabeln als Ziellabel den vorteilhaften Effekt bewirkt, dass ein qualitativ hochwertigerer synthetische Bilddatensatz erzeugt werden kann. Wird später ein Zielnetzwerk mit diesem Bilddatensatz trainiert, können Genauigkeitsverluste bei der Übertragung von Wissen von einem trainierten Starnetzwerk auf das Zielnetzwerk reduziert werden. Es wurde vorliegend erkannt, dass wenn Softlabel genutzt werden, ein vielfältigerer Bilddatensatz erstellt werden kann und das gesamte Wissen des Startnetzwerkes besser auf das Zielnetzwerk transformiert bzw. übertragen werden kann.

Ein One-Hot-kodiertes Label ist ein Label, bei dem alle Zielwerte mit Ausnahme eines Zielwertes auf null gesetzt sind. Ein Beispiel für ein One-Hot-kodiertes Ziellabel für ein KNN mit drei Ausgangsknoten bzw. drei Klassen ist das Label y= (1 ,0,0). Wie in diesem Beispiel zu erkennen ist, weist das One-Hot-kodierte Ziellabel drei Zielwerte 1 , 0 und 0 auf, wobei alle Zielwerte bis auf ein Zielwert auf null gesetzt sind.

Ein Softlabel ist ein Label, bei dem mehr als ein Zielwert einen Wert aufweist, der größer ist als null. Ein Beispiel für ein Softlabel für ein KNN mit drei Ausgangsknoten bzw. drei Klassen ist das Label y= (0.9, 0.1 , 0). Wie diesem Beispiel zu entnehmen ist, weist das Softlabel drei Zielwerte 0.9, 0.1 und 0 auf, wobei zwei Zielwerte größer sind als null. In einer besonders bevorzugten Ausführungsform wird vorgeschlagen, dass das Ziellabel mit einem einstellbaren Mittelwert und zusätzlich oder alternativ einer einstellbaren Standardabweichung veränderbar ausgebildet ist. Damit kann die Zielwertvorgabe einfacher verändert werden.

In einerweiteren bevorzugten Ausführungsform wird vorgeschlagen, dass die Kostenfunk- tion mittels eines Gradientenabstiegsverfahrens minimiert wird. Das Gradientenabstiegsverfahrens ist ein bekanntes Verfahren um eine Kostenfunktion zu minieren. Vorliegend eignet sich dieses Verfahren für eine schnelle und stabile Minimierung der Kostenfunktion.

In einer besonders bevorzugten Ausführungsform wird vorgeschlagen, dass die Kostenfunktion aus einer Vielzahl von Termen ausgebildet ist und die Kostenfunktion durch An- passung des Bilddatensatzes minimiert wird.

Die Kostenfunktion ist vorzugsweise ausgebildet aus wenigstens einem der nachfolgenden aufsummierten Terme,

Lx — L_t + ct_{i2L 2} + cc_vL_v + <XfLf wobei L_t ein Maß beschreibt, wie weit ein geschätztes Label des Startnetzwerkes von dem Ziellabel abweicht, L_a ein Maß beschreibt, wie weit ein angepasstes Bild des Bilddatensatzes von einem Normwert abweicht, L_v ein Maß beschreibt, wie weit ein angepasstes Bild des angepassten Bilddatensatzes von einem Varianzwert abweicht und L_f ein Maß beschreibt, wie ähnlich ein Merkmal des angepassten Bildes des Bilddatensatzes einem Merkmal des originalen Datensatzes ist. Die Faktoren a_l2, a_v, und a_f sind Skalierungsfaktoren. Diese können auch synonym als Gewichtungsfaktoren bezeichnet werden. Durch die Minimierung des Terms L_t wird erreicht, dass die generierten Bilder vom Startnetzwerk eindeutig einer Klasse zugeordnet werden.

Die Terme L_a und L_v dienen der Regularisierung und sorgen dafür, dass die synthetischen Bilder gewissen Eigenschaften von natürlichen Bildern folgen.

Durch die Minimierung des Terms L_f wird die Differenz der Aktivierung innerhalb der Schichten des Startnetzwerkes für die generierten Bilder und die der gespeicherten Aktivierung der originalen Bilder minimiert.

In einer bevorzugten Ausführungsform wird vorgeschlagen, dass der erste Hyperparametersatz wenigstens einen Hyperparameter umfasst, der Liste von Hyperparametern aufweisend: - ein Norm-Skalierungsfaktor a_l2, ein Varianz-Skalierungsfaktor a_v, ein Merkmal-Skalierungsfaktor a_f, eine Lernrate, die festlegt mit welcher Rate die Minimierung der Kostenfunktion erfolgt, - eine Epochenanzahl, die festlegt, wie häufig eine vorbestimmte Anzahl von Bildern durch das Startnetz propagiert, eine Stapelgröße, die eine Anzahl von Samples festlegt, die durch das Startnetzwerk propagiert werden.

In einer weiteren Ausführungsform wird vorgeschlagen, dass die Startnetzgewichte fest ausgebildet sind. Feste Startnetzgewichte sind rechenstabiler.

In einer alternativen Ausführungsform sind die Startnetzgewichte dynamisch anpassbar ausgebildet. Dynamisch anpassbare Startnetzgewichte bieten die Möglichkeit, durch weitere Optimierung des Startnetzes ebenfalls die Qualität des zu generierenden Datensatzes zu verbessern. Allerdings besteht auch die Gefahr einer instabilen Berechnung und einem Verlust von erlernten Merkmalen (engl. „Feature“) des Startnetzwerkes. Vorzugsweise wird vorgeschlagen, dass das Erstellen des initialen Bilddatensatzes mit einem Mittelwert m in einem normierten Bereich von 0 bis 0.20 mit m e [0,1] erfolgt.

Zusätzlich oder alternativ wird vorgeschlagen, dass das Erstellen des initialen Bilddatensatzes mit einer normierten Standardabweichung s in einem normierten Bereich von 0.8 bis 1 mit s e [0,1] erfolgt.

Besonders bevorzugt ist eine Initialisierung des Bilddatensatzes mit einem Mittelwert von null und einer Standardabweichung von eins.

Mit einem so initialisierten Bilddatensatz kann schneller ein Datensatz besserer Qualität erzeugt werden. Vorzugsweise wird vorgeschlagen, dass wenigstens der Schritt Erzeugen eines Bilddatensatzes mittels eines bildoptimierten Verfahrens mittels einer Hochleistungsberechnungseinheit durchgeführt wird, die eine Rechenleistung von wenigstens 500 Giga-FLOP/s aufweist.

Die Hochleistungsberechnungseinheit ist in einer besonders bevorzugten Ausführungs- form als GPU oder Cloudserver ausgebildet. Es wird also vorgeschlagen, eine leistungsfähige Berechnungseinheit für die Hyperparameteroptimierung und das Generieren des Bilddatensatzes zu verwenden.

Erfindungsgemäß wird zudem ein Verfahren zum Erstellen eines synthetischen Bilddatensatzes vorgeschlagen. Das Verfahren zum Erstellen eines synthetischen Bilddatensatzes umfassend dabei als ersten Schritt ein Erzeugen eines Bilddatensatzes mittels eines bildoptimierten Verfahrens in Abhängigkeit eines zweiten Hyperparametersatzes, wobei in dem bildoptimierten Verfahren wenigstens ein Startnetzwerk und ein Zwischen netzwerk verwendet wird. Dabei ist das Startnetzwerk ein trainiertes neuronales Netzwerk, das mit einem Originaldatensatz trainiert wurde und das durch eine Startnetzarchitektur und Startnetzgewichte gekennzeichnet ist. Das Zwischennetzwerk ist ein neuronales Netzwerk, das durch eine Zwischennetzarchitektur und Zwischennetzgewichte gekennzeichnet ist. Dem Startnetzwerk wird wenigstens ein Ziellabel vorgegeben, das als Softlabel ausgebildet ist.

Das bildoptimierte Verfahren umfasst wenigstens die Schritte Propagieren des Bilddaten- satzes durch das Startnetzwerk und durch das Zwischennetzwerk und Anpassen des Bilddatensatzes mittels Rückwärtspropagation zur Minimierung einer Kostenfunktion. Das bildoptimierte Verfahren wird dabei analog ausgeführt, wie zuvor beschrieben.

Als zweiten Schritt umfasst das Verfahren zum Erstellen eines synthetischen Bilddatensatzes ein Speichern des erzeugten Bilddatensatzes, um den synthetischen Bilddatensatzes zu erzeugen. Es wird also vorgeschlagen, dass die angepassten Bilddatensätze gespeichert werden, um einen synthetischen Bilddatensatzes zu generieren, der somit aus einer Vielzahl der angepassten Bilddatensätze besteht. Die angepassten Bilddatensätze bzw. Batches werden also ausgegeben bzw. gespeichert und ein synthetischer Bilddatensatz aus einer Vielzahl der gespeicherten Bilddatensätze wird erstellt. Das Speichern bezieht sich demnach nicht auf ein temporäres Speichern während eines Berechnungsprozesses, sondern auf ein dauerhaftes Speichern.

Damit ist es möglich, beliebig viele neuronale Zielnetzwerke auf Basis des synthetischen Bilddatensatzes trainieren zu können. Es wird also vorgeschlagen, die erzeugten Bilder nicht zu verwerfen. Das Verfahren zum Erstellen eines synthetischen Bilddatensatzes kann somit als Verfahren zum Erzeugung von Trainingsdaten für ein neuronales Netz verstanden werden, da mit dem Verfahren synthetische Bilder erstellt werden, auf dessen Basis ein Zielnetzwerk trainiert werden kann.

Die Ausführungen zu dem zuvor beschriebenen Verfahren zur Bereitstellung von Hyper- Parametern zur Erzeugung von künstlichen Bildern finden für das Verfahren zum Erzeugung von Trainingsdaten für ein neuronales Netz analog Anwendung.

Im Unterschied zum ersten Verfahren wird in dem bildoptimierten Verfahren zusätzlich zum Startnetzwerk ein Zwischennetzwerk verwendet.

Es wurde vorliegend erkannt, dass eine Verwendung von Softlabeln als Ziellabel den vor- teilhaften Effekt bewirkt, dass ein qualitativ besserer synthetischer Bilddatensatz erstellt wird, mit dem eine höheren Genauigkeit bei der Wissensübertragung erreicht werden kann. Es wird also im Grunde der synthetisch erzeugte Bilddatensatz verbessert, wenn Softlabel verwendet werden.

Vorzugsweise wird vorgeschlagen, dass der zweite Hyperparametersatz die Hyperpara- meter des ersten Hyperparametersatzes aufweist und der erste Hyperparametersatz nach einem Verfahren gemäß einer der vorstehenden Ausführungsformen bestimmt wurde. Es wird also vorgeschlagen, dass der zweite Hyperparametersatz die Hyperparameter des ersten Hyperparametersatzes umfasst und zudem noch mit weiteren Hyperparametern ergänzt werden.

Weitere Hyperparameter sind zum Beispiel Hyperparameter, die das Trainieren des Zwi- schennetzwerkes betreffen, da das Zwischen netzwerk erst bei der Bilddatensatzgenerierung verwendet wird, wie zum Beispiel die Wahl des Zwischennetzwerkes (Architektur), die Verwendung von Softtargets und/oder One-Hot-Targets, eine Lernrate für das Training des Zwischennetzwerkes oder ein Merkmal-Skalierungsfaktor a_c.

Vorzugsweise wird vorgeschlagen, dass das Verfahren zum Erstellen eines synthetischen Bilddatensatzes wenigstens einen der zusätzlichen Schritte umfasst:

Trainieren des Zwischen netzwerkes mit dem gespeicherten Bilddatensatz durch Anpassung der Zwischennetzgewichte mittels Rückwärtspropagation; und

Erneutes Durchführen des Schrittes Erzeugen eines Bilddatensatzes mittels eines bildoptimierten Verfahrens mit dem trainierten Startnetzwerk und dem trainierten Zwischennetz- werk.

Durch die Verwendung eines trainierten Zwischennetzwerkes kann die Diversität des synthetischen Bilddatensatzes erhöht werden. Es wird also vorgeschlagen, einen synthetischen Bilddatensatz mit dem Startnetzwerk und dem Zwischennetzwerk zu erzeugen, der möglichst die gleiche Komplexität aufweist, wie der originale Datensatz. Hierbei hilft das Zwischen netzwerk, in dem Bilder erzeugt werden, wo sich das Startnetzwerk und das Zwischennetzwerk uneinig sind.

Vorzugsweise wird zudem vorgeschlagen, dass wenigstens der Schritt Erzeugen eines Bilddatensatzes mittels eines bildoptimierten Verfahrens und zusätzlich oder alternativ der Schritt Trainieren des Zwischennetzwerkes mittels einer Hochleistungsberechnungseinheit durchgeführt wird, die eine Rechenleistung von wenigstens 500 Giga-FLOP/s aufweist.

Die Hochleistungsrecheneinheit ist besonders bevorzugt als GPU oder Cloudserver ausgebildet ist.

In einer besonders bevorzugten Ausführungsform wird zudem vorgeschlagen, dass die Kostenfunktion einen Term L_c aufweist, der ein Maß für die Unterschiedlichkeit der Aus- gaben des Startnetzwerk und des Zwischennetzwerkes für die erzeugten Bilder beschreibt. Dieser Term ist auch als „Compete-Ioss“ bekannt. Eine Minimierung des Terms L_c führt dazu, dass die generierten Bilder möglichst unterschiedlich durch das Startnetzwerk und das Zwischennetzwerk klassifiziert werden. Damit wird sichergestellt, dass vielfältige Bilder für jede Klasse generiert werden, um das Zwischennetzwerk herauszufordern und den originalen Datensatz möglichst gut abzubil- den.

In einerweiteren bevorzugten Ausführungsform wird vorgeschlagen, dass ein zusätzlicher Skalierungsfaktor a_c Teil des zweiten Hyperparametersatzes ist, der zur Skalierung des Terms L_c vorgesehen ist.

Vorzugsweise wird auch vorgeschlagen, dass die Zwischennetzarchitektur des Zwischen- netzwerks ähnlich oder gleich groß ausgebildet ist wie die Startnetzarchitektur des Startnetzwerkes, wobei die Zwischennetzarchitektur und die Startnetzarchitektur gekennzeichnet sind durch eine Anzahl von Netzwerkschichten und durch eine Anzahl von verwendeten Netzwerkneuronen.

Es wurde vorliegend erkannt, dass ein besserer synthetischer Bilddatensatz erzeugt wer- den kann, wenn die Architektur des Zwischennetzes der Architektur des Startnetzwerkes ähnelt oder diese sogar gleich ausgebildet sind, beispielsweise um das bildoptimierte Verfahren mit zwei ähnlich oder gleich großen neuronalen Netzen durchzuführen. Ist das Startnetzwerk beispielsweise als ResNet50 ausgebildet, wird somit vorgeschlagen, als Zwischennetzwerk ebenfalls ein ResNet50 zu verwenden oder ein KNN das eine ähnliche Ar- chitektur aufweist, also eine ähnliche Anzahl an Knoten, Schichten sowie eine ähnliche Art der Schichten aufweist.

Zudem liegt hier die Erkenntnis zu Grunde, dass das Zwischennetzwerk nicht das Zielnetzwerk ist und das Zwischennetzwerk im Grunde nur zur Erzeugung des synthetischen Bilddatensatzes verwendet wird. Nach der Erzeugung des synthetischen Bilddatensatzes kann das Zwischen netzwerk verworfen werden. Es kann mit einer ähnlichen Architektur des Startnetzwerkes und des Zwischennetzwerkes aber ein verbesserter Trainingsdatensatz bzw. synthetischer Bilddatensatz bereitgestellt werden, der zu weniger Verlusten führt.

Zudem wird vorgeschlagen, dass das wenigstens eine Ziellabel mit einem einstellbaren Mittelwert und zusätzlich oder alternativ mit einer einstellbaren Standardabweichung veränderbar ausgebildet ist. Vorzugsweise wird auch vorgeschlagen, dass das Verfahren zum Erstellen eines synthetischen Bilddatensatzes solange ausgeführt wird, bis ein Abbruchkriterium erfüllt.

Besonders bevorzugt ist als Abbruchkriterium für das Verfahren zum Erstellen eines synthetischen Bilddatensatzes - eine vorgegebene Gesamtanzahl an erzeugten Bilder, z. B 30 000 Bilder, eine vorgegebene Gesamtanzahl an erzeugten Bildern für eine Klasse, und/oder wenn sich ein Term L_c, der ein Maß für die Unterschiedlichkeit der Ausgaben des Startnetzwerk und des Zwischennetzwerkes für die erzeugten Bilder beschreibt, nur noch wenig ändert und innerhalb von vorbestimmten Schwankungsgrenzen liegt. Zudem wird erfindungsgemäß ein Verfahren zum Übertragen eines Netzwerkverhaltens eines Startnetzwerkes auf ein Zielnetzwerk vorgeschlagen.

Dabei ist das Startnetzwerk ein trainiertes neuronales Netzwerk, das mit einem Originaldatensatz trainiert wurde und das durch eine Startnetzarchitektur und Startnetzgewichte gekennzeichnet ist. Das Zielnetzwerk ist ein untrainiertes neuronales Netz und durch eine Zielnetzarchitektur und Zielnetzgewichte gekennzeichnet. Das Verfahren umfassend dabei die Schritte:

Laden des Startnetzwerkes in einen Datenspeicher.

In einer besonders bevorzugten Ausführungsform wird vorgeschlagen, dass der Datenspeicher ein Grafikspeicher ist. Zusätzlich oder alternativ wird vorgeschlagen, dass der Speicher ein Cloudspeicher ist. Es wird also vorgeschlagen, dass das Startnetzwerk in einen Datenspeicher zu laden. Dies kann beispielsweise mit einer Softwareanwendung umgesetzt werden.

Als weiterer Schritt wird vorgeschlagen, dass zudem ein erster Hyperparametersatz in den Datenspeicher geladen wird. In einer besonders bevorzugten Ausführungsform wird vorgeschlagen, dass der erste Hyperparametersatz mit dem zuvor beschriebenen Verfahren zur Bereitstellung von Hyperparametern zur Erzeugung von künstlichen Bildern gemäß einer der vorstehenden Ausführungsformen erstellt worden ist. In einem weiteren Schritt wird vorgeschlagen, dass ein Erzeugen eines synthetischen Bilddatensatzes mittels eines bildoptimierten Verfahrens in Abhängigkeit eines zweiten Hyperparametersatzes durchgeführt wird. Es wird also vorgeschlagen, dass Bilddatensätze zur Minimierung einer Kostenfunktion angepasst werden und die angepassten Bilddatensätze gespeichert werden, insbesondere wie zuvor beschrieben. Der zweite Hyperparametersatz umfasst dabei Hyperparameter, die sich auf das Training des Zwischennetzwerkes beziehen, wie die Wahl des Zwischennetzwerkes, die Lernrate usw.

Zudem wird vorgeschlagen, dass in dem bildoptimierten Verfahren wenigstens ein Startnetzwerk und ein Zwischen netzwerk verwendet wird. Das Zwischen netzwerk ist gekenn- zeichnet durch eine Zwischennetzarchitektur und Zwischennetzgewichte. Das Zwischennetzwerk ist ein trainierbares untrainiertes neuronales Netz.

In einer besonders bevorzugten Ausführungsform wird vorgeschlagen, dass der synthetische Bilddatensatz mit dem zuvor beschriebenen Verfahren zum Erstellen eines synthetischen Bilddatensatzes gemäß einer der vorstehenden Ausführungsformen erstellt worden ist.

Zudem wird in einem weiteren Schritt vorgeschlagen, dass ein Trainieren des Zielnetzwerkes mit dem erzeugten Bilddatensatz durch Anpassen der Zielnetzgewichte mittels Rückwärtspropagation durchgeführt wird, wobei das Trainieren des Zielnetzwerkes in Abhängigkeit von einem dritten Hyperparametersatz erfolgt. Der dritte Hyperparametersatz um- fasst Hyperparameter, die sich auf das Training des Zielnetzwerkes beziehen, wie die Wahl des Zielnetzwerkes, die Lernrate usw.

Vorliegend wird also vorgeschlagen, dass Zielnetzwerk auf mit dem synthetischen Bilddatendatensatz zu trainieren. Dazu kann das Zielnetzwerk ebenfalls in einen Datenspeicher einer Berechnungseinheit geladen werden, auf Basis des synthetischen Bilddatendaten- satz trainiert werden, und anschließend das trainierte Zielnetzwerk ausgegeben werden.

Da der synthetische Bilddatensatz zur Verfügung steht bzw. erzeugt wurde, kann somit ein übliches Verfahren zum Trainieren des Zielnetzwerkes verwendet werden. Trainingsverfahren zum Trainieren eines neuronalen Netzes auf Basis eines Bilddatensatzes sind dabei grundsätzlich bekannt, wie zum Beispiel das sogenannte Knowledge Distillation-Verfahren (KD-Verfahren) oder ein sonstiges überwachtes Lernverfahren.

Das Verfahren zum Übertragen eines Netzwerkverhaltens eines Startnetzwerkes auf ein Zielnetzwerk umfasst also zusammengefasst wenigstens die Schritte, dass das Startnetzwerkes und der Hyperparametersatz geladen werden, anschließend in Abhängigkeit des Hyperparametersatzes mittels des Startnetzwerkes und eines Zwischennetzwerkes ein synthetischer Bilddatensatzes mit einem bildoptimierten Verfahrens erzeugt wird und anschließend ein Zielnetzwerk mit dem erzeugten synthetischen Bilddatensatz trainiert wird.

Es wird also vorgeschlagen, dass das Wissen aus dem Startnetzwerk in Form der synthe- tischen Bilder extrahiert wird und mit diesen synthetischen Bildern anschließend das Zielnetzwerk trainiert wird.

In einer besonders bevorzugten Ausführungsform wird vorgeschlagen, das Knowledge Di- stillation-Verfahren als Trainingsverfahren einzusetzen, um das Zielnetzwerkes mit dem erzeugten synthetischen Bilddatensatz durch Anpassen der Zielnetzgewichte mittels Rück- wärtspropagation zu trainieren. Das KD-Verfahren eignet sich besonders gut, da das Zielnetzwerk nicht nur in Abhängigkeit des Bilddatensatzes antrainiert wird, sondern auch in Abhängigkeit eines Schätzwertes des Startnetzwerkes. So kann ein schnelleres Trainieren des Zielnetzwerkes umgesetzt werden. Das KD-Verfahren ist somit besonders vorteilhaft, da das Startnetzwerk zur Verfügung steht und der Trainingsprozess des Zielnetzwerkes somit schneller durchgeführt werden kann.

In einer anderen bevorzugten Ausführungsform wird vorgeschlagen, ein überwachtes Lernverfahren als Trainingsverfahren einzusetzen, um das Zielnetzwerkes mit dem erzeugten synthetischen Bilddatensatz durch Anpassen der Zielnetzgewichte mittels Rückwärtspropagation zu trainieren und vorzugsweise die Ziellabel, die für die Erzeugung der syntheti- sehen Bilder verwendet wurden, zum Training des Zielnetzwerkes zu verwenden. So kann das Trainieren des Zielnetzwerkes ohne die Verwendung des Startnetzwerkes erfolgen und eine schnelleres Trainieren des Zielnetzwerkes erfolgen, beispielsweise im Vergleich zum KD-Verfahren.

Zudem wird als optionaler Schritt vorgeschlagen, dass ein Prüfen des trainieren Zielnetz- werk auf ein Zielkriterium erfolgt und ein Anpassen des zweiten Hyperparametersatzes und zusätzlich oder alternativ ein Anpassen des dritten Hyperparametersatzes durchgeführt wird, wenn das Zielkriterium nicht erfüllt ist.

Wird das Zielkriterium erfüllt, wird das trainierte Zielnetzwerkes ausgegeben. Das Zielkriterium ist somit ebenfalls ein Abbruchkriterium, wie zuvor beschrieben. Als Zielkriterium wird vorzugsweise vorgeschlagen, einen Ähnlichkeitsschwellwert vorzugebene, der ein erneutes Trainieren des Zielnetzwerkes auslöst, wenn ein ausgegebener Schätzwert des Startnetzwerkes von einem ausgegebenen Schätzwert des Zielnetzwerkes zu weit abweicht, und beispielsweise dazu dem Startnetzwerk und dem Zielnetzwerk ein identischer Testbilddatensatz vorgegeben wird. Der Testdatensatz ist dabei ein gelabelter Datensatz auf dessen Basis das Zielnetzwerk eine bestimmte Testgenauigkeit erreichen soll.

Vorzugsweise wird vorgeschlagen, dass die Zielnetzarchitektur des Zielnetzwerks kleiner ausgebildet ist als die Startnetzarchitektur des Startnetzwerkes, beispielsweise um das Verhalten des größeren Startnetzwerkes auf ein kleineres Startnetzwerkzu übertragen und um ein trainiertes Zielnetzwerk mit einem verringerten Speicherbedarf als das Startnetzwerk bereitzustellen.

Vorzugsweise wird vorgeschlagen, dass wenigstens im Schritt Erzeugen eines syntheti- sehen Bilddatensatzes dem Startnetzwerk wenigstens ein Ziellabel vorgegeben wird, das als Softlabel ausgebildet ist.

Die zuvor beschrieben Verfahren bauen demnach aufeinander auf und stehen in Beziehung zueinander, da sie eine Lösung bereitstellen, mit der eine ressourcenschonende und verlustarme Übertragung von Wissen von einem ersten trainierten künstlichen neuronalen Netz auf ein zweites künstliches neuronales Netz erfolgen kann.

Erfindungsgemäß wird zudem ein Berechnungssystem vorgeschlagen, wobei das Berechnungssystem dazu eingerichtet ist, ein Verfahren zur Bereitstellung von Hyperparametern zur Erzeugung von künstlichen Bildern nach einer der vorstehenden Ausführungsformen durchzuführen, um einen ersten Hyperparametersatz bereitzustellen. Als Berechnungssystem wird vorzugsweise ein Cloudsystem oder Computersystem vorgeschlagen, das über eine hohe Rechenleistung verfügt, wie zuvor beschrieben.

Zusätzlich oder alternativ ist die Berechnungseinheit dazu eingerichtet, ein Verfahren zum Erstellen eines synthetischen Bilddatensatzes nach einer der vorstehenden Ausführungsformen durchzuführen, um einen synthetischen Bilddatensatz zum Trainieren eines Ziel- netzwerkes bereitzustellen.

Zusätzlich oder alternativ ist die Berechnungseinheit dazu eingerichtet, ein Verfahren zum Übertragen eines Netzwerkverhaltens eines Startnetzwerkes auf ein Zielnetzwerk nach einerdervorstehenden Ausführungsformen durchzuführen, um das Netzwerkverhalten bzw. Wissen eines Startnetzwerkes auf ein Zielnetzwerk zu übertragen. Erfindungsgemäß wird auch ein Übertragungssystem zum Übertragen eines Netzwerkverhaltens eines Startnetzwerkes auf ein Zielnetzwerk vorgeschlagen, wobei das Startnetzwerk ein trainiertes neuronales Netzwerk ist, das mit einem Originaldatensatz trainiert wurde und durch eine Startnetzarchitektur und Startnetzgewichte gekennzeichnet ist, und das Zielnetzwerk ein untrainiertes neuronales Netz ist und durch eine Zielnetzarchitektur und Zielnetzgewichte gekennzeichnet ist.

Das Übertragungssystem umfasst dabei wenigstens eine Berechnungseinheit, die zur Be- reitstellung von Hyperparametern zur Erzeugung von künstlichen Bildern eingerichtet ist, wobei die Berechnungseinheit in einem ersten Berechnungsprozess einen ersten Hyperparametersatz ausschließlich in Abhängigkeit des Startnetzwerkes erzeugt.

In einer besonders bevorzugten Ausführungsform wird in dem ersten Berechnungsprozess dem Startnetzwerk wenigstens ein Ziellabel vorgegeben, das als Softlabel ausgebildet ist. Zusätzlich oder alternativ umfasst das Übertragungssystem eine Berechnungseinheit, die zum Erstellen eines synthetischen Bilddatensatzes eingerichtet ist, wobei die Berechnungseinheit in einem zweiten Berechnungsprozess den synthetischen Bilddatensatz in Abhängigkeit des Startnetzwerkes und eines Zwischennetzwerkes erzeugt, und dem Startnetzwerk wenigstens ein Ziellabel vorgegeben wird, das als Softlabel ausgebildet ist. Zudem wird eine Berechnungseinheit vorgeschlagen, die zum Trainieren des Zielnetzwerkes mit dem synthetischen Bilddatensatz durch Anpassen der Zielnetzgewichte mittels Rückwärtspropagation eingerichtet ist, um in einem dritten Berechnungsprozess das Zielnetzwerk mit dem synthetischen Bilddatensatz zu trainieren, um das Netzwerkverhalten des Startnetzwerkes auf das Zielnetzwerk zu übertragen, beispielsweise ohne Verwen- düng oder unmittelbaren Zugriff auf den Originaldatensatz.

Die zuvor beschriebene Berechnungseinheit kann eine einzige Berechnungseinheit sein, die die Berechnungsprozesse seriell ausführt oder auch mit mehreren getrennten Berechnungseinheiten ausgebildet sein.

Die vorliegende Erfindung wird nun nachfolgend exemplarisch anhand von Ausführungs- beispielen unter Bezugnahme auf die begleitenden Figuren näher erläutert, wobei für gleiche oder ähnliche Baugruppen dieselben Bezugszeichen verwendet werden:

Fig. 1 zeigt schematisch ein Ablaufdiagramm des Verfahrens zur Bereitstellung von Hyperparametern zur Erzeugung von künstlichen Bildern in einer Ausführungsform. Fig. 2 zeigt schematisch ein Blockdiagramm eines bildoptimierenden Verfahrens in einer Ausführungsform. Fig. 3 zeigt schematisch ein Ablaufdiagramm des Verfahrens zum Erstellen eines synthetischen Bilddatensatzes in einer Ausführungsform.

Fig. 4 zeigt schematisch ein Blockdiagramm des Verfahrens zum Erstellen eines synthetischen Bilddatensatzes in einer Ausführungsform. Fig. 5 zeigt schematisch ein Ablaufdiagramm eines Verfahrens zum Trainieren eines Zielnetzwerkes mit einem erzeugten synthetischen Bilddatensatz in einer Ausführungsform.

Fig. 6 zeigt schematisch ein Blockdiagramm eines Verfahrens zum Trainieren eines Zielnetzwerkes mit einem erzeugten synthetischen Bilddatensatz in einer Ausführungsform.

Fig. 7 zeigt schematisch ein Übertragungssystem zum Übertragen eines Netzwerkverhaltens eines Startnetzwerkes auf ein Zielnetzwerk bzw. einen Gesamtprozess eines Verfahrens zum Übertragen eines Verhaltens eines trainierten Startnetzwerkes auf ein Zielnetzwerk. Fig. 8 zeigt schematisch einen Prozess zur Bestimmung von Hyperparametern mit temporärer Bildgenerierung, wie er aus dem Stand der Technik bekannt ist.

Fig. 9A, B zeigen eine Vorgabe eines Ziellabels.

Die Figur 1 zeigt schematisch ein Ablaufdiagramm des Verfahrens zur Bereitstellung von Hyperparametern zur Erzeugung von künstlichen Bildern in einer Ausführungsform. Das Verfahren wird dabei in einem ersten Berechnungsprozess P1 durchgeführt. Der Berechnungsprozess kann auch als Berechnungsphase verstanden werden. Der erste Berechnungsprozess wird dabei mit einer leistungsstarken Berechnungseinheit durchgeführt, nämlich mit einer GPU, und kann als Hochleistungsberechnungseinheit verstanden werden, wie zuvor beschrieben. Ausgangspunkt für das gezeigte Verfahren in der Figur 1 ist, dass ein trainiertes Startnetzwerk T zur Verfügung steht, dass auch als Lehrernetzwerk (engl. „Teacher“) bezeichnet werden kann. In einem ersten Schritt A1 wird ein Bilddatensatz mittels eines bildoptimierten Verfahrens erzeugt. Der Bilddatensatz wird dabei in Abhängigkeit eines Hyperparametersatzes erzeugt. Der Bilddatensatz kann auch als Batch bezeichnet werden. In dem bildoptimierten Verfahren wird das Startnetzwerk T verwendet, das ein trainiertes neuronales Netzwerk ist, das mit einem Originaldatensatz trainiert wurde und das durch eine Startnetzarchitektur und Startnetzgewichte gekennzeichnet ist.

Dem Startnetzwerk wird wenigstens ein Ziellabel vorgegeben, nämlich ein Softlabel.

Der Schritt A1 umfasst noch weitere Schritte, die vorliegend zur Veranschaulichung nicht dargestellt sind, nämlich ein Propagieren des Bilddatensatzes durch das Startnetzwerk und ein Anpassen des Bilddatensatzes mittels Rückwärtspropagation zur Minimierung einer Kostenfunktion. Diese Schritte sind beispielsweise in der Figur 2 veranschaulicht.

In einem zweiten Schritt A2 erfolgt ein Prüfen des erzeugten Bilddatensatzes X auf ein vorbestimmtes Abbruchkriterium. Das Abbruchkriterium kann wie zuvor beschrieben ein automatisiertes oder ein manuelles Abbuchkriterium sein. Vorliegend wird angenommen, dass das Abbruchkriterium ein automatisches Abbruchkriterium in Form eines Schwellenwertes ist, und das Abbruchkriterium erfüllt ist, wenn ein Wert einer zu minimierenden Kostenfunktion kleiner ist als ein zuvor definierter Schwellwert für die Kostenfunktion.

Ist das Abbruchkriterium nicht erfüllt ist, wird der Schritt A3 ausgeführt.

In dem dritten Schritt A3 erfolgt ein Anpassen des Hyperparametersatzes und ein erneutes Durchführen des bildoptimierten Verfahrens in Schritt A2 mit geänderten Hyperparametern, wenn die Prüfung in Schritt A2 ergibt, dass das Abbruchkriterium nicht erfüllt ist.

Es wird also ein iterativer Berechnungsprozess in dem ersten Berechnungsprozess P1 zur Bestimmung geeigneter Hyperparameter durchgeführt, der solange wiederholt wird, bis das Abbruchkriterium erfüllt ist. Ist das Abbruchkriterium erfüllt, wird der aktuell eingestellt Hyperparametersatz als erster Hyperparameterdatensatz als Datensatz bereitgestellt.

Der erste Berechnungsprozess P1 erfolgt somit ausschließlich in Abhängigkeit des trainierten Startnetzwerkes T. Der erste Berechnungsprozess P1 kann auch als Hyperparametertuning für eine anschließende Bildgenerierung verstanden werden.

Weitere Schritte, die in der Figur 1 nicht dargestellt sind, sind die Erstellung eines initialen Hyperparametersatzes Po und eines initialen Bilddatensatzes Xo. Diese Schritte werden einmalig durchgeführt, damit eine Grundlage in Form des initialen Hyperparametersatzes Po und des initialen Bilddatensatzes Xo für das iterative Optimierungsverfahren zur Verfügung steht.

Die Figur 2 zeigt schematisch ein Blockdiagramm, dass das Grundprinzip eines bildoptimierenden Verfahrens in einer Ausführungsform veranschaulicht und ausschließlich ab- hängig ist von einem Startnetzwerk T. Das in der Figur 2 gezeigte Blockdiagramm ist somit dem Schritt A1 der Figur 1 zuzuordnen und kann mehrfach durchlaufen werden.

Das Grundprinzip des Blockdiagramms der Figur 2 ist, dass ein Bilddatensatz X optimiert wird, indem Pixelwerte des Bilddatensatzes X angepasst werden. Dieser Vorgang ist in der Figur 2 in dem Bilddatensatz X veranschaulicht. Auf der linken Seite des obersten Bildes des Bilddatensatzes X ist zu erkennen, dass das gezeigte Bild noch teilweise verpixelt ausgebildet ist, also die Pixel noch zufällige Werte besitzen. Die dargestellte Optimierung durch Anpassung der Pixelwerte ist somit noch nicht abgeschlossen. Ist der Optimierungsvorgang abgeschlossen, liegt ein unverpixeltes und natürlich aussehendes Bild vor, das synthetisch erzeugt wurde und das auf Basis des Wissens erzeugt wurde, das in den Schichten des Startnetzwerk T enthalten ist. Das Startnetzwerk selber wurde nicht angepasst.

Um den Bilddatensatz X zu optimieren, propagiert der Bilddatensatz X durch das Startnetzwerk T. Die Gewichte des Startnetzwerkes sind dabei fest. Das Startnetzwerk T gibt entsprechend einen Schätzwert bzw. eine Vorhersage y_T ^T aus. Dieser Vorhersagewert y_T ^T wird anschließend mit einem vorgegebenen Ziellabel y abgeglichen. Das Ziellabel y wird beispielsweise als Softlabel vorgeben.

Anschließend erfolgt ein Anpassen des Bilddatensatzes X mittels Rückwärtspropagation zur Minimierung einer Kostenfunktion. Die Kostenfunktion ist in der Figur 2 als Lx dargestellt und ist ausgebildet als

Lx — L_t + ct_i2L_j2 + cc_vL_v + dfLf. Die Kostenfunktion besteht somit aus einer Vielzahl von Termen und wird mit einem Gradientenverfahren optimiert, um den Bilddatensatz X solange anzupassen, bis ein vorbestimmtes Abbruchkriterium erfüllt ist, wie beispielsweise bereits zur Figur 1 beschrieben. Die Terme L_t, L_l2, L_v und L_f wurden zuvor beschrieben. Zudem umfasst die Kostenfunk- tion Gewichtungsfaktoren a_l2, a_v und a_f, die ebenfalls zuvor beschrieben wurden.

Die Rückwärtspropagation, die auch als Backpropagation bekannt ist, ist in der Figur 2 schematisch durch die gestrichelten Pfeile dargestellt.

Aus Gründen der Übersichtlichkeit wurde auf das Einzeichnen von weiteren Komponenten verzichtet, beispielsweise wurden keine Aktivierungsfunktion in der Figur 2 darge- stellt, wie zum Beispiel eine Softmax-Funktion, die als Softmax-Layer implementiert sein können.

Zudem ist in der Figur 2 ein Block PP dargestellt. Dieser Block PP veranschaulicht eine Vorverarbeitung (engl. „Pre-Processing“) des Bilddatensatzes X, um die Bilder in ein Format zu überführen, die das Ausgangsnetzwerk T verarbeiten kann. Zudem kann die vor Verarbeitung umfassen, dass für die verwendeten Datensätze die Bilder zufällig um einen vorgegebenen Maximalwert, z.B. 10%, der Pixel horizontal und vertikal gerollt werden.

Die Figur 3 zeigt schematisch ein Ablaufdiagramm des Verfahrens zum Erstellen eines synthetischen Bilddatensatzes in einer Ausführungsform.

Das Verfahren wird dabei in einer zweiten Berechnungsphase P2 durchgeführt. Diese Phase kann auch als ein zweiter Berechnungsprozess verstanden werden. Der Berechnungsprozess wird dabei mit einer leistungsstarken Berechnungseinheit durchgeführt, nämlich mit einer GPU.

In einem ersten Schritt B1 wird ein Bilddatensatz mittels eines bildoptimierten Verfahrens bestimmt, wobei in dem bildoptimierten Verfahren wenigstens ein Startnetzwerk und ein Zwischen netzwerk verwendet wird. Das Startnetzwerk ist dabei ein trainiertes neuronales Netzwerk, das mit einem Originaldatensatz trainiert wurde und das durch eine Startnetzarchitektur und Startnetzgewichte gekennzeichnet ist. Das Zwischennetzwerk ist ein neuronales Netzwerk, das durch eine Zwischennetzarchitektur und Zwischennetzgewichte gekennzeichnet ist. Dem Startnetzwerk wird dabei wenigstens ein Ziellabel vorgegeben, das als Softlabel ausgebildet ist. Da ein zusätzliches Zwischenzweck verwendet wird, erfolgt das Erstellen des Bilddatensatzes in der Berechnungsphase P2 mit zusätzlichen Hyperparametern, also in Abhängigkeit eines zweiten Hyperparametersatzes P2. Der zweite Hyperparametersatz P2 umfasst dabei die Hyperparameter des ersten Hyperparametersatzes Pi. Das Erstellen des Bilddatensatzes erfolgt somit auf eine ähnliche Weise, wie beispielsweise zur Figur 1 und 2 beschrieben, mit dem Unterschied, dass ein zusätzliches Zwischennetzwerk für die Erzeugung des Bilddatensatzes verwendet wird. Dies ist beispielsweise in der Figur 4 veranschaulicht.

In einem zweiten Schritt B2 erfolgt ein Speichern des erzeugten Bilddatensatzes, um den synthetischen Bilddatensatzes D zu erzeugen. Die angepassten Bilddatensätze werden also nicht verworfen, sondern gespeichert, um einen großen Bilddatensatz auszubilden.

In einem dritten Schritt B3 erfolgt anschließend ein Trainieren des Zwischennetzwerkes mit dem gespeicherten Bilddatensatz durch Anpassung der Zwischennetzgewichte des Zwischen netzwerkes mittels Rückwärtspropagation. Das erneute Durchführen des bildoptimierten Verfahrens in Schritt B1 und der Schritte B2 und B3 erfolgt dabei solange ein Abbruchkriterium nicht erfüllt ist, wie zuvor beschrieben.

Es wird also ein iterativer Berechnungsprozess in dem zweiten Berechnungsprozess P2 vorgeschlagen, der solange wiederholt wird, bis ein Abbruchkriterium erfüllt ist, wie beispielsweise zur Figur 1 bereits beschrieben. Als Abbruchkriterium für den Berechnungs- prozess P2 kann beispielsweise eine vorgegebene Anzahl an Bildern sein, die erzeugt werden soll, beispielsweise 30 000 Bilder.

Die Figur 4 zeigt schematisch ein Blockdiagramm, das das Grundprinzip eines bildoptimierenden Verfahrens in einer Ausführungsform veranschaulicht und abhängig ist von einem Startnetzwerk T und einem Zwischen netzwerk S1. Das in der Figur 4 gezeigte Blockdia- gramm ist beispielsweise den Schritten B1 bis B2 aus der Figur 3 zuzuordnen und kann mehrfach durchlaufen werden.

Wie dem Blockdiagramm der Figur 4 zu entnehmen ist, sind die Schritte B1 und B2 veranschaulicht.

Das Grundprinzip des Blockdiagramms der Figur 4 ist analog zur Figur 2. In dem ersten Schritt B1 wird der Bilddatensatzes X optimiert, indem Pixelwerte des Bilddatensatzes X angepasst werden. Um den Bilddatensatz X zu optimieren, propagiert der Bilddatensatzes X durch das Startnetzwerk T und durch das Zwischennetzwerk Si. Die Gewichte des Startnetzwerkes T sind dabei fest. Die Gewichte des Zwischennerzwerkes Si sind veränderlich ausgebildet. Das Startnetzwerk T gibt entsprechend einen Schätzwert bzw. eine Vorhersage y-r^T aus. Zudem gibt das Zwischennetzwerk einen Schätzwert bzw. eine Vorhersage ys^T aus.

Anschließend erfolgt ein Anpassen des Bilddatensatzes X mittels Rückwärtspropagation zur Minimierung einer Kostenfunktion Lx. Die Kostenfunktion ist in der Figur 4 als Lx dar- gestellt und ist ausgebildet als

Die Kostenfunktion besteht aus einer Vielzahl von Termen und wird mit einem Gradientenverfahren optimiert, um den Bilddatensatz X solange anzupassen, bis ein vorbestimmtes Abbruchkriterium erfüllt ist, wie beispielsweise zur Figur 1 bereits beschrieben. Die Terme L_t, L_l2, L_v, L_f und L_c wurden zuvor beschrieben. Zudem umfasst die Kostenfunktion Gewichtungsfaktoren a_l2, a_v, a_f und a_c, die ebenfalls zuvor beschrieben wurden.

Die Rückwärtspropagation im Schritt B1 , die auch als Backpropagation bekannt ist, ist in der Figur 4 schematisch durch die gestrichelten Pfeile dargestellt.

Ist der Optimierungsvorgang abgeschlossen, liegt ein natürlich aussehendes und synthe- tisch erzeugtes Bild vor. Anschließend wird der angepasste Bilddatensatz in einem zweiten Schritt B2 in einem Datenspeicher als synthetischer Bilddatensatz D abgespeichert.

In einem nicht gezeigten dritten Schritt B3 erfolgt ein Trainieren des Zwischennetzwerkes Si mit dem gespeicherten Bilddatensatz D durch Anpassung der Zwischennetzgewichte mittels Rückwärtspropagation. Das Trainieren des Zwischennetzwerkes ist in der Figur 4 nicht dargestellt und wird beispielsweise mit einem KD-Verfahren durchgeführt, dass beispielsweise in der Figur 6 gezeigt ist.

Wurde das Zwischen netzwerk Si mit einem Trainingsverfahren auf Basis des gespeicherten Bilddatensatzes trainiert, erfolgt ein erneutes Durchführen des Schrittes B1 mit dem trainierten bzw. angepassten Zwischennetzwerk. Aus Gründen der Übersichtlichkeit wurde erneut auf das Einzeichnen von weiteren Komponenten verzichtet, beispielsweise wurden keine Aktivierungsfunktion in der Figur 4 dargestellt, wie zum Beispiel eine Softmax-Funktion, die als Softmax-Layer implementiert sein kann. Zudem ist in der Figur 4 ein Block PP dargestellt, wie zuvor beschrieben.

Die Figur 5 zeigt schematisch ein Ablaufdiagramm eines Verfahrens zum Trainieren eines Zielnetzwerkes S₂ mit einem erzeugten synthetischen Bilddatensatz D in einer Ausführungsform.

Das Verfahren wird dabei in einer dritten Berechnungsphase P3 durchgeführt. Diese Phase kann auch als ein dritter Berechnungsprozess verstanden werden. Der Berechnungsprozess wird dabei mit einer leistungsstarken Berechnungseinheit durchgeführt, nämlich mit einer GPU.

Ausgangspunkt für das gezeigte Verfahren in der Figur 5 ist, dass wenigstens ein Zielnetzwerk S₂ und der erzeugte synthetische Bilddatensatz D zur Verfügung steht. Das Zielnetz- werk ist ein untrainiertes neuronales Netz und durch eine Zielnetzarchitektur und Zielnetzgewichte gekennzeichnet.

In einem ersten Schritt C1 erfolgt ein Trainieren des Zielnetzwerkes S₂ mit dem erzeugten synthetischen Bilddatensatz D durch Anpassen der Zielnetzgewichte mittels Rückwärtspropagation, wobei das Trainieren des Zielnetzwerkes in Abhängigkeit von einem dritten Hyperparametersatz P3 erfolgt. Es sind verschiedene Trainingsverfahren zum Trainieren des Zielnetzwerkes bekannt, beispielsweise das Knowledge-Distilation-Verfahren, wie in der Figur 6 gezeigt.

Der dritte Hyperparametersatz P3 ist dabei dazu vorgesehen, dass Trainingsverfahren des Zielnetzwerkes auf Basis des erzeugten synthetischen Bilddatensatzes D zu regulieren, und kann unabhängig von dem ersten und zweiten Hyperparametersatz ausgebildet sein.

In einem zweiten Schritt C2 wird der dritte Hyperparametersatz P3 angepasst, wenn eine weitere Prüfung ergibt, dass ein Abbruchkriterium nicht erfüllt ist, wie zuvor beschrieben.

Ist das Abbruchkriterium erfüllt, wird das trainierte Zielnetzwerk ausgegeben und wird somit für die Implementierung auf einer Hardware bereitgestellt. Wird ein kleineres Netzwerk ausgewählt, kann so ein kleineres trainiertes KNN bereitgestellt werden, dass das gleiche Verhalten wie das Startnetzwerk aufweist, mit dem Unterschied, dass es weniger Speicherbedarf hat. So wird eine Implementierung auf einer echtzeitfähigen Hardware möglich. In der Figur 6 ist schematisch ein Blockdiagramm eines Verfahrens zum Trainieren eines Zielnetzwerkes mit einem erzeugten synthetischen Bilddatensatz in einer Ausführungsform dargestellt.

Eine Möglichkeit das Wissen von einem KNN auf ein anderes zu übertragen ist das Knowledge Distillation (KD)-Verfahren, das in der Figur 6 dargestellt ist. Dabei lernt ein Zielnetzwerk S2 von dem bereits trainierten Starnetzwerk T mithilfe des synthetischen Datensatzes. Für das KD-Verfahren wird üblicherweise der originale Datensatz verwendet, da dieser aber vorliegend nicht zur Verfügung steht, wird der synthetisch erzeugte Bilddatensatz D verwendet. Der Datensatz D besteht aus den Bilddaten X.

Allgemein werden die Gewichte des Zielnetzwerkes S2 über die Minimierung einer Kosten- funktion LKD mit einem Gradientenverfahren optimiert. Diese Kostenfunktion LKD setzt sich aus zwei Termen zusammen, nämlich aus der Kreuzentropie H und der Kullback-Leibler- Divergenz. Die Kreuzentropie H wird zwischen den Labein y und den Vorhersagen des Zielnetzwerkes ys berechnet. Die Verwendung der Kreuzentropie hat sich beim klassischen Training von KNNs bewährt. Die Kreuzentropie kann berechnet werden, wenn die Ziellabel zu den jeweiligen erzeugten Bildern abgespeichert wurden. Der Distillation-Loss LD sorgt dafür, dass das Zielnetzwerk S2 vom Startnetzwerk T lernt. Üblicherweise berechnet sich der Distillation-Loss LD aus den Vorhersagen des Startnetzwerkes yT^T und den Vorhersagen des Zielnetzwerkes ys^T.

Die am weitesten verbreitete Variante, um die Vorhersagen des Zielnetzwerkes ys^T auf die des Startnetzwerkes y_T ^T anzupassen, ist die Minimierung der Kullback-Leibler (KL)- Divergenz zwischen ys^T und yr^T. Die KL-Divergenz ist ein Maß für die Unterschiedlichkeit zwischen zwei Wahrscheinlichkeitsverteilungen. Der skalare Hyperparameter l legt fest, zu welchen Anteilen das Zielnetzwerk S2 aus den Labein y und den Vorhersagen des Startnetzwerkes S2 lernen soll. Im Gegensatz zu den zuvor beschriebenen Blockdiagrammen sind in der Figur 6 Softmax- Funktionen dargestellt. Für die Berechnung der Vorhersagen ys, ys^T und y_T ^T können verschiedene Temperaturwerte t gesetzt werden. Die Temperatur t ist dabei ein aus dem Bereich des maschinellen Lernens bekannter Wert, mit dem Wahrscheinlichkeitsverteilung verändert werden, beispielsweise in den Softmax-Schichten. Es versteht sich also, dass sich die Temperatur nicht auf die klassische Temperatur bezieht.

Das gezeigte KD-Verfahren ist dabei ein geeignetes Verfahren, um das Zielnetzwerk mit dem synthetischen Bilddatensatz D anzutrainieren.

Die Figur 7 zeigt schematisch ein Übertragungssystem 10 zum Übertragen eines Netz- Werkverhaltens eines Startnetzwerkes T auf ein Zielnetzwerk S2, wobei das Startnetzwerk T ein trainiertes neuronales Netzwerk ist, das mit einem Originaldatensatz trainiert wurde und durch eine Startnetzarchitektur und Startnetzgewichte gekennzeichnet ist, und das Zielnetzwerk S2 ein untrainiertes neuronales Netz ist und durch eine Zielnetzarchitektur und Zielnetzgewichte gekennzeichnet ist. Das Übertragungssystem umfasst eine Berechnungseinheit 100, die zur Bereitstellung von Hyperparametern zur Erzeugung von künstlichen Bilder eingerichtet ist, wobei die Berechnungseinheit in einem ersten Berechnungsprozess P1 einen ersten Hyperparametersatz P1 ausschließlich in Abhängigkeit des Startnetzwerkes erzeugt. In die Berechnungseinheit 100 ist somit nur das Startnetzwerk T geladen. Zudem wird in dem ersten Berechnungs- prozess dem Startnetzwerk wenigstens ein Ziellabel vorgegeben wird, das als Softlabel ausgebildet ist. Dies ist in der Figur 7 nicht dargestellt.

Mit der Berechnungseinheit 100 wird also ein Hyperparametertuning für eine Bildgenerierung durchgeführt, beispielsweise wie der Prozess P1 und wie zuvor zu den Figuren 1 und 2 beschrieben. Mit bzw. auf der Berechnungseinheit 100 werden somit mehrere Schritte ausgeführt. In einem ersten Schritt wird ein Bilddatensatz X generiert, der als Batch bezeichnet ist und beispielsweise dem Schritt A1 aus der Figur 1 entspricht. Die angepassten Bilder X werden anschließend in einem weiteren Schritt beurteilt, nämlich auf das Vorliegen eines Abbruchkriteriums. Dieser Schritt entspricht beispielsweise dem Schritt A2 aus der Figur 1 . In einem dritten Schritt werden die Hyperparameter angepasst, wenn ein Abbruchkriterium nicht erfüllt ist. Dieser Schritt entspricht beispielsweise dem Schritt A3 aus der Figur 1 . Ist das Abbruchkriterium erfüllt, wird der aktuell eingestellte Hyperparametersatz P1 durch die Berechnungseinheit 100 zur weiteren Verarbeiten bereitstellt. Das Übertragungssystem umfasst zudem eine Berechnungseinheit 200, die zum Erstellen eines synthetischen Bilddatensatzes D eingerichtet ist, wobei die Berechnungseinheit in einem zweiten Berechnungsprozess P2 den synthetischen Bilddatensatz in Abhängigkeit des Startnetzwerkes und eines Zwischen netzwerkes erzeugt, und wenigstens dem Start- netzwerk wenigstens ein Ziellabel vorgegeben wird, das als Softlabel ausgebildet ist.

Dazu werden mit bzw. auf der Berechnungseinheit 200 mehrere Schritte ausgeführt. In einem ersten Schritt wird ein Bilddatensatz X generiert, der als Batch bezeichnet ist und beispielsweise dem Schritt B1 aus der Figur 3 entspricht. Die angepassten Bilder X werden anschließend gespeichert. Dieser Schritt entspricht beispielsweise dem Schritt B2 aus der Figur 3. In einem dritten Schritt wird das Zwischennetzwerk Si trainiert, das als Student bezeichnet wird, nämlich auf Basis der angepassten Bilder X bzw. der gespeicherten Bilder. Dieser Schritt entspricht beispielsweise dem Schritt B3, der zuvor zur Figur 3 beschrieben wurde. Das Verfahren wird dabei solange wiederholt, bis ein Abbruchkriterium erfüllt wird, wie beispielsweise zuvor zu den Figur 3 und 4 beschrieben. Ist das Abbruchkriterium erfüllt, wird der gespeicherte synthetische Bilddatensatz D durch die Berechnungseinheit 200 zur weiteren Verarbeitung bereitstellt.

Das Übertragungssystem umfasst zudem eine Berechnungseinheit 300, die zum Trainieren des Zielnetzwerkes S2 mit dem synthetischen Bilddatensatz D durch Anpassen der Zielnetzgewichte mittels Rückwärtspropagation eingerichtet ist, um in einem dritten Be- rechnungsprozess P3 das Zielnetzwerk mit dem synthetischen Bilddatensatz D zu trainieren, um das Netzwerkverhalten des Startnetzwerkes T auf das Zielnetzwerk S2 zu übertragen, nämlich ohne Verwendung oder ohne unmittelbaren Zugriff auf einen Originaldatensatz. Das Zielnetzwerk wird als Student S2 in der Figur 7 bezeichnet. In dem dritten Berechnungsprozess P3 wird der Student S2 mittels eines Trainingsverfahren trainiert, näm- lieh beispielsweise mit dem Knowledge-Distillation-Verfahren (KD-Verfahren), wie zuvor zu den Figuren 5 und 6 beschrieben.

Dazu werden mit bzw. auf der Berechnungseinheit 300 mehrere Schritte ausgeführt. In einem ersten Schritt wird das Zielnetzwerk S2 auf Basis des synthetischen Bilddatensatzes D trainiert. Dieser Schritt entspricht beispielsweise dem Schritt C1 aus der Figur 5. In einem zweiten Schritt wird ein dritter Hyperparametersatz P3 angepasst, wenn ein Abbruchkriterium nicht erfüllt ist, wie beispielsweise zuvor zu der Figur 5 und 6 beschrieben. Das Verfahren wird dabei solange wiederholt, bis das Abbruchkriterium erfüllt wird. Ist das Abbruchkriterium erfüllt, wird der trainierte Student S2 bzw. das Zielnetzwerk S2 durch die Berechnungseinheit 300 zur weiteren Verarbeiten bereitstellt. In einerweiteren optionalen Ausführungsform wird vorgeschlagen, dass das Übertragungssystem 10 zudem eine Berechnungseinheit 400 umfasst, die zur Prüfung des trainierten Zielnetzwerkes S2 auf ein Zielkriterium eingerichtet ist, um in einem vierten Berechnungsprozess P4 das trainierte Zielnetzwerk zu verifizieren. Die Berechnungseinheit 400 ist zudem dazu eingerichtet, ein Anpassen des zweiten Hyperparametersatzes P2 und zusätzlich oder alternativ ein Anpassen des dritten Hyperparametersatzes P3 auszulösen oder umzusetzen, wenn das Zielkriterium nicht erfüllt ist.

Zudem ist die Berechnungseinheit 400 dazu eingerichtet, das trainierte Zielnetzwerkes S2 auszugeben, wenn das Zielkriterium erfüllt ist. Die Evaluation des Zielnetzwerkes kann mit einem Testdatensatz T verifiziert werden, um die Performance bzw. die Genauigkeit des Zielnetzwerkes zu überprüfen.

Gleichzeitig dient die Figur 7 auch als Veranschaulichung eines Verfahrens zum Übertragen eines Verhaltens eines trainierten Startnetzwerkes auf ein Zielnetzwerk ohne Verwendung eines Originaldatensatzes in einer Ausführungsform, die vier Übertragungseinheiten 100 bis 400 können auch als vier Berechnungsprozesse bzw. Berechnungsschritte S1 bis

S4 aufgefasst werden.

Die Figur 8 veranschaulicht wie im Stand der Technik eine Bestimmung von Hyperparametern für eine Bildgenerierung sowie eine Bildgenerierung und ein Training des Zielnetzwerkes erfolgt, der als Student S in der Figur 8 gezeigt ist. Problematisch an dem gezeigten Verfahren in der Figur 8 ist, dass die Bestimmung der Hyperparameter mit dem Studenten S erfolgt. Damit werden zusätzliche Ressourcen für die Berechnung der Hyperparameter benötigt. Der Bestimmungsprozess ist damit sehr langsam.

Zudem erfolgt keine Erstellung eines synthetischen Datensatzes D durch Abspeichern der Batches zu einem synthetischen Bilddatensatz ID). Die Bilder werden nur temporär gespeichert.

Ein weiterer Nachteil ist, dass im Stand der Technik keine Softlabel verwendet werden, die die Performance bei der Übertragung des Wissens von einem Startnetzwerk auf ein Ausgangsnetz erhöhen. Die Figuren 9A und B veranschaulichen eine Vorgabe eines Ziellabels mit einem Softlabel. Zudem veranschaulicht die Figur 9A den grundlegenden Aufbau eines KNN mit dem Bilddaten bzw. Bilder klassifiziert werden können. Der grundlegende Aufbau eines KNN mit dem Bilder bzw. Bilddaten klassifiziert werden können, wird als bekannt voraussetzt.

Ein solches KNN weist wenigstens eine Eingangsschicht (engl. „Input Layer“) mit einer Vielzahl von Eingangsknoten auf, wobei die Anzahl der Eingangsknoten einer Anzahl an Bildpixel entspricht. Jedes Pixel entspricht demnach einem Eingangsknoten. Zudem weist ein solches KNN eine Vielzahl von verstecken Schichten (engl „hidden layers“) und eine Ausgangsschicht (engl. „Output layer“) mit einer Vielzahl von Ausgangsknoten auf, wobei jeder Ausgangsknoten einer Klasse entspricht, die durch das KNN klassifiziert wird. Die Schichten sind dabei so miteinander verbunden, dass die Pixelwerte an der Eingangsschicht über die versteckten Schichten zu der Ausgangsschicht propagieren und an der Ausgangssicht pro Ausgangsknoten ein Schätzwert ausgeben wird.

Es versteht sich, dass das zuvor beschriebene Startnetzwerk, das Zwischennetzwerk und das Zielnetzwerk einen solchen Aufbau aufweisen. Das in der Figur 9A gezeigte KNN ist ein trainiertes Startnetzwerk.

Wie zu erkennen ist, wird ein tiefes KNN verwendet, dass eine Eingangsschicht („Input Layer“) mit einer Vielzahl von Eingangsknoten aufweist, wobei die Anzahl an Eingangsknoten der Anzahl an Bildpixeln bzw. den Pixeln entspricht. Dies ist mit den gestrichelten Pfeilen in der Fig. 9A dargestellt. Zudem weist das KNN eine Vielzahl von verstecken Schichten („Multiple hidden layers“) und eine Ausgangsschicht („Output layer“) mit einer Vielzahl von Ausgangsknoten auf. Propagiert ein Zufallsbild X durch das gezeigte trainiere Startnetzwerk, könnten sich an der Ausgangsschicht die Schätzwerte 0.5 für eine erste Klasse einstellen, der Schätzwert 0.3 für eine zweite Klasse und der Schätzwert 0.2 für eine dritte Klasse. Das trainierte KNN gibt also jeweils einen Schätzwert für jede Klasse bzw. an jedem Ausgangsknoten aus.

Als Ziellabel ist ein Softlabel vorgesehen, das den beispielshaften Zielwert 0.9 für die erste Klasse, den Zielwert 0.05 für die zweite Klasse und den Zielwert 0.05 für die dritte Klasse aufweist.

Da die Schätzwerte für die Klassen nicht mit den Zielwerten des Ziellabels übereinstimmen, erfolgt eine Anpassung des Zufallsbildes. Dies ist in der Figur 9B durch den gestrichelten Rückwärtspfad dargestellt. Wie zu erkennen ist, ist das gezeigte Bild X weniger verpixelt als das Bild X aus der Figur 9A. Propagiert das angepasst Bild X der Figur 9B durch das KNN könnten sich bereits die Zielwerte 0.75, 0.15 und 0.10 einstellen, die schon näher an der Ziellabelvorgabe liegen. Durch die Anpassung der Pixel des Bildes entsteht nach und nach ein natürliches aussehendes Bild. Die Zielwerte des Ziellabels stellen sich also ein.

Um den Unterschied zu einem One-Hot-Label aufzuzeigen ist ein solches Label in der Figur 9A ebenfalls mit den Zielwerten 0,1 ,0 dargestellt. Alle Zielwerte des One-Hot-Labels sind mit Ausnahme eines Wertes null.

Durch zuvor beschriebene und vorgeschlagenen Verfahren ergeben sich einige Vorteile.

Beispielsweise wird vorgeschlagen, die Bestimmung der Hyperparameter von der Bildgenerierung zu trennen. Damit kann können Ressourcen und Zeit gespart werden.

Zudem besteht nach der Bildgenerierung ein Datensatz mit dem anschließend jedes belie- bige Netzwerk trainieren kann.

Im Stand der Technik, werden die Bilder teilweise verworfen, da der Datensatz immer an das Zielnetzwerk gekoppelt ist.

Claims

Ansprüche

1. Verfahren zur Bereitstellung von Hyperparametern zur Erzeugung von künstlichen Bildern, umfassend die Schritte:

(i) Erstellen eines initialen Hyperparametersatzes; (ii) Erstellen eines initialen Bilddatensatzes;

(iii) Erzeugen eines Bilddatensatzes mittels eines bildoptimierten Verfahrens in Abhängigkeit des Hyperparametersatzes, wobei in dem bildoptimierten Verfahren ein Startnetzwerk verwendet wird, das ein trainiertes neuronales Netzwerk ist, das mit einem Originaldatensatz trainiert wurde und das durch eine Startnetzarchitektur und Start- netzgewichte gekennzeichnet ist, wobei dem Startnetzwerk wenigstens ein Ziellabel vorgegeben wird, und wobei das bildoptimierte Verfahren wenigstens die Schritte umfasst:

(a) Propagieren des Bilddatensatzes durch das Startnetzwerk;

(b) Anpassen des Bilddatensatzes mittels Rückwärtspropagation zur Minimie- rung einer Kostenfunktion;

(iv) Prüfen des erzeugten Bilddatensatzes auf ein vorbestimmtes Abbruchkriterium;

(v) Anpassen des Hyperparametersatzes und erneutes Durchführen des bildoptimierten Verfahrens mit geänderten Hyperparametern, wenn die Prüfung ergibt, dass das Abbruchkriterium nicht erfüllt ist, oder Bereitstellen des angepassten Hyperparametersatzes als erster Hyperparametersatz, wenn die Prüfung ergibt, dass das Abbruchkriterium erfüllt ist, dadurch gekennzeichnet, dass in dem bildoptimierten Verfahren ausschließlich das Startnetzwerk verwendet wird.

2. Verfahren nach Anspruch 1 , wobei in dem bildoptimierten Verfahren ein Startnetz- werk verwendet wird, dem wenigstens ein Ziellabel vorgegeben, das als Softlabel ausgebildet ist, wobei das Ziellabel vorzugsweise mit einem einstellbaren Mittelwert und/oder einer einstellbaren Standardabweichung veränderbar ausgebildet ist.

3. Verfahren nach Anspruch 1 oder 2, wobei das Erstellen des initialen Bilddatensatzes (Xo) im Schritt (ii) mit einem Mittelwert von null und einer Standardabweichung von eins erfolgt.

4. Verfahren nach einem der vorstehenden Ansprüche, wobei wenigstens der Schritt (iii) mittels einer Hochleistungsberechnungseinheit durchgeführt wird, die eine Rechenleistung von wenigstens 500 Giga-FLOP/s aufweist, wobei die Hochleistungsberechnungseinheit vorzugsweise als GPU oder Cloudserver ausgebildet ist.

5. Verfahren zum Erstellen eines synthetischen Bilddatensatzes, umfassend die Schritte:

(i) Erzeugen eines Bilddatensatzes mittels eines bildoptimierten Verfahrens in Abhängigkeit eines zweiten Hyperparametersatzes, wobei in dem bildoptimierten Verfahren wenigstens ein Startnetzwerk und ein Zwischen netzwerk verwendet wird, wobei das Startnetzwerk ein trainiertes neuronales Netzwerk ist, das mit einem Ori- ginaldatensatz trainiert wurde und das durch eine Startnetzarchitektur und

Startnetzgewichte gekennzeichnet ist, und das Zwischennetzwerk ein neuronales Netzwerk ist, das durch eine Zwischennetzarchitektur und Zwischennetzgewichte gekennzeichnet ist, und dem Startnetzwerk wenigstens ein Ziellabel vorgegeben wird, das als Softla- bei ausgebildet ist, wobei das bildoptimierte Verfahren wenigstens die Schritte umfasst:

(a) Propagieren des Bilddatensatzes durch das Startnetzwerk und durch das Zwischennetzwerk; und

(ii) Speichern des angepassten Bilddatensatzes, um den synthetischen Bilddatensatz zu erzeugen.

6 Verfahren nach Anspruch 5, wobei der zweite Hyperparametersatz die Hyperparameter des ersten Hyperparametersatzes aufweist und der erste Hyperparametersatz nach einem Verfahren gemäß Anspruch 1 bis 4 bestimmt wurde.

7. Verfahren nach Anspruch 5 oder 6, wobei das Verfahren wenigstens einen der zu- sätzlichen Schritte umfasst:

(iii) Trainieren des Zwischennetzwerkes mit dem gespeicherten Bilddatensatz durch Anpassung der Zwischennetzgewichte mittels Rückwärtspropagation;

(iv) Erneutes Durchführen des Schrittes (i) mit dem trainierten Startnetzwerk und dem trainierten Zwischennetzwerk.

8. Verfahren nach einem der vorstehenden Ansprüche 5 bis 7, wobei wenigstens der Schritt (i) und/oder der Schritt (iii) mittels einer Hochleistungsrecheneinheit durchgeführt wird, die eine Rechenleistung von wenigstens 500 Giga-FLOP/s aufweist, wobei die Hochleistungsrecheneinheit vorzugsweise als GPU oder Cloud- server ausgebildet ist.

9. Verfahren nach einem der vorstehenden Ansprüche 5 bis 8, wobei die Zwischennetzarchitektur des Zwischennetzwerks ähnlich oder gleich groß ausgebildet ist wie die Startnetzarchitektur des Startnetzwerkes, wobei die Zwischennetzarchitektur und die Startnetzarchitektur gekennzeichnet sind durch eine Anzahl von Netzwerkschichten und durch eine Anzahl von verwendeten Netzwerkneuronen, insbesondere um das bildoptimierte Verfahren mit wenigstens zwei ähnlich oder gleich großen neuronalen Netzen durchzuführen.

10. Verfahren nach einem der vorstehenden Ansprüche 5 bis 9, wobei das wenigstens eine Ziellabel mit einem einstellbaren Mittelwert und/oder einer einstellbaren Standardabweichung veränderbar ausgebildet ist.

11. Verfahren zum Übertragen eines Netzwerkverhaltens eines Startnetzwerkes auf ein

Zielnetzwerk, wobei das Startnetzwerk ein trainiertes neuronales Netzwerk ist, das mit einem Originaldatensatz trainiert wurde und durch eine Startnetzarchitektur und Startnetzgewichte gekennzeichnet ist, und das Zielnetzwerk ein untrainiertes neuronales Netz ist und durch eine Zielnetzarchitektur und Zielnetzgewichte gekennzeich- net ist, umfassend die Schritte: (i) Laden des Startnetzwerkes in einen Datenspeicher, insbesondere in einen Grafikspeicher oder einen Cloudspeicher;

(ii) Laden eines ersten Hyperparametersatzes in den Datenspeicher, wobei der erste Hyperparametersatz vorzugsweise mit dem Verfahren nach Anspruch 1 bis 4 erstellt wird;

(iii) Erzeugen eines synthetischen Bilddatensatzes mittels eines bildoptimierten Verfahrens in Abhängigkeit eines zweiten Hyperparametersatzes, wobei in dem bildoptimierten Verfahren wenigstens das Startnetzwerk und ein Zwischennetzwerk verwendet wird, wobei der synthetische Bilddatensatz vorzugsweise mit dem Verfahren nach Anspruch 5 bis 10 erzeugt wird;

(iv) T rainieren des Zielnetzwerkes mit dem erzeugten synthetischen Bilddatensatz durch Anpassen der Zielnetzgewichte mittels Rückwärtspropagation, wobei das Trainieren des Zielnetzwerkes in Abhängigkeit von einem dritten Hyperparametersatz erfolgt, und optional (v) Prüfen des trainierten Zielnetzwerkes auf ein Zielkriterium und

Anpassen des zweiten Hyperparametersatzes und/oder des dritten Hyperparametersatzes, wenn das Zielkriterium nicht erfüllt ist, oder

Ausgeben des trainierten Zielnetzwerkes, wenn das Zielkriterium erfüllt ist.

12. Verfahren nach Anspruch 11 , wobei die Zielnetzarchitektur des Zielnetzwerks kleiner ausgebildet ist als die Startnetzarchitektur des Startnetzwerkes, insbesondere um das Netzwerkverhalten des größeren Startnetzwerkes auf ein kleineres Zielnetzwerk zu übertragen und um ein trainiertes Zielnetzwerk mit einem verringerten Speicherbedarf als das Startnetzwerk bereitzustellen.

13. Verfahren nach Anspruch 11 oder 12, wobei wenigstens in Schritt (iii) dem Startnetzwerk wenigstens ein Ziellabel vorgegeben wird, das als Softlabel ausgebildet ist.

14. Berechnungssystem, insbesondere Cloudsystem oder Computersystem, wobei das Berechnungssystem dazu eingerichtet ist, ein Verfahren zur Bereitstellung von Hyperparametern zur Erzeugung von künstlichen Bildern nach einem der Ansprüche 1 bis 4 durchzuführen, um einen ersten Hyperparametersatz bereitzustellen, und/oder ein Verfahren zum Erstellen eines synthetischen Bilddatensatzes nach einem der Ansprüche 5 bis 10 durchzuführen, um einen synthetischen Bilddatensatzes zum Trainieren eines Zielnetzwerkes bereitzustellen, und/oder ein Verfahren zum Übertragen eines Netzwerkverhaltens eines Startnetzwerkes auf ein Zielnetzwerk nach einem der Ansprüche 11 bis 13 durchzuführen, um das Netzwerkverhalten des Startnetzwerkes auf das Zielnetzwerkzu über- tragen.

15. Übertragungssystem zum Übertragen eines Netzwerkverhaltens eines Startnetzwerkes auf ein Zielnetzwerk, wobei das Startnetzwerk ein trainiertes neuronales Netzwerk ist, das mit einem Originaldatensatz trainiert wurde und durch eine Startnetzarchitektur und Startnetzgewichte gekennzeichnet ist, und das Zielnetz- werk ein untrainiertes neuronales Netz ist und durch eine Zielnetzarchitektur und

Zielnetzgewichte gekennzeichnet ist, umfassend: eine Berechnungseinheit, die zur Bereitstellung von Hyperparametern zur Erzeugung von künstlichen Bilder eingerichtet ist, wobei die Berechnungseinheit in einem ersten Berechnungsprozess einen ersten Hyperparametersatz aus- schließlich in Abhängigkeit des Startnetzwerkes erzeugt, und vorzugsweise in dem ersten Berechnungsprozess dem Startnetzwerk wenigstens ein Ziellabel vorgegeben wird, das als Softlabel ausgebildet ist; und/oder eine Berechnungseinheit, die zum Erstellen eines synthetischen Bilddatensatzes eingerichtet ist, wobei die Berechnungseinheit in einem zweiten Berech- nungsprozess den synthetischen Bilddatensatz in Abhängigkeit des Startnetzwerkes und eines Zwischen netzwerkes erzeugt, und dem Startnetzwerk wenigstens ein Ziellabel vorgegeben wird, das als Softlabel ausgebildet ist, und eine Berechnungseinheit, die zum Trainieren des Zielnetzwerkes mit dem synthetischen Bilddatensatz durch Anpassen der Zielnetzgewichte mittels Rückwärtspropagation eingerichtet ist, um in einem dritten Berechnungsprozess das Zielnetzwerk mit dem synthetischen Bilddatensatz zu trainieren, um das Netzwerkverhalten des Startnetzwerkes auf das Zielnetzwerk zu übertragen, insbesondere ohne Verwendung oder unmittelbaren Zugriff auf den Originaldatensatz.