-
Die Erfindung betrifft ein Verfahren zum Betreiben eines Roboters, ein Verfahren zum automatisierten Labeln von Trainingsdaten, ein Verfahren zum Trainieren eines maschinellen Lernsystems, ein Trainingssystem, ein Verfahren zum Betreiben des Steuerungssystems, ein Steuerungssystem, ein Computerprogramm und ein maschinenlesbares Speichermedium.
-
Stand der Technik
-
Aus der
DE 20 2017 102 238 U ist ein Verfahren zum Trainieren eines maschinellen Lernsystems bekannt, bei dem Parameter des maschinellen Lernsystems mit Trainingsdaten für das maschinelle Lernsystem mit Beobachtungswerten und dazugehörigen gewünschten Ausgabewerten trainiert wird.
-
Vorteile der Erfindung
-
Das erfindungsgemäße Verfahren hat demgegenüber den Vorteil, dass Trainingsdaten für das maschinelle Lernsystem nicht gelabelt sein müssen, d.h. die müssen nicht mit gewünschten Ausgabewerten versehen sein.
-
Dies ermöglicht auf einfache Weise den Einsatz großer Datenmengen als Trainingsdaten, was das so trainierte maschinelle Lernsystem leistungsfähiger und das mit dem trainierten maschinellen Lernsystem betriebene Steuerungssystem im Betrieb sicherer macht.
-
Offenbarung der Erfindung
-
In einem ersten Aspekt betrifft die Erfindung ein computerimplementiertes Verfahren zum automatisierten Labeln von Trainingsdaten (also Paaren von Eingangs- und gewünschten Ausgangssignalen des maschinellen Lernsystems), das die folgenden Schritte umfasst:
- - zu wenigstens einer Teilmenge der Eingangssignale werden ein jeweils am Ausgang einer vorgebbaren Schicht eines maschinellen Lernsystems, insbesondere einer verborgenen Schicht anliegendes Zwischenergebnis ermittelt
- - die Menge dieser Zwischenergebnisse werden mit einem computerimplementieren Clusterverfahren in Gruppen (englisch: Cluster) eingeteilt
- - das jeweilige gewünschte Ausgangssignal der Eingangssignale wird abhängig davon gewählt, welcher Gruppe das jeweilige Zwischenergebnis angehört. „Labeln“ bedeutet wie üblich, dass (d.h. dass zu den Eingangssignalen jeweils zugehörige gewünschte Ausgangssignale ermittelt werden),
-
Bei dem maschinellen Lernsystem handelt es sich vorzugsweise um ein tiefes neuronales Netz. Ein tiefes neuronales Netz ist hierbei ein neuronales Netz mit einer Ein- oder Mehrzahl verborgener Schichten (englisch: hidden layer).
-
In einem weiteren Aspekt betrifft die Erfindung ein Verfahren zum Trainieren des maschinellen Lernsystems, wobei das maschinelle Lernsystem (60) mit Trainingsdaten trainiert wird, die mit dem vorgenannten Verfahren gelabelt wurde.
-
Dieses Training kann insbesondere mindestens teilweise überwacht sein. „Überwachtes Trainieren“ (englisch: supervised learning) kann hierbei bedeuten, dass das Trainieren, also ein Anpassen vorgebbarer Parameter des maschinellen Lernsystems, abhängig von einem Vergleich eines tatsächlichen Ausgangssignals des maschinellen Lernsystems mit einem für diesen Datenpunkt gewünschten Ausgangssignal, einem sogenannten „Label“, ermittelt wird. Dass dieses Training wenigstens teilweise überwacht ist kann bedeuten, dass es entweder überwacht oder teilweise überwacht (englisch: semisupervised learning) ist.
-
Mit dem so trainierten maschinellen Lernsystem kann dann vorgesehen sein, dass ein wenigstens teilautonomer Roboter und/oder ein Fertigungssystem und/oder ein persönlicher Assistent und/oder ein Zugangssystem und/oder ein Überwachungssystem oder ein medizinisch bildgebendes System angesteuert wird
-
Vorteilhafte Weiterbildungen sind Gegenstand der abhängigen Ansprüche.
-
Nachfolgend werden Ausführungsformen der Erfindung unter Bezugnahme auf die beiliegenden Zeichnungen näher erläutert. In den Zeichnungen zeigen:
- 1 schematisch einen Aufbau einer Ausführungsform der Erfindung;
- 2 schematisch ein Ausführungsbeispiel zur Steuerung eines wenigstens teilautonomen Roboters;
- 3 schematisch ein Ausführungsbeispiel zur Steuerung eines Fertigu ngssystems;
- 4 schematisch ein Ausführungsbeispiel zur Steuerung eines persönlichen Assistenten;
- 5 schematisch ein Ausführungsbeispiel zur Steuerung eines Zugangssystems;
- 6 schematisch ein Ausführungsbeispiel zur Steuerung eines Überwachungssystems;
- 7 schematisch ein Ausführungsbeispiel zur Steuerung eines medizinisch bildgebenden Systems;
- 8 schematisch ein Trainingssystem;
- 9 in einem Flussdiagramm einen möglichen Ablauf des Verfahrens automatisierten Labeln der Trainingsdaten;
- 10 in einem Flussdiagramm einen möglichen Ablauf zum Betreiben des maschinellen Lernsystems;
- 11 schematisch den Aufbau des maschinellen Lernsystem.
-
Beschreibung der Ausführungsbeispiele
-
1 zeigt einen Aktor 10 in seiner Umgebung 20 in Interaktion mit einem Steuerungssystem 40. Aktor 10 und Umgebung 20 werden gemeinschaftlich auch als Aktorsystem bezeichnet. In vorzugsweise regelmäßigen zeitlichen Abständen wird ein Zustand des Aktorsystems mit einem Sensor 30 erfasst, der auch durch eine Mehrzahl von Sensoren gegeben sein kann. Das Sensorsignal S - bzw. im Fall mehrerer Sensoren je ein Sensorsignal S - des Sensors 30 wird an das Steuerungssystem 40 übermittelt. Das Steuerungssystem 40 empfängt somit eine Folge von Sensorsignalen S. Das Steuerungssystem 40 ermittelt hieraus Ansteuersignale A, welche an den Aktor 10 übertragen werden.
-
Das Steuerungssystem 40 empfängt die Folge von Sensorsignalen S des Sensors 30 in einer optionalen Empfangseinheit 50, die die Folge von Sensorsignalen S in eine Folge von Eingangssignalen x umwandelt (alternativ kann auch unmittelbar je das Sensorsignal S als Eingangssignal x übernommen werden). Das Eingangssignal x kann beispielsweise ein Ausschnitt oder eine Weiterverarbeitung des Sensorsignals S sein. Das Eingangssignal x kann beispielsweise Bilddaten oder Bilder umfassen, oder einzelne Frames einer Videoaufzeichnung. Mit anderen Worten wird Eingangssignal x abhängig von Sensorsignal S ermittelt. Das Eingangssignal x wird einem maschinellen Lernsystem 60, das beispielsweise ein neuronales Netzwerk ist, zugeführt.
-
Das maschinelle Lernsystem 60 wird vorzugsweise parametriert durch Parameter θ, die in einem Parameterspeicher P hinterlegt sind und von diesem bereitgestellt werden.
-
Das maschinelle Lernsystem 60 ermittelt aus den Eingangssignalen x Ausgangssignale y. Die Ausgangssignale y werden einer optionalen Umformeinheit 80 zugeführt, die hieraus Ansteuersignale A ermittelt, welche dem Aktor 10 zugeführt werden, um den Aktor 10 entsprechend anzusteuern.
-
Eingangssignale werden im Folgenden auch als Eingangsgröße bezeichnet, Ausgangssignale auch als Ausgangsgröße.
-
Der Aktor 10 empfängt die Ansteuersignale A, wird entsprechend angesteuert und führt eine entsprechende Aktion aus. Der Aktor 10 kann hierbei eine (nicht notwendigerweise baulich integrierte) Ansteuerlogik umfassen, welches aus dem Ansteuersignal A ein zweites Ansteuersignal ermittelt, mit dem dann der Aktor 10 angesteuert wird.
-
In weiteren Ausführungsformen umfasst das Steuerungssystem 40 den Sensor 30. In noch weiteren Ausführungsformen umfasst das Steuerungssystem 40 alternativ oder zusätzlich auch den Aktor 10.
-
In weiteren bevorzugten Ausführungsformen umfasst das Steuerungssystem 40 eine Ein- oder Mehrzahl von Prozessoren 45 und wenigstens ein maschinenlesbares Speichermedium 46, auf dem Anweisungen gespeichert sind, die dann, wenn sie auf den Prozessoren 45 ausgeführt werden, das Steuerungssystem 40 veranlassen, das erfindungsgemäße Verfahren auszuführen.
-
In alternativen Ausführungsformen ist alternativ oder zusätzlich zum Aktor 10 eine Anzeigeeinheit 10a vorgesehen.
-
2 zeigt ein Ausführungsbeispiel, in dem das Steuerungssystem 40 zur Steuerung eines wenigstens teilautonomen Roboters, hier eines wenigstens teilautonomen Kraftfahrzeugs 100, eingesetzt wird.
-
Bei dem Sensor 30 kann es sich beispielsweise um einen oder mehrere vorzugsweise im Kraftfahrzeug 100 angeordnete Videosensoren und/oder einen oder mehrere Radarsensoren und/oder einen oder mehrere Ultraschallsensoren und/oder einen oder mehrere LiDAR-Sensoren und/oder einen oder mehrere Positionssensoren (beispielsweise GPS) handeln. Alternativ oder zusätzlich kann der Sensor 30 auch ein Informationssystem umfassen, das eine Information über einen Zustand des Aktorsystems ermittelt, wie beispielsweise ein Wetterinformationssystem, das einen aktuellen oder zukünftigen Zustand des Wetters in der Umgebung 20 ermittelt.
-
Das maschinelle Lernsystem 60 kann aus den Eingangsdaten x beispielsweise Gegenstände in der Umgebung des wenigstens teilautonomen Roboters detektieren. Bei dem Ausgangssignal y kann es sich um eine Information handeln, die charakterisiert, wo in der Umgebung des wenigstens teilautonomen Roboters Gegenstände vorhanden sind. Das Ausgangssignal A kann dann abhängig von dieser Information und/oder entsprechend dieser Information ermittelt werden.
-
Bei dem vorzugsweise im Kraftfahrzeug 100 angeordneten Aktor 10 kann es sich beispielsweise um eine Bremse, einen Antrieb oder eine Lenkung des Kraftfahrzeugs 100 handeln. Das Ansteuersignal A kann dann derart ermittelt werden, dass der Aktor oder die Aktoren 10 derart angesteuert wird, dass das Kraftfahrzeug 100 beispielsweise eine Kollision mit den vom maschinellen Lernsystem 60 identifizierten Gegenständen verhindert, insbesondere, wenn es sich um Gegenstände bestimmter Klassen, z.B. um Fußgänger, handelt. Mit anderen Worten kann Ansteuersignal A abhängig von der ermittelten Klasse und/oder entsprechend der ermittelten Klasse ermittelt werden.
-
Alternativ kann es sich bei dem wenigstens teilautonomen Roboter auch um einen anderen mobilen Roboter (nicht abgebildet) handeln, beispielsweise um einen solchen, der sich durch Fliegen, Schwimmen, Tauchen oder Schreiten fortbewegt. Bei dem mobilen Roboter kann es sich beispielsweise auch um einen wenigstens teilautonomen Rasenmäher oder einen wenigstens teilautonomen Putzroboter handeln. Auch in diesen Fällen kann das Ansteuersignal A derart ermittelt werden, dass Antrieb und/oder Lenkung des mobilen Roboters derart angesteuert werden, dass der wenigstens teilautonome Roboter beispielsweise eine Kollision mit den vom maschinellen Lernsystem 60 identifizierten Gegenständen verhindert,
-
In einer weiteren Alternative kann es sich bei dem wenigstens teilautonomen Roboter auch um einen Gartenroboter (nicht abgebildet) handeln, der mit einem bildgebenden Sensor 30 und dem maschinellen Lernsystem 60 eine Art oder einen Zustand von Pflanzen in der Umgebung 20 ermittelt. Bei dem Aktor 10 kann es sich dann beispielsweise um einen Applikator von Chemikalien handeln. Das Ansteuersignal A kann abhängig von der ermittelten Art oder vom ermittelten Zustand der Pflanzen derart ermittelt werden, dass eine der ermittelten Art oder dem ermittelten Zustand entsprechende Menge der Chemikalien aufgebracht wird.
-
In noch weiteren Alternativen kann es sich bei dem wenigstens teilautonomen Roboter auch um ein Haushaltsgerät (nicht abgebildet), insbesondere eine Waschmaschine, einen Herd, einen Backofen, eine Mikrowelle oder eine Spülmaschine handeln. Mit dem Sensor 30, beispielsweise einem optischen Sensor, kann ein Zustand eines mit dem Haushaltsgerät behandelten Objekts erfasst werden, beispielsweise im Falle der Waschmaschine ein Zustand von Wäsche, die in der Waschmaschine befindlich ist. Mit dem maschinellen Lernsystem 60 kann dann eine Art oder ein Zustand dieses Objekts ermittelt und vom Ausgangssignal y charakterisiert werden. Das Ansteuersignal A kann dann derart ermittelt werden, dass das Haushaltsgerät abhängig von der ermittelten Art oder dem ermittelten Zustand des Objekts angesteuert wird. Beispielsweise kann im Falle der Waschmaschine diese abhängig davon angesteuert werden, aus welchem Material die darin befindliche Wäsche ist. Ansteuersignal A kann dann abhängig davon gewählt werden, welches Material der Wäsche ermittelt wurde.
-
3 zeigt ein Ausführungsbeispiel, in dem das Steuerungssystem 40 zur Ansteuerung einer Fertigungsmaschine 11 eines Fertigungssystems 200 verwendet wird, indem ein diese Fertigungsmaschine 11 steuernder Aktor 10 angesteuert wird. Bei der Fertigungsmaschine 11 kann es sich beispielsweise um eine Maschine zum Stanzen, Sägen, Bohren und/oder Schneiden handeln.
-
Bei dem Sensor 30 dann beispielsweise um einen optischen Sensor handeln, der z.B. Eigenschaften von Fertigungserzeugnissen 12 erfasst. Es ist möglich, dass der die Fertigungsmaschine 11 steuernde Aktor 10 abhängig von den ermittelten Eigenschaften des Fertigungserzeugnisses 12 angesteuert wird, damit die Fertigungsmaschine 11 entsprechend einen nachfolgenden Bearbeitungsschritt dieses Fertigungserzeugnisses 12 ausführt. Es ist auch möglich, dass der Sensor 30 die Eigenschaften des von der Fertigungsmaschine 11 bearbeiteten Fertigungserzeugnisses 12 ermittelt, und abhängig davon eine Ansteuerung der Fertigungsmaschine 11 für ein nachfolgendes Fertigungserzeugnis anpasst.
-
4 zeigt ein Ausführungsbeispiel, bei dem das Steuerungssystem 40 zur Steuerung eines persönlichen Assistenten 250 eingesetzt wird. Der Sensor 30 ist bevorzugt ein akustischer Sensor, der Sprachsignale eines Nutzers 249 empfängt. Alternativ oder zusätzlich kann der Sensor 30 auch eingerichtet sein, optische Signale zu empfangen, beispielsweise Videobilder einer Geste des Nutzers 249.
-
Abhängig von den Signalen des Sensors 30 ermittelt das Steuerungssystem 40 ein Ansteuersignal A des persönlichen Assistenten 250, beispielsweise, indem das maschinelle Lernsystem eine Gestenerkennung durchführt. Dem persönlichen Assistenten 250 wird dann dieses ermittelte Ansteuersignal A übermittelt und er somit entsprechend angesteuert. Dieses ermittelte Ansteuersignal A ist kann insbesondere derart gewählt werden, dass es einer vermuteten gewünschten Ansteuerung durch den Nutzer 249 entspricht. Diese vermutete gewünschte Ansteuerung kann abhängig von der vom maschinellen Lernsystem 60 erkannten Geste ermittelt werden. Das Steuerungssystem 40 kann dann abhängig von der vermuteten gewünschten Ansteuerung das Ansteuersignal A zur Übermittlung an den persönlichen Assistenten 250 wählen und/oder das Ansteuersignal A zur Übermittlung an den persönlichen Assistenten entsprechend der vermuteten gewünschten Ansteuerung 250 wählen.
-
Diese entsprechende Ansteuerung kann beispielsweise beinhalten, dass der persönliche Assistent 250 Informationen aus einer Datenbank abruft und sie für den Nutzer 249 rezipierbar wiedergibt.
-
Anstelle des persönlichen Assistenten 250 kann auch ein Haushaltsgerät (nicht abgebildet), insbesondere eine Waschmaschine, ein Herd, ein Backofen, eine Mikrowelle oder eine Spülmaschine vorgesehen sein, um entsprechend angesteuert zu werden.
-
5 zeigt ein Ausführungsbeispiel, bei dem das Steuerungssystem 40 zur Steuerung eines Zugangssystems 300 eingesetzt wird. Das Zugangssystem 300 kann eine physische Zugangskontrolle, beispielsweise eine Tür 401 umfassen.
-
Bei dem Sensor 30 kann es sich beispielsweise um einen optischen Sensor (beispielsweise zur Erfassung von Bild- oder Videodaten) handeln, der eingerichtet ist, ein Gesicht zu erfassen. Mittels des maschinellen Lernsystems 60 kann dieses erfasste Bild interpretiert werden. Beispielsweise kann die Identität einer Person ermittelt werden. Der Aktor 10 kann ein Schloss sein, dass abhängig vom Ansteuersignal A die Zugangskontrolle freigibt, oder nicht, beispielsweise die Tür 401 öffnet, oder nicht. Hierzu kann das Ansteuersignal A abhängig von der der Interpretation des maschinellen Lernsystems 60 gewählt werden, beispielsweise abhängig von der ermittelten Identität der Person. An Stelle der physischen Zugangskontrolle kann auch eine logische Zugangskontrolle vorgesehen sein.
-
6 zeigt ein Ausführungsbeispiel, bei dem das Steuerungssystem 40 zur Steuerung eines Überwachungssystems 400 verwendet wird. Von dem in 5 dargestellten Ausführungsbeispiel unterscheidet sich dieses Ausführungsbeispiel dadurch, dass an Stelle des Aktors 10 die Anzeigeeinheit 10a vorgesehen ist, die vom Steuerungssystem 40 angesteuert wird. Beispielsweise kann vom maschinellen Lernsystem 60 ermittelt werden, ob ein vom optischen Sensor aufgenommener Gegenstand verdächtig ist, und das Ansteuersignal A dann derart gewählt werden, dass dieser Gegenstand von der Anzeigeeinheit 10a farblich hervorgehoben dargestellt wird.
-
7 zeigt ein Ausführungsbeispiel, bei dem das Steuerungssystem 40 zur Steuerung eines medizinischen bildgebenden System 500, beispielsweise eines MRT-, Röntgen- oder Ultraschallgeräts, verwendet wird. Der Sensor 30 kann beispielsweise durch einen bildgebenden Sensor gegeben sein, durch das Steuerungssystem 40 wird die Anzeigeeinheit 10a angesteuert. Beispielsweise kann vom maschinellen Lernsystem 60 ermittelt werden, ob ein vom bildgebenden Sensor aufgenommener Bereich auffällig ist, und das Ansteuersignal A dann derart gewählt werden, dass dieser Bereich von der Anzeigeeinheit 10a farblich hervorgehoben dargestellt wird.
-
8 zeigt schematisch ein Ausführungsbeispiel eines Trainingssystems 140 zum Trainieren des maschinellen Lernsystems 60. Eine Trainingsdateneinheit 150 ermittelt geeignete Eingangsgrößen x, die dem maschinellen Lernsystem 60 zugeführt werden. Beispielsweise greift die Trainingsdateneinheit 150 auf eine computerimplementierte Datenbank Q zu, in dem ein Satz von Trainingsdaten gespeichert ist, und wählt z.B. zufällig aus dem Satz von Trainingsdaten Eingangsgrößen x aus. Ferner ermittelt die Trainingsdateneinheit 150 auch zu den Eingangsgrößen x zugeordnete gewünschte Ausgangsgrößen ys , die einer Bewertungseinheit 180 zugeführt werden.
-
Das künstliche neuronale Netz x ist eingerichtet, aus den ihm zugeführten Eingangsgrößen x zugehörige Ausgangsgrößen y zu ermitteln. Diese Ausgangsgrößen y werden der Bewertungseinheit 180 zugeführt.
-
Eine Modifikationseinheit 160 ermittelt z.B. mit dem in 9 illustrierten Verfahren neue Parameter θ' und führt diese dem Parameterspeicher P zu, wo sie die Parameter θ ersetzen. Die Modifikationseinheit 160 ermittelt z.B. mit dem in 9 illustrierten Verfahren neue gewünschte Ausgangsgrößen ys' und führt diese der Datenbank Q zu.
-
Die Bewertungseinheit
180 kann beispielsweise mittels einer von den Ausgangsgrößen
y und den gewünschten Ausgangsgrößen
ys abhängigen Kostenfunktion (Englisch: loss function) die Kenngröße
ermitteln, die eine Leistungsfähigkeit des maschinellen Lernsystems
60 charakterisiert. Die Parameter
θ können abhängig von der Kenngröße
optimiert werden.
-
In weiteren bevorzugten Ausführungsformen umfasst das Trainingssystem 140 eine Ein- oder Mehrzahl von Prozessoren 145 und wenigstens ein maschinenlesbares Speichermedium 146, auf dem Anweisungen gespeichert sind, die dann, wenn sie auf den Prozessoren 145 ausgeführt werden, das Steuerungssystem 140 veranlassen, das erfindungsgemäße Verfahren auszuführen.
-
9 zeigt in einem Flussdiagramm den Ablauf eines Verfahrens zum automatisierten Labeln der Trainingsdaten gemäß einer Ausführungsform, bei der das maschinelle Lernsystem (60) durch ein neuronales Netz gegeben ist.
-
Zunächst (1000) werden die gewünschten Ausgangsgrößen ys der Trainingsdaten zufällig gewählt, den Eingangsgrößen x der Trainingsdaten zugeordnet und in der Datenbank Q gespeichert.
-
Dann (1100) wird das maschinelle Lernsystem (60) für eine vorgebbare Anzahl von Schritten mit den so gewählten Trainingsdaten trainiert. Optional werden die hierbei ermittelten neuen Parameter θ' vorzugsweise mit einer L1-Regularisierung regularisiert. Diese Regularisierung hat den Vorteil, dass sie es dem maschinellen Lernsystem (60) erschwert, zufällig gewählte Daten zu lernen. Dies ermöglicht mit Fortschritt des Trainings eine bessere Trennung der Daten. Diese neuen Parameter θ' werden im Parameterspeicher P hinterlegt.
-
Dann (1200) wird für jede Eingangsgröße x der Trainingsdaten die in 11 illustrierte Zwischengröße z, also der Ausgangsgröße einer k-ten Schicht des maschinellen Lernsystems (60), ermittelt. k ist hierbei eine fest vorgebbare Zahl, die für alle Eingangsgrößen x gleich gewählt ist.
-
Anschließend (1300) werden die so ermittelten Zwischengrößen z mittels eines Clusterverfahrens gruppiert, welches in metrischen Räumen Daten clustern kann. Beispielsweise kann ein k-means-Verfahren mit einem üblichen Abstandsmaß (L2, L1 oder Cosinus) verwendet werden. Auch ein spektrales Clusterverfahren ist möglich. Jede Zwischengröße z wird so genau einer Gruppe einer Mehrzahl von Gruppen zugeordnet. Diese werden durchnummeriert, d.h. jeder Gruppe wird eine Nummer n zugeordnet.
-
Dass das Clusterverfahren auf die Zwischengrößen z angewendet wird, hat gegenüber einer Anwendung auf Eingangsgrößen x den Vorteil, dass der Raum, in den die Mannigfaltigkeit der tatsächlichen Zwischengrößen z eingebettet ist, niedrigdimensionaler ist, wodurch diese Mannigfaltigkeit flacher wird. Dies führt dazu, dass das Clusterverfahren für die Zwischengröße z zuverlässigere Ergebnisse liefert.
-
Nun (1400) wird für jede Eingangsgröße x in den Trainingsdaten die neue gewünschte Ausgangsgröße ys' gleich der Nummer n gesetzt, die der Gruppe entspricht, der diejenige Zwischengröße z, die sich aus der jeweiligen Eingangsgröße x ergeben hatte, zugeordnet wurde. Die so ermittelten neuen gewünschten Ausgangsgrößen ys' werden in der Datenbank Q gespeichert.
-
Nun wird überprüft (1500), ob eine Abbruchbedingung erfüllt ist (z.B. eine vorgebbare Anzahl von Durchläufen der Verfahrensschritte durchlaufen wurde). Ist diese Abbruchbedingung nicht erfüllt, werden optional die Parameter des Trainingsverfahrens (z.B. eine Schrittweite) angepasst und zurückverzweigt zu Schritt (1100). Andernfalls (1600) endet das Verfahren mit den so ermittelten Parametern θ = θ' und den so ermittelten gewünschten Ausgangsgrößen ys = ys'.
-
10 zeigt den Ablauf des Verfahrens zum Betreiben des maschinellen Lernsystems 60. Das maschinelle Lernsystem 60 empfängt (2000) Eingangsdaten x und ermittelt mit Hilfe der Parameter θ zugehörige Ausgangsdaten y. Abhängig von den Ausgangsdaten y können Ansteuersignale A ermittelt werden (2100). Damit endet das Verfahren.
-
11 zeigt schematisch den Aufbau des maschinellen Lernsystem 60, im Ausführungsbeispiel eines tiefen neuronalen Netzes mit einer Mehrzahl von N vielen Schichten S1 ... SN . Die Eingangsgröße x wird einer ersten Schicht S1 zugeführt. Jede Schicht Sr ermittelt aus der ihr zugeführten Eingangsgröße eine Ausgangsgröße, die der nachfolgenden Schicht Sr+1 zugeführt wird (Skip-Verbindungen und rekurrente Verbindungen sind natürlich auch möglich). Solche Ausgangsgrößen werden üblicherweise auch mit dem englischen Wort feature map bezeichnet. Die letzte Schicht SN , welche oftmals durch eine argmax Funktion gegeben ist, ermittelt die Ausgangsgröße y des maschinellen Lernsystems 60. Die Ausgangsgröße der k-ten Schicht ist die Zwischengröße z.
-
Es versteht sich, dass die Verfahren nicht nur wie beschrieben vollständig in Software implementiert sein können. Sie können auch in Hardware implementiert sein, oder in einer Mischform aus Software und Hardware.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-