WO2020173700A1

WO2020173700A1 - Verfahren und vorrichtung zum betreiben eines steuerungssystems

Info

Publication number: WO2020173700A1
Application number: PCT/EP2020/053536
Authority: WO
Inventors: Konrad Groh
Original assignee: Robert Bosch Gmbh
Priority date: 2019-02-25
Filing date: 2020-02-12
Publication date: 2020-09-03
Also published as: DE102019202523A1

Abstract

Verfahren zum Ermitteln einer Zuverlässigkeit einer Klassifikation von Eingangssignalen (x) mittels eines maschinellen Lernsystems (60), insbesondere eines neuronalen Netzes, welches eingerichtet ist, aus Eingangssignalen (x) jeweils eine zugehörige Klasse einer Mehrzahl von Klassen zu ermitteln, wobei das maschinelle Lern System (60) eingerichtet ist, jeder der Klassen einen Klassifizierungswert (p) zuzuordnen, wobei als zugehörige Klassifikation diejenige Klasse ermittelt wird, deren zugeordneter Klassifizierungswert (p) am höchsten ist, und wobei ein Zuverlässigkeitswert ermittelt wird, der eine Zuverlässigkeit der Klassifikation charakterisiert, dadurch gekennzeichnet, dass der Zuverlässigkeitswert abhängig von den zwei höchsten der ermittelten Klassifizierungswerte (p ₁,p ₂) ermittelt wird.

Description

Beschreibung

Titel

Verfahren und Vorrichtung zum Betreiben eines Steuern ngssystems

Die Erfindung betrifft ein Verfahren zum Ermitteln einer Zuverlässigkeit von Klas sifikationen von Sensorsignalen, ein Verfahren zum Bereitstellen eines Ansteue- rungssignales eines Aktors, ein Steuerungssystem, Computerprogramm und ein maschinenlesbares Speichermedium.

Stand der Technik

Aus der nicht vorveröffentlichten DE 10 2018 209 595 ist ein Verfahren zum Er mitteln eines Straßenzustands eines Kraftfahrzeugs bekannt, wobei abhängig von ersten Eingangsgrößen eines ersten Sensorsystems und abhängig von zwei ten Eingangsgrößen eines zweiten Sensorsystems mittels eines verteilten ma schinellen Lernsystems, insbesondere eines verteilten neuronalen Netzes, eine den Straßenzustand charakterisierende Größe ermittelt wird.

Vorteile der Erfindung

Bei hochautomatisiert fahrenden Fahrzeugen können Bilder, die Umfeldsensorik des Fahrzeugs - beispielsweise Video- oder Radarsensoren - liefert, mittels Klassifikatoren analysiert werden. Ein solcher Klassifikator kann beispielsweise durch ein tiefes neuronales Netz gegeben sein. Um die Sicherheit des hochauto matisierten Fahrens zu verbessern, ist es wichtig, die Zuverlässigkeit der erhalte nen Klassifikationen zu kennen, um ggf. Gegenmaßnahmen ergreifen zu können.

Das Verfahren mit den Merkmalen des Anspruch 1 stellt eine solche Zuverlässig keit einer Klassifikation bereit, wodurch der Betrieb eines Systems, das abhängig von dieser ermittelten Klassifikation angesteuert wird, besonders zuverlässig ge staltet werden kann.

Weitere Aspekte der Erfindung sind Gegenstand der nebengeordneten Ansprü che. Vorteilhafte Weiterbildungen sind Gegenstand der abhängigen Ansprüche.

Offenbarung der Erfindung

In einem ersten Aspekt betrifft die Erfindung daher ein Verfahren zum Ermitteln einer Zuverlässigkeit einer Klassifikation von Eingangssignalen, welche insbe sondere abhängig von Ausgangssignalen eines Sensors ermittelt wurden, mittels eines maschinellen Lernsystems, insbesondere eines neuronalen Netzes. Dieses ist eingerichtet, aus Eingangssignalen jeweils eine zugehörige Klasse einer Mehrzahl von Klassen zu ermitteln, wobei das maschinelle Lernsystem einge richtet ist, jeder der Klassen einen Klassifizierungswert zuzuordnen, wobei als zugehörige Klassifikation diejenige Klasse ermittelt wird, deren zugeordneter Klassifizierungswert am höchsten ist, und wobei ein Zuverlässigkeitswert ermittelt wird, der eine Zuverlässigkeit der Klassifikation charakterisiert, wobei der Zuver lässigkeitswert abhängig von den zwei höchsten der ermittelten Klassifizierungs werte (pi, p₂) ermittelt wird.

Die Klassifizierungswerte können durch eine entsprechende Normierungsfunk tion derart auf Werte im Bereich zwischen 0 und 1 beschränkt werden, dass die Summe über alle Klassifizierungswerte 1 ergibt. Die Klassifizierungswerte wer den daher typischerweise auch Logit-Werte genannt. Zwar ist bekannt, dass diese Klassifizierungswerte im Allgemeinen nicht mit Wahrscheinlichkeiten einer Klassenzugehörigkeit des Eingangssignals gleichgesetzt werden können. Den noch hat sich gezeigt, dass die Robustheit der Klassifikation dadurch beschrie ben werden kann, wie groß die relative Größe des zweitgrößten Klassifizierungs werts p₂ zum größten Klassifizierungswert p₁ ist.

Mathematischer kann dies z.B. bei künstlichen neuronalen Netzen als maschinel les Lernsystem wie folgt ausgedrückt werden: Um eine Klassifikationsaufgabe zu lösen, also die Zuordnung von Eingangssignalen x eines Eingangsraums X = M^d zu einer Klasse y aus einer Anzahl k vieler Klassen. Diese Zuordnung erfolgt z.B. mittels einer Funktion /: M^d - M^fe, wobei M^fe ein euklidischer Raum ist. Die Komponenten von /(x) entsprechen jeweils einer der Klassen und sind gegeben durch die Klassifizierungswerte, die charakterisieren, ob die zugehörige Klasse y eine richtige Klassifikation des Eingangssignals x ist. Um das Eingangssignals x einer bestimmten Klasse zuzuordnen, kann eine argmax- Funktion verwendet werden. Die argmax- Funktion gibt die Koordinate des maximalen Werts von f aus, das heißt y = iV(x) = argma x/(x) .

Diese relative Größe kann beispielsweise durch eine Differenz p₁— p₂ gegeben sein. Es ist dann möglich, zu entscheiden, ob eine Klassifikation zuverlässig ist oder nicht. In einer besonders einfachen Ausgestaltung kann vorgesehen sein, dass genau dann, auf eine zuverlässige Zuordnung entschieden wird, wenn die Differenz ( p_t— p₂) größer ist als ein vorgebbarer Schwellwert (D).

Trainingsdaten umfassen eine Mehrzahl von Trainingspunkten (x_T,y_T), die Paare beispielhafter Eingangsdaten x_T und zugehöriger gewünschter Klassifikation bzw. Soll- Klassifikationen y_T sind. Falls die Klassifikation N(x_T) des maschinel len Lernsystems korrekt ist, ist der Wert der i-ten Koordinate von f(x_T ) der größte der Werte. Das heißt, es gilt f(x_T) > f(xr _j für alle j i .

Dieser vorgebbare Schwellwert (D) kann vorzugsweise derart ermittelt werden, dass das maschinelle Lernsystem auf einem nicht korrekt gelabelten Trainings datensatz ( X_r ) umfassend Paare aus Eingangssignalen und zugehörigen Soll- Klassifikationen trainiert wird. Der vorgebbare Schwellwert (D) kann dann abhän gig von Ausgabewerten des maschinelle Lernsystems ermittelt werden, die sich ergeben, wenn dem maschinellen Lernsystem Eingangssignale des Trainingsda tensatzes (. X_r ) zur Klassifikation zugeführt werden. Das heißt mit anderen Wor ten, dass dieser nicht korrekt gelabelte Trainingsdatensatz Teil der Trainingsda ten ist, mit denen das maschinelle Lernsystem trainiert wurde.

Es wurde erkannt, dass dieser nicht korrekt gelabelte Trainingsdatensatz Infor mationen über die Generalisierungsfähigkeit des maschinellen Lernsystems ent hält, da er die Neigung einer Überanpassung des maschinellen Lernsystems an die Trainingsdaten charakterisiert. Vorzugsweise werden die Soll-Klassifikationen des nicht korrekt gelabelten Trai ningsdatensatzes ( X_r ) zufällig gewählt sind.„Zufällig gewählt“ kann hierbei wie üblich bedeuten, dass die Soll- Klassifikation abhängig von einer echten Zufalls zahl oder abhängig von einer Pseudozufallszahl gewählt ist. D.h. die Eingangs daten ( x_T ) werden übernommen und die jeweils zugeordneten Soll- Klassifikatio nen ( y_T ) werden zufällig gewählt.

Um statistische Eigenschaften des Trainingsdatensatzes möglichst wenig zu be einflussen, kann vorgesehen sein, die Soll- Klassifikationen der nicht korrekt gela belten Trainingsdaten ( X_r ) durch eine zufällige Permutation der gewünschten Klassifikationen ( y_T ) aus einem Datensatz korrekt gelabelter Trainingsdaten ( X_c ) zu ermitteln.

Alternativ ist es auch möglich, ausgehend von den gewünschten Klassifikationen {y_T) des Datensatzes korrekt gelabelter Trainingsdaten (Z_c), diesen ein zufälliges Rauschen hinzuzufügen, um die Soll- Klassifikation der nicht korrekt gelabelten Trainingsdaten ( X_r ) zu erhalten. Hierdurch ist es in besonders einfacher Weise möglich, den Grad der Unkorrektheit der nicht korrekt gelabelten Trainingsdaten ( X_r ) zu quantifizieren. Beispielsweise kann das Rauschen durch eine Bernoulli- verteilte Zufallsvariable gegeben sein, die bestimmt ob die Klasse des Eingangs signals ( x_T ) gestört werden soll. Die zufällige Klasse kann dann gegebenenfalls mit einer, insbesondere gleichverteilten, Zufallsvariable bestimmt werden.

Vorzugsweise kann der vorgebbare Schwellwert (D) derart gewählt werden, dass er eine Häufigkeitsverteilung von Spannen (m) charakterisiert, die sich ergibt, wenn das maschinelle Lernsystem mit dem Satz nicht korrekt gelabelten Trai ningsdaten ( X_r ) trainiert wird, und die Eingangssignale der nicht korrekt gelabel ten Trainingsdaten ( X_r ) dem maschinellen Lernsystem dann zur Klassifikation zu geführt werden.

Eine Spanne (Englisch: margin) m ist definiert durch m = f(.x_T)i - max/(x_r) . .

j*i

Ist die Spanne positiv, dann ist die Klassifikation korrekt, ist sie negativ so ist die Klassifikation falsch.

Hierbei kann dann der vorgebbare Schwellwert (D) abhängig von einem Span nenschwellwert (m_A) ermittelt wird, wobei dieser Spannenschwellwert (m_A) derart gewählt ist, dass ein vorgebbarer Anteil der Häufigkeitsverteilung größer ist als der Spannenschwellwert (m_A). Dieser vorgebbare Anteil kann beispielsweise als 1/ {Anzahl der Klassen) festgelegt werden, bei 10 Klassen also auf 10%.

In einem weiteren Aspekt kann eines der vorgenannten Verfahren dann Bereit stellen eines Ansteuerungssignals zur Ansteuerung eines Aktors verwendet wer den, das abhängig von einer Klassifikation eines Eingangssignals, die mittels des maschinellen Lernsystems ermittelt wird, gewählt wird. Hierbei wird dann mittels eines der vorgenannten Verfahren ein Zuverlässigkeitswert dieser Klassifikation ermittelt und das Ansteuerungssignal abhängig vom ermittelten Zuverlässigkeits wert gewählt. Beispielsweise kann vorgesehen sein, dass dieser das Ansteue rungssignal derart gewählt wird, dass der Aktor in einem abgesicherten Betriebs modus betrieben wird, wenn entschieden wird, dass Klassifikation nicht zuverläs sig ist, und in einem normalen Betriebsmodus, wenn entschieden wird, dass die Klassifikation zuverlässig ist. Die Entscheidung, ob die Klassifikation zuverlässig ist oder nicht kann beispielsweise abhängig davon erfolgen, ob der ermittelte Zu verlässigkeitswert kleiner als ein vorgebbarer Zuverlässigkeitsschwellwert ist, o- der nicht.

Nachfolgend werden Ausführungsformen der Erfindung unter Bezugnahme auf die beiliegenden Zeichnungen näher erläutert. In den Zeichnungen zeigen:

Figur 1 schematisch einen Aufbau einer Ausführungsform der Erfindung;

Figur 2 schematisch ein Ausführungsbeispiel zur Steuerung eines wenigs tens teilautonomen Roboters;

Figur 3 schematisch ein Ausführungsbeispiel zur Steuerung eines Ferti gungssystems;

Figur 4 schematisch ein Ausführungsbeispiel zur Steuerung eines persönli chen Assistenten;

Figur 5 schematisch ein Ausführungsbeispiel zur Steuerung eines Zugangs systems; Figur 6 schematisch ein Ausführungsbeispiel zur Steuerung eines Überwa chungssystems;

Figur 7 schematisch ein Ausführungsbeispiel zur Steuerung eines medizi nisch bildgebenden Systems;

Figur 8 schematisch einen möglichen Aufbau des maschinellen Lernsystems;

Figur 9 in einem Flussdiagramm einen möglichen Ablauf des Verfahrens zum

Ermitteln des Zuverlässigkeitswerts;

Figur 10 in einem Flussdiagramm den Ablauf eines Verfahrens zum Ermitteln des Schwellwerts.

Beschreibung der Ausführungsbeispiele

Figur 1 zeigt einen Aktor 10 in seiner Umgebung 20 in Interaktion mit einem Steuerungssystem 40. Aktor 10 und Umgebung 20 werden gemeinschaftlich auch als Aktorsystem bezeichnet. In vorzugsweise regelmäßigen zeitlichen Ab ständen wird ein Zustand des Aktorsystems mit einem Sensor 30 erfasst, der auch durch eine Mehrzahl von Sensoren gegeben sein kann. Das Sensorsignal S - bzw. im Fall mehrerer Sensoren je ein Sensorsignal S - des Sensors 30 wird an das Steuerungssystem 40 übermittelt. Das Steuerungssystem 40 empfängt somit eine Folge von Sensorsignalen S. Das Steuerungssystem 40 ermittelt hie raus Ansteuersignale A, welche an den Aktor 10 übertragen werden.

Das Steuerungssystem 40 empfängt die Folge von Sensorsignalen S des Sen sors 30 in einer optionalen Empfangseinheit 50, die die Folge von Sensorsigna len S in eine Folge von Eingangssignalen x umwandelt (alternativ kann auch un mittelbar je das Sensorsignal S als Eingangssignal x übernommen werden). Das Eingangssignal x kann beispielsweise ein Ausschnitt oder eine Weiterverarbei tung des Sensorsignals S sein. Das Eingangssignal x kann beispielsweise Bild daten oder Bilder umfassen, oder einzelne Frames einer Videoaufzeichnung. Mit anderen Worten wird Eingangssignal x abhängig von Sensorsignal S ermittelt. Das Eingangssignal x wird einem maschinellen Lernsystem 60, das beispiels weise ein neuronales Netzwerk ist, zugeführt.

Das maschinelle Lernsystem 60 wird vorzugsweise parametriert durch Parameter Q, die in einem Parameterspeicher P hinterlegt sind und von diesem bereitgestellt werden.

Das maschinelle Lernsystem 60 ermittelt aus den Eingangssignalen x Ausgangs signale y. Die Ausgangssignale y werden einer optionalen Umformeinheit 80 zu geführt, die hieraus Ansteuersignale A ermittelt, welche dem Aktor 10 zugeführt werden, um den Aktor 10 entsprechend anzusteuern. Das Ausgangssignal y um fasst hierbei mindestens eine Klassifikation des Eingangssignals x, wobei auch eine semantische Segmentierung möglich ist, bei der einzelnen Segmenten des Eingangssignals x jeweils eine Klasse zugeordnet wird.

Zur Ermittlung der Klassifizierung ermittelt das maschinelle Lernsystem zu jeder der möglichen Klassen Klassifizierungswerte, wie unten im Zusammenhang mit Figur 8 noch einmal ausführlich diskutiert. Die größten beiden dieser Klassifizie rungswerte, p₁ und p₂, werden ebenfalls der Umformeinheit 80 zugeführt, und bei der Ermittlung des Ansteuersignals A berücksichtigt.

Der Aktor 10 empfängt die Ansteuersignale A, wird entsprechend angesteuert und führt eine entsprechende Aktion aus. Der Aktor 10 kann hierbei eine (nicht notwendigerweise baulich integrierte) Ansteuerlogik umfassen, welches aus dem Ansteuersignal A ein zweites Ansteuersignal ermittelt, mit dem dann der Aktor 10 angesteuert wird.

In weiteren Ausführungsformen umfasst das Steuerungssystem 40 den Sensor 30. In noch weiteren Ausführungsformen umfasst das Steuerungssystem 40 al ternativ oder zusätzlich auch den Aktor 10.

In weiteren bevorzugten Ausführungsformen umfasst das Steuerungssystem 40 eine Ein- oder Mehrzahl von Prozessoren 45 und wenigstens ein maschinenles bares Speichermedium 46, auf dem Anweisungen gespeichert sind, die dann, wenn sie auf den Prozessoren 45 ausgeführt werden, das Steuerungssystem 40 veranlassen, das erfindungsgemäße Verfahren auszuführen.

In alternativen Ausführungsformen ist alternativ oder zusätzlich zum Aktor 10 eine Anzeigeeinheit 10a vorgesehen.

Figur 2 zeigt ein Ausführungsbeispiel, in dem das Steuerungssystem 40 zur Steuerung eines wenigstens teilautonomen Roboters, hier eines wenigstens teil autonomen Kraftfahrzeugs 100, eingesetzt wird.

Bei dem Sensor 30 kann es sich beispielsweise um einen oder mehrere vorzugs weise im Kraftfahrzeug 100 angeordnete Videosensoren und/oder einen oder mehrere Radarsensoren und/oder einen oder mehrere Ultraschallsensoren und/oder einen oder mehrere LiDAR-Sensoren und/oder einen oder mehrere Po sitionssensoren (beispielsweise GPS) handeln. Alternativ oder zusätzlich kann der Sensor 30 auch ein Informationssystem umfassen, das eine Information über einen Zustand des Aktorsystems ermittelt, wie beispielsweise ein Wetterinforma tionssystem, das einen aktuellen oder zukünftigen Zustand des Wetters in der Umgebung 20 ermittelt.

Das maschinelle Lernsystem 60 kann aus den Eingangsdaten x beispielsweise Gegenstände in der Umgebung des wenigstens teilautonomen Roboters detek- tieren. Bei dem Ausgangssignal y kann es sich um eine Information handeln, die charakterisiert, wo in der Umgebung des wenigstens teilautonomen Roboters Gegenstände vorhanden sind. Das Ausgangssignal A kann dann abhängig von dieser Information und/oder entsprechend dieser Information ermittelt werden.

Bei dem vorzugsweise im Kraftfahrzeug 100 angeordneten Aktor 10 kann es sich beispielsweise um eine Bremse, einen Antrieb oder eine Lenkung des Kraftfahr zeugs 100 handeln. Das Ansteuersignal A kann dann derart ermittelt werden, dass der Aktor oder die Aktoren 10 derart angesteuert wird, dass das Kraftfahr zeug 100 beispielsweise eine Kollision mit den vom maschinellen Lernsystem 60 identifizierten Gegenständen verhindert, insbesondere, wenn es sich um Gegen stände bestimmter Klassen, z.B. um Fußgänger, handelt. Mit anderen Worten kann Ansteuersignal A abhängig von der ermittelten Klasse und/oder entspre chend der ermittelten Klasse ermittelt werden.

Alternativ kann es sich bei dem wenigstens teilautonomen Roboter auch um ei nen anderen mobilen Roboter (nicht abgebildet) handeln, beispielsweise um ei nen solchen, der sich durch Fliegen, Schwimmen, Tauchen oder Schreiten fort bewegt. Bei dem mobilen Roboter kann es sich beispielsweise auch um einen wenigstens teilautonomen Rasenmäher oder einen wenigstens teilautonomen Putzroboter handeln. Auch in diesen Fällen kann das Ansteuersignal A derart er mittelt werden, dass Antrieb und/oder Lenkung des mobilen Roboters derart an gesteuert werden, dass der wenigstens teilautonome Roboter beispielsweise eine Kollision mit den vom maschinellen Lernsystem 60 identifizierten Gegen ständen verhindert,

In einer weiteren Alternative kann es sich bei dem wenigstens teilautonomen Ro boter auch um einen Gartenroboter (nicht abgebildet) handeln, der mit einem bildgebenden Sensor 30 und dem maschinellen Lernsystem 60 eine Art oder ei nen Zustand von Pflanzen in der Umgebung 20 ermittelt. Bei dem Aktor 10 kann es sich dann beispielsweise um einen Applikator von Chemikalien handeln. Das Ansteuersignal A kann abhängig von der ermittelten Art oder vom ermittelten Zu stand der Pflanzen derart ermittelt werden, dass eine der ermittelten Art oder dem ermittelten Zustand entsprechende Menge der Chemikalien aufgebracht wird.

In noch weiteren Alternativen kann es sich bei dem wenigstens teilautonomen Roboter auch um ein Haushaltsgerät (nicht abgebildet), insbesondere eine Waschmaschine, einen Herd, einen Backofen, eine Mikrowelle oder eine Spül maschine handeln. Mit dem Sensor 30, beispielsweise einem optischen Sensor, kann ein Zustand eines mit dem Haushaltsgerät behandelten Objekts erfasst werden, beispielsweise im Falle der Waschmaschine ein Zustand von Wäsche, die in der Waschmaschine befindlich ist. Mit dem maschinellen Lernsystem 60 kann dann eine Art oder ein Zustand dieses Objekts ermittelt und vom Ausgangs signal y charakterisiert werden. Das Ansteuersignal A kann dann derart ermittelt werden, dass das Haushaltsgerät abhängig von der ermittelten Art oder dem er mittelten Zustand des Objekts angesteuert wird. Beispielsweise kann im Falle der Waschmaschine diese abhängig davon angesteuert werden, aus welchem Mate rial die darin befindliche Wäsche ist. Ansteuersignal A kann dann abhängig da von gewählt werden, welches Material der Wäsche ermittelt wurde.

Figur 3 zeigt ein Ausführungsbeispiel, in dem das Steuerungssystem 40 zur An steuerung einer Fertigungsmaschine 11 eines Fertigungssystems 200 verwendet wird, indem ein diese Fertigungsmaschine 11 steuernder Aktor 10 angesteuert wird. Bei der Fertigungsmaschine 11 kann es sich beispielsweise um eine Ma schine zum Stanzen, Sägen, Bohren und/oder Schneiden handeln.

Bei dem Sensor 30 dann beispielsweise um einen optischen Sensor handeln, der z.B. Eigenschaften von Fertigungserzeugnissen 12 erfasst. Es ist möglich, dass der die Fertigungsmaschine 11 steuernde Aktor 10 abhängig von den ermittelten Eigenschaften des Fertigungserzeugnisses 12 angesteuert wird, damit die Ferti gungsmaschine 11 entsprechend einen nachfolgenden Bearbeitungsschritt die ses Fertigungserzeugnisses 12 ausführt. Es ist auch möglich, dass der Sensor 30 die Eigenschaften des von der Fertigungsmaschine 11 bearbeiteten Ferti gungserzeugnisses 12 ermittelt, und abhängig davon eine Ansteuerung der Ferti gungsmaschine 11 für ein nachfolgendes Fertigungserzeugnis anpasst.

Figur 4 zeigt ein Ausführungsbeispiel, bei dem das Steuerungssystem 40 zur Steuerung eines persönlichen Assistenten 250 eingesetzt wird. Der Sensor 30 ist bevorzugt ein akustischer Sensor, der Sprachsignale eines Nutzers 249 emp fängt. Alternativ oder zusätzlich kann der Sensor 30 auch eingerichtet sein, opti sche Signale zu empfangen, beispielsweise Videobilder einer Geste des Nutzers 249.

Abhängig von den Signalen des Sensors 30 ermittelt das Steuerungssystem 40 ein Ansteuersignal A des persönlichen Assistenten 250, beispielsweise, indem das maschinelle Lernsystem eine Gestenerkennung durchführt. Dem persönli chen Assistenten 250 wird dann dieses ermittelte Ansteuersignal A übermittelt und er somit entsprechend angesteuert. Dieses ermittelte Ansteuersignal A ist kann insbesondere derart gewählt werden, dass es einer vermuteten gewünsch ten Ansteuerung durch den Nutzer 249 entspricht. Diese vermutete gewünschte Ansteuerung kann abhängig von der vom maschinellen Lernsystem 60 erkannten Geste ermittelt werden. Das Steuerungssystem 40 kann dann abhängig von der vermuteten gewünschten Ansteuerung das Ansteuersignal A zur Übermittlung an den persönlichen Assistenten 250 wählen und/oder das Ansteuersignal A zur Übermittlung an den persönlichen Assistenten entsprechend der vermuteten ge wünschten Ansteuerung 250 wählen.

Diese entsprechende Ansteuerung kann beispielsweise beinhalten, dass der per sönliche Assistent 250 Informationen aus einer Datenbank abruft und sie für den Nutzer 249 rezipierbar wiedergibt.

Anstelle des persönlichen Assistenten 250 kann auch ein Haushaltsgerät (nicht abgebildet), insbesondere eine Waschmaschine, ein Herd, ein Backofen, eine Mikrowelle oder eine Spülmaschine vorgesehen sein, um entsprechend ange steuert zu werden.

Figur 5 zeigt ein Ausführungsbeispiel, bei dem das Steuerungssystem 40 zur Steuerung eines Zugangssystems 300 eingesetzt wird. Das Zugangssystem 300 kann eine physische Zugangskontrolle, beispielsweise eine Tür 401 umfassen. Bei dem Sensor 30 kann es sich beispielsweise um einen optischen Sensor (bei spielsweise zur Erfassung von Bild- oder Videodaten) handeln, der eingerichtet ist, ein Gesicht zu erfassen. Mittels des maschinellen Lernsystems 60 kann die ses erfasste Bild interpretiert werden. Beispielsweise kann die Identität einer Per son ermittelt werden. Der Aktor 10 kann ein Schloss sein, dass abhängig vom Ansteuersignal A die Zugangskontrolle freigibt, oder nicht, beispielsweise die Tür 401 öffnet, oder nicht. Hierzu kann das Ansteuersignal A abhängig von der der Interpretation des maschinellen Lernsystems 60 gewählt werden, beispielsweise abhängig von der ermittelten Identität der Person. An Stelle der physischen Zu gangskontrolle kann auch eine logische Zugangskontrolle vorgesehen sein.

Figur 6 zeigt ein Ausführungsbeispiel, bei dem das Steuerungssystem 40 zur Steuerung eines Überwachungssystems 400 verwendet wird. Von dem in Figur 5 dargestellten Ausführungsbeispiel unterscheidet sich dieses Ausführungsbeispiel dadurch, dass an Stelle des Aktors 10 die Anzeigeeinheit 10a vorgesehen ist, die vom Steuerungssystem 40 angesteuert wird. Beispielsweise kann vom maschi- nellen Lernsystem 60 ermittelt werden, ob ein vom optischen Sensor aufgenom mener Gegenstand verdächtig ist, und das Ansteuersignal A dann derart gewählt werden, dass dieser Gegenstand von der Anzeigeeinheit 10a farblich hervorge hoben dargestellt wird.

Figur 7 zeigt ein Ausführungsbeispiel, bei dem das Steuerungssystem 40 zur Steuerung eines medizinischen bildgebenden System 500, beispielsweise eines M RT-, Röntgen- oder Ultraschallgeräts, verwendet wird. Der Sensor 30 kann bei spielsweise durch einen bildgebenden Sensor gegeben sein, durch das Steue rungssystem 40 wird die Anzeigeeinheit 10a angesteuert. Beispielsweise kann vom maschinellen Lernsystem 60 ermittelt werden, ob ein vom bildgebenden Sensor aufgenommener Bereich auffällig ist, und das Ansteuersignal A dann der art gewählt werden, dass dieser Bereich von der Anzeigeeinheit 10a farblich her vorgehoben dargestellt wird.

Figur 8 zeigt schematisch einen möglichen Aufbau des maschinellen Lernsys tems 60, das in diesem Fall durch neuronales Netzwerk gegeben ist. Das Ein gangssignal x wird einer Eingangsschicht 61 zugeführt, beispielsweise einer Fal tungsschicht, und dann sukzessive durch das neuronale Netz 60 propagiert, bis es in einer Schicht 62 dazu herangezogen wird, um Klassifizierungswerte p_t, ... p_k zu ermitteln. Diese werden einer argmax-Schicht zugeführt, die diejenige Klasse ermittelt, deren zugehöriger Klassifizierungswert den größten Wert annimmt. Diese Klasse wird als Ausgangssignal y bereitgestellt, ebenso der zugehörige Klassifizierungswert p_lt ebenso wie der zweitgrößte Klassifizierungswert p₂.

Das künstliche neuronale Netz x ist eingerichtet, aus den ihm zugeführten Ein gangssignalen x zugehörige Ausgangssignale y zu ermitteln. Diese Ausgangssig nale y werden der Bewertungseinheit 180 zugeführt.

Figur 9 zeigt in einem Flussdiagramm den Ablauf eines Verfahrens zum Ermitteln des Zuverlässigkeitswerts. Zunächst (1000) wird ein Eingangssignal x dem ma schinellen Lernsystem 60 zugeführt, und zugehöriges Ausgangssignal y sowie zugehöriger größter Klassifizierungswert p₁ und zugehöriger zweitgrößter Klassi fizierungswert p₂ werden ermittelt. Dann (1100) wird die Differenz p₁— p₂ des größten minus des zweitgrößten Klassifizierungswerts ermittelt und verglichen, ob diese Differenz größer ist als der vorgebbare Schwellwert D. Ist dies der Fall (1200), wird entschieden, dass die Klassifikation zuverlässig ist, und der Zuver lässigkeitswert wird auf den Wert„1“ gesetzt. Beispielsweise kann das Ansteuer signal A dann derart gewählt werden, dass Aktor 10 in einem Normalmodus be trieben wird. Ist dies hingegen nicht der Fall (1300), wird entschieden, dass die Klassifikation nicht zuverlässig ist, und der Zuverlässigkeitswert wird auf den Wert„0“ gesetzt. Beispielsweise kann das Ansteuersignal A dann derart gewählt werden, dass Aktor 10 in einem abgesicherten Modus betrieben wird, beispiels weise mit reduzierter Dynamik. Damit endet dieses Verfahren.

Figur 10 illustriert in einem Flussdiagramm den Ablauf eines Verfahrens zum Er mitteln des Schwellwerts D. Zunächst (2000) wird das maschinelle Lernsystem 60 mit einem Trainingsdatensatz X_r mit zufällig gewählten Soll- Klassifikationen trai niert. Dann (2100) werden die optional die Gewichte des maschinellen Lernsys tems 60 normalisiert. Anschließend (2200) werden die Spannen m ermittelt, die sich für alle Eingangssignale des Trainingsdatensatz X_r ergeben. Dann (2300) wird der Spannenschwellwert m_A so gewählt, dass ein vorgebbarer Anteil der er mittelten Schwellen m größer ist als der Spannenschwellwert m_A und die übrigen ermittelten Schwellen m kleiner. Anschließend (2400) wird der Schwellwert (D) gleich einem vorgebbaren Faktor mal dem Spannenschwellwert m_A gewählt, wo bei dieser Faktor beispielsweise den Wert eins annimmt. Damit endet dieses Ver fahren.

Der Begriff„Computer“ umfasst beliebige Geräte zur Abarbeitung vorgebbarer Rechenvorschriften. Diese Rechenvorschriften können in Form von Software vor liegen, oder in Form von Hardware, oder auch in einer Mischform aus Software und Hardware.

Es versteht sich ferner, dass die Verfahren nicht nur wie beschrieben vollständig in Software implementiert sein können. Sie können auch in Hardware implemen tiert sein, oder in einer Mischform aus Software und Hardware.

Claims

Ansprüche

1. Verfahren zum Ermitteln einer Zuverlässigkeit einer Klassifikation von Ein gangssignalen (x) mittels eines maschinellen Lernsystems (60), insbeson dere eines neuronalen Netzes, welches eingerichtet ist, aus Eingangssigna len (x) jeweils eine zugehörige Klasse einer Mehrzahl von Klassen zu ermit teln, wobei das maschinelle Lernsystem (60) eingerichtet ist, jeder der Klas sen einen Klassifizierungswert (p) zuzuordnen, wobei als zugehörige Klassi fikation diejenige Klasse ermittelt wird, deren zugeordneter Klassifizierungs wert (p) am höchsten ist, und wobei ein Zuverlässigkeitswert ermittelt wird, der eine Zuverlässigkeit der Klassifikation charakterisiert,

dadurch gekennzeichnet, dass der Zuverlässigkeitswert abhängig von den zwei höchsten der ermittelten Klassifizierungswerte (r_1;r₂) ermittelt wird.

2. Verfahren nach Anspruch 1, wobei die Zuverlässigkeit abhängig von einer Differenz p₁— p₂ zwischen dem höchsten (p und dem zweithöchsten (p₂) dieser Klassifizierungswerte.

3. Verfahren nach Anspruch 2, wobei dann, insbesondere genau dann, auf eine zuverlässige Klassifikation entschieden wird, wenn die Differenz (p_t— p₂) größer ist als ein vorgebbarer Schwellwert (D).

4. Verfahren nach Anspruch 3, wobei der vorgebbare Schwellwert (D) abhängig von Ausgabewerten des maschinelle Lernsystems (60) auf einem nicht kor rekt gelabelten Trainingsdatensatz ( X_r ) ermittelt wird, mit dem das maschi nelle Lernsystem (60) trainiert wurde.

5. Verfahren nach Anspruch 4, wobei Soll- Klassifikationen des nicht korrekt ge labelten Trainingsdatensatzes ( X_r ) zufällig gewählt sind.

6. Verfahren nach Anspruch 5, wobei die gewünschten Klassifikationen (y_r) der nicht korrekt gelabelten Trainingsdaten ( X_r ) durch eine zufällige Permutation der gewünschten Klassifikationen (y_r) aus einem Datensatz korrekt gelabel- ter Trainingsdaten ( X_c ) ermittelt werden.

7. Verfahren nach Anspruch 5, wobei die gewünschten Klassifikationen (y_r) der nicht korrekt gelabelten Trainingsdaten ( X_r ) durch Beaufschlagen der ge wünschten Klassifikationen ( y_T ) aus dem Datensatz korrekt gelabelter Trai ningsdaten ( X_c ) mit einem zufälligen Rauschen erhalten werden.

8. Verfahren nach einem der Ansprüche 4 bis 7, wobei der vorgebbare

Schwellwert (D) eine Häufigkeitsverteilung von Spannen (m) charakterisiert, die sich ergibt, wenn das maschinelle Lernsystem (60) mit einem Satz nicht korrekt gelabelten Trainingsdaten ( X_r ) trainiert wird.

9. Verfahren nach Anspruch 8, wobei der vorgebbare Schwellwert (D) abhängig von einem Spannenschwellwert (m_A) ermittelt wird, wobei dieser Spannen schwellwert (m_A) derart gewählt ist, dass ein vorgebbarer Anteil der Häufig keitsverteilung größer ist als der Spannenschwellwert (m_A).

10. Verfahren zum Bereitstellen eines Ansteuerungssignals (A) zur Ansteuerung eines Aktors (10) abhängig von einer Klassifikation eines Eingangssignals(x) mittels eines maschinellen Lernsystems (60), wobei mittels des Verfahrens nach einem der Ansprüche 1 bis 9 ein Zuverlässigkeitswert dieser Klassifika tion ermittelt wird und das Ansteuerungssignal (A) abhängig vom ermittelten Zuverlässigkeitswert gewählt wird.

11. Steuerungssystem (40) umfassend eine Ein- oder Mehrzahl von Prozesso ren (45) und wenigstens ein maschinenlesbares Speichermedium (46), auf dem Anweisungen gespeichert sind, die dann, wenn sie auf den Prozesso ren (45) ausgeführt werden, das Steuerungssystem (40) veranlassen, das Verfahren nach einem der Ansprüche 1 bis 10 auszuführen.

12. Computerprogramm, das eingerichtet ist, das Verfahren nach einem der An sprüche 1 bis 10 auszuführen.

13. Maschinenlesbares Speichermedium (46, 146), auf dem das Computerpro gramm nach Anspruch 12 gespeichert ist.