WO2020173700A1 - Verfahren und vorrichtung zum betreiben eines steuerungssystems - Google Patents

Verfahren und vorrichtung zum betreiben eines steuerungssystems Download PDF

Info

Publication number
WO2020173700A1
WO2020173700A1 PCT/EP2020/053536 EP2020053536W WO2020173700A1 WO 2020173700 A1 WO2020173700 A1 WO 2020173700A1 EP 2020053536 W EP2020053536 W EP 2020053536W WO 2020173700 A1 WO2020173700 A1 WO 2020173700A1
Authority
WO
WIPO (PCT)
Prior art keywords
classification
determined
machine learning
value
learning system
Prior art date
Application number
PCT/EP2020/053536
Other languages
English (en)
French (fr)
Inventor
Konrad Groh
Original Assignee
Robert Bosch Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch Gmbh filed Critical Robert Bosch Gmbh
Publication of WO2020173700A1 publication Critical patent/WO2020173700A1/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Definitions

  • the invention relates to a method for determining a reliability of classifications of sensor signals, a method for providing a control signal of an actuator, a control system, computer program and a machine-readable storage medium.
  • a method for determining a road condition of a motor vehicle is known, depending on first input variables of a first sensor system and depending on two th input variables of a second sensor system using a distributed machine learning system, in particular a distributed neural network , a variable characterizing the road condition is determined.
  • images provided by the vehicle's surroundings sensors - for example video or radar sensors - can be analyzed using classifiers.
  • a classifier can be given, for example, by a deep neural network.
  • the method with the features of claim 1 provides such a reliability of a classification ready, whereby the operation of a system that depends is controlled by this determined classification, can be designed particularly reliably.
  • the invention therefore relates to a method for determining the reliability of a classification of input signals, which were determined in particular as a function of output signals from a sensor, by means of a machine learning system, in particular a neural network.
  • This is set up to determine an associated class of a plurality of classes from input signals, the machine learning system being set up to assign a classification value to each of the classes, the associated classification being determined as the class whose assigned classification value is highest, and where a reliability value is determined which characterizes a reliability of the classification, the reliability value being determined as a function of the two highest of the determined classification values (pi, p 2 ).
  • the classification values can be limited to values in the range between 0 and 1 by a corresponding normalization function in such a way that the sum of all classification values is 1.
  • the classification values are therefore typically also called logit values. It is known that these classification values generally cannot be equated with probabilities of a class of the input signal. However, it has also been shown that the robustness of the classification can be described by the size of the relative size of the second largest classification value p 2 to the largest classification value p 1 .
  • this can be expressed as follows in the case of artificial neural networks, for example as a machine learning system:
  • This assignment takes place eg by means of a function /: M d - M fe , where M fe is a Euclidean space.
  • the components of / (x) each correspond to one of the classes and are given by the classification values that characterize whether the associated class y is a correct classification of the input signal x.
  • An argmax function can be used to assign the input signal x to a specific class.
  • This relative variable can be given, for example, by a difference p 1 -p 2 . It is then possible to decide whether a classification is reliable or not. In a particularly simple embodiment, it can be provided that a decision is made on a reliable assignment precisely when the difference (p t ⁇ p 2 ) is greater than a predeterminable threshold value (D).
  • Training data comprise a plurality of training points (x T , y T ), which are pairs of exemplary input data x T and the associated desired classification or target classifications y T. If the classification N (x T ) of the machine learning system is correct, the value of the i-th coordinate of f (x T ) is the largest of the values. That is, f (x T )> f (xr j for all ji.
  • This predefinable threshold value (D) can preferably be determined in such a way that the machine learning system is trained on an incorrectly labeled training data set (X r ) comprising pairs of input signals and associated nominal classifications.
  • the predeterminable threshold value (D) can then be determined depending on output values of the machine learning system that result when input signals of the training data set (. X r ) are fed to the machine learning system for classification. In other words, this incorrectly labeled training data set is part of the training data with which the machine learning system was trained.
  • this incorrectly labeled training data set contains information about the generalization capability of the machine learning system, since it characterizes the tendency of the machine learning system to over-adapt to the training data.
  • the target classifications of the incorrectly labeled training data set (X r ) are chosen randomly. “Chosen at random” can mean, as usual, that the target classification is selected depending on a real random number or depending on a pseudo-random number. In other words, the input data (x T ) are accepted and the respective assigned target classifications (y T ) are selected at random.
  • the target classifications of the incorrectly labeled training data (X r ) by a random permutation of the desired classifications (y T ) from a data set of correctly labeled training data (X c ) to investigate.
  • the noise can be given by a Bernoulli-distributed random variable which determines whether the class of the input signal (x T ) should be disturbed.
  • the random class can then optionally be determined with a, in particular uniformly distributed, random variable.
  • the predefinable threshold value (D) can preferably be selected in such a way that it characterizes a frequency distribution of ranges (m) that results when the machine learning system is trained with the set of incorrectly labeled training data (X r ) and the input signals of the incorrectly labeled training data (X r ) are then fed to the machine learning system for classification.
  • the predeterminable threshold value (D) can then be determined as a function of a span threshold value (m A ), this span threshold value (m A ) being selected in such a way that a predeterminable proportion of the frequency distribution is greater than the span threshold (m A ).
  • This specifiable proportion can be set, for example, as 1 / ⁇ number of classes), i.e. 10% for 10 classes.
  • one of the aforementioned methods can then provide a control signal for controlling an actuator, which is selected as a function of a classification of an input signal that is determined by means of the machine learning system.
  • a reliability value of this classification is then determined by means of one of the aforementioned methods and the control signal is selected as a function of the determined reliability value.
  • this control signal is selected in such a way that the actuator is operated in a secured operating mode if it is decided that the classification is not reliable, and in a normal operating mode if it is decided that the classification is reliable is.
  • the decision as to whether the classification is reliable or not can be made, for example, as a function of whether or not the established reliability value is less than a predeterminable reliability threshold value.
  • FIG. 1 schematically shows a structure of an embodiment of the invention
  • FIG. 2 schematically shows an exemplary embodiment for controlling an at least partially autonomous robot
  • FIG. 3 schematically shows an exemplary embodiment for controlling a manufacturing system
  • FIG. 4 schematically shows an exemplary embodiment for controlling a personal assistant
  • FIG. 5 schematically shows an exemplary embodiment for controlling an access system
  • FIG. 6 schematically shows an exemplary embodiment for controlling a monitoring system
  • FIG. 7 schematically shows an exemplary embodiment for controlling a medical imaging system
  • FIG. 8 schematically shows a possible structure of the machine learning system
  • FIG. 9 in a flow chart a possible sequence of the method for
  • FIG. 10 shows the sequence of a method for determining the threshold value in a flow chart.
  • FIG. 1 shows an actuator 10 in its surroundings 20 in interaction with a control system 40.
  • Actuator 10 and surroundings 20 are also referred to collectively as an actuator system.
  • a state of the actuator system is detected with a sensor 30, which can also be given by a plurality of sensors, at preferably regular time intervals.
  • the sensor signal S - or, in the case of several sensors, one sensor signal S each - of the sensor 30 is transmitted to the control system 40.
  • the control system 40 thus receives a sequence of sensor signals S.
  • the control system 40 determines control signals A from this, which are transmitted to the actuator 10.
  • the control system 40 receives the sequence of sensor signals S from the sensor 30 in an optional receiving unit 50, which converts the sequence of sensor signals S into a sequence of input signals x (alternatively, the sensor signal S can also be directly adopted as the input signal x).
  • the input signal x can, for example, be a section or a further processing of the sensor signal S.
  • the input signal x can include image data or images, for example, or individual frames of a video recording. In other words, the input signal x is determined as a function of the sensor signal S.
  • the input signal x is fed to a machine learning system 60, which is, for example, a neural network.
  • the machine learning system 60 is preferably parameterized by parameters Q, which are stored in a parameter memory P and are provided by this.
  • the machine learning system 60 determines output signals y from the input signals x.
  • the output signals y are fed to an optional conversion unit 80, which uses them to determine control signals A which are fed to the actuator 10 in order to control the actuator 10 accordingly.
  • the output signal y here comprises at least one classification of the input signal x, with semantic segmentation also being possible in which a class is assigned to each segment of the input signal x.
  • the machine learning system determines classification values for each of the possible classes, as discussed again in detail below in connection with FIG.
  • the two largest of these classification values, p 1 and p 2 are also fed to the shaping unit 80 and taken into account when the control signal A is determined.
  • the actuator 10 receives the control signals A, is controlled accordingly and carries out a corresponding action.
  • the actuator 10 can include control logic (not necessarily structurally integrated), which determines a second control signal from the control signal A, with which the actuator 10 is then controlled.
  • control system 40 includes the sensor 30. In still further embodiments, the control system 40 alternatively or additionally also includes the actuator 10.
  • control system 40 comprises one or a plurality of processors 45 and at least one machine-readable storage medium 46 on which instructions are stored which then if they are executed on the processors 45, cause the control system 40 to execute the method according to the invention.
  • a display unit 10a is provided as an alternative or in addition to the actuator 10.
  • FIG. 2 shows an exemplary embodiment in which the control system 40 is used to control an at least partially autonomous robot, here an at least partially autonomous motor vehicle 100.
  • the sensor 30 can be, for example, one or more video sensors preferably arranged in the motor vehicle 100 and / or one or more radar sensors and / or one or more ultrasonic sensors and / or one or more LiDAR sensors and / or one or more position sensors (e.g. GPS).
  • the sensor 30 can also include an information system that determines information about a state of the actuator system, such as a weather information system that determines a current or future state of the weather in the environment 20.
  • the machine learning system 60 can use the input data x to detect objects in the vicinity of the at least partially autonomous robot, for example.
  • the output signal y can be information that characterizes where objects are present in the vicinity of the at least partially autonomous robot.
  • the output signal A can then be determined as a function of this information and / or in accordance with this information.
  • the actuator 10, which is preferably arranged in the motor vehicle 100, can be, for example, a brake, a drive or a steering system of the motor vehicle 100.
  • the control signal A can then be determined in such a way that the actuator or actuators 10 is controlled in such a way that the motor vehicle 100 prevents, for example, a collision with the objects identified by the machine learning system 60, in particular if they are objects of certain classes, e.g. pedestrians.
  • control signal A can be determined depending on the determined class and / or according to the determined class.
  • the at least partially autonomous robot can also be another mobile robot (not shown), for example one that moves by flying, swimming, diving or striding.
  • the mobile robot can also be, for example, an at least partially autonomous lawnmower or an at least partially autonomous cleaning robot.
  • the control signal A can be determined in such a way that the drive and / or steering of the mobile robot are controlled in such a way that the at least partially autonomous robot prevents, for example, a collision with the objects identified by the machine learning system 60,
  • the at least partially autonomous robot can also be a garden robot (not shown) which uses an imaging sensor 30 and the machine learning system 60 to determine a type or condition of plants in the environment 20.
  • the actuator 10 can then be, for example, an applicator for chemicals.
  • the control signal A can be determined depending on the determined species or the determined state of the plants in such a way that an amount of chemicals corresponding to the determined species or the determined state is applied.
  • the at least partially autonomous robot can also be a household appliance (not shown), in particular a washing machine, a stove, an oven, a microwave or a dishwasher.
  • a household appliance for example an optical sensor
  • a state of an object treated with the domestic appliance can be detected, for example in the case of the washing machine a state of laundry that is in the washing machine.
  • the machine learning system 60 a type or a state of this object can then be determined and characterized by the output signal y.
  • the activation signal A can then be determined in such a way that the household appliance is activated depending on the determined type or the determined state of the object. For example, in the case of Washing machine these are controlled depending on which material the laundry is made of. Control signal A can then be selected depending on which material of the laundry was determined.
  • FIG. 3 shows an exemplary embodiment in which the control system 40 is used to control a production machine 11 of a production system 200, in that an actuator 10 controlling this production machine 11 is controlled.
  • the manufacturing machine 11 can be, for example, a machine for punching, sawing, drilling and / or cutting.
  • the sensor 30 can then be, for example, an optical sensor, e.g. Properties of manufactured products 12 recorded. It is possible that the actuator 10 controlling the production machine 11 is activated depending on the determined properties of the production product 12 so that the production machine 11 executes a subsequent processing step of this production product 12 accordingly. It is also possible for the sensor 30 to determine the properties of the manufactured product 12 processed by the manufacturing machine 11 and, depending on this, to adjust a control of the manufacturing machine 11 for a subsequent manufactured product.
  • an optical sensor e.g. Properties of manufactured products 12 recorded. It is possible that the actuator 10 controlling the production machine 11 is activated depending on the determined properties of the production product 12 so that the production machine 11 executes a subsequent processing step of this production product 12 accordingly. It is also possible for the sensor 30 to determine the properties of the manufactured product 12 processed by the manufacturing machine 11 and, depending on this, to adjust a control of the manufacturing machine 11 for a subsequent manufactured product.
  • FIG. 4 shows an exemplary embodiment in which the control system 40 is used to control a personal assistant 250.
  • the sensor 30 is preferably an acoustic sensor that receives speech signals from a user 249. Alternatively or in addition, the sensor 30 can also be set up to receive optical signals, for example video images of a gesture by the user 249.
  • the control system 40 determines a control signal A from the personal assistant 250, for example by the machine learning system performing gesture recognition. This determined activation signal A is then transmitted to the personal assistant 250 and is thus activated accordingly.
  • This determined control signal A act can in particular be selected such that it corresponds to a presumed desired control by the user 249. This presumed desired activation can be dependent on the one recognized by the machine learning system 60 Gesture to be determined.
  • the control system 40 can then select the control signal A for transmission to the personal assistant 250 depending on the presumed desired activation and / or select the activation signal A for transmission to the personal assistant according to the presumed desired activation 250.
  • This corresponding control can include, for example, that the personal assistant 250 retrieves information from a database and reproduces it for the user 249 in a perceptible manner.
  • a household appliance (not shown), in particular a washing machine, stove, oven, microwave or dishwasher, can be provided in order to be controlled accordingly.
  • FIG. 5 shows an exemplary embodiment in which the control system 40 is used to control an access system 300.
  • the access system 300 may include a physical access control, for example a door 401.
  • the sensor 30 can be, for example, an optical sensor (for example for capturing image or video data) which is set up to capture a face. This captured image can be interpreted by means of the machine learning system 60. For example, the identity of a person can be determined.
  • the actuator 10 can be a lock that, depending on the control signal A, releases the access control or not, for example the door 401 opens or not.
  • the control signal A can be selected depending on the interpretation of the machine learning system 60, for example depending on the identified identity of the person.
  • a logical access control can also be provided instead of the physical access control.
  • FIG. 6 shows an exemplary embodiment in which the control system 40 is used to control a monitoring system 400.
  • This exemplary embodiment differs from the exemplary embodiment illustrated in FIG. 5 in that, instead of the actuator 10, the display unit 10a is provided, which is controlled by the control system 40.
  • the control system 40 For example, from the machine A learning system 60 can determine whether an object picked up by the optical sensor is suspicious, and the control signal A can then be selected such that this object is highlighted in color by the display unit 10a.
  • FIG. 7 shows an exemplary embodiment in which the control system 40 is used to control a medical imaging system 500, for example an M RT, X-ray or ultrasound device.
  • the sensor 30 can be given for example by an imaging sensor
  • the display unit 10a is controlled by the control system 40.
  • the machine learning system 60 can determine whether an area recorded by the imaging sensor is conspicuous, and the control signal A can then be selected such that this area is highlighted in color by the display unit 10a.
  • FIG. 8 schematically shows a possible structure of the machine learning system 60, which in this case is provided by a neural network.
  • the input signal x is fed to an input layer 61, for example a folding layer, and then successively propagated through the neural network 60 until it is used in a layer 62 to determine classification values p t , ... p k . These are fed to an argmax layer, which determines the class whose associated classification value assumes the greatest value. This class is made available as output signal y, as is the associated classification value p lt and the second largest classification value p 2 .
  • the artificial neural network x is set up to determine associated output signals y from the input signals x supplied to it. These output signals y are fed to the evaluation unit 180.
  • FIG. 9 shows in a flow diagram the sequence of a method for determining the reliability value.
  • control signal A can then be selected in such a way that the actuator 10 is operated in a safe mode, for example with reduced dynamics. This ends this procedure.
  • FIG. 10 illustrates in a flowchart the sequence of a method for determining the threshold value D.
  • the machine learning system 60 is trained with a training data set X r with randomly selected target classifications.
  • the optionally the weights of the machine learning system 60 are normalized.
  • the spans m are determined which result for all input signals of the training data set X r .
  • the range threshold value m A is selected in such a way that a predeterminable portion of the determined thresholds m is greater than the range threshold value m A and the other determined thresholds m are smaller.
  • the threshold value (D) is selected equal to a predeterminable factor multiplied by the range threshold value m A , where this factor assumes the value one, for example. This ends this process.
  • the term “computer” encompasses any device for processing specifiable arithmetic rules. These calculation rules can be in the form of software, or in the form of hardware, or also in a mixed form of software and hardware.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Feedback Control In General (AREA)

Abstract

Verfahren zum Ermitteln einer Zuverlässigkeit einer Klassifikation von Eingangssignalen (x) mittels eines maschinellen Lernsystems (60), insbesondere eines neuronalen Netzes, welches eingerichtet ist, aus Eingangssignalen (x) jeweils eine zugehörige Klasse einer Mehrzahl von Klassen zu ermitteln, wobei das maschinelle Lern System (60) eingerichtet ist, jeder der Klassen einen Klassifizierungswert (p) zuzuordnen, wobei als zugehörige Klassifikation diejenige Klasse ermittelt wird, deren zugeordneter Klassifizierungswert (p) am höchsten ist, und wobei ein Zuverlässigkeitswert ermittelt wird, der eine Zuverlässigkeit der Klassifikation charakterisiert, dadurch gekennzeichnet, dass der Zuverlässigkeitswert abhängig von den zwei höchsten der ermittelten Klassifizierungswerte (p 1,p 2) ermittelt wird.

Description

Beschreibung
Titel
Verfahren und Vorrichtung zum Betreiben eines Steuern ngssystems
Die Erfindung betrifft ein Verfahren zum Ermitteln einer Zuverlässigkeit von Klas sifikationen von Sensorsignalen, ein Verfahren zum Bereitstellen eines Ansteue- rungssignales eines Aktors, ein Steuerungssystem, Computerprogramm und ein maschinenlesbares Speichermedium.
Stand der Technik
Aus der nicht vorveröffentlichten DE 10 2018 209 595 ist ein Verfahren zum Er mitteln eines Straßenzustands eines Kraftfahrzeugs bekannt, wobei abhängig von ersten Eingangsgrößen eines ersten Sensorsystems und abhängig von zwei ten Eingangsgrößen eines zweiten Sensorsystems mittels eines verteilten ma schinellen Lernsystems, insbesondere eines verteilten neuronalen Netzes, eine den Straßenzustand charakterisierende Größe ermittelt wird.
Vorteile der Erfindung
Bei hochautomatisiert fahrenden Fahrzeugen können Bilder, die Umfeldsensorik des Fahrzeugs - beispielsweise Video- oder Radarsensoren - liefert, mittels Klassifikatoren analysiert werden. Ein solcher Klassifikator kann beispielsweise durch ein tiefes neuronales Netz gegeben sein. Um die Sicherheit des hochauto matisierten Fahrens zu verbessern, ist es wichtig, die Zuverlässigkeit der erhalte nen Klassifikationen zu kennen, um ggf. Gegenmaßnahmen ergreifen zu können.
Das Verfahren mit den Merkmalen des Anspruch 1 stellt eine solche Zuverlässig keit einer Klassifikation bereit, wodurch der Betrieb eines Systems, das abhängig von dieser ermittelten Klassifikation angesteuert wird, besonders zuverlässig ge staltet werden kann.
Weitere Aspekte der Erfindung sind Gegenstand der nebengeordneten Ansprü che. Vorteilhafte Weiterbildungen sind Gegenstand der abhängigen Ansprüche.
Offenbarung der Erfindung
In einem ersten Aspekt betrifft die Erfindung daher ein Verfahren zum Ermitteln einer Zuverlässigkeit einer Klassifikation von Eingangssignalen, welche insbe sondere abhängig von Ausgangssignalen eines Sensors ermittelt wurden, mittels eines maschinellen Lernsystems, insbesondere eines neuronalen Netzes. Dieses ist eingerichtet, aus Eingangssignalen jeweils eine zugehörige Klasse einer Mehrzahl von Klassen zu ermitteln, wobei das maschinelle Lernsystem einge richtet ist, jeder der Klassen einen Klassifizierungswert zuzuordnen, wobei als zugehörige Klassifikation diejenige Klasse ermittelt wird, deren zugeordneter Klassifizierungswert am höchsten ist, und wobei ein Zuverlässigkeitswert ermittelt wird, der eine Zuverlässigkeit der Klassifikation charakterisiert, wobei der Zuver lässigkeitswert abhängig von den zwei höchsten der ermittelten Klassifizierungs werte (pi, p2) ermittelt wird.
Die Klassifizierungswerte können durch eine entsprechende Normierungsfunk tion derart auf Werte im Bereich zwischen 0 und 1 beschränkt werden, dass die Summe über alle Klassifizierungswerte 1 ergibt. Die Klassifizierungswerte wer den daher typischerweise auch Logit-Werte genannt. Zwar ist bekannt, dass diese Klassifizierungswerte im Allgemeinen nicht mit Wahrscheinlichkeiten einer Klassenzugehörigkeit des Eingangssignals gleichgesetzt werden können. Den noch hat sich gezeigt, dass die Robustheit der Klassifikation dadurch beschrie ben werden kann, wie groß die relative Größe des zweitgrößten Klassifizierungs werts p2 zum größten Klassifizierungswert p1 ist.
Mathematischer kann dies z.B. bei künstlichen neuronalen Netzen als maschinel les Lernsystem wie folgt ausgedrückt werden: Um eine Klassifikationsaufgabe zu lösen, also die Zuordnung von Eingangssignalen x eines Eingangsraums X = Md zu einer Klasse y aus einer Anzahl k vieler Klassen. Diese Zuordnung erfolgt z.B. mittels einer Funktion /: Md - Mfe, wobei Mfe ein euklidischer Raum ist. Die Komponenten von /(x) entsprechen jeweils einer der Klassen und sind gegeben durch die Klassifizierungswerte, die charakterisieren, ob die zugehörige Klasse y eine richtige Klassifikation des Eingangssignals x ist. Um das Eingangssignals x einer bestimmten Klasse zuzuordnen, kann eine argmax- Funktion verwendet werden. Die argmax- Funktion gibt die Koordinate des maximalen Werts von f aus, das heißt y = iV(x) = argma x/(x) .
Diese relative Größe kann beispielsweise durch eine Differenz p1— p2 gegeben sein. Es ist dann möglich, zu entscheiden, ob eine Klassifikation zuverlässig ist oder nicht. In einer besonders einfachen Ausgestaltung kann vorgesehen sein, dass genau dann, auf eine zuverlässige Zuordnung entschieden wird, wenn die Differenz ( pt— p2) größer ist als ein vorgebbarer Schwellwert (D).
Trainingsdaten umfassen eine Mehrzahl von Trainingspunkten (xT,yT), die Paare beispielhafter Eingangsdaten xT und zugehöriger gewünschter Klassifikation bzw. Soll- Klassifikationen yT sind. Falls die Klassifikation N(xT) des maschinel len Lernsystems korrekt ist, ist der Wert der i-ten Koordinate von f(xT ) der größte der Werte. Das heißt, es gilt f(xT) > f(xr j für alle j i .
Dieser vorgebbare Schwellwert (D) kann vorzugsweise derart ermittelt werden, dass das maschinelle Lernsystem auf einem nicht korrekt gelabelten Trainings datensatz ( Xr ) umfassend Paare aus Eingangssignalen und zugehörigen Soll- Klassifikationen trainiert wird. Der vorgebbare Schwellwert (D) kann dann abhän gig von Ausgabewerten des maschinelle Lernsystems ermittelt werden, die sich ergeben, wenn dem maschinellen Lernsystem Eingangssignale des Trainingsda tensatzes (. Xr ) zur Klassifikation zugeführt werden. Das heißt mit anderen Wor ten, dass dieser nicht korrekt gelabelte Trainingsdatensatz Teil der Trainingsda ten ist, mit denen das maschinelle Lernsystem trainiert wurde.
Es wurde erkannt, dass dieser nicht korrekt gelabelte Trainingsdatensatz Infor mationen über die Generalisierungsfähigkeit des maschinellen Lernsystems ent hält, da er die Neigung einer Überanpassung des maschinellen Lernsystems an die Trainingsdaten charakterisiert. Vorzugsweise werden die Soll-Klassifikationen des nicht korrekt gelabelten Trai ningsdatensatzes ( Xr ) zufällig gewählt sind.„Zufällig gewählt“ kann hierbei wie üblich bedeuten, dass die Soll- Klassifikation abhängig von einer echten Zufalls zahl oder abhängig von einer Pseudozufallszahl gewählt ist. D.h. die Eingangs daten ( xT ) werden übernommen und die jeweils zugeordneten Soll- Klassifikatio nen ( yT ) werden zufällig gewählt.
Um statistische Eigenschaften des Trainingsdatensatzes möglichst wenig zu be einflussen, kann vorgesehen sein, die Soll- Klassifikationen der nicht korrekt gela belten Trainingsdaten ( Xr ) durch eine zufällige Permutation der gewünschten Klassifikationen ( yT ) aus einem Datensatz korrekt gelabelter Trainingsdaten ( Xc ) zu ermitteln.
Alternativ ist es auch möglich, ausgehend von den gewünschten Klassifikationen {yT) des Datensatzes korrekt gelabelter Trainingsdaten (Zc), diesen ein zufälliges Rauschen hinzuzufügen, um die Soll- Klassifikation der nicht korrekt gelabelten Trainingsdaten ( Xr ) zu erhalten. Hierdurch ist es in besonders einfacher Weise möglich, den Grad der Unkorrektheit der nicht korrekt gelabelten Trainingsdaten ( Xr ) zu quantifizieren. Beispielsweise kann das Rauschen durch eine Bernoulli- verteilte Zufallsvariable gegeben sein, die bestimmt ob die Klasse des Eingangs signals ( xT ) gestört werden soll. Die zufällige Klasse kann dann gegebenenfalls mit einer, insbesondere gleichverteilten, Zufallsvariable bestimmt werden.
Vorzugsweise kann der vorgebbare Schwellwert (D) derart gewählt werden, dass er eine Häufigkeitsverteilung von Spannen (m) charakterisiert, die sich ergibt, wenn das maschinelle Lernsystem mit dem Satz nicht korrekt gelabelten Trai ningsdaten ( Xr ) trainiert wird, und die Eingangssignale der nicht korrekt gelabel ten Trainingsdaten ( Xr ) dem maschinellen Lernsystem dann zur Klassifikation zu geführt werden.
Eine Spanne (Englisch: margin) m ist definiert durch m = f(.xT)i - max/(xr) . .
j*i
Ist die Spanne positiv, dann ist die Klassifikation korrekt, ist sie negativ so ist die Klassifikation falsch.
Hierbei kann dann der vorgebbare Schwellwert (D) abhängig von einem Span nenschwellwert (mA) ermittelt wird, wobei dieser Spannenschwellwert (mA) derart gewählt ist, dass ein vorgebbarer Anteil der Häufigkeitsverteilung größer ist als der Spannenschwellwert (mA). Dieser vorgebbare Anteil kann beispielsweise als 1/ {Anzahl der Klassen) festgelegt werden, bei 10 Klassen also auf 10%.
In einem weiteren Aspekt kann eines der vorgenannten Verfahren dann Bereit stellen eines Ansteuerungssignals zur Ansteuerung eines Aktors verwendet wer den, das abhängig von einer Klassifikation eines Eingangssignals, die mittels des maschinellen Lernsystems ermittelt wird, gewählt wird. Hierbei wird dann mittels eines der vorgenannten Verfahren ein Zuverlässigkeitswert dieser Klassifikation ermittelt und das Ansteuerungssignal abhängig vom ermittelten Zuverlässigkeits wert gewählt. Beispielsweise kann vorgesehen sein, dass dieser das Ansteue rungssignal derart gewählt wird, dass der Aktor in einem abgesicherten Betriebs modus betrieben wird, wenn entschieden wird, dass Klassifikation nicht zuverläs sig ist, und in einem normalen Betriebsmodus, wenn entschieden wird, dass die Klassifikation zuverlässig ist. Die Entscheidung, ob die Klassifikation zuverlässig ist oder nicht kann beispielsweise abhängig davon erfolgen, ob der ermittelte Zu verlässigkeitswert kleiner als ein vorgebbarer Zuverlässigkeitsschwellwert ist, o- der nicht.
Nachfolgend werden Ausführungsformen der Erfindung unter Bezugnahme auf die beiliegenden Zeichnungen näher erläutert. In den Zeichnungen zeigen:
Figur 1 schematisch einen Aufbau einer Ausführungsform der Erfindung;
Figur 2 schematisch ein Ausführungsbeispiel zur Steuerung eines wenigs tens teilautonomen Roboters;
Figur 3 schematisch ein Ausführungsbeispiel zur Steuerung eines Ferti gungssystems;
Figur 4 schematisch ein Ausführungsbeispiel zur Steuerung eines persönli chen Assistenten;
Figur 5 schematisch ein Ausführungsbeispiel zur Steuerung eines Zugangs systems; Figur 6 schematisch ein Ausführungsbeispiel zur Steuerung eines Überwa chungssystems;
Figur 7 schematisch ein Ausführungsbeispiel zur Steuerung eines medizi nisch bildgebenden Systems;
Figur 8 schematisch einen möglichen Aufbau des maschinellen Lernsystems;
Figur 9 in einem Flussdiagramm einen möglichen Ablauf des Verfahrens zum
Ermitteln des Zuverlässigkeitswerts;
Figur 10 in einem Flussdiagramm den Ablauf eines Verfahrens zum Ermitteln des Schwellwerts.
Beschreibung der Ausführungsbeispiele
Figur 1 zeigt einen Aktor 10 in seiner Umgebung 20 in Interaktion mit einem Steuerungssystem 40. Aktor 10 und Umgebung 20 werden gemeinschaftlich auch als Aktorsystem bezeichnet. In vorzugsweise regelmäßigen zeitlichen Ab ständen wird ein Zustand des Aktorsystems mit einem Sensor 30 erfasst, der auch durch eine Mehrzahl von Sensoren gegeben sein kann. Das Sensorsignal S - bzw. im Fall mehrerer Sensoren je ein Sensorsignal S - des Sensors 30 wird an das Steuerungssystem 40 übermittelt. Das Steuerungssystem 40 empfängt somit eine Folge von Sensorsignalen S. Das Steuerungssystem 40 ermittelt hie raus Ansteuersignale A, welche an den Aktor 10 übertragen werden.
Das Steuerungssystem 40 empfängt die Folge von Sensorsignalen S des Sen sors 30 in einer optionalen Empfangseinheit 50, die die Folge von Sensorsigna len S in eine Folge von Eingangssignalen x umwandelt (alternativ kann auch un mittelbar je das Sensorsignal S als Eingangssignal x übernommen werden). Das Eingangssignal x kann beispielsweise ein Ausschnitt oder eine Weiterverarbei tung des Sensorsignals S sein. Das Eingangssignal x kann beispielsweise Bild daten oder Bilder umfassen, oder einzelne Frames einer Videoaufzeichnung. Mit anderen Worten wird Eingangssignal x abhängig von Sensorsignal S ermittelt. Das Eingangssignal x wird einem maschinellen Lernsystem 60, das beispiels weise ein neuronales Netzwerk ist, zugeführt.
Das maschinelle Lernsystem 60 wird vorzugsweise parametriert durch Parameter Q, die in einem Parameterspeicher P hinterlegt sind und von diesem bereitgestellt werden.
Das maschinelle Lernsystem 60 ermittelt aus den Eingangssignalen x Ausgangs signale y. Die Ausgangssignale y werden einer optionalen Umformeinheit 80 zu geführt, die hieraus Ansteuersignale A ermittelt, welche dem Aktor 10 zugeführt werden, um den Aktor 10 entsprechend anzusteuern. Das Ausgangssignal y um fasst hierbei mindestens eine Klassifikation des Eingangssignals x, wobei auch eine semantische Segmentierung möglich ist, bei der einzelnen Segmenten des Eingangssignals x jeweils eine Klasse zugeordnet wird.
Zur Ermittlung der Klassifizierung ermittelt das maschinelle Lernsystem zu jeder der möglichen Klassen Klassifizierungswerte, wie unten im Zusammenhang mit Figur 8 noch einmal ausführlich diskutiert. Die größten beiden dieser Klassifizie rungswerte, p1 und p2, werden ebenfalls der Umformeinheit 80 zugeführt, und bei der Ermittlung des Ansteuersignals A berücksichtigt.
Der Aktor 10 empfängt die Ansteuersignale A, wird entsprechend angesteuert und führt eine entsprechende Aktion aus. Der Aktor 10 kann hierbei eine (nicht notwendigerweise baulich integrierte) Ansteuerlogik umfassen, welches aus dem Ansteuersignal A ein zweites Ansteuersignal ermittelt, mit dem dann der Aktor 10 angesteuert wird.
In weiteren Ausführungsformen umfasst das Steuerungssystem 40 den Sensor 30. In noch weiteren Ausführungsformen umfasst das Steuerungssystem 40 al ternativ oder zusätzlich auch den Aktor 10.
In weiteren bevorzugten Ausführungsformen umfasst das Steuerungssystem 40 eine Ein- oder Mehrzahl von Prozessoren 45 und wenigstens ein maschinenles bares Speichermedium 46, auf dem Anweisungen gespeichert sind, die dann, wenn sie auf den Prozessoren 45 ausgeführt werden, das Steuerungssystem 40 veranlassen, das erfindungsgemäße Verfahren auszuführen.
In alternativen Ausführungsformen ist alternativ oder zusätzlich zum Aktor 10 eine Anzeigeeinheit 10a vorgesehen.
Figur 2 zeigt ein Ausführungsbeispiel, in dem das Steuerungssystem 40 zur Steuerung eines wenigstens teilautonomen Roboters, hier eines wenigstens teil autonomen Kraftfahrzeugs 100, eingesetzt wird.
Bei dem Sensor 30 kann es sich beispielsweise um einen oder mehrere vorzugs weise im Kraftfahrzeug 100 angeordnete Videosensoren und/oder einen oder mehrere Radarsensoren und/oder einen oder mehrere Ultraschallsensoren und/oder einen oder mehrere LiDAR-Sensoren und/oder einen oder mehrere Po sitionssensoren (beispielsweise GPS) handeln. Alternativ oder zusätzlich kann der Sensor 30 auch ein Informationssystem umfassen, das eine Information über einen Zustand des Aktorsystems ermittelt, wie beispielsweise ein Wetterinforma tionssystem, das einen aktuellen oder zukünftigen Zustand des Wetters in der Umgebung 20 ermittelt.
Das maschinelle Lernsystem 60 kann aus den Eingangsdaten x beispielsweise Gegenstände in der Umgebung des wenigstens teilautonomen Roboters detek- tieren. Bei dem Ausgangssignal y kann es sich um eine Information handeln, die charakterisiert, wo in der Umgebung des wenigstens teilautonomen Roboters Gegenstände vorhanden sind. Das Ausgangssignal A kann dann abhängig von dieser Information und/oder entsprechend dieser Information ermittelt werden.
Bei dem vorzugsweise im Kraftfahrzeug 100 angeordneten Aktor 10 kann es sich beispielsweise um eine Bremse, einen Antrieb oder eine Lenkung des Kraftfahr zeugs 100 handeln. Das Ansteuersignal A kann dann derart ermittelt werden, dass der Aktor oder die Aktoren 10 derart angesteuert wird, dass das Kraftfahr zeug 100 beispielsweise eine Kollision mit den vom maschinellen Lernsystem 60 identifizierten Gegenständen verhindert, insbesondere, wenn es sich um Gegen stände bestimmter Klassen, z.B. um Fußgänger, handelt. Mit anderen Worten kann Ansteuersignal A abhängig von der ermittelten Klasse und/oder entspre chend der ermittelten Klasse ermittelt werden.
Alternativ kann es sich bei dem wenigstens teilautonomen Roboter auch um ei nen anderen mobilen Roboter (nicht abgebildet) handeln, beispielsweise um ei nen solchen, der sich durch Fliegen, Schwimmen, Tauchen oder Schreiten fort bewegt. Bei dem mobilen Roboter kann es sich beispielsweise auch um einen wenigstens teilautonomen Rasenmäher oder einen wenigstens teilautonomen Putzroboter handeln. Auch in diesen Fällen kann das Ansteuersignal A derart er mittelt werden, dass Antrieb und/oder Lenkung des mobilen Roboters derart an gesteuert werden, dass der wenigstens teilautonome Roboter beispielsweise eine Kollision mit den vom maschinellen Lernsystem 60 identifizierten Gegen ständen verhindert,
In einer weiteren Alternative kann es sich bei dem wenigstens teilautonomen Ro boter auch um einen Gartenroboter (nicht abgebildet) handeln, der mit einem bildgebenden Sensor 30 und dem maschinellen Lernsystem 60 eine Art oder ei nen Zustand von Pflanzen in der Umgebung 20 ermittelt. Bei dem Aktor 10 kann es sich dann beispielsweise um einen Applikator von Chemikalien handeln. Das Ansteuersignal A kann abhängig von der ermittelten Art oder vom ermittelten Zu stand der Pflanzen derart ermittelt werden, dass eine der ermittelten Art oder dem ermittelten Zustand entsprechende Menge der Chemikalien aufgebracht wird.
In noch weiteren Alternativen kann es sich bei dem wenigstens teilautonomen Roboter auch um ein Haushaltsgerät (nicht abgebildet), insbesondere eine Waschmaschine, einen Herd, einen Backofen, eine Mikrowelle oder eine Spül maschine handeln. Mit dem Sensor 30, beispielsweise einem optischen Sensor, kann ein Zustand eines mit dem Haushaltsgerät behandelten Objekts erfasst werden, beispielsweise im Falle der Waschmaschine ein Zustand von Wäsche, die in der Waschmaschine befindlich ist. Mit dem maschinellen Lernsystem 60 kann dann eine Art oder ein Zustand dieses Objekts ermittelt und vom Ausgangs signal y charakterisiert werden. Das Ansteuersignal A kann dann derart ermittelt werden, dass das Haushaltsgerät abhängig von der ermittelten Art oder dem er mittelten Zustand des Objekts angesteuert wird. Beispielsweise kann im Falle der Waschmaschine diese abhängig davon angesteuert werden, aus welchem Mate rial die darin befindliche Wäsche ist. Ansteuersignal A kann dann abhängig da von gewählt werden, welches Material der Wäsche ermittelt wurde.
Figur 3 zeigt ein Ausführungsbeispiel, in dem das Steuerungssystem 40 zur An steuerung einer Fertigungsmaschine 11 eines Fertigungssystems 200 verwendet wird, indem ein diese Fertigungsmaschine 11 steuernder Aktor 10 angesteuert wird. Bei der Fertigungsmaschine 11 kann es sich beispielsweise um eine Ma schine zum Stanzen, Sägen, Bohren und/oder Schneiden handeln.
Bei dem Sensor 30 dann beispielsweise um einen optischen Sensor handeln, der z.B. Eigenschaften von Fertigungserzeugnissen 12 erfasst. Es ist möglich, dass der die Fertigungsmaschine 11 steuernde Aktor 10 abhängig von den ermittelten Eigenschaften des Fertigungserzeugnisses 12 angesteuert wird, damit die Ferti gungsmaschine 11 entsprechend einen nachfolgenden Bearbeitungsschritt die ses Fertigungserzeugnisses 12 ausführt. Es ist auch möglich, dass der Sensor 30 die Eigenschaften des von der Fertigungsmaschine 11 bearbeiteten Ferti gungserzeugnisses 12 ermittelt, und abhängig davon eine Ansteuerung der Ferti gungsmaschine 11 für ein nachfolgendes Fertigungserzeugnis anpasst.
Figur 4 zeigt ein Ausführungsbeispiel, bei dem das Steuerungssystem 40 zur Steuerung eines persönlichen Assistenten 250 eingesetzt wird. Der Sensor 30 ist bevorzugt ein akustischer Sensor, der Sprachsignale eines Nutzers 249 emp fängt. Alternativ oder zusätzlich kann der Sensor 30 auch eingerichtet sein, opti sche Signale zu empfangen, beispielsweise Videobilder einer Geste des Nutzers 249.
Abhängig von den Signalen des Sensors 30 ermittelt das Steuerungssystem 40 ein Ansteuersignal A des persönlichen Assistenten 250, beispielsweise, indem das maschinelle Lernsystem eine Gestenerkennung durchführt. Dem persönli chen Assistenten 250 wird dann dieses ermittelte Ansteuersignal A übermittelt und er somit entsprechend angesteuert. Dieses ermittelte Ansteuersignal A ist kann insbesondere derart gewählt werden, dass es einer vermuteten gewünsch ten Ansteuerung durch den Nutzer 249 entspricht. Diese vermutete gewünschte Ansteuerung kann abhängig von der vom maschinellen Lernsystem 60 erkannten Geste ermittelt werden. Das Steuerungssystem 40 kann dann abhängig von der vermuteten gewünschten Ansteuerung das Ansteuersignal A zur Übermittlung an den persönlichen Assistenten 250 wählen und/oder das Ansteuersignal A zur Übermittlung an den persönlichen Assistenten entsprechend der vermuteten ge wünschten Ansteuerung 250 wählen.
Diese entsprechende Ansteuerung kann beispielsweise beinhalten, dass der per sönliche Assistent 250 Informationen aus einer Datenbank abruft und sie für den Nutzer 249 rezipierbar wiedergibt.
Anstelle des persönlichen Assistenten 250 kann auch ein Haushaltsgerät (nicht abgebildet), insbesondere eine Waschmaschine, ein Herd, ein Backofen, eine Mikrowelle oder eine Spülmaschine vorgesehen sein, um entsprechend ange steuert zu werden.
Figur 5 zeigt ein Ausführungsbeispiel, bei dem das Steuerungssystem 40 zur Steuerung eines Zugangssystems 300 eingesetzt wird. Das Zugangssystem 300 kann eine physische Zugangskontrolle, beispielsweise eine Tür 401 umfassen. Bei dem Sensor 30 kann es sich beispielsweise um einen optischen Sensor (bei spielsweise zur Erfassung von Bild- oder Videodaten) handeln, der eingerichtet ist, ein Gesicht zu erfassen. Mittels des maschinellen Lernsystems 60 kann die ses erfasste Bild interpretiert werden. Beispielsweise kann die Identität einer Per son ermittelt werden. Der Aktor 10 kann ein Schloss sein, dass abhängig vom Ansteuersignal A die Zugangskontrolle freigibt, oder nicht, beispielsweise die Tür 401 öffnet, oder nicht. Hierzu kann das Ansteuersignal A abhängig von der der Interpretation des maschinellen Lernsystems 60 gewählt werden, beispielsweise abhängig von der ermittelten Identität der Person. An Stelle der physischen Zu gangskontrolle kann auch eine logische Zugangskontrolle vorgesehen sein.
Figur 6 zeigt ein Ausführungsbeispiel, bei dem das Steuerungssystem 40 zur Steuerung eines Überwachungssystems 400 verwendet wird. Von dem in Figur 5 dargestellten Ausführungsbeispiel unterscheidet sich dieses Ausführungsbeispiel dadurch, dass an Stelle des Aktors 10 die Anzeigeeinheit 10a vorgesehen ist, die vom Steuerungssystem 40 angesteuert wird. Beispielsweise kann vom maschi- nellen Lernsystem 60 ermittelt werden, ob ein vom optischen Sensor aufgenom mener Gegenstand verdächtig ist, und das Ansteuersignal A dann derart gewählt werden, dass dieser Gegenstand von der Anzeigeeinheit 10a farblich hervorge hoben dargestellt wird.
Figur 7 zeigt ein Ausführungsbeispiel, bei dem das Steuerungssystem 40 zur Steuerung eines medizinischen bildgebenden System 500, beispielsweise eines M RT-, Röntgen- oder Ultraschallgeräts, verwendet wird. Der Sensor 30 kann bei spielsweise durch einen bildgebenden Sensor gegeben sein, durch das Steue rungssystem 40 wird die Anzeigeeinheit 10a angesteuert. Beispielsweise kann vom maschinellen Lernsystem 60 ermittelt werden, ob ein vom bildgebenden Sensor aufgenommener Bereich auffällig ist, und das Ansteuersignal A dann der art gewählt werden, dass dieser Bereich von der Anzeigeeinheit 10a farblich her vorgehoben dargestellt wird.
Figur 8 zeigt schematisch einen möglichen Aufbau des maschinellen Lernsys tems 60, das in diesem Fall durch neuronales Netzwerk gegeben ist. Das Ein gangssignal x wird einer Eingangsschicht 61 zugeführt, beispielsweise einer Fal tungsschicht, und dann sukzessive durch das neuronale Netz 60 propagiert, bis es in einer Schicht 62 dazu herangezogen wird, um Klassifizierungswerte pt, ... pk zu ermitteln. Diese werden einer argmax-Schicht zugeführt, die diejenige Klasse ermittelt, deren zugehöriger Klassifizierungswert den größten Wert annimmt. Diese Klasse wird als Ausgangssignal y bereitgestellt, ebenso der zugehörige Klassifizierungswert plt ebenso wie der zweitgrößte Klassifizierungswert p2.
Das künstliche neuronale Netz x ist eingerichtet, aus den ihm zugeführten Ein gangssignalen x zugehörige Ausgangssignale y zu ermitteln. Diese Ausgangssig nale y werden der Bewertungseinheit 180 zugeführt.
Figur 9 zeigt in einem Flussdiagramm den Ablauf eines Verfahrens zum Ermitteln des Zuverlässigkeitswerts. Zunächst (1000) wird ein Eingangssignal x dem ma schinellen Lernsystem 60 zugeführt, und zugehöriges Ausgangssignal y sowie zugehöriger größter Klassifizierungswert p1 und zugehöriger zweitgrößter Klassi fizierungswert p2 werden ermittelt. Dann (1100) wird die Differenz p1— p2 des größten minus des zweitgrößten Klassifizierungswerts ermittelt und verglichen, ob diese Differenz größer ist als der vorgebbare Schwellwert D. Ist dies der Fall (1200), wird entschieden, dass die Klassifikation zuverlässig ist, und der Zuver lässigkeitswert wird auf den Wert„1“ gesetzt. Beispielsweise kann das Ansteuer signal A dann derart gewählt werden, dass Aktor 10 in einem Normalmodus be trieben wird. Ist dies hingegen nicht der Fall (1300), wird entschieden, dass die Klassifikation nicht zuverlässig ist, und der Zuverlässigkeitswert wird auf den Wert„0“ gesetzt. Beispielsweise kann das Ansteuersignal A dann derart gewählt werden, dass Aktor 10 in einem abgesicherten Modus betrieben wird, beispiels weise mit reduzierter Dynamik. Damit endet dieses Verfahren.
Figur 10 illustriert in einem Flussdiagramm den Ablauf eines Verfahrens zum Er mitteln des Schwellwerts D. Zunächst (2000) wird das maschinelle Lernsystem 60 mit einem Trainingsdatensatz Xr mit zufällig gewählten Soll- Klassifikationen trai niert. Dann (2100) werden die optional die Gewichte des maschinellen Lernsys tems 60 normalisiert. Anschließend (2200) werden die Spannen m ermittelt, die sich für alle Eingangssignale des Trainingsdatensatz Xr ergeben. Dann (2300) wird der Spannenschwellwert mA so gewählt, dass ein vorgebbarer Anteil der er mittelten Schwellen m größer ist als der Spannenschwellwert mA und die übrigen ermittelten Schwellen m kleiner. Anschließend (2400) wird der Schwellwert (D) gleich einem vorgebbaren Faktor mal dem Spannenschwellwert mA gewählt, wo bei dieser Faktor beispielsweise den Wert eins annimmt. Damit endet dieses Ver fahren.
Der Begriff„Computer“ umfasst beliebige Geräte zur Abarbeitung vorgebbarer Rechenvorschriften. Diese Rechenvorschriften können in Form von Software vor liegen, oder in Form von Hardware, oder auch in einer Mischform aus Software und Hardware.
Es versteht sich ferner, dass die Verfahren nicht nur wie beschrieben vollständig in Software implementiert sein können. Sie können auch in Hardware implemen tiert sein, oder in einer Mischform aus Software und Hardware.

Claims

Ansprüche
1. Verfahren zum Ermitteln einer Zuverlässigkeit einer Klassifikation von Ein gangssignalen (x) mittels eines maschinellen Lernsystems (60), insbeson dere eines neuronalen Netzes, welches eingerichtet ist, aus Eingangssigna len (x) jeweils eine zugehörige Klasse einer Mehrzahl von Klassen zu ermit teln, wobei das maschinelle Lernsystem (60) eingerichtet ist, jeder der Klas sen einen Klassifizierungswert (p) zuzuordnen, wobei als zugehörige Klassi fikation diejenige Klasse ermittelt wird, deren zugeordneter Klassifizierungs wert (p) am höchsten ist, und wobei ein Zuverlässigkeitswert ermittelt wird, der eine Zuverlässigkeit der Klassifikation charakterisiert,
dadurch gekennzeichnet, dass der Zuverlässigkeitswert abhängig von den zwei höchsten der ermittelten Klassifizierungswerte (r1;r2) ermittelt wird.
2. Verfahren nach Anspruch 1, wobei die Zuverlässigkeit abhängig von einer Differenz p1— p2 zwischen dem höchsten (p und dem zweithöchsten (p2) dieser Klassifizierungswerte.
3. Verfahren nach Anspruch 2, wobei dann, insbesondere genau dann, auf eine zuverlässige Klassifikation entschieden wird, wenn die Differenz (pt— p2) größer ist als ein vorgebbarer Schwellwert (D).
4. Verfahren nach Anspruch 3, wobei der vorgebbare Schwellwert (D) abhängig von Ausgabewerten des maschinelle Lernsystems (60) auf einem nicht kor rekt gelabelten Trainingsdatensatz ( Xr ) ermittelt wird, mit dem das maschi nelle Lernsystem (60) trainiert wurde.
5. Verfahren nach Anspruch 4, wobei Soll- Klassifikationen des nicht korrekt ge labelten Trainingsdatensatzes ( Xr ) zufällig gewählt sind.
6. Verfahren nach Anspruch 5, wobei die gewünschten Klassifikationen (yr) der nicht korrekt gelabelten Trainingsdaten ( Xr ) durch eine zufällige Permutation der gewünschten Klassifikationen (yr) aus einem Datensatz korrekt gelabel- ter Trainingsdaten ( Xc ) ermittelt werden.
7. Verfahren nach Anspruch 5, wobei die gewünschten Klassifikationen (yr) der nicht korrekt gelabelten Trainingsdaten ( Xr ) durch Beaufschlagen der ge wünschten Klassifikationen ( yT ) aus dem Datensatz korrekt gelabelter Trai ningsdaten ( Xc ) mit einem zufälligen Rauschen erhalten werden.
8. Verfahren nach einem der Ansprüche 4 bis 7, wobei der vorgebbare
Schwellwert (D) eine Häufigkeitsverteilung von Spannen (m) charakterisiert, die sich ergibt, wenn das maschinelle Lernsystem (60) mit einem Satz nicht korrekt gelabelten Trainingsdaten ( Xr ) trainiert wird.
9. Verfahren nach Anspruch 8, wobei der vorgebbare Schwellwert (D) abhängig von einem Spannenschwellwert (mA) ermittelt wird, wobei dieser Spannen schwellwert (mA) derart gewählt ist, dass ein vorgebbarer Anteil der Häufig keitsverteilung größer ist als der Spannenschwellwert (mA).
10. Verfahren zum Bereitstellen eines Ansteuerungssignals (A) zur Ansteuerung eines Aktors (10) abhängig von einer Klassifikation eines Eingangssignals(x) mittels eines maschinellen Lernsystems (60), wobei mittels des Verfahrens nach einem der Ansprüche 1 bis 9 ein Zuverlässigkeitswert dieser Klassifika tion ermittelt wird und das Ansteuerungssignal (A) abhängig vom ermittelten Zuverlässigkeitswert gewählt wird.
11. Steuerungssystem (40) umfassend eine Ein- oder Mehrzahl von Prozesso ren (45) und wenigstens ein maschinenlesbares Speichermedium (46), auf dem Anweisungen gespeichert sind, die dann, wenn sie auf den Prozesso ren (45) ausgeführt werden, das Steuerungssystem (40) veranlassen, das Verfahren nach einem der Ansprüche 1 bis 10 auszuführen.
12. Computerprogramm, das eingerichtet ist, das Verfahren nach einem der An sprüche 1 bis 10 auszuführen.
13. Maschinenlesbares Speichermedium (46, 146), auf dem das Computerpro gramm nach Anspruch 12 gespeichert ist.
PCT/EP2020/053536 2019-02-25 2020-02-12 Verfahren und vorrichtung zum betreiben eines steuerungssystems WO2020173700A1 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102019202523.4 2019-02-25
DE102019202523.4A DE102019202523A1 (de) 2019-02-25 2019-02-25 Verfahren und Vorrichtung zum Betreiben eines Steuerungssystems

Publications (1)

Publication Number Publication Date
WO2020173700A1 true WO2020173700A1 (de) 2020-09-03

Family

ID=69572003

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2020/053536 WO2020173700A1 (de) 2019-02-25 2020-02-12 Verfahren und vorrichtung zum betreiben eines steuerungssystems

Country Status (2)

Country Link
DE (1) DE102019202523A1 (de)
WO (1) WO2020173700A1 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102020131995A1 (de) 2020-12-02 2022-06-23 Bayerische Motoren Werke Aktiengesellschaft Validator für eine Positionsbestimmung
DE102021201461A1 (de) * 2021-02-16 2022-08-18 Continental Automotive Gmbh System zur Überwachung von Vitaldaten eines Insassen eines Fahrzeugs

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180114133A1 (en) * 2016-10-21 2018-04-26 Stmicroelectronics, Inc. Method and apparatus for energy efficient probabilistic context awareness of a mobile or wearable device user by switching between a single sensor and multiple sensors
DE102018209595A1 (de) 2018-06-14 2019-12-19 Robert Bosch Gmbh Verfahren zum automatischen Bestimmen eines Straßenzustands

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180114133A1 (en) * 2016-10-21 2018-04-26 Stmicroelectronics, Inc. Method and apparatus for energy efficient probabilistic context awareness of a mobile or wearable device user by switching between a single sensor and multiple sensors
DE102018209595A1 (de) 2018-06-14 2019-12-19 Robert Bosch Gmbh Verfahren zum automatischen Bestimmen eines Straßenzustands

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KONRAD GROH: "OVERFITTING DETECTION OF DEEP NEURAL NET- WORKS WITHOUT A HOLD OUT SET", 28 September 2018 (2018-09-28), XP055692595, Retrieved from the Internet <URL:https://openreview.net/pdf?id=B1lKtjA9FQ> [retrieved on 20200507] *
WINDEATT T ED - IMPEDOVO SEBASTIANO ET AL: "Vote counting measures for ensemble classifiers", PATTERN RECOGNITION, ELSEVIER, GB, vol. 36, no. 12, 1 December 2003 (2003-12-01), pages 2743 - 2756, XP004461084, ISSN: 0031-3203, DOI: 10.1016/S0031-3203(03)00191-2 *

Also Published As

Publication number Publication date
DE102019202523A1 (de) 2020-08-27

Similar Documents

Publication Publication Date Title
WO2020260020A1 (de) Verfahren und vorrichtung zum überprüfen der robustheit eines künstlichen neuronalen netzes
DE102018218586A1 (de) Verfahren, Vorrichtung und Computerprogramm zum Erzeugen robuster automatisch lernender Systeme und Testen trainierter automatisch lernender Systeme
DE202020101012U1 (de) Vorrichtung zum Vorhersagen einer geeigneten Konfiguration eines maschinellen Lernsystems für einen Trainingsdatensatz
DE102020210352A1 (de) Verfahren und Vorrichtung zum Transferlernen zwischen modifizierten Aufgaben
WO2020173700A1 (de) Verfahren und vorrichtung zum betreiben eines steuerungssystems
DE102019209457A1 (de) Verfahren zum Trainieren eines künstlichen neuronalen Netzes, künstliches neuronales Netz, Verwendung eines künstlichen neuronalen Netzes sowie entsprechendes Computerprogramm, maschinenlesbares Speichermedium und entsprechende Vorrichtung
WO2020260016A1 (de) Verfahren und vorrichtung zum trainieren eines maschinellen lernsystems
DE102018218834A1 (de) Verfahren und Vorrichtung zum Ermitteln eines Ansteuersignals
EP3853778A1 (de) Verfahren und vorrichtung zum betreiben eines steuerungssystems
DE102020208828A1 (de) Verfahren und Vorrichtung zum Erstellen eines maschinellen Lernsystems
DE102020208309A1 (de) Verfahren und Vorrichtung zum Erstellen eines maschinellen Lernsystems
EP3899809A1 (de) Verfahren und vorrichtung zum klassifizieren von sensordaten und zum ermitteln eines ansteuersignals zum ansteuern eines aktors
DE102020207564A1 (de) Verfahren und Vorrichtung zum Trainieren eines Bildklassifikators
DE102020212514A1 (de) Verfahren zur Ermittlung eines Ausgabesignals mittels eines maschinellen Lernsystems
WO2020126378A1 (de) Verfahren zum trainieren eines neuronalen netzes
DE102019209228A1 (de) Verfahren und Vorrichtung zum Überprüfen der Robustheit eines künstlichen neuronalen Netzes
EP3915058A1 (de) Verfahren zum trainieren eines neuronalen netzes
DE102018216295B4 (de) Verfahren und Vorrichtung zum Ermitteln eines Ansteuersignals zum Ansteuern eines Aktors
EP3701428A1 (de) Verfahren und vorrichtung zum verbessern der robustheit eines maschinellen lernsystems
DE102020211714A1 (de) Verfahren und Vorrichtung zum Erstellen eines maschinellen Lernsystems
DE102020213814A1 (de) Verfahren und Vorrichtung zum Ermitteln einer Abdeckung eines neuronalen Netzes
DE102019207408A1 (de) Verfahren und Vorrichtung zum Betreiben eines neuronalen Netzes
DE102022209517A1 (de) Verfahren und Vorrichtung zum Trainieren eines Objektdetektors
DE102020203807A1 (de) Verfahren und Vorrichtung zum Trainieren eines Bildklassifikators
DE102020202392A1 (de) Verfahren, Vorrichtung und Computerprogramm zum Vorhersagen einer geeigneten Konfiguration eines maschinellen Lernsystems für einen Trainingsdatensatz

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20705053

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20705053

Country of ref document: EP

Kind code of ref document: A1