DE102020203807A1 - Method and apparatus for training an image classifier - Google Patents
Method and apparatus for training an image classifier Download PDFInfo
- Publication number
- DE102020203807A1 DE102020203807A1 DE102020203807.4A DE102020203807A DE102020203807A1 DE 102020203807 A1 DE102020203807 A1 DE 102020203807A1 DE 102020203807 A DE102020203807 A DE 102020203807A DE 102020203807 A1 DE102020203807 A1 DE 102020203807A1
- Authority
- DE
- Germany
- Prior art keywords
- image classifier
- image
- output signal
- input
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 31
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000004590 computer program Methods 0.000 claims description 3
- 238000003860 storage Methods 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 14
- 238000004519 manufacturing process Methods 0.000 description 11
- 230000001276 controlling effect Effects 0.000 description 9
- 230000008901 benefit Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000002059 diagnostic imaging Methods 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- BUHVIAUBTBOHAG-FOYDDCNASA-N (2r,3r,4s,5r)-2-[6-[[2-(3,5-dimethoxyphenyl)-2-(2-methylphenyl)ethyl]amino]purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1=CC(OC)=CC(C(CNC=2C=3N=CN(C=3N=CN=2)[C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=2C(=CC=CC=2)C)=C1 BUHVIAUBTBOHAG-FOYDDCNASA-N 0.000 description 1
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000009189 diving Effects 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000009187 flying Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 230000009184 walking Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B6/00—Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment
- A61B6/02—Arrangements for diagnosis sequentially in different planes; Stereoscopic radiation diagnosis
- A61B6/03—Computed tomography [CT]
- A61B6/032—Transmission computed tomography [CT]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B6/00—Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment
- A61B6/46—Arrangements for interfacing with the operator or the patient
- A61B6/461—Displaying means of special interest
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B6/00—Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment
- A61B6/52—Devices using data or image processing specially adapted for radiation diagnosis
- A61B6/5211—Devices using data or image processing specially adapted for radiation diagnosis involving processing of medical diagnostic data
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B6/00—Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment
- A61B6/54—Control of apparatus or devices for radiation diagnosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B8/00—Diagnosis using ultrasonic, sonic or infrasonic waves
- A61B8/46—Ultrasonic, sonic or infrasonic diagnostic devices with special arrangements for interfacing with the operator or the patient
- A61B8/461—Displaying means of special interest
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B8/00—Diagnosis using ultrasonic, sonic or infrasonic waves
- A61B8/52—Devices using data or image processing specially adapted for diagnosis using ultrasonic, sonic or infrasonic waves
- A61B8/5215—Devices using data or image processing specially adapted for diagnosis using ultrasonic, sonic or infrasonic waves involving processing of medical diagnostic data
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B8/00—Diagnosis using ultrasonic, sonic or infrasonic waves
- A61B8/54—Control of the diagnostic device
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C9/00—Individual registration on entry or exit
- G07C9/30—Individual registration on entry or exit not involving the use of a pass
- G07C9/32—Individual registration on entry or exit not involving the use of a pass in combination with an identity check
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Image Analysis (AREA)
Abstract
Computerimplementiertes Verfahren zum Training eines Bildklassifikators (60), wobei der Bildklassifikator (60) zu einer Mehrzahl von Eingabebildern eine entsprechende Mehrzahl von Ausgabesignalen ermittelt, wobei ein Ausgabesignal jeweils auf Merkmalsrepräsentationen von wenigstens zwei Eingabebildern der Mehrzahl von Eingabebildern basiert, wobei die Merkmalsrepräsentationen vom Bildklassifikator (60) ermittelt werden.Computer-implemented method for training an image classifier (60), the image classifier (60) determining a corresponding plurality of output signals for a plurality of input images, an output signal being based in each case on feature representations of at least two input images of the plurality of input images, the feature representations from the image classifier ( 60) can be determined.
Description
Die Erfindung betrifft einen Verfahren zum Trainieren eines Bildklassifikators, ein Verfahren zum Betreiben eines Bildklassifikators, eine Trainingsvorrichtung, ein Computerprogramm und ein maschinenlesbares Speichermedium.The invention relates to a method for training an image classifier, a method for operating an image classifier, a training device, a computer program and a machine-readable storage medium.
Stand der TechnikState of the art
Aus der nicht vorveröffentlichten
Vorteile der ErfindungAdvantages of the invention
Neuronale Netze erzielen derzeit auf verschiedenen Feldern Bestleistungen in Bezug auf Klassifikationsgenaugkeit. Während des Trainings sind sie jedoch anfällig gegenüber dem Phänomen des Overfittings, also des Überanpassens an die zum Training verwendeten Daten.Neural networks are currently achieving top performances in terms of classification accuracy in various fields. During training, however, they are prone to the phenomenon of overfitting, i.e. overfitting to the data used for training.
Der Vorteil des Verfahrens mit Merkmalen des unabhängig Anspruchs 1 ist, dass ein Bildklassifikator derart während des Trainings regularisiert werden kann, dass Overfitting vermieden oder zumindest gemildert werden kann. Hierdurch steigert sich die Klassifikationsgenauigkeit des Bildklassifikators.The advantage of the method with the features of
Offenbarung der ErfindungDisclosure of the invention
In einem ersten Aspekt beschäftigt sich die Erfindung mit einem computerimplementierten Verfahren zum Training eines Bildklassifikators, wobei der Bildklassifikator zu einer Mehrzahl von Eingabebildern eine entsprechende Mehrzahl von Ausgabesignalen ermittelt, wobei ein Ausgabesignal jeweils auf Merkmalsrepräsentationen von wenigstens zwei Eingabebildern der Mehrzahl von Eingabebildern basiert, wobei die Merkmalsrepräsentationen vom Bildklassifikator ermittelt werden.In a first aspect, the invention deals with a computer-implemented method for training an image classifier, the image classifier determining a corresponding plurality of output signals for a plurality of input images, an output signal being based in each case on feature representations of at least two input images of the plurality of input images, the Feature representations are determined by the image classifier.
Unter einem Bildklassifikator kann eine Vorrichtung verstanden werden, die dahingehend ausgeprägt ist, dass sie ein oder mehrere Eingabebilder entgegennehmen kann und ein oder mehrere Ausgabesignale ermitteln kann, die eine Klassifikation der entsprechenden Eingabebilder oder Teile der entsprechenden Eingabebilder charakterisieren. Zum Beispiel kann ein Bildklassifikator verwendet werden, um zu detektieren, in welchen Teilen eines Bildes, welches als Eingabebild dem Bildklassifikator zur Verfügung gestellt wird, sich Objekte befinden.An image classifier can be understood to mean a device that is designed to accept one or more input images and determine one or more output signals that characterize a classification of the corresponding input images or parts of the corresponding input images. For example, an image classifier can be used to detect in which parts of an image, which is made available to the image classifier as an input image, objects are located.
Neben der Objektdetektion kann ein Bildklassifikator auch für andere Klassifikationsaufgaben verwendet werden, zum Beispiel für semantische Segmentierung. Hierbei klassifiziert der Bildklassifikator jeden gewünschten Punkt in einem Eingabebild, zum Beispiel jeden Pixel eines Kamerabildes, in eine gewünschte Klasse.In addition to object detection, an image classifier can also be used for other classification tasks, for example for semantic segmentation. The image classifier classifies every desired point in an input image, for example every pixel of a camera image, into a desired class.
Die Ermittlung eines Ausgabesignals durch den Bildklassifikator kann weitere Vor- und/oder Nachverarbeitungsverfahren beinhalten. Bei einer Objektdetektion können zum Beispiel Detektionen, die sich stark überlappen, zu einer Detektion zusammengefasst werden.The determination of an output signal by the image classifier can include further preprocessing and / or postprocessing methods. In the case of object detection, for example, detections that strongly overlap can be combined into one detection.
Die Eingabebilder, die dem Bildklassifikator zugeführt werden, können unterschiedliche Arten von Bilddaten darstellen, insbesondere Sensordaten, beispielsweise von einem Kamerasensor, einem Radarsensor, einem LIDAR-Sensor, einem Ultraschallsensor oder einem Infrarotkamerasensor. Auch Audioaufnahmen von Mikrofonen können als Eingabebild verwendet werden, zum Beispiel in Form von Spektralbildern.The input images that are fed to the image classifier can represent different types of image data, in particular sensor data, for example from a camera sensor, a radar sensor, a LIDAR sensor, an ultrasonic sensor or an infrared camera sensor. Audio recordings from microphones can also be used as input images, for example in the form of spectral images.
Es ist weiterhin vorstellbar, dass mehrere Arten von Eingabedaten kombiniert werden können, um ein Eingabebild für den Bildklassifikator zu erhalten.It is also conceivable that several types of input data can be combined in order to obtain an input image for the image classifier.
Alternativ können Eingabebilder mit Hilfe von computergestützten Maßnahmen synthetisch erzeugt werden. Zum Beispiel können Bilder basierend auf physikalischen Modellen berechnet bzw. gerendert werden.Alternatively, input images can be generated synthetically with the help of computer-aided measures. For example, images can be calculated or rendered based on physical models.
Es wird davon ausgegangen, dass der Bildklassifikator derart ausgeprägt ist, dass es in der Lage ist die Eingabedaten des Eingabebilds zu verarbeiten.It is assumed that the image classifier is so pronounced that it is able to process the input data of the input image.
Das Ausgabesignal kann als Prädiktion einer Eigenschaft des Eingabebilds durch den Bildklassifikator aufgefasst werden. Dabei kann das Ausgabesignal von einem gewünschten Ausgabesignal abweichen, das heißt der Bildklassifikator kann eine Fehlklassifikation ausgeben. In diesem Sinne kann die Performanz eines Bildklassifikators als die Klassifikationsgenauigkeit verstanden werden, also die Fähigkeit für ein Eingabebild eine gewünschte Klassifikation auszugeben. Im Allgemeinen ist eine hohe Performanz von höchster Wichtigkeit, da Fehlklassifikationen zu einem ungewollten und/oder gefährlichen Verhalten einer Vorrichtung führen können, die der Bildklassifikator betreibt.The output signal can be interpreted as a prediction of a property of the input image by the image classifier. In this case, the output signal can deviate from a desired output signal, that is to say the image classifier can output a misclassification. In this sense, the performance of an image classifier can be understood as the classification accuracy, i.e. the ability to output a desired classification for an input image. In general, high performance is of the utmost importance, since misclassifications can lead to undesired and / or dangerous behavior of a device operated by the image classifier.
Für das Training des Bildklassifikators kann ein Trainingsdatensatz verwendet werden, der Eingabebilder und entsprechende gewünschte Ausgabesignale umfasst. Auf Basis des Trainingsdatensatzes kann der Bildklassifikator vorzugsweise durch ein schrittweises Gradientenabstiegsverfahren auf Basis von Batches (engl. für Stapel) trainiert werden. Für einen Schritt des Gradientenabstiegsverfahrens kann aus der Menge der Trainingsdaten ein Batch mit einer vordefinierten Anzahl an Eingabebilden vorzugsweise zufällig ermittelt werden. Für die Eingabebilder des Batches kann der Bildklassifikator entsprechende Ausgabesignale ermitteln. Anschließend kann ein Kostenwert ermittelt werden, der ein Maß charakterisiert, inwiefern die Ausgabesignale mit den entsprechenden gewünschten Ausgabesignalen des Batches übereinstimmen. Das Training kann dann mit bekannten Verfahren basierend auf dem Kostenwert durchgeführt werden.For training the image classifier, a training data set can be used which comprises input images and corresponding desired output signals. On the basis of the training data set, the image classifier can preferably be trained by a step-by-step gradient descent method on the basis of batches. For one step of the gradient descent process, a batch with a predefined number of inputs can be formed from the set of training data preferably be determined randomly. The image classifier can determine corresponding output signals for the input images of the batch. A cost value can then be determined which characterizes a measure of the extent to which the output signals match the corresponding desired output signals of the batch. The training can then be performed using known methods based on the cost value.
Im Kontext der Erfindung wird verstanden, dass ein Bildklassifikator Merkmalsrepräsentationen von Eingabebildern ermitteln kann. Zum Beispiel kann der Bildklassifikator in Form eines neuronalen Netzes realisiert sein, wobei die Schichten des neuronalen Netzes jeweils Merkmalsrepräsentationen zu entsprechenden Eingabebildern ermitteln können.In the context of the invention it is understood that an image classifier can determine feature representations of input images. For example, the image classifier can be implemented in the form of a neural network, wherein the layers of the neural network can each determine feature representations for corresponding input images.
Anstatt bestimmte Merkmalsrepräsentationen eines Eingabebilds wie sonst üblich als Ausgabesignal zu verwenden, werden im ersten Aspekt der Erfindung die Merkmalsrepräsentationen anderer Eingabebilder des Batches zusätzlich verwendet, um das Ausgabesignal für das Eingabebild zu ermitteln. Hierfür kann beispielsweise eine Linearkombination der Repräsentation des Eingabebilds sowie weiteren Repräsentationen von anderen Eingabebilden verwendet werden.Instead of using certain feature representations of an input image as the usual output signal, in the first aspect of the invention the feature representations of other input images of the batch are additionally used to determine the output signal for the input image. For this purpose, for example, a linear combination of the representation of the input image and further representations of other input images can be used.
Diese Herangehensweise kann so verstanden werden, als dass die eigentliche Merkmalsrepräsentation des Eingabebildes mit einem entsprechenden Rauschen versehen wird. Dieses Hinzufügen von Rauschen hat einen regularisierenden Effekt auf das Training des Bildklassifikators. Es ist bekannt, dass Regularisierung während des Trainings dem Phänomen des Overfitting (eng. Überanpassung) entgegenwirkt und somit die Performanz des Bildklassifikators verbessert werden kann.This approach can be understood as providing the actual feature representation of the input image with corresponding noise. This addition of noise has a regularizing effect on the training of the image classifier. It is known that regularization counteracts the phenomenon of overfitting during training and thus the performance of the image classifier can be improved.
In einem weiteren Aspekt der Erfindung ist denkbar, dass die Mehrzahl der Eingabebilder eine Folge von Eingabebildern ist und ein Ausgabesignal für ein erstes Eingabebild von einer Merkmalsrepräsentation des Vorgängers und/oder einer Merkmalsrepräsentation des Nachfolgers des ersten Eingabebilds abhängt.In a further aspect of the invention, it is conceivable that the plurality of input images is a sequence of input images and an output signal for a first input image depends on a feature representation of the predecessor and / or a feature representation of the successor of the first input image.
Unter einem Vorgänger bzw. Nachfolger können Eingabebilder verstanden werden, die zum Beispiel in einem Batch dem ersten Eingabebild entsprechend vorgehen oder nachfolgen. Zu diesem Zweck kann der Batch als ringförmig verstanden werden, das heißt für das erste Element des Batches von Eingabebilden ist der Vorgänger das letzte Element des Batches und für das letzte Element des Batches ist das erste Element des Batches der Nachfolger.A predecessor or successor can be understood to mean input images which, for example, proceed or follow the first input image in a batch. For this purpose, the batch can be understood as ring-shaped, i.e. for the first element of the batch of input images the predecessor is the last element of the batch and for the last element of the batch the first element of the batch is the successor.
Der Vorteil dieser Weiterbildung ist, dass die Regularisierung von einem Computer effizient berechnet werden kann, da Merkmalsrepräsentationen von der Folge von Eingabebilden typischerweise sequentiell im Speicher des Computers abgelegt werden. Hierdurch kann der Computer schnell auf die Repräsentation des Vorgängers bzw. Nachfolgers zugreifen, wodurch das Training des Bildklassifikators beschleunigt wird. Der Vorteil eines beschleunigten Trainings liegt darin, dass für eine vordefinierte Trainingszeit der Bildklassifikator mehr Trainingsschritte durchführen kann und dadurch mehr Eingabebilder verarbeiten kann, was zu einer Extraktion von mehr Informationen aus dem Trainingsdaten und dadurch zu einer höheren Performanz des Bildklassifikators führt.The advantage of this development is that the regularization can be calculated efficiently by a computer, since feature representations from the sequence of input images are typically stored sequentially in the memory of the computer. As a result, the computer can quickly access the representation of the predecessor or successor, whereby the training of the image classifier is accelerated. The advantage of accelerated training is that the image classifier can carry out more training steps for a predefined training time and can thus process more input images, which leads to an extraction of more information from the training data and thus to a higher performance of the image classifier.
In einem weiteren Aspekt ist vorstellbar, dass ein Ausgabesignal durch eine Linearkombination der Merkmalsrepräsentationen des Vorgängers, der Merkmalsrepräsentation des Nachfolgers und der Merkmalsrepräsentation des ersten Eingabebildes ermittelt wird..In a further aspect, it is conceivable that an output signal is determined by a linear combination of the feature representations of the predecessor, the feature representation of the successor and the feature representation of the first input image.
Der Vorteil der Linearkombination liegt darin, dass die Gewichtung der einzelnen Merkmalsrepräsentationen derart angepasst werden kann, dass ein gewünschtes Rauschverhalten beim Training erreicht wird. Hierdurch kann das Training des Bildklassifikators den Trainingsdaten entsprechend angepasst werden, wodurch sich die Performanz des Bildklassifikators weiter erhöht.The advantage of the linear combination is that the weighting of the individual feature representations can be adapted in such a way that a desired noise behavior is achieved during training. As a result, the training of the image classifier can be adapted accordingly to the training data, which further increases the performance of the image classifier.
In einem weiteren Aspekt beschäftigt sich die Erfindung mit einem computerimplementierten Verfahren zum Klassifizieren eines Eingabebildes mittels eines Bildklassifikators umfassend die Schritte:
- • Trainieren des Bildklassifikators gemäß einem Verfahren der vorherigen Aspekte;
- • Bereitstellen des trainierten Bildklassifikators an eine Inferenzvorrichtung;
- • Ermittlung eines Ausgabesignals basierend auf dem Eingabebild durch die Inferenzvorrichtung, wobei die Inferenzvorrichtung zur Ermittlung des Ausgabesignals das Eingabebild dem Bildklassifikator zuführt und der Bildklassifikator das Ausgabesignal ermittelt.
- • training the image classifier according to a method of the previous aspects;
- • providing the trained image classifier to an inference device;
- Determination of an output signal based on the input image by the inference device, the inference device supplying the input image to the image classifier to determine the output signal and the image classifier determining the output signal.
Der Vorteil der Herangehensweise dieses Aspekts ist, dass der mit einem Verfahren der vorherigen Aspekte Bildklassifikator für einzelne Eingabebilder entsprechende Ausgabesignale ermitteln kann. Hierfür kann der Bildklassifikator das Ausgabesignal unabhängig von Repräsentationen eines Vorgänger- oder Nachfolgereingabebilds ermitteln. Dadurch wird der Inferenzvorrichtung ermöglicht, dass das Ausgabesignal in Echtzeit ermittelt werden kann. Dies ist insbesondere bei sicherheitskritischen Anwendungen der Inferenzvorrichtung von höchster Wichtigkeit, da eine verzögerte Ermittlung eines Ausgabesignals zu einem ungewollten und/oder sicherheitskritischen Verhalten führen kann.The advantage of the approach of this aspect is that the image classifier for individual input images can determine corresponding output signals with a method of the previous aspects. For this purpose, the image classifier can determine the output signal independently of representations of a preceding or following input image. This enables the inference device to be able to determine the output signal in real time. This is of the greatest importance in particular in the case of safety-critical applications of the inference device, since a delayed determination of an output signal can lead to undesired and / or safety-critical behavior.
Nachfolgend werden Ausführungsformen der Erfindung unter Bezugnahme auf die beiliegenden Zeichnungen näher erläutert. In den Zeichnungen zeigen:
-
1 schematisch einen Aufbau eines Steuerungssystems zur Ansteuerung eines Aktors; -
2 schematisch ein Ausführungsbeispiel zur Steuerung eines wenigstens teilautonomen Roboters; -
3 schematisch ein Ausführungsbeispiel zur Steuerung eines Fertigungssystems; -
4 schematisch ein Ausführungsbeispiel zur Steuerung eines Zugangssystems; -
5 schematisch ein Ausführungsbeispiel zur Steuerung eines Überwachungssystems; -
6 schematisch ein Ausführungsbeispiel zur Steuerung eines persönlichen Assistenten; -
7 schematisch ein Ausführungsbeispiel zur Steuerung eines medizinisch bildgebenden Systems; -
8 eine beispielhafte Ermittlung eines Kostenwerts während eines Trainingsschritts.
-
1 schematically a structure of a control system for controlling an actuator; -
2 schematically an embodiment for controlling an at least partially autonomous robot; -
3 schematically an embodiment for controlling a manufacturing system; -
4th schematically an embodiment for controlling an access system; -
5 schematically an embodiment for controlling a monitoring system; -
6th schematically an embodiment for controlling a personal assistant; -
7th schematically an embodiment for controlling a medical imaging system; -
8th an exemplary determination of a cost value during a training step.
Beschreibung der AusführungsbeispieleDescription of the exemplary embodiments
Das Steuerungssystem (
Der Bildklassifikator (
Der Bildklassifikator (
Der Aktor (
In weiteren Ausführungsformen umfasst das Steuerungssystem (
In weiteren bevorzugten Ausführungsformen umfasst das Steuerungssystem (
In alternativen Ausführungsformen ist alternativ oder zusätzlich zum Aktor (
Bei dem Sensor (
Der Bildklassifikator (
Bei dem vorzugsweise im Kraftfahrzeug (
Alternativ kann es sich bei dem wenigstens teilautonomen Roboter auch um einen anderen mobilen Roboter (nicht abgebildet) handeln, beispielsweise um einen solchen, der sich durch Fliegen, Schwimmen, Tauchen oder Schreiten fortbewegt. Bei dem mobilen Roboter kann es sich beispielsweise auch um einen wenigstens teilautonomen Rasenmäher oder einen wenigstens teilautonomen Putzroboter handeln. Auch in diesen Fällen kann das Ansteuersignal (
Alternativ oder zusätzlich kann mit dem Ansteuersignal (
Bei dem Sensor (
Abhängig von den Signalen des Sensors (
Diese entsprechende Ansteuerung kann beispielsweise beinhalten, dass der persönliche Assistent (
Anstelle des persönlichen Assistenten (
Dem Bildklassifikator (
Für die verschiedenen Eingabebilder (
Die verschiedenen Ausgabesignale (
Nachdem das kombinierte Ausgabesignal (
Es ist beispielsweise denkbar, dass auf Basis des Kostenwerts ein bekanntes Gradientenabstiegsverfahren durchgeführt wird, wie etwa SGD oder Adam.For example, it is conceivable that a known gradient descent method, such as SGD or Adam, is carried out on the basis of the cost value.
ZITATE ENTHALTEN IN DER BESCHREIBUNGQUOTES INCLUDED IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant was generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.
Zitierte PatentliteraturPatent literature cited
- DE 102018211875 [0002]DE 102018211875 [0002]
Claims (8)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102020203807.4A DE102020203807A1 (en) | 2020-03-24 | 2020-03-24 | Method and apparatus for training an image classifier |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102020203807.4A DE102020203807A1 (en) | 2020-03-24 | 2020-03-24 | Method and apparatus for training an image classifier |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102020203807A1 true DE102020203807A1 (en) | 2021-09-30 |
Family
ID=77658665
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102020203807.4A Pending DE102020203807A1 (en) | 2020-03-24 | 2020-03-24 | Method and apparatus for training an image classifier |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102020203807A1 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102018211875A1 (en) | 2018-07-17 | 2020-01-23 | Robert Bosch Gmbh | Method and device for operating a control system |
-
2020
- 2020-03-24 DE DE102020203807.4A patent/DE102020203807A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102018211875A1 (en) | 2018-07-17 | 2020-01-23 | Robert Bosch Gmbh | Method and device for operating a control system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102019209565A1 (en) | Method and device for checking the robustness of an artificial neural network | |
DE102020210352A1 (en) | Method and device for transfer learning between modified tasks | |
DE102020212515A1 (en) | Method and device for training a machine learning system | |
DE202020101012U1 (en) | Device for predicting a suitable configuration of a machine learning system for a training data set | |
DE112020003343T5 (en) | SYSTEM AND PROCESS USING A ROBUST DEEP GENERATIVE MODEL | |
WO2020260016A1 (en) | Method and apparatus for training a machine learning system | |
DE102019202523A1 (en) | Method and device for operating a control system | |
DE102020211262A1 (en) | Method and device for compressing a neural network | |
DE102020203807A1 (en) | Method and apparatus for training an image classifier | |
DE102018218834A1 (en) | Method and device for determining a control signal | |
DE102022201679A1 (en) | Method and device for training a neural network | |
DE102020212514A1 (en) | Method for determining an output signal using a machine learning system | |
DE202020104005U1 (en) | Device for creating a system for the automated creation of machine learning systems | |
DE102021204040A1 (en) | Method, device and computer program for creating training data in the vehicle | |
DE102020208828A1 (en) | Method and device for creating a machine learning system | |
DE102020207564A1 (en) | Method and apparatus for training an image classifier | |
DE102020208309A1 (en) | Method and device for creating a machine learning system | |
DE102020204005A1 (en) | Method and apparatus for training an image classifier | |
DE102021202813A1 (en) | Method, device and computer program for an uncertainty assessment of an image classification | |
DE102020216188A1 (en) | Apparatus and method for training a classifier | |
DE102018216295B4 (en) | Method and device for determining a control signal for controlling an actuator | |
DE102019209228A1 (en) | Method and device for checking the robustness of an artificial neural network | |
DE102019215120A1 (en) | Method and device for classifying sensor data and for determining a control signal for controlling an actuator | |
DE102018216078A1 (en) | Method and device for operating a control system | |
DE202020104727U1 (en) | Device for transfer learning between modified tasks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R079 | Amendment of ipc main class |
Free format text: PREVIOUS MAIN CLASS: G06K0009620000 Ipc: G06V0030190000 |