WO2022128787A1 - Verfahren und vorrichtung zum trainieren eines klassifikators für molekularbiologische untersuchungen - Google Patents

Verfahren und vorrichtung zum trainieren eines klassifikators für molekularbiologische untersuchungen Download PDF

Info

Publication number
WO2022128787A1
WO2022128787A1 PCT/EP2021/085187 EP2021085187W WO2022128787A1 WO 2022128787 A1 WO2022128787 A1 WO 2022128787A1 EP 2021085187 W EP2021085187 W EP 2021085187W WO 2022128787 A1 WO2022128787 A1 WO 2022128787A1
Authority
WO
WIPO (PCT)
Prior art keywords
classifier
input signal
output signal
signal
evaluation points
Prior art date
Application number
PCT/EP2021/085187
Other languages
English (en)
French (fr)
Inventor
Nicole Ying Finnie
Jan Hendrik Metzen
Jeremy Zieg Kolter
Original Assignee
Robert Bosch Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch Gmbh filed Critical Robert Bosch Gmbh
Priority to EP21839066.4A priority Critical patent/EP4260241A1/de
Priority to CN202180093598.1A priority patent/CN116940945A/zh
Priority to US18/257,343 priority patent/US20240028892A1/en
Publication of WO2022128787A1 publication Critical patent/WO2022128787A1/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N35/00Automatic analysis not limited to methods or materials provided for in any single one of groups G01N1/00 - G01N33/00; Handling materials therefor
    • G01N35/00029Automatic analysis not limited to methods or materials provided for in any single one of groups G01N1/00 - G01N33/00; Handling materials therefor provided with flat sample substrates, e.g. slides
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N35/00Automatic analysis not limited to methods or materials provided for in any single one of groups G01N1/00 - G01N33/00; Handling materials therefor
    • G01N35/00029Automatic analysis not limited to methods or materials provided for in any single one of groups G01N1/00 - G01N33/00; Handling materials therefor provided with flat sample substrates, e.g. slides
    • G01N2035/00099Characterised by type of test elements
    • G01N2035/00158Elements containing microarrays, i.e. "biochip"

Definitions

  • the invention relates to a method for training a classifier, a method for classification using the trained classifier, a training device, a system for data processing, a computer program and a machine-readable storage medium
  • DE 10 2016 222 075 A1 discloses a method for processing a cartridge, in particular a microfluidic cartridge, and a biological sample received in the cartridge by means of a processing unit.
  • the invention relates to a computer-implemented method for training a classifier, comprising the steps:
  • the first input signal characterizes a plurality of evaluation points of a molecular-biological examination system and a desired output signal, which characterizes a classification of the evaluation points, is assigned to the first input signal;
  • the evaluation points can in particular be evaluation points of a laboratory on a chip (lab-on-chip system), which evaluate a biological sample, e.g. a blood sample, a urine sample, a saliva sample or a sample from a smear, in particular with regard to Presence of at least one pathogen, eg at least one virus and/or at least one bacterium and/or at least one fungus in the sample.
  • the procedure can be understood as training the classifier to determine a classification based on the evaluation points.
  • the classification can characterize whether the at least one pathogen is present in the sample or not or with what probability the at least one pathogen is present in the sample and/or with what probability the at least one pathogen is not present in the sample.
  • the method can also be understood in such a way that, for training purposes, the presence or absence of the at least one pathogen is indicated to the classifier by means of the desired output signal.
  • the classifier is able to determine whether or not the at least one pathogen is present in the new sample based on a new plurality of score points related to a new sample.
  • the lab-on-chip system can in particular include a microarray.
  • a microarray can be understood to mean an analysis system that enables the parallel analysis of several, in particular several tens or several hundred to thousands, individual detections in a small amount of biological sample material.
  • microarrays which are also referred to as gene chips or biochips, since they can contain a lot of information in a very small space, comparable to a computer chip.
  • the microarray can have a plurality of evaluation points (spots) on which the sample can be applied.
  • reagents eg certain proteins
  • the biochemical reactions can result in electromagnetic radiation being emitted at the corresponding positions of the evaluation points of the microarray based on chemiluminescence. It is also possible that after a corresponding biochemical reaction by means of fluorescence, electromagnetic radiation is emitted at the corresponding positions.
  • the electromagnetic radiation generated can be measured using an optoelectronic sensor, in particular a camera, and can be provided, for example, in the form of an image. Since the evaluation points emit electromagnetic radiation of different strengths depending on the reagents and the presence or absence of the at least one pathogen, an image characteristic of the sample is produced. In particular, the evaluation points depicted in the image can have different brightness levels.
  • the image can be used as the first input signal.
  • Certain parts of the input signal can be understood as belonging to individual evaluation points. For example, certain areas of the image can each be assigned to individual evaluation points.
  • the image can be broken down into a plurality of second images depending on the position of the evaluation points, with each second image representing only one evaluation point.
  • the second images can be understood here as the second input signals.
  • the evaluation points are preferably arranged in a grid, with the image being divided into the plurality of second images in accordance with the grid.
  • the advantage of dividing the first input signal into the plurality of second input signals is that in this way each evaluation point can be evaluated individually by the classifier.
  • a first representation can be determined for each evaluation point, which can be understood as characterizing the evaluation point.
  • the first representations can each be in the form of a vector, a matrix or a tensor and can comprise values which characterize the content of the respective second input signal.
  • the first representations can preferably be determined using a machine learning method. Surprisingly, the inventors were able to establish that determining the output signal based on the plurality of first representations enables the classifier to achieve significantly better classification accuracy.
  • no first representation is determined for at least one second input signal.
  • an evaluation point may only serve to indicate whether or not a sample was applied to the evaluation points at all.
  • the evaluation point does not contribute to the classification of the presence or absence of at least one pathogen within the sample and can therefore be neglected by the classifier.
  • the classifier can include at least a first neural network, by means of which the first representations are determined.
  • the advantage of the at least one first neural network is that neural networks are particularly suitable for determining meaningful representations from data. Determining meaningful representations significantly simplifies the determination of the classification, which increases the classification accuracy of the classifier, ie the ability to correctly predict whether at least one pathogen is present in the sample or not.
  • the classifier comprises a plurality of first neural networks, the classifier comprising a first neural network for a respective second input signal of the first subset, by means of which the first representation of the second input signal is determined.
  • each first neural network is comprised by the classifier, the first neural network learning during training to learn the characteristic properties of the second input signals which each show the evaluation point.
  • the first neural network can correspond to the evaluation point be deemed.
  • the first neural network is specialized for the evaluation point.
  • each first neural network can focus on the evaluation point that corresponds to it or the second input signals that show the corresponding evaluation point. This simplifies the learning task, namely being able to determine meaningful first representations from the first input signal, from which a precise classification can then be determined, which leads to better classification accuracy of the classifier.
  • a plurality of weights of the respective first neural networks and/or a plurality of second weights of the second neural network can be understood as parameters.
  • the output signal is determined using a second neural network included in the classifier and based on the first representations.
  • first neural networks and second neural network can also be understood as an entire neural network, with the entire neural network initially guiding the plurality of second input signals on separate paths through the entire neural network (namely the respective first neural networks) and the Information from these paths is then brought together (namely by means of the second neural network) in order to then determine the output signal.
  • the invention relates to a computer-implemented method for determining an output signal, the output signal characterizing a classification of a first input signal, the first input signal characterizing a plurality of evaluation points of a molecular-biological examination system, the method comprising the following steps:
  • the method for determining the output signal can be understood as inference using the classifier, which was previously trained using an embodiment of the method for training.
  • the method for determining the output signal therefore obtains its advantages from the method for training, namely an improved classification accuracy of the classifier.
  • a display device prefferably controlled based on the ascertained output signal in such a way that the display device displays the classification in a suitable manner.
  • the result of the classification may be shown on a display of the display device.
  • the display device emits an acoustic signal, e.g. by means of a loudspeaker.
  • FIG. 1 shows schematically a structure of a classifier for the classification of evaluation points of a molecular-biological examination system
  • FIG. 2 shows a schematic of a training system for training the classifier
  • FIG. 3 shows a schematic of a control system for controlling a molecular-biological examination system
  • FIG. 4 shows a schematic of an exemplary embodiment of a molecular-biological examination system.
  • FIG. 1 shows a classifier (60) for classifying a plurality of evaluation points of a molecular-biological examination system.
  • a first input signal (x), which characterizes the evaluation points, is transmitted to the classifier (60), with the classifier (60) determining an output signal (y) with respect to the first input signal (x), which characterizes a classification of the input signal (x).
  • the first input signal (x) can be an image of an optoelectronic sensor with respect to the evaluation points.
  • the evaluation points are preferably arranged in a rectangular grid.
  • the evaluation points can in particular be evaluation points of a microarray which, by means of a protein-protein interaction of proteins on the evaluation points with proteins in a biological sample, can indicate the presence or absence of certain proteins in the sample. In particular, it can be shown whether the sample contains specific proteins of a pathogen, e.g. a virus.
  • a pathogen e.g. a virus.
  • the input signal (x) is fed to a splitting unit (61).
  • the splitting unit splits the first input signal (x) into a plurality of second input signals (x a , x b , x c ).
  • the distribution unit can carry out at least one pre-processing step.
  • the first input signal (x) is an image and the splitting unit first rotates and/or shifts and/or scales the image and then splits the pre-processed image into rectangular sections.
  • the decomposition takes place according to the knowledge of the division unit (61) about the arrangement of the evaluation points within the first input signal (x).
  • the evaluation points can be arranged in a grid, with the first input signal (x) being an image of the grid.
  • the division unit (61) can receive information regarding the structure of the grid present.
  • the splitting unit may rotate the image such that the evaluation points lie within the rotated image along a horizontal axis and a vertical axis. The image can then be decomposed along the axes to determine the second input signals (x a , x b , x c ).
  • the second input signals (x a , x b , x c ) are then each fed to a first neural network (62a, 62b, 63c ), with a first neural network ( 62a , 62b, 63c) in the classifier (60).
  • a first neural network 62a , 62b, 63c
  • the first neural networks (62a, 62b, 63c ) determine respective first representations (za, zb , zc ) based on the second input signals ( xa , xb , xc ).
  • the first representations (z a ,z b ,z c ) are then passed as input to a second neural network (63).
  • the second neural network (63) determines the output signal (y) on the basis of the first representations (z a , z b , z c ).
  • FIG. 2 shows an exemplary embodiment of a training system (140) for training the classifier (60) using a training data set (T).
  • the training data set (T) comprises a plurality of first input signals (x;), which are used to train the classifier (60), the training data set (T) also comprising a desired output signal (tj) for each input signal (x;), which corresponds to the first input signal (x;) and characterizes a classification of the input signal (x;).
  • a first input signal (x;) can be an image of a plurality of evaluation points of a microarray, while the desired output signal (tj) corresponding to the first input signal (x;) characterizes whether in a biological sample applied to the evaluation points contains at least one pathogen or not.
  • the class of the pathogen in the desired output signal (tj) is also characterized.
  • a training data unit (150) accesses a computer-implemented database (Sts), the database (Sts) making the training dataset (T) available.
  • the training data unit (150) determines at least one first input signal (x;) and the desired output signal (tj) corresponding to the first input signal (x;) from the training data set (T), preferably at random, and transmits the first input signal (x;) to the classifier ( 60).
  • the classifier (60) determines an output signal (y .
  • the desired output signal (tj) and the determined output signal (y) are transmitted to a changing unit (180).
  • New parameters (O') for the classifier (60) are then determined by the changing unit (180) on the basis of the desired output signal (tj) and the determined output signal (y).
  • a plurality of weights of the first neural networks (62a, 62b, 63c) and/or a plurality of weightings of the second neural network (63) can be understood as the parameters (O) of the classifier (60), for which new parameters (O') are determined by the changing unit (180) the desired output signal (tj) and the determined output signal (y using a loss function.
  • the loss function determines a first loss value, which characterizes how far the determined output signal (y) deviates from the desired output signal (tj).
  • a negative logarithmic plausibility function (negative log-likehood function), in particular one, is selected as the loss function categorical cross-entropy function categorical cross entropy loss).
  • Other loss functions are also conceivable in alternative exemplary embodiments.
  • the changing unit (180) determines the new parameters (O') on the basis of the first loss value. In the exemplary embodiment, this is done using a gradient descent method, preferably Stochastic Gradient Descent, Adam, or AdamW.
  • the determined new parameters (O') are stored in a model parameter memory (Sti).
  • the determined new parameters (O′) are preferably made available to the classifier (60) as parameters (O).
  • the training described is repeated iteratively for a predefined number of iteration steps or iteratively repeated until the first loss value falls below a predefined threshold value.
  • the training is ended when an average first loss value with regard to a test or validation data record falls below a predefined threshold value.
  • the new parameters (O') determined in a previous iteration are used as parameters (O) of the classifier (60).
  • the training system (140) can comprise at least one processor (145) and at least one machine-readable storage medium (146) containing instructions which, when executed by the processor (145), cause the training system (140) to implement a training method according to one of the aspects of the invention.
  • FIG. 3 shows a control system (40) of a processing unit for processing biological samples using the trained classifier (60).
  • An optoelectronic sensor (30) e.g. a camera, of the processing unit determines a sensor signal (S) which characterizes a plurality of evaluation points.
  • the control system (40) receives the sensor signal (S) from the sensor (30) in an optional receiving unit (50), which converts the sensor signal (S) into a first input signal (x) (alternatively, the sensor signal (S) can also be used directly as a first input signal (x) are accepted).
  • the first input signal (x) can be, for example, a section or further processing of the sensor signal (S). In other words, the first input signal (x) is determined as a function of the sensor signal (S).
  • the first input signal (x) is then fed to the trained classifier (60).
  • the classifier (60) is preferably parameterized by parameters (e) that are stored in a parameter memory (P) and are provided by this.
  • the classifier (60) determines an output signal (y) from the first input signal (x).
  • the output signal (y) is fed to an optional conversion unit (80), which uses it to determine a control signal (A), which is fed to a display device (10a) in order to control the display device (10a) accordingly.
  • control system (40) comprises at least one processor (45) and at least one machine-readable storage medium (46) on which instructions are stored which, when they are executed on the at least one processor (45), the control system ( 40) cause the method according to the invention to be carried out.
  • FIG 4 shows an embodiment in which the control system (40) controls the processing unit (600).
  • the processing unit (600) is supplied with a microarray (601) which includes a plurality of evaluation points (602) or also test fields, the test fields having been smeared with a biological sample.
  • the sample can come from a human swab, for example.
  • the microarray (601) can in particular be a protein microarray.
  • the sensor (30) is set up to record the microarray (601).
  • an optoelectronic sensor preferably a camera, can be used as the sensor (30).
  • the classifier (60) can therefore be understood as an image classifier.
  • the control signal (A) can then be selected in such a way that the result of the classification is shown on a display of the display device (10a).
  • an acoustic signal can also be output by means of a loudspeaker of the display device (10a) if the output signal (y) characterizes the presence of at least one pathogen in the sample.
  • the term "computer” includes any device for processing predeterminable calculation rules. These calculation rules can be in the form of software, or in the form of hardware, or in a mixed form of software and hardware.
  • a plurality can be understood as indexed, i.e. each element of the plurality is assigned a unique index, preferably by assigning consecutive integers to the elements contained in the plurality.
  • N is the number of elements in the plurality
  • integers from 1 to N are assigned to the elements.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

Computerimplementiertes Verfahren zum Trainieren eines Klassifikators (60) umfassend die Schritte: • Ermitteln zumindest eines ersten Eingabesignals (x i ), wobei das erste Eingabesignal (x i ) eine Mehrzahl von Auswertungspunkten (602) eines molekular biologischen Untersuchungssystems (600) charakterisiert und dem ersten Eingabesignal (xj) ein gewünschtes Ausgabesignal (t i ) zugeordnet ist, welches eine Klassifikation der Auswertungspunkte (602) charakterisiert; • Aufteilen des ersten Eingabesignals (x i ) in eine Mehrzahl von zweiten Eingabesignalen (xa, xb, xc) gemäß einer Anordnung der Auswertungspunkte (602); • Ermitteln einer Mehrzahl von ersten Repräsentationen ((z a , z b , z c ), wobei für jedes zweite Eingabesignal (x a , x b , x c ) zumindest einer ersten Untermenge der Mehrzahl von zweiten Eingabesignal (x a , x b , x c ) eine erste Repräsentation (z a , z b , z c ) mittels des Klassifikators (60) ermittelt wird; • Ermitteln eines Ausgabesignals (yj) mittels des Klassifikators (60) und basierend auf der Mehrzahl von ersten Repräsentationen (z a , z b , z c ), wobei das Ausgabesignal (y i ) eine Klassifikation des ersten Eingabesignals (x i ) charakterisiert; • Anpassen zumindest eines Parameters (Φ) des Klassifikators (60) gemäß eines Verlustwertes, wobei der Verlustwert einen Unterschied zwischen dem ermittelten Ausgabesignal (y i ) und dem gewünschten Ausgabesignal (t i ) charakterisiert.

Description

Beschreibung
Titel
Verfahren und Vorrichtung zum Trainieren eines Klassifikators für molekularbiologische Untersuchungen
Technisches Gebiet
Die Erfindung betrifft ein Verfahren zum Trainieren eines Klassifikators, ein Verfahren zur Klassifikation mittels des trainierten Klassifikators, eine Trainingsvorrichtung, ein System zur Datenverarbeitung, ein Computerprogramm und ein maschinenlesbares Speichermedium
Stand der Technik
Aus der DE 10 2016 222 075 Al ist ein Verfahren zur Prozessierung einer Kartusche, insbesondere einer mikrofluidischen Kartusche, und einer in die Kartusche aufgenommenen biologische Probe mittels einer Prozessiereinheit bekannt.
Vorteile der Erfindung
Bei automatisierten Analysesystemen wie beispielsweise Lab-on-a-Chip-Syste- men für die In-vitro-Diagnostik werden hohe Anforderungen an die Korrektheit der Ergebnisse der Analysesysteme gestellt. Insbesondere falls ein solches Analysesystem für medizinische Tests von biologischen Proben menschlichen Ursprungs, z.B. in Hinblick auf Infektionskrankheiten, verwendet wird, wird erwartet, dass die Ergebnisse in Hinblick auf Sensitivität und Spezifität höchsten Anforderungen genügen. Der Vorteil des Verfahrens mit Merkmalen des unabhängigen Anspruchs 1 ist, dass ein Klassifikator ermittelt werden kann, der eine höhere Klassifikationsgenauigkeit bezüglich eines medizinischen Testergebnisses aufweist. Der Klassifikator ist daher vorteilhafterweise in der Lage die Testgenauigkeit einer medizinischen Analysevorrichtung zu verbessern.
Offenbarung der Erfindung
In einem ersten Aspekt betrifft die Erfindung ein computerimplementiertes Verfahren zum Trainieren eines Klassifikators umfassend die Schritte:
• Ermitteln zumindest eines ersten Eingabesignals, wobei das erste Eingabesignal eine Mehrzahl von Auswertungspunkten eines molekularbiologischen Untersuchungssystems charakterisiert und dem ersten Eingabesignal ein gewünschtes Ausgabesignal zugeordnet ist, welches eine Klassifikation der Auswertungspunkte charakterisiert;
• Aufteilen des ersten Eingabesignals in eine Mehrzahl von zweiten Eingabesignalen gemäß einer Anordnung der Auswertungspunkte;
• Ermitteln einer Mehrzahl von ersten Repräsentationen, wobei für jedes zweite Eingabesignal zumindest einer ersten Untermenge der Mehrzahl von zweiten Eingabesignal eine erste Repräsentation mittels des Klassifikators ermittelt wird;
• Ermitteln eines Ausgabesignals mittels des Klassifikators und basierend auf der Mehrzahl von ersten Repräsentationen, wobei das Ausgabesignal eine Klassifikation des ersten Eingabesignals charakterisiert;
• Anpassen zumindest eines Parameters des Klassifikators gemäß eines Verlustwertes, wobei der Verlustwert einen Unterschied zwischen dem ermittelten Ausgabesignal und dem gewünschten Ausgabesignal charakterisiert.
Die Auswertungspunkte können insbesondere Auswertungspunkte eines Labors auf einem Chip (engl. lab-on-chip system) sein, welche eine biologische Probe, z.B. eine Blutprobe, eine Urinprobe, eine Speichelprobe oder eine Probe aus einem Abstrich, auswerten, insbesondere in Hinblick auf das Vorhandensein von zumindest einem Pathogen, z.B. zumindest einem Virus und/oder zumindest einem Bakterium und/oder zumindest einem Pilz, in der Probe. Das Verfahren kann derart Verstanden werden, als dass der Klassifikator derart trainiert wird, dass er basierend auf den Auswertungspunkten eine Klassifikation ermittelt. Insbesondere kann die Klassifikation charakterisieren, ob das zumindest eine Pathogen in der Probe vorliegt oder nicht bzw. mit welcher Wahrscheinlich das zumindest eine Pathogen in der Probe vorliegt und/oder mit welcher Wahrscheinlichkeit das zumindest eine Pathogen nicht in der Probe vorliegt.
Das Verfahren kann weiterhin derart verstanden werden, als dass zum Training ein Vorhandensein oder eine Abwesenheit des zumindest einen Pathogens mittels des gewünschten Ausgabesignals dem Klassifikator angezeigt wird. Nach dem Training ist der Klassifikator in der Lage, basierend auf einer neuen Mehrzahl von Auswertungspunkten bezüglich einer neuen Probe zu ermitteln, ob das zumindest eine Pathogen in der neuen Probe vorliegt oder nicht.
Das Lab-on-Chip-System kann insbesondere eine Mikroreihe (engl. Microarray) umfassen. Unter einem Microarray kann ein Analysesystem verstanden werden, das die parallele Analyse von mehreren, insbesondere mehreren zehn oder mehreren hundert bis tausend, Einzelnachweisen in einer geringen Menge biologischen Probenmaterials ermöglicht. Es gibt unterschiedliche Arten von Microarrays, die auch als Genchips oder Biochips bezeichnet werden, da diese vergleichbar einem Computerchip viele Informationen auf kleinstem Raum enthalten können.
Das Mikroarray kann insbesondere über eine Mehrzahl von Auswertungspunkten (engl. Spots) verfügen, auf denen die Probe aufgetragen werden kann. Auf den Auswertungspunkten können insbesondere Reagenzien, z.B. bestimmte Proteine, aufgetragen sein, die beim Aufträgen der Probe zu einer biochemischen Reaktion führen, die den Nachweis des zumindest einen Pathogens ermöglichen. Insbesondere können die biochemischen Reaktionen dazu führen, dass an den entsprechenden Positionen der Auswertungspunkte des Microarrays basierend auf einer Chemilumineszenz eine elektromagnetische Strahlung abgesondert wird. Auch ist möglich, dass nach einer entsprechenden biochemischen Reaktion mittels Fluoreszenz eine elektromagnetische Strahlung an den entsprechenden Positionen abgesondert wird. Unabhängig davon, ob die elektromagnetische Strahlung basierend auf Chemilu- mineszenz oder Fluoreszenz erzeugt wird, kann die erzeugte elektromagnetische Strahlung mittels eines optoelektronischen Sensors, insbesondere einer Kamera, gemessen werden und z.B. in Form eines Bildes bereitgestellt werden. Da die Auswertungspunkte abhängig von den Reagenzien und einem Vorhandensein oder einer Abwesenheit des zumindest einen Pathogens unterschiedlich starke elektromagnetische Strahlung absondern, entsteht ein für die Probe charakteristisches Bild. Insbesondere können in dem Bild abgebildeten Auswertungspunkte unterschiedliche Helligkeitsstufen aufweisen können.
Das Bild kann insbesondere als erstes Eingabesignal verwendet werden. Alternativ ist auch möglich, dass das Bild zunächst einen oder mehrere Vorverarbeitungsschritte, insbesondere Vorverarbeitungsschritte aus dem Bereich des maschinellen Sehens (engl. Computer Vision) durchläuft, bevor es als Eingabesignal zur Verfügung gestellt wird.
Bestimmte Teile des Eingabesignals können als zu einzelnen Auswertungspunkten zugehörig verstanden werden. Zum Beispiel können bestimmte Bereiche des Bildes jeweils einzelnen Auswertungspunkten zugeordnet werden. Insbesondere kann das Bild abhängig von der Position der Auswertungspunkte in eine Mehrzahl von zweiten Bildern zerlegt werden, wobei jeweils ein zweites Bild nur einen Auswertungspunkt darstellt. Die zweiten Bilder können hierbei als die zweiten Eingabesignale verstanden werden. Vorzugsweise sind die Auswertungspunkte in einem Raster angeordnet, wobei das Bild entsprechend des Rasters in die Mehrzahl von zweiten Bildern aufgeteilt wird.
Der Vorteil des Aufteilens des ersten Eingabesignals in die Mehrzahl von zweiten Eingabesignalen ist, dass so jeder Auswertungspunkt vom Klassifikator individuell ausgewertet werden kann. Insbesondere kann so zu jedem Auswertungspunkt eine erste Repräsentation ermittelt werden, die als den Auswertungspunkt charakterisierend verstanden werden kann. Die ersten Repräsentationen können jeweils in Form eines Vektors, einer Matrix oder eines Tensors vorliegen und Werte umfassen, die den Inhalt des jeweiligen zweiten Eingabesignals charakterisieren. Vorzugsweise können die ersten Repräsentationen mittels eines maschinellen Lernverfahrens ermittelt werden. Überraschenderweise konnten die Erfinder feststellen, dass die Ermittlung des Ausgabesignals basierend auf der Mehrzahl von ersten Repräsentationen eine wesentlich bessere Klassifikationsgenauigkeit des Klassifikators ermöglicht.
Alternativ ist auch möglich, dass für zumindest ein zweites Eingabesignal keine erste Repräsentation ermittelt wird. Dies ist insbesondere dann vorteilhaft, wenn bestimmte Auswertungspunkte einem anderen Zweck dienen als der Analyse der Probe. Zum Beispiel kann ein Auswertungspunkt lediglich dazu dienen anzuzeigen, ob auf den Auswertungspunkten überhaupt eine Probe aufgetragen wurde oder nicht. Der Auswertungspunkt trägt in diesem Beispiel nicht zur Klassifikation des Vorhandenseins oder der Abwesenheit zumindest einen Pathogens innerhalb der Probe bei und kann daher vom Klassifikator vernachlässigt werden.
In einer bevorzugten Ausprägung des Verfahrens kann der Klassifikator zumindest ein erstes neuronales Netz umfassen, mittels welchem die ersten Repräsentationen ermittelt werden.
Der Vorteil des zumindest einen ersten neuronalen Netzes ist, dass neuronale Netze besonders geeignet sind aussagekräftige Repräsentationen aus Daten zu ermitteln. Durch die Ermittlung von aussagekräftigen Repräsentationen wird die Ermittlung der Klassifikation maßgeblich vereinfacht, wodurch eine Klassifikationsgenauigkeit des Klassifikators, also eine Fähigkeit korrekt zu prädizieren, ob das zumindest eine Pathogen in der Probe vorliegt oder nicht, gesteigert wird.
In einer bevorzugten Ausprägung umfasst der Klassifikator eine Mehrzahl von ersten neuronalen Netzen, wobei der Klassifikator für jeweils ein zweites Eingabesignal der ersten Untermenge ein erstes neuronales Netz umfasst, mittels welchem die erste Repräsentation des zweiten Eingabesignals ermittelt wird.
Dies kann derart verstanden werden, als das für jeweils einen Auswertungspunkt ein erstes neuronales Netz vom Klassifikator umfasst wird, wobei das erste neuronale Netz während des Trainings lernt, die charakteristischen Eigenschaften der zweiten Eingabesignale zu lernen, die jeweils den Auswertungspunkt zeigen. Das erste neuronale Netz kann mit dem Auswertungspunkt als korrespondierend erachtet werden. Das erste neuronale Netz wird gewissermaßen auf den Auswertungspunkt spezialisiert. Der Vorteil dieser Herangehensweise liegt darin, dass jedes erste neuronale Netz sich auf den mit ihm jeweils korrespondierenden Auswertungspunkt bzw. die zweiten Eingabesignale, die den korrespondierenden Auswertungspunkt zeigen, fokussieren kann. Hierdurch wird die Lernaufgabe, nämlich aussagekräftige erste Repräsentationen aus dem ersten Eingabesignal ermitteln zu können, aus denen dann eine genaue Klassifikation ermittelt werden kann, vereinfacht, was zu einer besseren Klassifikationsgenauigkeit des Klassifikators führt.
Als Parameter können im Trainingsverfahren insbesondere eine Mehrzahl von Gewichten der jeweils ersten neuronalen Netze und/oder eine Mehrzahl von zweiten Gewichten des zweiten neuronalen Netzes verstanden werden.
Weiterhin ist möglich, dass das Ausgabesignal mittels eines vom Klassifikator umfassten zweiten neuronalen Netzes und basierend auf den ersten Repräsentationen ermittelt wird.
Die Erfinder konnten feststellen, dass der Einsatz eines zweiten neuronalen Netzes zu einer weiteren Steigerung der Klassifikationsgenauigkeit führt. Die Kombination aus ersten neuronalen Netzen und zweitem neuronalen Net kann auch als ein gesamtes neuronales Netz verstanden werden, wobei das gesamte neuronale Netz die Mehrzahl von zweiten Eingabesignalen zunächst auf separaten Pfaden durch das gesamte neuronale Netz führt (nämlich den jeweils ersten neuronalen Netzen) und die Informationen dieser Pfade danach zusammenführt (nämlich mittels des zweiten neuronalen Netzes), um anschließend das Ausgabesignal zu ermitteln.
Weiterhin betrifft die Erfindung ein computerimplementiertes Verfahren zum Ermitteln eines Ausgabesignals, wobei das Ausgabesignal eine Klassifikation eines ersten Eingabesignals charakterisiert, wobei das erste Eingabesignal eine Mehrzahl von Auswertungspunkten eines molekularbiologischen Untersuchungssystems charakterisiert, wobei das Verfahren die folgenden Schritte umfasst:
• Trainieren eines Klassifikators gemäß einem der oben beschriebenen Aspekte und/oder Ausprägungen; • Aufteilen des ersten Eingabesignals in eine Mehrzahl von zweiten Eingabesignalen gemäß einer Anordnung der Mehrzahl von Auswertungspunkten;
• Ermitteln des Ausgabesignals basierend auf der Mehrzahl von zweiten Eingabesignalen mittels des Klassifikators.
Das Verfahren zur Ermittlung des Ausgabesignals kann als Inferenz mittels des Klassifikators verstanden werden, der vorher mittels einer Ausprägung des Verfahrens zum Trainieren trainiert wurde. Das Verfahren zur Ermittlung des Ausgabesignals erhält seine Vorteile daher vom Verfahren zum Training, nämlich eine verbesserte Klassifikationsgenauigkeit des Klassifikators.
Bevorzugt ist weiterhin möglich, dass eine Anzeigevorrichtung basierend auf dem ermittelten Ausgabesignal derart angesteuert wird, dass die Anzeigevorrichtung die Klassifikation geeignet darstellt.
Beispielsweise ist möglich, dass das Ergebnis der Klassifikation auf einem Display der Anzeigevorrichtung dargestellt wird. Alternativ oder zusätzlich ist möglich, dass, falls das Ausgabesignal eine Klassifikation eines Vorhandenseins zumindest eines Pathogens charakterisiert, die Anzeigevorrichtung ein akustisches Signal z.B. mittels eines Lautsprechers ausgibt.
Nachfolgend werden Ausführungsformen der Erfindung unter Bezugnahme auf die beiliegenden Zeichnungen näher erläutert. In den Zeichnungen zeigen:
Figur 1 schematisch einen Aufbau eines Klassifikators zur Klassifikation von Auswertungspunkten eines molekularbiologischen Untersuchungssystems;
Figur 2 schematisch ein Trainingssystem zum Trainieren des Klassifikators;
Figur 3 schematisch ein Steuerungssystem zur Steuerung eines molekularbiologischen Untersuchungssystems; Figur 4 schematisch ein Ausführungsbeispiel eines molekularbiologischen Untersuchungssystems.
Beschreibung der Ausführungsbeispiele
Figur 1 zeigt einen Klassifikator (60) zur Klassifikation einer Mehrzahl von Auswertungspunkten eines molekularbiologischen Untersuchungssystems. Dem Klassifikator (60) wird ein erstes Eingabesignal (x) übermittelt, welches die Auswertungspunkte charakterisiert, wobei der Klassifikator (60) bezüglich des ersten Eingabesignals (x) ein Ausgabesignal (y) ermittelt, welches eine Klassifikation des Eingabesignals (x) charakterisiert. Insbesondere kann das erste Eingabesignal (x) ein Bild eines optoelektronischen Sensors bezüglich der Auswertungspunkte sein. Bevorzugt sind die Auswertungspunkte in einem rechtwinkligen Raster angeordnet.
Die Auswertungspunkte können insbesondere Auswertungspunkte eines Microarrays sein, die mittels einer Protein- Protein Interaktion von Proteinen auf den Auswertungspunkten zu Proteinen einer biologischen Probe das Vorhandensein oder die Abwesenheit bestimmter Proteine in der Probe anzeigen können. Insbesondere kann so angezeigt werden, ob die Probe spezifische Proteine eines Pathogens, z.B. eines Virus, enthält.
Das Eingabesignal (x) wird einer Aufteilungseinheit (61) zugeführt. Die Aufteilungseinheit zerlegt das erste Eingabesignal (x) in eine Mehrzahl von zweiten Eingabesignalen (xa, xb,xc). Hierfür kann die Aufteilungseinheit zumindest einen Vorverarbeitungsschritt durchführen. Zum Beispiel ist möglich, dass das erste Eingabesignal (x) ein Bild ist und die Aufteilungseinheit das Bild zunächst rotiert und/oder verschiebt und/oder skaliert und anschließend das vorverarbeitete Bild in rechteckige Ausschnitte zerlegt.
Die Zerlegung erfolgt gemäß einem Wissen der Aufteilungseinheit (61) über die Anordnung der Auswertungspunkte innerhalb des ersten Eingabesignal (x). Beispielsweise können die Auswertungspunkte in einem Raster angeordnet sein, wobei das erste Eingabesignal (x) ein Bild des Rasters ist. Der Aufteilungseinheit (61) kann in diesem Fall eine Information bezüglich des Aufbaus des Rasters vorliegen. Insbesondere kann die Aufteilungseinheit das Bild so rotieren, dass die Auswertungspunkte innerhalb des rotierten Bildes entlang einer horizontalen Achse und einer vertikalen Achse liegen. Anschließend kann das Bild entlang der Achsen zerlegt werden, um die zweiten Eingabesignale (xa,xb, xc) zu ermitteln.
Die zweiten Eingabesignale (xa, xb,xc) werden anschließend jeweils einem ersten neuronalen Netz (62a, 62b, 63c) zugeführt, wobei für jedes zweite Eingabesignal (xa,xb, xc) ein erstes neuronales Netz (62a, 62b, 63c) im Klassifikator (60) vorliegt. In alternativen Ausführungsbeispielen kann auch vorgesehen sein, dass für zumindest ein zweites Eingabesignal (xa, xb, xc) kein erstes neuronales Netz vorliegt und daher für die Ermittlung des Ausgabesignals (y) das zweite Eingabesignal (xa,xb, xc) nicht berücksichtigt wird.
Die ersten neuronalen Netze (62a, 62b, 63c) ermitteln basierend auf den zweiten Eingabesignalen (xa, xb,xc) jeweils erste Repräsentationen (za,zb, zc). Die ersten Repräsentationen (za, zb,zc) werden dann einem zweiten neuronalen Netz (63) als Eingabe übergeben. Das zweite neuronale Netz (63) ermittelt dann auf Basis der ersten Repräsentationen (za, zb,zc) das Ausgabesignal (y)
Figur 2 zeigt ein Ausführungsbeispiel eines Trainingssystems (140) zum Trainieren des Klassifikators (60) mittels eines Trainingsdatensatzes (T). Der Trainingsdatensatz (T) umfasst eine Mehrzahl von ersten Eingabesignalen (x;), die zum Trainieren des Klassifikators (60) verwendet werden, wobei der Trainingsdatensatz (T) ferner zu jeweils einem Eingabesignal (x;) ein gewünschtes Ausgabesignal (tj) umfasst, welches mit dem ersten Eingabesignal (x;) korrespondiert und eine Klassifikation des Eingabesignals (x;) charakterisiert. Insbesondere kann ein erstes Eingabesignal (x;) ein Bild einer Mehrzahl von Auswertungspunkten eines Microarrays sein, während das mit dem ersten Eingabesignal (x;) korrespondierende gewünschte Ausgabesignal (tj) charakterisiert, ob in einer biologischen Probe, die auf den Auswertungspunkten aufgetragen wurde, zumindest ein Pathogen enthält oder nicht. Vorzugsweise wird bei einem Vorhandensein eines Pathogens in der Probe außerdem die Klasse des Pathogens im gewünschten Ausgabesignal (tj) charakterisiert. Zum Training greift eine Trainingsdateneinheit (150) auf eine computerimplementierte Datenbank (Sts) zu, wobei die Datenbank (Sts) den Trainingsdatensatz (T) zur Verfügung stellt. Die Trainingsdateneinheit (150) ermittelt aus dem Trainingsdatensatz (T) vorzugsweise zufällig zumindest ein erstes Eingabesignal (x;) und das zum ersten Eingabesignal (x;) korrespondierende gewünschte Ausgabesignal (tj) und übermittelt das erste Eingabesignal (x;) an den Klassifikator (60). Der Klassifikator (60) ermittelt auf Basis des ersten Eingabesignals (x;) ein Ausgabesignal (y .
Das gewünschte Ausgabesignal (tj) und das ermittelte Ausgabesignal (y werden an eine Veränderungseinheit (180) übermittelt.
Basierend auf dem gewünschten Ausgabesignal (tj) und dem ermittelten Ausgabesignal (y werden dann von der Veränderungseinheit (180) neue Parameter (O') für den Klassifikator (60) bestimmt. Im Ausführungsbeispiel kann eine Mehrzahl von Gewichten der ersten neuronalen Netze (62a, 62b, 63c) und/oder eine Mehrzahl von Gewichten des zweiten neuronalen Netzes (63) als die Parameter (O) des Klassifikators (60) verstanden werden, für die von der Veränderungseinheit neue Parameter (O') ermittelt werden. Hierfür vergleicht die Veränderungseinheit (180) das gewünschte Ausgabesignal (tj) und das ermittelte Ausgabesignal (y mittels einer Verlustfunktion (engl. Loss Function). Die Verlustfunktion ermittelt einen ersten Verlustwert, der charakterisiert, wie weit das ermittelte Ausgabesignal (y vom gewünschten Ausgabesignal (tj) abweicht. Als Verlustfunktion wird im Ausführungsbeispiel eine negative logarithmierte Plausibilitätsfunktion (engl. negative log-likehood function) gewählt, insbesondere eine kategorische Kreuzentropiefunktion (engl. categorical cross entropy loss). In alternativen Ausführungsbeispielen sind auch andere Verlustfunktion denkbar.
Die Veränderungseinheit (180) ermittelt auf Grundlage des ersten Verlustwertes die neuen Parameter (O'). Im Ausführungsbeispiel geschieht dies mittels eines Gradientenabstiegsverfahren, vorzugsweise Stochastic Gradient Descent, Adam, oder AdamW. Die ermittelten neuen Parameter (O') werden in einem Modellparameterspeicher (Sti) gespeichert. Vorzugsweise werden die ermittelten neuen Parameter (O') als Parameter (O) dem Klassifikator (60) bereitgestellt.
In weiteren bevorzugten Ausführungsbeispielen wird das beschriebene Training iterativ für eine vordefinierte Anzahl an Iterationsschritten wiederholt oder iterativ wiederholt, bis der erste Verlustwert einen vordefinierten Schwellenwert unterschreitet. Alternativ oder zusätzlich ist auch vorstellbar, dass das Training beendet wird, wenn ein durchschnittlicher erster Verlustwert bezüglich eines Test- o- der Validierungsdatensatzes einen vordefinierten Schwellenwert unterschreitet. In mindestens einer der Iterationen werden die in einer vorherigen Iteration bestimmten neuen Parameter (O') als Parameter (O) des Klassifikators (60) verwendet.
Des Weiteren kann das Trainingssystem (140) mindestens einen Prozessor (145) und mindestens ein maschinenlesbares Speichermedium (146) umfassen, welches Befehle enthält, welche, wenn sie durch den Prozessor (145) ausgeführt werden, das Trainingssystem (140) veranlassen, ein Trainingsverfahren nach einem der Aspekte der Erfindung auszuführen.
Figur 3 ein Steuerungssystem (40) einer Prozessiereinheit zur Prozessierung von biologischen Proben mittels des trainierten Klassifikators (60). Ein optoelektronischer Sensor (30), z.B. eine Kamera, der Prozessiereinheit ermittelt ein Sensorsignal (S), welches eine Mehrzahl von Auswertungspunkten charakterisiert.
Das Steuerungssystem (40) empfängt die das Sensorsignal (S) des Sensors (30) in einer optionalen Empfangseinheit (50), die das Sensorsignal (S) in ein erstes Eingabesignal (x) umwandelt (alternativ kann auch unmittelbar das Sensorsignal (S) als erstes Eingangssignal (x) übernommen werden). Das erste Eingabesignal (x) kann beispielsweise ein Ausschnitt oder eine Weiterverarbeitung des Sensorsignals (S) sein. Mit anderen Worten wird das erste Eingabesignal (x) abhängig von Sensorsignal (S) ermittelt. Das erste Eingabesignal (x) wird denn dem trainierten Klassifikator (60) zugeführt. Der Klassifikator (60) wird vorzugsweise parametriert durch Parameter (e ), die in einem Parameterspeicher (P) hinterlegt sind und von diesem bereitgestellt werden.
Der Klassifikator (60) ermittelt aus dem ersten Eingabesignal (x) ein Ausgabesignal (y). Das Ausgabesignal (y) werden einer optionalen Umformeinheit (80) zugeführt, die hieraus ein Ansteuersignale (A) ermittelt, welches einer Anzeigevorrichtung (10a) zugeführt wird, um die Anzeigevorrichtung (10a) entsprechend anzusteuern.
In weiteren bevorzugten Ausführungsformen umfasst das Steuerungssystem (40) zumindest einen Prozessor (45) und zumindest ein maschinenlesbares Speichermedium (46), auf dem Anweisungen gespeichert sind, die dann, wenn sie auf dem zumindest einen Prozessor (45) ausgeführt werden, das Steuerungssystem (40) veranlassen, das erfindungsgemäße Verfahren auszuführen.
Figur 4 zeigt ein Ausführungsbeispiel, in dem das Steuerungssystem (40) die Prozessiereinheit (600) steuert. Der Prozessiereinheit (600) wird eine Mikroreihe (601, engl. Microarray) zugeführt, welche eine Mehrzahl von Auswertungspunkten (602) oder auch Testfeldern umfasst, wobei die Testfelder mit einer biologischen Probe bestrichen wurden. Die Probe kann beispielsweise einem Abstrich eines Menschen entstammen.
Das Microarray (601) kann insbesondere ein Protein-Microarray sein. Der Sensor (30) ist eingerichtet das Microarray (601) aufzuzeichnen. Als Sensor (30) kann insbesondere ein optoelektronischer Sensor verwendet werden, vorzugsweise eine Kamera. Der Klassifikator (60) kann daher als Bildklassifikator verstanden werden.
Das Ansteuersignal (A) kann dann derart gewählt werden, dass das Ergebnis der Klassifikation auf einem Display der der Anzeigevorrichtung (10a) dargestellt wird. Alternativ oder zusätzlich kann auch ein akustisches Signal mittels eines Lautsprechers der Anzeigevorrichtung (10a) ausgegeben werden, falls das Ausgabesignal (y) das Vorhandensein zumindest eines Pathogens in der Probe charakterisiert. Der Begriff „Computer“ umfasst beliebige Geräte zur Abarbeitung vorgebbarer Rechenvorschriften. Diese Rechenvorschriften können in Form von Software vorliegen, oder in Form von Hardware, oder auch in einer Mischform aus Software und Hardware.
Im Allgemeinen kann eine Mehrzahl als indexiert verstanden werden, d.h. jedem Element der Mehrzahl wird ein eindeutiger Index zugewiesen, vorzugsweise durch Zuweisung aufeinanderfolgender Ganzzahlen an die in der Mehrzahl ent- haltenen Elemente. Vorzugsweise, wenn eine Mehrzahl N Elemente umfasst, wobei N die Anzahl der Elemente in der Mehrzahl ist, werden den Elementen die ganzen Zahlen von 1 bis N zugewiesen.

Claims

Ansprüche
1. Computerimplementiertes Verfahren zum Trainieren eines Klassifikators (60) umfassend die Schritte:
• Ermitteln zumindest eines ersten Eingabesignals (x;), wobei das erste Eingabesignal (x;) eine Mehrzahl von Auswertungspunkten (602) eines molekularbiologischen Untersuchungssystems (600) charakterisiert und dem ersten Eingabesignal (x;) ein gewünschtes Ausgabesignal (tj) zugeordnet ist, welches eine Klassifikation der Auswertungspunkte (602) charakterisiert;
• Aufteilen des ersten Eingabesignals (x;) in eine Mehrzahl von zweiten Eingabesignalen (xa,xb,xc) gemäß einer Anordnung der Auswertungspunkte (602);
• Ermitteln einer Mehrzahl von ersten Repräsentationen (za,zb,zc), wobei für jedes zweite Eingabesignal (xa,xb,xc) zumindest einer ersten Untermenge der Mehrzahl von zweiten Eingabesignal (xa,xb,xc) eine erste Repräsentation (za,zb,zc) mittels des Klassifikators (60) ermittelt wird;
• Ermitteln eines Ausgabesignals (y mittels des Klassifikators (60) und basierend auf der Mehrzahl von ersten Repräsentationen (za,zb,zc), wobei das Ausgabesignal (y eine Klassifikation des ersten Eingabesignals (xj) charakterisiert;
• Anpassen zumindest eines Parameters (O) des Klassifikators (60) gemäß eines Verlustwertes, wobei der Verlustwert einen Unterschied zwischen dem ermittelten Ausgabesignal (y und dem gewünschten Ausgabesignal (tj) charakterisiert.
2. Verfahren nach Anspruch 1, wobei das Eingabesignal (x;) basierend auf einem Sensorsignal (S) eines optoelektronischen Sensors (30) ermittelt wird, wobei das Sensorsignal (S) eine Messung der Auswertungspunkte (602) charakterisiert.
3. Verfahren nach Anspruch 1 oder 2, wobei der Klassifikator (60) zumindest ein erstes neuronales Netz umfasst (62a, 62b, 62c), mittels welchem die ersten Repräsentationen (za, zb, zc) ermittelt werden.
4. Verfahren nach Anspruch 1 oder 2, wobei der Klassifikator (60) eine Mehrzahl von ersten neuronalen Netzen (62a, 62b, 63c) umfasst, wobei der Klassifikator (60) für jeweils ein zweites Eingabesignal (xa,xb, xc) der ersten Untermenge ein erstes neuronales Netz (62a, 62b, 62c) umfasst, mittels welchem die erste Repräsentation (za, zb,zc) des zweiten Eingabesignals (xa, xb,xc) ermittelt wird.
5. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Ausgabesignal (y mittels eines vom Klassifikator (60) umfassten zweiten neuronalen Netzes (63) und basierend auf den ersten Repräsentationen (za, zb, zc) ermittelt wird.
6. Verfahren nach einem der vorhergehenden Ansprüche, wobei das molekularbiologischen Untersuchungssystems (600) eine Mikroreihe (601, engl. Microarray) umfasst und das Eingabesignal (x;) ein Bild der Auswertungspunkte (602) der Mikroreihe (601) charakterisiert.
7. Verfahren nach Anspruch 6, wobei jeweils ein zweites Eingabesignal (xa, xb,xc) der Mehrzahl von zweiten Eingabesignalen (xa, xb,xc) ein Ausschnitt des Bildes ist, wobei der Ausschnitt gemäß der Anordnung der Auswertungspunkte (602) der Mikroreihe (601) gewählt wird.
8. Computerimplementiertes Verfahren zum Ermitteln eines Ausgabesignals (y), wobei das Ausgabesignal (y) eine Klassifikation eines ersten Eingabesignals (x) charakterisiert, wobei das erste Eingabesignal (x) eine Mehrzahl von Auswertungspunkten (602) eines molekularbiologischen Untersuchungssystems (600) charakterisiert, wobei das Verfahren die folgenden Schritte umfasst:
• Trainieren eines Klassifikators (60) gemäß einem der Ansprüche 1 bis 7; - 16 -
• Aufteilen des ersten Eingabesignals (x) in eine Mehrzahl von zweiten Eingabesignalen (xa,xb,xc) gemäß einer Anordnung der Mehrzahl von Auswertungspunkten (602);
• Ermitteln des Ausgabesignals (y) basierend auf der Mehrzahl von zweiten Eingabesignalen (xa,xb,xc) mittels des Klassifikators (60). Verfahren nach Anspruch 8, wobei eine Anzeigevorrichtung (10a) basierend auf dem ermittelten Ausgabesignal (y) derart angesteuert wird, dass die Anzeigevorrichtung (10a) die Klassifikation darstellt. Trainingsvorrichtung (140), welche eingerichtet ist, das Verfahren nach einem der Ansprüche 1 bis 7 auszuführen. System zur Datenverarbeitung, umfassend Mittel zur Ausführung der Schritte des Verfahrens einem der Ansprüche 8 oder 9. Computerprogramm, welches eingerichtet ist, das Verfahren nach einem der Ansprüche 1 bis 9 auszuführen, wenn es durch einen Prozessor (45, 145) ausgeführt wird. Maschinenlesbares Speichermedium (46, 146), auf dem das Computerprogramm nach Anspruch 12 gespeichert ist.
PCT/EP2021/085187 2020-12-14 2021-12-10 Verfahren und vorrichtung zum trainieren eines klassifikators für molekularbiologische untersuchungen WO2022128787A1 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP21839066.4A EP4260241A1 (de) 2020-12-14 2021-12-10 Verfahren und vorrichtung zum trainieren eines klassifikators für molekularbiologische untersuchungen
CN202180093598.1A CN116940945A (zh) 2020-12-14 2021-12-10 用来对用于分子生物学研究的分类器进行训练的方法和装置
US18/257,343 US20240028892A1 (en) 2020-12-14 2021-12-10 Method and device for training a classifier for molecular biological examinations

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102020215815.0 2020-12-14
DE102020215815.0A DE102020215815A1 (de) 2020-12-14 2020-12-14 Verfahren und Vorrichtung zum Trainieren eines Klassifikators für molekularbiologische Untersuchungen

Publications (1)

Publication Number Publication Date
WO2022128787A1 true WO2022128787A1 (de) 2022-06-23

Family

ID=79270006

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2021/085187 WO2022128787A1 (de) 2020-12-14 2021-12-10 Verfahren und vorrichtung zum trainieren eines klassifikators für molekularbiologische untersuchungen

Country Status (5)

Country Link
US (1) US20240028892A1 (de)
EP (1) EP4260241A1 (de)
CN (1) CN116940945A (de)
DE (1) DE102020215815A1 (de)
WO (1) WO2022128787A1 (de)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102016222075A1 (de) 2016-11-10 2018-05-17 Robert Bosch Gmbh Prozessiersystem und Verfahren zur Prozessierung einer mikrofluidischen Kartusche mit einer Prozessiereinheit
US20180330056A1 (en) * 2015-07-02 2018-11-15 Indevr Inc. Methods of Processing and Classifying Microarray Data for the Detection and Characterization of Pathogens

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4122261B2 (ja) 2003-06-02 2008-07-23 日立ソフトウエアエンジニアリング株式会社 Dnaマイクロアレイイメージ解析システム
US20170175169A1 (en) 2015-12-18 2017-06-22 Min Lee Clinical decision support system utilizing deep neural networks for diagnosis of chronic diseases
US20200018749A1 (en) 2016-12-20 2020-01-16 Indevr, Inc. Plug-in expertise for pathogen identification using modular neural networks
WO2020146554A2 (en) 2019-01-08 2020-07-16 Abraham Jim Genomic profiling similarity

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180330056A1 (en) * 2015-07-02 2018-11-15 Indevr Inc. Methods of Processing and Classifying Microarray Data for the Detection and Characterization of Pathogens
DE102016222075A1 (de) 2016-11-10 2018-05-17 Robert Bosch Gmbh Prozessiersystem und Verfahren zur Prozessierung einer mikrofluidischen Kartusche mit einer Prozessiereinheit

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NGUYEN HUU-GIAO ET AL: "An Effective Deep Learning Architecture Combination for Tissue Microarray Spots Classification of H&E Stained Colorectal Images", 2020 IEEE 17TH INTERNATIONAL SYMPOSIUM ON BIOMEDICAL IMAGING (ISBI), IEEE, 3 April 2020 (2020-04-03), pages 1271 - 1274, XP033773752, DOI: 10.1109/ISBI45749.2020.9098636 *
WANG ZIDONG ET AL: "A novel neural network approach to cDNA microarray image segmentation", COMPUTER METHODS AND PROGRAMS IN BIOMEDICINE, ELSEVIER, AMSTERDAM, NL, vol. 111, no. 1, 11 May 2013 (2013-05-11), pages 189 - 198, XP028551939, ISSN: 0169-2607, DOI: 10.1016/J.CMPB.2013.03.013 *

Also Published As

Publication number Publication date
DE102020215815A1 (de) 2022-06-15
US20240028892A1 (en) 2024-01-25
CN116940945A (zh) 2023-10-24
EP4260241A1 (de) 2023-10-18

Similar Documents

Publication Publication Date Title
EP1181525B1 (de) Verfahren zur automatischen analyse von mikroskopaufnahmen
DE69532276T2 (de) Automatisiertes cytologisches probenklassifizierungsverfahren
DE112014002045B4 (de) Nucleinsäure-Analysator und Nucleinsäure-Analysenverfahren unter Verwendung des Analysators
DE19616997A1 (de) Verfahren zur automatisierten mikroskopunterstützten Untersuchung von Gewebeproben oder Körperflüssigkeitsproben
DE69904165T2 (de) Verfahren zur bewertung chemischer und biologischer tests
DE102008059788A1 (de) Analyse und Klassifizierung insbesondere biologischer oder biochemischer Objekte auf Basis von Zeitreihen-Bildern, anwendbar bei der zytometrischen Time-Lapse-Zellanalyse in der bildbasierten Zytometrie
EP2997365A1 (de) Analyseverfahren zur klassifikationsunterstützung
DE102020210352A1 (de) Verfahren und Vorrichtung zum Transferlernen zwischen modifizierten Aufgaben
DE112020003977T5 (de) Informationsverarbeitungsvorrichtung, anzeigeverfahren, programm und informationsverarbeitungssystem
EP3540632A1 (de) Verfahren und analysegeräte zum klassifizieren von gewebeproben
EP3971827B1 (de) Verfahren zum detektieren einer bindung von antikörpern einer patientenprobe an doppelsträngige dns unter verwendung von crithidia luciliae zellen und fluoreszenzmikroskopie
WO2022128787A1 (de) Verfahren und vorrichtung zum trainieren eines klassifikators für molekularbiologische untersuchungen
EP4206986A1 (de) Verfahren zur analyse von gefügen in stahlproben
DE102011117320A1 (de) Vorrichtung und Verfahren zum Nachweis von in biologischen oder chemischen Proben vorliegenden Substanzen
DE102020211219A1 (de) Verfahren und Steuergerät zum Bestimmen einer Anzahl von Proben für eine Sammelanalyse unter Verwendung eines Analysegeräts zum Analysieren von Proben biologischen Materials
EP2613139B1 (de) Verfahren zur Analyse von Proben und Systeme hierfür
DE102011055070B3 (de) Probenanalysevorrichtung zum Bestimmen von Proben in einer Probenmatrix und Verfahren zum Bestimmen von Proben in einer oder mehreren Probenmatrizen
EP1687756B1 (de) Verfahren zur klassifikation von messwerten in der medizinischen und biochemischen analytik
DE102022206892A1 (de) Verfahren zum Bestimmen einer optimalen Architektur eines künstlichen neuronalen Netzes
WO2021122979A1 (de) Verfahren und vorrichtung zum ermitteln einer in einem fluid enthaltenen kopienanzahl einer dna-sequenz
Dahlmanns Development of quantitative functional analysis tools and models for neuroscientific applications
DE102021108907A1 (de) Verfahren und Vorrichtung zum Ermitteln einer Klassifikation und/oder eines Regressionsergebnisses unter fehlenden Sensordaten
EP4125005A1 (de) Kontrastives representation learning für messdaten
DE102022111622A1 (de) Computerprogramm und Verfahren zur verbesserten Asbestanalytik mit künstlicher Intelligenz
EP3076333A1 (de) Analyseverfahren zur klassifikation einer testdispersion hinsichtlich des vorliegens einer sichelzellenanämie

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21839066

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 18257343

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2021839066

Country of ref document: EP

Effective date: 20230714

WWE Wipo information: entry into national phase

Ref document number: 202180093598.1

Country of ref document: CN