DE102020215815A1 - Verfahren und Vorrichtung zum Trainieren eines Klassifikators für molekularbiologische Untersuchungen - Google Patents

Verfahren und Vorrichtung zum Trainieren eines Klassifikators für molekularbiologische Untersuchungen Download PDF

Info

Publication number
DE102020215815A1
DE102020215815A1 DE102020215815.0A DE102020215815A DE102020215815A1 DE 102020215815 A1 DE102020215815 A1 DE 102020215815A1 DE 102020215815 A DE102020215815 A DE 102020215815A DE 102020215815 A1 DE102020215815 A1 DE 102020215815A1
Authority
DE
Germany
Prior art keywords
classifier
input signal
output signal
evaluation points
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102020215815.0A
Other languages
English (en)
Inventor
Jeremy Zieg Kolter
Nicole Ying Finnie
Jan Hendrik Metzen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE102020215815.0A priority Critical patent/DE102020215815A1/de
Priority to EP21839066.4A priority patent/EP4260241A1/de
Priority to CN202180093598.1A priority patent/CN116940945A/zh
Priority to US18/257,343 priority patent/US20240028892A1/en
Priority to PCT/EP2021/085187 priority patent/WO2022128787A1/de
Publication of DE102020215815A1 publication Critical patent/DE102020215815A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N35/00Automatic analysis not limited to methods or materials provided for in any single one of groups G01N1/00 - G01N33/00; Handling materials therefor
    • G01N35/00029Automatic analysis not limited to methods or materials provided for in any single one of groups G01N1/00 - G01N33/00; Handling materials therefor provided with flat sample substrates, e.g. slides
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N35/00Automatic analysis not limited to methods or materials provided for in any single one of groups G01N1/00 - G01N33/00; Handling materials therefor
    • G01N35/00029Automatic analysis not limited to methods or materials provided for in any single one of groups G01N1/00 - G01N33/00; Handling materials therefor provided with flat sample substrates, e.g. slides
    • G01N2035/00099Characterised by type of test elements
    • G01N2035/00158Elements containing microarrays, i.e. "biochip"

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

Computerimplementiertes Verfahren zum Trainieren eines Klassifikators (60) umfassend die Schritte:• Ermitteln zumindest eines ersten Eingabesignals (xi), wobei das erste Eingabesignal (xi) eine Mehrzahl von Auswertungspunkten (602) eines molekularbiologischen Untersuchungssystems (600) charakterisiert und dem ersten Eingabesignal (xi) ein gewünschtes Ausgabesignal (ti) zugeordnet ist, welches eine Klassifikation der Auswertungspunkte (602) charakterisiert;• Aufteilen des ersten Eingabesignals (xi) in eine Mehrzahl von zweiten Eingabesignalen (xa,xb,xc) gemäß einer Anordnung der Auswertungspunkte (602);• Ermitteln einer Mehrzahl von ersten Repräsentationen (za, zb, zc), wobei für jedes zweite Eingabesignal (xa, xb, xc) zumindest einer ersten Untermenge der Mehrzahl von zweiten Eingabesignal (xa, xb, xc) eine erste Repräsentation (za, zb, zc) mittels des Klassifikators (60) ermittelt wird;• Ermitteln eines Ausgabesignals (yi) mittels des Klassifikators (60) und basierend auf der Mehrzahl von ersten Repräsentationen (za, zb, zc), wobei das Ausgabesignal (yi) eine Klassifikation des ersten Eingabesignals (xi) charakterisiert;• Anpassen zumindest eines Parameters (Φ) des Klassifikators (60) gemäß eines Verlustwertes, wobei der Verlustwert einen Unterschied zwischen dem ermittelten Ausgabesignal (yi) und dem gewünschten Ausgabesignal (ti) charakterisiert.

Description

  • Technisches Gebiet
  • Die Erfindung betrifft ein Verfahren zum Trainieren eines Klassifikators, ein Verfahren zur Klassifikation mittels des trainierten Klassifikators, eine Trainingsvorrichtung, ein System zur Datenverarbeitung, ein Computerprogramm und ein maschinenlesbares Speichermedium
  • Stand der Technik
  • Aus der DE 10 2016 222 075 A1 ist ein Verfahren zur Prozessierung einer Kartusche, insbesondere einer mikrofluidischen Kartusche, und einer in die Kartusche aufgenommenen biologische Probe mittels einer Prozessiereinheit bekannt.
  • Vorteile der Erfindung
  • Bei automatisierten Analysesystemen wie beispielsweise Lab-on-a-Chip-Systemen für die In-vitro-Diagnostik werden hohe Anforderungen an die Korrektheit der Ergebnisse der Analysesysteme gestellt. Insbesondere falls ein solches Analysesystem für medizinische Tests von biologischen Proben menschlichen Ursprungs, z.B. in Hinblick auf Infektionskrankheiten, verwendet wird, wird erwartet, dass die Ergebnisse in Hinblick auf Sensitivität und Spezifität höchsten Anforderungen genügen.
  • Der Vorteil des Verfahrens mit Merkmalen des unabhängigen Anspruchs 1 ist, dass ein Klassifikator ermittelt werden kann, der eine höhere Klassifikationsgenauigkeit bezüglich eines medizinischen Testergebnisses aufweist. Der Klassifikator ist daher vorteilhafterweise in der Lage die Testgenauigkeit einer medizinischen Analysevorrichtung zu verbessern.
  • Offenbarung der Erfindung
  • In einem ersten Aspekt betrifft die Erfindung ein computerimplementiertes Verfahren zum Trainieren eines Klassifikators umfassend die Schritte:
    • • Ermitteln zumindest eines ersten Eingabesignals, wobei das erste Eingabesignal eine Mehrzahl von Auswertungspunkten eines molekularbiologischen Untersuchungssystems charakterisiert und dem ersten Eingabesignal ein gewünschtes Ausgabesignal zugeordnet ist, welches eine Klassifikation der Auswertungspunkte charakterisiert;
    • • Aufteilen des ersten Eingabesignals in eine Mehrzahl von zweiten Eingabesignalen gemäß einer Anordnung der Auswertungspunkte;
    • • Ermitteln einer Mehrzahl von ersten Repräsentationen, wobei für jedes zweite Eingabesignal zumindest einer ersten Untermenge der Mehrzahl von zweiten Eingabesignal eine erste Repräsentation mittels des Klassifikators ermittelt wird;
    • • Ermitteln eines Ausgabesignals mittels des Klassifikators und basierend auf der Mehrzahl von ersten Repräsentationen, wobei das Ausgabesignal eine Klassifikation des ersten Eingabesignals charakterisiert;
    • • Anpassen zumindest eines Parameters des Klassifikators gemäß eines Verlustwertes, wobei der Verlustwert einen Unterschied zwischen dem ermittelten Ausgabesignal und dem gewünschten Ausgabesignal charakterisiert.
  • Die Auswertungspunkte können insbesondere Auswertungspunkte eines Labors auf einem Chip (engl. lab-on-chip system) sein, welche eine biologische Probe, z.B. eine Blutprobe, eine Urinprobe, eine Speichelprobe oder eine Probe aus einem Abstrich, auswerten, insbesondere in Hinblick auf das Vorhandensein von zumindest einem Pathogen, z.B. zumindest einem Virus und/oder zumindest einem Bakterium und/oder zumindest einem Pilz, in der Probe. Das Verfahren kann derart Verstanden werden, als dass der Klassifikator derart trainiert wird, dass er basierend auf den Auswertungspunkten eine Klassifikation ermittelt. Insbesondere kann die Klassifikation charakterisieren, ob das zumindest eine Pathogen in der Probe vorliegt oder nicht bzw. mit welcher Wahrscheinlich das zumindest eine Pathogen in der Probe vorliegt und/oder mit welcher Wahrscheinlichkeit das zumindest eine Pathogen nicht in der Probe vorliegt.
  • Das Verfahren kann weiterhin derart verstanden werden, als dass zum Training ein Vorhandensein oder eine Abwesenheit des zumindest einen Pathogens mittels des gewünschten Ausgabesignals dem Klassifikator angezeigt wird. Nach dem Training ist der Klassifikator in der Lage, basierend auf einer neuen Mehrzahl von Auswertungspunkten bezüglich einer neuen Probe zu ermitteln, ob das zumindest eine Pathogen in der neuen Probe vorliegt oder nicht.
  • Das Lab-on-Chip-System kann insbesondere eine Mikroreihe (engl. Microarray) umfassen. Unter einem Microarray kann ein Analysesystem verstanden werden, das die parallele Analyse von mehreren, insbesondere mehreren zehn oder mehreren hundert bis tausend, Einzelnachweisen in einer geringen Menge biologischen Probenmaterials ermöglicht. Es gibt unterschiedliche Arten von Microarrays, die auch als Genchips oder Biochips bezeichnet werden, da diese vergleichbar einem Computerchip viele Informationen auf kleinstem Raum enthalten können.
  • Das Mikroarray kann insbesondere über eine Mehrzahl von Auswertungspunkten (engl. Spots) verfügen, auf denen die Probe aufgetragen werden kann. Auf den Auswertungspunkten können insbesondere Reagenzien, z.B. bestimmte Proteine, aufgetragen sein, die beim Auftragen der Probe zu einer biochemischen Reaktion führen, die den Nachweis des zumindest einen Pathogens ermöglichen. Insbesondere können die biochemischen Reaktionen dazu führen, dass an den entsprechenden Positionen der Auswertungspunkte des Microarrays basierend auf einer Chemilumineszenz eine elektromagnetische Strahlung abgesondert wird. Auch ist möglich, dass nach einer entsprechenden biochemischen Reaktion mittels Fluoreszenz eine elektromagnetische Strahlung an den entsprechenden Positionen abgesondert wird.
  • Unabhängig davon, ob die elektromagnetische Strahlung basierend auf Chemilumineszenz oder Fluoreszenz erzeugt wird, kann die erzeugte elektromagnetische Strahlung mittels eines optoelektronischen Sensors, insbesondere einer Kamera, gemessen werden und z.B. in Form eines Bildes bereitgestellt werden. Da die Auswertungspunkte abhängig von den Reagenzien und einem Vorhandensein oder einer Abwesenheit des zumindest einen Pathogens unterschiedlich starke elektromagnetische Strahlung absondern, entsteht ein für die Probe charakteristisches Bild. Insbesondere können in dem Bild abgebildeten Auswertungspunkte unterschiedliche Helligkeitsstufen aufweisen können.
  • Das Bild kann insbesondere als erstes Eingabesignal verwendet werden. Alternativ ist auch möglich, dass das Bild zunächst einen oder mehrere Vorverarbeitungsschritte, insbesondere Vorverarbeitungsschritte aus dem Bereich des maschinellen Sehens (engl. Computer Vision) durchläuft, bevor es als Eingabesignal zur Verfügung gestellt wird.
  • Bestimmte Teile des Eingabesignals können als zu einzelnen Auswertungspunkten zugehörig verstanden werden. Zum Beispiel können bestimmte Bereiche des Bildes jeweils einzelnen Auswertungspunkten zugeordnet werden. Insbesondere kann das Bild abhängig von der Position der Auswertungspunkte in eine Mehrzahl von zweiten Bildern zerlegt werden, wobei jeweils ein zweites Bild nur einen Auswertungspunkt darstellt. Die zweiten Bilder können hierbei als die zweiten Eingabesignale verstanden werden. Vorzugsweise sind die Auswertungspunkte in einem Raster angeordnet, wobei das Bild entsprechend des Rasters in die Mehrzahl von zweiten Bildern aufgeteilt wird.
  • Der Vorteil des Aufteilens des ersten Eingabesignals in die Mehrzahl von zweiten Eingabesignalen ist, dass so jeder Auswertungspunkt vom Klassifikator individuell ausgewertet werden kann. Insbesondere kann so zu jedem Auswertungspunkt eine erste Repräsentation ermittelt werden, die als den Auswertungspunkt charakterisierend verstanden werden kann. Die ersten Repräsentationen können jeweils in Form eines Vektors, einer Matrix oder eines Tensors vorliegen und Werte umfassen, die den Inhalt des jeweiligen zweiten Eingabesignals charakterisieren. Vorzugsweise können die ersten Repräsentationen mittels eines maschinellen Lernverfahrens ermittelt werden.
  • Überraschenderweise konnten die Erfinder feststellen, dass die Ermittlung des Ausgabesignals basierend auf der Mehrzahl von ersten Repräsentationen eine wesentlich bessere Klassifikationsgenauigkeit des Klassifikators ermöglicht.
  • Alternativ ist auch möglich, dass für zumindest ein zweites Eingabesignal keine erste Repräsentation ermittelt wird. Dies ist insbesondere dann vorteilhaft, wenn bestimmte Auswertungspunkte einem anderen Zweck dienen als der Analyse der Probe. Zum Beispiel kann ein Auswertungspunkt lediglich dazu dienen anzuzeigen, ob auf den Auswertungspunkten überhaupt eine Probe aufgetragen wurde oder nicht. Der Auswertungspunkt trägt in diesem Beispiel nicht zur Klassifikation des Vorhandenseins oder der Abwesenheit zumindest einen Pathogens innerhalb der Probe bei und kann daher vom Klassifikator vernachlässigt werden.
  • In einer bevorzugten Ausprägung des Verfahrens kann der Klassifikator zumindest ein erstes neuronales Netz umfassen, mittels welchem die ersten Repräsentationen ermittelt werden.
  • Der Vorteil des zumindest einen ersten neuronalen Netzes ist, dass neuronale Netze besonders geeignet sind aussagekräftige Repräsentationen aus Daten zu ermitteln. Durch die Ermittlung von aussagekräftigen Repräsentationen wird die Ermittlung der Klassifikation maßgeblich vereinfacht, wodurch eine Klassifikationsgenauigkeit des Klassifikators, also eine Fähigkeit korrekt zu prädizieren, ob das zumindest eine Pathogen in der Probe vorliegt oder nicht, gesteigert wird.
  • In einer bevorzugten Ausprägung umfasst der Klassifikator eine Mehrzahl von ersten neuronalen Netzen, wobei der Klassifikator für jeweils ein zweites Eingabesignal der ersten Untermenge ein erstes neuronales Netz umfasst, mittels welchem die erste Repräsentation des zweiten Eingabesignals ermittelt wird.
  • Dies kann derart verstanden werden, als das für jeweils einen Auswertungspunkt ein erstes neuronales Netz vom Klassifikator umfasst wird, wobei das erste neuronale Netz während des Trainings lernt, die charakteristischen Eigenschaften der zweiten Eingabesignale zu lernen, die jeweils den Auswertungspunkt zeigen. Das erste neuronale Netz kann mit dem Auswertungspunkt als korrespondierend erachtet werden. Das erste neuronale Netz wird gewissermaßen auf den Auswertungspunkt spezialisiert. Der Vorteil dieser Herangehensweise liegt darin, dass jedes erste neuronale Netz sich auf den mit ihm jeweils korrespondierenden Auswertungspunkt bzw. die zweiten Eingabesignale, die den korrespondierenden Auswertungspunkt zeigen, fokussieren kann. Hierdurch wird die Lernaufgabe, nämlich aussagekräftige erste Repräsentationen aus dem ersten Eingabesignal ermitteln zu können, aus denen dann eine genaue Klassifikation ermittelt werden kann, vereinfacht, was zu einer besseren Klassifikationsgenauigkeit des Klassifikators führt.
  • Als Parameter können im Trainingsverfahren insbesondere eine Mehrzahl von Gewichten der jeweils ersten neuronalen Netze und/oder eine Mehrzahl von zweiten Gewichten des zweiten neuronalen Netzes verstanden werden.
  • Weiterhin ist möglich, dass das Ausgabesignal mittels eines vom Klassifikator umfassten zweiten neuronalen Netzes und basierend auf den ersten Repräsentationen ermittelt wird.
  • Die Erfinder konnten feststellen, dass der Einsatz eines zweiten neuronalen Netzes zu einer weiteren Steigerung der Klassifikationsgenauigkeit führt. Die Kombination aus ersten neuronalen Netzen und zweitem neuronalen Net kann auch als ein gesamtes neuronales Netz verstanden werden, wobei das gesamte neuronale Netz die Mehrzahl von zweiten Eingabesignalen zunächst auf separaten Pfaden durch das gesamte neuronale Netz führt (nämlich den jeweils ersten neuronalen Netzen) und die Informationen dieser Pfade danach zusammenführt (nämlich mittels des zweiten neuronalen Netzes), um anschließend das Ausgabesignal zu ermitteln.
  • Weiterhin betrifft die Erfindung ein computerimplementiertes Verfahren zum Ermitteln eines Ausgabesignals, wobei das Ausgabesignal eine Klassifikation eines ersten Eingabesignals charakterisiert, wobei das erste Eingabesignal eine Mehrzahl von Auswertungspunkten eines molekularbiologischen Untersuchungssystems charakterisiert, wobei das Verfahren die folgenden Schritte umfasst:
    • • Trainieren eines Klassifikators gemäß einem der oben beschriebenen Aspekte und/oder Ausprägungen;
    • • Aufteilen des ersten Eingabesignals in eine Mehrzahl von zweiten Eingabesignalen gemäß einer Anordnung der Mehrzahl von Auswertungspunkten;
    • • Ermitteln des Ausgabesignals basierend auf der Mehrzahl von zweiten Eingabesignalen mittels des Klassifikators.
  • Das Verfahren zur Ermittlung des Ausgabesignals kann als Inferenz mittels des Klassifikators verstanden werden, der vorher mittels einer Ausprägung des Verfahrens zum Trainieren trainiert wurde. Das Verfahren zur Ermittlung des Ausgabesignals erhält seine Vorteile daher vom Verfahren zum Training, nämlich eine verbesserte Klassifikationsgenauigkeit des Klassifikators.
  • Bevorzugt ist weiterhin möglich, dass eine Anzeigevorrichtung basierend auf dem ermittelten Ausgabesignal derart angesteuert wird, dass die Anzeigevorrichtung die Klassifikation geeignet darstellt.
  • Beispielsweise ist möglich, dass das Ergebnis der Klassifikation auf einem Display der Anzeigevorrichtung dargestellt wird. Alternativ oder zusätzlich ist möglich, dass, falls das Ausgabesignal eine Klassifikation eines Vorhandenseins zumindest eines Pathogens charakterisiert, die Anzeigevorrichtung ein akustisches Signal z.B. mittels eines Lautsprechers ausgibt.
  • Nachfolgend werden Ausführungsformen der Erfindung unter Bezugnahme auf die beiliegenden Zeichnungen näher erläutert. In den Zeichnungen zeigen:
    • 1 schematisch einen Aufbau eines Klassifikators zur Klassifikation von Auswertungspunkten eines molekularbiologischen Untersuchungssystems;
    • 2 schematisch ein Trainingssystem zum Trainieren des Klassifikators;
    • 3 schematisch ein Steuerungssystem zur Steuerung eines molekularbiologischen Untersuchungssystems;
    • 4 schematisch ein Ausführungsbeispiel eines molekularbiologischen Untersuchungssystems.
  • Beschreibung der Ausführungsbeispiele
  • 1 zeigt einen Klassifikator (60) zur Klassifikation einer Mehrzahl von Auswertungspunkten eines molekularbiologischen Untersuchungssystems. Dem Klassifikator (60) wird ein erstes Eingabesignal (x) übermittelt, welches die Auswertungspunkte charakterisiert, wobei der Klassifikator (60) bezüglich des ersten Eingabesignals (x) ein Ausgabesignal (y) ermittelt, welches eine Klassifikation des Eingabesignals (x) charakterisiert. Insbesondere kann das erste Eingabesignal (x) ein Bild eines optoelektronischen Sensors bezüglich der Auswertungspunkte sein. Bevorzugt sind die Auswertungspunkte in einem rechtwinkligen Raster angeordnet.
  • Die Auswertungspunkte können insbesondere Auswertungspunkte eines Microarrays sein, die mittels einer Protein-Protein Interaktion von Proteinen auf den Auswertungspunkten zu Proteinen einer biologischen Probe das Vorhandensein oder die Abwesenheit bestimmter Proteine in der Probe anzeigen können. Insbesondere kann so angezeigt werden, ob die Probe spezifische Proteine eines Pathogens, z.B. eines Virus, enthält.
  • Das Eingabesignal (x) wird einer Aufteilungseinheit (61) zugeführt. Die Aufteilungseinheit zerlegt das erste Eingabesignal (x) in eine Mehrzahl von zweiten Eingabesignalen (xa, xb, xc). Hierfür kann die Aufteilungseinheit zumindest einen Vorverarbeitungsschritt durchführen. Zum Beispiel ist möglich, dass das erste Eingabesignal (x) ein Bild ist und die Aufteilungseinheit das Bild zunächst rotiert und/oder verschiebt und/oder skaliert und anschließend das vorverarbeitete Bild in rechteckige Ausschnitte zerlegt.
  • Die Zerlegung erfolgt gemäß einem Wissen der Aufteilungseinheit (61) über die Anordnung der Auswertungspunkte innerhalb des ersten Eingabesignal (x). Beispielsweise können die Auswertungspunkte in einem Raster angeordnet sein, wobei das erste Eingabesignal (x) ein Bild des Rasters ist. Der Aufteilungseinheit (61) kann in diesem Fall eine Information bezüglich des Aufbaus des Rasters vorliegen. Insbesondere kann die Aufteilungseinheit das Bild so rotieren, dass die Auswertungspunkte innerhalb des rotierten Bildes entlang einer horizontalen Achse und einer vertikalen Achse liegen. Anschließend kann das Bild entlang der Achsen zerlegt werden, um die zweiten Eingabesignale (xa, xb, xc) zu ermitteln.
  • Die zweiten Eingabesignale (xa, xb, xc) werden anschließend jeweils einem ersten neuronalen Netz (62a, 62b, 63c) zugeführt, wobei für jedes zweite Eingabesignal (xa, xb, xc) ein erstes neuronales Netz (62a, 62b, 63c) im Klassifikator (60) vorliegt. In alternativen Ausführungsbeispielen kann auch vorgesehen sein, dass für zumindest ein zweites Eingabesignal (xa, xb, xc) kein erstes neuronales Netz vorliegt und daher für die Ermittlung des Ausgabesignals (y) das zweite Eingabesignal (xa, xb, xc) nicht berücksichtigt wird.
  • Die ersten neuronalen Netze (62a, 62b, 63c) ermitteln basierend auf den zweiten Eingabesignalen (xa, xb, xc) jeweils erste Repräsentationen (za, zb, zc). Die ersten Repräsentationen (za, zb, zc) werden dann einem zweiten neuronalen Netz (63) als Eingabe übergeben. Das zweite neuronale Netz (63) ermittelt dann auf Basis der ersten Repräsentationen (za, zb, zc) das Ausgabesignal (y)
  • 2 zeigt ein Ausführungsbeispiel eines Trainingssystems (140) zum Trainieren des Klassifikators (60) mittels eines Trainingsdatensatzes (T). Der Trainingsdatensatz (T) umfasst eine Mehrzahl von ersten Eingabesignalen (xi), die zum Trainieren des Klassifikators (60) verwendet werden, wobei der Trainingsdatensatz (T) ferner zu jeweils einem Eingabesignal (xi) ein gewünschtes Ausgabesignal (ti) umfasst, welches mit dem ersten Eingabesignal (xi) korrespondiert und eine Klassifikation des Eingabesignals (xi) charakterisiert. Insbesondere kann ein erstes Eingabesignal (xi) ein Bild einer Mehrzahl von Auswertungspunkten eines Microarrays sein, während das mit dem ersten Eingabesignal (xi) korrespondierende gewünschte Ausgabesignal (ti) charakterisiert, ob in einer biologischen Probe, die auf den Auswertungspunkten aufgetragen wurde, zumindest ein Pathogen enthält oder nicht. Vorzugsweise wird bei einem Vorhandensein eines Pathogens in der Probe außerdem die Klasse des Pathogens im gewünschten Ausgabesignal (ti) charakterisiert.
  • Zum Training greift eine Trainingsdateneinheit (150) auf eine computerimplementierte Datenbank (St2) zu, wobei die Datenbank (St2) den Trainingsdatensatz (T) zur Verfügung stellt. Die Trainingsdateneinheit (150) ermittelt aus dem Trainingsdatensatz (T) vorzugsweise zufällig zumindest ein erstes Eingabesignal (xi) und das zum ersten Eingabesignal (xi) korrespondierende gewünschte Ausgabesignal (ti) und übermittelt das erste Eingabesignal (xi) an den Klassifikator (60). Der Klassifikator (60) ermittelt auf Basis des ersten Eingabesignals (xi) ein Ausgabesignal (yi.
  • Das gewünschte Ausgabesignal (ti) und das ermittelte Ausgabesignal (yi) werden an eine Veränderungseinheit (180) übermittelt.
  • Basierend auf dem gewünschten Ausgabesignal (ti) und dem ermittelten Ausgabesignal (yi) werden dann von der Veränderungseinheit (180) neue Parameter (Φ') für den Klassifikator (60) bestimmt. Im Ausführungsbeispiel kann eine Mehrzahl von Gewichten der ersten neuronalen Netze (62a, 62b, 63c) und/oder eine Mehrzahl von Gewichten des zweiten neuronalen Netzes (63) als die Parameter (Φ) des Klassifikators (60) verstanden werden, für die von der Veränderungseinheit neue Parameter (Φ') ermittelt werden. Hierfür vergleicht die Veränderungseinheit (180) das gewünschte Ausgabesignal (ti) und das ermittelte Ausgabesignal (yi) mittels einer Verlustfunktion (engl. Loss Function). Die Verlustfunktion ermittelt einen ersten Verlustwert, der charakterisiert, wie weit das ermittelte Ausgabesignal (yi) vom gewünschten Ausgabesignal (ti) abweicht. Als Verlustfunktion wird im Ausführungsbeispiel eine negative logarithmierte Plausibilitätsfunktion (engl. negative log-likehood function) gewählt, insbesondere eine kategorische Kreuzentropiefunktion (engl. categorical cross entropy loss). In alternativen Ausführungsbeispielen sind auch andere Verlustfunktion denkbar.
  • Die Veränderungseinheit (180) ermittelt auf Grundlage des ersten Verlustwertes die neuen Parameter (Φ'). Im Ausführungsbeispiel geschieht dies mittels eines Gradientenabstiegsverfahren, vorzugsweise Stochastic Gradient Descent, Adam, oder AdamW.
  • Die ermittelten neuen Parameter (Φ') werden in einem Modellparameterspeicher (St1) gespeichert. Vorzugsweise werden die ermittelten neuen Parameter (Φ') als Parameter (Φ) dem Klassifikator (60) bereitgestellt.
  • In weiteren bevorzugten Ausführungsbeispielen wird das beschriebene Training iterativ für eine vordefinierte Anzahl an Iterationsschritten wiederholt oder iterativ wiederholt, bis der erste Verlustwert einen vordefinierten Schwellenwert unterschreitet. Alternativ oder zusätzlich ist auch vorstellbar, dass das Training beendet wird, wenn ein durchschnittlicher erster Verlustwert bezüglich eines Test- oder Validierungsdatensatzes einen vordefinierten Schwellenwert unterschreitet. In mindestens einer der Iterationen werden die in einer vorherigen Iteration bestimmten neuen Parameter (Φ') als Parameter (Φ) des Klassifikators (60) verwendet.
  • Des Weiteren kann das Trainingssystem (140) mindestens einen Prozessor (145) und mindestens ein maschinenlesbares Speichermedium (146) umfassen, welches Befehle enthält, welche, wenn sie durch den Prozessor (145) ausgeführt werden, das Trainingssystem (140) veranlassen, ein Trainingsverfahren nach einem der Aspekte der Erfindung auszuführen.
  • 3 ein Steuerungssystem (40) einer Prozessiereinheit zur Prozessierung von biologischen Proben mittels des trainierten Klassifikators (60). Ein optoelektronischer Sensor (30), z.B. eine Kamera, der Prozessiereinheit ermittelt ein Sensorsignal (S), welches eine Mehrzahl von Auswertungspunkten charakterisiert.
  • Das Steuerungssystem (40) empfängt die das Sensorsignal (S) des Sensors (30) in einer optionalen Empfangseinheit (50), die das Sensorsignal (S) in ein erstes Eingabesignal (x) umwandelt (alternativ kann auch unmittelbar das Sensorsignal (S) als erstes Eingangssignal (x) übernommen werden). Das erste Eingabesignal (x) kann beispielsweise ein Ausschnitt oder eine Weiterverarbeitung des Sensorsignals (S) sein. Mit anderen Worten wird das erste Eingabesignal (x) abhängig von Sensorsignal (S) ermittelt. Das erste Eingabesignal (x) wird denn dem trainierten Klassifikator (60) zugeführt.
  • Der Klassifikator (60) wird vorzugsweise parametriert durch Parameter (Φ), die in einem Parameterspeicher (P) hinterlegt sind und von diesem bereitgestellt werden.
  • Der Klassifikator (60) ermittelt aus dem ersten Eingabesignal (x) ein Ausgabesignal (y). Das Ausgabesignal (y) werden einer optionalen Umformeinheit (80) zugeführt, die hieraus ein Ansteuersignale (A) ermittelt, welches einer Anzeigevorrichtung (10a) zugeführt wird, um die Anzeigevorrichtung (10a) entsprechend anzusteuern.
  • In weiteren bevorzugten Ausführungsformen umfasst das Steuerungssystem (40) zumindest einen Prozessor (45) und zumindest ein maschinenlesbares Speichermedium (46), auf dem Anweisungen gespeichert sind, die dann, wenn sie auf dem zumindest einen Prozessor (45) ausgeführt werden, das Steuerungssystem (40) veranlassen, das erfindungsgemäße Verfahren auszuführen.
  • 4 zeigt ein Ausführungsbeispiel, in dem das Steuerungssystem (40) die Prozessiereinheit (600) steuert. Der Prozessiereinheit (600) wird eine Mikroreihe (601, engl. Microarray) zugeführt, welche eine Mehrzahl von Auswertungspunkten (602) oder auch Testfeldern umfasst, wobei die Testfelder mit einer biologischen Probe bestrichen wurden. Die Probe kann beispielsweise einem Abstrich eines Menschen entstammen.
  • Das Microarray (601) kann insbesondere ein Protein-Microarray sein. Der Sensor (30) ist eingerichtet das Microarray (601) aufzuzeichnen. Als Sensor (30) kann insbesondere ein optoelektronischer Sensor verwendet werden, vorzugsweise eine Kamera. Der Klassifikator (60) kann daher als Bildklassifikator verstanden werden.
  • Das Ansteuersignal (A) kann dann derart gewählt werden, dass das Ergebnis der Klassifikation auf einem Display der der Anzeigevorrichtung (10a) dargestellt wird. Alternativ oder zusätzlich kann auch ein akustisches Signal mittels eines Lautsprechers der Anzeigevorrichtung (10a) ausgegeben werden, falls das Ausgabesignal (y) das Vorhandensein zumindest eines Pathogens in der Probe charakterisiert.
  • Der Begriff „Computer“ umfasst beliebige Geräte zur Abarbeitung vorgebbarer Rechenvorschriften. Diese Rechenvorschriften können in Form von Software vorliegen, oder in Form von Hardware, oder auch in einer Mischform aus Software und Hardware.
  • Im Allgemeinen kann eine Mehrzahl als indexiert verstanden werden, d.h. jedem Element der Mehrzahl wird ein eindeutiger Index zugewiesen, vorzugsweise durch Zuweisung aufeinanderfolgender Ganzzahlen an die in der Mehrzahl enthaltenen Elemente. Vorzugsweise, wenn eine Mehrzahl N Elemente umfasst, wobei N die Anzahl der Elemente in der Mehrzahl ist, werden den Elementen die ganzen Zahlen von 1 bis N zugewiesen.
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • DE 102016222075 A1 [0002]

Claims (13)

  1. Computerimplementiertes Verfahren zum Trainieren eines Klassifikators (60) umfassend die Schritte: • Ermitteln zumindest eines ersten Eingabesignals (xi), wobei das erste Eingabesignal (xi) eine Mehrzahl von Auswertungspunkten (602) eines molekularbiologischen Untersuchungssystems (600) charakterisiert und dem ersten Eingabesignal (xi) ein gewünschtes Ausgabesignal (ti) zugeordnet ist, welches eine Klassifikation der Auswertungspunkte (602) charakterisiert; • Aufteilen des ersten Eingabesignals (xi) in eine Mehrzahl von zweiten Eingabesignalen (xa, xb, xc) gemäß einer Anordnung der Auswertungspunkte (602); • Ermitteln einer Mehrzahl von ersten Repräsentationen (za, zb, zc), wobei für jedes zweite Eingabesignal (xa, xb, xc) zumindest einer ersten Untermenge der Mehrzahl von zweiten Eingabesignal (xa, xb, xc) eine erste Repräsentation (za, zb, zc) mittels des Klassifikators (60) ermittelt wird; • Ermitteln eines Ausgabesignals (yi) mittels des Klassifikators (60) und basierend auf der Mehrzahl von ersten Repräsentationen (za, zb, zc), wobei das Ausgabesignal (yi) eine Klassifikation des ersten Eingabesignals (xi) charakterisiert; • Anpassen zumindest eines Parameters (Φ) des Klassifikators (60) gemäß eines Verlustwertes, wobei der Verlustwert einen Unterschied zwischen dem ermittelten Ausgabesignal (yi) und dem gewünschten Ausgabesignal (ti) charakterisiert.
  2. Verfahren nach Anspruch 1, wobei das Eingabesignal (xi) basierend auf einem Sensorsignal (S) eines optoelektronischen Sensors (30) ermittelt wird, wobei das Sensorsignal (S) eine Messung der Auswertungspunkte (602) charakterisiert.
  3. Verfahren nach Anspruch 1 oder 2, wobei der Klassifikator (60) zumindest ein erstes neuronales Netz umfasst (62a, 62b, 62c), mittels welchem die ersten Repräsentationen (za, zb, zc) ermittelt werden.
  4. Verfahren nach Anspruch 1 oder 2, wobei der Klassifikator (60) eine Mehrzahl von ersten neuronalen Netzen (62a, 62b, 63c) umfasst, wobei der Klassifikator (60) für jeweils ein zweites Eingabesignal (xa, xb, xc) der ersten Untermenge ein erstes neuronales Netz (62a, 62b, 62c) umfasst, mittels welchem die erste Repräsentation (za, zb, zc) des zweiten Eingabesignals (xa, xb, xc) ermittelt wird.
  5. Verfahren nach einem der vorhergehenden Ansprüche, wobei das Ausgabesignal (yi) mittels eines vom Klassifikator (60) umfassten zweiten neuronalen Netzes (63) und basierend auf den ersten Repräsentationen (za, zb, zc) ermittelt wird.
  6. Verfahren nach einem der vorhergehenden Ansprüche, wobei das molekularbiologischen Untersuchungssystems (600) eine Mikroreihe (601, engl. Microarray) umfasst und das Eingabesignal (xi) ein Bild der Auswertungspunkte (602) der Mikroreihe (601) charakterisiert.
  7. Verfahren nach Anspruch 6, wobei jeweils ein zweites Eingabesignal (xa, xb, xc) der Mehrzahl von zweiten Eingabesignalen (xa, xb, xc) ein Ausschnitt des Bildes ist, wobei der Ausschnitt gemäß der Anordnung der Auswertungspunkte (602) der Mikroreihe (601) gewählt wird.
  8. Computerimplementiertes Verfahren zum Ermitteln eines Ausgabesignals (y), wobei das Ausgabesignal (y) eine Klassifikation eines ersten Eingabesignals (x) charakterisiert, wobei das erste Eingabesignal (x) eine Mehrzahl von Auswertungspunkten (602) eines molekularbiologischen Untersuchungssystems (600) charakterisiert, wobei das Verfahren die folgenden Schritte umfasst: • Trainieren eines Klassifikators (60) gemäß einem der Ansprüche 1 bis 7; • Aufteilen des ersten Eingabesignals (x) in eine Mehrzahl von zweiten Eingabesignalen (xa, xb, xc) gemäß einer Anordnung der Mehrzahl von Auswertungspunkten (602); • Ermitteln des Ausgabesignals (y) basierend auf der Mehrzahl von zweiten Eingabesignalen (xa, xb, xc) mittels des Klassifikators (60).
  9. Verfahren nach Anspruch 8, wobei eine Anzeigevorrichtung (10a) basierend auf dem ermittelten Ausgabesignal (y) derart angesteuert wird, dass die Anzeigevorrichtung (10a) die Klassifikation darstellt.
  10. Trainingsvorrichtung (140), welche eingerichtet ist, das Verfahren nach einem der Ansprüche 1 bis 7 auszuführen.
  11. System zur Datenverarbeitung, umfassend Mittel zur Ausführung der Schritte des Verfahrens einem der Ansprüche 8 oder 9.
  12. Computerprogramm, welches eingerichtet ist, das Verfahren nach einem der Ansprüche 1 bis 9 auszuführen, wenn es durch einen Prozessor (45, 145) ausgeführt wird.
  13. Maschinenlesbares Speichermedium (46, 146), auf dem das Computerprogramm nach Anspruch 12 gespeichert ist.
DE102020215815.0A 2020-12-14 2020-12-14 Verfahren und Vorrichtung zum Trainieren eines Klassifikators für molekularbiologische Untersuchungen Pending DE102020215815A1 (de)

Priority Applications (5)

Application Number Priority Date Filing Date Title
DE102020215815.0A DE102020215815A1 (de) 2020-12-14 2020-12-14 Verfahren und Vorrichtung zum Trainieren eines Klassifikators für molekularbiologische Untersuchungen
EP21839066.4A EP4260241A1 (de) 2020-12-14 2021-12-10 Verfahren und vorrichtung zum trainieren eines klassifikators für molekularbiologische untersuchungen
CN202180093598.1A CN116940945A (zh) 2020-12-14 2021-12-10 用来对用于分子生物学研究的分类器进行训练的方法和装置
US18/257,343 US20240028892A1 (en) 2020-12-14 2021-12-10 Method and device for training a classifier for molecular biological examinations
PCT/EP2021/085187 WO2022128787A1 (de) 2020-12-14 2021-12-10 Verfahren und vorrichtung zum trainieren eines klassifikators für molekularbiologische untersuchungen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102020215815.0A DE102020215815A1 (de) 2020-12-14 2020-12-14 Verfahren und Vorrichtung zum Trainieren eines Klassifikators für molekularbiologische Untersuchungen

Publications (1)

Publication Number Publication Date
DE102020215815A1 true DE102020215815A1 (de) 2022-06-15

Family

ID=79270006

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102020215815.0A Pending DE102020215815A1 (de) 2020-12-14 2020-12-14 Verfahren und Vorrichtung zum Trainieren eines Klassifikators für molekularbiologische Untersuchungen

Country Status (5)

Country Link
US (1) US20240028892A1 (de)
EP (1) EP4260241A1 (de)
CN (1) CN116940945A (de)
DE (1) DE102020215815A1 (de)
WO (1) WO2022128787A1 (de)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040240718A1 (en) 2003-06-02 2004-12-02 Hitachi Software Engineering Co. Ltd. DNA microarray image analysis system
US20170175169A1 (en) 2015-12-18 2017-06-22 Min Lee Clinical decision support system utilizing deep neural networks for diagnosis of chronic diseases
DE102016222075A1 (de) 2016-11-10 2018-05-17 Robert Bosch Gmbh Prozessiersystem und Verfahren zur Prozessierung einer mikrofluidischen Kartusche mit einer Prozessiereinheit
US20200018749A1 (en) 2016-12-20 2020-01-16 Indevr, Inc. Plug-in expertise for pathogen identification using modular neural networks
WO2020146554A2 (en) 2019-01-08 2020-07-16 Abraham Jim Genomic profiling similarity

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180330056A1 (en) * 2015-07-02 2018-11-15 Indevr Inc. Methods of Processing and Classifying Microarray Data for the Detection and Characterization of Pathogens

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040240718A1 (en) 2003-06-02 2004-12-02 Hitachi Software Engineering Co. Ltd. DNA microarray image analysis system
US20170175169A1 (en) 2015-12-18 2017-06-22 Min Lee Clinical decision support system utilizing deep neural networks for diagnosis of chronic diseases
DE102016222075A1 (de) 2016-11-10 2018-05-17 Robert Bosch Gmbh Prozessiersystem und Verfahren zur Prozessierung einer mikrofluidischen Kartusche mit einer Prozessiereinheit
US20200018749A1 (en) 2016-12-20 2020-01-16 Indevr, Inc. Plug-in expertise for pathogen identification using modular neural networks
WO2020146554A2 (en) 2019-01-08 2020-07-16 Abraham Jim Genomic profiling similarity

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FAROUK, R. M. et.al.: Recognition of cDNA microarray image using feedforward artificial Neural Network. arXiv preprint arXiv:1410.2381, 2014.
ROJAS, T. et.al: Neural networks ensemble for automatic DNA microarray spot classification. Neural Computing and Applications, 2019, 31. Jg., Nr. 7, S. 2311-2327.

Also Published As

Publication number Publication date
US20240028892A1 (en) 2024-01-25
CN116940945A (zh) 2023-10-24
WO2022128787A1 (de) 2022-06-23
EP4260241A1 (de) 2023-10-18

Similar Documents

Publication Publication Date Title
EP1181525B1 (de) Verfahren zur automatischen analyse von mikroskopaufnahmen
DE69532276T2 (de) Automatisiertes cytologisches probenklassifizierungsverfahren
DE112014002045B4 (de) Nucleinsäure-Analysator und Nucleinsäure-Analysenverfahren unter Verwendung des Analysators
DE19616997A1 (de) Verfahren zur automatisierten mikroskopunterstützten Untersuchung von Gewebeproben oder Körperflüssigkeitsproben
DE102008059788A1 (de) Analyse und Klassifizierung insbesondere biologischer oder biochemischer Objekte auf Basis von Zeitreihen-Bildern, anwendbar bei der zytometrischen Time-Lapse-Zellanalyse in der bildbasierten Zytometrie
WO2015024770A1 (de) Analyseverfahren zur klassifikationsunterstützung
EP3971827B1 (de) Verfahren zum detektieren einer bindung von antikörpern einer patientenprobe an doppelsträngige dns unter verwendung von crithidia luciliae zellen und fluoreszenzmikroskopie
DE102020215815A1 (de) Verfahren und Vorrichtung zum Trainieren eines Klassifikators für molekularbiologische Untersuchungen
DE112020003977T5 (de) Informationsverarbeitungsvorrichtung, anzeigeverfahren, programm und informationsverarbeitungssystem
DE102020211219A1 (de) Verfahren und Steuergerät zum Bestimmen einer Anzahl von Proben für eine Sammelanalyse unter Verwendung eines Analysegeräts zum Analysieren von Proben biologischen Materials
EP4206986A1 (de) Verfahren zur analyse von gefügen in stahlproben
DE102020202360B4 (de) Verfahren und Vorrichtung zur Durchführung eines qPCR-Verfahrens
DE102011117320A1 (de) Vorrichtung und Verfahren zum Nachweis von in biologischen oder chemischen Proben vorliegenden Substanzen
DE102011055070B3 (de) Probenanalysevorrichtung zum Bestimmen von Proben in einer Probenmatrix und Verfahren zum Bestimmen von Proben in einer oder mehreren Probenmatrizen
EP2613139B1 (de) Verfahren zur Analyse von Proben und Systeme hierfür
WO2021122979A1 (de) Verfahren und vorrichtung zum ermitteln einer in einem fluid enthaltenen kopienanzahl einer dna-sequenz
EP1687756B1 (de) Verfahren zur klassifikation von messwerten in der medizinischen und biochemischen analytik
DE102022206892A1 (de) Verfahren zum Bestimmen einer optimalen Architektur eines künstlichen neuronalen Netzes
Dahlmanns Development of quantitative functional analysis tools and models for neuroscientific applications
EP3076333A1 (de) Analyseverfahren zur klassifikation einer testdispersion hinsichtlich des vorliegens einer sichelzellenanämie
EP3540650A1 (de) Maschinelles lernverfahren für eine vorrichtung zur signalauswertung
DE102022207072A1 (de) Verfahren zum Ermitteln einer optimalen Architektur eines künstlichen neuronalen Netzes
DE202023105443U1 (de) Ein System zur Abbildung einer Probe für biologische oder chemische Analysen
DE102022111622A1 (de) Computerprogramm und Verfahren zur verbesserten Asbestanalytik mit künstlicher Intelligenz
EP3931359A1 (de) Verfahren zum zählen von zelltypen oder zellmarkern in einer probe, insbesondere in einer blutprobe

Legal Events

Date Code Title Description
R163 Identified publications notified