WO2018108281A1 - Verfahren und vorrichtungen zum rechnergestützten konfigurieren eines tiefen neuronalen netzes - Google Patents

Verfahren und vorrichtungen zum rechnergestützten konfigurieren eines tiefen neuronalen netzes Download PDF

Info

Publication number
WO2018108281A1
WO2018108281A1 PCT/EP2016/081207 EP2016081207W WO2018108281A1 WO 2018108281 A1 WO2018108281 A1 WO 2018108281A1 EP 2016081207 W EP2016081207 W EP 2016081207W WO 2018108281 A1 WO2018108281 A1 WO 2018108281A1
Authority
WO
WIPO (PCT)
Prior art keywords
neural network
deep neural
layer
processing
measured value
Prior art date
Application number
PCT/EP2016/081207
Other languages
English (en)
French (fr)
Inventor
Thomas Engel
Alexander Michael Gigler
Ralph Grothmann
Stefanie VOGL
Hans-Georg Zimmermann
Original Assignee
Siemens Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Aktiengesellschaft filed Critical Siemens Aktiengesellschaft
Priority to PCT/EP2016/081207 priority Critical patent/WO2018108281A1/de
Publication of WO2018108281A1 publication Critical patent/WO2018108281A1/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

Die Erfindung bezieht sich auf ein Verfahren und Geräte, um das Systemverhalten eines dynamischen Systems zu ermitteln. Die Erfindung kann beispielsweise auf dem Gebiet der Medizintechnik eingesetzt werden, um z. B. einen Arzt beim klassifizieren von Gewebetypen/ Zelltypen zu unterstützen.

Description

Beschreibung
VERFAHREN UND VORRICHTUNGEN ZUM RECHNERGESTÜTZTEN KONFIGURIEREN EINES TIEFEN NEURONALEN NETZES
Die Erfindung bezieht sich auf ein Verfahren und Gerate, um das Systemverhalten eines dynamischen Systems zu ermitteln .
Die Erfindung kann beispielsweise auf dem Gebiet der Medizin- technik eingesetzt werden, um z. B. einen Arzt beim Klassifi- zieren von Gewebetypen/ Zelltypen zu unterstützen.
Beispielsweise werden spektroskopische Verfahren in vielen
Bereichen der Chemie, Lebensmittelchemie und Biochemie, sowie der Biologie und Medizin zur Bestimmung bzw. Klassifikation von Systemzuständen bzw. Systemverhalten eingesetzt. Die Verfahren beruhen insbesondere darauf, dass aufgezeichnete opti¬ sche Spektren als charakteristischer Fingerprint der
(bio ) chemischen Zusammensetzung der untersuchten Probe interpretiert und zur Klassifikation herangezogen werden. Um bei- spielsweise Spektraldaten von Einzelproben zur Klassifikation nutzen zu können, ist oft a priori Wissen über die typischen Eigenschaften der einzelnen zu unterscheidenden Klassen notwendig. So werden beispielsweise Peaks in bekannten Spektral¬ bereichen analysiert, um insbesondere den Wasser- oder Sauer- stoffgehalt zu analysieren und damit auffällige Testproben zu isolieren. Sollen jedoch beispielsweise Klassen unterschieden werden, deren biochemische und somit spektrale Eigenschaften nicht oder nur teilweise bekannt sind, können diese Verfahren nicht zur Anwendung gebracht werden.
Eine Aufgabe der vorliegenden Erfindung ist es, Verfahren und Vorrichtungen bereitzustellen, die es erlauben, Merkmale ei¬ nes Objekts mittels eines Systemverhaltens eines dynamischen Systems zu ermitteln.
Die Aufgabe wird durch die in den unabhängigen Ansprüchen angegebenen Merkmale gelöst. In den abhängigen Ansprüchen sind vorteilhafte Weiterbildungen der Erfindung dargestellt. Gemäß einem ersten Aspekt betrifft die Erfindung ein Verfahren zum rechnergestützten Konfigurieren eines tiefen neuronalen Netzes zur Ermittlung von Merkmalen eines Objekts mittels eines Systemverhaltens eines dynamischen Systems mit folgen¬ den Verfahrensschritten:
Bereitstellen (110) von Trainingsdaten für das dynamische System mit vorgegebenen ersten Eingabevektoren, wobei
- den jeweiligen ersten Eingabevektoren jeweils erste vorgegebene Ausgabevektoren zugeordnet sind und ein bekanntes Systemverhalten des dynamischen Systems beschreiben,
die jeweiligen ersten Eingabevektoren mittels einer Auswahlfunktion in Messwert-Abschnitte zerlegt wer¬ den,
Messwerte der Messwert-Abschnitte jeweils einem Er¬ gebniswert des dem ersten Eingabevektor zugeordne¬ ten ersten Ausgabevektors zugeordnet wird; - Konfigurieren (130) des tiefen neuronalen Netzes mittels der Trainingsdaten, wobei
das tiefe neuronale Netz eine Vielzahl von Verar¬ beitungsschichten umfasst,
- einer jeweiligen Verarbeitungs Schicht jeweils einer der Messwert-Abschnitte zugeordnet wird, jeweils die Messwerte eines entsprechenden Mess¬ wert-Abschnitts an die jeweilige Verarbeitungs¬ schicht übermittelt werden, die dem entsprechenden Messwert-Abschnitt zugeordnet ist,
- die den Messwerten zugeordneten Ergebniswerte der einer Ausgabeschicht des tiefen neuronalen Netzes übermittelt werden,
Neuronen der jeweiligen Verarbeitungsschichten anhand des bekannten Systemverhaltens konfiguriert werden.
Sofern es in der nachfolgenden Beschreibung nicht anders angegeben ist, beziehen sich die Begriffe "durchführen", "be- rechnen", "rechnergestützt", "rechnen", "feststellen", "generieren", "konfigurieren", "rekonstruieren" und dergleichen, vorzugsweise auf Handlungen und/oder Prozesse und/oder Verarbeitungsschritte, die Daten verändern und/oder erzeugen und/oder die Daten in andere Daten überführen, wobei die Daten insbesondere als physikalische Größen dargestellt werden oder vorliegen können, beispielsweise als elektrische Impul¬ se. Insbesondere sollte der Ausdruck "Computer" möglichst breit ausgelegt werden, um insbesondere alle elektronischen Geräte mit Datenverarbeitungseigenschaften abzudecken. Computer können somit beispielsweise Personal Computer, Server, Handheld-Computer-Systeme, Pocket-PC-Geräte, Mobilfunkgeräte und andere Kommunikationsgeräte, die rechnergestützt Daten verarbeiten können, Prozessoren und andere elektronische Ge- räte zur Datenverarbeitung sein.
Unter „rechnergestützt" kann im Zusammenhang mit der Erfindung beispielsweise eine Implementierung des Verfahrens ver¬ standen werden, bei dem insbesondere ein Prozessor mindestens einen Verfahrensschritt des Verfahrens ausführt.
Unter einem Prozessor kann im Zusammenhang mit der Erfindung beispielsweise eine Maschine oder eine elektronische Schal¬ tung verstanden werden. Bei einem Prozessor kann es sich ins- besondere um einen Hauptprozessor (engl. Central Processing Unit, CPU), einen Mikroprozessor oder einen Mikrokontroller, beispielsweise eine anwendungsspezifische integrierte Schal¬ tung oder einen digitaler Signalprozessor, möglicherweise in Kombination mit einer Speichereinheit zum Speichern von Pro- grammbefehlen, etc. handeln. Bei einem Prozessor kann es sich beispielsweise auch um einen IC (integrierter Schaltkreis, engl. Integrated Circuit), insbesondere einen FPGA (engl. Field Programmable Gate Array) oder einen ASIC (anwendungs¬ spezifische integrierte Schaltung, engl. Application-Specific Integrated Circuit), oder einen DSP (Digitaler Signalprozes¬ sor, engl. Digital Signal Processor) handeln. Auch kann unter einem Prozessor ein virtualisierter Prozessor oder eine Soft- CPU verstanden werden. Es kann sich beispielsweise auch um einen programmierbaren Prozessor handeln, der mit Konfigurationsschritten zur Ausführung des genannten erfindungsgemäßen Verfahrens ausgerüstet wird oder mit Konfigurationsschritten derart konfiguriert ist, dass der programmierbare Prozessor die erfindungsgemäßen Merkmale des Verfahrens, der Komponente, der Module, oder anderer Aspekte und/oder Teilaspekte der Erfindung realisiert .
Unter einer „Speichereinheit" kann im Zusammenhang mit der Erfindung beispielsweise ein Speicher in Form von Arbeits- Speicher (engl. Random-Acces s Memory, RAM) oder eine Fest- platte verstanden werden.
Unter einem „Modul" kann im Zusammenhang mit der Erfindung beispielsweise ein Prozessor und/oder eine Speichereinheit zum Speichern von Programmbefehlen verstanden werden. Beispielsweise ist der Prozessor speziell dazu eingerichtet, die Programmbefehle derart auszuführen, damit der Prozessor Funktionen ausführt, um das erfindungsgemäße Verfahren oder einen Schritt des erfindungsgemäßen Verfahrens zu implementieren oder realisieren.
Unter einem „dynamisches System" kann im Zusammenhang mit der Erfindung beispielsweise ein Filter oder eine Datenauswertung zum Verarbeiten von Messdatensätzen des Objekts bzw. von den Messwerten der Messwert-Abschnitte eines Messdatensatzes ver¬ standen werden. Dies kann beispielsweise in einem einfachen Fall eine Mittelwertbildung für jeden Messwert-Abschnitt sein, wobei insbesondere der ermittelte Mittelwert der jewei¬ ligen Verarbeitungsschicht an die Ausgabeschicht übermittelt wird. Das dynamische System kann jedoch deutlich komplexere Analysen realisieren, um beispielsweise anhand von optischen Spektren von Gewebe festzustellen, um welchen Gewebetyp es sich handelt .
Unter einem „Systemverhalten" kann im Zusammenhang mit der Erfindung beispielsweise ein Verhalten des dynamischen Systems auf Eingangsvektoren bzw. Messwerte/Messdatensätze ver- standen werden, um diese zum Beispiel auszuwerten bzw. zu klassifizieren. Wenn zum Beispiel das dynamische System Mittelwerte jeweils für die Messwert-Abschnitte berechnen soll, so definiert insbesondere das Systemverhalten, wie beispiels¬ weise der Mittelwert gebildet wird. Beispielsweise kann durch die Bestimmung des Systemverhaltens des dynamischen Systems insbesondere eine Klassifikationsaufgabe oder Regressionsauf¬ gabe für ein Objekt, beispielsweise erfasste Messdaten für das Objekt, gelöst werden. Bei einem Systemverhalten kann es sich beispielsweise auch um eine Datentransformation handeln, die insbesondere eine Dimension der Messwerte reduziert.
Unter „bereitstellen" kann im Zusammenhang mit der Erfindung beispielsweise ein Laden oder ein Speichern, beispielsweise des konfigurierten neuronalen Netzes, auf oder von einem Da- tenträger verstanden werden.
Unter „Echtzeit" kann im Zusammenhang mit der Erfindung beispielsweise ein Durchführen eines Ermitteins von Merkmalen für ein Objekt, beispielsweise für Gewebe oder Gewebetypen, während einer Operation eines Patienten verstanden werden, wobei das Analysieren eines Messdatensatzes/Ermitteln von Merkmalen für das Objekt anhand des Messdatensatzes vorzugs¬ weise unmittelbar nach dem Erfassen des Messdatensatzes erfolgt und wobei die Ermittlung vorzugsweise keine oder nur eine minimale Verlängerung der Operationsdauer mit sich bringt. Insbesondere kann unter „Echtzeit" das Ermitteln und die Dauer des Ermitteins verstanden werden, die vorzugsweise zuverlässig innerhalb einer vorbestimmten Zeitspanne, zum Beispiel während einer Operation, Ergebnisse liefern können.
Unter „Messdaten", „Messdatensätze" oder einem „Messdatensatz" können im Zusammenhang mit der Erfindung beispielsweise Spektren (z. B. optische Spektren, Frequenzspektren), elektrische Spannungswerte (z. B. von piezoelektrischen Sensoren) oder Intensitätsverläufe von Strahlung (z. B. Röntgenstrahlung) für ein Objekt verstanden werden. Die „Messdaten", „Messdatensätze" oder der „Messdatensatz" liegen vorzugsweise als eindimensionaler Vektor vor. Beispielsweise können Messdaten in höherdimensionaler Form, z. B. multispektrale 2D Bilder, beispielsweise mittels einer Datentransformation in eindimensionale Vektoren transformiert werden. Dies kann bei¬ spielsweise dadurch geschehen, dass insbesondere ein bestimmtes Pixel in einem Bild ausgewählt wird und beispielsweise der Intensitätswert dieses Pixels für die unterschiedlichen Wellenlängen, für die 2D Bilder erfasst wurden, in einem eindimensionalen Vektor eingefügt wird.
Unter einem „multispektralen Bild" können im Zusammenhang mit der Erfindung beispielsweise eine Serie von 2D Bildern für ein Objekt verstanden werden, wobei insbesondere jedes Bild der Serie für eine bestimmte Wellenlänge oder einen bestimm¬ ten Wellenlängenbereich, beispielsweise mittels eines multi¬ spektralen Kamerasystems, aufgezeichnet wurde.
Unter „Klassifikation" oder „klassifizieren" kann im Zusammenhang mit der Erfindung beispielsweise ein Analysieren von Eingabevektoren, insbesondere von einem Messdatensatz, hinsichtlich vorgegebener gesuchter Eigenschaften verstanden werden. Beispielsweise können für einen Messdatensatz gesuchte Eigenschaften/Merkmale ermittelt werden. Insbesondere kön¬ nen unter einer Klassifikationsaufgabe oder auch gesuchte Merkmale/Eigenschaften des Messdatensatzes, beispielsweise Fragestellungen wie „handelt es sich um Fettgewebe, sauerstoffreiches Gewebe, sauerstoffarmes Gewebe, Muskelgewebe, gesundes Gewebe oder um Tumorgewebe", verstanden werden. Ins¬ besondere können unter einem Klassifikationsergebnis die Ana¬ lyseergebnisse verstanden werden, die sich beim Ermitteln des Systemverhaltens für den Messdatensatz mittels des konfigu¬ rierten tiefen neuronalen Netzes ergeben.
Unter „Ermitteln von Merkmalen eines Objekts" kann im Zusammenhang mit der Erfindung beispielsweise eine Klassifikation des Objektes bzw. eines Messdatensatzes des Objekts oder eine Prognose für ein Objekt verstanden werden. Beispielsweise, wenn die Eingabevektoren bzw. ein Messdatensatz Intensitäts- werte für ionisierende Strahlung für einen Zeitverlauf umfas¬ sen, so könnte beispielsweise eine Höhe oder ein Grad eines DNA-Schadens von Zellen (Objekt) prognostiziert werden, die dieser Strahlung ausgesetzt sind. Alternativ kann auch prog- nostiziert werden, wie viele Zellen nach einer vorgegebenen Zeit zerstört sind oder wie viel Zeit benötigt wird, um eine vorgegebene Anzahl von Zellen zu zerstören. Beispielsweise kann für eine Prognose der Messdatensatz/erste Eingabevektor eine Historie von Werten für das Objekt, z. B. der Zellen ei- nes Wirbeltieres, umfassen. Alternativ oder zusätzlich kann beispielsweise der Messdatensatz/erste Eingabevektor eine Historie von Werten für andere Objekte umfassen, z. B. von Bakterien und die Auswirkung von ionisierender Strahlung auf diese .
Unter einem „Eingabevektor" können im Zusammenhang mit der Erfindung beispielsweise gemessene Größen des Objekts ver¬ standen werden. Insbesondere werden Eingabevektoren von Trainingsdaten, die zum Konfigurieren des tiefen neuronalen Netz- werkes verwendet werden, als erste Eingabevektoren bezeichnet. Insbesondere werden zu analysierende Eingabevektoren, beispielsweise gemessene Eigenschaften eines zu analysieren¬ den Objektes, als Messdatensatz bzw. Messdatensätze bezeichnet. Vorzugsweise umfasst der Messdatensatz bzw. die (ersten) Eingabevektoren, der/die beim Training verwendet werden, auch die gesuchte Eigenschaft.
Unter einem „Ausgabevektor" kann im Zusammenhang mit der Erfindung beispielsweise ein Ergebnis einer Analyse des Einga- bevektors bzw. des Messdatensatzes verstanden werden. Ein
Ausgabevektor umfasst insbesondere mindestens ein Analyseer¬ gebnis oder eine gesuchte Eigenschaft/Merkmal, beispielsweise ob es sich um einen bestimmten Gewebetyp (z. B. Tumorgewebe, Fettgewebe oder Muskelgewebe) handelt, und ein jeweiliger Eingabevektor bzw. Messdatensatz umfasst insbesondere mindestens eine Eingangsgröße, die die gesuchte Eigenschaft oder das Analyseergebnis beeinflussen. Insbesondere werden Ausga¬ bevektoren des dynamischen Systems, die zum Konfigurieren be- nutzt werden, als erste Ausgabevektoren bezeichnet. Diese ersten Ausgabevektoren umfassen insbesondere vorgegebene Zielgrößen anhand derer das tiefe neuronale Netz konfiguriert wird. Mit anderen Worten ist das erfindungsgemäße Verfahren insbesondere dazu geeignet, um einen Gewebetyp, beispielswei¬ se Tumorgewebe oder gesundes Gewebe, eine Erkrankungswahr¬ scheinlichkeit oder einen Sauerstoffgehalt im Gewebe festzu¬ stellen/anzugeben und insbesondere in Form eines Analyseergebnisses bereitzustellen. Insbesondere werden Ausgabevekto¬ ren, die insbesondere ein Analyseergebnis von Messda¬ ten/Messdatensätzen umfassen, als zweite Ausgabevektoren bezeichnet .
Unter „Trainingsdaten" können im Zusammenhang mit der Erfindung beispielsweise die ersten Eingabevektoren und die ersten Ausgabevektoren, beispielsweise bereits manuell zeitaufwändig analysierte Messdatensätze, verstanden werden, wobei insbe¬ sondere den ersten Eingabevektoren jeweils mindestens einer der ersten Ausgabevektoren zugeordnet wird. Beispielsweise beschreibt ein Trainingsdatensatz der Trainingsdaten, also z. B. ein erster Eingabevektor mit einem zugeordneten ersten Ausgabevektor, vorgegebene Zielgrößen oder ein bekanntes Systemverhalten des dynamischen Systems auf die Trainingsdaten oder Messwerte, anhand denen beispielsweise das tiefe neuro¬ nale Netz konfiguriert wird.
Unter einer „Datentransformation" kann im Zusammenhang mit der Erfindung beispielsweise eine Transformation in einen mathematischen Raum (z. B. ein Normierter Raum, ein Banachraum, ein topologischer Vektorraum oder ein lokalkonvexer Raum) wie z. B. den Fourier-Raum oder Hilbert-Raum verstanden werden. Eine Datentransformation kann beispielsweise mittels einer Fourier-Transformation oder einer Hilbert-Transformation durchgeführt werden.
Unter einem „Modell" kann im Zusammenhang mit der Erfindung beispielsweise eine Datenstruktur insbesondere zum Modellie- ren eines dynamischen Systems und dessen Systemverhalten verstanden werden.
Unter einer „Auswahlfunktion" kann im Zusammenhang mit der Erfindung beispielsweise eine Funktion verstanden werden, die einen Messdatensatz, beispielsweise einen eindimensionalen Messdatensatz, vorzugsweise ein optisches Spektrum, in Messwert-Abschnitte unterteilt. Ein solcher Messwert-Abschnitt umfasst dann beispielsweise eine vorgegebene Anzahl von Mess¬ werten, z. B. 5 Messwerte. Insbesondere kann mit einer Aus¬ wahlfunktion ein optisches Spektrum für ein Objekt (z. B. Gewebe), das vorzugsweise bei 500 nm beginnt und in 1 nm
Schritten bis 650 nm erfasst wurde, insbesondere in Messwert- Abschnitte zerlegt werden, sodass beispielsweise jeder Mess¬ wert-Abschnitt 8 Messpunkte enthält. Dies sind z. B. für ei¬ nen ersten Messwert-Abschnitt acht Messwerte (z. B. 500 nm, 501 nm, 502 nm ... 507 nm) . Insbesondere können die Messwert- Abschnitte auch unterschiedliche Längen aufweisen oder sich auch überschneiden.
Unter einem „tiefen neuronalen Netz" kann im Zusammenhang mit der Erfindung beispielsweise ein neuronales Netz oder ein neuronales Netzwerk verstanden werden, das im Gegensatz zu konventionellen neuronalen Netzen eine Vielzahl von Verarbeitungsschichten umfasst. Insbesondere findet die Informations¬ verarbeitung (insbesondere die Analyse eines Eingangsvektors) vorzugsweise in einer großen Anzahl (z. B. 10 bis 200 oder noch mehr) von Verarbeitungs schichten statt. Insbesondere werden Analyseergebnisse (z. B. eine Merkmalsextraktion) der Verarbeitungs schichten an eine Ausgabeschicht übermittelt. Bei dem tiefen neuronalen Netz kann es sich beispielsweise auch um ein tiefes neuronales Faltungsnetz (engl. Deep
Convolutional Neural Network, DCNN) handeln.
Unter „Verarbeitungsschichten" können im Zusammenhang mit der Erfindung beispielsweise miteinander vernetzte Verarbeitungs¬ schichten, voneinander unabhängige Verarbeitungsschichten und/oder voneinander unabhängige versteckte Schichten, die insbesondere zueinander parallel angeordnet sind, verstanden werden. Alternativ oder zusätzlich kann es sich bei Verarbeitungsschichten um parallele Verarbeitungs schichten handeln. Alternativ oder zusätzlich kann beispielsweise ein Analyseer- gebnis einer Verarbeitungsschicht als zusätzlicher Eingabe¬ wert in eine andere Verarbeitungsschicht eingehen. Es ist beispielsweise hierdurch möglich, mehrere Analyseergebnisse von Verarbeitungsschichten zu einem Wert bzw. Analyseergebnis zusammenzufassen. Verarbeitungsschichten können beispielswei- se auch als versteckte oder verdeckte Schichten eines tiefen neuronalen Netzes bezeichnet werden.
Unter einem „Konfigurieren", insbesondere der Verarbeitungsschichten, kann im Zusammenhang mit der Erfindung beispiels- weise ein Gewichten und/oder Löschen und/oder Einfügen von
Neuronen in die jeweiligen Verarbeitungsschichten verstanden werden. Insbesondere können beim Konfigurieren auch Gewichte von entsprechenden Konnektoren der Neuronen angepasst werden Insbesondere kann „Konfigurieren" auch als „Trainieren" oder „Lernen" bezeichnet werden, bei dem insbesondere ein tiefes neuronales Netzwerk konfiguriert /trainiert wird.
Das Verfahren ist beispielsweise dahingehend vorteilhaft, um insbesondere ein tiefes neuronales Netz derart zu konfigurie- ren, um beispielsweise mit dem konfigurierten tiefen neuronalen Netz die Merkmale des Objekts zu ermitteln. Hierzu kann beispielsweise das tiefe neuronale Netz anhand der Trainings¬ daten konfiguriert werden, sodass dieses beispielsweise ein vorgegebenes bzw. bekanntes Systemverhalten, das durch die Trainingsdaten beschrieben wird, auf neu erfasste und noch nicht analysierte Messdaten/eines Messdatensatzes eines Ob¬ jekts anwendet.
Bei einer ersten Ausführungsform des Verfahrens sind die ers ten Eingabevektoren gemessene Spektren des Objekts, und die ersten Ausgabevektoren sind bereits durchgeführte Analyseergebnisse für die Spektren. Das Verfahren ist beispielsweise dahingehend vorteilhaft, um beispielsweise Klassen in den gemessenen Spektren des Objekts zu unterscheiden, deren biochemische und somit spektrale Ei¬ genschaften nicht oder nur teilweise bekannt sind. Es ist beispielsweise möglich mit diesem Verfahren eine Klassifika¬ tion von Gewebetypen oder Zelltypen (z. B. Fettzellen, Hirnzellen, Knochenzellen, Tumorzellen) mit Hilfe von NIR Spektren vorzunehmen. Dabei werden beispielsweise die aufgezeichneten Spektren, die beispielsweise in einem Messdatensatz enthalten sind, als hochdimensionale Vektoren aufgefasst, die insbesondere entsprechend der aufgelösten Wellenlängen viele Einzelmerkmale enthalten. Insbesondere gehen bei einer derar¬ tigen Interpretation jedoch bei konventionellen Verfahren Informationen verloren, da beispielsweise Spektraldaten eine eindimensionale Abfolge von Werten mit (physikalisch) begründeter Ordnung darstellen. Vorzugsweise ist das erfindungsge¬ mäße Verfahren in der Lage derartig geordnete eindimensionale Daten zu klassifizieren. Vorzugsweise erlaubt das erfindungs¬ gemäße Verfahren Nachbarschaftsbeziehungen in Messdatensätzen bzw. Spektraldaten bei der Klassifikation mit in Betracht ziehen und vorzugsweise eine Klassifikation durchzuführen ohne a priori Wissen über die biochemischen Eigenschaften der analysierten Proben einzubringen.
Bei einer weiteren Ausführungsform des Verfahrens werden die Neuronen derart konfiguriert, um die Auswahlfunktion zu mo¬ dellieren .
Das Verfahren ist beispielsweise dahingehend vorteilhaft, um insbesondere das Ermitteln des Systemverhaltens möglichst schnell automatisiert durchzuführen ohne, dass beispielsweise eine manuelle Vorverarbeitung beim Ermitteln des Systemverhaltens notwendig ist. Dies kann beispielsweise mittels einer Vorverarbeitungsschicht realisiert werden, deren Neuronen entsprechend konfiguriert werden. Diese Vorverarbeitungs¬ schicht übermittelt dann vorzugsweise die vorverarbeiteten ersten Eingabevektoren oder einen vorverarbeiteten Messdatensatz an die Verarbeitungsschichten. Bei einer weiteren Ausführungsform des Verfahrens werden die Neuronen derart konfiguriert, um eine Datentransformation der ersten Eingabevektoren zu modellieren.
Das Verfahren ist beispielsweise dahingehend vorteilhaft, um beispielsweise das Ermitteln der Merkmale möglichst schnell automatisiert durchzuführen ohne, dass beispielsweise eine manuelle Vorverarbeitung beim Ermitteln des Systemverhaltens notwendig ist. Dies kann beispielsweise mittels einer Vorver¬ arbeitungsschicht realisiert werden, deren Neuronen entspre¬ chend konfiguriert werden. Diese Vorverarbeitungsschicht übermittelt dann vorzugsweise die vorverarbeiteten ersten Eingabevektoren oder einen vorverarbeiteten Messdatensatz an die Verarbeitungsschichten.
Gemäß einem weiteren Aspekt betrifft die Erfindung ein Verfahren zum rechnergestützten Ermitteln von Merkmalen eines Objekts mittels eines Systemverhaltens eines dynamischen Sys¬ tems mit folgenden Verfahrensschritten:
Erfassen eines Messdatensatzes von dem Objekt;
Zerlegen des Messdatensatzes mittels einer Auswahlfunk¬ tion in Messwert-Abschnitte;
Bereitstellen eines konfigurierten tiefen neuronalen Netzes, welches eine Eingabeschicht, eine Ausgabeschicht und eine Vielzahl von Verarbeitungs schichten umfasst, wobei einer jeweiligen Verarbeitungsschicht jeweils ei¬ ner der Messwert-Abschnitte zugeordnet wird;
Übermitteln von Messwerten der Messwert-Abschnitte an die dem jeweiligen Messwert-Abschnitt zugeordnete Verar¬ beitungsschicht ;
Ermitteln der Merkmale anhand des Messdatensatzes mit¬ tels des konfigurierten tiefen neuronalen Netzes, wobei jeweils die Messwerte durch Neuronen der dem entspre¬ chenden Messwert-Abschnitts zugeordneten Verarbeitungs¬ schicht verarbeitet werden;
Übermitteln von Analyseergebnissen von den Verarbeitungsschichten an die Ausgabeschicht. Bei einer weiteren Ausführungsform des Verfahrens ist der Messdatensatz ein gemessenes Spektrum des Objekts.
Bei einer weiteren Ausführungsform des Verfahrens wird das Zerlegen durch die Neuronen der Verarbeitungsschichten als Vorverarbeitungsschritt durchgeführt .
Bei einer weiteren Ausführungsform des Verfahrens führen die Neuronen eine Datentransformation des Messdatensatzes als Vorverarbeitungsschicht durch.
Bei einer weiteren Ausführungsform des Verfahrens wurde das konfigurierte tiefe neuronale Netz mit dem erfindungsgemäßen Verfahren zum Konfigurieren eines tiefen neuronalen Netzes konfiguriert .
Konfigurationsvorrichtung zum rechnergestützten Konfigurieren eines tiefen neuronalen Netzes zur Ermittlung von Merkmalen eines Objekts mittels eines Systemverhaltens eines dynami¬ schen Systems, aufweisend:
ein erstes Bereitstellungsmodul Bereitstellen von Trai¬ ningsdaten für das dynamische System mit vorgegebenen ersten Eingabevektoren, wobei
den jeweiligen ersten Eingabevektoren jeweils erste vorgegebene Ausgabevektoren zugeordnet sind und ein bekanntes Systemverhalten des dynamischen Systems beschreiben,
die jeweiligen ersten Eingabevektoren mittels einer Auswahlfunktion in Messwert-Abschnitte zerlegt wer¬ den,
Messwerte der Messwert-Abschnitte jeweils einem Er¬ gebniswert des dem ersten Eingabevektor zugeordne¬ ten ersten Ausgabevektors zugeordnet wird; - ein erstes Konfigurationsmodul zum Konfigurieren des tiefen neuronalen Netzes mittels der Trainingsdaten, wobei das tiefe neuronale Netz eine Vielzahl von Verar¬ beitungsschichten umfasst,
- einer jeweiligen Verarbeitungs Schicht jeweils einer der Messwert-Abschnitte zugeordnet wird, jeweils die Messwerte eines entsprechenden Mess¬ wert-Abschnitts an die jeweilige Verarbeitungs¬ schicht übermittelt werden, die dem entsprechenden Messwert-Abschnitt zugeordnet ist,
die den Messwerten zugeordneten Ergebniswerte der einer Ausgabeschicht des tiefen neuronalen Netzes übermittelt werden,
Neuronen der jeweiligen Verarbeitungsschichten anhand des bekannten Systemverhaltens konfiguriert werden .
Bei einer weiteren Ausführungsform der Konfigurationsvorrichtung umfasst die Konfigurationsvorrichtung zumindest ein weiteres Modul oder mehrere weitere Module zur Durchführung des erfindungsgemäßen Verfahrens (oder einer seiner Ausführungsformen) zum Konfigurieren des tiefen neuronalen Netzes.
Gemäß einem weiteren Aspekt betrifft die Erfindung eine Er¬ mittlungsvorrichtung zum rechnergestützten Ermitteln von Merkmalen eines Objekts mittels eines Systemverhaltens eines dynamischen Systems aufweisend:
ein erstes Erfassungsmodul zum Erfassen eines Messdaten¬ satzes von dem Objekt;
ein erstes Zerlegemodul zum Zerlegen des Messdatensatzes mittels einer Auswahlfunktion in Messwert-Abschnitte; ein zweites Bereitstellungsmodul zum Bereitstellen eines konfigurierten tiefen neuronalen Netzes, welches eine Eingabeschicht, eine Ausgabeschicht und eine Vielzahl von Verarbeitungsschichten umfasst, wobei einer jeweiligen Verarbeitungsschicht jeweils einer der Messwert- Abschnitte zugeordnet wird;
ein erstes Übermittlungsmodul zum Übermitteln von Mess¬ werten der Messwert-Abschnitte an die dem jeweiligen Messwert-Abschnitt zugeordnete Verarbeitungsschicht; ein erstes Ermittlungsmodul zum Ermitteln der Merkmale anhand des Messdatensatzes mittels des konfigurierten tiefen neuronalen Netzes, wobei jeweils die Messwerte durch Neuronen der dem entsprechenden Messwert- Abschnitts zugeordneten Verarbeitungsschicht verarbeitet werden;
ein zweites Übermittlungsmodul zum Übermitteln von Ana¬ lyseergebnissen von den Verarbeitungsschichten an die Ausgabeschicht .
Bei einer weiteren Ausführungsform der Ermittlungsvorrichtung umfasst die Ermittlungsvorrichtung zumindest ein weiteres Mo¬ dul oder mehrere weitere Module zur Durchführung des erfin¬ dungsgemäßen Verfahrens (oder einer seiner Ausführungsformen) zum Ermitteln eines Systemverhaltens eines dynamischen Sys¬ tems .
Gemäß einem weiteren Aspekt betrifft die Erfindung ein Multi¬ spektrales Kamerasystem aufweisend:
- eine erfindungsgemäße Ermittlungsvorrichtung (oder einer ihrer Ausführungsformen) , wobei das Erfassungsmodul mindestens eine Kamera zum Erfassen von optischen Spektren des Objekts umfasst.
Des Weiteren wird ein Computerprogrammprodukt mit Programmbe¬ fehlen zur Durchführung der genannten erfindungsgemäßen Verfahren beansprucht, wobei mittels des Computerprogrammpro¬ dukts jeweils eines der erfindungsgemäßen Verfahren, alle erfindungsgemäßen Verfahren oder eine Kombination der erfindungsgemäßen Verfahren durchführbar ist.
Zusätzlich wird eine Variante des Computerprogrammproduktes mit Programmbefehlen zur Konfiguration eines Erstellungsgeräts, beispielsweise ein 3D-Drucker oder ein zur Erstellung von Prozessoren und/oder Geräten geeignete HerStellungsmaschine, beansprucht, wobei das Erstellungsgerät mit den Pro¬ grammbefehlen derart konfiguriert wird, dass die genannte er¬ findungsgemäße Konfigurationsvorrichtung und/oder die Ermitt- lungsvorrichtung und/oder das multispektrale Kamerasystem erstellt wird.
Darüber hinaus wird eine Bereitstellungsvorrichtung zum Speichern und/oder Bereitstellen des Computerprogrammprodukts be¬ ansprucht. Die Bereitstellungsvorrichtung ist beispielsweise ein Datenträger, der das Computerprogrammprodukt speichert und/oder bereitstellt. Alternativ und/oder zusätzlich ist die Bereitstellungsvorrichtung beispielsweise ein Netzwerkdienst, ein Computersystem, ein Serversystem, insbesondere ein verteiltes Computersystem, ein cloudbasiertes Rechnersystem und/oder virtuelles Rechnersystem, welches das Computerpro¬ grammprodukt vorzugsweise in Form eines Datenstroms speichert und/oder bereitstellt.
Diese Bereitstellung erfolgt beispielsweise als Download m Form eines Programmdatenblocks und/oder Befehlsdatenblocks, vorzugsweise als Datei, insbesondere als Downloaddatei, oder als Datenstrom, insbesondere als Downloaddatenstrom, des vollständigen Computerprogrammprodukts. Diese Bereitstellung kann beispielsweise aber auch als partieller Download erfol¬ gen, der aus mehreren Teilen besteht und insbesondere über ein Peer-to-Peer Netzwerk heruntergeladen oder als Datenstro bereitgestellt wird. Ein solches Computerprogrammprodukt wir beispielsweise unter Verwendung der Bereitstellungsvorrichtung in Form des Datenträgers in ein System eingelesen und führt die Programmbefehle aus, sodass das erfindungsgemäße Verfahren auf einem Computer zur Ausführung gebracht wird oder das Erstellungsgerät derart konfiguriert, dass diese er findungsgemäße Konfigurationsvorrichtung und/oder die Ermitt lungsvorrichtung und/oder das Multispektrales Kamerasysteme erstellt .
Die oben beschriebenen Eigenschaften, Merkmale und Vorteile dieser Erfindung sowie die Art und Weise, wie diese erreicht werden, werden klarer und deutlicher verständlich im Zusammenhang mit der folgenden Beschreibung der Aus führungsbei- spiele, die im Zusammenhang mit den Figuren näher erläutert werden. Dabei zeigen in schematischer Darstellung: ein erstes Ausführungsbeispiel der Erfindung als ein Ablaufdiagramm des erfindungsgemäßen Verfahrens zum Konfigurieren eines tiefen neuronalen Netzes;
Fig. 2 ein zweites Ausführungsbeispiel der Erfindung als ein Ablaufdiagramm des erfindungsgemäßen Verfahrens zum Ermitteln von Merkmalen eines Objekts mittels eines Systemverhaltens eines dynamischen Systems;
Fig. 3 ein drittes Ausführungsbeispiel der Erfindung als eine Konfigurationsvorrichtung;
Fig. 4 ein viertes Ausführungsbeispiel der Erfindung als eine Ermittlungsvorrichtung;
Fig. 5 ein fünftes Ausführungsbeispiel der Erfindung als ein multispektrales Kamerasystem.
Fig. 6 ein sechstes Ausführungsbeispiel eines konfigurier¬ ten erfindungsgemäßen neuronalen Netzes.
In den Figuren sind funktionsgleiche Elemente mit denselben Bezugszeichen versehen, sofern nichts anderes angegeben ist.
Die nachfolgenden Ausführungsbeispiele weisen, sofern nicht anders angegeben oder bereits angegeben, zumindest einen Prozessor und/oder eine Speichereinheit auf, um das Verfahren zu implementieren oder auszuführen.
Auch sind insbesondere einem (einschlägigen) Fachmann in Kenntnis des/der Verfahrensanspruchs /Verfahrensansprüche alle im Stand der Technik üblichen Möglichkeiten zur Realisierung von Produkten oder Möglichkeiten zur Implementierung selbstverständlich bekannt, sodass es insbesondere einer eigenstän¬ digen Offenbarung in der Beschreibung nicht bedarf. Insbeson- dere können diese gebräuchlichen und dem Fachmann bekannten RealisierungsVarianten ausschließlich per Hardware (komponenten) oder ausschließlich per Software (komponenten) realisiert werden. Alternativ und/oder zusätzlich kann der Fachmann im Rahmen seines fachmännischen Könnens weitestgehend beliebige erfindungsgemäße Kombinatio¬ nen aus Hardware (komponenten ) und Software (komponenten) wählen, um erfindungsgemäße Realisierungsvarianten umzusetzen.
Eine erfindungsgemäße Kombination aus Hardware (komponenten) und Software (komponenten) kann insbesondere dann eintreten, wenn ein Teil der erfindungsgemäßen Wirkungen vorzugsweise ausschließlich durch Spezialhardware (z. B. einem Prozessor in Form eines ASIC oder FPGA) und/oder ein anderer Teil durch die (prozessor- und/oder speichergestützte) Software bewirkt wird .
Insbesondere ist es angesichts der hohen Anzahl an unter¬ schiedlichen Realisierungsmöglichkeiten unmöglich und auch für das Verständnis der Erfindung nicht zielführend oder not¬ wendig, all diese Realisierungsmöglichkeiten zu benennen. Insofern sollen insbesondere all die nachfolgenden Ausführungs¬ beispiele lediglich beispielhaft einige Wege aufzeigen, wie insbesondere solche Realisierungen der erfindungsgemäßen Lehre aussehen könnten.
Folglich sind insbesondere die Merkmale der einzelnen Ausfüh¬ rungsbeispiele nicht auf das jeweilige Ausführungsbeispiel beschränkt, sondern beziehen sich insbesondere auf die Erfin¬ dung im Allgemeinen. Entsprechend können vorzugsweise Merkma¬ le eines Ausführungsbeispiels auch als Merkmale für ein ande¬ res Ausführungsbeispiel dienen, insbesondere ohne dass dies expliziert in dem jeweiligen Aus führungsbeispiel genannt sein muss .
Die Fig. 1 zeigt ein erstes Ausführungsbeispiel der Erfindung als ein Ablaufdiagramm des erfindungsgemäßen Verfahrens zum Konfigurieren eines tiefen neuronalen Netzes. Das Verfahren ist vorzugsweise rechnergestützt und wird ins¬ besondere durch den Sender implementiert/realisiert. Im Einzelnen zeigt das Ablaufdiagramm ein Verfahren zum rechnergestützten Konfigurieren eines tiefen neuronalen Netzes, wobei das tiefe neuronale Netz konfiguriert wird um ein Sys¬ temverhalten (z. B. Filterverhalten eines Filters) eines dynamischen Systems (z. B. des Filters) zu erlernen, damit bei- spielsweise Merkmale (z. B. Feststellen eines Gewebetyps oder Gewebemerkmale) eines Objekts (z. B. Gewebe) bestimmt werden können .
Das Verfahren umfasst einen ersten Verfahrensschritt zum Be- reitstellen 110 von Trainingsdaten für das dynamische System mit vorgegebenen ersten Eingabevektoren (z. B. optische Spektren) . Den jeweiligen ersten Eingabevektoren sind erste vorgegebene Ausgabevektoren (z. B. ausgewertete bzw. analysierte optische Spektren) zugeordnet. Diese Vektoren beschreiben ein bekanntes Systemverhalten des dynamischen Systems. Die ersten Eingabevektoren umfassen dabei z. B. eine gesuchte Zielgröße und die ersten Ausgabevektoren umfassen ein Analyseergebnis mit Ergebniswerten, das z. B. die gesuchte Zielgröße umfasst oder ausschließlich die gesuchte Zielgröße umfasst. Die Trai- ningsdaten können beispielswiese für ein Objekt bestimmt wor¬ den sein oder die Trainingsdaten wurden für mehrere Objekte bestimmt, z. B. ein optisches Spektrum in dem Bereich zwischen den Wellenlängen von 480 nm und 610 nm, wobei das Spektrum in 1 nm Schritten erfasst wurde, für mehrere Objek- te. Es gibt somit mehrere Spektren in dem genannten Bereich für unterschiedliche Objekte, z. B. unterschiedliche Gewebe¬ proben .
Die jeweiligen ersten Eingabevektoren (also z. B. jeweils ein optisches Spektrum) werden mittels einer Auswahlfunktion in Messwert-Abschnitte zerlegt. Hierdurch kann z. B. ein opti¬ sches Spektrum in Messwert-Abschnitte zerlegt werden, die je¬ weils zehn Messwerte des Bereichs umfassen (z. B. Messwerte für die Wellenlängen von 511 nm - 520 nm, 521 nm - 530 nm usw . ) .
Die Messwerte der Messwert-Abschnitte werden dann jeweils ei- nem Ergebniswert des ersten Ausgabevektors zugeordnet, wobei der entsprechende Ausgabevektor verwendet wird, der dem ent¬ sprechenden ersten Eingabevektor zugeordnet ist.
Das Verfahren umfasst einen zweiten Verfahrens schritt zum Konfigurieren 120 des tiefen neuronalen Netzes mittels der
Trainingsdaten, wobei das tiefe neuronale Netz eine Vielzahl von Verarbeitungsschichten umfasst. Zusätzlich umfasst das neuronale Netz noch eine Eingabeschicht und eine Ausgabe¬ schicht die über die Verarbeitungsschichten miteinander ver- bunden sind, um z. B. Messwerte bzw. zu analysierende Mess¬ werte über die Eingabeschicht einzugeben, an die Verarbei¬ tungsschichten zur Verarbeitung zu übermitteln und von den Verarbeitungs schichten an die Ausgabeschicht zur Ausgabe zu übermitteln .
Einer jeweiligen Verarbeitungsschicht wird beim Konfigurieren jeweils einer der Messwert-Abschnitte zugeordnet. Diese zu¬ geordneten Verarbeitungsschichten verarbeiten dann vorzugsweise bei einer späteren Datenauswertung genau die Messwerte, die in den ihnen zugeordneten Messwert-Abschnitt fallen. Insbesondere kann mit diesem Schritt eine direkte Zuordnung von Messwert-Abschnitten an eine jeweilige Verarbeitungsschicht erfolgen. Hierdurch können insbesondere Nachbarschaftsbezie¬ hungen zwischen Messwerten innerhalb dieses Messwert- Abschnitts besser berücksichtigt werden. Messwert-Abschnitte können, wie bereits erwähnt, über eine Auswahlfunktion defi¬ niert werden. In einem einfachen Fall ist dies jeweils eine vorgegebene Anzahl (1, 10, 100 oder eine andere beliebige An¬ zahl) von aufeinanderfolgenden Werten. Es sind aber auch an- dere Auswahlfunktionen denkbar, die z. B. Messwert-Abschnitte in Abhängigkeit von einer Höhe/Intensität des Messwertes oder einem Erfassungszeitpunkt des Messwertes auswählen. Zum Bei¬ spiel können bei einem normalisierten Spektrum beispielsweise in einem ersten Messwert-Abschnitt die Messwerte ausgewählt werden, die in einem Intensitätsintervall zwischen 0 und 0,2 liegen. In einem zweiten Messwert-Abschnitt können dann die Messwerte ausgewählt werden, die zwischen 0,2 und 0,4 liegen usw. Die Intervallgrenzen können beispielsweise bei den Messwert-Abschnitten entweder berücksichtigt oder ignoriert werden .
Diese und andere Eigenschaften, die die Messwert-Abschnitte definieren, können beispielsweise über einen Messwert- Abschnitt-Parametersatz definiert werden. Dieser Messwert- Abschnitt-Parametersatz wird vorzugsweise ebenfalls beim Konfigurieren berücksichtigt, um beispielsweise festzulegen, wie viele Verarbeitungsschichten notwendig sind, um einen Datensatz eines Objektes zu analysieren.
Somit werden also beim Konfigurieren jeweils die Messwerte eines entsprechenden Messwert-Abschnitts an die jeweilige Verarbeitungs Schicht übermittelt, die dem entsprechenden Messwert-Abschnitt zugeordnet ist.
Zusätzlich werden zum Konfigurieren die den Messwerten zugeordneten Ergebniswerte der Ausgabeschicht des tiefen neuro¬ nalen Netzes übermittelt.
Anhand dieser Informationen können nun Neuronen der jeweiligen Verarbeitungsschichten anhand des bekannten Systemverhaltens (das beispielsweise durch die ersten Eingabevektoren und den zugeordneten Ergebniswerten der ersten Ausgabevektoren definiert ist) konfiguriert werden.
Die Fig. 2 zeigt ein zweites Aus führungsbeispiel der Erfin¬ dung als ein Ablaufdiagramm des erfindungsgemäßen Verfahrens zum Ermitteln von Merkmalen eines Objekts mittels eines Sys¬ temverhaltens eines dynamischen Systems.
Das Verfahren ist vorzugsweise rechnergestützt und wird ins¬ besondere durch den Empfänger implementiert/realisiert. Im Einzelnen umfasst das Verfahren einen ersten Verfahrensschritt zum Erfassen 210 eines Messdatensatzes (z. B. ein op¬ tisches Spektrum) von dem Objekt (z. B. Gewebe) .
Das Verfahren umfasst einen zweiten Verfahrens schritt zum Zerlegen 220 des Messdatensatzes mittels einer Auswahlfunkti¬ on in Messwert-Abschnitte. Das Zerlegen mit der Auswahlfunktion funktioniert vorzugsweise analog dazu, wie dies in Fig. 1 erläutert wurde.
Das Verfahren umfasst einen dritten Verfahrens schritt zum Be¬ reitstellen 230 eines konfigurierten tiefen neuronalen Netzes, welches eine Eingabeschicht, eine Ausgabeschicht und ei- ne Vielzahl von Verarbeitungsschichten umfasst, wobei einer jeweiligen Verarbeitungsschicht jeweils einer der Messwert- Abschnitte zugeordnet wird.
Bei dem konfigurierten tiefen neuronalen Netz handelt es sich vorzugsweise um ein erfindungsgemäßes neuronales Netz, so wie dies zum Beispiel in Fig. 1 erläutert wurde oder in einem der Ansprüche 1-4 definiert ist. Dadurch ist das tiefe neuronale Netz anhand der Trainingsdaten derart konfiguriert, dass es das vorgegebene Verhalten modelliert .
Die Eingabeschicht ist über die Verarbeitungsschichten mit der Ausgabeschicht verbunden, z. B. so wie dies in Fig. 1 erläutert ist . Das Zerlegen des Messdaten-Satzes erfolgt insbesondere auf die gleiche Weise, wie die Messdatensätze/erste Eingabevekto¬ ren beim Konfigurieren des tiefen neuronalen Netzes zerlegt wurden . Neuronen der Verarbeitungsschichten des konfigurierten tiefen neuronalen Netzes sind derart konfiguriert, um ein bekanntes Systemverhalten des dynamischen Systems zu modellieren und auf den Messdatensatz anzuwenden. Wie dies durchgeführt werden kann, ist beispielsweise in Fig. 1 erläutert.
Auch können die Verarbeitungsschichten und/oder die Eingabeschicht beispielsweise derart konfiguriert werden, dass diese die Auswahlfunktion modellieren, sodass das Zerlegen des Messdatensatzes ebenfalls von der Vorverarbeitungsschicht und/oder den Verarbeitungsschichten und/oder der Eingabeschicht durchgeführt wird.
Das Verfahren umfasst einen vierten Verfahrens schritt zum Übermitteln 240 der Messwerte der Messwert-Abschnitte an die dem jeweiligen Messwert-Abschnitt zugeordnete Verarbeitungs¬ schicht .
Das Verfahren umfasst einen fünften Verfahrens schritt zum Er¬ mitteln 250 der Merkmale anhand des Messdatensatzes mittels des konfigurierten tiefen neuronalen Netzes, wobei jeweils die Messwerte durch die Neuronen der dem entsprechenden Messwert-Abschnitts zugeordneten Verarbeitungsschicht verarbeitet werden .
Das Verfahren umfasst einen sechsten Verfahrensschritt zum Übermitteln 260 von Analyseergebnissen von den Verarbeitungsschichten an die Ausgabeschicht.
Die Verfahren, die in Fig. 1 und Fig. 2 erläutert wurden, können beispielsweise rechnergestützt realisiert werden, in dem die Verarbeitungsschichten jeweils als Datenstrukturen realisiert werden, die beispielsweise an bestimmte Speicher¬ adressen (z. B. 0x00008130, 0x0000DC30 usw.) eines Arbeits¬ speichers geladen werden. Auf analoge weise lässt sich eine Eingabeschicht und/oder eine Ausgabeschicht und/oder eine Vorverarbeitungsschicht realisieren .
Konventionelle Klassifikationsverfahren, die auf Clustering mit Hilfe geeigneter Metriken beruhen, werden häufig zur Lösung von Klassifikationsaufgaben bei Spektren verwendet. Da- bei werden Spektren mit bekannter Klassifikation als Prototypen d. h. Cluster-Zentren identifiziert, und unbekannte Spek¬ tren werden, nach Auswertung der entsprechenden Metrik, der Klasse mit dem nächstliegenden Prototypen zugeordnet. Die Reihenfolge der Anordnung der Messdaten in den Messdatensätzen, also beispielsweise der Wellenlängen und ihrer zugeord¬ neten Intensitäten, spielt hierbei keine Rolle. Insbesondere besteht bei diesen konventionellen Verfahren der Nachteil, dass Nachbarschaftsbeziehungen der Messwerte nicht berück- sichtigt werden.
Die Grundidee des erfindungsgemäßen Verfahrens besteht zu¬ nächst darin - wie in der Fig. 1 und der Fig. 2 erläutert - die Eingabevektoren/Messdatensätze als in Messwert-Abschnitte geordnete eindimensionale Strukturen dem tiefen neuronalen Netz zur Verfügung zu stellen.
Dabei können z. B. gleitende kleinere Ausschnitte/Messwert- Abschnitte eines Messdatensatzes (local receptive fields bzw.), deren Abmessungen und Schrittweite jeweils einen Para¬ meter des Modells, das durch das tiefe neuronale Netz model¬ liert wird (z. B. das vorgegebene Systemverhalten) darstel¬ len, zusammengefas st und durch eine gemeinsame und gelernte lineare Transformation (shared Weights) in Form einer (konfi- gurierten) Verarbeitungsschicht bzw. mehreren (konfigurierten) Verarbeitungs schichten als verdeckte Schicht/en (feature map) eines übergeordneten tiefen neuronalen Netzes dienen. Dabei können die Verarbeitungsschichten und eine ggf. zugehörige Vorverarbeitungsschicht als ein tiefes neuronales
Subnetz des übergeordneten tiefen neuronalen Netzes angesehen werden .
Die Fig. 6 zeigt ein sechstes Ausführungsbeispiel eines kon¬ figurierten erfindungsgemäßen neuronalen Netzes. Das tiefe neuronale Netz wurde beispielsweise nach dem in Fig. 1 erläu¬ terten Verfahren konfiguriert. Zur Klassifikation von geordneten eindimensionalen Daten, z. B. eines Messdatensatzes, wird beispielsweise das konfigu¬ rierte tiefe Netz, wie z. B. in Fig. 2 erläutert, verwendet. Die Verarbeitung des Inputs bzw. die Klassifikation (z. B. Ermitteln von gesuchten Merkmalen) erfolgt dabei analog zur 2D-Bilderkennung indem der Eingabevektor als geordnetes 1D Bild betrachtet wird und Nachbarschaftsbeziehungen berücksichtigt werden.
In einer Variante lässt sich das Ermitteln von Merkmalen z. B. auch analog zur Lösung von Regressionsproblemen einsetzen. Dann werden Zeitreihen bzw. Messwert-Abschnitte in Form von Ausschnitten von Zeitreihen als Eingabegrößen im Form von (geordnete) eindimensionalen Messdatensätzen interpretiert und das (konfigurierte) tiefe neuronale Netz liefert im letz¬ ten Schritt den Wert der Zielgröße zu einem bestimmten Zeit¬ punkt statt der Klassenzuordnung. Im Folgenden wird für ein Ausführungsbeispiel ein optisches
Spektrum eines Objektes (z. B. Gewebe) als Messdatensatz verwendet .
In einer ersten Schicht/Vorverarbeitungsschicht 610 wird der Messdatensatz mit Hilfe eines Moving-Window-Verfahrens (Aus¬ wahlfunktion) abgetastet, in die Messwert-Abschnitte a, b, c, d, e, f, g zerlegt und die den jeweiligen Messwert- Abschnitten a, b, c, d, e, f, g zugeordneten Verarbeitungs¬ schichten 620 übermittelt. Dieses Ausführungsbeispiel bzw. dieses tiefe neuronale Netz wird auch als Faltung bzw. Fal¬ tungssubnetz bezeichnet. Wie in Fig. 6 dargestellt, können die Messwert-Abschnitte überlappend sein oder (wie nicht dar¬ gestellt) es können die Messwert-Abschnitte nicht-überlappend bzw. voneinander getrennt sein.
In einer weiteren Variante ist es beispielsweise denkbar, dass analog zu der Verwendung verschiedener Farbkanäle, die beispielsweise bei einer Bildverarbeitung verwendet werden, auch generell verschiedene Messdatensätze sowie verschieden vorverarbeitete eindimensionale Messdatensätze simultan ins tiefe neuronale Netz eingegeben werden. Dies kann beispiels¬ weise beim Trainieren und/oder beim Ermitteln der Merkmale eines Objekts erfolgen.
Verschiedene simultane Messdatensätze können beispielsweise durch Analyse der gleichen Probe/des gleichen Objekts mit unterschiedlichen Messverfahren ermittelt werden.
Vorverarbeitungsschritte zur Erzeugung multipler/simultaner Messdatensätze aus einer Einzelmessung können zum Beispiel durch eine Binning- oder Fouriertransformation ermittelt werden. Auch eine Transformation vom Intensitäts- in den Ener- gieraum ist grundsätzlich möglich, was auch nichtlineare
Umskalierungen/Umrechnungen der Achse darstellt, die zur Ordnung der Daten bei der Aufnahme diente.
Bei der Lösung von Regressionsproblemen können beispielsweise die Zeitreihen der verschiedenen Input Variablen auf unterschiedlichen Input Kanälen simultan ins Netz eingegeben werden .
Zusätzlich zur physikalisch basierten Einführung weiterer Messdatensätze bzw. Messdaten-Kanäle (z. B. direkt von einem optischen Sensor bereitgestellt) werden Parame¬ ter/Eigenschaften des konfigurierten tiefen neuronalen Netzes z. B. beim Konfigurieren des tiefen neuronalen Netzes nicht ausschließlich empirisch bestimmt, sondern können insbesonde- re aus den Eigenschaften der spektralen Messdatensätze oder Messdatensätze mit Zeitreihen abgeleitet werden.
In der ersten Vorverarbeitungsschicht 610 können so bei¬ spielsweise Messwert-Abschnitt-Parameter eines Messwert- Abschnitt-Parametersatzes berücksichtigt werden, beispiels¬ weise die Breite des gleitenden Ausschnittes/Messwert- Abschnitts oder eine (sinnvolle) Schrittweite des Messwert- Abschnitt s . Weiterhin ist es in einer weiteren Variante beispielsweise möglich, die Ausschnitte/Messwert-Abschnitte a, b, c, d, e, f, g schon in der ersten Vorverarbeitungs Schicht 610 dyna¬ misch anzupassen, das heißt Ausschnittsbreite und Schrittwei¬ te, also von links nach rechts hin zu verändern. Mit anderen Worten können die Ausschnittsbreite und die Schrittweite bzw. die Messwert-Abschnitt-Parameter für die einzelnen Messwert- Abschnitte variieren.
Den Messwert-Abschnitten a, b, c, d, e, f, g werden dann jeweils eine Verarbeitungsschicht 620 zugeordnet (beim Konfigu¬ rieren des tiefen neuronalen Netzes) bzw. ist eine der Verarbeitungsschichten zugeordnet (im konfigurierten tiefen neuronalen Netz), die eine Datentransformation (Systemverhalten) A auf die Messwerte der Messwert-Abschnitte anwendet. Die Ana¬ lyseergebnisse a', b', c' , cT, e', f', g' der Verarbeitungs¬ schichten 620 werden dann von den Verarbeitungsschichten 620 an die Ausgabeschicht 630 übermittelt.
In einer weiteren (nicht dargestellten) Variante werden Messwert-Abschnitte mit identischen Messwert-Abschnitt-Parameter oder ausgewählten identischen Messwert-Abschnitt-Parameter, z. B. mit einer gleichen Ausschnittsdimension (z. B. der gleichen vorgegebenen Anzahl von Messwerten pro Messwert- Abschnitt), dann jeweils durch eine gemeinsame Verarbeitungs¬ schicht (shared weights) verarbeitet, um ein Systemverhal¬ ten/Datentransformation auf die Messwerte dieser Abschnitte anzuwenden. Es ist z. B. denkbar, dass diese gemeinsame Verarbeitungsschicht nur einmal instanziiert wird und für die entsprechenden Messwert-Abschnitte gemeinsam genutzt wird oder die entsprechende gemeinsame Verarbeitungsschicht wird für jeden Messwert-Abschnitt separat instanziiert, sodass diese dann die Messwert-Abschnitte bzw. deren Messwerte ver¬ arbeiten können. Da insbesondere Randpixel/Randwerte typi¬ scherweise von untergeordneter Wichtigkeit sind, entsteht z. B. kein Problem durch Randverluste aufgrund der Auswahlfunktion in der ersten Vorverarbeitungsschicht. In einer weiteren (nicht dargestellten) Variante wird das tiefe neuronale Netz derart konfiguriert, um beispielsweise die maximalen Werte eines Messwert-Abschnitts zusammenzufas- sen. Dieses tiefe neuronale Netz kann z. B. als Pooling bzw. Poolingsubnet z bezeichnet werden. Im Falle von geordneten eindimensionalen Daten kann dies ähnlich, wie in der Fig. 6 dargestellt, erfolgen, indem die Anzahl der Werte im Feature Vektor erfolgen werden. Die Verarbeitungs schichten wählen durch eine einfache Datentransformation den jeweils höchsten Messwert in einem Messwert-Abschnitt aus und übermitteln die¬ ses Analyseergebnis an die Ausgabeschicht.
In einer weiteren (nicht dargestellten) Variante können je nach Komplexität der Klassifikationsaufgabe das
Poolingsubnet z und das Faltungssubnetz miteinander kombiniert werden. Dabei dient beispielsweise das Ergebnis der Ausgabe¬ schicht des Faltungssubnetzes als Eingabewert bzw. Messdaten¬ satz für das Poolingsubnetz oder umgekehrt. Die Netze können nacheinander zu einer gesamten Netz-Topologie eines überge¬ ordneten tiefen neuronalen Netzes angeordnet werden. Das Poo- ling-Netz oder das Faltungsnetz können dann als versteckte Schichten des übergeordneten tiefen neuronalen Netzes dienen. Am Ende des Prozesses, der zur Extraktion von aussagekräfti- gen Merkmalen dient, steht bzw. können miteinander vollver- schaltete versteckte Schichten und die Ausgabeschicht des übergeordneten tiefen neuronalen Netzes, die das endgültige Klassifikationsergebnis liefert. Ein übergeordnetes tiefes neuronales Netz kann mehrere Fal¬ tungssubnetze umfassen, denen jeweils vorzugsweise ein
Poolingsubnetz nachgeschaltet ist. Die Poolingsubnetze dienen dazu, die Dimension der abgeleiteten Merkmale/Analyseergebnisse zu verringern, indem sie z. B. ein Ana- lyseergebnis des Faltungssubnetzes (z. B. ein Analyseergebnis das drei oder fünf Werte umfasst) aufsummieren, mittein oder durch den Maximalwert ersetzen (Max-Pooling, L2-Pooling etc . ) . Die Dimension der zusammengefassten Messwert- Abschnitte/Analyseergebnisse, z. B. der Poolingsubnetze, kön¬ nen ebenfalls als ein Parameter zum Konfigurieren des tiefen neuronalen Netzes/der Neuronen des tiefen neuronalen Netzes genutzt werden. Dieser Parameter und/oder andere Parameter werden insbesondere für das Konfigurieren empirisch bestimmt.
Mit dem erfindungsgemäßen Verfahren können beispielsweise für eine Klassifikationsaufgabe/Bestimmung von Merkmalen eines Objekts unterschiedliche konfigurierte Tiefe neuronale Netze erstellt werden, je nachdem wie die Daten vorverarbeitet wur¬ den. Zum Beispiel, kann ein konfiguriertes tiefes neuronales Netz jeweils für einen multiplen/simultanen Messdatensatz ermittelt werden, z. B. ein konfiguriertes tiefes neuronales Netz für Fourier-transformierte Daten (Daten im Frequenzraum) , Binning-transformierte Daten oder Daten im Ortsraum. Diese konfigurierten tiefen neuronalen Netze können dann an bekannten Beispieldatensätzen getestet und das konfigurierte tiefe neuronale Netz mit der besten Performanz ausgewählt werden. Die Input Features ergeben sich in dem Fall automa¬ tisch z. B. durch Aufteilung der originalen Bilddaten in ihre Farbkanäle (RGB-Kodierung) .
Das beschriebene Verfahren bietet folgende Vorteile:
- Die Interpretation von nachbarschaftlich geordneten, hoch- dimensionalen Abfolgen von Messwerten mit physikalischem Zusammenhang (z. B. optische Spektren) oder Zeitreihen als eindimensionale Bildinformation.
- Erzeugen von physikalisch oder mathematisch basierten zusätzlichen Merkmalen (z. B. Binning, Gradientenbildung, Integration, Transformation wie Fourier oder PCA etc.), die auch das Signal-Rausch-Verhältnis gegenüber dem ursprüngli¬ chen Datensatz verändern/optimieren können. - Nutzung von geordneten Wertefolgen mit physikalischem Zusammenhang als eindimensionale Eingabevektoren/Messdatensätze für das tiefe neuronale Netz.
- Simultane Nutzung von ursprünglichen Wertefolgen und abgeleiteten Merkmalen analog zur Eingabe von RGB-Kanälen bei der Bildverarbeitung und Klassifikation mittels des tiefen neuronalen Net zes .
- Simultane Nutzung von Zeitreihen mehrerer Input Variablen analog zur Eingabe von RGB-Kanälen bei der Lösung klassischer Regressionsprobleme .
- Intelligentes Netzwerk-Setup: Nutzung bekannter physikali¬ scher Gesetzmäßigkeiten und Eigenschaften oder mathematischer Eigenschaften der nachbarschaftlich geordneten Eingangsdaten zur Ableitung von Messwert-Abschnitt-Parametern für die Topo- logie des tiefen neuronalen Netzes (z. B. Fensterbreite und Schrittweite in Subnetzen, Verwendung geeigneter dynamischer Schrittweiten etc.)
Es lassen sich insbesondere folgende Vorteile damit erzielen: - Berücksichtigung von nachbarschaftlichen Beziehungen in Messdatensätzen/Eingabevektoren
- Simultane Verarbeitung von physikalisch sinnvollen Zusatzinformationen sowie mehrere (simultaner/multipler) Messdatensätze bzw. Messwerten von Messdatensätzen und dadurch verbesserte Ableitung prädiktiver Merkmale
- Effektive Nutzung lernender Verfahren zur Klassifikation von Daten mit unzureichend bekannten Merkmalen sowie zur Lösung von Regressionsaufgaben.
- Physikalisch bzw. mathematisch basierte Modellkonfiguration ersetzt/erweitert empirisch ermittelte Parameter in tiefen neuronalen Netzen Die Fig. 3 zeigt ein drittes Aus führungsbeispiel der Erfin¬ dung als eine Konfigurationsvorrichtung zum rechnergestützten Konfigurieren eines tiefen neuronalen Netzes zur Ermittlung von Merkmalen eines Objekts mittels eines Systemverhaltens eines dynamischen Systems.
Die KonfigurationsVorrichtung umfasst ein erstes Bereitstellungsmodul 310, ein erstes Konfigurationsmodul 320 und eine optionale erste Kommunikationsschnittstelle 304, die über ei- nen ersten Bus 303 kommunikativ miteinander verbunden sind.
Die KonfigurationsVorrichtung kann beispielsweise zusätzlich noch eine weitere oder mehrere weitere Komponente/n umfassen, wie beispielsweise einen Prozessor, eine Speichereinheit, ein Eingabegerät, insbesondere eine Computertastatur oder eine
Computermaus, und ein Anzeigegerät (z. B. einen Monitor) . Der Prozessor kann beispielsweise mehrere weitere Prozessoren um¬ fassen, wobei beispielsweise die weiteren Prozessoren jeweils eines oder mehrere der Module realisiert. Alternativ reali- siert der Prozessor insbesondere alle Module des Ausführungs¬ beispiels. Die weitere/n Komponente/n können beispielsweise ebenfalls über den ersten Bus 303 miteinander kommunikativ verbunden sein. Bei dem Prozessor kann es sich beispielsweise um einen ASIC handeln, der anwendungsspezifisch für die Funktionen eines jeweiligen Moduls oder aller Module des Ausführungsbeispiels (und/oder weiterer Ausführungsbeispiele) realisiert wurde, wobei die Programmkomponente bzw. die Programmbefehle insbe- sondere als integrierte Schaltkreise realisiert sind. Bei dem Prozessor kann es sich beispielsweise auch um einen FPGA handeln, der insbesondere mittels der Programmbefehle derart konfiguriert wird, dass der FPGA die Funktionen eines jewei¬ ligen Moduls oder aller Module des Ausführungsbeispiels (und/oder weiterer Ausführungsbeispiele) realisiert.
Das erste Bereitstellungsmodul 310 ist zum Bereitstellen von Trainingsdaten für das dynamische System mit vorgegebenen ersten Eingabevektoren eingerichtet. Den jeweiligen ersten Eingabevektoren sind jeweils erste vorgegebene Ausgabevekto¬ ren zugeordnet. Durch diese Zuordnung wird ein bekanntes Sys¬ temverhalten des dynamischen Systems beschrieben. Zusätzlich werden die jeweiligen ersten Eingabevektoren mittels einer Auswahlfunktion in Messwert-Abschnitte zerlegt und es werden Messwerte der Messwert-Abschnitte jeweils einem Ergebniswert des dem ersten Eingabevektor zugeordneten ersten Ausgabevektors zugeordnet .
Das erste Bereitstellungsmodul 310 kann beispielsweise mit¬ tels des Prozessors, der Speichereinheit und einer ersten Programmkomponente implementiert oder realisiert werden, wo¬ bei beispielsweise durch ein Ausführen von Programmbefehlen der ersten Programmkomponente der Prozessor derart konfigu¬ riert wird oder durch die Programmbefehle der Prozessor der¬ art konfiguriert ist, dass die Trainingsdaten, wie im vorher¬ gehenden Absatz erläutert, bereitgestellt werden. Das erste Konfigurationsmodul 320 ist zum Konfigurieren des tiefen neuronalen Netzes mittels der Trainingsdaten eingerichtet, wobei das tiefe neuronale Netz eine Vielzahl von Verarbeitungs schichten umfasst. Dabei wird einer jeweiligen Verarbeitungs Schicht jeweils einer der Messwert-Abschnitte zugeordnet und es werden jeweils die Messwerte eines entspre¬ chenden Messwert-Abschnitts an die jeweilige Verarbeitungs¬ schicht übermittelt, die dem entsprechenden Messwert- Abschnitt zugeordnet ist. Zusätzlich werden die den Messwerten zugeordneten Ergebniswerte einer Ausgabeschicht des tie- fen neuronalen Netzes übermittelt. Danach werden Neuronen der jeweiligen Verarbeitungsschichten anhand des bekannten Systemverhaltens konfiguriert.
Das erste Konfigurationsmodul 320 kann beispielsweise mittels des Prozessors, der Speichereinheit und einer zweiten Pro¬ grammkomponente implementiert oder realisiert werden, wobei beispielsweise durch ein Ausführen von Programmbefehlen der zweiten Programmkomponente der Prozessor derart konfiguriert wird oder durch die Programmbefehle der Prozessor derart kon¬ figuriert ist, dass das tiefe neuronale Netz mittels der Trainingsdaten konfiguriert wird. Das Ausführen der Programmbefehle der jeweiligen Module kann hierbei beispielsweise mittels des Prozessors selbst und/oder mittels einer Initialisierungskomponente, beispielsweise ein Lader (engl, loader) oder einer Konfigurationskomponente, erfolgen .
Die Fig. 4 zeigt ein viertes Aus führungsbeispiel der Erfin¬ dung als eine Ermittlungsvorrichtung zum rechnergestützten Ermitteln von Merkmalen eines Objekts mittels eines Systemverhaltens eines dynamischen Systems.
Die Ermittlungsvorrichtung umfasst ein erstes Erfassungsmodul 410, ein erstes Zerlegemodul 420, ein zweites Bereitstel¬ lungsmodul 430, ein erstes Übermittlungsmodul 440, ein erstes Ermittlungsmodul 450, ein zweites Übermittlungsmodul 460 und eine optionale zweite Kommunikationsschnittstelle 404, die über einen zweiten Bus 403 kommunikativ miteinander verbunden sind .
Die Ermittlungsvorrichtung kann beispielsweise zusätzlich noch eine weitere oder mehrere weitere Komponente/n umfassen, wie beispielsweise einen Prozessor, eine Speichereinheit, ein Eingabegerät, insbesondere eine Computertastatur oder eine Computermaus, und ein Anzeigegerät (z. B. einen Monitor) . Der Prozessor kann beispielsweise mehrere weitere Prozessoren, z. B. mehrere Kerne oder als Hyperthreading Technologie rea¬ lisiert, umfassen, wobei beispielsweise die weiteren Prozes¬ soren jeweils eines oder mehrere der Module realisiert. Al¬ ternativ realisiert der Prozessor insbesondere alle Module des Ausführungsbeispiels. Die weitere/n Komponente/n können beispielsweise ebenfalls über den zweiten Bus 403 miteinander kommunikativ verbunden sein. Bei dem Prozessor kann es sich beispielsweise um einen ASIC handeln, der anwendungsspezifisch für die Funktionen eines jeweiligen Moduls oder aller Module des Ausführungsbeispiels (und/oder weiterer Ausführungsbeispiele) realisiert wurde, wobei die Programmkomponente bzw. die Programmbefehle insbe¬ sondere als integrierte Schaltkreise realisiert sind. Bei dem Prozessor kann es sich beispielsweise auch um einen FPGA handeln, der insbesondere mittels der Programmbefehle derart konfiguriert wird, dass der FPGA die Funktionen eines jewei- ligen Moduls oder aller Module des Ausführungsbeispiels (und/oder weiterer Ausführungsbeispiele) realisiert.
Das erste Erfassungsmodul 410 ist zum Erfassen eines Messda¬ tensatzes von dem Objekt eingerichtet.
Das erste Erfassungsmodul 410 kann beispielsweise mittels des Prozessors, der Speichereinheit und einer ersten Programmkom¬ ponente implementiert oder realisiert werden, wobei bei¬ spielsweise durch ein Ausführen von Programmbefehlen der ers- ten Programmkomponente der Prozessor derart konfiguriert wird oder durch die Programmbefehle der Prozessor derart konfigu¬ riert ist, dass der Messdatensatz von dem Objekt beispiels¬ weise mittels eines Sensors erfasst wird. Das erste Zerlegemodul 420 ist zum Zerlegen des Messdatensat¬ zes mittels einer Auswahlfunktion in Messwert-Abschnitte ein¬ gerichtet .
Das erste Zerlegemodul 420 kann beispielsweise mittels des Prozessors, der Speichereinheit und einer zweiten Programm¬ komponente implementiert oder realisiert werden, wobei bei¬ spielsweise durch ein Ausführen von Programmbefehlen der zweiten Programmkomponente der Prozessor derart konfiguriert wird oder durch die Programmbefehle der Prozessor derart kon- figuriert ist, dass der Messdatensatz mittels einer Auswahlfunktion in die Messwert-Abschnitte zerlegt wird. Das zweite Bereitstellungsmodul 430 ist zum Bereitstellen ei¬ nes konfigurierten tiefen neuronalen Netzes, welches eine Eingabeschicht, eine Ausgabeschicht und eine Vielzahl von Verarbeitungs schichten umfasst, eingerichtet, wobei einer je- weiligen Verarbeitungsschicht jeweils einer der Messwert- Abschnitte zugeordnet wird.
Das zweite Bereitstellungsmodul 430 kann beispielsweise mit¬ tels des Prozessors, der Speichereinheit und einer dritten Programmkomponente implementiert oder realisiert werden, wo¬ bei beispielsweise durch ein Ausführen von Programmbefehlen der dritten Programmkomponente der Prozessor derart konfigu¬ riert wird oder durch die Programmbefehle der Prozessor der¬ art konfiguriert ist, dass das konfigurierte tiefe neuronale Netz bereitgestellt wird.
Das erste Übermittlungsmodul 440 ist zum Übermitteln von Messwerten der Messwert-Abschnitte an die dem jeweiligen Messwert-Abschnitt zugeordnete Verarbeitungsschicht einge- richtet.
Das erste Übermittlungsmodul 440 kann beispielsweise mittels des Prozessors, der Speichereinheit und einer vierten Pro¬ grammkomponente implementiert oder realisiert werden, wobei beispielsweise durch ein Ausführen von Programmbefehlen der vierten Programmkomponente der Prozessor derart konfiguriert wird oder durch die Programmbefehle der Prozessor derart kon¬ figuriert ist, dass die Messwerte übermittelt werden. Das erste Ermittlungsmodul 450 wird zum Ermitteln der Merkma¬ le anhand des Messdatensatzes mittels des konfigurierten tie¬ fen neuronalen Netzes eingerichtet, wobei jeweils die Mess¬ werte durch Neuronen der dem entsprechenden Messwert- Abschnitts zugeordneten Verarbeitungsschicht verarbeitet wer- den.
Das erste Ermittlungsmodul 450 kann beispielsweise mittels des Prozessors, der Speichereinheit und einer fünften Pro- grammkomponente implementiert oder realisiert werden, wobei beispielsweise durch ein Ausführen von Programmbefehlen der fünften Programmkomponente der Prozessor derart konfiguriert wird oder durch die Programmbefehle der Prozessor derart kon- figuriert ist, dass die Merkmale ermittelt werden.
Das zweite Übermittlungsmodul 460 ist zum Übermitteln von Analyseergebnissen von den Verarbeitungsschichten an die Ausgabeschicht eingerichtet. Das Übermittlungsmodul 460 kann die Analyseergebnisse beispielsweise an das Anzeigegerät übermit¬ teln, sodass das Analyseergebnis beispielsweise einem Arzt angezeigt wird.
Das zweite Übermittlungsmodul 460 kann beispielsweise mittels des Prozessors, der Speichereinheit und einer sechsten Pro¬ grammkomponente implementiert oder realisiert werden, wobei beispielsweise durch ein Ausführen von Programmbefehlen der sechsten Programmkomponente der Prozessor derart konfiguriert wird oder durch die Programmbefehle der Prozessor derart kon- figuriert ist, dass die Analyseergebnisse übermittelt werden.
Das Ausführen der Programmbefehle der jeweiligen Module kann hierbei beispielsweise mittels des Prozessors selbst und/oder mittels einer Initialisierungskomponente, beispielsweise ein Lader (engl, loader) oder einer Konfigurationskomponente, erfolgen .
Die Fig. 5 zeigt ein fünftes Aus führungsbeispiel der Erfin¬ dung als ein multispektrales Kamerasystem.
Das multispektrale Kamerasystem umfasst eine optionale erste Schnittstelle 504 und eine Ermittlungsvorrichtung 400, bei¬ spielsweise eine Ermittlungsvorrichtung so wie diese in Fig. 4 beschrieben wurde, wobei das Erfassungsmodul der Er- mittlungsvorrichtung 400 mindestens eine Kamera 510 zum Er¬ fassen von optischen Spektren (also z. B. mehreren Spektren) des Objekts umfasst. Die Ermittlungsvorrichtung 400 ist über ihre Schnittstelle mit einem Bus 503 des multispektralen Ka- merasystems mit der ersten Schnittstelle 504 kommunikativ verbunden. Über einen externen Bus 505 ist die Kamera 510 mit der ersten Schnittstelle 504 derart verbunden, dass die er- fassten Spektren an das Erfassungsmodul übermittelt werden können .
Die Erfindung und ihre Ausführungsbeispiele (Verfahren, Vor¬ richtungen und multispektrales Kamerasystem) können beispielsweise in „in vitro" und/oder in „in vivo" Verfahren verwendet werden, um insbesondere während einer Operation oder Behandlung eines Patienten einem Arzt vorzugsweise auf einem Anzeigegerät Informationen über den Patienten, z. B. über Informationen über den Gewebetyp einer Gewebeprobe, anzugeben. Hierzu kann beispielsweise dem Arzt auf dem Anzeige¬ gerät angezeigt werden, wie viele Zellen z. B. von einem be¬ stimmten Zelltyp in der Gewebeprobe vorhanden sind (z. B. 30 % Tumorzellen, 40 % Muskelzellen, 30 % Fettzellen) .
Obwohl die Erfindung im Detail durch die Ausführungsbeispiele näher illustriert und beschrieben wurde, ist die Erfindung nicht durch die offenbarten Beispiele eingeschränkt, und an¬ dere Variationen können vom Fachmann hieraus abgeleitet werden, ohne den Schutzumfang der Erfindung zu verlassen.

Claims

Patentansprüche
1. Verfahren zum rechnergestützten Konfigurieren eines tiefen neuronalen Netzes zur Ermittlung von Merkmalen eines Objekts mittels eines Systemverhaltens eines dynamischen Systems mit folgenden Verfahrensschritten:
Bereitstellen (110) von Trainingsdaten für das dynamische System mit vorgegebenen ersten Eingabevektoren, wobei
- den jeweiligen ersten Eingabevektoren jeweils erste vorgegebene Ausgabevektoren zugeordnet sind und ein bekanntes Systemverhalten des dynamischen Systems beschreiben,
die jeweiligen ersten Eingabevektoren mittels einer Auswahlfunktion in Messwert-Abschnitte zerlegt wer¬ den,
Messwerte der Messwert-Abschnitte jeweils einem Er¬ gebniswert des dem ersten Eingabevektor zugeordne¬ ten ersten Ausgabevektors zugeordnet wird, - Konfigurieren (120) des tiefen neuronalen Netzes mittels der Trainingsdaten, wobei
das tiefe neuronale Netz eine Vielzahl von Verar¬ beitungsschichten umfasst,
- einer jeweiligen Verarbeitungs Schicht jeweils einer der Messwert-Abschnitte zugeordnet wird, jeweils die Messwerte eines entsprechenden Mess¬ wert-Abschnitts an die jeweilige Verarbeitungs¬ schicht übermittelt werden, die dem entsprechenden Messwert-Abschnitt zugeordnet ist,
- die den Messwerten zugeordneten Ergebniswerte einer
Ausgabeschicht des tiefen neuronalen Netzes über¬ mittelt werden,
Neuronen der jeweiligen Verarbeitungsschichten anhand des bekannten Systemverhaltens konfiguriert werden.
2. Verfahren nach Anspruch 1, wobei die ersten Eingabevektoren gemessene Spektren des Objekts sind, und wobei die ersten Ausgabevektoren bereits durchgeführte Analyseergebnisse für die Spektren sind.
3. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Neuronen derart konfiguriert werden, um die Auswahlfunktion zu modellieren.
4. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Neuronen derart konfiguriert werden, um eine Datentrans¬ formation der ersten Eingabevektoren zu modellieren.
5. Verfahren zum rechnergestützten Ermitteln von Merkmalen eines Objekts mittels eines Systemverhaltens eines dynami¬ schen Systems mit folgenden Verfahrensschritten:
Erfassen (210) eines Messdatensatzes von dem Objekt; Zerlegen (220) des Messdatensatzes mittels einer Aus¬ wahlfunktion in Messwert-Abschnitte;
Bereitstellen (230) eines konfigurierten tiefen neuronalen Netzes, welches eine Eingabeschicht, eine Ausgabe¬ schicht und eine Vielzahl von Verarbeitungsschichten um- fasst, wobei einer jeweiligen Verarbeitungsschicht je¬ weils einer der Messwert-Abschnitte zugeordnet wird; Übermitteln (240) von Messwerten der Messwert-Abschnitte an die dem jeweiligen Messwert-Abschnitt zugeordnete Verarbeitungsschicht ;
Ermitteln (250) der Merkmale anhand des Messdatensatzes mittels des konfigurierten tiefen neuronalen Netzes, wobei jeweils die Messwerte durch Neuronen der dem ent¬ sprechenden Messwert-Abschnitt zugeordneten Verarbei¬ tungsschicht verarbeitet werden;
Übermitteln (260) von Analyseergebnissen von den Verarbeitungsschichten an die Ausgabeschicht.
6. Verfahren nach Anspruch 5, wobei der Messdatensatz ein gemessenes Spektrum des Objekts ist.
7. Verfahren nach Anspruch 5 oder 6, wobei das Zerlegen durch die Neuronen der Verarbeitungsschichten als Vorverarbeitungsschritt durchgeführt wird.
8. Verfahren nach einem der der Ansprüche 5 - 7, wobei die Neuronen eine Datentransformation des Messdatensatzes als Vorverarbeitungsschicht durchführen .
9. Verfahren nach einem der An Sprüche 5 - 8, wobei das konfi- gurierte tiefe neuronale Netz mit dem Verfahren nach einem der Ansprüche 1-4 konfiguriert wurde .
10. KonfigurationsVorrichtung zum rechnergestützten Konfigurieren eines tiefen neuronalen Netzes zur Ermittlung von Merkmalen eines Objekts mittels eines Systemverhaltens eines dynamischen Systems, aufweisend:
ein erstes Bereitstellungsmodul (310) zum Bereitstellen von Trainingsdaten für das dynamische System mit vorgegebenen ersten Eingabevektoren, wobei
den jeweiligen ersten Eingabevektoren jeweils erste vorgegebene Ausgabevektoren zugeordnet sind und ein bekanntes Systemverhalten des dynamischen Systems beschreiben,
die jeweiligen ersten Eingabevektoren mittels einer Auswahlfunktion in Messwert-Abschnitte zerlegt wer¬ den,
Messwerte der Messwert-Abschnitte jeweils einem Er¬ gebniswert des dem ersten Eingabevektor zugeordne¬ ten ersten Ausgabevektors zugeordnet wird; ein erstes Konfigurationsmodul (320) zum Konfigurieren des tiefen neuronalen Netzes mittels der Trainingsdaten, wobei
das tiefe neuronale Netz eine Vielzahl von Verar¬ beitungsschichten umfasst,
- einer jeweiligen Verarbeitungs Schicht jeweils einer der Messwert-Abschnitte zugeordnet wird, jeweils die Messwerte eines entsprechenden Mess¬ wert-Abschnitts an die jeweilige Verarbeitungs- Schicht übermittelt werden, die dem entsprechenden Messwert-Abschnitt zugeordnet ist,
die den Messwerten zugeordneten Ergebniswerte einer Ausgabeschicht des tiefen neuronalen Netzes über¬ mittelt werden,
Neuronen der jeweiligen Verarbeitungsschichten anhand des bekannten Systemverhaltens konfiguriert werden .
11. Ermittlungsvorrichtung zum rechnergestützten Ermitteln von Merkmalen eines Objekts mittels eines Systemverhaltens eines dynamischen Systems, aufweisend:
ein erstes Erfassungsmodul (410) zum Erfassen eines
Messdatensatzes von dem Objekt;
ein erstes Zerlegemodul (420) zum Zerlegen des Messda¬ tensatzes mittels einer Auswahlfunktion in Messwert- Abschnitte;
ein zweites Bereitstellungsmodul (430) zum Bereitstellen eines konfigurierten tiefen neuronalen Netzes, welches eine Eingabeschicht, eine Ausgabeschicht und eine Viel¬ zahl von Verarbeitungsschichten umfasst, wobei einer jeweiligen Verarbeitungsschicht jeweils einer der Mess¬ wert-Abschnitte zugeordnet wird;
ein erstes Übermittlungsmodul (440) zum Übermitteln von Messwerten der Messwert-Abschnitte an die dem jeweiligen Messwert-Abschnitt zugeordnete Verarbeitungsschicht; ein erstes Ermittlungsmodul (450) zum Ermitteln der Merkmale anhand des Messdatensatzes mittels des konfigu¬ rierten tiefen neuronalen Netzes, wobei jeweils die Messwerte durch Neuronen der dem entsprechenden Messwert-Abschnitts zugeordneten Verarbeitungsschicht verar¬ beitet werden;
ein zweites Übermittlungsmodul (460) zum Übermitteln von Analyseergebnissen von den Verarbeitungs schichten an die Ausgabeschicht .
12. Multispektrales Kamerasystem, aufweisend:
eine Ermittlungsvorrichtung nach Anspruch 11, wobei das Erfassungsmodul (410) mindestens eine Kamera zum Erfassen von optischen Spektren des Objekts umfasst.
13. Computerprogrammprodukt mit Programmbefehlen zur Durch¬ führung des Verfahrens nach einem der Ansprüche 1 - 4 und/oder zur Durchführung des Verfahrens nach einem der Ansprüche 5 - 9.
14. Computerprogrammprodukt mit Programmbefehlen für ein Ers tellungsgerät , das mittels der Programmbefehle konfiguriert wird, die Konfigurationsvorrichtung nach Anspruch 10 und/ode die Ermittlungsvorrichtung nach Anspruch 11 und/oder das Mul tispektrales Kamerasystem nach Anspruch 12 zu erstellen.
15. Bereitstellungsvorrichtung für das Computerprogrammprodukt nach Anspruch 13 oder 14, wobei die Bereitstellungsvorrichtung das Computerprogrammprodukt speichert und/oder be¬ reitstellt .
PCT/EP2016/081207 2016-12-15 2016-12-15 Verfahren und vorrichtungen zum rechnergestützten konfigurieren eines tiefen neuronalen netzes WO2018108281A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/EP2016/081207 WO2018108281A1 (de) 2016-12-15 2016-12-15 Verfahren und vorrichtungen zum rechnergestützten konfigurieren eines tiefen neuronalen netzes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2016/081207 WO2018108281A1 (de) 2016-12-15 2016-12-15 Verfahren und vorrichtungen zum rechnergestützten konfigurieren eines tiefen neuronalen netzes

Publications (1)

Publication Number Publication Date
WO2018108281A1 true WO2018108281A1 (de) 2018-06-21

Family

ID=57708563

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2016/081207 WO2018108281A1 (de) 2016-12-15 2016-12-15 Verfahren und vorrichtungen zum rechnergestützten konfigurieren eines tiefen neuronalen netzes

Country Status (1)

Country Link
WO (1) WO2018108281A1 (de)

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"Network and Parallel Computing", vol. 10111, 22 September 2016, SPRINGER INTERNATIONAL PUBLISHING, Cham, ISBN: 978-3-642-01523-6, ISSN: 0302-9743, article NICOLAS AUDEBERT ET AL: "Semantic Segmentation of Earth Observation Data Using Multimodal and Multi-scale Deep Networks", pages: 180 - 196, XP055402133, 032548, DOI: 10.1007/978-3-319-54181-5_12 *
CAVIGELLI LUKAS ET AL: "Computationally efficient target classification in multispectral image data with Deep Neural Networks", PROCEEDINGS VOLUME 9025 IS&T/SPIE ELECTRONIC IMAGING | 2-6 FEBRUARY 2014 INTELLIGENT ROBOTS AND COMPUTER VISION XXXI: ALGORITHMS AND TECHNIQUES, SPIE, US, vol. 9997, 24 October 2016 (2016-10-24), pages 99970L - 99970L, XP060079892, ISSN: 0277-786X, DOI: 10.1117/12.2241383 *
HENRY G R GOUK ET AL: "Fast Sliding Window Classification with Convolutional Neural Networks", IMAGE AND VISION COMPUTING NEW ZEALAND, ACM, 2 PENN PLAZA, SUITE 701 NEW YORK NY 10121-0701 USA, 19 November 2014 (2014-11-19), pages 114 - 118, XP058065344, ISBN: 978-1-4503-3184-5, DOI: 10.1145/2683405.2683429 *
WEI HU ET AL: "Deep Convolutional Neural Networks for Hyperspectral Image Classification", JOURNAL OF SENSORS, vol. 2015, 1 January 2015 (2015-01-01), US, pages 1 - 12, XP055402128, ISSN: 1687-725X, DOI: 10.1155/2015/258619 *

Similar Documents

Publication Publication Date Title
EP1532583B1 (de) Verfahren zum extrahieren von texturmerkmalen aus einem mehrkanaligen bild
DE112012005677T5 (de) Systeme und Verfahren zur Verarbeitung von Daten in chromatographischen Systemen.
DE112019003587T5 (de) Lernvorrichtung, Betriebsprogramm von Lernvorrichtung und Betriebsverfahren von Lernvorrichtung
WO2005122092A1 (de) Verfahren und vorrichtung zur segmentierung einer digitalen abbildung von zellen
WO2021023514A1 (de) Bestimmung eines verschleissgrades eines werkzeugs
DE102018104616A1 (de) Verfahren zum Aufteilen eines oder mehrerer Bilder einer Probe in nach Farbstoffen aufgeteilte Bilddaten, Computerprogrammprodukt, computerlesbares Medium, auf dem das Computerprogrammprodukt gespeichert ist, und System zum Aufteilen eines oder mehrerer Bilder einer Probe in nach Farbstoffen aufgeteilte Bilddaten
DE102018125740A1 (de) Verfahren und vorrichtungen zur ermöglichung einer parallelen verarbeitung beim lösen von linearen gleichungen in einem computervisionsverarbeitungssystem
DE112018004567T5 (de) Spektralanalyseeinrichtung und Spektralanalyseverfahren
DE10017551C2 (de) Verfahren zur zyklischen, interaktiven Bildanalyse sowie Computersystem und Computerprogramm zur Ausführung des Verfahrens
EP3513355A1 (de) Verfahren zur klassifizierung von spektren von objekten mit komplexem informationsgehalt
EP3707496B1 (de) Identifizierung eines oder mehrerer spektraler merkmale in einem spektrum einer probe für eine inhaltsstoffanalyse
WO2018108281A1 (de) Verfahren und vorrichtungen zum rechnergestützten konfigurieren eines tiefen neuronalen netzes
DE102005049017A1 (de) Verfahren zur Segmentierung in einem n-dimensionalen Merkmalsraum und Verfahren zur Klassifikation auf Grundlage von geometrischen Eigenschaften segmentierter Objekte in einem n-dimensionalen Datenraum
DE102019117680A1 (de) Automatisiertes segmentierungsverfahren für die qualitätsprüfung
WO2001080235A1 (de) Verfahren zur bestimmung eines charakteristischen datensatzes für ein datensignal
EP2096578A2 (de) Verfahren und Vorrichtung zur Charakterisierung der Formation von Papier
DE102014224916B4 (de) Verfahren zur rechnergestützten Analyse eines oder mehrerer Gewebeschnitte des menschlichen oder tierischen Körpers
EP1986127B1 (de) Erzeugung von Endmember-Spektren
DE102008054345B4 (de) Verfahren und Vorrichtung zur Detektion von Kampfstoffen
WO2018019355A1 (de) Verfahren und vorrichtung zum rechnergestützten analysieren mindestens eines zweiten eingabevektors eines zielsystems
EP4256475A1 (de) Vergleichen eines ersten knn mit einem zweiten knn
Dwivedi Understanding how visual information is represented in humans and machines
WO2023066792A1 (de) Computer-implementiertes verfahren zur erzeugung synthetischer bilder zum trainieren künstlicher intelligenz (ai)
EP1687756B9 (de) Verfahren zur klassifikation von messwerten in der medizinischen und biochemischen analytik
DE102011114285B4 (de) Verfahren zur Analyse eines über ein Übertragungsmedium übertragenen Mischsignals, Signalanalysator, Analysatorfinger-Hardwaremodul und Computerprogramm

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16820220

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16820220

Country of ref document: EP

Kind code of ref document: A1