DE102021210920A1 - Einrichtung und computerimplementiertes Verfahren zum Trainieren eines Systems für maschinelles Lernen zum Zuordnen einer Scan-Untersuchung zu einem standardisierten Identifizierercode - Google Patents

Einrichtung und computerimplementiertes Verfahren zum Trainieren eines Systems für maschinelles Lernen zum Zuordnen einer Scan-Untersuchung zu einem standardisierten Identifizierercode Download PDF

Info

Publication number
DE102021210920A1
DE102021210920A1 DE102021210920.9A DE102021210920A DE102021210920A1 DE 102021210920 A1 DE102021210920 A1 DE 102021210920A1 DE 102021210920 A DE102021210920 A DE 102021210920A DE 102021210920 A1 DE102021210920 A1 DE 102021210920A1
Authority
DE
Germany
Prior art keywords
scan
exams
mls
machine learning
learning system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE102021210920.9A
Other languages
English (en)
Inventor
Pankaj Kumar
Nikhil Lakshman
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens Healthineers Ag De
Original Assignee
Siemens Healthcare GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Healthcare GmbH filed Critical Siemens Healthcare GmbH
Priority to DE102021210920.9A priority Critical patent/DE102021210920A1/de
Priority to US17/953,504 priority patent/US20230101474A1/en
Publication of DE102021210920A1 publication Critical patent/DE102021210920A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Die Erfindung bezieht sich auf eine Einrichtung und ein computerimplementiertes Verfahren zum Trainieren eines Systems für maschinelles Lernen zum Abbilden einer Scan-Untersuchung auf einen standardisierten Identifizierercode.Aktives Lernen wird verwendet, um zu steuern, welche Scan-Untersuchungen durch einen Anwender abzubilden sind. Diese Steuerung wird genutzt, um den Anwender aufzufordern, die - für das MLS in seinem aktuellen Trainingszustand - schwierigsten Datenpunkte zu kennzeichnen. Die Erfindung stellt auch eine Anzahl von Techniken zum Gewinnen von Wissen aus den Scan-Untersuchungen und zum Bestimmen optimaler Entscheidungskriterien bereit.

Description

  • Die Erfindung bezieht sich auf das Abbilden von Scan-Untersuchungen, die üblicherweise durch mandantenspezifische oder herstellerspezifische Protokollbezeichnungen bezeichnet sind, auf ein Wörterbuch für standardisierte Identifizierercodes wie z. B. das RadLex Playbook und die darin enthaltenen RadLex-IDs (RPIDs). Die Erfindung stellt auch ein computerimplementiertes Verfahren zum Abbilden von Scan-Untersuchungen, ein Computerprogrammprodukt, ein Datenspeichermedium und einen zugehörigen Datenstrom bereit.
  • Die Benennung der Bildgebungsprozeduren ist derzeit in verschiedenen Ländern und sogar in verschiedenen Institutionen nicht standardisiert. Dies erschwert die Bemühungen, verschiedene Typen von Scan-Prozeduren zu vergleichen und nationale oder internationale Register zu erstellen, z. B. für die eingesetzten Dosen.
  • Die Radiological Society of North America (RSNA) hat das sogenannte RadLex Playbook entwickelt, das eine Referenz zum Abbilden der Bemühungen zum Adressieren dieser Lücke ist. Das RadLex Playbook ist unter dieser URL verfügbar: http://playbook.radlex.org/playbook/SearchRadlexAction, derzeit in der Version 2.5 vom Februar 2018. Es ist jedoch zu verstehen, dass auch spätere Versionen des RadLex Playbook eingeschlossen sind, wenn das RadLex Playbook hier genannt ist.
  • In dem RadLex Playbook wird jede Scan-Untersuchung auf einen standardisierten Identifizierercode SIC abgebildet, der in diesem Fall als „RadLex ID“ oder kurz „RPID“ bezeichnet ist. Das RPID-Abbilden ist nützlich zur Standardisierung der Bildgebungsprozeduren, zum Vergleichen ähnlicher Prozeduren und Untersuchungen in verschiedenen Regionen und zum Erleichtern des Aufnehmens der Dosis und des Bestrahlungsmanagements in verschiedenen Institutionen. Auf diese Weise kann auch die Häufigkeit von Fehlalarmen verringert werden, oder Fehlalarme können vollständig eliminiert werden.
  • Die Aufgabe der RPID-Vorhersage einer Scan-Untersuchung (d. h. das Abbilden der Scan-Untersuchung auf eine RPID) hängt von vielen Faktoren ab, die Modalität, Körperregion, Untersuchungsbeschreibung und vieles mehr enthalten. Das manuelle Abbilden solcher Datensätze, die bei Tausenden von Untersuchungen pro Tag anfallen, ist eine mühsame Arbeit für die Radiologen.
  • Es ist allgemein bekannt, dass Systeme für maschinelles Lernen, MLS, einige Aufgaben automatisieren können, die für den Menschen mit erheblichem Aufwand verbunden sind, falls sie Mustern folgen, die zu unterscheiden und zu erkennen das MLS trainiert ist. Das Trainieren eines MLS erfordert jedoch auch eine große Menge an gekennzeichneten Daten, um überwachtes Lernen, das das bisher vielversprechendste Trainingsverfahren ist, auszuführen. Bei überwachtem Lernen wird eine Trainingsmenge von Eingabedaten bereitgestellt, wobei jedes Element der Eingabedaten zusammen mit einer Kennzeichnung, die die korrekte, d. h. gewünschte, Ausgabe eines MLS für diese Eingabedaten angibt, bereitgestellt wird.
  • Dementsprechend besteht ein Bedarf an Systemen und Verfahren zum Trainieren von MLSs unter Verwendung einer minimalen Anzahl von Kennzeichnungen.
  • Es ist eine Aufgabe der vorliegenden Erfindung, Systeme und Verfahren zum Trainieren von Systemen für maschinelles Lernen unter Verwendung einer minimalen Anzahl von Kennzeichnungen bereitzustellen. Diese Aufgabe wird durch den Gegenstand der unabhängigen Ansprüche gelöst.
  • Dementsprechend ist gemäß einem ersten Aspekt eine Einrichtung zum Trainieren eines Systems für maschinelles Lernen, MLS, zum Abbilden einer Scan-Untersuchung auf einen standardisierten Identifizierungscode, SIC, eines Wörterbuchs für standardisierte Identifizierercodes, SICD, bereitgestellt, wobei die Vorrichtung Folgendes umfasst:
    • eine Eingabeschnittstelle, die dazu ausgelegt ist, eine Grundmenge von Scan-Untersuchungen (BSSS) zu erhalten; und
    • eine Berechnungsvorrichtung, die dazu ausgelegt ist, wenigstens ein Clustering-Modul, das dazu ausgelegt ist, unter Verwendung eines Clustering-Algorithmus die Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS, in mehrere Cluster zu klassifizieren, zu implementieren; und
    • ein Modul für aktives Lernen, das dazu ausgelegt ist, das System für maschinelles Lernen MLS zu trainieren, wobei das Modul für aktives Lernen Folgendes umfasst:
      • ein Kennzeichnungsaufgabenbestimmungsmodul, LTDM, das dazu ausgelegt ist, wenigstens eine Scan-Untersuchung aus jedem Cluster auszuwählen;
      • ein Kennzeichnungsmodul, das dazu ausgelegt ist, SIC-Kennzeichnungen für die ausgewählten Scan-Untersuchungen zu erhalten, um eine Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu erzeugen; und
      • ein Trainingsmodul für Systeme für maschinelles Lernen, MLSTM, das dazu ausgelegt ist, das System für maschinelles Lernen, MLS, basierend auf der erzeugten Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu trainieren;
      • wobei das Modul für aktives Lernen ferner dazu ausgelegt ist, das System für maschinelles Lernen, MLS, neu zu trainieren durch Ausführen wenigstens einer Verfeinerungsschleife, umfassend:
        • - Bestimmen basierend auf einer Bewertungsmetrik einer zusätzlichen Menge zu kennzeichnender Scan-Untersuchungen aus der Grundmenge von Scan-Untersuchungen, BSSS;
        • - Erhalten von SIC-Kennzeichnungen für die Scan-Untersuchungen in der bestimmten zusätzlichen Menge von Scan-Untersuchungen, um die TSLSS zu erweitern;
        • - erneutes Trainieren des MLS unter Verwendung wenigstens der erweiterten TSLSS. Das Auswählen von Scan-Untersuchungen aus der zu kennzeichnenden Grundmenge von Scan-Untersuchungen, BSSS, ist so zu verstehen, dass es bedeutet, dass eine echte Teilmenge der Grundmenge ausgewählt wird. Vorzugsweise umfasst die anfängliche Auswahl höchstens 100 Scan-Untersuchungen, vorzugsweise höchstens 50 Scan-Untersuchungen. Weiter vorzuziehen ist die zusätzliche Menge von Scan-Untersuchungen, die während jeder der Verfeinerungsschleifen bestimmt wird, kleiner als die Menge von Scan-Untersuchungen, der in der anfänglichen Auswahl ausgewählt wurden, und kann beispielsweise eine Anzahl von 20 oder weniger Scan-Untersuchungen, vorzugsweise 10 Scan-Untersuchungen, sein.
  • Die Bewertungsmetrik (die auch als ein Auswahlkriterium bezeichnet sein kann) basiert vorzugsweise auf einer Entropie der Scan-Untersuchung und/oder auf einer Position eines Datenpunkts, der die Scan-Untersuchung in dem für das Clustering verwendeten Datenpunktraum repräsentiert. Auf diese Weise kann die Bewertungsmetrik verwendet werden, um solche Scan-Untersuchungen für eine zusätzliche Kennzeichnung, von denen erwartet wird, dass sie die Genauigkeit des Systems für maschinelles Lernen, MLS, am meisten verbessern, zu bestimmen. Solche Scan-Untersuchungen können Scan-Untersuchungen sein, die direkt an einer oder in der Nähe einer Clustergrenze liegen.
  • Die Entropie von Scan-Untersuchungen kann zusätzlich oder alternativ auch basierend auf den darin enthaltenen Unigrammen (im Wesentlichen dem in den Scan-Untersuchungsmerkmalen enthaltenen Text) bestimmt werden. Ein anderer Begriff für „Unigramm“ ist „1-Gramm“, wobei ein 1-Gramm eine Unterart eines n-Gramms (für eine beliebige positive Ganzzahl n) ist, wobei ein n-Gramm eine zusammenhängende Folge aus n Elementen (z. B. Phonemen, Silben, Buchstaben, Wörtern) aus einer gegebenen Textprobe ist. Anstelle des Wortes „Unigramm“ können auch die Wörter „Elemente“, „Textelemente“ oder „Grundelemente“ verwendet sein. Beispielsweise kann bestimmt werden, wie unterscheidungskräftig die Unigramme in der Scan-Untersuchung insgesamt sind, indem Repräsentationen für unterschiedliche SICs basierend Unigrammen bestimmt werden. Daraus kann bestimmt werden, ob ein spezielles Unigramm eine vergleichsweise höhere Entropie aufweist, d. h. gleichmäßiger in allen Repräsentationen vorhanden und wichtig ist, oder ob das spezielle Unigramm eine vergleichsweise geringere Entropie aufweist, d. h. in weniger Repräsentationen vorhanden ist.
  • Die höchste Entropie kann einem Unigramm zugewiesen werden, das in jeder Repräsentation mit dem gleichen Gewicht vorhanden ist, so dass es für die Kennzeichnung null Information führt. Die niedrigste Entropie kann einem Unigramm zugewiesen werden, das nur in einer einzigen Repräsentation vorhanden ist (und möglicherweise sogar mit der höchsten Gewichtung aller darin enthaltenen Unigramme), so dass eine hohe Wahrscheinlichkeit besteht, dass eine Scan-Untersuchung, die dieses Unigramm aufweist, für den durch diese einzige Repräsentation repräsentierten SIC klassifiziert wird. Die Entropie einer Scan-Untersuchung kann dann durch die Summe der Entropien ihrer Unigramme bestimmt werden, wobei die Summe eine gewichtete oder eine gleichgewichtete Summe sein kann.
  • Der (im Folgenden beschriebene) Mechanismus zum Erhöhen oder Erniedrigen der Gewichte von Unigrammen in den Repräsentationen basierend auf den erhaltenen Kennzeichnungen kann dann zum Ändern der Entropie der Unigramme beitragen. Außerdem ist es offensichtlich, dass Scan-Untersuchungen mit hoher Entropie tendenziell schwieriger automatisch zu klassifizieren sind, so dass zu erwarten ist, dass das Trainieren des Systems für maschinelles Lernen, MLS, am meisten von der Kennzeichnung von Scan-Untersuchungen mit hoher Entropie profitiert.
  • Die vorliegende Erfindung nutzt einen so genannten aktiven Lernansatz (oder: ein aktives Lernmodell), der einen Anwender dabei unterstützt, eine minimale Anzahl von Scan-Untersuchungen zu kennzeichnen, um ein gewünschtes Ergebnis zu erreichen. Die Bewertungsmetrik (oder: das Auswahlkriterium), vorzugsweise basierend auf der Entropie, verbessert die Wahrscheinlichkeiten dafür, dass die (vorzugsweise durch einen Anwender) erhaltenen Kennzeichnungen diejenigen sind, die das System für maschinelles Lernen, MLS, am meisten verbessern.
  • Die Berechnungsvorrichtung kann als irgendeine Vorrichtung oder irgendein Mittel zum Berechnen, insbesondere zum Ausführen einer Software, einer App oder eines Algorithmus, realisiert sein. Beispielsweise kann die Berechnungsvorrichtung wenigstens eine Verarbeitungseinheit wie z. B. wenigstens eine zentrale Verarbeitungseinheit, CPU, und/oder wenigstens eine Grafikverarbeitungseinheit, GPU, und/oder wenigstens ein feldprogrammierbares Gatter-Array, FPGA, und/oder wenigstens eine anwendungsspezifische integrierte Schaltung, ASIC, und/oder eine irgendeine Kombination der vorgenannten umfassen.
  • Die Berechnungsvorrichtung kann ferner einen Arbeitsspeicher, der betriebstechnisch mit der wenigstens einen Verarbeitungseinheit verbunden ist, und/oder einen nichttransitorischen Speicher, der betriebstechnisch mit der wenigstens einen Verarbeitungseinheit und/oder einem Arbeitsspeicher verbunden ist, umfassen. Die Berechnungsvorrichtung kann als eine lokale Vorrichtung, als eine entfernte Vorrichtung (z. B. ein Server, der über eine Anwenderschnittstelle mit einem Client entfernt verbunden ist) oder als eine Kombination aus diesen realisiert sein. Ein Teil der oder die gesamte Berechnungsvorrichtung kann auch durch eine Cloud-Computing-Plattform implementiert sein. Das Eingabemodul und/oder das Ausgabemodul können ebenfalls in die Berechnungsvorrichtung integriert sein.
  • Obwohl hier im Vorstehenden und auch im Folgenden einige Funktionen als durch Module ausgeführt beschrieben werden, ist zu verstehen, dass das nicht notwendigerweise bedeutet, dass solche Module als voneinander getrennte Einheiten bereitgestellt sind. In Fällen, in denen ein oder mehrere Module als Software bereitgestellt sind, können die Module durch Programmcodeabschnitte oder Programmcode-Snippets, die voneinander unterscheidbar sein können, aber auch miteinander verwoben oder integriert sein können, implementiert sein.
  • Ähnlich können in Fällen, in denen ein oder mehrere Module als Hardware bereitgestellt sind, die Funktionen eines oder mehrerer Module durch ein und dieselbe Hardwarekomponente bereitgestellt sein, oder die Funktionen mehrerer Module können über mehrere Hardwarekomponenten, die nicht notwendigerweise den Modulen entsprechen müssen, verteilt sein. Somit ist irgendein/e Einrichtung, System, Verfahren und so weiter, die/das alle einem spezifischen Modul zugeschriebenen Merkmale und Funktionen aufweist, so zu verstehen, dass es dieses Modul umfasst oder implementiert. Insbesondere besteht die Möglichkeit, dass alle Module durch Programmcode, der durch die Berechnungsvorrichtung, z. B. einen Server oder eine Cloud-Computing-Plattform, ausgeführt wird, implementiert sind.
  • Gemäß einem zweiten Aspekt der vorliegenden Erfindung ist ein computerimplementiertes Verfahren zum Trainieren eines Systems für maschinelles Lernen zum Abbilden einer Scan-Untersuchung auf einen standardisierten Identifizierungscode, SIC, eines Wörterbuchs für standardisierte Identifizierungscodes, SICD, bereitgestellt. Das Verfahren umfasst die folgenden Schritte:
    • - Erhalten einer Grundmenge von Scan-Untersuchungen, BSSS;
    • - Klassifizieren unter Verwendung eines Clustering-Algorithmus der Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS, in mehrere Cluster;
    • - Auswählen wenigstens einer Scan-Untersuchung aus jedem Cluster;
    • - Erhalten von SIC-Kennzeichnungen für die ausgewählten Scan-Untersuchungen, um eine Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu erzeugen;
    • - Trainieren eines Systems für maschinelles Lernen, MLS, unter Verwendung der gekennzeichneten Scan-Untersuchungen, um individuelle Scan-Untersuchungen auf einen entsprechenden SIC des SICD abzubilden;
    • - Ausführen wenigstens einer Verfeinerungsschleife, umfassend:
    • - Bestimmen einer zusätzlichen Menge von Scan-Untersuchungen aus der Grundmenge von Scan-Untersuchungen, BSSS, basierend auf einer Bewertungsmetrik;
    • - Erhalten von SIC-Kennzeichnungen für die Scan-Untersuchungen in der bestimmten Menge von Scan-Untersuchungen, um die Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu erweitern;
    • - erneutes Trainieren des Systems für maschinelles Lernen, MLS, unter Verwendung wenigstens der erweiterten Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS.
  • Es ist zu verstehen, dass das Verfahren gemäß dem zweiten Aspekt der vorliegenden Erfindung unter Verwendung der Einrichtung gemäß dem ersten Aspekt der vorliegenden Erfindung ausgeführt werden kann. Somit kann die Einrichtung basierend auf irgendeiner für das Verfahren beschriebenen Option, Modifikation, Variante oder Verfeinerung angepasst, verändert oder verfeinert werden, und umgekehrt.
  • Gemäß einem dritten Aspekt stellt die Erfindung ein Computerprogrammprodukt bereit, das ausführbaren Programmcode umfasst, der dazu ausgelegt ist, dann, wenn er ausgeführt wird, das Verfahren gemäß irgendeiner Ausführungsform des zweiten Aspekts der vorliegenden Erfindung auszuführen.
  • Gemäß einem vierten Aspekt stellt die Erfindung ein nicht-transientes computerlesbares Datenspeichermedium bereit, das ausführbaren Programmcode umfasst, der dazu ausgelegt ist, dann, wenn er ausgeführt wird, das Verfahren gemäß irgendeiner Ausführungsform des zweiten Aspekts der vorliegenden Erfindung auszuführen.
  • Das nicht-transiente computerlesbare Datenspeichermedium kann irgendeine Art von Computerspeicher, insbesondere einen Halbleiterspeicher wie z. B. einen Festkörperspeicher, umfassen oder daraus bestehen. Das Datenspeichermedium kann auch eine CD, eine DVD, eine Blu-Ray-Disc, ein USB-Speicherstick oder dergleichen umfassen oder daraus bestehen.
  • Gemäß einem fünften Aspekt stellt die Erfindung einen Datenstrom bereit, der Programmcode repräsentiert oder dazu ausgelegt ist, ihn bereitzustellen, der dazu ausgelegt ist, dann, wenn er ausgeführt wird, das Verfahren gemäß irgendeiner Ausführungsform des zweiten Aspekts der vorliegenden Erfindung auszuführen.
  • Gemäß einem sechsten Aspekt stellt die Erfindung eine Verwendung eines Systems für maschinelles Lernen, MLS, das unter Verwendung des Verfahrens gemäß irgendeiner Ausführungsform des zweiten Aspekts der vorliegenden Erfindung trainiert ist, zum Abbilden einer Scan-Untersuchung auf einen standardisierten Identifizierercode, SIC, insbesondere auf eine RadLex-ID, RPID, bereit.
  • Hier und im Folgenden sind für einige (insbesondere längere) Begriffe Abkürzungen verwendet (z. B. „CNN“ für „neuronales Faltungsnetz“). Üblicherweise werden die Begriffe gefolgt von den entsprechenden Abkürzungen angegeben. In einigen Fällen wird, um die Lesbarkeit zu verbessern, nur die Abkürzung verwendet, während in anderen Fällen nur der Begriff selbst verwendet wird.
  • Eine oder mehrere Funktionen, Verfahrensschritte oder Module können durch eine Cloud-Computing-Plattform implementiert sein oder ausgeführt werden. Bei Systemen, die auf der Cloud-Computing-Technologie basieren, ist eine große Anzahl von Vorrichtungen über das Internet mit einem Cloud-Computing-System verbunden. Die Geräte können sich in einer entfernten Anlage, die mit dem Cloud-Computing-System verbunden ist, befinden. Die Vorrichtungen können beispielsweise eine Ausrüstung, Sensoren, Aktoren, Roboter und/oder Maschinen in einer oder mehreren industriellen Anlage(n) umfassen oder daraus bestehen. Die Vorrichtungen können medizinische Vorrichtungen und Ausrüstungen in einer Einheit des Gesundheitswesens sein. Die Vorrichtungen können Haushaltsgeräte oder Bürogeräte in einem Wohn-/Gewerbebetrieb sein.
  • Das Cloud-Computing-System kann die Fernkonfiguration, -überwachung, -steuerung und -wartung verbundener Vorrichtungen (auch allgemein als ‚Anlagevermögen‘ bezeichnet) ermöglichen. Außerdem kann das Cloud-Computing-System das Speichern großer Datenmengen, die periodisch von den Vorrichtungen gesammelt werden, das Analysieren der großen Datenmengen und das Bereitstellen von Erkenntnissen (z. B. wichtige Leistungsindikatoren, Ausreißer) und Warnungen für Bediener, Außendiensttechniker oder Eigentümer der Vorrichtungen über eine grafische Benutzeroberfläche (z. B. von Webanwendungen) erleichtern. Die Erkenntnisse und Warnungen können das Steuern und Warten der Vorrichtungen ermöglichen, was zu einem effizienten und ausfallsicheren Betrieb der Vorrichtungen führt. Das Cloud-Computing-System kann auch das Modifizieren von Parametern, die den Geräten zugeordnet sind, ermöglichen und gibt Steuerbefehle über die grafische Benutzeroberfläche basierend auf den Erkenntnissen und Warnungen aus.
  • Das Cloud-Computing-System kann mehrere Server oder Prozessoren (auch als ‚Cloud-Infrastruktur‘ bezeichnet), die geografisch verteilt und über ein Netz miteinander verbunden sind, umfassen. Auf den Servern/Prozessoren ist eine dedizierte Plattform (nachstehend als ‚Cloud-Computing-Plattform‘ bezeichnet) installiert, die die vorstehend genannte Funktionalität als einen Dienst (nachstehend ‚Cloud-Dienst‘ bezeichnet) bereitstellt. Die Cloud-Computing-Plattform kann mehrere Softwareprogramme umfassen, die auf einem oder mehreren Servern oder Prozessoren des Cloud-Computing-Systems ausgeführt werden, um die Lieferung des angeforderten Dienstes für die Vorrichtungen und ihre Anwender zu ermöglichen.
  • Eine oder mehrere Anwendungsprogrammierschnittstellen (APIs) sind in dem Cloud-Computing-System eingesetzt, um verschiedene Cloud-Dienste für die Anwender zu liefern.
  • Zusätzliche vorteilhafte Verfeinerungen, Varianten und Optionen der und für die im Vorstehenden beschriebenen Ausführungsformen ergeben sich aus den abhängigen Ansprüchen sowie aus der folgenden Beschreibung zusammen mit den beigefügten Zeichnungen.
  • In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen der Einrichtung gemäß der vorliegenden Erfindung ist das Kennzeichnungsmodul als ein Mensch-Maschine-Interaktionsmodul (HMIM) ausgelegt, das dazu ausgelegt ist, einem Anwender als Kennzeichnungsaufgaben durch das Kennzeichnungsaufgabenbestimmungsmodul, LTDM, ausgewählte Scan-Untersuchungen unter Verwendung einer grafischen Benutzeroberfläche anzuzeigen und Kennzeichnungen für die ausgewählten und angezeigten Scan-Untersuchungen als Antworten des Anwenders auf die Kennzeichnungsaufgaben zu erhalten. Auf diese Weise wird eine geführte Mensch-Maschine-Interaktion bereitgestellt, die die Kennzeichnungsfähigkeiten des Anwenders auf effizienteste Weise nutzbar macht.
  • In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen umfasst das System für maschinelles Lernen, MLS, ein protokollbestimmendes künstliches neuronales Netz, PDANN, das dazu ausgelegt ist, für eine Scan-Untersuchung einen Protokollnamen, mit dem die Scan-Untersuchung bezeichnet werden kann, zu bestimmen, und wobei das System für maschinelles Lernen das PDANN umfasst. Der Protokollname ist eine (normalerweise geordnete) Liste von Token oder Unigrammen, d. h. von Wörtern und/oder Abkürzungen, die durch Buchstaben und/oder Zahlen ausgedrückt sind und zum Identifizieren oder Bezeichnen einer speziellen Scan-Folge, wie sie in einem Krankenhaus oder einer Forschungsinstitution ausgeführt wird, dienen. Da Scan-Untersuchungen (fast) immer mit Protokollnamen versehen sind, ist eine große Anzahl von Trainingsdaten zum Trainieren eines solchen PDANN vorhanden, ohne dass irgendwelche zusätzliche Schritte erforderlich sind.
  • In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen des Verfahrens gemäß der vorliegenden Erfindung werden die SIC-Kennzeichnungen erhalten, indem einem Anwender, vorzugsweise unter Verwendung einer grafischen Benutzeroberfläche, Kennzeichnungsaufgaben für die ausgewählten Scan-Untersuchungen präsentiert werden und die Eingaben des Anwenders als Kennzeichnungen für die ausgewählten Scan-Untersuchungen empfangen werden. Das stellt eine einfache und intuitive Art bereit, auf die der Anwender die Scan-Untersuchungen kennzeichnen kann. Das Präsentieren der Kennzeichnungsaufgaben kann es dem Anwender ermöglichen, alle Einzelheiten oder Merkmale der Scan-Untersuchungen zu betrachten, z. B. ihre Texteinträge, die mit dieser Scan-Untersuchung erhaltenen Bilder und/oder dergleichen.
  • In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen werden zum Trainieren des Systems für maschinelles Lernen, MLS, basierend auf Vektorisierungsoperationen, die an Scan-Untersuchungen des erweiterten TSLSS ausgeführt werden, zusätzliche virtuelle Scan-Untersuchungen oder Merkmale davon erzeugt. Wenigstens das abschließende Neu-Trainieren (z. B. ein Neu-Trainieren innerhalb einer abschließenden Verfeinerungsschleife) des Systems für maschinelles Lernen, MLS, wird unter Verwendung der erweiterten TSLSS und der zusätzlichen virtuellen Scan-Untersuchungen oder deren Merkmale ausgeführt. In Varianten, in denen die Erfüllung eines Abbruchkriteriums für die Verfeinerungsschleife vor dem Ausführen des Neu-Trainierens nicht bekannt ist, kann ein zusätzliches Neu-Trainieren nach der abschließenden Verfeinerungsschleife ausgeführt werden. In einigen Untervarianten werden während der Verfeinerungsschleife nur die tatsächlich gekennzeichneten Scan-Untersuchungen verwendet, und erst bei dem zusätzlichen Neu-Trainieren nach der abschließenden Verfeinerungsschleife werden die zusätzlichen virtuellen Scan-Untersuchungen oder deren Merkmale verwendet. In anderen Varianten, bei denen die Erfüllung des Abbruchkriteriums für die Verfeinerungsschleifen vor dem Neu-Trainieren bekannt ist (z. B. wenn eine feste Anzahl von Verfeinerungsschleifen erreicht ist), kann das abschließende Neu-Trainieren das Neu-Trainieren innerhalb der letzten Verfeinerungsschleife sein.
  • Merkmale virtueller Scan-Untersuchungen können so verstanden werden, dass sie sich auf die Werte von Knoten wenigstens einer verdeckten Schicht eines Teils des Systems für maschinelles Lernen, MLS, beziehen. Somit kann keine tatsächliche Scan-Untersuchung vorhanden sein, die in das MLS eingefügt ist, vorhanden sein, jedoch besitzt das Bereitstellen von Werten für die wenigstens eine verdeckte Schicht für das MLS die gleiche Wirkung, als ob eine Scan-Untersuchung eingegeben worden wäre. Somit können Merkmale einer virtuellen Scan-Untersuchung bereitgestellt werden, ohne dass eine virtuelle Scan-Untersuchung selbst bereitgestellt wird.
  • In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen werden zusätzliche virtuelle Scan-Untersuchungen durch Hinzufügen von Rauschen zu Scan-Untersuchungen, für die Kennzeichnungen erhalten worden sind, erzeugt. Das Rauschen kann beispielsweise in Form zusätzlicher Unigramme hinzugefügt werden, die der Liste von Unigrammen der Scan-Untersuchung hinzugefügt werden. In diesem Fall ist es vorzuziehen, dass Wörter hinzugefügt werden, für die bestimmt worden ist, dass sie eine vergleichsweise geringe Auswirkung auf das Abbilden der Scan-Untersuchungen besitzen. Als eine Alternative kann das Rauschen als numerisches Rauschen zu Merkmalen einer verdeckten Schicht eines Teils des Systems für maschinelles Lernen, MLS, hinzugefügt werden. Wenigstens das abschließende Neu-Trainieren (z. B. ein Neu-Trainieren innerhalb einer abschließenden Verfeinerungsschleife) des Systems für maschinelles Lernen, MLS, wird unter Verwendung der erweiterten TSLSS und deren zusätzlichen virtuellen Scan-Untersuchungen ausgeführt. Optionen und Varianten hinsichtlich des abschließenden Neu-Trainierens sind im Vorstehenden beschrieben worden.
  • In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen umfasst das Verfahren das Erzeugen von Repräsentationen für die SICs basierend auf gewichteten Unigrammen. Unter anderen Verwendungen ermöglicht das das Bestimmen der Wichtigkeit von Unigrammen für die Repräsentationen, was wiederum zum Bestimmen einer Bewertungsmetrik (oder eines Auswahlkriteriums) zum Auswählen der zu kennzeichnenden Aufgaben verwendet werden kann.
  • In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen werden die erzeugten Repräsentationen für die SICs wenigstens einmal basierend auf den erhaltenen SIC-Kennzeichnungen aktualisiert.
  • In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen werden die Repräsentationen für die SICs aktualisiert, indem die Gewichte der gewichteten Unigramme innerhalb der Repräsentationen basierend auf einer Bestimmung, wie groß die Auswirkungen einer Hinzufügung und/oder Löschung jedes Unigramms für die Entscheidung darüber sind, ob eine spezifische Scan-Untersuchung in einen speziellen SIC klassifiziert wird, geändert werden.
  • In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen umfasst das System für maschinelles Lernen, MLS, ein protokollbestimmendes künstliches neuronales Netz (PDANN), das dazu ausgebildet ist, für eine Scan-Untersuchung einen Protokollnamen, mit dem die Scanstudie bezeichnet werden kann, zu bestimmen, und wobei das Abbilden der Scan-Untersuchung auf den SIC durch das MLS teilweise und wenigstens indirekt auf der Ausgabe des PDANN basierend auf der Scan-Untersuchung basiert.
  • In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen, bei denen die Verfeinerungsschleife iteriert wird, bis ein Abbruchkriterium erfüllt ist, wobei das Abbruchkriterium eines der oder alle folgenden Kriterien umfassen kann:
    • - eine im Voraus definierte Anzahl von Kennzeichnungen ist erhalten worden;
    • - eine im Voraus definierte Anzahl von Iterationen ist ausgeführt worden; und/oder
    • - die Leistung des neu trainierten Systems für maschinelles Lernen, MLS, verbessert sich oberhalb eines speziellen Schwellenwerts nicht mehr signifikant oder bleibt nach einem speziellen Schwellenwert konstant.
  • Die Erfindung wird unter Bezugnahme auf beispielhafte Ausführungsformen, die in den beigefügten Zeichnungen abgebildet sind, näher erläutert.
  • Die begleitenden Zeichnungen sind aufgenommen, um ein besseres Verständnis der vorliegenden Erfindung bereitzustellen, und sind in diese Spezifikation integriert und bilden einen Teil davon. Die Zeichnungen stellen die Ausführungsformen der vorliegenden Erfindung dar und dienen zusammen mit der Beschreibung dazu, die Prinzipien der Erfindung zu erläutern. Andere Ausführungsformen der vorliegenden Erfindung und viele der beabsichtigten Vorteile der vorliegenden Erfindung sind leicht zu erkennen, wenn sie unter Bezugnahme auf die folgende ausführliche Beschreibung besser verstanden werden. Die Elemente der Zeichnungen sind in Bezug aufeinander nicht notwendigerweise maßstabsgerecht. Gleiche Bezugszeichen bezeichnen entsprechende ähnliche Teile.
  • In den Figuren zeigen:
    • 1 ein schematisches Blockdiagramm, das eine Einrichtung gemäß einer Ausführungsform des ersten Aspekts der vorliegenden Erfindung darstellt;
    • 2 ein schematisches Ablaufdiagramm, das ein Verfahren gemäß einer Ausführungsform des zweiten Aspekts der vorliegenden Erfindung darstellt;
    • 3 ein schematisches Blockdiagramm, das ein Computerprogrammprodukt gemäß einer Ausführungsform des dritten Aspekts der vorliegenden Erfindung darstellt; und
    • 4 ein schematisches Blockdiagramm, das ein Datenspeichermedium gemäß einer Ausführungsform des vierten Aspekts der vorliegenden Erfindung darstellt.
  • Genaue Beschreibung der Erfindung
  • Obwohl hier spezifische Ausführungsformen dargestellt und beschrieben worden sind, werden normale Fachleute erkennen, dass die gezeigten und beschriebenen spezifischen Ausführungsformen durch eine Vielzahl alternativer und/oder äquivalenter Implementierungen ersetzt werden können, ohne von dem Schutzbereich der vorliegenden Erfindung abzuweichen. Im Allgemeinen soll diese Anmeldung alle Anpassungen oder Variationen der hier diskutierten spezifischen Ausführungsformen abdecken.
  • 1 zeigt ein schematisches Blockdiagramm, das eine Ausführungsform des ersten Aspekts der vorliegenden Erfindung darstellt, d. h. eine Einrichtung 1000 zum Trainieren eines Systems für maschinelles Lernen, MLS 200, zum Abbilden einer Scan-Untersuchung 71 auf einen standardisierten Identifizierercode, SIC, eines Wörterbuchs für standardisierte Identifizierercodes, SICD. Zur Veranschaulichung werden das RadLex Playbook und seine RPIDs verwendet. Es ist jedoch zu verstehen, dass alternativ auch irgendein anderes SICD verwendet werden kann.
  • Bei der Beschreibung der Einrichtung 1000 von 1 wird gleichzeitig auch ein Verfahren gemäß einer Ausführungsform des zweiten Aspekts der vorliegenden Erfindung mit Bezug auf 2 beschrieben. Es ist zu verstehen, dass das Verfahren gemäß 2 unter Verwendung der Einrichtung 1000 gemäß 1 ausgeführt werden kann. Somit kann die Einrichtung 1000 basierend auf irgendeiner für das Verfahren beschriebenen Option, Modifikation, Variante oder Verfeinerung angepasst, verändert oder verfeinert werden, und umgekehrt.
  • 2 zeigt ein schematisches Ablaufdiagramm, das ein Verfahren gemäß einer Ausführungsform des zweiten Aspekts der vorliegenden Erfindung darstellt, d. h. ein Verfahren zum Trainieren eines Systems für maschinelles Lernen, MLS 200, zum Abbilden einer Scan-Untersuchung 71 auf einen standardisierten Identifizierercode, SIC, eines Wörterbuchs für standardisierte Identifizierercodes, SICD. Obwohl das Verfahren von 2 zusammen mit der Einrichtung 1000 von 1 beschrieben wird, ist zu verstehen, dass das Verfahren von 2 nicht darauf beschränkt ist, unter Verwendung der Einrichtung 1000 ausgeführt zu werden, obwohl dies eine bevorzugte Variante ist.
  • Die Einrichtung 1000 umfasst eine Eingabeschnittstelle 1100, die dazu ausgelegt ist, eine Grundmenge von Scan-Untersuchungen, BSSS 71, zu erhalten. Einige der Scan-Untersuchungen aus der Grundmenge von Scan-Untersuchungen, BSSS 71, können gekennzeichnet sein, obwohl für das vorliegende Beispiel angenommen wird, dass alle Scan-Untersuchungen nicht gekennzeichnet sind. In dem vorliegenden Kontext ist gekennzeichnet so zu verstehen, dass es bedeutet, dass die Scan-Untersuchung korrekt auf einen SIC abgebildet worden ist, beispielsweise eine RadLex-Playbook-ID, RPID. Für die vorliegende Diskussion wird angenommen, dass eine Anzahl von NM Scan-Untersuchungen in der Grundmenge von Scan-Untersuchungen, BSSS 71, enthalten ist, und die individuellen Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS 71, werden manchmal durch sm bezeichnet, wobei der Index m von 1 bis NM läuft.
  • Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1100 zum Erhalten der Grundmenge von Scan-Untersuchungen, BSSS 71, z. B. unter Verwendung der Eingabeschnittstelle 1100, umfassen.
  • Die Einrichtung 1000 umfasst ferner eine Berechnungsvorrichtung 1500. Die Berechnungsvorrichtung 1500 kann ein Vorverarbeitungsmodul 1501 implementieren, das dazu ausgelegt ist, Extrahieren und/oder Bereinigen von über die Eingabeschnittstelle 1100 erhaltenen oder empfangenen Daten, insbesondere der Grundmenge von Scan-Untersuchungen, BSSS 71, auszuführen.
  • Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1501 zum Vorverarbeiten der in Schritt S1100 erhaltenen Grundmenge von Scan-Untersuchungen, BSSS 71, umfassen.
  • Die Scan-Untersuchungen können als Tupel (x, y, z) repräsentiert sein, wobei x ein Untervektor ist, der aus einer Liste von Merkmalen besteht, y ein Protokollname ist, der ein Protokoll, mit dem die Scan-Untersuchung ausgeführt worden ist, gemäß den Merkmalen x angibt, und z die in der Scan-Untersuchung erfassten Bilddaten sind. Die Merkmale x können beispielsweise Folgendes umfassen:
    • - eine Beschreibung der Untersuchung
    • - eine Beschreibung der Reihe
    • - ein maximales Dosis-Länge-Produkt, maxDLP
    • - maxCTDIVolume
    • - eine Untersuchungslänge
    • - und/oder dergleichen.
  • Die Untersuchungslänge sc kann aus anderen Merkmalen, insbesondere aus maxDLP und maxCTDIVolume, abgeleitet werden durch: sc = ( maxDLP/maxCTDIVolume ) * 100
    Figure DE102021210920A1_0001
  • Das Protokoll ist in dem vorliegenden Kontext eine Menge von Regeln, die definiert sind, um eine Bilderfassungsprozedur zum Erfassen einer Scan-Untersuchung auszuführen. Der Protokollname ist eine (normalerweise geordnete) Liste von Token oder Unigrammen, d. h. von Wörtern und/oder Abkürzungen, die durch Buchstaben und/oder Zahlen ausgedrückt sind. Aus den Protokollnamen (und optional zusätzlich anderen Textfeldern der Scan-Untersuchungs-Merkmale x) aller Scan-Untersuchungen aus der Grundmenge von Scan-Untersuchungen, BSSS 71, kann ein Vokabular erzeugt werden. Das Vokabular kann dann mit Techniken zur Verarbeitung natürlicher Sprache, NLP-Techniken, wie z. B. Worteinbettungen und dergleichen, bearbeitet werden.
  • Der Protokollname ist normalerweise spezifisch für Hersteller von Scan-Vorrichtungen und/oder für Anwender wie z. B. Krankenhäuser oder Forschungsinstitutionen. Der Protokollname enthält üblicherweise ein Token oder ein Wort, das einen Körperbereich spezifiziert (z. B. „Abdomen“), obwohl unterschiedliche Hersteller oder Anwender die gleichen (oder teilweise überlappenden) Körperbereiche gleich oder unterschiedlich bezeichnen können. Beispielsweise kann die im Wesentlichen gleiche Körperregion in einem durch einen Hersteller A verwendeten Protokollschema als „Kopf“ bezeichnet sein und in einem weiteren durch einen Hersteller B verwendeten Protokollschema als „Gehirn“ bezeichnet sein. Als ein weiteres Beispiel kann selbst innerhalb einer Institution ein Anwender (z. B. ein Arzt oder ein technischer Assistent) die Bezeichnung „Kopf“ verwenden, und der andere kann die Bezeichnung „Gehirn“ verwenden. Jeder Hersteller kann für dieselbe Körperregion mehrere Protokolle für denselben Typ von Untersuchung verwenden, die sich gemäß dem Alter des Patienten unterscheiden, wobei zwischen verschiedenen Herstellern A, B unterschiedliche Altersgruppen definiert sein können.
  • Der Protokollname kann auch ein Token enthalten, das einen Typ des ausgeführten Scans angibt, und er kann optional zusätzliche Token enthalten, die beispielsweise angeben, ob optionale zusätzliche Maßnahmen ergriffen worden sind oder nicht. Beispielsweise kann das Protokoll eine Angabe enthalten, dass ein Kontrastmittel verabreicht worden ist oder nicht verabreicht worden ist.
  • Die Berechnungsvorrichtung 1500 ist ferner dazu ausgelegt, ein Clustering-Modul 1510 zu implementieren. Der allgemeine Zweck des Clustering-Moduls 1510 ist das Clustern der Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS 71, mit der Absicht, später so weit wie möglich die Cluster mit SICs des SICD zu identifizieren.
  • Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1510 zum Clustern der Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS 71, umfassen, wie im Folgenden auf der Basis einer Anzahl von Teilschritten des Schritts S1510 beschrieben wird. Alle Funktionen, die als Teil der Funktion des Clustering-Moduls 1510 beschrieben sind, können auch so verstanden werden, dass sie als Teil oder als Teilschritte von Schritt S1510 ausgeführt werden.
  • Das Clustering-Modul 1510 kann ein protokollbestimmendes künstliches neuronales Netz, PDANN 1511 (oder insbesondere: ein protokollnamenbestimmendes künstliches neuronales Netz, PNDANN) umfassen, das vorzugsweise in Form eines neuronalen Faltungsnetzes, CNN, bereitgestellt ist. Das PDANN 1511 kann dazu ausgelegt sein, als Eingabe wenigstens einen Teil der Merkmale x jeder Untersuchung sm sm = (xm, ym, zm) zu empfangen. Beispielsweise können Teile von x, von denen bekannt ist, dass sie für die vorliegende Aufgabe keine Bedeutung haben (z. B. Zeitstempel), nicht Teil der Eingabe sein.
  • Die Eingabe kann optional auch die Bilddaten z und ebenfalls optional Daten aus Bildanalysewerkzeugen, die eine Analyse der Bilddaten z ausgeführt haben, umfassen.
  • Für die Eingabe des PDANN 1511 können alle Unigramme, die in den Merkmalen x vorhanden sind, in ein Datenfeld zusammen gruppiert werden, und der Textinhalt jeder Scan-Untersuchung kann dann durch einen Vektor V mit so vielen Einträgen , wie das Vokabular Unigramme aufweist, repräsentiert sein, wobei jeder Eintrag die Anzahl der Unigramme innerhalb der Scan-Untersuchung sm = (xm, ym, zm), die diesem Vektor zugeordnet ist, angibt. Übliche Zählvektorisierertechniken, die sich mit zu häufigen oder zu unbestimmten Wörtern befassen, können angewandt werden. Alle Vektoren V können verwendet werden, um eine NM × NV-dimensionale Matrix zu bilden, wobei die Anzahl der Scan-Untersuchungen und NV die Anzahl der Unigramme im Vokabular sind. Der Vektor V(sm) kann als ein „Textvektor einer Scan-Untersuchung“ bezeichnet sein, da der Vektor V(sm) den in der Scan-Untersuchung sm = (xm, ym, zm) enthaltenen Text beschreibt. Die Matrix mit den Einträgen Tij, die jeweils durch den j-ten Eintrag des Textvektors V(si)j der i-ten Scan-Untersuchung si gegeben sind, kann als die Textmatrix des BSSS 71 bezeichnet sein.
  • Das PDANN 1511 ist ferner dazu ausgelegt, basierend auf seiner Eingabe einen Vektor U auszugeben, der angibt, mit welcher Wahrscheinlichkeit die Eingabe welchem Protokoll (oder genauer: welchem Protokollnamen) zuzuordnen ist (oder: für ihn zu klassifizieren ist). Dieser Vektor U kann als ein Protokollklassifizierungsvektor, PCV, bezeichnet sein.
  • Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1511 zum Erzeugen unter Verwendung eines PDANN 1511 eines Vektors U, der angibt, mit welcher Wahrscheinlichkeit die Eingabe dem Protokollnamen zuzuordnen ist (oder: für ihn zu klassifizieren ist), umfassen. Wieder kann eine Matrix A erzeugt werden, deren Einträge Aij durch den i-ten Eintrag des Vektors Ui für die i-te Scan-Untersuchung sj gegeben sind. Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1511 zum Erzeugen unter Verwendung eines protokollbestimmenden künstlichen neuronalen Netzes, PDANN 1511, eines Vektors U, der angibt, mit welcher Wahrscheinlichkeit die Eingabe welchem Protokollnamen aus einer Liste verfügbarer Protokollnamen zuzuordnen ist (oder: für ihn zu klassifizieren ist), wobei die Eingabe des PDANN 1511 auf einer der Scan-Untersuchungen sm basiert, so dass der ausgegebene Vektor U angibt, für welchen Protokollnamen die entsprechende Scan-Untersuchung sm klassifiziert werden sollte.
  • Idealerweise kann eine Liste verfügbarer Protokolle in einem Speicher 1502 der Berechnungsvorrichtung 1500 gespeichert sein, wobei jedem Protokoll eine Ganzzahl zugeordnet ist. Diese Ganzzahl kann einem Index (d. h. einem Eintrag) des ausgegebenen Protokollklassifizierungsvektors U des protokollbestimmenden künstlichen neuronalen Netzes, PDANN 1511, der unter Verwendung einer Softmax-Aktivierungsfunktion in der letzten Schicht erzeugt werden kann, entsprechen. Somit wird der ausgegebene Protokollklassifizierungsvektor U so viele Indizes aufweisen, wie verfügbare Protokolle in der Liste der verfügbaren Protokolle vorhanden sind. Der ausgegebene Protokollklassifizierungsvektor U wird in jedem Eintrag mit dem Index i eine reelle Zahl Pi aufweisen, die die Wahrscheinlichkeit angibt, dass die durch das PDANN 1511 zum Erzeugen des ausgegebenen Vektors U verwendete Eingabe dem durch die Ganzzahl i charakterisierten Protokoll zugeordnet werden sollte, wobei aufgrund der Softmax-Aktivierungsfunktion ΣiPi=1 ist.
  • Das protokollbestimmende künstliche neuronale Netz, PDANN 1511, wird vorzugsweise unter Verwendung des Protokollnamens y der Scan-Untersuchungen sm als Kennzeichnungen trainiert. Der Zweck dahinter ist das Trainieren des PDANN 1511, um zu erkennen, welche Unigramme und Merkmale sich am besten zum Bestimmen des Protokollnamens einer Scan-Untersuchung eignen. Basierend auf diesen Informationen kann abgeleitet werden, welche Unigramme am wichtigsten sind oder am meisten zu der Entscheidung, dass eine spezielle Scan-Untersuchung zu einer speziellen Körperregion gehört, beitragen.
  • Das Verfahren gemäß der vorliegenden Erfindung kann deshalb auch einen Schritt zum Trainieren des PDANN 1511 auf diese Weise umfassen.
  • Die Berechnungsvorrichtung 1500 ist ferner dazu ausgelegt, ein Protokollrepräsentationsbestimmungsmodul, PRDAM 1512, zu implementieren. Das PRDAM 1512 ist dazu ausgelegt, basierend auf der Grundmenge von Scan-Untersuchungen, BSSS 71, eine Repräsentation für jedes Protokoll zu bestimmen.
  • Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1512 zum Bestimmen einer Repräsentation für jedes Protokoll basierend auf der Grundmenge von Scan-Untersuchungen, BSSS 71, umfassen.
  • Die Repräsentation ist vorzugsweise eine gewichtete Summe von Unigrammen. Beispielsweise kann die Repräsentation eines speziellen Protokolls für jedes Unigramm in dem Vokabular angeben, wie groß der Einfluss dieses Unigramm auf die Entscheidung des PDANN 1511 ist, die Scan-Untersuchung für dieses Protokoll zu klassifizieren.
  • Die Repräsentation B1 für jedes Protokoll 1 kann auf folgende Weise bestimmt werden:
    • Das protokollbestimmende künstliche neuronale Netz, PDANN 1511, ist trainiert worden, wie vorstehend beschrieben, jede der Scan-Untersuchungen unter Verwendung des Protokollklassifizierungsvektors U in ein Protokoll zu klassifizieren. Das Protokollrepräsentationsbestimmungsmodul,
    • PRDAM 1512, ist dazu ausgelegt, die Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS 71, zu modifizieren und basierend auf den Änderungen, die dies an der Ausgabe des protokollbestimmenden künstlichen neuronalen Netzes, PDANN 1511, bewirkt, die Repräsentation jedes Protokolls zu bestimmen.
  • Eine bevorzugte Implementierung dieser Prozedur wird zunächst an Hand einer einzelnen Scan-Untersuchung beschrieben. Es ist angenommen, dass die Scan-Untersuchung einen Text, der aus den Unigrammen (u1, u2, u3, u4) besteht, umfasst. Mit anderen Worten wird der Textvektor V(sm) der Scan-Untersuchung sm ganzzahlige Einträge ungleich Null bei den Indizes, die u1, u2, u3 und u4 entsprechen, aufweisen. Das PRDAM 1512 führt einen oder beide der folgenden zwei Schritte aus (die auch in dem Verfahren gemäß der vorliegenden Erfindung enthalten sein können):
    1. a) Hinzufügen zu diesem ursprünglichen Textvektor V(sm) einzelner zusätzlicher Unigramme ui, die in dem ursprünglichen Textvektor V nicht vorhanden sind, um einen geänderten Textvektor V+ (sm, ui) zu erzeugen;
    2. b) Entfernen aus diesem ursprünglichen Textvektor V einzelner Unigramme uj, die Teil des ursprünglichen Textvektors V sind, um einen geänderten Textvektor V- (sm,uj) zu erzeugen.
  • Das Hinzufügen eines Unigramms ui kann durch Einstellen des Eintrags mit dem Index i in dem ursprünglichen Textvektor V auf „1“ erfolgen, und das Entfernen eines Unigramms uj kann durch Einstellen des Eintrags mit dem Index j in dem ursprünglichen Textvektor V auf „0“ erfolgen.
  • Falls beide Schritte a) und b) ausgeführt werden, bedeutet das, dass für jedes Unigramm im Vokabular ein geänderter Textvektor erzeugt wird: die V+ (sm, ui) behandeln die Unigramme, die nicht Teil des ursprünglichen Textvektors V sind, und die V-(sm,uj) behandeln die Unigramme, die Teil des ursprünglichen Textvektors V sind.
  • Die geänderten Textvektoren V+ (sm, ui) und/oder V- (sm,uj) werden dann nacheinander in das Protokollrepräsentationsbestimmungsmodul, PRDAM 1512, eingegeben, und der entsprechende geänderte Protokollklassifizierungsvektor U (V+ (sm, uj)), U (V-(sm,uj)) wird erzeugt und mit dem ursprünglichen Protokollklassifizierungsvektor U (V) des ursprünglichen Textvektors verglichen.
  • Für die Scan-Untersuchung und jedes Protokoll 1 wird die Differenz der Wahrscheinlichkeit P1 zwischen dem ursprünglichen Protokollklassifizierungsvektor U(V) und dem geänderten Protokollklassifizierungsvektor U (V+ (sm, ui) U (V- (sm,uj)) berechnet: δ P 1 ( m , u i ) : = U ( V + ( s m , u i ) ) 1 U ( V ( s m ) ) 1 ,
    Figure DE102021210920A1_0002
    δ P 1 ( m , u j ) : = U ( V ( s m , u j ) ) 1 U ( V ( s m ) ) 1 ,
    Figure DE102021210920A1_0003
    wobei ":=" eine Definition bezeichnet und U(V)1 der 1-te Eintrag (d. h. Eintrag mit dem Index 1) des Protokollklassifizierungsvektors U ist und U (V+ (sm,ui))1 der 1-te Eintrag des geänderten Protokollklassifizierungsvektors U (V+ (sm, ui)) ist. Es sei daran erinnert, dass der 1-te Eintrag U(V)1 des Protokollklassifizierungsvektors die Wahrscheinlichkeit P1 ist, dass das Protokoll 1 die optimale Beschreibung für eine bestimmte Scan-Untersuchung ist.
  • Mit anderen Worten ist δP1(m,ui) ein Maß dafür, wie stark das Unigramm ui die Wahrscheinlichkeit dafür, dass die Scan-Untersuchung mit dem Index m mit dem Protokoll 1 klassifiziert wird, beeinflusst.
  • Eine anfängliche Repräsentation jedes Protokolls 1 kann dann durch Nehmen der gewichteten Summe über jedes Unigramm erzeugt werden, wobei jedes Unigramm mit der Gesamtheit der δP1(m,ui) für alle Scan-Untersuchungen m normalisiert durch NM gewichtet wird. Wenn NL Protokolle in der Liste verfügbarer Protokolle vorhanden sind und jede Repräsentation eines Protokolls mit B1, 1 im Bereich von 1 bis NL, bezeichnet ist, dann: B 1 = i = 1 N V u i m = 1 N M δ P l ( m , u i ) N M
    Figure DE102021210920A1_0004
  • Diese Prozedur führt dazu, dass die Repräsentationen der Protokolle dadurch charakterisiert sind, wie groß der Einfluss der einzelnen Unigramme für das Protokoll ist, mit anderen Worten wie charakteristisch sie sind. Zum Beispiel kann ein Protokoll 1, das sich auf einen Scan eines Kopfes bezieht, in seiner Repräsentation B1 vergleichsweise höhere Gewichtungen für Unigramme wie „Kopf“, „Gehirn“ usw. und vergleichsweise niedrigere Gewichtungen für Unigramme wie „Brust“, „Abdomen“ oder dergleichen aufweisen. Als Nebenbemerkung sind hier, obwohl im Bereich des maschinellen Lernens in vielen Programmiersprachen (z. B. Python - eingetragenes Warenzeichen) Vektoren und Listen häufig mit dem Index „0“ beginnen, die Erläuterungen unter Verwendung von Listen im Bereich von 1...N gegeben. Bei einer Implementierung unter Verwendung von Python würde eine solche Liste mit einem Vektor mit N Einträgen, beginnend mit Eintrag 0 bis zu Eintrag N-1, implementiert, was für die Zwecke der Erläuterung als weniger deutlich erachtet wird.
  • Die Berechnungsvorrichtung 1500 ist ferner dazu ausgelegt, ein Clustering-Algorithmusausführungsmodul, CAEM 1513, des Clustering-Moduls 1510 zu implementieren. Das Clustering-Algorithmusausführungsmodul, CAEM 1513, ist dazu ausgelegt, einen k-Means-Algorithmus einzusetzen, um die Scan-Untersuchungen, die auch als Datensätze bezeichnet sein können, zu clustern. Die Anzahl NC der gesuchten Cluster kann durch die Anzahl der SICs in dem SICD gegeben sein (z. B. durch die Anzahl der RadLex-IDs für Körperregionen) oder sie kann (vorzugsweise dynamisch) durch einen Optimierungsalgorithmus, z. B. das Ellbogenverfahren, bestimmt werden. Das Ellbogenverfahren versucht, eine Abflachung oder einen „Ellbogen“ in einem Graphen zu finden, der die Verzerrung (Summe der quadrierten Fehler, SSE) als eine Funktion der Anzahl der Cluster repräsentiert.
  • Die Scan-Untersuchungen sm können gemäß irgendwelcher oder allen ihrer Merkmalen oder Eigenschaften geclustert werden. Als ein vorteilhaftes Beispiel können die Scan-Untersuchungen sm basierend auf (z.B. nur) ihren Textvektoren V(sm), die üblicherweise dünn besetzt sind, geclustert werden. Somit kann jede Scan-Untersuchung durch einen Punkt in einem Nv-dimensionalen Raum repräsentiert sein, und der Clustering-Algorithmus kann versuchen, diese Punkte in Cluster zu gruppieren.
  • Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1513 zum Einsetzen eines k-Means-Algorithmus, um die Scan-Untersuchungen zu clustern, d. h. die Scan-Untersuchungen in NC Cluster zu klassifizieren, umfassen. Jeder Cluster wird mit einer Ganzzahl c im Bereich von 1 bis NC identifiziert. Die Abstände werden als Abstände jedes untersuchten Punktes von einem entsprechenden Schwerpunkt (Mitte des Clusters) definiert, wobei der Schwerpunkt die mittlere Position aller Punkte in einem Cluster ist.
  • Als ein Ergebnis des Clustering-Algorithmusausführungsmoduls, CAEM 1513, oder analog des Schritts S1513, wird nun die Grundmenge von Scan-Untersuchungen, BSSS 71, in NC Cluster geclustert. So kann jede Scan-Untersuchung durch zwei zusätzliche Merkmale ergänzt werden:
    • 1) seine Clusternummer c gemäß dem Clustering (die Clusternummer c entspricht in diesem Fall einer RPID)
    • 2) der Abstand des Punktes, der die Scan-Untersuchung bezeichnet (oder: spezifiziert, oder: definiert), zu dem Schwerpunktpunkt seines Clusters c.
  • An diesem Punkt kann, wenn alle Scan-Untersuchungen in einen der Cluster klassifiziert sind, der aktive Lernansatz beginnen.
  • Die Berechnungsvorrichtung 1500 ist ferner dazu ausgelegt, ein Modul für aktives Lernen 1520 zu implementieren. Das Modul für aktives Lernen 1520 ist dazu ausgelegt, ein System für maschinelles Lernen, MLS 1530, zu trainieren, um Scan-Untersuchungen auf die RPIDs abzubilden. Das System für maschinelles Lernen, MLS 1530, kann das protokollbestimmende künstliche neuronale Netz, PDANN 1511, (das ein spezifisches neuronales Faltungsnetz CNN ist) und einen Klassifizierer 1531, der in der Pipeline des MLS 1530 hinter dem PDANN 511 angeordnet ist, umfassen oder daraus bestehen.
  • Das Trainieren des MLS 1530 kann insbesondere das Trainieren des Klassifizierers 1531 umfassen oder daraus bestehen. Das MLS 1530 kann andere Module oder mathematische Entitäten umfassen, wie im Vorstehenden beschrieben, die als Eingabe für den Klassifizierer 1531 verwendet werden können und/oder die zum Erzeugen von Eingaben für den Klassifizierer 1531 verwendet werden können. Beispielsweise kann das MLS 1530 eine Entität basierend auf den Repräsentationen der Protokolle oder der SICs umfassen, wie z. B. eine Matrix, die durch Verwenden jeder Repräsentation als eine Spalte (oder jeder als eine Zeile) gebildet ist. Jeder Teil des MLS 1530 kann durch das Modul für aktives Lernen 1520 trainiert werden oder nicht.
  • Um das System für maschinelles Lernen, MLS 1530, zu trainieren, wird eine vergleichsweise kleine Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, vorbereitet, die über mehrere Verfeinerungsschleifen für das aktive Lernen des Systems für maschinelles Lernen, MLS 1530, erweitert wird. Einer der Hauptgedanken ist, dass die TSLSS spezifisch und selektiv durch solche gekennzeichneten Scan-Untersuchungen erweitert wird, die als besonders hilfreich für (oder: mit dem größten Einfluss auf) das Verbessern des MLS 1530 erachtet werden.
  • Die Trainingsmenge gekennzeichneter Scan-Untersuchungen wird erzeugt und erweitert, indem einem Anwender (z. B. einem Arzt) Kennzeichnungsaufgaben zum Kennzeichnen einer Auswahl von Scan-Untersuchungen präsentiert werden, und um als Antwort auf die Aufgaben die Auswahl zusammen mit SIC-Kennzeichnungen für jede darin enthaltene Scan-Untersuchung zu erhalten. In der Fachsprache des aktiven Lernens kann der Anwender in dieser Prozedur als ein „Orakel“ bezeichnet sein.
  • Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1520 zum Trainieren eines Systems für maschinelles Lernen, MLS 1530, umfassen.
  • Das Modul für aktives Lernen 1520 kann ein Kennzeichnungsaufgabenbestimmungsmodul, LTDM 1521, umfassen, das dazu ausgelegt ist, - anfangs - zufällig eine Scan-Untersuchung aus jedem der durch das Clustering-Modul 1510 bestimmten Cluster auszuwählen, um eine Auswahl von NC zu kennzeichnenden Scan-Untersuchungen zu erzeugen.
  • Das Kennzeichnungsmodul 1520 kann ferner ein Kennzeichnungsmodell, das dazu ausgelegt ist, Kennzeichnungen für die Auswahl von NC zu kennzeichnenden Scan-Untersuchungen zu erhalten, umfassen. Da es bevorzugt ist, dass die Kennzeichnungen von einem menschlichen Anwender erhalten werden, ist das Kennzeichnungsmodul hier auch als Mensch-Maschine-Interaktionsmodul, HMIM 1522, bezeichnet, das mit einer Benutzeroberfläche, vorzugsweise einer grafischen Benutzeroberfläche, GUI, die durch eine Anzeigevorrichtung 1600 implementiert ist, betriebstechnisch verbunden ist. Das HMIM 1522 ist dazu ausgelegt, einem Anwender unter Verwendung der GUI Kennzeichnungsaufgaben zu präsentieren und unter Verwendung der GUI eine Antwort des Anwenders auf die Kennzeichnungsaufgaben (d. h. die Kennzeichnungen) zu empfangen. Scan-Untersuchungen, die mit einer Kennzeichnung ausgestattet worden sind, sind im Folgenden als sm L bezeichnet. Die Anzeigevorrichtung 1600 kann Teil der Einrichtung 1000 sein oder nicht. Die Präsentation der Kennzeichnungsaufgaben (und die Antwort darauf) kann in Echtzeit oder zeitverzögert stattfinden.
  • Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1521 umfassen, in dem aus jedem der durch den Clustering-Schritt S1510 bestimmten Cluster eine Scan-Untersuchung in der Reihenfolge zufällig ausgewählt wird, um eine Auswahl von NC zu kennzeichnenden Scan-Untersuchungen zu erzeugen.
  • Die Anzeigevorrichtung 1600 kann beispielsweise ein Monitor, ein berührungssensitiver Bildschirm, ein System für virtuelle Realität, ein System für erweiterte Realität, ein holografisches System, ein Projektor oder dergleichen sein.
  • In einem Schritt S1522 wird die Kennzeichnungsaufgabe mit der Auswahl der zu kennzeichnenden Scan-Untersuchungen einem Anwender präsentiert, vorzugsweise unter Verwendung einer grafischen Benutzeroberfläche, die durch eine Anzeigevorrichtung 1600 implementiert ist.
  • In einem Schritt S1523 wird die Antwort des Anwenders auf die Kennzeichnungsaufgaben, d. h. die Kennzeichnungen für die Scan-Untersuchungen in der Auswahl der Scan-Untersuchungen, empfangen, vorzugsweise wieder über die grafische Benutzeroberfläche, GUI.
  • Diese anfänglich gekennzeichneten Scan-Untersuchungen sm L, die durch das Kennzeichnungsmodul 1520 (oder durch den Schritt S1520) erhalten werden, bilden den ersten Teil einer Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS. Diese anfängliche TSLSS wird in weiteren Schritten erweitert. In der jetzigen Stufe wird in einem Schritt S1524 das System für maschinelles Lernen, MLS 1530, unter Verwendung der aktuellen TSLSS trainiert.
  • Somit ist die Berechnungsvorrichtung 1500 dazu ausgelegt, ein Trainingsmodul für ein System für maschinelles Lernen, MLSTM 1523, das dazu ausgelegt ist, das System für maschinelles Lernen, MLS 1530, auf der aktuellen Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu trainieren, zu implementieren. Ein weiteres Ergebnis ist, dass nun als eine erste Näherung alle Scan-Untersuchungen zu demselben Cluster gehören, da angenommen werden kann, dass jede der anfangs gekennzeichneten Scan-Untersuchungen sm L die gleiche Kennzeichnung aufweist. Da eine Scan-Untersuchung jedes Clusters gekennzeichnet worden ist, gibt es jetzt NC gekennzeichneter Scan-Untersuchungen s m L
    Figure DE102021210920A1_0005
    und NM-NC Scan-Untersuchungen, die Kennzeichnungen aufweisen, durch Inferenz, d. h. aufgrund ihrer Zugehörigkeit zu demselben Cluster wie eine der gekennzeichneten Scan-Untersuchungen s m L .
    Figure DE102021210920A1_0006
    Dies wird manchmal als „Kennzeichnungs-Propagation“ bezeichnet und umfasst einen Wissenstransfer von den direkt durch den Anwender gekennzeichneten Scan-Untersuchungen auf die verbleibenden Scan-Untersuchungen, um eine erweiterte Trainingsmenge zu erzeugen. Für einige Anwendungen kann diese erweiterte Trainingsmenge bereits ausreichend genau sein, um überwachtes Trainieren auszuführen.
  • Als ein Beispiel kann der Anwender eine spezielle Scan-Untersuchung sm L mit der RPID (RadLex-ID, als ein Typ des SIC) RPID64 gekennzeichnet haben. Das Mensch-Maschine-Interaktionsmodul, 1522, kann dazu ausgelegt sein, für den Anwender über die GUI ein bequemes Dropdown-Menü (oder eine andere Art der Auswahl aus einer gegebenen Menge von Antworten), das die RPID-Codes enthält, bereitzustellen.
  • Der Speicher 1502 der Berechnungsvorrichtung 1500 kann ferner eine Tabelle umfassen, in der jeder der auswählbaren RPID-Codes mit einer textbasierten Beschreibung dafür verknüpft ist. Beispielsweise ist gemäß dem RadLex Playbook die RPID64 der „Langbeschreibung“ „CT Becken Cystogramm ohne IV-Kontrast“ zugeordnet (oder damit verknüpft). Daraus können Unigramme oder Token wie „CT“ („Computertomographie“), „Becken“, „Cystogramm“, „ohne IV-Kontrast“ („ohne intravenösen Kontrast“) extrahiert werden.
  • Da der Anwender in Reaktion auf die Kennzeichnungsaufgabe für jede der zum Kennzeichnen ausgewählten Scan-Untersuchungen sm L eine RPID bereitgestellt hat, ist für jeden der bestimmten Cluster eine Scan-Untersuchung sm L ausgewählt worden, was bedeutet, dass jetzt jedem Cluster eine RPID zugeordnet werden kann. Anstelle von Repräsentationen B1 von Körperregionen kann man deshalb von Repräsentationen Qc von RPIDs (oder allgemein von Repräsentationen von SICs) sprechen.
  • Die Berechnungsvorrichtung 1500 implementiert ferner ein Gewichtungsaktualisierungsmodul 1540, das dazu ausgelegt ist, die Gewichte der Unigramme in den Repräsentationen Qc der Cluster c in Abhängigkeit von der Antwort auf die Kennzeichnungsaufgabe zu aktualisieren. Der Textvektor V(sm L) für eine gekennzeichnete Untersuchung sm L kann in Bezug darauf analysiert werden, ob die mit der Kennzeichnung (hier: RPID64) verknüpften Unigramme in der Repräsentation Qc der Cluster c, in die die gekennzeichnete Untersuchung sm L zuvor klassifiziert worden ist, vorhanden sind. Für vorhandene Unigramme werden ihre Gewichte für die Repräsentation Qc der Cluster c erhöht, während ihre Gewichte für die Repräsentationen Qd der anderen Cluster d≠c reduziert werden.
  • Falls der Anwender (beispielsweise unter anderem) ein neues Unigramm, das noch nicht in das Vokabular zum Kennzeichnen einer Scan-Untersuchung aufgenommen worden ist, verwendet, kann das Vokabular erweitert werden und der Zählvektorisiererwert für Textvektoren V für die gekennzeichnete Scan-Untersuchung wird auf „1“ eingestellt. Falls der Anwender ein oder mehrere Unigramme, die bereits in dem Textvektor V vorhanden sind, verwendet, kann ihr Wert (d. h. ihr numerischer Eintrag innerhalb des Textvektors V) erhöht werden. Die Erhöhung kann als Prozentsatz bestimmt werden, beispielsweise als fester Prozentsatz im Bereich von 20 % bis 70 %, vorzugsweise im Bereich von 30 % bis 60 %, besonders bevorzugt 50 %. Die Erhöhung kann auch als ein absoluter Wert bestimmt werden, beispielsweise durch einen Wert im Bereich von 0,2 bis 0,7, vorzugsweise im Bereich von 0,3 bis 0,6, am meisten bevorzugt 0,5.
  • Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1540 zum Aktualisieren der Gewichte der Unigramme in den Repräsentationen Qc der Cluster c abhängig von der Antwort auf die Kennzeichnungsaufgabe in der vorstehend beschriebenen Weise umfassen.
  • Ein Clustering-Aktualisierungsmodul 1550 kann durch die Berechnungsvorrichtung 1500 implementiert sein, wobei das Clustering-Aktualisierungsmodul 1550 dazu ausgelegt ist, bei Bedarf die Anzahl NC der Cluster c und die Abstände der Datenpunkte, die die Scan-Untersuchungen repräsentieren, zu den jeweiligen Schwerpunkten zu aktualisieren. Beispielsweise ist denkbar, dass zwei Scan-Untersuchungen, die ursprünglich zu zwei Clustern gehörten, die basierend auf der Anzahl der Protokolle 1 erzeugt wurden, durch den Anwender so gekennzeichnet worden sind, dass sie tatsächlich zu derselben RPID gehören. Dann können die beiden ursprünglichen Cluster, die zwei unterschiedliche Protokolle 1 repräsentieren, zu einem Cluster, der eine einzige RPID repräsentiert, zusammengefasst werden. Die Anzahl der Cluster NC wird somit um eins reduziert, der Schwerpunkt für den neuen Cluster wird sich von den Schwerpunkten der beiden früheren Cluster unterscheiden, und die Abstände der zu dem neuen Cluster gehörenden Scan-Untersuchungen werden ebenfalls aktualisiert, da sie sich im Allgemeinen von ihrem früheren Abstand zu dem jeweiligen näheren Schwerpunkt der beiden früheren Cluster unterscheiden werden.
  • Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1550 zum Aktualisieren der Anzahl und der Form der Cluster und/oder der Abstände der Scan-Untersuchungen zu dem Schwerpunkt des Clusters, zu dem sie gehören, umfassen. Die erneute Clustern S1550 durch das Clustering-Aktualisierungsmodul 1550 kann während des aktiven Lernansatzes, der durch das Modul für aktives Lernen 1520 ausgeführt wird, (z. B. während einer Verfeinerungsschleife) oder danach ausgeführt werden, z. B. als Vorbereitung für ein späteres Neu-Trainieren des Systems für maschinelles Lernen, MLS 1530. In einer so genannten Verfeinerungsschleife werden wenigstens die Schritte zum Auswählen der Scan-Untersuchungen, die durch den Anwender zu kennzeichnen sind, (d. h. Bestimmen der Kennzeichnungsaufgaben S1521, Präsentation der Kennzeichnungsaufgaben 1522, Erhalten der Kennzeichnungen S1523, und Neu-Trainieren S1524 (oder, in der Verfeinerungsschleife: Neu-Trainieren) in dem System für maschinelles Lernen, MLS 1530, wiederholt. Jede Wiederholung dieser Verfeinerungsschleife erhöht die Anzahl der gekennzeichneten Scan-Untersuchungen sm L und verbessert offensichtlich auch das MLS 1530 weiter.
  • Nachdem die erste Gruppe der zu kennzeichnenden Scan-Untersuchungen (eine aus jedem der ursprünglichen Cluster) ausgewählt worden ist, werden in jeder Iteration f der Verfeinerungsschleife weitere NS(f) Scan-Untersuchungen zum Kennzeichnen ausgewählt. Die Anzahl NS kann für jede Iteration f unterschiedlich sein, ist aber in dem hier beschriebenen Beispiel fest. Die Anzahl NS ist vorzugsweise kleiner als die Anzahl NC von Protokollen und/oder kleiner als die Anzahl der SICs (hier: RPIDs) und kann beispielsweise im Bereich von 5 bis 30, vorzugsweise im Bereich von 15 bis 20 sein. In dem vorliegenden Beispiel ist die Einstellung NS =10.
  • Zu Beginn der Iteration f, ist die Anzahl der Scan-Untersuchungen, die noch nicht durch einen Anwender gekennzeichnet worden sind, gleich NM-NC-(f-1)*NS. Aus diesen werden wiederum NS ausgewählt. Eine mögliche Prozedur ist, dass zunächst aus den nicht gekennzeichneten Scan-Untersuchungen die d*NS Scan-Untersuchungen mit der höchsten Entropie ausgewählt werden und aus diesen dann wiederum NS endgültig zum Kennzeichnen ausgewählt werden. Die Ganzzahl d kann irgendeine Zahl sein, zum Beispiel Bereich von 1 bis 10, und ist hier auf 5 eingestellt.
  • Die Auswahl der NS Scan-Untersuchungen innerhalb der anfangs ausgewählten d*NS Scan-Untersuchungen kann nach irgendeinem Kriterium erfolgen, z. B. wieder nach der höchsten Entropie. Beispielsweise ist es vorteilhaft, die Unigramme ui mit der höchsten Varianz über ihre Gewichte innerhalb der Repräsentationen Qc zu bestimmen, d. h., die mit anderen Worten diejenigen sind, die in Bezug auf die Repräsentationen Qc stark ausgeprägt sind. Um dies zu verstehen, kann man ein Unigramm ui betrachten, das in jeder Repräsentation Qc das gleiche Gewicht aufweist; ein solches Unigramm ui hätte die Varianz Null und würde im Wesentlichen keine Angabe für eine der Darstellungen Qc führen. Dann können aus den anfangs ausgewählten d*NS Scan-Untersuchungen die NS Scan-Untersuchungen ausgewählt werden, die Unigramme mit der höchsten Gesamtvarianz umfassen, mit der zusätzlichen Bedingung, dass keine Scan-Untersuchung ausgewählt wird, die bereits gekennzeichnet worden ist.
  • Die Iteration der Verfeinerungsschleife kann ausgeführt werden, bis ein Abbruchkriterium erreicht ist. Das Abbruchkriterium kann beispielsweise Folgendes sein:
    • - eine im Voraus definierte Anzahl von Scan-Untersuchungen, die zum Kennzeichnen an den Anwender gesendet werden, ist erreicht, wobei die Anzahl vorzugsweise Bereich von 100 bis 400, besonders bevorzugt Bereich von 200 bis 300 ist;
    • - eine im Voraus definierte Anzahl von Iterationen (d. h. die Anzahl der Wiederholungen, mit denen das System für maschinelles Lernen, MLS 1530, neu trainiert wird);
    • - wenn sich die Leistung des MLS 1530 oberhalb eines speziellen Schwellenwerts nicht mehr signifikant verbessert oder nach einem speziellen Schwellenwert konstant bleibt.
  • Es kann auch bestimmt werden, dass die Verfeinerungsschleife abgebrochen wird, wenn in einer Verfeinerungsiteration f wenigstens eine im Voraus definierte Anzahl von Scan-Untersuchungen ausgewählt wird, die bereits in einer vorherigen Verfeinerungsiteration f ausgewählt worden sind. Da die Vorauswahl der d*NS Scan-Untersuchungen auf der Entropie basiert, gibt eine solche Neuauswahl derselben Scan-Untersuchungen an, dass die Entropie selbst für die Scan-Untersuchungen mit der höchsten Entropie durch das Kennzeichnen nicht mehr reduziert werden kann.
  • Eine solche Verfeinerungsschleife kann in Zukunft als Rückkopplung wieder eingesetzt werden, beispielsweise in einem Fall, in dem die Leistung des Systems für maschinelles Lernen, MLS, abnimmt. In diesem Fall kann das System für maschinelles Lernen, MLS, automatisch in einer oder mehreren Verfeinerungsschleifen, wie im Vorstehenden beschrieben, wieder neu trainiert werden.
  • Nachdem die Verfeinerungsschleifen beendet sind, können optional mehr Daten synthetisiert werden, um die Größe der Trainingsdatenmenge weiter zu erhöhen.
  • Eine Option ist, das protokollbestimmende künstliche neuronale Netz, PDANN 1511, konstant zu halten und zusätzliche virtuelle Scan-Untersuchungen sV(sm, δV) zu erzeugen, indem zu wenigstens einer existierenden Scan-Untersuchung sm ein Rauschen δV durch Einfügen oder Löschen von Unigrammen in den/aus dem Textvektor V(sm) hinzugefügt wird, wobei vorzugsweise solche Unigramme ausgewählt werden, die wenig Einfluss auf die Klassifizierung der Scan-Untersuchungen in SICs aufweisen. Beispielsweise bezieht sich das Unigramm „Topogramm“ nicht auf eine spezifische Körperregion. Um den Einfluss zu bestimmen, kann ein Chi-Quadrat-Test angewandt werden. Dann kann in Fällen, in denen das MLS 1530 das PDANN 1511 und dem Klassifizierer 1531, der die Ausgabe des PDANN 1511 als Eingabe verwendet, umfasst, der Klassifizierer 1531 unter anderem unter Verwendung der zusätzlichen virtuellen Scan-Untersuchungen sv(sm, δV) zusammen mit der Kennzeichnung, die der Anwender für die ursprüngliche Scan-Unter sm, zu der das Rauschen δV hinzugefügt worden ist, vergeben hat, trainiert werden.
  • Eine weitere Option ist das Verwenden von Vektorisierung, d. h. eines Prozesses zum Erzeugen zusätzlicher Vektoren unter Verwendung von Vektorbetriebsbedingungen.
  • Falls beispielsweise eine Scan-Untersuchung s1 mit einer RPID gekennzeichnet ist, die das Abdomen als Körperregion angibt, und eine Scan-Untersuchung s2 mit einer RPID gekennzeichnet ist, die das Becken als Körperregion angibt, dann kann die Vektoraddition s1+s2 verwendet werden, um eine neue virtuelle Scan-Untersuchung zu erzeugen, die mit einer RPID gekennzeichnet ist, die Abdomen + Becken als Körperregion angibt. In ähnlicher Weise kann Vektorsubtraktion s3-s4 verwendet werden, um verdeckte Schichten virtueller Untersuchungen zu erzeugen, die sich auf eine kleinere Körperregion oder auf weniger Körperregionen beziehen als die, mit der s3 gekennzeichnet worden ist. Die Hinzufügung und/oder Löschung kann auf den gesamten Merkmalen x der Untersuchungen und/oder auf Zwischenschichten des protokollbestimmenden künstlichen neuronalen Netzes, PDANN 1511, basierend auf den Scan-Untersuchungen s1, s2, s3 bzw. s4 ausgeführt werden. Im letzteren Fall können die verdeckten Schichten der virtuellen Untersuchungen in das PDANN 1511 eingefügt werden, um es auf der Ebene (d. h. anstelle) der jeweiligen Zwischenschichten zu trainieren, während die tatsächlichen Scan-Untersuchungen weiterhin in das PDANN 1511 an seiner ersten Schicht, d. h. seinen Eingangsknoten, eingegeben werden.
  • Schließlich kann das abschließende Trainieren des MLS 1530 auf irgendeinem oder allen aus dem Folgenden basieren:
    • - alle gekennzeichneten Scan-Untersuchungen sm L sowohl aus dem anfänglichen Kennzeichnen als auch aus den Iterationen der Verfeinerungsschleife;
    • - allen zusätzlichen virtuellen Scan-Untersuchungen;
    • - anderen Scan-Untersuchungen, die durch Kennzeichnungsverteilung gekennzeichnet sind, d. h. mit dem Kennzeichen gekennzeichnet sind, das für die gekennzeichneten Scan-Untersuchungen sm L desselben Clusters vergeben worden ist,
    wobei die Optionen so aufgezählt sind, dass sie mit der zuverlässigsten (und am meisten bevorzugten) beginnen und mit der am wenigsten zuverlässigen enden.
  • Als ein Ergebnis ist eine enorme Menge an Trainingsdaten zum Trainieren des MLS 1530 verfügbar, um den SIC (hier: RPID) irgendeiner Scan-Untersuchung genau zu bestimmen, obwohl tatsächlich nur eine vergleichsweise sehr geringe Anzahl von Scan-Untersuchungen durch einen Anwender gekennzeichnet werden musste. Außerdem wurden die Zeit und der Aufwand des Anwenders, der die Daten kennzeichnet, äußerst effizient genutzt, da dem Anwender Kennzeichnungsaufgaben gestellt wurden, die geeignet waren, das MLS 1530 maximal zu verbessern. Die Einrichtung 1000 umfasst ferner eine Ausgabeschnittstelle 1900, die dazu ausgelegt ist, das trainierte MLS 1530 auszugeben. Sowohl die Eingabeschnittstelle 1100 als auch die Ausgabeschnittstelle 1900 können als Hardware und/oder Software, drahtgebunden oder drahtlos realisiert sein und können insbesondere mit einem Netz wie z. B. einem Intranet oder dem Internet verbunden sein. In der Einsatzphase kann das trainierte System für maschinelles Lernen MLS 1530 verwendet werden, um die RPID für eine zuvor unbekannte Scan-Untersuchung zu bestimmen, d. h. die Scan-Untersuchung auf eine RPID abzubilden.
  • Somit kann ein Verfahren gemäß der vorliegenden Erfindung auch einen Schritt S2000 zum Verwenden des trainierten MLS 1530, um die RPID für eine zuvor unbekannte Scan-Untersuchung zu bestimmen, umfassen. Ein solches Verfahren, das die vorstehend beschriebenen Schritte zum Trainieren des MLS 1530 umfassen kann oder nicht, kann als ein Verfahren zum Abbilden einer Scan-Untersuchung auf einen SIC eines SICD bezeichnet werden.
  • 3 zeigt ein schematisches Blockdiagramm, das ein Computerprogrammprodukt 300 gemäß einer Ausführungsform des dritten Aspekts der vorliegenden Erfindung darstellt. Das Computerprogrammprodukt 300 umfasst ausführbaren Programmcode 350, der dazu ausgelegt ist, dann, wenn er ausgeführt wird, das Verfahren gemäß der vorliegenden Erfindung auszuführen, insbesondere so, wie es im Vorstehenden in Bezug auf 1 und 2 beschrieben worden ist.
  • 4 zeigt ein schematisches Blockdiagramm, das ein nicht-transientes, computerlesbares Datenspeichermedium 400 gemäß einer Ausführungsform des vierten Aspekts der vorliegenden Erfindung darstellt. Das Datenspeichermedium 400 umfasst ausführbaren Programmcode 450, der dazu ausgelegt ist, dann, wenn er ausgeführt wird, das Verfahren gemäß der vorliegenden Erfindung auszuführen, insbesondere so, wie es im Vorstehenden in Bezug auf 1 und 2 beschrieben worden ist.
  • In der vorstehenden genauen Beschreibung sind verschiedene Merkmale in ein oder mehrere Beispielen oder Beispiele mit dem Zweck, die Offenbarung zu straffen, zusammengefasst. Es ist zu verstehen, dass die vorstehende Beschreibung erläuternd und nicht einschränkend sein soll. Sie soll alle Alternativen, Modifikationen und Äquivalente abdecken. Viele andere Beispiele werden für einen Fachmann bei der Durchsicht der vorstehenden Beschreibung offensichtlich.
  • Die Ausführungsformen wurden ausgewählt und beschrieben, um die Prinzipien der Erfindung und ihre praktischen Anwendungen bestmöglich zu erläutern und dadurch andere Fachleute in die Lage zu versetzen, die Erfindung und die verschiedenen Ausführungsformen mit verschiedenen Modifikationen, die für die spezielle angedachte Verwendung geeignet sind, optimal zu nutzen.
  • Noch einmal kurz gesagt ist eine der Hauptideen der vorliegenden Erfindung, aktives Lernen zu verwenden, um zu steuern, welche Scan-Untersuchungen durch einen Anwender abzubilden sind. Diese Steuerung wird genutzt, um den Anwender aufzufordern, die - für das MLS 1530 in seinem aktuellen Trainingszustand - schwierigsten Datenpunkte zu kennzeichnen. Die Erfinder haben festgestellt, dass sich auf diese Weise die Zeit und der Aufwand für einen Anwender zum Abbilden von Datensätzen reduzieren, während gleichzeitig eine bessere Vorhersageleistung erzielt wird. Die Erfindung stellt auch eine Anzahl von Techniken zum Gewinnen von Wissen aus den Scan-Untersuchungen und zum Bestimmen optimaler Entscheidungskriterien bereit.

Claims (15)

  1. Einrichtung (1000) zum Trainieren eines Systems für maschinelles Lernen, MLS, (1530) zum Abbilden einer Scan-Untersuchung auf einen standardisierten Identifizierercode, SIC, eines Wörterbuchs für standardisierte Identifizierercodes, SICD, wobei die Einrichtung (1000) Folgendes umfasst: eine Eingabeschnittstelle (1100), die dazu ausgelegt ist, eine Grundmenge von Scan-Untersuchungen, BSSS (71), zu erhalten; und eine Berechnungsvorrichtung (1500), die dazu ausgelegt ist, wenigstens ein Clustering-Modul (1510) zu implementieren, das dazu ausgelegt ist, unter Verwendung eines Clustering-Algorithmus die Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS (71), in mehrere Cluster zu klassifizieren; und ein Modul für aktives Lernen (1520), das dazu ausgelegt ist, das System für maschinelles Lernen, MLS (1530), zu trainieren, wobei das Modul für aktives Lernen Folgendes umfasst: ein Kennzeichnungsaufgabenbestimmungsmodul, LTDM (1521), das dazu ausgelegt ist, wenigstens eine Scan-Untersuchung aus jedem Cluster auszuwählen; ein Kennzeichnungsmodul (1522), das dazu ausgelegt ist, SIC-Kennzeichen für die ausgewählten Scan-Untersuchungen zu erhalten, um eine Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu erzeugen; und ein Trainingsmodul für Systeme für maschinelles Lernen, MLSTM (1523), das dazu ausgelegt ist, das System für maschinelles Lernen, MLS (1530), basierend auf der erzeugten Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu trainieren; wobei das Modul für aktives Lernen (1520) ferner dazu ausgelegt ist, das System für maschinelles Lernen, MLS (1530), durch Ausführen wenigstens einer Verfeinerungsschleife neu zu trainieren, umfassend: - Bestimmen basierend auf einer Bewertungsmetrik einer zusätzlichen Menge zu kennzeichnender Scan-Untersuchungen aus der Grundmenge von Scan-Untersuchungen, BSSS (71); - Erhalten von SIC-Kennzeichnungen für die Scan-Untersuchungen in der bestimmten zusätzlichen Menge von Scan-Untersuchungen, um die Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu erweitern; - erneutes Trainieren des Systems für maschinelles Lernen, MLS (1530), unter Verwendung wenigstens der erweiterten Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS.
  2. Einrichtung (1000) nach Anspruch 1, wobei das Kennzeichnungsmodul als ein Mensch-Maschine-Interaktionsmodul, HMIM (1522), ausgelegt ist, das dazu ausgelegt ist, durch das Kennzeichnungsaufgabenbestimmungsmodul, LTDM (1521), ausgewählte Scan-Untersuchungen einem Anwender als Kennzeichnungsaufgaben unter Verwendung einer grafischen Benutzeroberfläche anzuzeigen und Kennzeichnungen für die ausgewählten und angezeigten Scan-Untersuchungen als Antworten des Anwenders auf die Kennzeichnungsaufgaben zu erhalten.
  3. Einrichtung (1000) nach Anspruch 1 oder Anspruch 2, wobei das System für maschinelles Lernen, MLS (1530), ein protokollbestimmendes künstliches neuronales Netz, PDANN (1511), umfasst, das dazu ausgelegt ist, für eine Scan-Untersuchung einen Protokollnamen, mit dem die Scan-Untersuchung bezeichnet werden kann, zu bestimmen, und wobei das System für maschinelles Lernen (1530) das PDANN (1511) umfasst.
  4. Computerimplementiertes Verfahren zum Trainieren eines Systems für maschinelles Lernen zum Abbilden einer Scan-Untersuchung auf einen standardisierten Identifizierercode, SIC, eines Wörterbuchs für standardisierte Identifizierercodes, SICD, das die folgenden Schritte umfasst: - Erhalten (S1100) einer Grundmenge von Scan-Untersuchungen, BSSS (71); - Klassifizieren (S1510) unter Verwendung eines Clustering-Algorithmus der Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS (71), in mehrere Cluster; - Auswählen (S1521) wenigstens einer Scan-Untersuchung aus jedem Cluster; - Erhalten (S1523) von SIC-Kennzeichnungen für die ausgewählten Scan-Untersuchungen, um eine Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu erzeugen; - Trainieren (S1524) eines Systems für maschinelles Lernen, MLS (1530), unter Verwendung der gekennzeichneten Scan-Untersuchungen, um individuelle Scan-Untersuchungen auf einen entsprechenden SIC des SICD abzubilden; - Ausführen wenigstens einer Verfeinerungsschleife, umfassend: - Bestimmen (S1521) einer zusätzlichen Menge von Scan-Untersuchungen aus der Grundmenge von Scan-Untersuchungen, BSSS (71), basierend auf einer Bewertungsmetrik; - Erhalten (S1523) von SIC-Kennzeichnungen für die Scan-Untersuchungen in der bestimmten Menge von Scan-Untersuchungen, um die Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu erweitern; - erneutes Trainieren (S1524) des Systems für maschinelles Lernen, MLS (1530), unter Verwendung wenigstens der erweiterten Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS.
  5. Verfahren nach Anspruch 4, wobei die SIC-Kennzeichnungen durch Präsentieren (S1522) von Kennzeichnungsaufgaben für die ausgewählten Scan-Untersuchungen für einen Anwender unter Verwendung einer grafischen Benutzeroberfläche und Empfangen der Eingaben des Anwenders als Kennzeichnungen für die ausgewählten Scan-Untersuchungen erhalten werden.
  6. Verfahren nach Anspruch 4 oder Anspruch 5, wobei zusätzliche virtuelle Scan-Untersuchungen oder Merkmale davon zum Trainieren des Systems für maschinelles Lernen, MLS (1503), basierend auf Vektorisierungsoperationen, die an Scan-Untersuchungen des erweiterten TSLSS ausgeführt werden, erzeugt werden, und wobei wenigstens das abschließende Neu-Trainieren des Systems für maschinelles Lernen, MLS (1530), unter Verwendung der erweiterten TSLSS und der zusätzlichen virtuellen Scan-Untersuchungen oder deren Merkmale ausgeführt wird.
  7. Verfahren nach einem der Ansprüche 4 bis 6, wobei zusätzliche virtuelle Scan-Untersuchungen durch Hinzufügen von Rauschen zu Scan-Untersuchungen, für die Kennzeichnungen erhalten worden sind, erzeugt werden, und wobei wenigstens das abschließende Neu-Trainieren des Systems für maschinelles Lernen, MLS (1530), unter Verwendung der erweiterten TSLSS und der zusätzlichen virtuellen Scan-Untersuchungen ausgeführt wird.
  8. Verfahren nach einem der Ansprüche 4 bis 7, das Erzeugen von Repräsentationen für die SICs basierend auf gewichteten Unigrammen umfassend.
  9. Verfahren nach Anspruch 8, wobei die erzeugten Repräsentationen für die SICs wenigstens einmal basierend auf den erhaltenen SIC-Kennzeichnungen aktualisiert werden.
  10. Verfahren nach Anspruch 9, wobei die Repräsentationen für die SICs durch Ändern der Gewichte der gewichteten Unigramme innerhalb der Repräsentationen basierend auf einer Bestimmung, wie groß die Auswirkungen einer Hinzufügung und/oder Löschung jedes Unigramms für die Entscheidung darüber sind, ob eine bestimmte Scan-Untersuchung in einen speziellen SIC klassifiziert wird, aktualisiert werden.
  11. Verfahren nach einem der Ansprüche 4 bis 10, wobei das System für maschinelles Lernen, MLS (1530), ein protokollbestimmendes künstliches neuronales Netz, PDANN (1511), umfasst, das dazu ausgebildet ist, für eine Scan-Untersuchung einen Protokollnamen, mit dem die Scan-Untersuchung bezeichnet werden kann, zu bestimmen, und wobei das Abbilden der Scan-Untersuchung auf den SIC durch das MLS (1530) teilweise und wenigstens indirekt auf der Ausgabe des PDANN (1511) basierend auf der Scan-Untersuchung basiert.
  12. Verfahren nach einem der Ansprüche 4 bis 11, wobei die Verfeinerungsschleife iteriert wird, bis ein Abbruchkriterium erfüllt ist, wobei das Abbruchkriterium irgendeines der oder alle aus dem Folgenden umfassen kann: - eine im Voraus definierte Anzahl von Kennzeichnungen ist erhalten worden; - eine im Voraus definierte Anzahl von Iterationen ist ausgeführt worden; und/oder - die Leistung des neu trainierten Systems für maschinelles Lernen, MLS (1530), verbessert sich oberhalb eines speziellen Schwellenwerts nicht mehr signifikant oder bleibt nach einem speziellen Schwellenwert konstant.
  13. Verwendung eines Systems für maschinelles Lernen, MLS (1530), das unter Verwendung des Verfahrens nach einem der Ansprüche 4 bis 12 trainiert worden ist, zum Abbilden einer Scan-Untersuchung auf einen standardisierten Identifizierercode, SIC, eines Wörterbuchs für standardisierte Identifizierercodes, SICD.
  14. Computerprogrammprodukt (200), ausführbaren Programmcode (250) umfassend, der dazu ausgelegt ist, dann, wenn er ausgeführt wird, das Verfahren nach einem der Ansprüche 4 bis 12 auszuführen.
  15. Nicht-transientes, computerlesbares Datenspeichermedium (300), ausführbaren Programmcode (350) umfassend, der dazu ausgelegt ist, dann, wenn er ausgeführt wird, das Verfahren nach einem der Ansprüche 4 bis 12 auszuführen.
DE102021210920.9A 2021-09-29 2021-09-29 Einrichtung und computerimplementiertes Verfahren zum Trainieren eines Systems für maschinelles Lernen zum Zuordnen einer Scan-Untersuchung zu einem standardisierten Identifizierercode Pending DE102021210920A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE102021210920.9A DE102021210920A1 (de) 2021-09-29 2021-09-29 Einrichtung und computerimplementiertes Verfahren zum Trainieren eines Systems für maschinelles Lernen zum Zuordnen einer Scan-Untersuchung zu einem standardisierten Identifizierercode
US17/953,504 US20230101474A1 (en) 2021-09-29 2022-09-27 Apparatus and computer-implemented method for training a machine learning system for mapping a scan study to a standardized identifier code

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102021210920.9A DE102021210920A1 (de) 2021-09-29 2021-09-29 Einrichtung und computerimplementiertes Verfahren zum Trainieren eines Systems für maschinelles Lernen zum Zuordnen einer Scan-Untersuchung zu einem standardisierten Identifizierercode

Publications (1)

Publication Number Publication Date
DE102021210920A1 true DE102021210920A1 (de) 2023-03-30

Family

ID=85477286

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102021210920.9A Pending DE102021210920A1 (de) 2021-09-29 2021-09-29 Einrichtung und computerimplementiertes Verfahren zum Trainieren eines Systems für maschinelles Lernen zum Zuordnen einer Scan-Untersuchung zu einem standardisierten Identifizierercode

Country Status (2)

Country Link
US (1) US20230101474A1 (de)
DE (1) DE102021210920A1 (de)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160232658A1 (en) 2015-02-06 2016-08-11 International Business Machines Corporation Automatic ground truth generation for medical image collections
US20200286614A1 (en) 2017-09-08 2020-09-10 The General Hospital Corporation A system and method for automated labeling and annotating unstructured medical datasets

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160232658A1 (en) 2015-02-06 2016-08-11 International Business Machines Corporation Automatic ground truth generation for medical image collections
US20200286614A1 (en) 2017-09-08 2020-09-10 The General Hospital Corporation A system and method for automated labeling and annotating unstructured medical datasets

Also Published As

Publication number Publication date
US20230101474A1 (en) 2023-03-30

Similar Documents

Publication Publication Date Title
DE112018001996T5 (de) Systeme und verfahren zur modellgestützten kohortenauswahl
DE112018002822T5 (de) Klassifizieren neuronaler netze
DE102015212953A1 (de) Künstliche neuronale Netze zur Klassifizierung von medizinischen Bilddatensätzen
EP2648122B1 (de) Verfahren zum Laden von medizinischen Bilddaten sowie Vorrichtung zur Durchführung des Verfahrens
DE112010003251T5 (de) Medizinische Diagnoseunterstützungsvorrichtung, Verfahren zur Steuerung einer medizinischen Diagnoseunterstützungsvorrichtung und Programm
DE102021004157A1 (de) Maschinell lernendes Modellieren zum Schutz gegen die Online-Offenlegung empfindlicher Daten
DE102008002882A1 (de) System und Verfahren zu von einer elektronischen Krankenakte beeinflusster Datenerfassung, -verarbeitung und -anzeige
DE10300545A1 (de) Vorrichtung, Verfahren, Speichermedium und Datenstruktur zur Kennzeichnung und Speicherung von Daten
DE102020110542A1 (de) Verfahren und einrichtungen zum ver walten von tickets
DE112017007530T5 (de) Entitätsmodell-erstellung
EP4016543A1 (de) Verfahren und vorrichtung zur bereitstellung einer medizinischen information
DE112019005308T5 (de) Erzeugungsvorrichtung, -verfahren und -programm für gewichtetes bild, bestimmerlernvorrichtung, -verfahren und -programm, bereichsextraktionsvorrichtung, -verfahren und -programm und bestimmer
DE112021005678T5 (de) Normieren von OCT-Bilddaten
DE112021000329T5 (de) Unterstützungsvorrichtung, verfahren und programm für dokumentenerstellung
DE112021003761T5 (de) Prädiktive modelle mit zerlegbaren hierarchischen ebenen, die konfiguriert werden, um interpretierbare resultate zu erzeugen
DE102020211849A1 (de) Trainieren eines maschinellen lernmodells unter verwendung eines batch-basierten aktiven lernansatzes
DE102020211214A1 (de) System und Verfahren zum Erkennen von Anomalien in Bildern
DE112020002892T5 (de) Aktives lernen für den datenabgleich
DE102021210920A1 (de) Einrichtung und computerimplementiertes Verfahren zum Trainieren eines Systems für maschinelles Lernen zum Zuordnen einer Scan-Untersuchung zu einem standardisierten Identifizierercode
EP3340250B1 (de) Bauteilidentifikation bei der fehlerbehandlung von medizinischen geräten
EP4205041A1 (de) System zur automatisierten harmonisierung strukturierter daten aus verschiedenen erfassungseinrichtungen
DE102021206108A1 (de) Verfahren und Vorrichtung zur Auswertung von medizinischen Bilddaten
DE112020005870T5 (de) Unterstützungsvorrichtung für dokumentenerstellung, unterstützungsverfahren für dokumentenerstellung und unterstützungsprogramm für dokumentenerstellung
DE112021000934T5 (de) Unterstützungsvorrichtung für dokumentenerstellung, unterstützungsverfahren für dokumentenerstellung und programm
DE112021001190T5 (de) Informationsverarbeitungsvorrichtung, -verfahren und -programm

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R081 Change of applicant/patentee

Owner name: SIEMENS HEALTHINEERS AG, DE

Free format text: FORMER OWNER: SIEMENS HEALTHCARE GMBH, MUENCHEN, DE