DE102021210920A1

DE102021210920A1 - Einrichtung und computerimplementiertes Verfahren zum Trainieren eines Systems für maschinelles Lernen zum Zuordnen einer Scan-Untersuchung zu einem standardisierten Identifizierercode

Info

Publication number: DE102021210920A1
Application number: DE102021210920.9A
Authority: DE
Inventors: Pankaj Kumar; Nikhil Lakshman
Original assignee: Siemens Healthcare GmbH
Current assignee: Siemens Healthineers Ag De
Priority date: 2021-09-29
Filing date: 2021-09-29
Publication date: 2023-03-30
Also published as: US20230101474A1

Abstract

Die Erfindung bezieht sich auf eine Einrichtung und ein computerimplementiertes Verfahren zum Trainieren eines Systems für maschinelles Lernen zum Abbilden einer Scan-Untersuchung auf einen standardisierten Identifizierercode.Aktives Lernen wird verwendet, um zu steuern, welche Scan-Untersuchungen durch einen Anwender abzubilden sind. Diese Steuerung wird genutzt, um den Anwender aufzufordern, die - für das MLS in seinem aktuellen Trainingszustand - schwierigsten Datenpunkte zu kennzeichnen. Die Erfindung stellt auch eine Anzahl von Techniken zum Gewinnen von Wissen aus den Scan-Untersuchungen und zum Bestimmen optimaler Entscheidungskriterien bereit.

Description

Die Erfindung bezieht sich auf das Abbilden von Scan-Untersuchungen, die üblicherweise durch mandantenspezifische oder herstellerspezifische Protokollbezeichnungen bezeichnet sind, auf ein Wörterbuch für standardisierte Identifizierercodes wie z. B. das RadLex Playbook und die darin enthaltenen RadLex-IDs (RPIDs). Die Erfindung stellt auch ein computerimplementiertes Verfahren zum Abbilden von Scan-Untersuchungen, ein Computerprogrammprodukt, ein Datenspeichermedium und einen zugehörigen Datenstrom bereit.
Die Benennung der Bildgebungsprozeduren ist derzeit in verschiedenen Ländern und sogar in verschiedenen Institutionen nicht standardisiert. Dies erschwert die Bemühungen, verschiedene Typen von Scan-Prozeduren zu vergleichen und nationale oder internationale Register zu erstellen, z. B. für die eingesetzten Dosen.
Die Radiological Society of North America (RSNA) hat das sogenannte RadLex Playbook entwickelt, das eine Referenz zum Abbilden der Bemühungen zum Adressieren dieser Lücke ist. Das RadLex Playbook ist unter dieser URL verfügbar: http://playbook.radlex.org/playbook/SearchRadlexAction, derzeit in der Version 2.5 vom Februar 2018. Es ist jedoch zu verstehen, dass auch spätere Versionen des RadLex Playbook eingeschlossen sind, wenn das RadLex Playbook hier genannt ist.
In dem RadLex Playbook wird jede Scan-Untersuchung auf einen standardisierten Identifizierercode SIC abgebildet, der in diesem Fall als „RadLex ID“ oder kurz „RPID“ bezeichnet ist. Das RPID-Abbilden ist nützlich zur Standardisierung der Bildgebungsprozeduren, zum Vergleichen ähnlicher Prozeduren und Untersuchungen in verschiedenen Regionen und zum Erleichtern des Aufnehmens der Dosis und des Bestrahlungsmanagements in verschiedenen Institutionen. Auf diese Weise kann auch die Häufigkeit von Fehlalarmen verringert werden, oder Fehlalarme können vollständig eliminiert werden.
Die Aufgabe der RPID-Vorhersage einer Scan-Untersuchung (d. h. das Abbilden der Scan-Untersuchung auf eine RPID) hängt von vielen Faktoren ab, die Modalität, Körperregion, Untersuchungsbeschreibung und vieles mehr enthalten. Das manuelle Abbilden solcher Datensätze, die bei Tausenden von Untersuchungen pro Tag anfallen, ist eine mühsame Arbeit für die Radiologen.
Es ist allgemein bekannt, dass Systeme für maschinelles Lernen, MLS, einige Aufgaben automatisieren können, die für den Menschen mit erheblichem Aufwand verbunden sind, falls sie Mustern folgen, die zu unterscheiden und zu erkennen das MLS trainiert ist. Das Trainieren eines MLS erfordert jedoch auch eine große Menge an gekennzeichneten Daten, um überwachtes Lernen, das das bisher vielversprechendste Trainingsverfahren ist, auszuführen. Bei überwachtem Lernen wird eine Trainingsmenge von Eingabedaten bereitgestellt, wobei jedes Element der Eingabedaten zusammen mit einer Kennzeichnung, die die korrekte, d. h. gewünschte, Ausgabe eines MLS für diese Eingabedaten angibt, bereitgestellt wird.
Dementsprechend besteht ein Bedarf an Systemen und Verfahren zum Trainieren von MLSs unter Verwendung einer minimalen Anzahl von Kennzeichnungen.
Es ist eine Aufgabe der vorliegenden Erfindung, Systeme und Verfahren zum Trainieren von Systemen für maschinelles Lernen unter Verwendung einer minimalen Anzahl von Kennzeichnungen bereitzustellen. Diese Aufgabe wird durch den Gegenstand der unabhängigen Ansprüche gelöst.
Dementsprechend ist gemäß einem ersten Aspekt eine Einrichtung zum Trainieren eines Systems für maschinelles Lernen, MLS, zum Abbilden einer Scan-Untersuchung auf einen standardisierten Identifizierungscode, SIC, eines Wörterbuchs für standardisierte Identifizierercodes, SICD, bereitgestellt, wobei die Vorrichtung Folgendes umfasst:

eine Eingabeschnittstelle, die dazu ausgelegt ist, eine Grundmenge von Scan-Untersuchungen (BSSS) zu erhalten; und
eine Berechnungsvorrichtung, die dazu ausgelegt ist, wenigstens ein Clustering-Modul, das dazu ausgelegt ist, unter Verwendung eines Clustering-Algorithmus die Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS, in mehrere Cluster zu klassifizieren, zu implementieren; und
ein Modul für aktives Lernen, das dazu ausgelegt ist, das System für maschinelles Lernen MLS zu trainieren, wobei das Modul für aktives Lernen Folgendes umfasst:
- ein Kennzeichnungsaufgabenbestimmungsmodul, LTDM, das dazu ausgelegt ist, wenigstens eine Scan-Untersuchung aus jedem Cluster auszuwählen;
- ein Kennzeichnungsmodul, das dazu ausgelegt ist, SIC-Kennzeichnungen für die ausgewählten Scan-Untersuchungen zu erhalten, um eine Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu erzeugen; und
- ein Trainingsmodul für Systeme für maschinelles Lernen, MLSTM, das dazu ausgelegt ist, das System für maschinelles Lernen, MLS, basierend auf der erzeugten Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu trainieren;
- wobei das Modul für aktives Lernen ferner dazu ausgelegt ist, das System für maschinelles Lernen, MLS, neu zu trainieren durch Ausführen wenigstens einer Verfeinerungsschleife, umfassend:
  - - Bestimmen basierend auf einer Bewertungsmetrik einer zusätzlichen Menge zu kennzeichnender Scan-Untersuchungen aus der Grundmenge von Scan-Untersuchungen, BSSS;
  - - Erhalten von SIC-Kennzeichnungen für die Scan-Untersuchungen in der bestimmten zusätzlichen Menge von Scan-Untersuchungen, um die TSLSS zu erweitern;
  - - erneutes Trainieren des MLS unter Verwendung wenigstens der erweiterten TSLSS. Das Auswählen von Scan-Untersuchungen aus der zu kennzeichnenden Grundmenge von Scan-Untersuchungen, BSSS, ist so zu verstehen, dass es bedeutet, dass eine echte Teilmenge der Grundmenge ausgewählt wird. Vorzugsweise umfasst die anfängliche Auswahl höchstens 100 Scan-Untersuchungen, vorzugsweise höchstens 50 Scan-Untersuchungen. Weiter vorzuziehen ist die zusätzliche Menge von Scan-Untersuchungen, die während jeder der Verfeinerungsschleifen bestimmt wird, kleiner als die Menge von Scan-Untersuchungen, der in der anfänglichen Auswahl ausgewählt wurden, und kann beispielsweise eine Anzahl von 20 oder weniger Scan-Untersuchungen, vorzugsweise 10 Scan-Untersuchungen, sein.

Die Bewertungsmetrik (die auch als ein Auswahlkriterium bezeichnet sein kann) basiert vorzugsweise auf einer Entropie der Scan-Untersuchung und/oder auf einer Position eines Datenpunkts, der die Scan-Untersuchung in dem für das Clustering verwendeten Datenpunktraum repräsentiert. Auf diese Weise kann die Bewertungsmetrik verwendet werden, um solche Scan-Untersuchungen für eine zusätzliche Kennzeichnung, von denen erwartet wird, dass sie die Genauigkeit des Systems für maschinelles Lernen, MLS, am meisten verbessern, zu bestimmen. Solche Scan-Untersuchungen können Scan-Untersuchungen sein, die direkt an einer oder in der Nähe einer Clustergrenze liegen.
Die Entropie von Scan-Untersuchungen kann zusätzlich oder alternativ auch basierend auf den darin enthaltenen Unigrammen (im Wesentlichen dem in den Scan-Untersuchungsmerkmalen enthaltenen Text) bestimmt werden. Ein anderer Begriff für „Unigramm“ ist „1-Gramm“, wobei ein 1-Gramm eine Unterart eines n-Gramms (für eine beliebige positive Ganzzahl n) ist, wobei ein n-Gramm eine zusammenhängende Folge aus n Elementen (z. B. Phonemen, Silben, Buchstaben, Wörtern) aus einer gegebenen Textprobe ist. Anstelle des Wortes „Unigramm“ können auch die Wörter „Elemente“, „Textelemente“ oder „Grundelemente“ verwendet sein. Beispielsweise kann bestimmt werden, wie unterscheidungskräftig die Unigramme in der Scan-Untersuchung insgesamt sind, indem Repräsentationen für unterschiedliche SICs basierend Unigrammen bestimmt werden. Daraus kann bestimmt werden, ob ein spezielles Unigramm eine vergleichsweise höhere Entropie aufweist, d. h. gleichmäßiger in allen Repräsentationen vorhanden und wichtig ist, oder ob das spezielle Unigramm eine vergleichsweise geringere Entropie aufweist, d. h. in weniger Repräsentationen vorhanden ist.
Die höchste Entropie kann einem Unigramm zugewiesen werden, das in jeder Repräsentation mit dem gleichen Gewicht vorhanden ist, so dass es für die Kennzeichnung null Information führt. Die niedrigste Entropie kann einem Unigramm zugewiesen werden, das nur in einer einzigen Repräsentation vorhanden ist (und möglicherweise sogar mit der höchsten Gewichtung aller darin enthaltenen Unigramme), so dass eine hohe Wahrscheinlichkeit besteht, dass eine Scan-Untersuchung, die dieses Unigramm aufweist, für den durch diese einzige Repräsentation repräsentierten SIC klassifiziert wird. Die Entropie einer Scan-Untersuchung kann dann durch die Summe der Entropien ihrer Unigramme bestimmt werden, wobei die Summe eine gewichtete oder eine gleichgewichtete Summe sein kann.
Der (im Folgenden beschriebene) Mechanismus zum Erhöhen oder Erniedrigen der Gewichte von Unigrammen in den Repräsentationen basierend auf den erhaltenen Kennzeichnungen kann dann zum Ändern der Entropie der Unigramme beitragen. Außerdem ist es offensichtlich, dass Scan-Untersuchungen mit hoher Entropie tendenziell schwieriger automatisch zu klassifizieren sind, so dass zu erwarten ist, dass das Trainieren des Systems für maschinelles Lernen, MLS, am meisten von der Kennzeichnung von Scan-Untersuchungen mit hoher Entropie profitiert.
Die vorliegende Erfindung nutzt einen so genannten aktiven Lernansatz (oder: ein aktives Lernmodell), der einen Anwender dabei unterstützt, eine minimale Anzahl von Scan-Untersuchungen zu kennzeichnen, um ein gewünschtes Ergebnis zu erreichen. Die Bewertungsmetrik (oder: das Auswahlkriterium), vorzugsweise basierend auf der Entropie, verbessert die Wahrscheinlichkeiten dafür, dass die (vorzugsweise durch einen Anwender) erhaltenen Kennzeichnungen diejenigen sind, die das System für maschinelles Lernen, MLS, am meisten verbessern.
Die Berechnungsvorrichtung kann als irgendeine Vorrichtung oder irgendein Mittel zum Berechnen, insbesondere zum Ausführen einer Software, einer App oder eines Algorithmus, realisiert sein. Beispielsweise kann die Berechnungsvorrichtung wenigstens eine Verarbeitungseinheit wie z. B. wenigstens eine zentrale Verarbeitungseinheit, CPU, und/oder wenigstens eine Grafikverarbeitungseinheit, GPU, und/oder wenigstens ein feldprogrammierbares Gatter-Array, FPGA, und/oder wenigstens eine anwendungsspezifische integrierte Schaltung, ASIC, und/oder eine irgendeine Kombination der vorgenannten umfassen.
Die Berechnungsvorrichtung kann ferner einen Arbeitsspeicher, der betriebstechnisch mit der wenigstens einen Verarbeitungseinheit verbunden ist, und/oder einen nichttransitorischen Speicher, der betriebstechnisch mit der wenigstens einen Verarbeitungseinheit und/oder einem Arbeitsspeicher verbunden ist, umfassen. Die Berechnungsvorrichtung kann als eine lokale Vorrichtung, als eine entfernte Vorrichtung (z. B. ein Server, der über eine Anwenderschnittstelle mit einem Client entfernt verbunden ist) oder als eine Kombination aus diesen realisiert sein. Ein Teil der oder die gesamte Berechnungsvorrichtung kann auch durch eine Cloud-Computing-Plattform implementiert sein. Das Eingabemodul und/oder das Ausgabemodul können ebenfalls in die Berechnungsvorrichtung integriert sein.
Obwohl hier im Vorstehenden und auch im Folgenden einige Funktionen als durch Module ausgeführt beschrieben werden, ist zu verstehen, dass das nicht notwendigerweise bedeutet, dass solche Module als voneinander getrennte Einheiten bereitgestellt sind. In Fällen, in denen ein oder mehrere Module als Software bereitgestellt sind, können die Module durch Programmcodeabschnitte oder Programmcode-Snippets, die voneinander unterscheidbar sein können, aber auch miteinander verwoben oder integriert sein können, implementiert sein.
Ähnlich können in Fällen, in denen ein oder mehrere Module als Hardware bereitgestellt sind, die Funktionen eines oder mehrerer Module durch ein und dieselbe Hardwarekomponente bereitgestellt sein, oder die Funktionen mehrerer Module können über mehrere Hardwarekomponenten, die nicht notwendigerweise den Modulen entsprechen müssen, verteilt sein. Somit ist irgendein/e Einrichtung, System, Verfahren und so weiter, die/das alle einem spezifischen Modul zugeschriebenen Merkmale und Funktionen aufweist, so zu verstehen, dass es dieses Modul umfasst oder implementiert. Insbesondere besteht die Möglichkeit, dass alle Module durch Programmcode, der durch die Berechnungsvorrichtung, z. B. einen Server oder eine Cloud-Computing-Plattform, ausgeführt wird, implementiert sind.
Gemäß einem zweiten Aspekt der vorliegenden Erfindung ist ein computerimplementiertes Verfahren zum Trainieren eines Systems für maschinelles Lernen zum Abbilden einer Scan-Untersuchung auf einen standardisierten Identifizierungscode, SIC, eines Wörterbuchs für standardisierte Identifizierungscodes, SICD, bereitgestellt. Das Verfahren umfasst die folgenden Schritte:

- Erhalten einer Grundmenge von Scan-Untersuchungen, BSSS;
- Klassifizieren unter Verwendung eines Clustering-Algorithmus der Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS, in mehrere Cluster;
- Auswählen wenigstens einer Scan-Untersuchung aus jedem Cluster;
- Erhalten von SIC-Kennzeichnungen für die ausgewählten Scan-Untersuchungen, um eine Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu erzeugen;
- Trainieren eines Systems für maschinelles Lernen, MLS, unter Verwendung der gekennzeichneten Scan-Untersuchungen, um individuelle Scan-Untersuchungen auf einen entsprechenden SIC des SICD abzubilden;
- Ausführen wenigstens einer Verfeinerungsschleife, umfassend:
- Bestimmen einer zusätzlichen Menge von Scan-Untersuchungen aus der Grundmenge von Scan-Untersuchungen, BSSS, basierend auf einer Bewertungsmetrik;
- Erhalten von SIC-Kennzeichnungen für die Scan-Untersuchungen in der bestimmten Menge von Scan-Untersuchungen, um die Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu erweitern;
- erneutes Trainieren des Systems für maschinelles Lernen, MLS, unter Verwendung wenigstens der erweiterten Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS.

Es ist zu verstehen, dass das Verfahren gemäß dem zweiten Aspekt der vorliegenden Erfindung unter Verwendung der Einrichtung gemäß dem ersten Aspekt der vorliegenden Erfindung ausgeführt werden kann. Somit kann die Einrichtung basierend auf irgendeiner für das Verfahren beschriebenen Option, Modifikation, Variante oder Verfeinerung angepasst, verändert oder verfeinert werden, und umgekehrt.
Gemäß einem dritten Aspekt stellt die Erfindung ein Computerprogrammprodukt bereit, das ausführbaren Programmcode umfasst, der dazu ausgelegt ist, dann, wenn er ausgeführt wird, das Verfahren gemäß irgendeiner Ausführungsform des zweiten Aspekts der vorliegenden Erfindung auszuführen.
Gemäß einem vierten Aspekt stellt die Erfindung ein nicht-transientes computerlesbares Datenspeichermedium bereit, das ausführbaren Programmcode umfasst, der dazu ausgelegt ist, dann, wenn er ausgeführt wird, das Verfahren gemäß irgendeiner Ausführungsform des zweiten Aspekts der vorliegenden Erfindung auszuführen.
Das nicht-transiente computerlesbare Datenspeichermedium kann irgendeine Art von Computerspeicher, insbesondere einen Halbleiterspeicher wie z. B. einen Festkörperspeicher, umfassen oder daraus bestehen. Das Datenspeichermedium kann auch eine CD, eine DVD, eine Blu-Ray-Disc, ein USB-Speicherstick oder dergleichen umfassen oder daraus bestehen.
Gemäß einem fünften Aspekt stellt die Erfindung einen Datenstrom bereit, der Programmcode repräsentiert oder dazu ausgelegt ist, ihn bereitzustellen, der dazu ausgelegt ist, dann, wenn er ausgeführt wird, das Verfahren gemäß irgendeiner Ausführungsform des zweiten Aspekts der vorliegenden Erfindung auszuführen.
Gemäß einem sechsten Aspekt stellt die Erfindung eine Verwendung eines Systems für maschinelles Lernen, MLS, das unter Verwendung des Verfahrens gemäß irgendeiner Ausführungsform des zweiten Aspekts der vorliegenden Erfindung trainiert ist, zum Abbilden einer Scan-Untersuchung auf einen standardisierten Identifizierercode, SIC, insbesondere auf eine RadLex-ID, RPID, bereit.
Hier und im Folgenden sind für einige (insbesondere längere) Begriffe Abkürzungen verwendet (z. B. „CNN“ für „neuronales Faltungsnetz“). Üblicherweise werden die Begriffe gefolgt von den entsprechenden Abkürzungen angegeben. In einigen Fällen wird, um die Lesbarkeit zu verbessern, nur die Abkürzung verwendet, während in anderen Fällen nur der Begriff selbst verwendet wird.
Eine oder mehrere Funktionen, Verfahrensschritte oder Module können durch eine Cloud-Computing-Plattform implementiert sein oder ausgeführt werden. Bei Systemen, die auf der Cloud-Computing-Technologie basieren, ist eine große Anzahl von Vorrichtungen über das Internet mit einem Cloud-Computing-System verbunden. Die Geräte können sich in einer entfernten Anlage, die mit dem Cloud-Computing-System verbunden ist, befinden. Die Vorrichtungen können beispielsweise eine Ausrüstung, Sensoren, Aktoren, Roboter und/oder Maschinen in einer oder mehreren industriellen Anlage(n) umfassen oder daraus bestehen. Die Vorrichtungen können medizinische Vorrichtungen und Ausrüstungen in einer Einheit des Gesundheitswesens sein. Die Vorrichtungen können Haushaltsgeräte oder Bürogeräte in einem Wohn-/Gewerbebetrieb sein.
Das Cloud-Computing-System kann die Fernkonfiguration, -überwachung, -steuerung und -wartung verbundener Vorrichtungen (auch allgemein als ‚Anlagevermögen‘ bezeichnet) ermöglichen. Außerdem kann das Cloud-Computing-System das Speichern großer Datenmengen, die periodisch von den Vorrichtungen gesammelt werden, das Analysieren der großen Datenmengen und das Bereitstellen von Erkenntnissen (z. B. wichtige Leistungsindikatoren, Ausreißer) und Warnungen für Bediener, Außendiensttechniker oder Eigentümer der Vorrichtungen über eine grafische Benutzeroberfläche (z. B. von Webanwendungen) erleichtern. Die Erkenntnisse und Warnungen können das Steuern und Warten der Vorrichtungen ermöglichen, was zu einem effizienten und ausfallsicheren Betrieb der Vorrichtungen führt. Das Cloud-Computing-System kann auch das Modifizieren von Parametern, die den Geräten zugeordnet sind, ermöglichen und gibt Steuerbefehle über die grafische Benutzeroberfläche basierend auf den Erkenntnissen und Warnungen aus.
Das Cloud-Computing-System kann mehrere Server oder Prozessoren (auch als ‚Cloud-Infrastruktur‘ bezeichnet), die geografisch verteilt und über ein Netz miteinander verbunden sind, umfassen. Auf den Servern/Prozessoren ist eine dedizierte Plattform (nachstehend als ‚Cloud-Computing-Plattform‘ bezeichnet) installiert, die die vorstehend genannte Funktionalität als einen Dienst (nachstehend ‚Cloud-Dienst‘ bezeichnet) bereitstellt. Die Cloud-Computing-Plattform kann mehrere Softwareprogramme umfassen, die auf einem oder mehreren Servern oder Prozessoren des Cloud-Computing-Systems ausgeführt werden, um die Lieferung des angeforderten Dienstes für die Vorrichtungen und ihre Anwender zu ermöglichen.
Eine oder mehrere Anwendungsprogrammierschnittstellen (APIs) sind in dem Cloud-Computing-System eingesetzt, um verschiedene Cloud-Dienste für die Anwender zu liefern.
Zusätzliche vorteilhafte Verfeinerungen, Varianten und Optionen der und für die im Vorstehenden beschriebenen Ausführungsformen ergeben sich aus den abhängigen Ansprüchen sowie aus der folgenden Beschreibung zusammen mit den beigefügten Zeichnungen.
In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen der Einrichtung gemäß der vorliegenden Erfindung ist das Kennzeichnungsmodul als ein Mensch-Maschine-Interaktionsmodul (HMIM) ausgelegt, das dazu ausgelegt ist, einem Anwender als Kennzeichnungsaufgaben durch das Kennzeichnungsaufgabenbestimmungsmodul, LTDM, ausgewählte Scan-Untersuchungen unter Verwendung einer grafischen Benutzeroberfläche anzuzeigen und Kennzeichnungen für die ausgewählten und angezeigten Scan-Untersuchungen als Antworten des Anwenders auf die Kennzeichnungsaufgaben zu erhalten. Auf diese Weise wird eine geführte Mensch-Maschine-Interaktion bereitgestellt, die die Kennzeichnungsfähigkeiten des Anwenders auf effizienteste Weise nutzbar macht.
In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen umfasst das System für maschinelles Lernen, MLS, ein protokollbestimmendes künstliches neuronales Netz, PDANN, das dazu ausgelegt ist, für eine Scan-Untersuchung einen Protokollnamen, mit dem die Scan-Untersuchung bezeichnet werden kann, zu bestimmen, und wobei das System für maschinelles Lernen das PDANN umfasst. Der Protokollname ist eine (normalerweise geordnete) Liste von Token oder Unigrammen, d. h. von Wörtern und/oder Abkürzungen, die durch Buchstaben und/oder Zahlen ausgedrückt sind und zum Identifizieren oder Bezeichnen einer speziellen Scan-Folge, wie sie in einem Krankenhaus oder einer Forschungsinstitution ausgeführt wird, dienen. Da Scan-Untersuchungen (fast) immer mit Protokollnamen versehen sind, ist eine große Anzahl von Trainingsdaten zum Trainieren eines solchen PDANN vorhanden, ohne dass irgendwelche zusätzliche Schritte erforderlich sind.
In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen des Verfahrens gemäß der vorliegenden Erfindung werden die SIC-Kennzeichnungen erhalten, indem einem Anwender, vorzugsweise unter Verwendung einer grafischen Benutzeroberfläche, Kennzeichnungsaufgaben für die ausgewählten Scan-Untersuchungen präsentiert werden und die Eingaben des Anwenders als Kennzeichnungen für die ausgewählten Scan-Untersuchungen empfangen werden. Das stellt eine einfache und intuitive Art bereit, auf die der Anwender die Scan-Untersuchungen kennzeichnen kann. Das Präsentieren der Kennzeichnungsaufgaben kann es dem Anwender ermöglichen, alle Einzelheiten oder Merkmale der Scan-Untersuchungen zu betrachten, z. B. ihre Texteinträge, die mit dieser Scan-Untersuchung erhaltenen Bilder und/oder dergleichen.
In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen werden zum Trainieren des Systems für maschinelles Lernen, MLS, basierend auf Vektorisierungsoperationen, die an Scan-Untersuchungen des erweiterten TSLSS ausgeführt werden, zusätzliche virtuelle Scan-Untersuchungen oder Merkmale davon erzeugt. Wenigstens das abschließende Neu-Trainieren (z. B. ein Neu-Trainieren innerhalb einer abschließenden Verfeinerungsschleife) des Systems für maschinelles Lernen, MLS, wird unter Verwendung der erweiterten TSLSS und der zusätzlichen virtuellen Scan-Untersuchungen oder deren Merkmale ausgeführt. In Varianten, in denen die Erfüllung eines Abbruchkriteriums für die Verfeinerungsschleife vor dem Ausführen des Neu-Trainierens nicht bekannt ist, kann ein zusätzliches Neu-Trainieren nach der abschließenden Verfeinerungsschleife ausgeführt werden. In einigen Untervarianten werden während der Verfeinerungsschleife nur die tatsächlich gekennzeichneten Scan-Untersuchungen verwendet, und erst bei dem zusätzlichen Neu-Trainieren nach der abschließenden Verfeinerungsschleife werden die zusätzlichen virtuellen Scan-Untersuchungen oder deren Merkmale verwendet. In anderen Varianten, bei denen die Erfüllung des Abbruchkriteriums für die Verfeinerungsschleifen vor dem Neu-Trainieren bekannt ist (z. B. wenn eine feste Anzahl von Verfeinerungsschleifen erreicht ist), kann das abschließende Neu-Trainieren das Neu-Trainieren innerhalb der letzten Verfeinerungsschleife sein.
Merkmale virtueller Scan-Untersuchungen können so verstanden werden, dass sie sich auf die Werte von Knoten wenigstens einer verdeckten Schicht eines Teils des Systems für maschinelles Lernen, MLS, beziehen. Somit kann keine tatsächliche Scan-Untersuchung vorhanden sein, die in das MLS eingefügt ist, vorhanden sein, jedoch besitzt das Bereitstellen von Werten für die wenigstens eine verdeckte Schicht für das MLS die gleiche Wirkung, als ob eine Scan-Untersuchung eingegeben worden wäre. Somit können Merkmale einer virtuellen Scan-Untersuchung bereitgestellt werden, ohne dass eine virtuelle Scan-Untersuchung selbst bereitgestellt wird.
In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen werden zusätzliche virtuelle Scan-Untersuchungen durch Hinzufügen von Rauschen zu Scan-Untersuchungen, für die Kennzeichnungen erhalten worden sind, erzeugt. Das Rauschen kann beispielsweise in Form zusätzlicher Unigramme hinzugefügt werden, die der Liste von Unigrammen der Scan-Untersuchung hinzugefügt werden. In diesem Fall ist es vorzuziehen, dass Wörter hinzugefügt werden, für die bestimmt worden ist, dass sie eine vergleichsweise geringe Auswirkung auf das Abbilden der Scan-Untersuchungen besitzen. Als eine Alternative kann das Rauschen als numerisches Rauschen zu Merkmalen einer verdeckten Schicht eines Teils des Systems für maschinelles Lernen, MLS, hinzugefügt werden. Wenigstens das abschließende Neu-Trainieren (z. B. ein Neu-Trainieren innerhalb einer abschließenden Verfeinerungsschleife) des Systems für maschinelles Lernen, MLS, wird unter Verwendung der erweiterten TSLSS und deren zusätzlichen virtuellen Scan-Untersuchungen ausgeführt. Optionen und Varianten hinsichtlich des abschließenden Neu-Trainierens sind im Vorstehenden beschrieben worden.
In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen umfasst das Verfahren das Erzeugen von Repräsentationen für die SICs basierend auf gewichteten Unigrammen. Unter anderen Verwendungen ermöglicht das das Bestimmen der Wichtigkeit von Unigrammen für die Repräsentationen, was wiederum zum Bestimmen einer Bewertungsmetrik (oder eines Auswahlkriteriums) zum Auswählen der zu kennzeichnenden Aufgaben verwendet werden kann.
In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen werden die erzeugten Repräsentationen für die SICs wenigstens einmal basierend auf den erhaltenen SIC-Kennzeichnungen aktualisiert.
In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen werden die Repräsentationen für die SICs aktualisiert, indem die Gewichte der gewichteten Unigramme innerhalb der Repräsentationen basierend auf einer Bestimmung, wie groß die Auswirkungen einer Hinzufügung und/oder Löschung jedes Unigramms für die Entscheidung darüber sind, ob eine spezifische Scan-Untersuchung in einen speziellen SIC klassifiziert wird, geändert werden.
In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen umfasst das System für maschinelles Lernen, MLS, ein protokollbestimmendes künstliches neuronales Netz (PDANN), das dazu ausgebildet ist, für eine Scan-Untersuchung einen Protokollnamen, mit dem die Scanstudie bezeichnet werden kann, zu bestimmen, und wobei das Abbilden der Scan-Untersuchung auf den SIC durch das MLS teilweise und wenigstens indirekt auf der Ausgabe des PDANN basierend auf der Scan-Untersuchung basiert.
In einigen vorteilhaften Ausführungsformen, Verfeinerungen oder Varianten von Ausführungsformen, bei denen die Verfeinerungsschleife iteriert wird, bis ein Abbruchkriterium erfüllt ist, wobei das Abbruchkriterium eines der oder alle folgenden Kriterien umfassen kann:

- eine im Voraus definierte Anzahl von Kennzeichnungen ist erhalten worden;
- eine im Voraus definierte Anzahl von Iterationen ist ausgeführt worden; und/oder
- die Leistung des neu trainierten Systems für maschinelles Lernen, MLS, verbessert sich oberhalb eines speziellen Schwellenwerts nicht mehr signifikant oder bleibt nach einem speziellen Schwellenwert konstant.

Die Erfindung wird unter Bezugnahme auf beispielhafte Ausführungsformen, die in den beigefügten Zeichnungen abgebildet sind, näher erläutert.
Die begleitenden Zeichnungen sind aufgenommen, um ein besseres Verständnis der vorliegenden Erfindung bereitzustellen, und sind in diese Spezifikation integriert und bilden einen Teil davon. Die Zeichnungen stellen die Ausführungsformen der vorliegenden Erfindung dar und dienen zusammen mit der Beschreibung dazu, die Prinzipien der Erfindung zu erläutern. Andere Ausführungsformen der vorliegenden Erfindung und viele der beabsichtigten Vorteile der vorliegenden Erfindung sind leicht zu erkennen, wenn sie unter Bezugnahme auf die folgende ausführliche Beschreibung besser verstanden werden. Die Elemente der Zeichnungen sind in Bezug aufeinander nicht notwendigerweise maßstabsgerecht. Gleiche Bezugszeichen bezeichnen entsprechende ähnliche Teile.
In den Figuren zeigen:

1 ein schematisches Blockdiagramm, das eine Einrichtung gemäß einer Ausführungsform des ersten Aspekts der vorliegenden Erfindung darstellt;
2 ein schematisches Ablaufdiagramm, das ein Verfahren gemäß einer Ausführungsform des zweiten Aspekts der vorliegenden Erfindung darstellt;
3 ein schematisches Blockdiagramm, das ein Computerprogrammprodukt gemäß einer Ausführungsform des dritten Aspekts der vorliegenden Erfindung darstellt; und
4 ein schematisches Blockdiagramm, das ein Datenspeichermedium gemäß einer Ausführungsform des vierten Aspekts der vorliegenden Erfindung darstellt.

Genaue Beschreibung der Erfindung
Obwohl hier spezifische Ausführungsformen dargestellt und beschrieben worden sind, werden normale Fachleute erkennen, dass die gezeigten und beschriebenen spezifischen Ausführungsformen durch eine Vielzahl alternativer und/oder äquivalenter Implementierungen ersetzt werden können, ohne von dem Schutzbereich der vorliegenden Erfindung abzuweichen. Im Allgemeinen soll diese Anmeldung alle Anpassungen oder Variationen der hier diskutierten spezifischen Ausführungsformen abdecken.
1 zeigt ein schematisches Blockdiagramm, das eine Ausführungsform des ersten Aspekts der vorliegenden Erfindung darstellt, d. h. eine Einrichtung 1000 zum Trainieren eines Systems für maschinelles Lernen, MLS 200, zum Abbilden einer Scan-Untersuchung 71 auf einen standardisierten Identifizierercode, SIC, eines Wörterbuchs für standardisierte Identifizierercodes, SICD. Zur Veranschaulichung werden das RadLex Playbook und seine RPIDs verwendet. Es ist jedoch zu verstehen, dass alternativ auch irgendein anderes SICD verwendet werden kann.
Bei der Beschreibung der Einrichtung 1000 von 1 wird gleichzeitig auch ein Verfahren gemäß einer Ausführungsform des zweiten Aspekts der vorliegenden Erfindung mit Bezug auf 2 beschrieben. Es ist zu verstehen, dass das Verfahren gemäß 2 unter Verwendung der Einrichtung 1000 gemäß 1 ausgeführt werden kann. Somit kann die Einrichtung 1000 basierend auf irgendeiner für das Verfahren beschriebenen Option, Modifikation, Variante oder Verfeinerung angepasst, verändert oder verfeinert werden, und umgekehrt.
2 zeigt ein schematisches Ablaufdiagramm, das ein Verfahren gemäß einer Ausführungsform des zweiten Aspekts der vorliegenden Erfindung darstellt, d. h. ein Verfahren zum Trainieren eines Systems für maschinelles Lernen, MLS 200, zum Abbilden einer Scan-Untersuchung 71 auf einen standardisierten Identifizierercode, SIC, eines Wörterbuchs für standardisierte Identifizierercodes, SICD. Obwohl das Verfahren von 2 zusammen mit der Einrichtung 1000 von 1 beschrieben wird, ist zu verstehen, dass das Verfahren von 2 nicht darauf beschränkt ist, unter Verwendung der Einrichtung 1000 ausgeführt zu werden, obwohl dies eine bevorzugte Variante ist.
Die Einrichtung 1000 umfasst eine Eingabeschnittstelle 1100, die dazu ausgelegt ist, eine Grundmenge von Scan-Untersuchungen, BSSS 71, zu erhalten. Einige der Scan-Untersuchungen aus der Grundmenge von Scan-Untersuchungen, BSSS 71, können gekennzeichnet sein, obwohl für das vorliegende Beispiel angenommen wird, dass alle Scan-Untersuchungen nicht gekennzeichnet sind. In dem vorliegenden Kontext ist gekennzeichnet so zu verstehen, dass es bedeutet, dass die Scan-Untersuchung korrekt auf einen SIC abgebildet worden ist, beispielsweise eine RadLex-Playbook-ID, RPID. Für die vorliegende Diskussion wird angenommen, dass eine Anzahl von N_M Scan-Untersuchungen in der Grundmenge von Scan-Untersuchungen, BSSS 71, enthalten ist, und die individuellen Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS 71, werden manchmal durch s_m bezeichnet, wobei der Index m von 1 bis N_M läuft.
Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1100 zum Erhalten der Grundmenge von Scan-Untersuchungen, BSSS 71, z. B. unter Verwendung der Eingabeschnittstelle 1100, umfassen.
Die Einrichtung 1000 umfasst ferner eine Berechnungsvorrichtung 1500. Die Berechnungsvorrichtung 1500 kann ein Vorverarbeitungsmodul 1501 implementieren, das dazu ausgelegt ist, Extrahieren und/oder Bereinigen von über die Eingabeschnittstelle 1100 erhaltenen oder empfangenen Daten, insbesondere der Grundmenge von Scan-Untersuchungen, BSSS 71, auszuführen.
Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1501 zum Vorverarbeiten der in Schritt S1100 erhaltenen Grundmenge von Scan-Untersuchungen, BSSS 71, umfassen.
Die Scan-Untersuchungen können als Tupel (x, y, z) repräsentiert sein, wobei x ein Untervektor ist, der aus einer Liste von Merkmalen besteht, y ein Protokollname ist, der ein Protokoll, mit dem die Scan-Untersuchung ausgeführt worden ist, gemäß den Merkmalen x angibt, und z die in der Scan-Untersuchung erfassten Bilddaten sind. Die Merkmale x können beispielsweise Folgendes umfassen:

- eine Beschreibung der Untersuchung
- eine Beschreibung der Reihe
- ein maximales Dosis-Länge-Produkt, maxDLP
- maxCTDIVolume
- eine Untersuchungslänge
- und/oder dergleichen.

Die Untersuchungslänge sc kann aus anderen Merkmalen, insbesondere aus maxDLP und maxCTDIVolume, abgeleitet werden durch: $sc = (maxDLP/maxCTDIVolume) * 100$
Das Protokoll ist in dem vorliegenden Kontext eine Menge von Regeln, die definiert sind, um eine Bilderfassungsprozedur zum Erfassen einer Scan-Untersuchung auszuführen. Der Protokollname ist eine (normalerweise geordnete) Liste von Token oder Unigrammen, d. h. von Wörtern und/oder Abkürzungen, die durch Buchstaben und/oder Zahlen ausgedrückt sind. Aus den Protokollnamen (und optional zusätzlich anderen Textfeldern der Scan-Untersuchungs-Merkmale x) aller Scan-Untersuchungen aus der Grundmenge von Scan-Untersuchungen, BSSS 71, kann ein Vokabular erzeugt werden. Das Vokabular kann dann mit Techniken zur Verarbeitung natürlicher Sprache, NLP-Techniken, wie z. B. Worteinbettungen und dergleichen, bearbeitet werden.
Der Protokollname ist normalerweise spezifisch für Hersteller von Scan-Vorrichtungen und/oder für Anwender wie z. B. Krankenhäuser oder Forschungsinstitutionen. Der Protokollname enthält üblicherweise ein Token oder ein Wort, das einen Körperbereich spezifiziert (z. B. „Abdomen“), obwohl unterschiedliche Hersteller oder Anwender die gleichen (oder teilweise überlappenden) Körperbereiche gleich oder unterschiedlich bezeichnen können. Beispielsweise kann die im Wesentlichen gleiche Körperregion in einem durch einen Hersteller A verwendeten Protokollschema als „Kopf“ bezeichnet sein und in einem weiteren durch einen Hersteller B verwendeten Protokollschema als „Gehirn“ bezeichnet sein. Als ein weiteres Beispiel kann selbst innerhalb einer Institution ein Anwender (z. B. ein Arzt oder ein technischer Assistent) die Bezeichnung „Kopf“ verwenden, und der andere kann die Bezeichnung „Gehirn“ verwenden. Jeder Hersteller kann für dieselbe Körperregion mehrere Protokolle für denselben Typ von Untersuchung verwenden, die sich gemäß dem Alter des Patienten unterscheiden, wobei zwischen verschiedenen Herstellern A, B unterschiedliche Altersgruppen definiert sein können.
Der Protokollname kann auch ein Token enthalten, das einen Typ des ausgeführten Scans angibt, und er kann optional zusätzliche Token enthalten, die beispielsweise angeben, ob optionale zusätzliche Maßnahmen ergriffen worden sind oder nicht. Beispielsweise kann das Protokoll eine Angabe enthalten, dass ein Kontrastmittel verabreicht worden ist oder nicht verabreicht worden ist.
Die Berechnungsvorrichtung 1500 ist ferner dazu ausgelegt, ein Clustering-Modul 1510 zu implementieren. Der allgemeine Zweck des Clustering-Moduls 1510 ist das Clustern der Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS 71, mit der Absicht, später so weit wie möglich die Cluster mit SICs des SICD zu identifizieren.
Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1510 zum Clustern der Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS 71, umfassen, wie im Folgenden auf der Basis einer Anzahl von Teilschritten des Schritts S1510 beschrieben wird. Alle Funktionen, die als Teil der Funktion des Clustering-Moduls 1510 beschrieben sind, können auch so verstanden werden, dass sie als Teil oder als Teilschritte von Schritt S1510 ausgeführt werden.
Das Clustering-Modul 1510 kann ein protokollbestimmendes künstliches neuronales Netz, PDANN 1511 (oder insbesondere: ein protokollnamenbestimmendes künstliches neuronales Netz, PNDANN) umfassen, das vorzugsweise in Form eines neuronalen Faltungsnetzes, CNN, bereitgestellt ist. Das PDANN 1511 kann dazu ausgelegt sein, als Eingabe wenigstens einen Teil der Merkmale x jeder Untersuchung s_m s_m = (x_m, y_m, z_m) zu empfangen. Beispielsweise können Teile von x, von denen bekannt ist, dass sie für die vorliegende Aufgabe keine Bedeutung haben (z. B. Zeitstempel), nicht Teil der Eingabe sein.
Die Eingabe kann optional auch die Bilddaten z und ebenfalls optional Daten aus Bildanalysewerkzeugen, die eine Analyse der Bilddaten z ausgeführt haben, umfassen.
Für die Eingabe des PDANN 1511 können alle Unigramme, die in den Merkmalen x vorhanden sind, in ein Datenfeld zusammen gruppiert werden, und der Textinhalt jeder Scan-Untersuchung kann dann durch einen Vektor V mit so vielen Einträgen , wie das Vokabular Unigramme aufweist, repräsentiert sein, wobei jeder Eintrag die Anzahl der Unigramme innerhalb der Scan-Untersuchung s_m = (x_m, y_m, z_m), die diesem Vektor zugeordnet ist, angibt. Übliche Zählvektorisierertechniken, die sich mit zu häufigen oder zu unbestimmten Wörtern befassen, können angewandt werden. Alle Vektoren V können verwendet werden, um eine N_M × N_V-dimensionale Matrix zu bilden, wobei die Anzahl der Scan-Untersuchungen und N_V die Anzahl der Unigramme im Vokabular sind. Der Vektor V(s_m) kann als ein „Textvektor einer Scan-Untersuchung“ bezeichnet sein, da der Vektor V(s_m) den in der Scan-Untersuchung s_m = (x_m, y_m, z_m) enthaltenen Text beschreibt. Die Matrix mit den Einträgen T_ij, die jeweils durch den j-ten Eintrag des Textvektors V(s_i)_j der i-ten Scan-Untersuchung s_i gegeben sind, kann als die Textmatrix des BSSS 71 bezeichnet sein.
Das PDANN 1511 ist ferner dazu ausgelegt, basierend auf seiner Eingabe einen Vektor U auszugeben, der angibt, mit welcher Wahrscheinlichkeit die Eingabe welchem Protokoll (oder genauer: welchem Protokollnamen) zuzuordnen ist (oder: für ihn zu klassifizieren ist). Dieser Vektor U kann als ein Protokollklassifizierungsvektor, PCV, bezeichnet sein.
Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1511 zum Erzeugen unter Verwendung eines PDANN 1511 eines Vektors U, der angibt, mit welcher Wahrscheinlichkeit die Eingabe dem Protokollnamen zuzuordnen ist (oder: für ihn zu klassifizieren ist), umfassen. Wieder kann eine Matrix A erzeugt werden, deren Einträge A_ij durch den i-ten Eintrag des Vektors U_i für die i-te Scan-Untersuchung s_j gegeben sind. Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1511 zum Erzeugen unter Verwendung eines protokollbestimmenden künstlichen neuronalen Netzes, PDANN 1511, eines Vektors U, der angibt, mit welcher Wahrscheinlichkeit die Eingabe welchem Protokollnamen aus einer Liste verfügbarer Protokollnamen zuzuordnen ist (oder: für ihn zu klassifizieren ist), wobei die Eingabe des PDANN 1511 auf einer der Scan-Untersuchungen s_m basiert, so dass der ausgegebene Vektor U angibt, für welchen Protokollnamen die entsprechende Scan-Untersuchung s_m klassifiziert werden sollte.
Idealerweise kann eine Liste verfügbarer Protokolle in einem Speicher 1502 der Berechnungsvorrichtung 1500 gespeichert sein, wobei jedem Protokoll eine Ganzzahl zugeordnet ist. Diese Ganzzahl kann einem Index (d. h. einem Eintrag) des ausgegebenen Protokollklassifizierungsvektors U des protokollbestimmenden künstlichen neuronalen Netzes, PDANN 1511, der unter Verwendung einer Softmax-Aktivierungsfunktion in der letzten Schicht erzeugt werden kann, entsprechen. Somit wird der ausgegebene Protokollklassifizierungsvektor U so viele Indizes aufweisen, wie verfügbare Protokolle in der Liste der verfügbaren Protokolle vorhanden sind. Der ausgegebene Protokollklassifizierungsvektor U wird in jedem Eintrag mit dem Index i eine reelle Zahl P_i aufweisen, die die Wahrscheinlichkeit angibt, dass die durch das PDANN 1511 zum Erzeugen des ausgegebenen Vektors U verwendete Eingabe dem durch die Ganzzahl i charakterisierten Protokoll zugeordnet werden sollte, wobei aufgrund der Softmax-Aktivierungsfunktion Σ_iP_i=1 ist.
Das protokollbestimmende künstliche neuronale Netz, PDANN 1511, wird vorzugsweise unter Verwendung des Protokollnamens y der Scan-Untersuchungen s_m als Kennzeichnungen trainiert. Der Zweck dahinter ist das Trainieren des PDANN 1511, um zu erkennen, welche Unigramme und Merkmale sich am besten zum Bestimmen des Protokollnamens einer Scan-Untersuchung eignen. Basierend auf diesen Informationen kann abgeleitet werden, welche Unigramme am wichtigsten sind oder am meisten zu der Entscheidung, dass eine spezielle Scan-Untersuchung zu einer speziellen Körperregion gehört, beitragen.
Das Verfahren gemäß der vorliegenden Erfindung kann deshalb auch einen Schritt zum Trainieren des PDANN 1511 auf diese Weise umfassen.
Die Berechnungsvorrichtung 1500 ist ferner dazu ausgelegt, ein Protokollrepräsentationsbestimmungsmodul, PRDAM 1512, zu implementieren. Das PRDAM 1512 ist dazu ausgelegt, basierend auf der Grundmenge von Scan-Untersuchungen, BSSS 71, eine Repräsentation für jedes Protokoll zu bestimmen.
Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1512 zum Bestimmen einer Repräsentation für jedes Protokoll basierend auf der Grundmenge von Scan-Untersuchungen, BSSS 71, umfassen.
Die Repräsentation ist vorzugsweise eine gewichtete Summe von Unigrammen. Beispielsweise kann die Repräsentation eines speziellen Protokolls für jedes Unigramm in dem Vokabular angeben, wie groß der Einfluss dieses Unigramm auf die Entscheidung des PDANN 1511 ist, die Scan-Untersuchung für dieses Protokoll zu klassifizieren.
Die Repräsentation B₁ für jedes Protokoll 1 kann auf folgende Weise bestimmt werden:

Das protokollbestimmende künstliche neuronale Netz, PDANN 1511, ist trainiert worden, wie vorstehend beschrieben, jede der Scan-Untersuchungen unter Verwendung des Protokollklassifizierungsvektors U in ein Protokoll zu klassifizieren. Das Protokollrepräsentationsbestimmungsmodul,
PRDAM 1512, ist dazu ausgelegt, die Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS 71, zu modifizieren und basierend auf den Änderungen, die dies an der Ausgabe des protokollbestimmenden künstlichen neuronalen Netzes, PDANN 1511, bewirkt, die Repräsentation jedes Protokolls zu bestimmen.

Eine bevorzugte Implementierung dieser Prozedur wird zunächst an Hand einer einzelnen Scan-Untersuchung beschrieben. Es ist angenommen, dass die Scan-Untersuchung einen Text, der aus den Unigrammen (u1, u2, u3, u4) besteht, umfasst. Mit anderen Worten wird der Textvektor V(s_m) der Scan-Untersuchung s_m ganzzahlige Einträge ungleich Null bei den Indizes, die u1, u2, u3 und u4 entsprechen, aufweisen. Das PRDAM 1512 führt einen oder beide der folgenden zwei Schritte aus (die auch in dem Verfahren gemäß der vorliegenden Erfindung enthalten sein können):

a) Hinzufügen zu diesem ursprünglichen Textvektor V(s_m) einzelner zusätzlicher Unigramme u_i, die in dem ursprünglichen Textvektor V nicht vorhanden sind, um einen geänderten Textvektor V⁺ (s_m, u_i) zu erzeugen;
b) Entfernen aus diesem ursprünglichen Textvektor V einzelner Unigramme u_j, die Teil des ursprünglichen Textvektors V sind, um einen geänderten Textvektor V^- (s_m,u_j) zu erzeugen.

Das Hinzufügen eines Unigramms u_i kann durch Einstellen des Eintrags mit dem Index i in dem ursprünglichen Textvektor V auf „1“ erfolgen, und das Entfernen eines Unigramms u_j kann durch Einstellen des Eintrags mit dem Index j in dem ursprünglichen Textvektor V auf „0“ erfolgen.
Falls beide Schritte a) und b) ausgeführt werden, bedeutet das, dass für jedes Unigramm im Vokabular ein geänderter Textvektor erzeugt wird: die V⁺ (s_m, u_i) behandeln die Unigramme, die nicht Teil des ursprünglichen Textvektors V sind, und die V^-(s_m,u_j) behandeln die Unigramme, die Teil des ursprünglichen Textvektors V sind.
Die geänderten Textvektoren V⁺ (s_m, u_i) und/oder V^- (s_m,u_j) werden dann nacheinander in das Protokollrepräsentationsbestimmungsmodul, PRDAM 1512, eingegeben, und der entsprechende geänderte Protokollklassifizierungsvektor U (V⁺ (s_m, u_j)), U (V^-(s_m,u_j)) wird erzeugt und mit dem ursprünglichen Protokollklassifizierungsvektor U (V) des ursprünglichen Textvektors verglichen.
Für die Scan-Untersuchung und jedes Protokoll 1 wird die Differenz der Wahrscheinlichkeit P₁ zwischen dem ursprünglichen Protokollklassifizierungsvektor U(V) und dem geänderten Protokollklassifizierungsvektor U (V⁺ (s_m, u_i) U (V^- (s_m,u_j)) berechnet: $δ P_{1} (m, u_{i}) : = U {(V^{+} (s_{m}, u_{i}))}_{1} - U {(V (s_{m}))}_{1},$
$δ P_{1} (m, u_{j}) : = U {(V^{-} (s_{m}, u_{j}))}_{1} - U {(V (s_{m}))}_{1},$
wobei ":=" eine Definition bezeichnet und U(V)₁ der 1-te Eintrag (d. h. Eintrag mit dem Index 1) des Protokollklassifizierungsvektors U ist und U (V⁺ (s_m,u_i))₁ der 1-te Eintrag des geänderten Protokollklassifizierungsvektors U (V⁺ (s_m, u_i)) ist. Es sei daran erinnert, dass der 1-te Eintrag U(V)₁ des Protokollklassifizierungsvektors die Wahrscheinlichkeit P₁ ist, dass das Protokoll 1 die optimale Beschreibung für eine bestimmte Scan-Untersuchung ist.
Mit anderen Worten ist δP₁(m,u_i) ein Maß dafür, wie stark das Unigramm u_i die Wahrscheinlichkeit dafür, dass die Scan-Untersuchung mit dem Index m mit dem Protokoll 1 klassifiziert wird, beeinflusst.
Eine anfängliche Repräsentation jedes Protokolls 1 kann dann durch Nehmen der gewichteten Summe über jedes Unigramm erzeugt werden, wobei jedes Unigramm mit der Gesamtheit der δP₁(m,u_i) für alle Scan-Untersuchungen m normalisiert durch N_M gewichtet wird. Wenn N_L Protokolle in der Liste verfügbarer Protokolle vorhanden sind und jede Repräsentation eines Protokolls mit B₁, 1 im Bereich von 1 bis N_L, bezeichnet ist, dann: $B_{1} = \sum_{i = 1}^{N_{V}} u_{i} \sum_{m = 1}^{N_{M}} \frac{δ P_{l} (m, u_{i})}{N_{M}}$
Diese Prozedur führt dazu, dass die Repräsentationen der Protokolle dadurch charakterisiert sind, wie groß der Einfluss der einzelnen Unigramme für das Protokoll ist, mit anderen Worten wie charakteristisch sie sind. Zum Beispiel kann ein Protokoll 1, das sich auf einen Scan eines Kopfes bezieht, in seiner Repräsentation B₁ vergleichsweise höhere Gewichtungen für Unigramme wie „Kopf“, „Gehirn“ usw. und vergleichsweise niedrigere Gewichtungen für Unigramme wie „Brust“, „Abdomen“ oder dergleichen aufweisen. Als Nebenbemerkung sind hier, obwohl im Bereich des maschinellen Lernens in vielen Programmiersprachen (z. B. Python - eingetragenes Warenzeichen) Vektoren und Listen häufig mit dem Index „0“ beginnen, die Erläuterungen unter Verwendung von Listen im Bereich von 1...N gegeben. Bei einer Implementierung unter Verwendung von Python würde eine solche Liste mit einem Vektor mit N Einträgen, beginnend mit Eintrag 0 bis zu Eintrag N-1, implementiert, was für die Zwecke der Erläuterung als weniger deutlich erachtet wird.
Die Berechnungsvorrichtung 1500 ist ferner dazu ausgelegt, ein Clustering-Algorithmusausführungsmodul, CAEM 1513, des Clustering-Moduls 1510 zu implementieren. Das Clustering-Algorithmusausführungsmodul, CAEM 1513, ist dazu ausgelegt, einen k-Means-Algorithmus einzusetzen, um die Scan-Untersuchungen, die auch als Datensätze bezeichnet sein können, zu clustern. Die Anzahl N_C der gesuchten Cluster kann durch die Anzahl der SICs in dem SICD gegeben sein (z. B. durch die Anzahl der RadLex-IDs für Körperregionen) oder sie kann (vorzugsweise dynamisch) durch einen Optimierungsalgorithmus, z. B. das Ellbogenverfahren, bestimmt werden. Das Ellbogenverfahren versucht, eine Abflachung oder einen „Ellbogen“ in einem Graphen zu finden, der die Verzerrung (Summe der quadrierten Fehler, SSE) als eine Funktion der Anzahl der Cluster repräsentiert.
Die Scan-Untersuchungen s_m können gemäß irgendwelcher oder allen ihrer Merkmalen oder Eigenschaften geclustert werden. Als ein vorteilhaftes Beispiel können die Scan-Untersuchungen s_m basierend auf (z.B. nur) ihren Textvektoren V(s_m), die üblicherweise dünn besetzt sind, geclustert werden. Somit kann jede Scan-Untersuchung durch einen Punkt in einem N_v-dimensionalen Raum repräsentiert sein, und der Clustering-Algorithmus kann versuchen, diese Punkte in Cluster zu gruppieren.
Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1513 zum Einsetzen eines k-Means-Algorithmus, um die Scan-Untersuchungen zu clustern, d. h. die Scan-Untersuchungen in N_C Cluster zu klassifizieren, umfassen. Jeder Cluster wird mit einer Ganzzahl c im Bereich von 1 bis N_C identifiziert. Die Abstände werden als Abstände jedes untersuchten Punktes von einem entsprechenden Schwerpunkt (Mitte des Clusters) definiert, wobei der Schwerpunkt die mittlere Position aller Punkte in einem Cluster ist.
Als ein Ergebnis des Clustering-Algorithmusausführungsmoduls, CAEM 1513, oder analog des Schritts S1513, wird nun die Grundmenge von Scan-Untersuchungen, BSSS 71, in N_C Cluster geclustert. So kann jede Scan-Untersuchung durch zwei zusätzliche Merkmale ergänzt werden:

1) seine Clusternummer c gemäß dem Clustering (die Clusternummer c entspricht in diesem Fall einer RPID)
2) der Abstand des Punktes, der die Scan-Untersuchung bezeichnet (oder: spezifiziert, oder: definiert), zu dem Schwerpunktpunkt seines Clusters c.

An diesem Punkt kann, wenn alle Scan-Untersuchungen in einen der Cluster klassifiziert sind, der aktive Lernansatz beginnen.
Die Berechnungsvorrichtung 1500 ist ferner dazu ausgelegt, ein Modul für aktives Lernen 1520 zu implementieren. Das Modul für aktives Lernen 1520 ist dazu ausgelegt, ein System für maschinelles Lernen, MLS 1530, zu trainieren, um Scan-Untersuchungen auf die RPIDs abzubilden. Das System für maschinelles Lernen, MLS 1530, kann das protokollbestimmende künstliche neuronale Netz, PDANN 1511, (das ein spezifisches neuronales Faltungsnetz CNN ist) und einen Klassifizierer 1531, der in der Pipeline des MLS 1530 hinter dem PDANN 511 angeordnet ist, umfassen oder daraus bestehen.
Das Trainieren des MLS 1530 kann insbesondere das Trainieren des Klassifizierers 1531 umfassen oder daraus bestehen. Das MLS 1530 kann andere Module oder mathematische Entitäten umfassen, wie im Vorstehenden beschrieben, die als Eingabe für den Klassifizierer 1531 verwendet werden können und/oder die zum Erzeugen von Eingaben für den Klassifizierer 1531 verwendet werden können. Beispielsweise kann das MLS 1530 eine Entität basierend auf den Repräsentationen der Protokolle oder der SICs umfassen, wie z. B. eine Matrix, die durch Verwenden jeder Repräsentation als eine Spalte (oder jeder als eine Zeile) gebildet ist. Jeder Teil des MLS 1530 kann durch das Modul für aktives Lernen 1520 trainiert werden oder nicht.
Um das System für maschinelles Lernen, MLS 1530, zu trainieren, wird eine vergleichsweise kleine Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, vorbereitet, die über mehrere Verfeinerungsschleifen für das aktive Lernen des Systems für maschinelles Lernen, MLS 1530, erweitert wird. Einer der Hauptgedanken ist, dass die TSLSS spezifisch und selektiv durch solche gekennzeichneten Scan-Untersuchungen erweitert wird, die als besonders hilfreich für (oder: mit dem größten Einfluss auf) das Verbessern des MLS 1530 erachtet werden.
Die Trainingsmenge gekennzeichneter Scan-Untersuchungen wird erzeugt und erweitert, indem einem Anwender (z. B. einem Arzt) Kennzeichnungsaufgaben zum Kennzeichnen einer Auswahl von Scan-Untersuchungen präsentiert werden, und um als Antwort auf die Aufgaben die Auswahl zusammen mit SIC-Kennzeichnungen für jede darin enthaltene Scan-Untersuchung zu erhalten. In der Fachsprache des aktiven Lernens kann der Anwender in dieser Prozedur als ein „Orakel“ bezeichnet sein.
Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1520 zum Trainieren eines Systems für maschinelles Lernen, MLS 1530, umfassen.
Das Modul für aktives Lernen 1520 kann ein Kennzeichnungsaufgabenbestimmungsmodul, LTDM 1521, umfassen, das dazu ausgelegt ist, - anfangs - zufällig eine Scan-Untersuchung aus jedem der durch das Clustering-Modul 1510 bestimmten Cluster auszuwählen, um eine Auswahl von N_C zu kennzeichnenden Scan-Untersuchungen zu erzeugen.
Das Kennzeichnungsmodul 1520 kann ferner ein Kennzeichnungsmodell, das dazu ausgelegt ist, Kennzeichnungen für die Auswahl von N_C zu kennzeichnenden Scan-Untersuchungen zu erhalten, umfassen. Da es bevorzugt ist, dass die Kennzeichnungen von einem menschlichen Anwender erhalten werden, ist das Kennzeichnungsmodul hier auch als Mensch-Maschine-Interaktionsmodul, HMIM 1522, bezeichnet, das mit einer Benutzeroberfläche, vorzugsweise einer grafischen Benutzeroberfläche, GUI, die durch eine Anzeigevorrichtung 1600 implementiert ist, betriebstechnisch verbunden ist. Das HMIM 1522 ist dazu ausgelegt, einem Anwender unter Verwendung der GUI Kennzeichnungsaufgaben zu präsentieren und unter Verwendung der GUI eine Antwort des Anwenders auf die Kennzeichnungsaufgaben (d. h. die Kennzeichnungen) zu empfangen. Scan-Untersuchungen, die mit einer Kennzeichnung ausgestattet worden sind, sind im Folgenden als s_m ^L bezeichnet. Die Anzeigevorrichtung 1600 kann Teil der Einrichtung 1000 sein oder nicht. Die Präsentation der Kennzeichnungsaufgaben (und die Antwort darauf) kann in Echtzeit oder zeitverzögert stattfinden.
Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1521 umfassen, in dem aus jedem der durch den Clustering-Schritt S1510 bestimmten Cluster eine Scan-Untersuchung in der Reihenfolge zufällig ausgewählt wird, um eine Auswahl von N_C zu kennzeichnenden Scan-Untersuchungen zu erzeugen.
Die Anzeigevorrichtung 1600 kann beispielsweise ein Monitor, ein berührungssensitiver Bildschirm, ein System für virtuelle Realität, ein System für erweiterte Realität, ein holografisches System, ein Projektor oder dergleichen sein.
In einem Schritt S1522 wird die Kennzeichnungsaufgabe mit der Auswahl der zu kennzeichnenden Scan-Untersuchungen einem Anwender präsentiert, vorzugsweise unter Verwendung einer grafischen Benutzeroberfläche, die durch eine Anzeigevorrichtung 1600 implementiert ist.
In einem Schritt S1523 wird die Antwort des Anwenders auf die Kennzeichnungsaufgaben, d. h. die Kennzeichnungen für die Scan-Untersuchungen in der Auswahl der Scan-Untersuchungen, empfangen, vorzugsweise wieder über die grafische Benutzeroberfläche, GUI.
Diese anfänglich gekennzeichneten Scan-Untersuchungen s_m ^L, die durch das Kennzeichnungsmodul 1520 (oder durch den Schritt S1520) erhalten werden, bilden den ersten Teil einer Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS. Diese anfängliche TSLSS wird in weiteren Schritten erweitert. In der jetzigen Stufe wird in einem Schritt S1524 das System für maschinelles Lernen, MLS 1530, unter Verwendung der aktuellen TSLSS trainiert.
Somit ist die Berechnungsvorrichtung 1500 dazu ausgelegt, ein Trainingsmodul für ein System für maschinelles Lernen, MLSTM 1523, das dazu ausgelegt ist, das System für maschinelles Lernen, MLS 1530, auf der aktuellen Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu trainieren, zu implementieren. Ein weiteres Ergebnis ist, dass nun als eine erste Näherung alle Scan-Untersuchungen zu demselben Cluster gehören, da angenommen werden kann, dass jede der anfangs gekennzeichneten Scan-Untersuchungen s_m ^L die gleiche Kennzeichnung aufweist. Da eine Scan-Untersuchung jedes Clusters gekennzeichnet worden ist, gibt es jetzt N_C gekennzeichneter Scan-Untersuchungen $s_{m}^{L}$
und N_M-N_C Scan-Untersuchungen, die Kennzeichnungen aufweisen, durch Inferenz, d. h. aufgrund ihrer Zugehörigkeit zu demselben Cluster wie eine der gekennzeichneten Scan-Untersuchungen $s_{m}^{L} .$
Dies wird manchmal als „Kennzeichnungs-Propagation“ bezeichnet und umfasst einen Wissenstransfer von den direkt durch den Anwender gekennzeichneten Scan-Untersuchungen auf die verbleibenden Scan-Untersuchungen, um eine erweiterte Trainingsmenge zu erzeugen. Für einige Anwendungen kann diese erweiterte Trainingsmenge bereits ausreichend genau sein, um überwachtes Trainieren auszuführen.
Als ein Beispiel kann der Anwender eine spezielle Scan-Untersuchung s_m ^L mit der RPID (RadLex-ID, als ein Typ des SIC) RPID64 gekennzeichnet haben. Das Mensch-Maschine-Interaktionsmodul, 1522, kann dazu ausgelegt sein, für den Anwender über die GUI ein bequemes Dropdown-Menü (oder eine andere Art der Auswahl aus einer gegebenen Menge von Antworten), das die RPID-Codes enthält, bereitzustellen.
Der Speicher 1502 der Berechnungsvorrichtung 1500 kann ferner eine Tabelle umfassen, in der jeder der auswählbaren RPID-Codes mit einer textbasierten Beschreibung dafür verknüpft ist. Beispielsweise ist gemäß dem RadLex Playbook die RPID64 der „Langbeschreibung“ „CT Becken Cystogramm ohne IV-Kontrast“ zugeordnet (oder damit verknüpft). Daraus können Unigramme oder Token wie „CT“ („Computertomographie“), „Becken“, „Cystogramm“, „ohne IV-Kontrast“ („ohne intravenösen Kontrast“) extrahiert werden.
Da der Anwender in Reaktion auf die Kennzeichnungsaufgabe für jede der zum Kennzeichnen ausgewählten Scan-Untersuchungen s_m ^L eine RPID bereitgestellt hat, ist für jeden der bestimmten Cluster eine Scan-Untersuchung s_m ^L ausgewählt worden, was bedeutet, dass jetzt jedem Cluster eine RPID zugeordnet werden kann. Anstelle von Repräsentationen B₁ von Körperregionen kann man deshalb von Repräsentationen Q_c von RPIDs (oder allgemein von Repräsentationen von SICs) sprechen.
Die Berechnungsvorrichtung 1500 implementiert ferner ein Gewichtungsaktualisierungsmodul 1540, das dazu ausgelegt ist, die Gewichte der Unigramme in den Repräsentationen Q_c der Cluster c in Abhängigkeit von der Antwort auf die Kennzeichnungsaufgabe zu aktualisieren. Der Textvektor V(s_m ^L) für eine gekennzeichnete Untersuchung s_m ^L kann in Bezug darauf analysiert werden, ob die mit der Kennzeichnung (hier: RPID64) verknüpften Unigramme in der Repräsentation Q_c der Cluster c, in die die gekennzeichnete Untersuchung s_m ^L zuvor klassifiziert worden ist, vorhanden sind. Für vorhandene Unigramme werden ihre Gewichte für die Repräsentation Q_c der Cluster c erhöht, während ihre Gewichte für die Repräsentationen Q_d der anderen Cluster d≠c reduziert werden.
Falls der Anwender (beispielsweise unter anderem) ein neues Unigramm, das noch nicht in das Vokabular zum Kennzeichnen einer Scan-Untersuchung aufgenommen worden ist, verwendet, kann das Vokabular erweitert werden und der Zählvektorisiererwert für Textvektoren V für die gekennzeichnete Scan-Untersuchung wird auf „1“ eingestellt. Falls der Anwender ein oder mehrere Unigramme, die bereits in dem Textvektor V vorhanden sind, verwendet, kann ihr Wert (d. h. ihr numerischer Eintrag innerhalb des Textvektors V) erhöht werden. Die Erhöhung kann als Prozentsatz bestimmt werden, beispielsweise als fester Prozentsatz im Bereich von 20 % bis 70 %, vorzugsweise im Bereich von 30 % bis 60 %, besonders bevorzugt 50 %. Die Erhöhung kann auch als ein absoluter Wert bestimmt werden, beispielsweise durch einen Wert im Bereich von 0,2 bis 0,7, vorzugsweise im Bereich von 0,3 bis 0,6, am meisten bevorzugt 0,5.
Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1540 zum Aktualisieren der Gewichte der Unigramme in den Repräsentationen Q_c der Cluster c abhängig von der Antwort auf die Kennzeichnungsaufgabe in der vorstehend beschriebenen Weise umfassen.
Ein Clustering-Aktualisierungsmodul 1550 kann durch die Berechnungsvorrichtung 1500 implementiert sein, wobei das Clustering-Aktualisierungsmodul 1550 dazu ausgelegt ist, bei Bedarf die Anzahl N_C der Cluster c und die Abstände der Datenpunkte, die die Scan-Untersuchungen repräsentieren, zu den jeweiligen Schwerpunkten zu aktualisieren. Beispielsweise ist denkbar, dass zwei Scan-Untersuchungen, die ursprünglich zu zwei Clustern gehörten, die basierend auf der Anzahl der Protokolle 1 erzeugt wurden, durch den Anwender so gekennzeichnet worden sind, dass sie tatsächlich zu derselben RPID gehören. Dann können die beiden ursprünglichen Cluster, die zwei unterschiedliche Protokolle 1 repräsentieren, zu einem Cluster, der eine einzige RPID repräsentiert, zusammengefasst werden. Die Anzahl der Cluster N_C wird somit um eins reduziert, der Schwerpunkt für den neuen Cluster wird sich von den Schwerpunkten der beiden früheren Cluster unterscheiden, und die Abstände der zu dem neuen Cluster gehörenden Scan-Untersuchungen werden ebenfalls aktualisiert, da sie sich im Allgemeinen von ihrem früheren Abstand zu dem jeweiligen näheren Schwerpunkt der beiden früheren Cluster unterscheiden werden.
Dementsprechend kann das Verfahren gemäß der vorliegenden Erfindung einen Schritt S1550 zum Aktualisieren der Anzahl und der Form der Cluster und/oder der Abstände der Scan-Untersuchungen zu dem Schwerpunkt des Clusters, zu dem sie gehören, umfassen. Die erneute Clustern S1550 durch das Clustering-Aktualisierungsmodul 1550 kann während des aktiven Lernansatzes, der durch das Modul für aktives Lernen 1520 ausgeführt wird, (z. B. während einer Verfeinerungsschleife) oder danach ausgeführt werden, z. B. als Vorbereitung für ein späteres Neu-Trainieren des Systems für maschinelles Lernen, MLS 1530. In einer so genannten Verfeinerungsschleife werden wenigstens die Schritte zum Auswählen der Scan-Untersuchungen, die durch den Anwender zu kennzeichnen sind, (d. h. Bestimmen der Kennzeichnungsaufgaben S1521, Präsentation der Kennzeichnungsaufgaben 1522, Erhalten der Kennzeichnungen S1523, und Neu-Trainieren S1524 (oder, in der Verfeinerungsschleife: Neu-Trainieren) in dem System für maschinelles Lernen, MLS 1530, wiederholt. Jede Wiederholung dieser Verfeinerungsschleife erhöht die Anzahl der gekennzeichneten Scan-Untersuchungen s_m ^L und verbessert offensichtlich auch das MLS 1530 weiter.
Nachdem die erste Gruppe der zu kennzeichnenden Scan-Untersuchungen (eine aus jedem der ursprünglichen Cluster) ausgewählt worden ist, werden in jeder Iteration f der Verfeinerungsschleife weitere N_S(f) Scan-Untersuchungen zum Kennzeichnen ausgewählt. Die Anzahl N_S kann für jede Iteration f unterschiedlich sein, ist aber in dem hier beschriebenen Beispiel fest. Die Anzahl N_S ist vorzugsweise kleiner als die Anzahl N_C von Protokollen und/oder kleiner als die Anzahl der SICs (hier: RPIDs) und kann beispielsweise im Bereich von 5 bis 30, vorzugsweise im Bereich von 15 bis 20 sein. In dem vorliegenden Beispiel ist die Einstellung N_S =10.
Zu Beginn der Iteration f, ist die Anzahl der Scan-Untersuchungen, die noch nicht durch einen Anwender gekennzeichnet worden sind, gleich N_M-N_C-(f-1)*N_S. Aus diesen werden wiederum N_S ausgewählt. Eine mögliche Prozedur ist, dass zunächst aus den nicht gekennzeichneten Scan-Untersuchungen die d*N_S Scan-Untersuchungen mit der höchsten Entropie ausgewählt werden und aus diesen dann wiederum N_S endgültig zum Kennzeichnen ausgewählt werden. Die Ganzzahl d kann irgendeine Zahl sein, zum Beispiel Bereich von 1 bis 10, und ist hier auf 5 eingestellt.
Die Auswahl der N_S Scan-Untersuchungen innerhalb der anfangs ausgewählten d*N_S Scan-Untersuchungen kann nach irgendeinem Kriterium erfolgen, z. B. wieder nach der höchsten Entropie. Beispielsweise ist es vorteilhaft, die Unigramme u_i mit der höchsten Varianz über ihre Gewichte innerhalb der Repräsentationen Q_c zu bestimmen, d. h., die mit anderen Worten diejenigen sind, die in Bezug auf die Repräsentationen Q_c stark ausgeprägt sind. Um dies zu verstehen, kann man ein Unigramm u_i betrachten, das in jeder Repräsentation Q_c das gleiche Gewicht aufweist; ein solches Unigramm u_i hätte die Varianz Null und würde im Wesentlichen keine Angabe für eine der Darstellungen Q_c führen. Dann können aus den anfangs ausgewählten d*N_S Scan-Untersuchungen die N_S Scan-Untersuchungen ausgewählt werden, die Unigramme mit der höchsten Gesamtvarianz umfassen, mit der zusätzlichen Bedingung, dass keine Scan-Untersuchung ausgewählt wird, die bereits gekennzeichnet worden ist.
Die Iteration der Verfeinerungsschleife kann ausgeführt werden, bis ein Abbruchkriterium erreicht ist. Das Abbruchkriterium kann beispielsweise Folgendes sein:

- eine im Voraus definierte Anzahl von Scan-Untersuchungen, die zum Kennzeichnen an den Anwender gesendet werden, ist erreicht, wobei die Anzahl vorzugsweise Bereich von 100 bis 400, besonders bevorzugt Bereich von 200 bis 300 ist;
- eine im Voraus definierte Anzahl von Iterationen (d. h. die Anzahl der Wiederholungen, mit denen das System für maschinelles Lernen, MLS 1530, neu trainiert wird);
- wenn sich die Leistung des MLS 1530 oberhalb eines speziellen Schwellenwerts nicht mehr signifikant verbessert oder nach einem speziellen Schwellenwert konstant bleibt.

Es kann auch bestimmt werden, dass die Verfeinerungsschleife abgebrochen wird, wenn in einer Verfeinerungsiteration f wenigstens eine im Voraus definierte Anzahl von Scan-Untersuchungen ausgewählt wird, die bereits in einer vorherigen Verfeinerungsiteration f ausgewählt worden sind. Da die Vorauswahl der d*N_S Scan-Untersuchungen auf der Entropie basiert, gibt eine solche Neuauswahl derselben Scan-Untersuchungen an, dass die Entropie selbst für die Scan-Untersuchungen mit der höchsten Entropie durch das Kennzeichnen nicht mehr reduziert werden kann.
Eine solche Verfeinerungsschleife kann in Zukunft als Rückkopplung wieder eingesetzt werden, beispielsweise in einem Fall, in dem die Leistung des Systems für maschinelles Lernen, MLS, abnimmt. In diesem Fall kann das System für maschinelles Lernen, MLS, automatisch in einer oder mehreren Verfeinerungsschleifen, wie im Vorstehenden beschrieben, wieder neu trainiert werden.
Nachdem die Verfeinerungsschleifen beendet sind, können optional mehr Daten synthetisiert werden, um die Größe der Trainingsdatenmenge weiter zu erhöhen.
Eine Option ist, das protokollbestimmende künstliche neuronale Netz, PDANN 1511, konstant zu halten und zusätzliche virtuelle Scan-Untersuchungen s^V(s_m, δV) zu erzeugen, indem zu wenigstens einer existierenden Scan-Untersuchung s_m ein Rauschen δV durch Einfügen oder Löschen von Unigrammen in den/aus dem Textvektor V(s_m) hinzugefügt wird, wobei vorzugsweise solche Unigramme ausgewählt werden, die wenig Einfluss auf die Klassifizierung der Scan-Untersuchungen in SICs aufweisen. Beispielsweise bezieht sich das Unigramm „Topogramm“ nicht auf eine spezifische Körperregion. Um den Einfluss zu bestimmen, kann ein Chi-Quadrat-Test angewandt werden. Dann kann in Fällen, in denen das MLS 1530 das PDANN 1511 und dem Klassifizierer 1531, der die Ausgabe des PDANN 1511 als Eingabe verwendet, umfasst, der Klassifizierer 1531 unter anderem unter Verwendung der zusätzlichen virtuellen Scan-Untersuchungen s^v(s_m, δV) zusammen mit der Kennzeichnung, die der Anwender für die ursprüngliche Scan-Unter s_m, zu der das Rauschen δV hinzugefügt worden ist, vergeben hat, trainiert werden.
Eine weitere Option ist das Verwenden von Vektorisierung, d. h. eines Prozesses zum Erzeugen zusätzlicher Vektoren unter Verwendung von Vektorbetriebsbedingungen.
Falls beispielsweise eine Scan-Untersuchung s1 mit einer RPID gekennzeichnet ist, die das Abdomen als Körperregion angibt, und eine Scan-Untersuchung s2 mit einer RPID gekennzeichnet ist, die das Becken als Körperregion angibt, dann kann die Vektoraddition s1+s2 verwendet werden, um eine neue virtuelle Scan-Untersuchung zu erzeugen, die mit einer RPID gekennzeichnet ist, die Abdomen + Becken als Körperregion angibt. In ähnlicher Weise kann Vektorsubtraktion s3-s4 verwendet werden, um verdeckte Schichten virtueller Untersuchungen zu erzeugen, die sich auf eine kleinere Körperregion oder auf weniger Körperregionen beziehen als die, mit der s3 gekennzeichnet worden ist. Die Hinzufügung und/oder Löschung kann auf den gesamten Merkmalen x der Untersuchungen und/oder auf Zwischenschichten des protokollbestimmenden künstlichen neuronalen Netzes, PDANN 1511, basierend auf den Scan-Untersuchungen s1, s2, s3 bzw. s4 ausgeführt werden. Im letzteren Fall können die verdeckten Schichten der virtuellen Untersuchungen in das PDANN 1511 eingefügt werden, um es auf der Ebene (d. h. anstelle) der jeweiligen Zwischenschichten zu trainieren, während die tatsächlichen Scan-Untersuchungen weiterhin in das PDANN 1511 an seiner ersten Schicht, d. h. seinen Eingangsknoten, eingegeben werden.
Schließlich kann das abschließende Trainieren des MLS 1530 auf irgendeinem oder allen aus dem Folgenden basieren:

- alle gekennzeichneten Scan-Untersuchungen s_m ^L sowohl aus dem anfänglichen Kennzeichnen als auch aus den Iterationen der Verfeinerungsschleife;
- allen zusätzlichen virtuellen Scan-Untersuchungen;
- anderen Scan-Untersuchungen, die durch Kennzeichnungsverteilung gekennzeichnet sind, d. h. mit dem Kennzeichen gekennzeichnet sind, das für die gekennzeichneten Scan-Untersuchungen s_m ^L desselben Clusters vergeben worden ist,

Als ein Ergebnis ist eine enorme Menge an Trainingsdaten zum Trainieren des MLS 1530 verfügbar, um den SIC (hier: RPID) irgendeiner Scan-Untersuchung genau zu bestimmen, obwohl tatsächlich nur eine vergleichsweise sehr geringe Anzahl von Scan-Untersuchungen durch einen Anwender gekennzeichnet werden musste. Außerdem wurden die Zeit und der Aufwand des Anwenders, der die Daten kennzeichnet, äußerst effizient genutzt, da dem Anwender Kennzeichnungsaufgaben gestellt wurden, die geeignet waren, das MLS 1530 maximal zu verbessern. Die Einrichtung 1000 umfasst ferner eine Ausgabeschnittstelle 1900, die dazu ausgelegt ist, das trainierte MLS 1530 auszugeben. Sowohl die Eingabeschnittstelle 1100 als auch die Ausgabeschnittstelle 1900 können als Hardware und/oder Software, drahtgebunden oder drahtlos realisiert sein und können insbesondere mit einem Netz wie z. B. einem Intranet oder dem Internet verbunden sein. In der Einsatzphase kann das trainierte System für maschinelles Lernen MLS 1530 verwendet werden, um die RPID für eine zuvor unbekannte Scan-Untersuchung zu bestimmen, d. h. die Scan-Untersuchung auf eine RPID abzubilden.
Somit kann ein Verfahren gemäß der vorliegenden Erfindung auch einen Schritt S2000 zum Verwenden des trainierten MLS 1530, um die RPID für eine zuvor unbekannte Scan-Untersuchung zu bestimmen, umfassen. Ein solches Verfahren, das die vorstehend beschriebenen Schritte zum Trainieren des MLS 1530 umfassen kann oder nicht, kann als ein Verfahren zum Abbilden einer Scan-Untersuchung auf einen SIC eines SICD bezeichnet werden.
3 zeigt ein schematisches Blockdiagramm, das ein Computerprogrammprodukt 300 gemäß einer Ausführungsform des dritten Aspekts der vorliegenden Erfindung darstellt. Das Computerprogrammprodukt 300 umfasst ausführbaren Programmcode 350, der dazu ausgelegt ist, dann, wenn er ausgeführt wird, das Verfahren gemäß der vorliegenden Erfindung auszuführen, insbesondere so, wie es im Vorstehenden in Bezug auf 1 und 2 beschrieben worden ist.
4 zeigt ein schematisches Blockdiagramm, das ein nicht-transientes, computerlesbares Datenspeichermedium 400 gemäß einer Ausführungsform des vierten Aspekts der vorliegenden Erfindung darstellt. Das Datenspeichermedium 400 umfasst ausführbaren Programmcode 450, der dazu ausgelegt ist, dann, wenn er ausgeführt wird, das Verfahren gemäß der vorliegenden Erfindung auszuführen, insbesondere so, wie es im Vorstehenden in Bezug auf 1 und 2 beschrieben worden ist.
In der vorstehenden genauen Beschreibung sind verschiedene Merkmale in ein oder mehrere Beispielen oder Beispiele mit dem Zweck, die Offenbarung zu straffen, zusammengefasst. Es ist zu verstehen, dass die vorstehende Beschreibung erläuternd und nicht einschränkend sein soll. Sie soll alle Alternativen, Modifikationen und Äquivalente abdecken. Viele andere Beispiele werden für einen Fachmann bei der Durchsicht der vorstehenden Beschreibung offensichtlich.
Die Ausführungsformen wurden ausgewählt und beschrieben, um die Prinzipien der Erfindung und ihre praktischen Anwendungen bestmöglich zu erläutern und dadurch andere Fachleute in die Lage zu versetzen, die Erfindung und die verschiedenen Ausführungsformen mit verschiedenen Modifikationen, die für die spezielle angedachte Verwendung geeignet sind, optimal zu nutzen.
Noch einmal kurz gesagt ist eine der Hauptideen der vorliegenden Erfindung, aktives Lernen zu verwenden, um zu steuern, welche Scan-Untersuchungen durch einen Anwender abzubilden sind. Diese Steuerung wird genutzt, um den Anwender aufzufordern, die - für das MLS 1530 in seinem aktuellen Trainingszustand - schwierigsten Datenpunkte zu kennzeichnen. Die Erfinder haben festgestellt, dass sich auf diese Weise die Zeit und der Aufwand für einen Anwender zum Abbilden von Datensätzen reduzieren, während gleichzeitig eine bessere Vorhersageleistung erzielt wird. Die Erfindung stellt auch eine Anzahl von Techniken zum Gewinnen von Wissen aus den Scan-Untersuchungen und zum Bestimmen optimaler Entscheidungskriterien bereit.

Claims

Einrichtung (1000) zum Trainieren eines Systems für maschinelles Lernen, MLS, (1530) zum Abbilden einer Scan-Untersuchung auf einen standardisierten Identifizierercode, SIC, eines Wörterbuchs für standardisierte Identifizierercodes, SICD, wobei die Einrichtung (1000) Folgendes umfasst: eine Eingabeschnittstelle (1100), die dazu ausgelegt ist, eine Grundmenge von Scan-Untersuchungen, BSSS (71), zu erhalten; und eine Berechnungsvorrichtung (1500), die dazu ausgelegt ist, wenigstens ein Clustering-Modul (1510) zu implementieren, das dazu ausgelegt ist, unter Verwendung eines Clustering-Algorithmus die Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS (71), in mehrere Cluster zu klassifizieren; und ein Modul für aktives Lernen (1520), das dazu ausgelegt ist, das System für maschinelles Lernen, MLS (1530), zu trainieren, wobei das Modul für aktives Lernen Folgendes umfasst: ein Kennzeichnungsaufgabenbestimmungsmodul, LTDM (1521), das dazu ausgelegt ist, wenigstens eine Scan-Untersuchung aus jedem Cluster auszuwählen; ein Kennzeichnungsmodul (1522), das dazu ausgelegt ist, SIC-Kennzeichen für die ausgewählten Scan-Untersuchungen zu erhalten, um eine Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu erzeugen; und ein Trainingsmodul für Systeme für maschinelles Lernen, MLSTM (1523), das dazu ausgelegt ist, das System für maschinelles Lernen, MLS (1530), basierend auf der erzeugten Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu trainieren; wobei das Modul für aktives Lernen (1520) ferner dazu ausgelegt ist, das System für maschinelles Lernen, MLS (1530), durch Ausführen wenigstens einer Verfeinerungsschleife neu zu trainieren, umfassend: - Bestimmen basierend auf einer Bewertungsmetrik einer zusätzlichen Menge zu kennzeichnender Scan-Untersuchungen aus der Grundmenge von Scan-Untersuchungen, BSSS (71); - Erhalten von SIC-Kennzeichnungen für die Scan-Untersuchungen in der bestimmten zusätzlichen Menge von Scan-Untersuchungen, um die Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu erweitern; - erneutes Trainieren des Systems für maschinelles Lernen, MLS (1530), unter Verwendung wenigstens der erweiterten Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS.
Einrichtung (1000) nach Anspruch 1, wobei das Kennzeichnungsmodul als ein Mensch-Maschine-Interaktionsmodul, HMIM (1522), ausgelegt ist, das dazu ausgelegt ist, durch das Kennzeichnungsaufgabenbestimmungsmodul, LTDM (1521), ausgewählte Scan-Untersuchungen einem Anwender als Kennzeichnungsaufgaben unter Verwendung einer grafischen Benutzeroberfläche anzuzeigen und Kennzeichnungen für die ausgewählten und angezeigten Scan-Untersuchungen als Antworten des Anwenders auf die Kennzeichnungsaufgaben zu erhalten.
Einrichtung (1000) nach Anspruch 1 oder Anspruch 2, wobei das System für maschinelles Lernen, MLS (1530), ein protokollbestimmendes künstliches neuronales Netz, PDANN (1511), umfasst, das dazu ausgelegt ist, für eine Scan-Untersuchung einen Protokollnamen, mit dem die Scan-Untersuchung bezeichnet werden kann, zu bestimmen, und wobei das System für maschinelles Lernen (1530) das PDANN (1511) umfasst.
Computerimplementiertes Verfahren zum Trainieren eines Systems für maschinelles Lernen zum Abbilden einer Scan-Untersuchung auf einen standardisierten Identifizierercode, SIC, eines Wörterbuchs für standardisierte Identifizierercodes, SICD, das die folgenden Schritte umfasst: - Erhalten (S1100) einer Grundmenge von Scan-Untersuchungen, BSSS (71); - Klassifizieren (S1510) unter Verwendung eines Clustering-Algorithmus der Scan-Untersuchungen der Grundmenge von Scan-Untersuchungen, BSSS (71), in mehrere Cluster; - Auswählen (S1521) wenigstens einer Scan-Untersuchung aus jedem Cluster; - Erhalten (S1523) von SIC-Kennzeichnungen für die ausgewählten Scan-Untersuchungen, um eine Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu erzeugen; - Trainieren (S1524) eines Systems für maschinelles Lernen, MLS (1530), unter Verwendung der gekennzeichneten Scan-Untersuchungen, um individuelle Scan-Untersuchungen auf einen entsprechenden SIC des SICD abzubilden; - Ausführen wenigstens einer Verfeinerungsschleife, umfassend: - Bestimmen (S1521) einer zusätzlichen Menge von Scan-Untersuchungen aus der Grundmenge von Scan-Untersuchungen, BSSS (71), basierend auf einer Bewertungsmetrik; - Erhalten (S1523) von SIC-Kennzeichnungen für die Scan-Untersuchungen in der bestimmten Menge von Scan-Untersuchungen, um die Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS, zu erweitern; - erneutes Trainieren (S1524) des Systems für maschinelles Lernen, MLS (1530), unter Verwendung wenigstens der erweiterten Trainingsmenge gekennzeichneter Scan-Untersuchungen, TSLSS.
Verfahren nach Anspruch 4, wobei die SIC-Kennzeichnungen durch Präsentieren (S1522) von Kennzeichnungsaufgaben für die ausgewählten Scan-Untersuchungen für einen Anwender unter Verwendung einer grafischen Benutzeroberfläche und Empfangen der Eingaben des Anwenders als Kennzeichnungen für die ausgewählten Scan-Untersuchungen erhalten werden.
Verfahren nach Anspruch 4 oder Anspruch 5, wobei zusätzliche virtuelle Scan-Untersuchungen oder Merkmale davon zum Trainieren des Systems für maschinelles Lernen, MLS (1503), basierend auf Vektorisierungsoperationen, die an Scan-Untersuchungen des erweiterten TSLSS ausgeführt werden, erzeugt werden, und wobei wenigstens das abschließende Neu-Trainieren des Systems für maschinelles Lernen, MLS (1530), unter Verwendung der erweiterten TSLSS und der zusätzlichen virtuellen Scan-Untersuchungen oder deren Merkmale ausgeführt wird.
Verfahren nach einem der Ansprüche 4 bis 6, wobei zusätzliche virtuelle Scan-Untersuchungen durch Hinzufügen von Rauschen zu Scan-Untersuchungen, für die Kennzeichnungen erhalten worden sind, erzeugt werden, und wobei wenigstens das abschließende Neu-Trainieren des Systems für maschinelles Lernen, MLS (1530), unter Verwendung der erweiterten TSLSS und der zusätzlichen virtuellen Scan-Untersuchungen ausgeführt wird.
Verfahren nach einem der Ansprüche 4 bis 7, das Erzeugen von Repräsentationen für die SICs basierend auf gewichteten Unigrammen umfassend.
Verfahren nach Anspruch 8, wobei die erzeugten Repräsentationen für die SICs wenigstens einmal basierend auf den erhaltenen SIC-Kennzeichnungen aktualisiert werden.
Verfahren nach Anspruch 9, wobei die Repräsentationen für die SICs durch Ändern der Gewichte der gewichteten Unigramme innerhalb der Repräsentationen basierend auf einer Bestimmung, wie groß die Auswirkungen einer Hinzufügung und/oder Löschung jedes Unigramms für die Entscheidung darüber sind, ob eine bestimmte Scan-Untersuchung in einen speziellen SIC klassifiziert wird, aktualisiert werden.
Verfahren nach einem der Ansprüche 4 bis 10, wobei das System für maschinelles Lernen, MLS (1530), ein protokollbestimmendes künstliches neuronales Netz, PDANN (1511), umfasst, das dazu ausgebildet ist, für eine Scan-Untersuchung einen Protokollnamen, mit dem die Scan-Untersuchung bezeichnet werden kann, zu bestimmen, und wobei das Abbilden der Scan-Untersuchung auf den SIC durch das MLS (1530) teilweise und wenigstens indirekt auf der Ausgabe des PDANN (1511) basierend auf der Scan-Untersuchung basiert.
Verfahren nach einem der Ansprüche 4 bis 11, wobei die Verfeinerungsschleife iteriert wird, bis ein Abbruchkriterium erfüllt ist, wobei das Abbruchkriterium irgendeines der oder alle aus dem Folgenden umfassen kann: - eine im Voraus definierte Anzahl von Kennzeichnungen ist erhalten worden; - eine im Voraus definierte Anzahl von Iterationen ist ausgeführt worden; und/oder - die Leistung des neu trainierten Systems für maschinelles Lernen, MLS (1530), verbessert sich oberhalb eines speziellen Schwellenwerts nicht mehr signifikant oder bleibt nach einem speziellen Schwellenwert konstant.
Verwendung eines Systems für maschinelles Lernen, MLS (1530), das unter Verwendung des Verfahrens nach einem der Ansprüche 4 bis 12 trainiert worden ist, zum Abbilden einer Scan-Untersuchung auf einen standardisierten Identifizierercode, SIC, eines Wörterbuchs für standardisierte Identifizierercodes, SICD.
Computerprogrammprodukt (200), ausführbaren Programmcode (250) umfassend, der dazu ausgelegt ist, dann, wenn er ausgeführt wird, das Verfahren nach einem der Ansprüche 4 bis 12 auszuführen.
Nicht-transientes, computerlesbares Datenspeichermedium (300), ausführbaren Programmcode (350) umfassend, der dazu ausgelegt ist, dann, wenn er ausgeführt wird, das Verfahren nach einem der Ansprüche 4 bis 12 auszuführen.