WO2023237608A1

WO2023237608A1 - Computerimplementiertes trainings-verfahren, computerimplementiertes vorhersage-verfahren, computerprogramm, computerlesbares medium und vorrichtung

Info

Publication number: WO2023237608A1
Application number: PCT/EP2023/065239
Authority: WO
Inventors: Kaustubh Raosaheb PATIL
Original assignee: Forschungszentrum Jülich GmbH
Priority date: 2022-06-10
Filing date: 2023-06-07
Publication date: 2023-12-14
Also published as: DE102022114713A1

Abstract

Computerimplementiertes Trainings-Verfahren zum Trainieren maschineller Lernmodelle, bei dem A1) eine Lerndatensammlung (L, LA, LB, LC) mit Lerndatensätzen (LDS) bereitgestellt wird, wobei jeder Lerndatensatz (LDS) einen Messdatensatz (MDS) mit Messdaten-Einträgen (MDE) und eine Target-Variable (T) umfasst, A2) eine Gruppierung der Messdaten-Einträge (MDE) der Messdatensätze (MDS) der wenigstens einen Lerndatensammlung (L, LA, LB, LC) in mehrere Gruppen (G1, G2) erfolgt, A3) für jede Gruppe (G1, G2) ein eigenes maschinelles Lernmodell unter Nutzung einer Resampling-Methode trainiert und getestet wird, und wenigstens ein Testen mit einem anderen Teil der zu der jeweiligen Gruppe (G1, G2) gehörenden Gruppen-Unter-Messdatensätze, und wobei das Testen Vorhersagen für verschiedene Gruppen, gruppenspezifische Vorhersagen (P1, P2, AP1, AP2, BP1, BP2) liefert, A4) mit den gruppenspezifischen Vorhersagen (P1, P2, AP1, AP2, BP1, BP2) und Target-Variablen (T) wenigstes ein weiteres maschinelles Lernmodell, gruppenübergreifendes Meta-Lernmodell (MM, MA+B, MA_B), trainiert wird, so dass es aus mehreren, verschiedenen Gruppen (G1, G2) zugeordneten gruppenspezifischen Vorhersagen (P1, P2, AP1, AP2, BP1, BP2) eine gruppenübergreifende Vorhersage (P) liefern kann. Die Erfindung betrifft ferner ein computerimplementiertes Vorhersage-Verfahren zur Vorhersage einer Eigenschaft unter Nutzung maschineller Lernmodelle, ein Computerprogramm, ein computerlesbares Medium und eine Vorrichtung.

Description

Beschreibung

Computerimplementiertes Trainings-Verfahren, computerimplementiertes Vorhersage-Verfahren, Computerprogramm, computerlesbares Medium und Vorrichtung

Die Erfindung betrifft ein computerimplementiertes Trainings-Verfahren zum Trainieren maschineller Lernmodelle, bei dem

A1) wenigstens eine Lerndatensammlung mit mehreren Lerndatensätzen bereitgestellt wird, wobei jeder Lerndatensatz einen Messdatensatz mit mehreren Messdaten-Einträgen und eine dem Messdatensatz zugeordnete Target-Variable umfasst, bevorzugt, wobei alle Lerndatensätze den gleichen Aufbau aufweisen.

Die Erfindung betrifft ferner ein computerimplementiertes Vorhersage- Verfahren zur Vorhersage einer Eigenschaft unter Nutzung maschineller Lernmodelle, ein Computerprogramm, ein computerlesbares Medium und eine Vorrichtung.

Künstliche Intelligenz und maschinelles Lernen (ML) entwickeln sich zu einem wichtigen Werkzeug in der Analyse von Daten, beispielsweise Bilddaten [Myszczynska et al. 2022], Rein beispielhaft seien Bilddaten menschlicher Gehirne genannt, die durch Magnetresonanztomographie, kurz MRT (englisch: Magnetic Resonance Imaging, kurz MRI) erhalten wurden. Es existieren jedoch diverse Herausforderungen, welche die Anwendung von ML- Verfahren erschweren. Eine große Herausforderung, vor allem im klinischen Bereich, ist die Verfügbarkeit von nur vergleichsweise wenig Daten am jeweiligen Messort, beispielsweise Krankenhaus, an dem MRT-Aufnahmen ge- macht werden. Da in der Regel große Mengen von Trainingsdaten nötig sind, um genaue ML-Modelle aufzubauen, ist eine übliche Vorgehensweise, die Datenmenge zu erhöhen, indem Daten, die an verschiedenen Messorten erhalten wurden, zusammenführt. Multi-Messort Daten-Pooling ist jedoch ebenfalls mit Herausforderungen verbunden.

Einerseits wird eine Harmonisierung erforderlich, da die Daten verschiedener Standorte heterogen sind, insbesondere systematische Unterschiede zwischen den genutzten Messaufbauten, im Falle von MRT-Bildern etwa Scannern, sowie den Datensammel-Parametern existieren [Chen 2021 , Mali et al]. Das Pooling macht daher eine zusätzliche Verarbeitung erforderlich, was durch den Aufbau von Daten-Harmonisierungs-Modellen erzielt wird.

Selbst wenn Standard-Vorsichtsmaßnahmen, wie etwa die Pseudonymisie- rung von Bildern, eingehalten werden, kann ferner das standortübergreifende Teilen sensitiver Daten zu einer Reduktion der Patienten-Privatsphäre führen, da Fingerabdruck-artige Eigenschaften der Daten für eine Re- Identifikation genutzt werden können [Finn 2015, Larabi 2021], Derzeit werden verschiedene Verfahren, wie etwa das “Defacing“ von MRT-Bildern verwendet, um die Patienten-Privatsphäre zu erhöhen. Föderales Lernen (Federated Learning, kurz FL) wird verwendet, um den Datenschutz zu erhöhen [Kaissis et al. 2020],

Die bestehenden Lösungen haben verschiedene Beschränkungen bzw. Nachteile.

Beim standortübergreifenden Daten-Pooling benötigen die Harmonisierungsmodelle für das Training in der Regel einige prototypische Daten vom jeweiligen Messort. Dies schränkt die Anwendbarkeit, was neue Messorte angeht, für die keine prototypischen Daten verfügbar sind, ein. Eine Harmo- nisierung kann ferner problematisch sein, was den Datenschutz angeht, insbesondere, wenn Rohdaten zusammengeführt werden. Dezentrales Lernen, z. B. föderiertes Lernen, kann zu Modellen mit geringerer Genauigkeit führen. Ein weiterer Nachteil besteht, wenn nicht interpretierbare Modelle, beispiels- wiese auf Deep Learning basierende Methoden, genutzt werden. Der Mangel an Interpretierbarkeit macht die Nutzung für kritische Entscheidungssituationen, wie sie z.B. im klinischen Bereich oftmals bestehen, schwierig [Hed- derich & Eickhoff 2021],

Ausgehend davon ist es eine Aufgabe der vorliegenden Erfindung, eine Möglichkeit zu schaffen, besonders zutreffende Vorhersagen bei gleichzeitig besonders hohem Maß an Privatsphäre bzw. Datenschutz zu erhalten, dies auch unter Nutzung von Daten verschiedener Messorte.

Bei einem computerimplementierten Trainings-Verfahren der eingangs genannten Art wird dies dadurch gelöst, dass

A2) eine Gruppierung zumindest eines Teils der Messdaten- Einträge der Messdatensätze der wenigstens einen Lerndatensammlung in mehrere Gruppen erfolgt, wodurch Gruppen-Unter- Messdatensätze erhalten werden, wobei die Gruppen-Unter- Messdatensätze einer Gruppe jeweils zueinander korrespondierende Messdaten-Einträge verschiedener Messdatensätze umfassen,

A3) für jede Gruppe ein eigenes maschinelles Lernmodell unter Nutzung einer Resampling-Methode trainiert und getestet wird, Resampling-basiertes Gruppen-Lernmodell, wobei die Resampling- basierte Methode einschließt, dass wenigstens ein Trainieren mit einem Teil der zu der jeweiligen Gruppe gehörenden Gruppen-Unter- Messdatensätze und den zugehörigen Target-Variablen erfolgt, und wenigstens ein Testen mit einem anderen Teil der zu der jeweiligen Gruppe gehörenden Gruppen-Unter-Messdatensätze erfolgt, und wo- bei das wenigstens eine Testen Vorhersagen für verschiedene Gruppen, gruppenspezifische Vorhersagen liefert,

A4) mit den gruppenspezifischen Vorhersagen und Target- Variablen der wenigstens einen Lerndatensammlung wenigstes ein weiteres maschinelles Lernmodell, gruppenübergreifendes Meta- Lernmodell, insbesondere ohne Nutzung einer Resampling-Methode trainiert wird, so dass es aus mehreren, verschiedenen Gruppen zugeordneten gruppenspezifischen Vorhersagen eine gruppenübergreifende Vorhersage liefern kann,

A5) optional für jede Gruppe ein weiteres maschinelles Lernmodell mit zu der jeweiligen Gruppe gehörenden Gruppen-Unter- Messdatensätzen (und zugehörigen Target-Variablen insbesondere ohne Nutzung einer Resampling-Methode trainiert wird, Vorhersage- Gruppen-Lernmodell, wobei das Training bevorzugt mit allen zu der jeweiligen Gruppe gehörenden Gruppen-Unter-Messdatensätze und zugehörigen Target-Variablen erfolgt.

Die erfindungsgemäß trainierten Lernmodelle können insbesondere genutzt werden, um für wenigstens einen neuen Messdatensatz, zu dem keine Target-Variable vorliegt, wenigstens eine Vorhersage zu treffen. Rein beispielhaft sei genannt, dass MRT-Daten des Gehirns eines Patienten vorliegen und für diesen gruppen-, insbesondere parzellenspezifische Gehirnalter und ein parzellenübergreifendes Gehirnalter vorhergesagt werden. Weitere mögliche Anwendungsbeispiele für die Erfindung finden sich in der Genetik, medizinischen Patientendaten, Natural Language Processing und Computer Vision.

Es sei betont, dass die Schritte des erfindungsgemäßen Trainings- Verfahrens nicht zwingend in der vorgenannten Reihenfolge durchlaufen werden müssen. Insbesondere kann das Training der nicht Resampling- basierten Gruppen-Lernmodelle gemäß Schritt A5) auch früher, z.B. zwischen Schritt A2) und A3) oder gleichzeitig mit Schritt A3) erfolgen.

Gegenstand der Erfindung ist daher auch ein computerimplementiertes Vorhersage-Verfahren zur Vorhersage einer Eigenschaft unter Nutzung maschineller Lernmodelle, die unter Durchführung des erfindungsgemäßen Trainings-Verfahrens erhalten wurden, bei dem

B1) ein Messdatensatz mit mehreren Messdaten-Einträgen bereitgestellt wird,

B2) gemäß Schritt A5 trainierte Vorhersage-Gruppen-Lernmodelle und/oder gemäß Schritt A2 trainierte Resampling-basierte Gruppen-Lernmodelle und wenigstens ein gemäß Schritt A4 insbesondere ohne Nutzung einer Resampling-Methode trainiertes gruppenübergreifendes Meta-Lernmodell bereitgestellt werden,

B3) die Messdaten-Einträge des in Schritt B1 bereitgestellten Messdatensatzes analog zu Schritt A2 gruppiert werden, wodurch für jede Gruppe ein Gruppen-Unter-Messdatensatz erhalten wird,

B4) die Gruppen-Unter-Messdatensätze jeweils den zugehörigen Vorhersage-Gruppen-Lernmodellen oder den zugehörigen Resampling-basierten Gruppen-Lernmodellen zugeführt werden und von diesen als Ausgabe jeweils eine gruppenspezifische Vorhersage erhalten wird,

B5) die gruppenspezifischen Vorhersagen dem wenigstens einen insbesondere ohne Nutzung einer Resampling-Methode trainierten gruppenübergreifenden Meta-Lernmodell zugeführt werden und von diesem als Ausgabe eine gruppenübergreifende Vorhersage erhalten wird.

Es sei betont, dass die Schritte des erfindungsgemäßen Vorhersage- Verfahrens nicht zwingend in der vorgenannten Reihenfolge durchlaufen werden müssen. Beispielsweise können die Lernmodelle auch im Anschluss an die Gruppierung bereitgestellt werden.

Die vorliegende Erfindung sieht mit anderen Worten einen „Divide-and- conquer“-Ansatz vor, bei dem mehrere Level von maschinellen Lernmodellen trainiert werden. Im Rahmen der Vorhersage unter Nutzung der trainierten Modelle werden auch mehrere Level durchlaufen. Die Ausgaben eines Levels werden - bei Training und Vorhersage - jeweils als Eingaben für das nächste, „höhere“ Level genutzt.

Erfindungsgemäß erfolgt eine Gruppenaufteilung der Trainingsdaten und es wird, insbesondere im ersten, „niedrigsten“ Level (Level 0), ein maschinelles Lernmodell für jede Gruppe eingeführt und unter Nutzung einer Resampling- basierten Methode trainiert und getestet, mit anderen Worten gruppenspezifische Lernmodelle oder Gruppen-Lernmodelle. Diese werden unter Nutzung einer Resampling-basierten Methode mit den Lerndaten trainiert und getestet.

Im Rahmen der Gruppierung werden zweckmäßiger Weise jeweils verschiedene Teile bzw. Abschnitte der Messdatensätze verschiedenen Gruppen zugeordnet. Rein beispielhaft sei genannt, dass eine Unterteilung in zwei oder mehr Gruppen erfolgt, wobei einer Gruppe jeweils ein Teil der Messdaten- Einträge der Messdatensätze zugeordnet wird und der oder den anderen Gruppen jeweils (der) andere Teil(e) der Messdaten-Einträge. Die Gruppierung ist derart, dass korrespondierende Teile bzw. Bereiche der Messdatensätze, also korrespondierende Messdaten-Einträge, jeweils der gleichen Gruppe zugeordnet werden. Beispielhaft sei genannt, dass eine erste Gruppe die ersten fünf Messdaten-Einträge der Messdatensätze umfasst, eine weitere Gruppe die nächsten sieben Messdaten-Einträge aller Messdatensätze und so weiter. Wenn die Messdatensätze durch Bilddaten gegeben sind oder solche umfassen, gehört zu einer Gruppe insbesondere der gleiche Bildausschnitt jedes Messdatensatzes, also jedes Bildes bzw. jeder Aufnahme.

Die Gruppen können einander ausschließen, mit anderen Worten disjunkt sein, oder sich auch überlappen, also gemeinsame Messdaten-Einträge umfassen. Die Gruppen-Unter-Messdatensätze verschiedener Gruppen sollten sich voneinander unterscheiden. Die Gruppen können flach sein oder auch in einer Struktur, beispielsweise einer Hierarchie, organisiert sein. Es ist sowohl möglich, dass alle Messdaten-Einträge jeweils einer oder mehreren Gruppen zugeordnete werden als auch, dass dies nur für einen Teil der Messdaten- Einträge gilt. Weiterhin ist es möglich, dass einer Gruppe nur ein Messdaten- Eintrag oder mehrere Messdaten-Einträge zugeordnet werden. Beispielhaft kann eine oder können mehrere oder kann jede Gruppe aus genau einem Messdaten-Eintrag bestehen.

Es kann beispielsweise eine von einem Benutzer vordefinierte Gruppierung oder eine von der oder der jeweiligen Lerndatensammlung, insbesondere der Struktur der Messdatensätze, abgeleitete, bevorzugt durch Clusterbildung erhaltene Gruppierung der Messdatensätze vorgenommen wird.

Die Resampling-Methode schließt in an sich bekannter Weise mit ein, dass ein oder mehrmals eine Unterteilung der Daten in einen Trainings- und Testteil erfolgt, man kann auch von Trainings- und Test-Sets sprechen. Von dem einen Teil, dem Trainingsanteil, werden die Unter-Messdatensätze nebst zugehörigen Target-Variablen dann genutzt, um das jeweilige Gruppen- Lernmodell zu trainieren, so dass es im trainierten Zustand (weitere) Target- Variablen Vorhersagen kann. Auf diese Weise werden maschinelle Lernmodelle für jede Gruppe angelernt, mit anderen Worten trainiert, wobei jeweils Messdatensätzen genutzt werden, die der jeweiligen Gruppe zugeordnet sind. Jeder Unter-Messdatensatz ist Teil eines Messdatensatzes und somit diesem zugeordnet bzw. zugehörig. Jedem Messdatensatz ist eine Traget-Variable zugeordnet, die entsprechend als auch dem Unter-Messdatensatz zugeordnet bzw. zu dem Unter- Messdatensatz gehörig erachtet werden kann.

Die zum anderen Teil, dem Testanteil, gehörigen Unter-Messdatensätzen der jeweiligen Gruppe werden anschließend (ohne die entsprechenden, zugehörigen Target-Variablen) dem jeweiligen Gruppen-Lernmodell zugeführt, um von diesem Vorhersagen zu erhalten. Man spricht auch von „out of sample“- Vorhersagen. Das Trainieren mit einem Teil und Testen mit einem anderen Teil der Daten kann im Rahmen des Resampling-basierten Modellierens in an sich bekannter Weise mehrfach erfolgen. Rein beispielhaft sei genannt, dass die Messdatensätze in zwei gleich oder auch verschieden große Teile aufgeteilt und in einem ersten Durchgang mit dem einen Teil trainiert und mit dem anderen vorhergesagt und in einem zweiten Durchgang getauscht, also mit dem anderen Teil trainiert und dem einen Teil getestet wird. So kann man eine Anzahl von „out of sample“ Vorhersagen erhalten, die der Gesamtanzahl der Messdatensätze entspricht, wobei dies keineswegs zwingend erforderlich ist, sondern nur eine Option darstellt. Da das Resampling-basierte Modellieren erfindungsgemäß für jede Gruppe geschieht, erhält man gruppenspezifische Vorhersagen.

Mit den gruppenspezifischen Vorhersagen und den Target-Variablen des Lerndatensatzes kann dann wenigstens ein Meta-Modell trainiert werden. Das wenigstens eine Meta-Modell ist nach dem Training in der Lage, auf Basis mehrerer gruppenspezifischer Vorhersagen als Input eine gemeinsame, gruppenübergreifende Vorhersage als Output zu liefern. Optional wird in Schritt A5 für jede Gruppe ein weiteres maschinelles Lernmodell mit zu der jeweiligen Gruppe gehörenden Gruppen-Unter- Messdatensätzen und zugehörigen Target-Variablen zweckmäßiger Weise ohne Nutzung einer Resampling-Methode trainiert. Diese Modelle werden vorliegend auch als Vorhersage-Gruppen-Lernmodelle bezeichnet, da sie vor allem für das erfindungsgemäße Vorhersage-Verfahren genutzt werden können. Hierbei schließt ein Lernmodell ohne Nutzung einer Resampling- Methode auch Lernmodelle mit ein, die aus zuvor trainierten Resampling basierten Lernmodellen abgeleitet oder zusammengefasst wurden. Beispielhaft seien auch Ensemble-Modelle aus Modellen, die zuvor Resampling basiert, z.B. durch k-Fold Kreuz-Validierung, träniert wurden, genannt.

Zur Vorhersage-Zeit durchläuft eine neue Instanz nacheinander alle Level des Stapels bzw. Stacks, also die trainierten maschinellen Lernmodelle aller Level, und es werden Vorhersagen für jedes Level erhalten. Die finale Vorhersage aus dem letzten, höchsten Level und die intermediären Vorhersagen aus dem oder den vorangegangenen Leveln können für die Interpretation und das Treffen von Entscheidungen genutzt werden.

Prinzipiell können verschiedenen Arten von Vorhersagen im Rahmen des erfindungsgemäßen Trainings- sowie Vorhersage-Verfahrens getroffen werden, beispielsweise vorhergesagte Werte oder Vorhersage- Wahrscheinlichkeiten oder Konfidenz. Bei den Vorhersage-Target-Variablen kann es sich entsprechend beispielsweise um Vorhersage-Werte, Vorhersage-Wahrscheinlichkeiten oder auch Konfidenzen handeln bzw. sie können solche umfassen. Es sei angemerkt, dass alternativ zu dem Begriff Target- Variable auch der Ausdruck Zielvariable verwendet werden kann. Da die Modelle in jedem Level das Ergebnis bzw. das Target Vorhersagen, ist die Ausgabe jedes Levels mehr auf das Target ausgerichtet als auf jegliche andere Information, die in den Rohdaten, insbesondere den Messdatensätzen, enthalten sind. Mit anderen Worten erzeugt jedes Level durch das Ausgeben von Target-Vorhersagen bzw. -Schätzungen eine abstraktere Repräsentation der Daten und reduziert somit private Informationen. Dies macht es möglich, insbesondere bei dem messortübergreifenden Teilen bzw. Zusammenführen von Daten ein hohes Maß an Privatsphäre zu gewährleisten, was einen wichtigen Vorteil der Erfindung darstellt. Die Erfindung ermöglicht es, weniger private Daten zu teilen, wobei gleichzeitig genauere Modelle unter Nutzung von Daten mehrerer Standorte („Cross-Site“), erhalten werden können.

Rein beispielhaft für Resampling-Methoden, die im Rahmen der Erfindung genutzt werden können, seien das Bootstrapping und die Kreuz-Validierung, etwa die Leave-One-Out-Kreuz-Validierung bzw. die k-Fold-Kreuz- Validierung, genannt. Natürlich kann auch eine Kombination verschiedener Resampling-Methoden zum Einsatz kommen, sowohl innerhalb eines Levels als auch über verschiedene Level betrachtet.

Das im Rahmen der vorliegenden Erfindung erfolgende Training maschineller Lernmodellen kann ferner das Tunen von Hyperparametern umfassen, wobei dies für sämtliche Lernmodelle in allen Leveln gilt.

Als besonders geeignet hat es sich erwiesen, wenn im Rahmen der vorliegenden Erfindung zwei, drei oder vier Level bzw. Lagen maschineller Lernmodelle vorgesehen sind. Man kann auch von einem Stack mit zwei, drei oder vier Leveln sprechen. Es ist aber auch keineswegs ausgeschlossen, dass mehr Level genutzt werden. Es kann insbesondere eine Anzahl von Leveln bzw. Lagen des Stacks vorgesehen werden, die an die Gruppierung angepasst ist. Level können auch hierarchisch organisiert sein. Rein beispielhaft sei die hierarchische Strukturierung von Gehirn-MRT Daten anhand des Gehirn-Parzellierungs-Schemas von Yeo et al. (2011) genannt. Hier wäre es möglich, zuerst in Level 1 die Voxel anhand ihrer Gehirn- Parzellierungen als Gruppierung zum Modellieren der Target-Variable zu nutzen. In Level 2 könnten die Vorhersagen pro Gehirn-Parcel genutzt werden, um die Target-Variable anhand ihrer von Yeo et. al definierten Gehirn- Netzwerke als Gruppierung zu modellieren. Dies ist eine hierarchische Struktur, indem jedes Netzwerk aus mehreren Parcel besteht, die aus mehreren Voxel bestehen. In diesem Beispiel würden zweckmäßiger Weise nicht alle Voxel als Input verwendet werde, da dieses Gehirn-Parzellierungs-Schema ausschließlich zerebralen Kortex betrachtet. Nun könnten alle nicht genutzten Voxel bei dem Trainings-Verfahren unbetrachtet bleiben oder unter Hinzuführung anderer Parzellierungs-Schemas zusätzlich für weitere hierarchische oder nicht hierarchisch Modellierungen genutzt werden. Dies bedeutet, dass in einem Level 4 nun die Vorhersagen gruppiert anhand verschiedener Parzellierung-Schemas genutzt werden können. Dies beinhaltet entweder verschiedene Netzwerke oder Hirn-Parzellierungen oder eine Mischung aus beidem. Dies ist nur ein Beispiel der Möglichkeiten, die im Rahmen der vorliegenden Erfindung in Frage kommen. Andere Kombinationen von hierarchisch oder nicht hierarchischen, sich überlappenden oder nicht überlappenden Gruppierungen sind ebenfalls möglich.

Bei den im Rahmen der vorliegenden Erfindung zum Einsatz kommenden maschinellen Lernmodellen kann es sich um solche beliebiger Art handeln. Ein Benutzer kann insbesondere frei wählen, welches Modell bzw. welche Modelle er für die verschiedenen Gruppen und Level wählt. Die Modelle können insbesondere einen oder mehrere beliebige Maschinelles-Lernen- Algorithmen umfassen oder dadurch gegeben sein. Rein beispielhaft für Ma- schinelles-Lernen-Algorithmen seien Entscheidungsbäume und Support Vec- tor Machines genannt. Werden inhärent interpretierbare Modelle gewählt, wird die Gesamtlösung als solche interpretierbar.

Bei einer Ausführungsform des erfindungsgemäßen Trainings-Verfahrens ist vorgesehen, dass die verschiedenen Lerndatensätze zu verschiedenen Patienten gehören und die Lerndatensätze medizinisch relevante Messdatensätze, insbesondere Messdatensätze, die mittels medizinischer Diagnostikverfahren erhalten wurden, umfassen, und die Target-Variablen Eigenschaften der Patienten, insbesondere ein Alter und/oder einen Krankheitszustand der Patienten, betreffen oder dadurch gegeben sind.

Die Messdatensätze können beispielsweise durch Bildaufnahmen, insbesondere MRT-Bildaufnahmen, menschlicher Gehirne gegeben sein oder solche umfassen. Die erfindungsgemäß vorgesehene Gruppierung kann dann in Parzellen erfolgen, so dass jede Gruppe einer bestimmten Parzelle mit bestimmten, zweckmäßiger Weise zusammenhängenden Voxeln entspricht. Der Ausdruck Voxel setzt sich aus „volumetric“ und „pixel“ zusammen und entspricht in bekannter Weise dem 3D-Äquivalent zu einem Pixel. Die Mess- daten-Einträge können dann insbesondere Voxel-weise Messungen von MRT-Daten sein, etwa dem Graue-Zellen-Volumen, wobei zu jeder Gruppe die Voxel einer bestimmten Gehirnparzelle gehören.

Insbesondere im konkreten Falle des Gehirn-MRT können mittels der Erfindung bekannte Regelmäßigkeiten in den Daten ausgenutzt werden, um zunächst ortsbezogene Vorhersagen zu treffen, die von finalen, gehirnübergreifenden, mit anderen Worten dem gesamten Gehirn zugeordneten Vorhersagen gefolgt werden. Man kann sich beispielsweise eine Alters- oder Geschlechtsvorhersage vorstellen, die als Musterfälle für die Regression bzw. Klassifizierung dienen können. Diese Musterfälle bieten klinische Anwendbarkeit, sind gut etabliert, bieten bekanntermaßen eine hohe Genauigkeit und ihre Ergebnisse einschließlich der Bedeutung der Merkmale sind einfach zu verifizieren. Es ist beispielsweise erwartet, dass das Volumen der grauen Zellen mit zunehmendem Alter abnimmt, so dass von einer negativen Merkmalsgewichtung auszugehen ist. Im Rahmen der Erfindung wird das niedrigste Level des Stacks prädiktive Modelle unter Nutzung von a priori definierten Gruppierungen von Gehirnregionen aufbauen. Im Anschluss an die Trainingsphase können die trainierten gruppenspezifischen Modelle und das Meta-Modell oder die Meta-Modelle genutzt werden, um Vorhersagen für einen bereitgestellten Messdatensatz, beispielsweise eine MRT-Aufnahme eines Patienten, zu treffen.

Im Falle von MRT-Bildaufnahmen von Patienten, etwa deren Gehirne, können die Target-Variablen beispielsweise durch das Alter des jeweiligen Patienten, oder auch einen Erkrankungsstatus gegeben sein. Im Rahmen des Vorhersage-Verfahrens kann entsprechend z.B. ein Patientenalter bzw. Patientenkrankenstatus vorhergesagt werden.

Eine weitere Ausführungsform zeichnet sich dadurch aus, dass die verschiedenen Lerndatensätze zu verschiedenen Personen gehören und die Messdatensätze durch Bildaufnahmen zumindest eines Teils des Gesichts und/oder zumindest eines Teils des Körpers der Personen gegeben sind oder solche umfassen, und die Target-Variablen Eigenschaften der Personen betreffen oder dadurch gegeben sind. Die Messdaten-Einträge können dann jeweils einem Pixel entsprechen oder zugeordnet sein. Weiterhin kann vorgesehen sein, dass die Eigenschaften der Personen keinen Krankheitszustand der Personen betreffen bzw. nicht durch einen Krankheitszustand der Personen gegeben sind.

Mit anderen Worten kann auch ein Training mit Bildaufnahmen von Gesichtern bzw. Gesichtsteilen und/oder den Körpern bzw. Körperteilen von Perso- nen und Eigenschaften der Personen, wie etwa dem Alter und/oder Geschlecht, erfolgen. Im Anschluss an die Trainingsphase können die trainierten gruppenspezifischen Modelle und das Meta-Modell oder die Meta- Modelle genutzt werden, um Vorhersagen für einen bereitgestellten Messdatensatz, beispielsweise eine Aufnahme des Gesichtes einer Person, zu treffen, z.B. das Alter und/oder Geschlecht der Person vorherzusagen.

Bezüglich der erfindungsgemäß vorgesehenen Gruppierung kann in diesem Falle beispielsweise gelten, dass eine Gruppierung nach bestimmten Bereichen bzw. Teilen des Gesichtes (z.B. Nase, Augen, ...) und/oder Körpers erfolgt.

Auch ist es möglich, die verschiedenen Lerndatensätze zu verschiedenen Abschnitten der Erdoberfläche gehören und die Messdatensätze durch Bildaufnahmen, insbesondere Satellitenaufnahmen, von den Erdoberflächenabschnitten gegeben sind oder solche umfassen, und die Target-Variablen Eigenschaften der Erdoberflächenabschnitte, insbesondere das Vorhandensein bestimmter Elemente, bevorzugt das Vorhandensein von Feldern und/oder Flüssen und/oder Seen, betreffen oder dadurch gegeben sind.

Mit anderen Worten kann ein Training mit Satellitenaufnahmen der Erdoberfläche und bestimmten zu dem jeweils gezeigten Abschnitt gehörigen Landschaftsmerkmalen, wie der Existenz von Feldern, Seen, Flüssen, etc. erfolgen. Im Anschluss an die Trainingsphase können die trainierten gruppenspezifischen Modelle und das Meta-Modell oder die Meta-Modelle genutzt werden, um Vorhersagen für eine neue Satellitenaufnahme mit unbekannten Merkmalen zu treffen, etwa vorherzusagen, ob diese Flüsse, Seen und/oder Felder zeigt, um nur einige Beispiel möglicher Merkmale zu nennen. Bezüglich der erfindungsgemäß vorgesehenen Gruppierung kann in diesem Falle insbesondere gelten, dass eine Gruppierung nach bestimmten Bereichen bzw. Teilen der Bildaufnahmen erfolgt. Es kann beispielsweise eine Segmentierung (Bildsegmentierung) erfolgen, im Rahmen derer bevorzugt inhaltlich zusammenhängende Regionen bzw. Bereiche bestimmt werden, die benachbarte Pixel umfassen, die ein bestimmtes Homogenitätskriterium erfüllen. Die erhaltenen Segmente können dann jeweils eine Gruppe darstellen bzw. einer solchen entsprechen.

Als weiteres Beispiel sei genannt, dass die verschiedenen Lerndatensätze zu verschiedenen Personen gehören und die Messdatensätze durch Informationen über das Benutzerverhalten der Personen, insbesondere auf wenigstens einer Webseite, gegeben sind oder solche umfassen, und die Target- Variablen Informationen über von den Personen vorgenommene Handlungen, insbesondere von den Personen getätigte Käufe, betreffen oder dadurch gegeben sind. Es handelt sich zweckmäßiger Weise um auf der wenigstens eine Webseite vorgenommene Handlungen, etwa Käufe von Produkten und/oder Dienstleistungen, die auf der wenigstens einen Webseite angeboten werden.

Die von den Messdatensätzen umfassten Informationen über das Benutzerverhalten der Personen können beispielsweise Informationen darüber umfassen, wie lange sich die Personen auf einer Webseite aufgehalten haben, in welchen Bereich bzw. in welche Bereiche der Webseite die Personen den Mauszeiger bewegt haben und insbesondere, wie lange der Mauszeiger in den jeweiligen Bereichen verweilte, und/oder, in welche Bereiche die Personen mit dem Mauszeiger geklickt haben. Mit anderen Worten kann ein Training mit Informationen über das Benutzerverhalten, insbesondere im Internet, und zugehörige bestimmte Benutzerhandlungen, etwa Käufe, erfolgen.

Im Anschluss an die Trainingsphase können die trainierten gruppenspezifischen Modelle und das Meta-Modell oder die Meta-Modelle genutzt werden, um auf Basis von Daten zum Benutzerverhalten wenigstens einer weiteren Person Vorhersagen über Handlungen bzw. Handlungswahrscheinlichkeiten, etwa über Kaufwahrscheinlichkeiten für bestimmte Produkte und/oder Dienstleistungen, zu treffen.

Bezüglich der Gruppierung kann dann beispielsweise gelten, dass verschiedene Bereiche der wenigstens einen Webseite verschiedene Gruppen bilden bzw. solchen entsprechen, mit andere Worten eine Gruppierung in verschiedene Webseitenbereiche bzw. -abschnitte erfolgt.

Ein weiteres Ausführungsbeispiel zeichnet sich dadurch aus, dass die verschiedenen Lerndatensätze zu verschiedenen DNA-Sequenzen und/oder Proteinsequenzen und/oder Genexpressionen gehören und die Messdatensätze durch Informationen über die DNA-Sequenzen und/oder Proteinsequenzen und/oder Genexpressionen gegeben sind oder solche umfassen. Zweckmäßiger Weise handelt es sich dann um den Aufbau der DNA- Sequenzen bzw. Proteinsequenzen bzw. Genexpressionen betreffende Informationen. Die Informationen können Sequenz-basierte Merkmale von DNA-Sequenzen und/oder Proteinsequenzen umfassen bzw. Genexpressionsdaten. Die Target-Variablen betreffen dann zweckmäßiger Weise (andere) Merkmale der DNA-Sequenzen und/oder Proteinsequenzen und/oder Genexpressionendaten, insbesondere Bindungsstellen und/oder Protein- Protein-Wechselwirkungen und/oder Lösungsmittel-Eigenschaften dieser, oder sind dadurch gegeben. Im Anschluss an die Trainingsphase können die trainierten gruppenspezifischen Modelle und das Meta-Modell oder die Meta-Modelle dann z.B. genutzt werden, um basierend auf Informationen für eine neue DNA- oder Proteinsequenz oder Genexpressionsdaten, insbesondere basierend auf einem zugehörigen Messdatensatz, Bindungsstellen bzw. Protein-Protein- Wechselwirkungen bzw. Lösungsmittel-Eigenschaften vorherzusagen.

Bezüglich der Gruppierung ist beispielsweise möglich, dass Gruppen unter Nutzung von Domänen-Wissen, wie etwa bekannter Gen-Regionen bzw. Interaktions-Netzwerke, definiert werden.

Die Messdaten für das Training können von einem oder auch mehreren Messorten stammen. In letzterem Falle können für jeden Messort wiederum eigene Gruppen-Lernmodelle, mit anderen Worten messortspezifische Grup- pen-Lernmodelle eingeführt werden.

In bevorzugter Weiterbildung des erfindungsgemäßen Trainings-Verfahrens ist daher vorgesehen, dass in Schritt A1 Lerndatensammlungen von und insbesondere an verschiedenen Messorten bereitgestellt werden, wobei die Lerndatensammlungen jeweils mehrere Lerndatensätze mit Messdaten- Einträgen und zugehörigen Target-Variablen umfassen.

Sollen messortübergreifende Daten („Cross-Site-Daten“) für das Training verwendet werden, ist besteht in der Regel eine besonders große Problematik, was die Privatsphäre bzw. den Datenschutz angeht, denn die Daten der verschiedenen Messorte müssen dafür geteilt, mit anderen Worten aus der Hand gegeben werden, damit sie an einem anderen Messort oder auch dritter Stelle, für das Training von Lernmodellen genutzt werden können. Dies ganz besonders, wenn es um Daten mit medizinischer Relevanz geht und/oder andere besonders sensible Daten. Dezentrales Lernen bietet zwar die Möglichkeit höherer Privatsphäre, da die Daten nicht zentral zusammengeführt werden müssen, sondern am jeweiligen Messort verbleiben können. Wie bereits angemerkt, führt dezentrales Lernen jedoch in der Regel zu ungenaueren Modellen.

Die Erfindung bietet hier einen großen Vorteil, denn das Teilen bzw. Zusammenführen von Daten ist auf verschiedenen der vorgesehenen Level möglich, wobei die Privatsphäre bzw. der Datenschutz umso höher sind, je höher das Level ist, in welchem das Teilen bzw. Zusammenführen erfolgt. Dabei gilt jedoch, dass bereits in den Vorhersagen des niedrigsten Levels, also den gruppenspezifischen bzw. gruppenweisen Vorhersagen, keine oder jedenfalls nur limitierte private Information enthalten ist, da ihr Informationsgehalt nur auf die Vorhersage, mit anderen Worten das vorhergesagte Target, bezogen ist. Entsprechend können bereits diese Daten über Messorte hinweg zum Anlernen von ML-Modellen geteilt und dennoch die Privatsphäre gewahrt bleiben.

Messortübergreifende Modelle („Cross-Site-Modelle“) können im Rahmen der Erfindung auf verschiedene Weise eingeführt bzw. erhalten werden. So kann beispielsweise eine intermediäre Fusion erfolgen, bei der Vorhersagen der Modelle der niedrigsten Level messortübergreifend geteilt werden, um eine ML-Modell mit den gepoolten Daten anzulernen. Auch ist es möglich, eine „späte Fusion“ vorzunehmen, bei dem erst Vorhersagen des nächsthöheren Levels geteilt werden, was in eine gewichtetes Aggregations- ZEnsemble-Modell resultiert. In allen Fällen, in denen ein Zusammenführen der Vorhersagen der Modelle erfolgt, sei es im niedrigsten oder auch höheren Leveln, werden Harmonisierungseffekte erzielt und die Privatsphäre erhöht. Eine Ausführungsform des erfindungsgemäßen Trainings-Verfahrens zeichnet sich dadurch aus, dass in Schritt A3 für jeden Messort eigene Resampling-basierte messortspezifische Gruppen-Lernmodelle mit den zum jeweiligen Messort gehörigen Lerndatensätzen trainiert und getestet werden, wobei die Resampling-Methode jeweils einschließt, dass wenigstens ein Trainieren mit einem Teil der messortspezifischen Gruppen-Unter- Messdatensätze und zugehörigen messortspezifischen Target-Variablen erfolgt, und wenigstens ein Testen mit einem anderen Teil der messortspezifischen Gruppen-Unter-Messdatensätze erfolgt, und wobei das wenigstens eine Testen für den jeweiligen Messort Vorhersagen für verschiedene Gruppen, messort- und gruppenspezifische Vorhersagen, liefert.

Ein Teilen der Lerndatensammlungen, mit anderen Worten Rohdaten, ist dann nicht nötig. Die Daten jedes Messortes können unabhängig vom dem oder den Daten anderer Messorte verarbeitet werden, wobei die erfindungsgemäße Gruppierung und das Resampling-basierte Trainieren und Testen zum Erhalt der gruppenspezifischen Vorhersagen messortweise erfolgen. Im Ergebnis liegen für die einzelnen Messorte jeweils gruppenspezifische Vorhersagen vor, die vorliegend auch als messort- und gruppenspezifische Vorhersagen bezeichnet werden.

Dann kann weiterhin vorgesehen sein, dass in Schritt A5 für jeden Messort eigene messortspezifische Vorhersage-Gruppen-Lernmodelle insbesondere ohne Nutzung einer Resampling-Methode trainiert werden, wobei das Training bevorzugt jeweils mit allen messortspezifischen Gruppen-Unter- Messdatensätzen und zugehörigen messortspezifischen Target-Variablen erfolgt. Auf diese Weise erhaltene messortspezifische Vorhersage-Gruppen- Lernmodelle können insbesondere für die spätere Vorhersage genutzt werden. In Schritt A4 können dann die messort- und gruppenspezifischen Vorhersagen und zugehörigen messortspezifischen Target-Variablen verschiedener Messorte zusammengeführt werden und damit ein zusammenführendes messort- und gruppenübergreifendes Meta-Lernmodell insbesondere ohne Nutzung einer Resampling-Methode trainiert werden. Dieses Szenario entspricht der vorstehend bereits erwähnten intermediären Datenfusion.

Weiterhin kann vorgesehen sein, dass in Schritt A4 für jeden Messort ein Resampling-basiertes messortspezifisches gruppenübergreifendes Meta- Lernmodell trainiert und getestet wird, wobei die Resampling-Methode einschließt, dass wenigstens ein Trainieren mit einem Teil der messort- und gruppenspezifischen Vorhersagen und den zugehörigen messortspezifischen Target-Variablen der Lerndatensammlungen erfolgt, und wenigstens ein Testen mit einem anderen Teil der messort- und gruppenspezifischen Vorhersagen und den zugehörigen messortspezifischen Target-Variablen der Lerndatensammlungen erfolgt, und wobei das wenigstens eine Testen messortspezifische gruppenübergreifende Vorhersagen liefert.

Dies hat sich insbesondere als zweckmäßig erwiesen, wenn keine intermediäre Datenfusion erfolgt und die messort- und gruppenspezifischen Vorhersagen von verschiedenen Messorten nicht geteilt bzw. zusammengeführt werden.

Mit den von mehreren Messorten stammenden messortspezifischen gruppenübergreifenden Vorhersagen und zugehörigen messortspezifischen Target-Variablen kann dann ein Kreuz-Messort-Meta-Lernmodell bevorzugt ohne Nutzung einer Resampling-Methode trainiert werden, so dass es aus mehreren messortspezifischen gruppenübergreifenden Vorhersagen eine messort- und gruppenübergreifende Vorhersage liefern kann. Weiter bevorzugt wird dann insbesondere in Schritt A4 für jeden Messort ein messortspezifisches gruppenübergreifendes Meta-Lernmodell bevorzugt ohne Nutzung einer Resampling-Methode trainiert, wobei das Training jeweils mit den messort- und gruppenspezifischen Vorhersagen und den zugehörigen messortspezifischen Target-Variablen der jeweiligen Lerndatensammlung erfolgt, bevorzugt jeweils mit allen messort- und gruppenspezifischen Vorhersagen und zugehörigen messortspezifischen Target-Variablen. Die auf diese Weise erhaltenen nicht Resampling-basierten messortspezifischen gruppenübergreifenden Meta-Lernmodelle können insbesondere für die spätere Vorhersage genutzt werden.

Auch kann vorgesehen sein, dass eine zusätzliche Lerndatensammlung von einem von den Messorten verschiedenen zusätzlichen Messort bereitgestellt wird, und eine Gruppierung der Messdaten-Einträge der Messdatensätze der zusätzlichen Lerndatensammlung in mehrere Gruppen wie in Schritt A2 vorgesehen erfolgt, wodurch zusätzliche Gruppen-Unter- Messdatensätze erhalten werden, die zusätzlichen Gruppen-Unter-Messdatensätze und die Target- Variablen der zusätzlichen Lerndatensammlung jeweils den zu den Messorten gehörigen insbesondere ohne Nutzung einer Resampling- Methode trainierten messortspezifischen Vorhersage-Gruppen- Lernmodellen zugeführt und von diesen messort- und gruppenspezifische Vorhersagen erhalten werden, die messort- und gruppenspezifische Vorhersagen jeweils den zu den Messorten gehörenden insbesondere ohne Nutzung einer Resampling-Methode trainierten messortspezifischen gruppenübergreifenden Meta-Lernmodellen zugeführt und von diesen messortspezifische gruppenübergreifende Vorhersagen erhalten werden, mit den messortspezifischen gruppenübergreifenden Vorhersagen und den Target-Variablen der zusätzlichen Lerndatensammlung ein Zu- satz-Kreuz-Messort-Meta-Lernmodell bevorzugt ohne Nutzung einer Resampling-Methode trainiert wird.

Es ist mit anderen Worten möglich, zu verschiedenen Messorten gehörige trainierte Lernmodelle zu nutzen, um Vorhersagen für Daten von noch einem weiteren Messort zu treffen. Rein beispielhaft sei genannt, dass mit Daten eines Messortes A Lernmodelle und mit den Daten eines Messortes B Lernmodelle trainiert und somit messortspezifische Lernmodelle für A und B erhalten werden. Dann werden Daten eines dritten Messortes C bereitgestellt und die Daten von C sowohl zu Messort A gehörigen Lernmodelle als auch zu Messort B gehörigen Lernmodellen zugeführt und Vorhersagen erhalten. Es sei betont, dass das Szenario mit Messorten A, B und C rein beispielhaft und natürlich auch eine andere Anzahl von Messorten möglich ist.

In vorteilhafter Weiterbildung des erfindungsgemäßen Trainings-Verfahrens ist ferner vorgesehen, dass dem trainierten messortspezifischen gruppenübergreifenden Meta-Lernmodell wenigstens eines Messortes messort- und gruppenspezifische Vorhersagen wenigstens eines anderen Messortes nebst zugehöriger Target-Variablen zugeführt und hierdurch messortspezifische gruppenübergreifende Kreuz-Vorhersagen erhalten werden. Bevorzugt werden alle messort- und gruppenspezifische Vorhersagen und zugehörigen Target-Variablen des (jeweils) anderen Messortes zugeführt.

Das Kreuz-Messort-Meta-Lernmodell kann dann mit den messortspezifischen gruppenübergreifenden Vorhersagen und den messortspezifischen gruppenübergreifenden Kreuz-Vorhersagen trainiert werden. Bei dem erfindungsgemäßen Vorhersage-Verfahren ist in vorteilhafter Weiterbildung vorgesehen, dass in Schritt B2 messortspezifische Vorhersage-Gruppen-Lernmodelle verschiedener Standorte, die unter Durchführung des erfindungsgemäßen Trainings-Verfahrens erhalten wurden, und/oder Resampling- basierte messortspezifische Gruppen-Lernmodelle verschiedener Standorte, die unter Durchführung des erfindungsgemäßen Trainings- Verfahrens erhalten wurden, und ein zusammenführendes messort- und gruppenübergreifendes Meta-Lernmodell, das unter Durchführung des erfindungsgemäßen Trainings-Verfahrens insbesondere ohne Nutzung einer Resampling-Methode erhalten wurde, bereitgestellt werden, die in Schritt B3 erhaltenen Gruppen-Unter-Messdatensätze in Schritt B4 den messortspezifischen Vorhersage-Gruppen-Lernmodellen oder den Resampling-basierten messortspezifische Gruppen-Lernmodelle verschiedenen Messorte zugeführt und messort- und gruppenspezifische Vorhersagen erhalten werden, die jeweils zu einer Gruppe gehörenden Vorhersagen verschiedener Messorte durch ein statistisches Verfahren, insbesondere Mittelung, miteinander kombiniert werden, so dass eine gruppenspezifische Vorhersage für jede Gruppe erhalten wird, die gruppenspezifischen Vorhersagen dem zusammenführenden messort- und gruppenübergreifenden Meta-Lernmodell zugeführt werden und von diesem eine messort- und gruppenübergreifende Vorhersage erhalten wird.

Diese Vorgehensweise hat sich insbesondere für den Fall bewährt, dass im Rahmen des Trainings eine intermediäre Datenfusion erfolgte, im Rahmen derer Vorhersagen der Modelle des niedrigsten Levels kombiniert bzw. zusammengeführt wurden. Alternativ oder zusätzlich kann vorgesehen sein, dass

- in Schritt B2 messortspezifische Vorhersage-Gruppen-Lernmodelle verschiedener Standorte, die unter Durchführung des erfindungsgemäßen Trainings-Verfahrens erhalten wurden, und/oder Resampling- basierte messortspezifische Gruppen-Lernmodelle verschiedener Standorte, die unter Durchführung des erfindungsgemäßen Trainings- Verfahrens erhalten wurden, und ein zusammenführendes messort- und gruppenübergreifendes Meta-Lernmodell, das unter Durchführung des erfindungsgemäßen Trainings-Verfahrens insbesondere ohne Nutzung einer Resampling-Methode erhalten wurde, bereitgestellt werden,

- die in Schritt B3 erhaltenen Gruppen-Unter-Messdatensätze in Schritt B4 den messortspezifischen Vorhersage-Gruppen-Lernmodellen oder den Resampling-basierten messortspezifischen Gruppen-Lernmodelle n der verschiedenen Messorte zugeführt und messort- und gruppenspezifische Vorhersagen erhalten werden,

- die messort- und gruppenspezifischen Vorhersagen messortweise dem zusammenführenden messort- und gruppenübergreifenden Meta- Lernmodell zugeführt und so messortspezifische gruppenübergreifende Vorhersagen für jeden Messort erhalten werden,

- die messortspezifischen gruppenübergreifenden Vorhersagen durch ein statistisches Verfahren, insbesondere Mittelung, miteinander kombiniert werden, so dass eine messort- und gruppenübergreifende Vorhersage erhalten wird.

Dies hat sich vor allem als weitere geeignete Vorhersagevariante für denjenigen Fall erwiesen, dass im Rahmen des Trainings eine intermediäre Datenfusion erfolgte. Eine weitere vorteilhafte Ausführungsform des erfindungsgemäßen Vorhersage-Verfahrens zeichnet sich ferner dadurch aus, dass

- in Schritt B2 messortspezifische Vorhersage-Gruppen-Lernmodelle verschiedener Standorte, die unter Durchführung des erfindungsgemäßen Trainings-Verfahrens erhalten wurden, und/oder Resampling- basierten messortspezifischen Gruppen-Lernmodelle verschiedener Standorte, die unter Durchführung des erfindungsgemäßen Trainings- Verfahrens erhalten wurden und messortspezifische gruppenübergreifende Meta-Lernmodelle, die unter Durchführung des erfindungsgemäßen Trainings-Verfahrens insbesondere ohne Nutzung einer Resampling-Methode erhalten wurden, und ein Kreuz-Messort-Meta- Lernmodell, das unter Durchführung des erfindungsgemäßen Trainings-Verfahrens insbesondere ohne Nutzung einer Resampling- Methode erhalten wurde, und/oder ein Zusatz-Kreuz-Messort-Meta- Lernmodell, das unter Durchführung des erfindungsgemäßen Trainings-Verfahrens insbesondere ohne Nutzung einer Resampling- Methode erhalten wurde, bereitgestellt werden,

- die in Schritt B3 erhaltenen Gruppen-Unter-Messdatensätze in Schritt B4 den messortspezifischen Vorhersage-Gruppen-Lernmodellen oder den Resampling-basierten messortspezifischen Gruppen- Lernmodellen der verschiedenen Messorte zugeführt und messort- und gruppenspezifische Vorhersagen erhalten werden,

- die messort- und gruppenspezifischen Vorhersagen messortweise dem jeweiligen zugehörigen messortspezifischen gruppenübergreifenden Meta-Lernmodell zugeführt werden und so messortspezifische gruppenübergreifende Vorhersagen (für jeden Messort erhalten werden,

- die messortspezifischen gruppenübergreifenden Vorhersagen dem Kreuz-Messort-Meta-Lernmodell oder dem Zusatz-Kreuz-Messort- Meta-Lernmodell zugeführt und von diesem eine messort- und gruppenübergreifende Vorhersage erhalten wird.

Dieses Ausführungsbeispiel eignet sich besonders für denjenigen Fall, dass im Rahmen des Trainings eine späte Datenfusion erfolgte, im Rahmen derer Vorhersagen des bzw. der Modelle eines höheren als des niedrigsten Levels kombiniert bzw. zusammengeführt wurden.

Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Computerprogramm, das Instruktionen umfasst, die, wenn sie auf wenigstens einem Computer ausgeführt werden, den wenigstens einen Computer veranlassen, die Schritte des erfindungsgemäßen Trainings-Verfahrens und/oder die Schritte des erfindungsgemäßen Vorhersage-Verfahrens durchzuführen.

Gegenstand der Erfindung ist auch ein computerlesbares Medium, das Instruktionen umfasst, die, wenn sie auf wenigstens einem Computer ausgeführt werden, den wenigstens einen Computer veranlassen, die Schritte des erfindungsgemäßen Trainings-Verfahrens und/oder die Schritte des erfindungsgemäßen Vorhersage-Verfahrens durchzuführen.

Es ist auch möglich, dass zumindest ein Teil der Schritte des erfindungsgemäßen Trainings-Verfahrens und/oder zumindest ein Teil Schritte des erfindungsgemäßen Vorhersage-Verfahrens in einer Cloud durchgeführt werden. Darunter ist insbesondere die Nutzung von extern bzw. entfernt bzw. verteilt betriebenen Diensten über das Internet (Cloud-Computing) zu verstehen, wobei sowohl „Infrastructure as a Service“ (laaS) als auch „Platform as a Service“ (PaaS) als auch „Software as a Service“ (SaaS) darunterfallen.

Schließlich ist Gegenstand der Erfindung eine Vorrichtung zur Durchführung des erfindungsgemäßen Trainings-Verfahrens und/oder des erfindungsge- TI mäßen Vorhersage-Verfahrens, umfassend einen Computer mit einem Datenspeicher, auf dem das erfindungsgemäße Computerprogramm gespeichert ist.

In bevorzugter Ausgestaltung umfasst die erfindungsgemäße Vorrichtung einen MRT-Scanner-Einrichtung. Diese ist ausgebildet und eingerichtet, um MRT-Aufnahmen von einem Patienten zu erstellen. Die erfindungsgemäße Vorrichtung hat sich insbesondere bewährt, um das erfindungsgemäße Trainings-Verfahren und/oder Vorhersage-Verfahren lokal auszuführen.

Hinsichtlich der Ausgestaltungen der Erfindung wird auch auf die Unteransprüche sowie auf die nachfolgende Beschreibung mehrerer Ausführungsbeispiele unter Bezugnahme auf die beiliegende Zeichnung verwiesen.

In der Zeichnung zeigt in rein schematischer Darstellung:

Figur 1 ein erstes Ausführungsbeispiel des erfindungsgemäßen computerimplementierten Trainings-Verfahrens für den Fall, dass die Lerndatensätze von einem Messort stammen, und ein erstes Ausführungsbeispiel des erfindungsgemäßen computerimplementierten Vorhersage-Verfahrens, das trainierte Modelle nutzt, die mit dem Trainings-Verfahren gemäß dieser Figur erhalten wurden;

Figur 2 MRT-Aufnahmen menschlicher Gehirne der Lerndatensammlung aus Figur 1 nebst einer rein schematischen Darstellung zur Gruppierung in Hirn-Parzellen;

Figur 3 ein zweites Ausführungsbeispiel des erfindungsgemäßen computerimplementierten Trainings-Verfahrens für den Fall, dass die Lerndatensätze von zwei verschiedenen Messorten stammen, und ein zweites Ausführungsbeispiel des erfindungsgemäßen computerimplementierten Vorhersage-Verfahrens, das trainierte Modelle nutzt, die mit dem Trainings-Verfahren gemäß dieser Figur erhalten wurden;

Figur 4 ein drittes Ausführungsbeispiel des erfindungsgemäßen computerimplementierten Vorhersage-Verfahrens, das ebenfalls trainierte Modelle nutzt, die mit dem Trainings-Verfahren gemäß Figur 3 erhalten wurden;

Figur 5 ein drittes Ausführungsbeispiel des erfindungsgemäßen computerimplementierten Trainings-Verfahrens für den Fall, dass die Lerndatensätze von zwei verschiedenen Messorten stammen, und ein viertes Ausführungsbeispiel des erfindungsgemäßen computerimplementierten Vorhersage-Verfahrens, das trainierte Modelle nutzt, die mit dem Trainings-Verfahren gemäß dieser Figur erhalten wurden; und

Figur 6 ein viertes Ausführungsbeispiel des erfindungsgemäßen computerimplementierten Trainings-Verfahrens für den Fall, dass die Lerndatensätze von drei verschiedenen Messorten stammen, und ein fünftes Ausführungsbeispiel des erfindungsgemäßen computerimplementierten Vorhersage-Verfahrens, das trainierte Modelle nutzt, die mit dem Trainings-Verfahren gemäß dieser Figur erhalten wurden.

In den Figuren sind gleiche bzw. korrespondierende Elemente mit gleichen Bezugszeichen versehen. Die Figur 1 zeigt oben in rein schematischer Blockdarstellung Schritte eines ersten Ausführungsbeispiels des erfindungsgemäßen computerimplementierten Trainings-Verfahrens Tr. Diese sind in einer mit Tr bezeichneten Umrahmung zusammengefasst. Darunter befindet sich ein weiterer, mit Vo bezeichneter Rahmen, innerhalb dem die Schritte eines ersten korrespondierenden Ausführungsbeispiels des erfindungsgemäßen computerimplementierten Vorhersage-Verfahrens dargestellt sind, das mit dem Trainings- Verfahren gemäß Figur 1 erhaltene maschinelle Lernmodelle MG1 , MG2, MM nutzt. In der Figur ist die Nutzung auch über gestrichelte Pfeile schematisch angedeutet.

Die Figuren 3, 5 und 6 haben einen zu der Figur 1 analogen Aufbau, jeweils mit einem Ausführungsbeispiel eines erfindungsgemäßen Trainings- Verfahrens oben und einem Ausführungsbeispiel eines erfindungsgemäßen Vorhersage-Verfahrens unten, das Modelle vom jeweils obigen Verfahren nutzt.

Bei dem Trainings-Verfahren gemäß Figur 1 wird in einem Schritt A1 eine Lerndatensammlung L mit mehreren Lerndatensätzen LDS bereitgestellt. Jeder Lerndatensatz LDS umfasst einen Messdatensatz MDS mit mehreren Messdaten-Einträgen ME und eine dem Messdatensatz MDS zugeordnete Target-Variable T. Alle Lerndatensätze LDS haben bei dem hier gezeigten Beispiel den gleichen Aufbau, insbesondere jeweils die gleiche Anzahl von Messdaten-Einträger MDE mit jeweils einer zugeordneten Target-Variable T. Die Messdaten-Einträgen ME können auch als Features bezeichnet werden, was in der Figur durch die Abkürzung F angedeutet ist.

Bei dem hier gezeigten Beispiel handelt es sich bei den Lerndatensätzen LDS um MRT- bzw. MRI-Bildaufnahmen menschlicher Gehirne verschiedener Patienten unterschiedlichen Alters. Dies ist in Figur 2 dargestellt, die bei- spielhaft vier solche Aufnahmen zeigt. MRI steht dabei in bekannter Weise für die Magnetresonanztomographie. Die MRI-Aufnahmen wurden in hinlänglich vorbekannter Weise mittels eines Magnetresonanztomographiesystems erhalten, das sich beispielsweise in einem Krankenhaus befindet, in welchem die Patienten untersucht wurden. Das Patientenalter von hier beispielhaft 42, 21 , 53 und 78 Jahren sind ebenfalls in Figur 2 zu der jeweiligen Aufnahme angegeben. Die Messdaten-Einträge MDE sind durch das Voxel-weise Graue-Zellen-Volumen (englisch: voxelwise gray matter volume, kurz voxel- wise GMV) gegeben.

In Schritt A2 des Trainings-Verfahrens gemäß Figur 1 erfolgt ein Gruppierung Gr der Messdaten-Einträge MDE der Messdatensätze MDS der Lerndatensammlung L in mehrere Gruppen G1 , G2. Hierdurch werden Gruppen-Unter- Messdatensätze GUM erhalten, wobei die Gruppen-Unter-Messdatensätze GUM einer Gruppe G1 , G2 jeweils zueinander korrespondierende Messdaten-Einträge ME verschiedener Messdatensätze MDS umfassen. In Figur 1 ist dies aus Gründen der Übersichtlichkeit beispielhaft für 2 Gruppen G1 , G2 dargestellt. Es sei betont, dass selbstverständlich eine Gruppierung in eine größere Anzahl von Gruppen möglich ist und in der Regel erfolgen wird.

Bei dem hier gezeigten Beispiel erfolgt eine Gruppierung in Hirn-Parzellen eines Hirn-Parzellierungs-Schemas, auch Gehirn-Atlanten genannt. Eine Parzelle kann beispielswiese durch den Hippocampus gegeben sein und weitere Parzellen durch andere Hirnregionen. Ein weiterer Gehirn Atlant ist zum Beispiel der Schaefer Atlas [Schaefer et al. 2018], In Figur 2 sind - rein schematisch - zwei Parzellen PA1 , PA2 in der vorderste MRT-Aufnahme eingezeichnet. Wie man erkennt, umfasst die eine, in Figur 2 rechte Parzelle PA1 , die der ersten Gruppe G1 entspricht, neun benachbarte Voxel und die zweite, in Figur 2 linke Parzelle PA2, die Gruppe G2 entspricht, vier benachbarte Voxel, wobei auch dies rein beispielhaft zu verstehen ist. Bei den weite- ren Messdatensätzen MDS, hier also MRT-Aufnahmen weiterer Patienten anderen Alters, erfolgt die Gruppierung völlig analog. Es sein angemerkt, dass, wenngleich in der Figur 1 aus Gründen der Übersichtlichkeit jeweils eine andere Anzahl von Messdaten-Einträgen MDE je Gruppe G1 , G2 gezeigt ist, das Prinzip hier gleichermaßen entnommen werden kann. Weiterhin sei angemerkt, dass in der rein schematischen Darstellung des Lerndatensatzes L in Figur 1 jeweils eine Zeile einem Patienten entspricht.

Schließlich sei betont, dass, auch wenn sich das erfindungsgemäße Verfahren besonders für MRT-Aufnahmen geeignet hat, es prinzipiell auch auf beliebige Daten anderer Art angewendet werden kann.- Weitere Anwendungsbeispiele sind etwa durch andere medizinische Patientendaten, genetische Daten, Natural Language Processing und Computer Vision gegeben.

Es ist beispielweise auch möglich, dass die verschiedenen Lerndatensätze LDS zu verschiedenen Personen gehören und die Messdatensätze MDS durch Bildaufnahmen zumindest eines Teils des Gesichts und/oder zumindest eines Teils des Körpers der Personen gegeben sind oder solche umfassen, und die Target-Variablen T Eigenschaften der Personen betreffen oder dadurch gegeben sind. Dann kann beispielsweise eine Gruppierung in verschiedene Bereiche des Gesichtes bzw. Körpers erfolgen.

Als weiteres Beispiel sei genannt, dass die verschiedenen Lerndatensätze LDS zu verschiedenen Abschnitten der Erdoberfläche gehören und die Messdatensätze MDS durch Bildaufnahmen, insbesondere Satellitenaufnahmen, von den Erdoberflächenabschnitten gegeben sind oder solche umfassen, und die Target-Variablen T Eigenschaften der Erdoberflächenabschnitte, insbesondere das Vorhandensein bestimmter Elemente, zum Beispiel das Vorhandensein von Feldern und/oder Flüssen und/oder Seen, betreffen oder dadurch gegeben sind. Dann wäre es beispielsweise möglich, dass eine Gruppierung nach bestimmten Bereichen bzw. Teilen der Bildaufnahmen erfolgt.

Auch ist es möglich, dass die verschiedenen Lerndatensätze LDS zu verschiedenen Personen gehören und die Messdatensätze MDS Informationen über das Benutzerverhalten der Personen, insbesondere auf wenigstens einer Webseite, umfassen, und die Target-Variablen T Informationen über von den Personen vorgenommenen Handlungen, insbesondere von den Personen getätigte Käufe, betreffen oder dadurch gegeben sind. Dann können z.B. verschiedene Bereiche der wenigstens einen Webseite verschiedene Gruppen bilden bzw. solchen entsprechen, mit andere Worten eine Gruppierung in verschiedene Webseitenbereiche bzw. -abschnitte erfolgen.

Als weiteres Beispiel sei genannt, dass die verschiedenen Lerndatensätze LDS zu verschiedenen DNA-Sequenzen und/oder Proteinsequenzen und/oder Genexpressionen gehören und die Messdatensätze MDS durch Informationen über die DNA-Sequenzen und/oder Proteinsequenzen und/oder Genexpressionen, insbesondere durch den Aufbau dieser betreffende Informationen, gegeben sind oder solche umfassen, und die Target- Variablen T Merkmale der DNA-Sequenzen und/oder Proteinsequenzen und/oder Genexpressionendaten, insbesondere Bindungsstellen und/oder Protein-Protein-Wechselwirkungen und/oder Lösungsmittel-Eigenschaften dieser, betreffen oder dadurch gegeben sind. Dann können z.B. verschiedene DNA- bzw. Genbereiche verschiedene Gruppen bilden bzw. solchen entsprechen.

Nachdem die erfindungsgemäße Gruppierung in Hirn-Parzellen - oder eine der anderen vorstehend beispielhaft beschriebenen Gruppierungen - vorgenommen wurde, wird in Schritt A3 für jede Gruppe G1 , G2 ein eigenes maschinelles Lernmodell unter Nutzung einer Resampling-Methode trainiert und getestet. Dies ist in den Figuren 1 und 2 ebenfalls schematisch angedeutet, in der Figur 1 durch den Pfeil RsB M, wobei die Abkürzung für Resampling- basiertes modellieren steht. Für die Gruppe G1 wird das Modell RsB MG1 trainiert und für die Gruppe G2 das Modell RsB MG2 (vgl. Figur 2).

Dabei kann der Benutzer prinzipiell frei wählen, welche Art von Lernmodellen zum Einsatz kommen. Die Modelle umfassen einen oder mehrere Maschinel- les-Lernen-Algorithmen, bei denen es sich beispielsweise um Entscheidungsbäume und/oder Support Vector Machines handeln kann. Bevorzugt werden inhärent interpretierbare Modelle gewählt.

Die Resampling-basierte Methode schließt ein, dass wenigstens ein Trainieren mit einem Teil der zu der jeweiligen Gruppe G1 , G2 gehörenden Grup- pen-Unter-Messdatensätze GUM und den zugehörigen Target-Variablen T erfolgt, und wenigstens ein Testen mit einem anderen Teil der zu der jeweiligen Gruppe G1 , G2 gehörenden Gruppen-Unter-Messdatensätze GUM erfolgt, und wobei das wenigstens eine Testen Vorhersagen für verschiedene Gruppen G1 , G2, gruppenspezifische Vorhersagen, liefert. Es erfolgt in an sich bekannter Weise ein oder mehrmals eine Unterteilung der Daten in einen Trainings- und Testteil, man kann auch von Trainings- und Test-Sets sprechen. Bei dem vorliegenden Beispiel werden - für die jeweilige Gruppe G1 , G2 - die Daten, konkret die zur jeweiligen gruppe G1 , G2 gehörigen Gruppen-Unter-Messdatensätze GUMs mit zugehörigen Target-Variablen T, einiger Patienten, beispielsweise der einen Hälfte der Patienten, als Trainings- und die die Daten GUMs der verbleibenden Patienten, also zweiten Hälfte, als Test-Sets genutzt und es wird zum Beispiel eine Kreuz- Validierung, etwa eine Leave-One-Out-Kreuz-Validierung oder auch k-Fold- Kreuz-Validierung durchgeführt. Die gruppenweise Zuführung der Trainings- Set GUMs und zugehörigen Target-Variablen T zu den Gruppen- Lernmodellen RsB MG1 , RsB MG2 ist auch rein schematisch in Figur 2 rechts angedeutet.

Mit den Test-Set GLIMs werden dann gruppenweise „out-of-sample“ Vorhersagen P1 , P2 (vgl. Figur 1) für das Patientenalter erhalten. Da infolge des gruppenweisen Vorgehens für jede Gruppe eigene Vorhersagen P1 , P2 erhalten werden, wird auch von gruppenspezifischen Vorhersagen P1 , P2 gesprochen. Im Anschluss wird gewechselt, mit anderen Worten werden die Daten der zweiten Hälfte für das Trainieren und die der ersten Hälfte für das Testen genutzt, so dass auch für die erste Hälfte „out-of-sample“ Vorhersagen P1 , P2 erhalten werden. Bei dieser Vorgehensweise können gruppenspezifische Vorhersagen P1 , P2 in einer Anzahl erhalten werden, die der Anzahl der Messdatensätze MDS der Lerndatensammlung L und somit der Gesamtanzahl der Patienten entspricht. Dies ist jedoch keinesfalls zwingend erforderlich.

Mit den gruppenspezifischen Vorhersagen P1 , P2 der Patientenalter und den bekannten Patientenaltern, also Target-Variablen T der Lerndatensammlung L wird in Schritt A4 ein weiteres maschinelles Lernmodell, gruppenübergreifendes Meta-Lernmodell MM, ohne Nutzung einer Resampling-Methode trainiert. Man kann auch sagen, dass mehrere, bei diesem Beispiel zwei, .Level von maschinellen Lernmodellen trainiert werden, wobei man das gruppenweise Training z.B. als LevelO- und das Training des Meta-Modells MM als LeveH -Training bezeichnen kann.

In Figur 1 ist das Training ohne Nutzung einer Resampling-Methode des Meta-Modells MM mit einem Pfeil ML M angedeutet. Im Anschluss an dieses Training kann das Modell MM dann aus mehreren, verschiedenen Gruppen G1 , G2 zugeordneten gruppenspezifischen Vorhersagen P1 , P2 eine gruppenübergreifende Vorhersage P liefern. Weiterhin wird in Schritt A5 für jede Gruppe G1 , G2 ein weiteres maschinelles Lernmodell ohne Nutzung einer Resampling-Methode mit zu der jeweiligen Gruppe G1 , G2 gehörenden Gruppen-Unter-Messdatensätzen GMU und zugehörigen Target-Variablen T trainiert, Vorhersage-Gruppen-Lernmodell MG1 , MG2, wobei das Training hier mit allen zu der jeweiligen Gruppe G1 , G2 gehörenden Gruppen-Unter-Messdatensätze GMU und zugehörigen Target-Variablen T, mit anderen Worten hier mit den Lerndatensatz-Daten aller Patienten, erfolgt. In der Figur 1 ist dieses Training rein schematisch mit einem weiteren Pfeil ML M und rechts von diesem den Vorhersage-Gruppen- Lernmodellen MG1 , MG2 angedeutet. Das Training von MG1 und MG2 kann natürlich auch vor dem Training des Modells MM erfolgen, z.B. vor, nach o- der parallel zum Resampling-basierten Training von RsB MG1 und RsB MG2.

Die erhaltenen trainierten Lernmodelle MM und MG1 , MG2 können anschließend genutzt werden, um basierend auf den MRT-Aufnahmen von Gehirnen anderer Patienten deren Alter zu schätzen.

Dies ist, wie oben angemerkt, rein schematisch in Figur 1 unten dargestellt. Es sei angemerkt, dass das Trainieren der Vorhersage-Gruppen- Lernmodellen MG1 , MG2 optional ist, da alternativ zu diesen für die Vorhersage prinzipiell auch die Resampling-basierten Gruppen-Lernmodelle RsB MG1 , RsB MG2 genutzt werden können. Auch eine zusätzliche Nutzung ist möglich.

Für den Fall, dass ein Training mit Messdatensätzen MDS mit Bildaufnahmen zumindest eines Teils des Gesichts und/oder zumindest eines Teils des Körpers von Personen und zugehörigen Target-Variablen mit Eigenschaften der Personen erfolgte, kann basierend auf einer neuen Aufnahme für eine weitere Person beispielsweise deren Alter und/oder Geschlecht vorhergesagt werden.

Für den Fall, dass ein Training mit Messdatensätze MDS mit Bildaufnahmen, insbesondere Satellitenaufnahmen, von Erdoberflächenabschnitte und zugehörigen Target-Variablen (T) mit Eigenschaften der Erdoberflächenabschnitte erfolgte, kann zum Beispiel für eine neue Aufnahme eines weiteren Erdoberflächenabschnitts vorhergesagt werden, ob diese wenigstens einen Fluss und/oder wenigstens einen See und/oder wenigstens ein Feld umfasst.

Für den Fall, dass ein Training mit Messdatensätze MDS mit Informationen über das Benutzerverhalten von Personen und zugehörigen Target-Variablen T mit Informationen über von den Personen vorgenommenen Handlungen erfolgte, kann beispielsweise für einen Messdatensatz MDS mit Informationen zum Benutzerverhalten einerweiteren Person eine Kaufwahrscheinlichkeit vorhergesagt werden.

Für den Fall, dass ein Training mit Messdatensätze MDS mit Informationen über DNA-Sequenzen und/oder Proteinsequenzen und/oder Genexpressionen erfolgte, kann beispielsweise für einen Messdatensatz MDS wenigstens eine Bindungsstelle bzw. Protein-Protein-Wechselwirkung vorhergesagt werden.

Konkret wird für die Vorhersage in einem Schritt B1 ein Messdatensatz MDS mit mehreren Messdaten-Einträgen MDE bereitgestellt. Man kann auch von Test Sample Features sprechen.

In Schritt B2 werden gemäß obigem Schritt A5 trainierte Vorhersage- Gruppen-Lernmodelle MG1 , MG2 und ein gemäß obigem Schritt A4 trainiertes gruppenübergreifendes Meta-Lernmodell MM bereitgestellt. Die Messdaten-Einträge MDE des bereitgestellten Messdatensatzes MDS werden in Schritt B3 analog zu Schritt A2 gruppiert, wodurch für jede Gruppe ein Gruppen-Unter-Messdatensatz GUM erhalten wird. Zu Schritt A2 analog bedeutet vorliegend bzw. für den Fall des Trainings mit MRT-Aufnahmen, dass die neue MRT-Aufnahme des Patienten unbekannten Alters bzw. die entsprechenden voxelweisen Graue-Zellen-Volumen in die gleichen Hirn- Parzellen unterteilt wird, wie es im Rahmen des Trainings-Verfahrens erfolgt. Es versteht sich, dass auch wenn im Folgenden beispielhaft auf den Fall der MRT-Aufnahmen von Hirnen eingegangen wird, bezüglich der anderen vorgenannten Beispiele völlig analog vorgegangen werden kann.

In Schritt B4 werden die Gruppen-Unter-Messdatensätze GUM jeweils den zugehörigen Vorhersage-Gruppen-Lernmodellen MG1 , MG2 zugeführt und von diesen wird als Ausgabe jeweils eine gruppenspezifische Vorhersage P1 , P2 erhalten. Wie angemerkt können alternativ oder zusätzlich auch die Modelle RsB MG1 , RsB MG2 genutzt werden (in Figur 1 unten aus Gründen der Übersichtlichkeit nicht zusätzlich dargestellt). Bei dem hier beschriebenen Ausführungsbeispiel wird für jede Gruppe, also jede Hirn-Parzelle ein Patientenalter als Vorhersage P1 , P2 erhalten, wobei sich die gruppen-, also parzellenspezifischen Alter voneinander unterscheiden können.

In Schritt B5 werden die gruppenspezifischen Vorhersagen für das Alter P1 , P2 dem gruppenübergreifenden Meta-Lernmodell MM zugeführt und von diesem wird als Ausgabe genau eine gruppenübergreifende Vorhersage P, mit anderen Worten ein Patientenalter für das gesamte Gehirn, erhalten.

Vorteile dieses Vorgehens beinhalten eine erhöhte Vorhersagegenauigkeit, verbesserte Generalisierbarkeit der Modellvorhersagen und erhöhte Interpre- tierbarkeit/Erklärbarkeit sowohl auf Modellebene als auch auf Datenpunkt- ebene. Interpretierbarkeit auf Modellebene meint dabei, dass jedes trainierte Modell auch out-of-sample Vorhersagen und somit Vorhersagegenauigkeit bereitstellt. Diese Vorhersagegenauigkeit kann als Wichtigkeitsmaß für die Vorhersagekraft der von diesem Modell benutzten Messdaten-Einträge MDE und somit der Gruppierungen interpretiert werden. Die Interpretierbarkeit auf Datenpunktebene ist dadurch gegeben, dass für - auch neue - Datenpunkte im Vorhersage-Verfahren die Vorhersagegenauigkeiten jedes Modelles geprüft werden und als Erklärung für Unterschiede in der Vorhersagegenauigkeit des gesamten Vorhersage-Verfahrens für diesen Datenpunkt dienen kann. Ist die Vorhersagegenauigkeit bei Modellen mit bestimmten Messda- ten-Einträgen MDE bzw. Gruppierung als Input anders als erwartet, kann dies Informationen bieten, weshalb die Vorhersage des gesamten Vorhersage-Verfahrens anders als erwartet ausfällt.

Das erfindungsgemäße computerimplementierte Trainings-Verfahren eignet sich besonders gut für den Fall, dass Lerndaten von bzw. an verschiedenen Messsorten zur Verfügung stehen. Ein Ausführungsbeispiel für ein solches Cross-Site-Szenario ist rein schematisch in der Figur 3 dargestellt. Im Folgenden wird insbesondere darauf eingegangen, wie sich das Verfahren in diesem Falle von demjenigen gemäß Figur 1 unterscheidet. Bezüglich der verbleibenden, übereinstimmenden Aspekte wird auf die vorangegangene Beschreibung verwiesen.

In Abweichung zu dem Beispiel aus Figur 1 werden im Cross-Site-Szenario in Schritt A1 mehrere, von verschiedenen Messorten stammende Lerndatensammlungen bereitgestellt. Bei dem Beispiel gemäß Figur 3 konkret zwei von den Messorten A, B stammende Lerndatensammlungen LA, LB. Es versteht sich, dass rein beispielhaft und aus Gründen der Übersichtlichkeit Figur 3 zwei Messorte A, B zeigt und es natürlich auch mehr sein können. Die verschiedenen Messorte A, B sind hier durch verschiedene Krankenhäuser gegeben, die jeweils ein eigenes MRT-System haben, mittels dem die Messdatensätze MDS der Lerndatensammlungen LA, LB für Patienten bekannten Alters erhalten wurden. Jede der beiden Lerndatensammlungen LA, LB gleicht von ihrem Aufbau her der Lerndatensammlung L aus Figur 1 , so dass auch diesbezüglich auf obige Beschreibung verwiesen wird.

In dem Cross-Site-Szenario gemäß Figur 3 werden in Schritt A3 für jeden und an jedem Messort A, B eigene Resampling-basierte messortspezifische Gruppen-Lernmodelle mit den zum jeweiligen Messort A, B gehörigen Lerndatensätzen LDS trainiert und getestet. Dies ist in der Figur wiederum durch mit RsB M bezeichnete Pfeile angedeutet. Die Resampling-Methode schließt auch hier mit ein, dass wenigstens ein Trainieren mit einem Teil der messortspezifischen, also zum jeweiligen Messort A, B gehörigen Gruppen- Unter-Messdatensätze GUM und zugehörigen messortspezifischen Target- Variablen T erfolgt, und wenigstens ein Testen mit einem anderen Teil der messortspezifischen Gruppen-Unter-Messdatensätze GUM. Das Testen liefert dann - für den jeweiligen Messort A, B - Vorhersagen für verschiedene Gruppen, mit anderen Worten messort- und gruppenspezifische Vorhersagen AP1 , AP2, BP1 , BP2. In der Figur 3 ist zur besseren Unterscheidung für den Messort A eine nach links und für den Messort B eine nach rechts gekippte Schraffierung verwendet. Die für Messort A bzw. B und Gruppe G1 spezifischen Vorhersagen AP1 , BP1 sind entsprechend die nach links bzw. rechts schraffierten und mit P1 bezeichneten. Gruppe G2 verhält es sich analog.

Es kann, genau wie bei dem Beispiel gemäß Figur 1 , eine Kreuz-Validierung, etwa eine Leave-One-Out-Kreuz-Validierung oder auch k-Fold-Kreuz- Validierung durchgeführt werden, mit der einzigen Maßgabe, dass auch dies getrennt für die beiden Messorte A, B erfolgt. Bei dem gezeigten Ausführungsbeispiel wird auf diese Weise für jeden Messort A, B eine Anzahl von „out-of-sample“ Vorhersagen erhalten, die der Anzahl der Messdatensätze MDS der jeweiligen Lerndatensammlung LA, LB entspricht. Dies ist wiederum nicht zwingend.

Es werden ferner in Schritt A5 für jeden Messort eigene messortspezifische Vorhersage-Gruppen-Lernmodelle MA1 , MA2, MB1 , MB2 hier ohne Nutzung einer Resampling-Methode trainiert, wobei das Training hier jeweils mit allen messortspezifischen Gruppen-Unter-Messdatensätzen GUM und zugehörigen messortspezifischen Target-Variablen T erfolgt. Auch hier gilt, dass das Trainieren der messortspezifischen Vorhersage-Gruppen-Lernmodelle MA1 , MA2, MB1 , MB2 optional ist.

In Schritt A4 werden dann die messort- und gruppenspezifischen Vorhersagen AP1 , AP2, BP1 , BP2 und zugehörigen messortspezifischen Target- Variablen T der beiden verschiedenen Messorte A, B zusammengeführt („Daten-Pooling“) und mit diesen Daten beider Messorte A, B wird ein nicht Resampling-basiertes zusammenführendes messort- und gruppenübergreifendes Meta-Lernmodell MA+B trainiert. Das Zusammenführen der messort- und gruppenspezifischen Vorhersagen AP1 , AP2, BP1 , BP2 und zugehörigen messortspezifischen Target-Variablen T kann beispielsweise erfolgen, indem Messort A seine Vorhersagen AP1 , AP2 und Target-Variablen T an Messort B übergibt oder umgekehrt. Natürlich können auch beide Messorte A, B die Daten an ein Dritte Stelle übergeben, welche diese dann zusammen für das Training nutzt.

Von verschiedenen Messorten stammende Daten sind in der Regel heterogen. Insbesondere bestehen systematische Unterschiede zwischen den genutzten Messaufbauten, im Falle von MRT-Bildern etwa Scannern, sowie den Datensammel-Parametern [Chen 2021 , Mali et al]. Das Trainings-Verfahren gemäß Figur 3 ermöglicht hier eine Harmonisierung, da die Vorhersagen von messortspezifischen Gruppen-Lernmodellen auf die Target-Variable selbst und nicht auf die messortspezifischen Assoziationen zwischen den Messda- ten-Einträgen MDE und der Target-Variable T ausgerichtet sind. Ist zum Beispiel für Messort A die Intensität jeder Hirnparzelle höher als in Messort B, so würde dies unter Nutzung von normalen Daten-Pooling Methoden, wie der Bestimmung des Arithmetischen Mittels, zu verschiedenen messortabhängigen Repräsentationen führen. Die Nutzung der Vorhersagen von messortspezifischen Gruppen-Lernmodellen sind nun jedoch immer vorhergesagte Target-Variablen-Werte und somit auf die Target-Variable ausgerichtet. Sie beinhalten also nicht mehr diese Unterschiede in der Intensität. Auf der anderen Seite wird ein hohes Maß an Privatsphäre trotz der Cross- Site-Daten gewährleistet, da kein Teilen der Rohdaten erforderlich ist, sondern nur die Vorhersagen AP1 , AP2, BP1 , BP2 der verschiedenen Messorte A, B zusammengeführt werden. Dies bedeutet, dass Kooperationen zwischen verschiedenen Standorten A, B ermöglicht werden, ohne Rohdaten oder andere geschützten Daten zu teilen.

Für eine anschließende Vorhersage (vgl. Figur 3 unten) gilt dann folgendes, wobei wieder die Unterschiede zu dem Ausführungsbeispiel des erfindungsgemäßen Vorhersage-Verfahrens gemäß Figur 1 erläutert und im Übrigen auf dessen obige Beschreibung verweisen wird.

In Schritt B2 werden die erhaltenen messortspezifischen Vorhersage- Gruppen-Lernmodelle MA1 , MA2, MB1 , MB2 (alternativ oder zusätzlich die messortspezifischen Vorhersage-Gruppen-Lernmodelle MA1 , MA2, MB1 , MB2, was in Figur 3 aus Gründen der Übersichtlichkeit nicht zusätzlich dargestellt ist) und das erhaltene zusammenführende messort- und gruppenübergreifende Meta-Lernmodell MA+B bereitgestellt. Die Gruppen-Unter-Messdatensätze GUM des in Schritt B1 bereitgestellten Messdatensatzes MDS werden in Schritt B4 den messortspezifischen Vor- hersage-Gruppen-Lernmodellen MA1 , MA2, MB1 , MB2 zugeführt. Dabei werden die Gruppen-Unter-Messdatensätze GUM sowohl den Vorhersage- Gruppen-Lernmodellen MA1 , MA2 von Messort A als auch den Vorhersage- Gruppen-Lernmodellen MB1 , MB2 von Messort B zugeführt, so dass für jeden Messort A, B messort- und gruppenspezifische Vorhersagen P1 , P2 erhalten werden (ebenfalls entsprechend schraffiert). Man erhält bei dem vorliegenden Beispiel für jede Gruppe, also jede Hirnparzelle ein vorhergesagtes Patientenalter, einmal unter Nutzung der mit den Daten LA von Messort A trainierten Modelle MA1 , MA2 und einmal unter Nutzung der mit den Daten LB von Messort B trainierten Modelle MB1 , MB2.

Die jeweils zu einer Gruppe G1 , G2 gehörenden Vorhersagen AP1 , AP2, BP1 , BP2 der beiden verschiedenen Messorte A, B werden durch ein statistisches Verfahren, vorliegend durch Bildung deren Mittelwertes, miteinander kombiniert, so dass genau eine messortübergreifende gruppenspezifische Vorhersage P1 , P2 für jede Gruppe erhalten wird. Es wird mit anderen Worten der Mittelwert von AP1 und BP1 sowie der Mittelwert von AP2 und BP2 gebildet.

Die durch Mittelwertbildung erhaltenen (nur noch) gruppenspezifischen Vorhersagen P1 , P2 werden dem nicht Resampling-basierten zusammenführenden messort- und gruppenübergreifenden Meta-Lernmodell MA+B zugeführt und von diesem wird eine messort- und gruppenübergreifende Vorhersage P - bei dem vorliegenden Beispiel wiederum ein Patientenalter - erhalten.

Die Figur 4 zeigt ein weiteres Ausführungsbeispiel eines erfindungsgemäßen Vorhersage-Verfahrens, das Lernmodelle nutzt, die gemäß dem Trainings- Verfahren aus Figur 3, also unter Nutzung von Cross-Site-Daten, erhalten wurden. Wie man erkennt, besteht der Unterschied darin, dass aus den messort- und gruppenspezifischen Vorhersagen AP1 , AP2, BP1 , BP2 kein Mittelwert gebildet, sondern diese messortweise dem zusammenführenden messort- und gruppenübergreifenden Meta-Lernmodell MA+B zugeführt werden, so dass messortspezifische gruppenübergreifende Vorhersagen PA, PB erhalten werden. Diese werden dann durch ein statistisches Verfahren, insbesondere Mittelung, miteinander kombiniert, so dass aus PA und PB eine messort- und gruppenübergreifende Vorhersage P erhalten wird.

Die Figur 5 zeigt ein weiteres Ausführungsbeispiel eines erfindungsgemäßen computerimplementierten Trainings-Verfahrens für den Cross-Site-Fall. Der Unterschied zu dem Beispiel gemäß Figur 3 besteht im Wesentlichen darin, dass ein Zusammenführen von Daten von den beiden verschiedenen Messorten A, B zu einem späteren Zeitpunkt erfolgt. Man kann auch von einer „späten Datenfusion“ sprechen, während das Beispiel aus Figur 3 einer „intermediäre Datenfusion“ bereits der Vorhersagen von LevelO entspricht.

Das Szenario aus Figur 5 oben stimmt mit demjenigen aus Figur 3 bis zum Erhalt der messort- und gruppenspezifischen Vorhersagen AP1 , AP2, BP1 , BP2 überein. Diese werden jedoch nicht zusammengeführt, sondern weiter getrennt voneinander verarbeitet, z.B. weiter an dem jeweiligen Messort A, B.

In Schritt A4 wird dann für jeden Messort ein Resampling-basiertes messortspezifisches gruppenübergreifendes Meta-Lernmodell trainiert und getestet, wobei die Resampling-Methode einschließt, dass wenigstens ein Trainieren mit einem Teil der messort- und gruppenspezifischen Vorhersagen AP1 , AP2, BP1 , BP2 und den zugehörigen messortspezifischen Target- Variablen T der Lerndatensammlungen LA, LB erfolgt, und wenigstens ein Testen mit einem anderen Teil der messort- und gruppenspezifischen Vorhersagen AP1 , AP2, BP1 , BP2 und den zugehörigen messortspezifischen Target-Variablen T der Lerndatensammlungen LA, LB erfolgt, und wobei das wenigstens eine Testen messortspezifische gruppenübergreifende Vorhersagen PA, PB liefert.

Es wird ferner, insbesondere ebenfalls in Schritt A4, für jeden Messort A, B ein nicht Resampling-basiertes messortspezifisches gruppenübergreifendes Meta-Lernmodell MA, MB trainiert, wobei das Training jeweils mit den mess- ort- und gruppenspezifischen Vorhersagen AP1 , AP2, BP1 , BP2 und den zugehörigen messortspezifischen Target-Variablen T der jeweiligen Lerndatensammlung LA, LB erfolgt, bevorzugt jeweils mit allen messort- und gruppenspezifischen Vorhersagen AP1 , AP2, BP1 , BP2 und zugehörigen messortspezifischen Target-Variablen T.

Den trainierten nicht Resampling-basierten messortspezifischen gruppenübergreifenden Meta-Lernmodellen MA, MB werden messort- und gruppenspezifische Vorhersagen des jeweils anderen Messortes A, B nebst zugehöriger Target-Variablen T zugeführt und hierdurch messortspezifische gruppenübergreifende Kreuz-Vorhersagen PAB, PBA erhalten werden. Mit anderen Worten werden Modell MA die Vorhersagen BP1 Und BP2 zugeführt und die Vorhersagen PAB erhalten und Modell MB die Vorhersagen AP1 und AP2 zugeführt und die Vorhersagen PBA erhalten. Die Vorhersagen PAB sind entsprechend solche, die unter Nutzung eines zu Messort A gehörigen Modells und Daten von Messort B erhalten wurden und für PBA umgekehrt.

Mit den messortspezifische gruppenübergreifende Vorhersagen PA, PB und den und den messortspezifischen gruppenübergreifenden Kreuz- Vorhersagen PAB, PBA und den entsprechenden Target-Variablen T der Lerndatensammlungen LA, LB wird dann ein nicht Resampling-basiertes Kreuz-Messort-Meta-Lernmodell MA_B trainiert, so dass es aus mehreren messortspezifischen gruppenübergreifenden Vorhersagen PA, PB eine messort- und gruppenübergreifende Vorhersage P liefern kann.

Ein zugehöriges Ausführungsbeispiel eines erfindungsgemäßen computerimplementierten Vorhersage-Verfahrens ist in Figur 5 unten dargestellt. Dieses stimmt, bis zum Erhalt der messort- und gruppenspezifischen Vorhersagen AP1 , AP2, BP1 , BP2 mit denjenigen gemäß Figur 3 und 4 überein. Dann werden jedoch die nicht Resampling-basierten messortspezifischen gruppenübergreifenden Meta-Lernmodelle MA, MB genutzt. Konkret werden diesen jeweils die gruppenspezifischen Vorhersagen des zugehörigen Messortes A, B, also dem trainierten Modell MA die Vorhersagen AP1 Und AP2 und dem Modell MB die Borhersagen BP1 Und BP2 zugeführt. Aus dem Modell MA wird die gruppenübergreifend messortspezifische Vorhersage PA und aus dem Modell MB die gruppenübergreifend messortspezifische Vorhersage PB erhalten (ein Patientenalter von jedem messortspezifischen Modell). Diese Vorhersagen PA, PB werden dann dem nicht Resampling-basierten Kreuz-Messort-Meta-Lernmodell MA_B zugeführt, welches die Vorhersage P, vorliegend ein Patientenalter, liefert.

Die Figur 6 zeigt ein weiteres Ausführungsbeispiel für ein Cross-Site- Szenario. Bei diesem kommt eine zusätzliche Lerndatensammlung LC von einem von den Messorten A und B verschiedenen zusätzlichen Messort C zum Einsatz. Es sein angemerkt, dass zusätzlich zu den Schritten gemäß Figur 6 Schritte des Trainings- Verfahrens aus Figur 5 absolviert werden müssen und zwar zumindest diejenigen zum Erhalt der Modelle MA1 , MA2, MB1 , MB2 sowie MA und MB, jeweils unter Nutzung der entsprechenden Lerndatensammlungen LA bzw. LB.

Wie in Figur 6 erkennbar erfolgt dann eine Gruppierung der Messdaten- Einträge MDE der Messdatensätze MDS der zusätzlichen Lerndatensamm- lung LC in mehrere Gruppen G1 , G2 wie in Schritt A2 vorgesehen, wodurch zusätzliche Gruppen-Unter-Messdatensätze GUM erhalten werden.

Die zusätzlichen Gruppen-Unter-Messdatensätze GUM und die Target- Variablen T der zusätzlichen Lerndatensammlung LC werden dann jeweils den zu den Messorten A und B gehörigen trainierten nicht Resampling- basierten messortspezifischen Gruppen-Lernmodellen MA1 , MA2, MB1 , MB2 zugeführt und von diesen werden messort- und gruppenspezifische Vorhersagen, nämlich einerseits AP1 , AP2 und andererseits BP1 , BP2 erhalten.

Die messort- und gruppenspezifische Vorhersagen AP1 , AP2, BP1 , BP2 werden jeweils den zu den Messorten A, B gehörenden trainierten nicht Resampling-basierten messortspezifischen gruppenübergreifenden Meta- Lernmodellen MA, MB zugeführt und von diesen messortspezifische gruppenübergreifende Vorhersagen PA, PB erhalten. Die ist in gewissem Maße analog zu Figur 5 jedoch mit der Maßgabe, dass AP1 , AP2, BP1 , BP2 zwar mit den Modellen MA1 , MA2, MB1 , MB2 erhalten werden, jedoch nicht unter Nutzung von Daten dieser Messorte A, B, sondern des unabhängigen Messortes C.

Mit den messortspezifische gruppenübergreifende Vorhersagen PA, PB und den entsprechenden Target-Variablen T der zusätzlichen Lerndatensammlung LC von Messort C wird dann ein nicht Resampling-basiertes Zusatz- Kreuz-Messort-Meta-Lernmodell MA_Bc trainiert.

Wie der Figur 6 unten entnommen werden kann, stimmt ein entsprechendes Ausführungsbeispiel eines zugehörigen computerimplementierten Vorhersage-Verfahrens mit dem Beispiel aus Figur 5 überein, mit der einzigen Maßgabe, dass zum Erhalt von P das nicht Resampling-basiertes Zusatz-Kreuz- Messort-Meta-Lernmodell MA_Bc genutzt wird. Ein solches System bietet viele Vorteile für Federation-Learning basierte Kollaborationen mehrerer Arbeitsgruppen. Als Beispiel kann ein Szenario genannt werden, in dem Mess- ort/Krankenhaus A und Messort/Krankenhaus B intern dasselbe Trainings- Verfahren anwenden, um dann Vorhersagen auf Messort C mit einander o- der einer dritten Partei, z.B. Forschenden, zu teilen. Dies bedeutet, dass weder die trainierten Modelle noch die Rohdaten miteinander geteilt werden müssen. Dies erlaubt maximalen Schutz für die Sicherheit und Privatsphäre der Daten von Messort A und B. Messort C kann ein allen Parteien oder sogar öffentlich zugängliches Datenset sein. Dies bedeutet, dass sowohl private als auch öffentlich oder anderes geteilte, große und kleine Datensätze ideal genutzt werden können. Ein Beispiel für einen solchen nun besser nutzbaren großangelegten Datensatz ist die UK Biobank (UKB) [Sudlow et al. 2015], Natürlich ist dieses genaue Szenario nur ein Beispiel und die Nutzung einer anderen Anzahl an sowohl privaten als auch geteilten Datensätze verschiedener Messorte ist möglich.

Die Schritte der oben beschriebenen Ausführungsbeispiele sowohl erfindungsgemäßer Trainings- als auch Vorhersage-Verfahren können jeweils mittels wenigstens eines Computers ausgeführt werden. Es kann ein bzw. können mehrere Computerprogramme mit Programmcode-Mittel zum Einsatz kommen die, wenn sie auf wenigstens einem Computer ausgeführt werden, den wenigstens einen Computer veranlassen, die obigen Schritte durchzuführen. Auch die Nutzung einer (privaten und/oder öffentlichen) Cloud ist möglich.

REFERENZEN

Chen et al. 2021 : Chen, J., Müller, V.I., Dukart, J., Hoffstaedter, F., Baker, J.T., Holmes, A.J., Vatansever, D., Nickl-Jockschat, T., Liu, X., Derntl, B., et al. (2021). Intrinsic Connectivity Patterns of Task-Defined Brain Networks Allow Individual Prediction of Cognitive Symptom Dimension of Schizophrenia and Are Linked to Molecular Architecture. Biol. Psychiatry 89, 308-319.

Finn et al. 2015: Finn, E.S., Shen, X., Scheinost, D., Rosenberg, M.D., Huang, J., Chun, M.M., Papademetris, X., and Constable, R.T. (2015). Functional connectome fingerprinting: identifying individuals using patterns of brain connectivity. Nat. Neurosci. 18, 1664-1671

Hedderich & Eickhoff 2021 : Hedderich, D.M., and Eickhoff, S.B. (2021).

Machine learning for psychiatry: getting doctors at the black box? Mol. Psychiatry 26, 23-25

Kaissis et al. 2020: Kaissis, G.A., Makowski, M.R., Rückert, D., and

Braren, R.F. (2020). Secure, privacy-preserving and federated machine learning in medical imaging. Nat. Mach. Intell

Larabi et al. 2021 : Larabi, D.I., Gell, M., Amico, E., Eickhoff, S.B., and Patil, K.R. (2021). Highly accurate local functional fingerprints and their stability. BioRxiv

Mali et al 2021 : Mali, S.A., Ibrahim, A., Woodruff, H.C., Andrearczyk, V., Müller, H., Primakov, S., Salahuddin, Z., Chatterjee, A., and Lambin, P. (2021). Making Radiomics More Reproducible across Scanner and Imaging Protocol Variations: A Review of Harmonization Methods. J. Pers. Med. 11 Myszczynska et al. 2020: Myszczynska, M.A., Ojamies, P.N., Lacoste, A.M.B., Neil, D., Saffari, A., Mead, R., Hautbergue, G.M., Holbrook, J.D., and Ferraiuolo, L. (2020). Applications of machine learning to diagnosis and treatment of neurodegenerative diseases. Nat. Rev. Neurol. 16, 440-456 Schaefer et al. 2018: Schaefer, A., Kong, R., Gordon, E.M., Laumann,

T.O., Zuo, X.-N., Holmes, A.J., Eickhoff, S.B., and Yeo, B.T.T. (2018). Local- Global Parcellation of the Human Cerebral Cortex from Intrinsic Functional Connectivity MRI. Cereb. Cortex 28, 3095-3114

Sudlow C et al. 2015: Sudlow, C., Gallacher, J., Allen, N., Beral, V., Burton, P., Danesh, J., Downey, P., Elliott, P., Green, J., Landray, M., et al. (2015). UK Biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age. PLoS Med. 12, e1001779

Yeo et al. 2011 : Yeo, B.T.T., Krienen, F.M., Sepulcre, J., Sabuncu, M.R., Lashkari, D., Hollinshead, M., Roffman, J.L., Smoller, J.W., Zöllei, L., Poli- meni, J.R., et al. (2011). The organization of the human cerebral cortex estimated by intrinsic functional connectivity. J. Neurophysiol. 106, 1125-1165

Claims

ANSPRÜCHE

1. Computerimplementiertes Trainings-Verfahren zum Trainieren maschineller Lernmodelle, bei dem

A1) wenigstens eine Lerndatensammlung (L, LA, LB, LC) mit mehreren Lerndatensätzen (LDS) bereitgestellt wird, wobei jeder Lerndatensatz (LDS) einen Messdatensatz (MDS) mit mehreren Messdaten- Einträgen (MDE) und eine dem Messdatensatz (MDS) zugeordnete Target-Variable (T) umfasst, bevorzugt, wobei alle Lerndatensätze (LDS) den gleichen Aufbau aufweisen, dadurch gekennzeichnet, dass

A2) eine Gruppierung zumindest eines Teils der Messdaten- Einträge (MDE) der Messdatensätze (MDS) der wenigstens einen Lerndatensammlung (L, LA, LB, LC) in mehrere Gruppen (G1 , G2) erfolgt, wodurch Gruppen-Unter-Messdatensätze erhalten werden, wobei die Gruppen-Unter-Messdatensätze (GUM) einer Gruppe (G1 , G2) jeweils zueinander korrespondierende Messdaten-Einträge (MDE) verschiedener Messdatensätze (MDS) umfassen,

A3) für jede Gruppe (G1 , G2) ein eigenes maschinelles Lernmodell unter Nutzung einer Resampling-Methode trainiert und getestet wird, Resampling-basiertes Gruppen-Lernmodell (RsB MG1 , RsB MG2), wobei die Resampling-basierte Methode einschließt, dass wenigstens ein Trainieren mit einem Teil der zu der jeweiligen Gruppe (G1 , G2) gehörenden Gruppen-Unter-Messdatensätze (GUM) und den zugehörigen Target-Variablen (T) erfolgt, und wenigstens ein Testen mit einem anderen Teil der zu der jeweiligen Gruppe (G1 , G2) gehörenden Gruppen-Unter-Messdatensätze (GUM) erfolgt, und wobei das we- nigstens eine Testen Vorhersagen für verschiedene Gruppen, gruppenspezifische Vorhersagen (P1 , P2, AP1 , AP2, BP1 , BP2) liefert,

A4) mit den gruppenspezifischen Vorhersagen (P1 , P2, AP1 , AP2, BP1 , BP2) und Target-Variablen (T) der wenigstens einen Lerndatensammlung (L, LA, LB, LC) wenigstes ein weiteres maschinelles Lernmodell, gruppenübergreifendes Meta-Lernmodell (MM, MA+B, MA_B), insbesondere ohne Nutzung einer Resampling-Methode trainiert wird, so dass es aus mehreren, verschiedenen Gruppen (G1 , G2) zugeordneten gruppenspezifischen Vorhersagen (P1 , P2, AP1 , AP2, BP1 , BP2) eine gruppenübergreifende Vorhersage (P) liefern kann,

A5) optional für jede Gruppe (G1 , G2) ein weiteres maschinelles Lernmodell mit zu der jeweiligen Gruppe (G1 , G2) gehörenden Grup- pen-Unter-Messdatensätzen (GUM) und zugehörigen Target- Variablen (T) insbesondere ohne Nutzung einer Resampling-Methode trainiert wird, Vorhersage-Gruppen-Lernmodell (MG1 , MG2), wobei das Training bevorzugt mit allen zu der jeweiligen Gruppe (G1 , G2) gehörenden Gruppen-Unter-Messdatensätze (GUM) und zugehörigen Target-Variablen (T) erfolgt.

2. Computerimplementiertes Trainings-Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die verschiedenen Lerndatensätze (LDS) zu verschiedenen Patienten gehören und die Lerndatensätze (LDS) medizinisch relevante Messdatensätze (MDS), insbesondere Messdatensätze (MDS), die mittels medizinischer Diagnostikverfahren erhalten wurden, umfassen, und die Target-Variablen (T) Eigenschaften der Patienten, insbesondere ein Alter und/oder einen Krankheitszustand der Patienten, betreffen oder dadurch gegeben sind.

3. Computerimplementiertes Trainings-Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass die Messdatensätze (MDS) durch Bildauf- nahmen, insbesondere MRT-Bildaufnahmen, menschlicher Gehirne oder Teile dieser gegeben sind oder solche umfassen, und die Messdaten-Einträge (MDE) jeweils einem Voxel entsprechen oder zugeordnet sind, und dass eine Gruppierung in Hirn-Parzellen erfolgt.

4. Computerimplementiertes Trainings-Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die verschiedenen Lerndatensätze (LDS) zu verschiedenen Personen gehören und die Messdatensätze (MDS) durch Bildaufnahmen zumindest eines Teils des Gesichts und/oder zumindest eines Teils des Körpers der Personen gegeben sind oder solche umfassen, und die Target-Variablen (T) Eigenschaften der Personen betreffen oder dadurch gegeben sind, bevorzugt, wobei die Messdaten-Einträge (MDE) jeweils einem Pixel entsprechen oder zugeordnet sind, und/oder wobei die Eigenschaften der Personen keinen Krankheitszustand der Personen betreffen bzw. nicht dadurch gegeben sind.

5. Computerimplementiertes Trainings-Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die verschiedenen Lerndatensätze (LDS) zu verschiedenen Abschnitten der Erdoberfläche gehören und die Messdatensätze (MDS) durch Bildaufnahmen, insbesondere Satellitenaufnahmen, von den Erdoberflächenabschnitten gegeben sind oder solche umfassen, und die Target-Variablen (T) Eigenschaften der Erdoberflächenabschnitte, insbesondere das Vorhandensein bestimmter Elemente, bevorzugt das Vorhandensein von Feldern und/oder Flüssen und/oder Seen, betreffen oder dadurch gegeben sind.

6. Computerimplementiertes Trainings-Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die verschiedenen Lerndatensätze (LDS) zu verschiedenen Personen gehören und die Messdatensätze (MDS) durch Informationen über das Benutzerverhalten der Personen, insbesondere auf wenigstens einer Webseite, gegeben sind oder solche umfassen, und die Target-Variablen (T) Informationen über von den Personen vorgenommene Handlungen, insbesondere von den Personen getätigte Käufe, betreffen oder dadurch gegeben sind.

7. Computerimplementiertes Trainings-Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die verschiedenen Lerndatensätze (LDS) zu verschiedenen DNA-Sequenzen und/oder Proteinsequenzen und/oder Genexpressionen gehören und die Messdatensätze (MDS) durch Informationen über die DNA-Sequenzen und/oder Proteinsequenzen und/oder Genexpressionen, insbesondere durch den Aufbau dieser betreffende Informationen, gegeben sind oder solche umfassen, und die Target-Variablen (T) Merkmale der DNA-Sequenzen und/oder Proteinsequenzen und/oder Genexpressionendaten, insbesondere Bindungsstellen und/oder Protein-Protein- Wechselwirkungen und/oder Lösungsmittel-Eigenschaften dieser, betreffen oder dadurch gegeben sind.

8. Computerimplementiertes Trainings-Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass in Schritt A2 eine von einem Benutzer vordefinierte Gruppierung oder eine von der wenigstens einen Lerndatensammlung (L, LA, LB, LC), insbesondere der Struktur der Messdatensätze (MDS), abgeleitete, bevorzugt durch Clusterbildung erhaltene Gruppierung der Messdatensätze (MDS) vorgenommen wird.

9. Computerimplementiertes Trainings-Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass in Schritt A1 Lerndatensammlungen (L, LA, LB LC) von und insbesondere an verschiedenen Messorten (A, B, C) bereitgestellt werden, wobei die Lerndatensammlungen (L, LA, LB LC) jeweils mehrere Lerndatensätze (LDS) mit Messdaten- Einträgen (MDE) und zugehörigen Target-Variablen (T) umfassen.

10. Computerimplementiertes Trainings-Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass in Schritt A3 für jeden Messort (A, B, C) eigene Resampling-basierte messortspezifische Gruppen-Lernmodelle mit den zum jeweiligen Messort (A, B, C) gehörigen Lerndatensätzen (LDS) trainiert und getestet werden, wobei die Resampling-Methode jeweils einschließt, dass wenigstens ein Trainieren mit einem Teil der messortspezifischen Gruppen-Unter-Messdatensätze (GUM) und zugehörigen messortspezifischen Target-Variablen (T) erfolgt, und wenigstens ein Testen mit einem anderen Teil der messortspezifischen Gruppen-Unter-Messdatensätze (GUM) erfolgt, und wobei das wenigstens eine Testen für den jeweiligen Messort (A, B, C) Vorhersagen für verschiedene Gruppen, messort- und gruppenspezifische Vorhersagen (AP1 , AP2, BP1 , BP2), liefert.

11. Computerimplementiertes Trainings-Verfahren nach Anspruch 9 oder 10, dadurch gekennzeichnet, dass in Schritt A5 für jeden Messort (A, B, C) eigene messortspezifische Vorhersage-Gruppen-Lernmodelle (MA1 , MA2, MB1 , MB2) insbesondere ohne Nutzung einer Resampling-Methode trainiert werden, wobei das Training bevorzugt jeweils mit allen messortspezifischen Gruppen-Unter-Messdatensätzen (GUM) und zugehörigen messortspezifischen Target-Variablen (T) erfolgt.

12. Computerimplementiertes Trainings-Verfahren nach einem der Ansprüche 9 bis 11 , dadurch gekennzeichnet, dass in Schritt A4 die messort- und gruppenspezifischen Vorhersagen (AP1 , AP2, BP1 , BP2) und zugehörigen messortspezifischen Target-Variablen (T) verschiedener Messorte (A, B, C) zusammengeführt werden und damit ein zusammenführendes messort- und gruppenübergreifendes Meta-Lernmodell (MA+B) insbesondere ohne Nutzung einer Resampling-Methode trainiert wird.

13. Computerimplementiertes Trainings-Verfahren nach einem der Ansprüche 9 bis 12, dadurch gekennzeichnet, dass in Schritt A4 für jeden Messort (A, B, C) ein Resampling-basiertes messortspezifisches gruppenübergreifendes Meta-Lernmodell trainiert und getestet wird, wobei die Resampling-Methode einschließt, dass wenigstens ein Trainieren mit einem Teil der messort- und gruppenspezifischen Vorhersagen (AP1 , AP2, BP1 , BP2) und den zugehörigen messortspezifischen Target-Variablen (T) der Lerndatensammlungen (L, LA, LB, LC) erfolgt, und wenigstens ein Testen mit einem anderen Teil der messort- und gruppenspezifischen Vorhersagen (AP1 , AP2, BP1 , BP2) und den zugehörigen messortspezifischen Target- Variablen (T) der Lerndatensammlungen (L, LA, LB, LC) erfolgt, und wobei das wenigstens eine Testen messortspezifische gruppenübergreifende Vorhersagen (PA, PB) liefert.

14. Computerimplementiertes Trainings-Verfahren nach Anspruch 13, dadurch gekennzeichnet, dass mit den von mehreren Messorten (A, B, C) stammenden messortspezifischen gruppenübergreifenden Vorhersagen (PA, PB) und zugehörigen messortspezifischen Target-Variablen (T) ein Kreuz- Messort-Meta-Lernmodell (MA_B) insbesondere ohne Nutzung einer Resampling-Methode trainiert wird, so dass es aus mehreren messortspezifischen gruppenübergreifenden Vorhersagen (PA, PB) eine messort- und gruppenübergreifende Vorhersage (P) liefern kann.

15. Computerimplementiertes Trainings-Verfahren nach einem der Ansprüche 9 bis 14, dadurch gekennzeichnet, dass insbesondere in Schritt A4 für jeden Messort ein messortspezifisches gruppenübergreifendes Meta- Lernmodell (MA, MB) insbesondere ohne Nutzung einer Resampling- Methode trainiert wird, wobei das Training jeweils mit den messort- und gruppenspezifischen Vorhersagen (AP1 , AP2, BP1 , BP2) und den zugehörigen messortspezifischen Target-Variablen (T) der jeweiligen Lerndaten- Sammlung (L, LA, LB, LC) erfolgt, bevorzugt jeweils mit allen messort- und gruppenspezifischen Vorhersagen (AP1 , AP2, BP1 , BP2) und zugehörigen messortspezifischen Target-Variablen (T).

16. Computerimplementiertes Trainings-Verfahren nach Anspruch 11 und 15, dadurch gekennzeichnet, dass eine zusätzliche Lerndatensammlung (LC) von einem von den Messorten (A, B) verschiedenen zusätzlichen Messort (C) bereitgestellt wird, und eine Gruppierung der Messdaten-Einträge (MDE) der Messdatensätze (MDS) der zusätzlichen Lerndatensammlung (LC) in mehrere Gruppen (G1 , G2) wie in Schritt A2 vorgesehen erfolgt, wodurch zusätzliche Gruppen-Unter-Messdatensätze (GUM) erhalten werden, die zusätzlichen Gruppen-Unter-Messdatensätze (GUM) und die Target-Variablen (T) der zusätzlichen Lerndatensammlung (LC) jeweils den zu den Messorten (A, B) gehörigen insbesondere ohne Nutzung einer Resampling-Methode trainierten messortspezifischen Vorhersa- ge-Gruppen-Lernmodellen (MA1 , MA2, MB1 , MB2) zugeführt und von diesen messort- und gruppenspezifische Vorhersagen (AP1 , AP2, BP1 , BP2) erhalten werden, die messort- und gruppenspezifische Vorhersagen (AP1 , AP2, BP1 , BP2) jeweils den zu den Messorten (A, B) gehörenden insbesondere ohne Nutzung einer Resampling-Methode trainierten messortspezifischen gruppenübergreifenden Meta-Lernmodellen (MA, MB) zugeführt und von diesen messortspezifische gruppenübergreifende Vorhersagen (PA, PB) erhalten werden, mit den messortspezifischen gruppenübergreifenden Vorhersagen (PA, PB) und den Target-Variablen (T) der zusätzlichen Lerndatensammlung (LC) ein Zusatz-Kreuz-Messort-Meta-Lernmodell MA_Bc insbesondere ohne Nutzung einer Resampling-Methode trainiert wird.

17. Computerimplementiertes Trainings-Verfahren nach Anspruch 15 oder

16, dadurch gekennzeichnet, dass dem trainierten messortspezifischen gruppenübergreifenden Meta-Lernmodell (MA, MB) wenigstens eines Messortes (A, B, C) messort- und gruppenspezifische Vorhersagen (AP1 , AP2, BP1 , BP2) wenigstens eines anderen Messortes (A, B, C) zugeführt und hierdurch messortspezifische gruppenübergreifende Kreuz-Vorhersagen (PAB, PBA) erhalten werden.

18. Computerimplementiertes Trainings-Verfahren nach Anspruch 14 und

17, dadurch gekennzeichnet, dass das Kreuz-Messort-Meta-Lernmodell MA_Bc mit den messortspezifischen gruppenübergreifenden Vorhersagen (PA, PB) und den messortspezifischen gruppenübergreifenden Kreuz- Vorhersagen (PAB, PBA) trainiert wird.

19. Computerimplementiertes Vorhersage-Verfahren zur Vorhersage einer Eigenschaft unter Nutzung maschineller Lernmodelle, die unter Durchführung des Trainings-Verfahrens nach einem der vorhergehenden Ansprüche erhalten wurden, bei dem

B1) ein Messdatensatz (MDS) mit mehreren Messdaten-Einträgen (MDE) bereitgestellt wird,

B2) gemäß Schritt A5 trainierte Vorhersage-Gruppen-Lernmodelle (MG1 , MG2, MA1 , MA2, MB1 , MB2) und/oder gemäß Schritt A2 trainierte Resampling-basierte Gruppen-Lernmodelle (RsB MG1 , RsB MG2) und wenigstens ein gemäß Schritt A4 insbesondere ohne Nutzung einer Resampling-Methode trainiertes gruppenübergreifendes Meta-Lernmodell (MM, MA+B, MA_B) bereitgestellt werden,

B3) die Messdaten-Einträge (MDE) des in Schritt B1 bereitgestellten Messdatensatzes (MDS) analog zu Schritt A2 gruppiert werden, wodurch für jede Gruppe (G1 , G2) ein Gruppen-Unter-Messdatensatz (GUM) erhalten wird,

B4) die Gruppen-Unter-Messdatensätze (GUM) jeweils den zugehörigen Vorhersage-Gruppen-Lernmodellen (MG1 , MG2, MA1 , MA2, MB1 , MB2) oder den zugehörigen Resampling-basierten Gruppen- Lernmodellen (RsB MG1 , RsB MG2) zugeführt werden und von diesen als Ausgabe jeweils eine gruppenspezifische Vorhersage (P1 , P2) erhalten wird,

B5) die gruppenspezifischen Vorhersagen (P1 , P2, AP1 , AP2, BP1 , BP2) dem wenigstens einen insbesondere ohne Nutzung einer Resampling-Methode trainierten gruppenübergreifenden Meta- Lernmodell (MM, MA+B, MA_B) zugeführt werden und von diesem als Ausgabe eine gruppenübergreifende Vorhersage (P) erhalten wird.

20. Computerimplementiertes Vorhersage-Verfahren nach Anspruch 19, bei dem

- in Schritt B2 messortspezifische Vorhersage-Gruppen-Lernmodelle (MA1 , MA2, MB1 , MB2) verschiedener Standorte (A, B, C), die unter Durchführung des Trainings-Verfahrens nach Anspruch 11 erhalten wurden, und/oder Resampling-basierte messortspezifische Gruppen- Lernmodelle verschiedener Standorte (A, B, C), die unter Durchführung des Trainings-Verfahrens nach Anspruch 10 erhalten wurden, und ein zusammenführendes messort- und gruppenübergreifendes Meta-Lernmodell (MA+B), das unter Durchführung des Trainings- Verfahrens nach Anspruch 12 insbesondere ohne Nutzung einer Resampling-Methode erhalten wurde, bereitgestellt werden,

- die in Schritt B3 erhaltenen Gruppen-Unter-Messdatensätze (GUM) in

Schritt B4 den messortspezifischen Vorhersage-Gruppen-

Lernmodellen (MA1 , MA2, MB1 , MB2) oder den Resampling-basierten messortspezifischen Gruppen-Lernmodellen der verschiedenen Messorte (A, B, C) zugeführt und messort- und gruppenspezifische Vorhersagen (AP1 , AP2, BP1 , BP2) erhalten werden,

- die jeweils zu einer Gruppe (G1 , G2) gehörenden Vorhersagen (AP1 , AP2, BP1 , BP2) verschiedener Messorte (A, B, C) durch ein statistisches Verfahren, insbesondere Mittelung, miteinander kombiniert werden, so dass eine gruppenspezifische Vorhersage (P1 , P2) für jede Gruppe (G1 , G2) erhalten wird,

- die gruppenspezifischen Vorhersagen (P1 , P2) dem zusammenführenden messort- und gruppenübergreifenden Meta-Lernmodell (MA+B) zugeführt werden und von diesem eine messort- und gruppenübergreifende Vorhersage (P) erhalten wird.

21. Computerimplementiertes Vorhersage-Verfahren nach Anspruch 19 oder 20, bei dem in Schritt B2 messortspezifische Vorhersage-Gruppen-Lernmodelle (MA1 , MA2, MB1 , MB2) verschiedener Standorte (A, B, C), die unter Durchführung des Trainings-Verfahrens nach Anspruch 11 erhalten wurden, und/oder Resampling-basierte messortspezifische Gruppen- Lernmodelle verschiedener Standorte (A, B, C), die unter Durchführung des Trainings-Verfahrens nach Anspruch 10 erhalten wurden, und ein zusammenführendes messort- und gruppenübergreifendes Meta-Lernmodell (MA+B), das unter Durchführung des Trainings- Verfahrens nach Anspruch 12 insbesondere ohne Nutzung einer Resampling-Methode erhalten wurde, bereitgestellt werden, die in Schritt B3 erhaltenen Gruppen-Unter-Messdatensätze (GUM) in Schritt B4 den messortspezifischen Vorhersage-Gruppen- Lernmodellen (MA1 , MA2, MB1 , MB2) oder den Resampling-basierten messortspezifischen Gruppen-Lernmodellen der verschiedenen Messorte (A, B, C) zugeführt und messort- und gruppenspezifische Vorhersagen (AP1 , AP2, BP1 , BP2) erhalten werden, - die messort- und gruppenspezifischen Vorhersagen (AP1 , AP2, BP1 , BP2) messortweise dem zusammenführenden messort- und gruppenübergreifenden Meta-Lernmodell (MA+B) zugeführt und so messortspezifische gruppenübergreifende Vorhersagen (PA, PB) für jeden Messort (A, B, C) erhalten werden,

- die messortspezifischen gruppenübergreifenden Vorhersagen (PA, PB) durch ein statistisches Verfahren, insbesondere Mittelung, miteinander kombiniert werden, so dass eine messort- und gruppenübergreifende Vorhersage (P) erhalten wird.

22. Computerimplementiertes Vorhersage-Verfahren nach einem der Ansprüche 19 bis 21 , bei dem

- in Schritt B2 messortspezifische Vorhersage-Gruppen-Lernmodelle (MA1 , MA2, MB1 , MB2) verschiedener Standorte (A, B, C), die unter Durchführung des Trainings-Verfahrens nach Anspruch 11 erhalten wurden, und/oder Resampling-basierte messortspezifische Gruppen- Lernmodelle verschiedener Standorte (A, B, C), die unter Durchführung des Trainings-Verfahrens nach Anspruch 10 erhalten wurden, und messortspezifische gruppenübergreifende Meta-Lernmodelle (MA, MB), die unter Durchführung des Trainings-Verfahrens nach Anspruch 15 insbesondere ohne Nutzung einer Resampling-Methode erhalten wurden, und ein Kreuz-Messort-Meta-Lernmodell (MA_B), das unter Durchführung des Trainings-Verfahrens nach Anspruch 14 insbesondere ohne Nutzung einer Resampling-Methode erhalten wurde, und/ oder ein Zusatz-Kreuz-Messort-Meta-Lernmodell (MA_Bc), das unter Durchführung des Trainings-Verfahrens nach Anspruch 16 insbesondere ohne Nutzung einer Resampling-Methode erhalten wurde, bereitgestellt werden,

- die in Schritt B3 erhaltenen Gruppen-Unter-Messdatensätze (GUM) in Schritt B4 den messortspezifischen Vorhersage-Gruppen- Lernmodellen (MA1 , MA2, MB1 , MB2) der verschiedenen Messorte (A, B, C) zugeführt und messort- und gruppenspezifische Vorhersagen (AP1 , AP2, BP1 , BP2) erhalten werden,

- die messort- und gruppenspezifischen Vorhersagen (AP1 , AP2, BP1 , BP2) messortweise dem jeweiligen zugehörigen messortspezifischen gruppenübergreifenden Meta-Lernmodell (MA, MB) zugeführt werden und so messortspezifische gruppenübergreifende Vorhersagen (PA, PB) für jeden Messort (A, B, C) erhalten werden,

- die messortspezifischen gruppenübergreifenden Vorhersagen (PA, PB) dem Kreuz-Messort-Meta-Lernmodell (MA_B) oder dem Zusatz- Kreuz-Messort-Meta-Lernmodell (MA_Bc) zugeführt und von diesem eine messort- und gruppenübergreifende Vorhersage (P) erhalten wird.

23. Computerprogramm umfassend Programmcode-Mittel die, wenn sie auf wenigstens einem Computer ausgeführt werden, den wenigstens einen Computer veranlassen, die Schritte des Trainings-Verfahrens nach einem der Ansprüche 1 bis 18 und/oder die Schritte des Vorhersage-Verfahrens nach einem der Ansprüche 19 bis 22 durchzuführen.

24. Computerlesbares Medium, das Instruktionen umfasst, die, wenn sie auf wenigstens einem Computer ausgeführt werden, den wenigstens einen Computer veranlassen, die Schritte des Trainings-Verfahrens nach einem der Ansprüche 1 bis 18 und/oder die Schritte des Vorhersage-Verfahrens nach einem der Ansprüche 19 bis 22 durchzuführen.

25. Vorrichtung zur Durchführung des computerimplementierten Trainings- Verfahrens nach einem der Ansprüche 1 bis 18 und/oder des computerimplementierten Vorhersage-Verfahrens nach einem der Ansprüche 19 bis 22, umfassend einen Prozessor und einen Datenspeicher, auf dem das Computerprogramm nach Anspruch 23 gespeichert ist.