DE112020005433T5

DE112020005433T5 - Verfahren und Systeme zur Analyse von Nukleinsäuremolekülen

Info

Publication number: DE112020005433T5
Application number: DE112020005433.0T
Authority: DE
Inventors: David M. Kurtz; Maximilian Diehn; Arash Ash Alizadeh
Original assignee: Leland Stanford Junior University
Current assignee: Leland Stanford Junior University
Priority date: 2019-11-06
Filing date: 2020-11-06
Publication date: 2022-10-06
Also published as: AU2020378435A1; US11447833B2; GB2623904A; US20220389518A1; US20210172022A1; EP4055187A1; EP4365309A2; US20220208303A1; CA3156589A1; US20240035095A1; JP2024028940A; JP2023501376A; US20240175088A1; US20230250485A1; WO2021092476A1; GB202404419D0; US11634779B2; US20230203597A1; GB2613427B; MX2022005588A

Abstract

Es werden Verfahren und Materialien zum Nachweis von Krebs aus einer Biopsie beschrieben. In einigen Fällen können zellfreie Nukleinsäuren sequenziert werden, und das Sequenzierungsergebnis kann zum Nachweis von Sequenzen verwendet werden, die von einem Neoplasma abgeleitet sind. Der Nachweis somatischer, in Phase auftretender Varianten kann in einem diagnostischen Scan auf das Vorhandensein von Krebs hinweisen und eine klinische Intervention kann durchgeführt werden.

Description

QUERVERWEIS
Diese Anmeldung beansprucht die Vorteile der vorläufigen US-Patentanmeldung Nr. 62/931,688 , eingereicht am 6. November 2019, die hierin durch Bezugnahme vollständig einbezogen ist.
SEQUENZPROTOKOLL
Die vorliegende Anmeldung enthält ein Sequenzprotokoll, das elektronisch im ASCII-Format eingereicht wurde und hiermit in vollem Umfang in die Anmeldung einbezogen wird. Die ASCII-Kopie, erstellt am 3. November 2020, heißt 58626-702_601_SL.txt und ist 307.199 Bytes groß.
STAATLICHE RECHTE
Diese Erfindung wurde mit staatlicher Unterstützung gemäß CA233975 , CA241076 und CA188298 von den US-Amerikanischen National Institutes of Health entwickelt. Der USamerikanische Staat bzw. dessen Regierung hat gewisse Rechte an der Erfindung.
HINTERGRUND
Nichtinvasive Bluttests, die somatische Veränderungen (z. B. mutierte Nukleinsäuren) auf der Grundlage der Analyse zellfreier Nukleinsäuren (z. B. zellfreier Desoxyribonukleinsäure (cfDNA) und zellfreier Ribonukleinsäure (cfRNA)) nachweisen können, sind aufgrund der relativ einfachen Gewinnung biologischer Spezimen (z. B. biologischer Flüssigkeiten) attraktive Kandidaten für Krebs-Screening-Anwendungen. Zirkulierende Tumor-Nukleinsäuren (z. B. ctDNA oder ctRNA, d. h. von Krebszellen erlangte Nukleinsäuren) können empfindliche und spezifische Biomarker für zahlreiche Krebs-Subtypen sein. Die derzeitigen Verfahren zum Nachweis der minimalen Restkrankheit (MRD) anhand von ctDNA können jedoch durch einen oder mehrere Faktoren, wie beispielsweise geringe Ausgangs-DNA-Mengen und hohe Hintergrundfehlerraten, eingeschränkt sein.
Jüngste Ansätze haben durch die Verfolgung multipler somatischer Mutationen mit fehlerunterdrückter Sequenzierung die ctDNA-MRD-Leistung verbessert, was zu Nachweisgrenzen von nur 4 Teilen in 100.000 aus limitierter cfDNA-Eingabe führt. Der Nachweis einer Restkrankheit während oder nach der Behandlung ist ein wirksames Instrument, wobei eine nachweisbare MRD selbst bei einer radiologischen Remission ein negatives prognostisches Zeichen darstellt. Die derzeitigen Nachweisgrenzen könnten jedoch unzureichend sein, um bei Patienten, bei denen ein Rückfall oder eine Progression der Krankheit zu erwarten ist, generell eine Restkrankheit nachzuweisen. Dieser „Nachweisverlust“ ist beispielhaft beim diffusen großzelligen B-Zell-Lymphom (DLBCL), bei dem der Nachweis von ctDNA nach zwei Zyklen einer Therapie mit kurativer Absicht ein starker prognostischer Marker ist. Trotzdem hat fast ein Drittel der Patienten, bei denen die Krankheit fortschreitet, an diesem Meilenstein keine nachweisbare ctDNA, was „falsch negative“ Tests bedeutet. Es wurden ähnliche falsch negative Ergebnisse bei Dickdarmkrebs und Brustkrebs beobachtet.
ZUSAMMENFASSUNG
Die vorliegende Offenbarung sieht Verfahren und Systeme zur Analyse zellfreier Nukleinsäuren (z. B. cfDNA, cfRNA) eines Subjekts vor. Verfahren und Systeme der vorliegenden Offenbarung können die von einem Subjekt abgeleiteten Sequenzierungsergebnisse nutzen, um krebserlangte Nukleinsäuren (z. B. ctDNA, ctRNA) nachzuweisen, z. B. zur Krankheitsdiagnose, zur Krankheitsbeobachtung oder zur Bestimmung von Behandlungen des Subjekts. Verfahren und Systeme der vorliegenden Offenbarung können eine erhöhte Empfindlichkeit, Spezifität und/oder Zuverlässigkeit des Nachweises von krebserlangten Nukleinsäuren aufweisen.
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren vor, umfassend: (a) Erlangen, durch ein Computersystem, von Sequenzierungsdaten, die aus einer Vielzahl zellfreier Nukleinsäuremolekülen erlangt sind, die von einem Subjekt erlangt oder abgeleitet werden; (b) Verarbeiten der Sequenzierungsdaten durch das Computersystem, um ein oder mehrere zellfreie Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle zu identifizieren, wobei jedes des einen oder mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, wobei wenigstens etwa 10 % des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten umfasst, die durch wenigstens ein Nukleotid getrennt sind; und (c) Analysieren des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle durch das Computersystem, um einen Zustand der Erkrankung zu ermitteln.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfassen die wenigstens etwa 10 % der zellfreien Nukleinsäuremoleküle wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % oder etwa 100 % des einen oder der mehreren zellfreien Nukleinsäuremoleküle.
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren vor, umfassend: (a) Erlangen, durch ein Computersystem, von Sequenzierungsdaten, die aus einer Vielzahl zellfreier Nukleinsäuremolekülen abgeleitet sind, die von einem Subjekt erlangt oder abgeleitet sind; (b) Verarbeiten der Sequenzierungsdaten durch das Computersystem, um ein oder mehrere zellfreie Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle zu identifizieren, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind; und (c) Analysieren des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle durch das Computersystem, um eine Erkrankung des Subjekts zu bestimmen.
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren vor, umfassend: (a) Erlangen von Sequenzierungsdaten, die von einer Vielzahl zellfreier Nukleinsäuremolekülen abgeleitet sind, die von einem Subjekt erlangt oder abgeleitet sind; (b) Verarbeiten der Sequenzierungsdaten, um ein oder mehrere zellfreie Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle mit einer Nachweisgrenze von weniger als etwa 1 von 50.000 Beobachtungen aus den Sequenzierungsdaten zu identifizieren, und (c) Analysieren des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle, um eine Erkrankung des Subjekts zu bestimmen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren liegt die Nachweisgrenze des Identifizierungsschritts bei weniger als etwa 1 von 100.000, weniger als etwa 1 von 500.000, weniger als etwa 1 von 1.000.000, weniger als etwa 1 von 1.500.000 oder weniger als etwa 1 von 2.000.000 Beobachtungen aus den Sequenzierungsdaten.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Prozesse (a) bis (c) von einem Computersystem durchgeführt.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten basierend auf einer Nukleinsäure-Amplifikation erzeugt. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten basierend auf der Polymerase-Kettenreaktion erzeugt. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten basierend auf der Amplikon-Sequenzierung erzeugt.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten basierend auf der Next-Generation-Sequenzierung (NGS) erzeugt. Alternativ werden in einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren die Sequenzierungsdaten basierend auf nicht-hybridisierungsbasierter NGS erzeugt.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten ohne Verwendung einer molekularen Barcodierung von wenigstens einem Teil der Vielzahl zellfreier Nukleinsäuremolekülen erzeugt. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten ohne Verwendung einer Probenbarcodierung von wenigstens einem Teil der Vielzahl zellfreier Nukleinsäuremolekülen erlangt.
In einigen Ausführungsformen eines der hierin offenbarten Verfahren werden die Sequenzierungsdaten ohne In silico-Entfernung oder Unterdrückung von (i) Hintergrundfehlern oder (ii) Sequenzierungsfehlern erhalten.
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Behandlung einer Erkrankung eines Subjekts vor, das Verfahren umfassend: (a) Identifizieren des Subjekts zur Behandlung der Erkrankung, wobei bei dem Subjekt, basierend auf der Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus einer Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden, ermittelt wurde, dass er die Erkrankung hat, wobei jedes des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind, und wobei das Vorhandensein der Vielzahl von Phasenvarianten indikativ für die Erkrankung des Subjekts ist; und (b) Unterziehen des Subjekts der Behandlung basierend auf der Identifizierung in (a).
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Überwachung des Verlaufs einer Erkrankung eines Subjekts vor, das Verfahren umfassend: (a) Ermitteln eines ersten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines ersten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer ersten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden; (b) Ermitteln eines zweiten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines zweiten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer zweiten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden, wobei die zweite Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt wird, nachdem die erste Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt wurde; und (c) Ermitteln des Verlaufs der Erkrankung basierend auf dem ersten Stadium der Erkrankung und dem zweiten Stadium der Erkrankung, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Verlauf der Erkrankung eine Verschlimmerung der Erkrankung.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Verlauf der Erkrankung wenigstens eine Teilremission der Erkrankung.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist das Vorhandensein der Vielzahl von Phasenvarianten indikativ für das erste Stadium oder das zweite Stadium der Erkrankung des Subjekts.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wird die zweite Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt wenigstens etwa 1 Woche, wenigstens etwa 2 Wochen, wenigstens etwa 3 Wochen, wenigstens etwa 4 Wochen, wenigstens etwa 2 Monate oder wenigstens etwa 3 Monate nach der Erlangung der ersten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wird das Subjekt einer Behandlung der Erkrankung (i) vor der Gewinnung der zweiten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt und (ii) im Anschluss an die Gewinnung der ersten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt unterzogen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Verlauf der Erkrankung indikativ für eine minimale Resterkrankung der Erkrankung des Subjekts. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Verlauf der Erkrankung indikativ für die Tumorlast oder die Krebslast des Subjekts.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden das eine oder die mehreren zellfreien Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle mit einem Nukleinsäuresondensatz erfasst, wobei der Nukleinsäuresondensatz zur Hybridisierung an wenigstens einen Teil der zellfreien Nukleinsäuremoleküle ausgelegt ist, die eine oder mehrere mit der Erkrankung assoziierte Genombereiche umfassen.
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren vor, umfassend: (a) Vorsehen eines Gemisches, umfassend (1) einen Nukleinsäuresondensatz und (2) eine Vielzahl von zellfreien Nukleinsäuremolekülen, die von einem Subjekt erlangt oder abgeleitet wird, wobei eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatzes zur Hybridisierung an wenigstens einen Teil eines zellfreien Zielnukleinsäuremoleküls gestaltet ist, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind, und wobei die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens umfasst, wobei die Aktivierung des aktivierbaren Reporteragens ausgewählt ist aus der Gruppe bestehend aus: (i) Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl der Phasenvarianten und (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl der Phasenvarianten hybridisiert wurde; (b) Nachweis des aktivierbaren Reporteragens, das zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle aktiviert ist, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle die Vielzahl der Phasenvarianten umfasst; und (c) Analysieren des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle zur Ermittlung einer Erkrankung des Subjekts.
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren vor, umfassend: (a) Vorsehen eines Gemisches, umfassend (1) einen Nukleinsäuresondensatz und (2) eine Vielzahl von zellfreien Nukleinsäuremolekülen, die von einem Subjekt erlangt oder abgeleitet wird, wobei eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatzes zur Hybridisierung an wenigstens einen Teil eines zellfreien Zielnukleinsäuremoleküls gestaltet ist, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, und wobei die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens umfasst, wobei die Aktivierung des aktivierbaren Reporteragens ausgewählt ist aus der Gruppe bestehend aus: (i) Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl der Phasenvarianten und (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl der Phasenvarianten hybridisiert wurde; (b) Nachweis des aktivierbaren Reporteragens, das zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle aktiviert ist, wobei eine Nachweisgrenze des Identifizierungsschritts weniger als etwa 1 aus 50.000 zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen ist; und (c) Analysieren des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle zur Ermittlung einer Erkrankung des Subjekts.
In einigen Ausführungsformen eines beliebigen der hierin offenbaren Verfahren beträgt die Nachweisgrenze des Identifizierungsschritts weniger als etwa 1 von 100.000, weniger als etwa 1 von 500.000, weniger als etwa 1 von 1.000.000, weniger als etwa 1 von 1.500.000 oder weniger als etwa 1 von 2.000.000 zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wird das aktivierbare Reporteragens bei der Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl der Phasenvarianten aktiviert.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wird das aktivierbare Reporteragens bei der Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl der Phasenvarianten hybridisiert wurde, aktiviert.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das Verfahren ferner das Mischen (1) des Nukleinsäuresondensatzes und (2) der Vielzahl von zellfreien Nukleinsäuremolekülen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist das aktivierbare Reporteragens ein Fluorophor.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst die Analyse des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle die Analyse (i) des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle und (ii) anderer zellfreier Nukleinsäuremoleküle der Vielzahl zellfreier Nukleinsäuremoleküle, die nicht die Vielzahl der Phasenvarianten als unterschiedliche Variablen umfassen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren basiert die Analyse des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle nicht auf anderen zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen, die nicht die Vielzahl von Phasenvarianten umfassen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist eine Anzahl der Vielzahl von Phasenvarianten aus dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts. In einigen Ausführungsformen ist ein Verhältnis von (i) der Anzahl der Vielzahl von Phasenvarianten aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen und (ii) einer Anzahl von Einzelnukleotidvarianten (Single Nucleotide Variants, SNV) aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Häufigkeit der Vielzahl von Phasenvarianten in dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts. In einigen Ausführungsformen ist die Häufigkeit indikativ für eine mit der Erkrankung verbundene erkrankte Zelle. In einigen Ausführungsformen ist die Erkrankung ein diffuses großzelliges B-Zell-Lymphom, und wobei die Häufigkeit indikativ dafür ist, ob das eine oder die mehreren zellfreien Nukleinsäuremoleküle von Keimzentrum-B-Zellen (Germinal Center B-Cells, GCB) oder aktivierten B-Zellen (Activated B-Cell, ABC) abgeleitet sind.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Genomursprung des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle indikativ für die Erkrankung des Subjekts.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren sind die erste und die zweite Phasenvariante durch wenigstens 2, wenigstens 3, wenigstens 4, wenigstens 5, wenigstens 6, wenigstens 7 oder wenigstens 8 Nukleotide getrennt. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren sind die erste und die zweite Phasenvariante durch höchstens etwa 180, höchstens etwa 170, höchstens etwa 160, höchstens etwa 150 oder höchstens etwa 140 Nukleotide getrennt.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfassen wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 % oder wenigstens etwa 50 % des einen oder der mehreren zellfreien Nukleinsäuremoleküle, die eine Vielzahl von Phasenvarianten umfassen, eine Einzelnukleotidvariante (Single Nucleotide Variant, SNV), die wenigstens 2 Nukleotide von einer benachbarten SNV entfernt ist.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst die Vielzahl der Phasenvarianten wenigstens 3, wenigstens 4, wenigstens 5, wenigstens 10, wenigstens 15, wenigstens 20 oder wenigstens 25 Phasenvarianten innerhalb desselben zellfreien Nukleinsäuremoleküls.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das eine oder umfassen die mehreren identifizierten zellfreien Nukleinsäuremoleküle wenigstens 2, wenigstens 3, wenigstens 4, wenigstens 5, wenigstens 10, wenigstens 50, wenigstens 100, wenigstens 500 oder wenigstens 1.000 zellfreie Nukleinsäuremoleküle.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Referenzgenomsequenz von einer Referenzkohorte abgeleitet. In einigen Ausführungsformen umfasst die Referenzgenomsequenz eine Konsenssequenz aus der Referenzkohorte. In einigen Ausführungsformen umfasst die Referenzgenomsequenz wenigstens einen Teil des menschlichen hg 19-Genoms, hg18-Genoms, hg17-Genoms, hg16-Genoms oder hg38-Genoms.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Referenzgenomsequenz aus einer Probe des Subjekts abgeleitet.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Probe eine gesunde Probe. In einigen Ausführungsformen umfasst die Probe eine gesunde Zelle. In einigen Ausführungsformen umfasst die gesunde Zelle einen gesunden Leukozyten.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Probe eine erkrankte Probe. In einigen Ausführungsformen umfasst die erkrankte Probe eine erkrankte Zelle. In einigen Ausführungsformen umfasst die erkrankte Zelle eine Tumorzelle. In einigen Ausführungsformen umfasst die erkrankte Probe einen soliden Tumor.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wird der Nukleinsäuresondensatz basierend auf der Vielzahl von Phasenvarianten gestaltet, die durch den Vergleich von (i) Sequenzierungsdaten aus einem soliden Tumor, Lymphom oder Bluttumor des Subjekts und (ii) Sequenzierungsdaten aus einer gesunden Zelle des Subjekts oder einer gesunden Kohorte identifiziert werden. In einigen Ausführungsformen stammt die gesunde Zelle von dem Subjekt. In einigen Ausführungsformen stammt die gesunde Zelle aus der gesunden Kohorte.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Nukleinsäuresondensatz zur Hybridisierung an wenigstens einen Teil der Sequenzen der mit der Erkrankung assoziierten genomischen Loci gestaltet. In einigen Ausführungsformen ist bekannt, dass die mit der Erkrankung assoziierten genomischen Loci eine aberrante somatische Hypermutation aufweisen, wenn das Subjekt die Erkrankung hat.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Nukleinsäuresondensatz zur Hybridisierung an wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % oder etwa 100 % (i) der in Tabelle 1 identifizierten Genombereiche, (ii) der in Tabelle 3 identifizierten Genombereiche oder (iii) der in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereiche, gestaltet.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren weist jede Nukleinsäuresonde des Nukleinsäuresondensatz wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % Sequenzidentität, wenigstens etwa 95 % Sequenzidentität oder etwa 100 % Sequenzidentität mit einer aus Tabelle 6 ausgewählten Sondensequenz auf.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst der Nukleinsäuresondensatz wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 % oder wenigstens etwa 90 % der Sondensequenzen in Tabelle 6.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das Verfahren ferner die Bestimmung, dass das Subjekt die Erkrankung hat oder die Bestimmung eines Grades oder Stadiums der Erkrankung des Subjekts, basierend auf dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen, die die Vielzahl von Phasenvarianten umfassen. In einigen Ausführungsformen umfasst das Verfahren ferner das Bestimmen, dass das eine oder die mehreren zellfreien Nukleinsäuremoleküle aus einer mit der Erkrankung assoziierten Probe abgeleitet ist/sind, basierend auf der Durchführung einer statistischen Modellanalyse des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle. In einigen Ausführungsformen umfasst die statistische Modellanalyse eine statistische Monte-Carlo-Analyse.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das Verfahren ferner die Überwachung eines Verlaufs der Erkrankung des Subjekts basierend auf dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das Verfahren ferner das Durchführen eines anderen Verfahrens zur Bestätigung der Erkrankung des Subjekts. In einigen Ausführungsformen umfasst das andere Verfahren einen Bluttest, einen Gentest, eine medizinische Bildgebung, eine körperliche Untersuchung oder eine Gewebebiopsie.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das Verfahren ferner das Bestimmen einer Behandlung der Erkrankung des Subjekts basierend auf dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wurde das Subjekt vor (a) einer Behandlung der Erkrankung unterzogen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst die Behandlung Chemotherapie, Radiotherapie, Chemoradiotherapie, Immuntherapie, adoptive Zelltherapie, Hormontherapie, gezielte Arzneimitteltherapie, Operation, Transplantation, Transfusion oder medizinische Überwachung.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst die Vielzahl der zellfreien Nukleinsäuremoleküle eine Vielzahl von zellfreien Desoxyribonukleinsäuremolekülen (DNA-Molekülen).
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst Erkrankung eine Krankheit.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Vielzahl der zellfreien Nukleinsäuremoleküle aus einer Körperprobe des Subjekts abgeleitet. In einigen Ausführungsformen umfasst die Körperprobe Plasma, Serum, Blut, Liquor, Lymphflüssigkeit, Speichel, Urin oder Stuhl.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist das Subjekt ein Säugetier. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist das Subjekt ein Mensch.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst die Erkrankung Neoplasma, Krebs oder Tumor. In einigen Ausführungsformen umfasst die Erkrankung einen soliden Tumor. In einigen Ausführungsformen umfasst die Erkrankung ein Lymphom. In einigen Ausführungsformen umfasst die Erkrankung ein B-Zell-Lymphom. In einigen Ausführungsformen umfasst die Erkrankung einen Untertyp des B-Zell-Lymphoms, der ausgewählt ist aus der Gruppe bestehend aus diffusem großzelligem B-Zell-Lymphom, follikulärem Lymphom, Burkitt-Lymphom und chronisch lymphozytäre B-Zell-Leukämie.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wurde die Vielzahl der Phasenvarianten zuvor durch Sequenzierung einer früheren Tumorprobe oder einer zellfreien Nukleinsäureprobe als tumorabgeleitet identifiziert.
In einem Aspekt sieht die vorliegende Offenbarung eine Zusammensetzung vor, umfassend einen Ködersatz, der einen Nukleinsäuresondensatz umfasst, der zum Erfassen von zellfreien DNA-Molekülen gestaltet ist, die von wenigstens etwa 5 % der Genombereiche abgeleitet sind, die in (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen aufgeführt sind.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist der Nukleinsäuresondensatz für das Pull-Down (Abrufen, Herunterziehen) von zellfreien DNA-Molekülen gestaltet, die von wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % oder etwa 100 % von in (i) der in Tabelle 1 identifizierten Genombereiche, (ii) der in Tabelle 3 identifizierten Genombereiche oder (iii) der in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereiche festgelegten Genombereichen abgeleitet sind.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist der Nukleinsäuresondensatz zum Erfassen des einen oder der mehreren zellfreien DNA-Molekülen gestaltet, die von höchstens etwa 10 %, höchstens etwa 20 %, höchstens etwa 30 %, höchstens etwa 40 %, höchstens etwa 50 %, höchstens etwa 60 %, höchstens etwa 70 %, höchstens etwa 80 %, höchstens etwa 90 % oder etwa 100 % von (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen festgelegten Genombereichen abgeleitet sind.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst der Ködersatz höchstens 5, höchstens 10, höchstens 50, höchstens 100, höchstens 500, höchstens 1000 oder höchstens 2000 Nukleinsäuresonden.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatzes ein Pull-Down-Tag.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst das Pull-Down-Tag einen Nukleinsäure-Barcode.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst das Pull-Down-Tag Biotin.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist jedes der zellfreien DNA-Moleküle zwischen etwa 100 Nukleotiden und etwa 180 Nukleotiden lang.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen sind die Genombereiche mit einer Erkrankung assoziiert.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen weisen die Genombereiche eine aberrante somatische Hypermutation auf, wenn ein Subjekt die Erkrankung hat.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst die Erkrankung ein B-Zell-Lymphom. In einigen Ausführungsformen umfasst die Erkrankung einen Untertyp des B-Zell-Lymphoms, der ausgewählt ist aus der Gruppe bestehend aus diffusem großzelligem B-Zell-Lymphom, follikulärem Lymphom, Burkitt-Lymphom und chronisch lymphozytäre B-Zell-Leukämie.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst die Zusammensetzung ferner eine Vielzahl von zellfreien DNA-Molekülen, die von einem Subjekt erlangt oder abgeleitet wurden.
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Durchführung eines klinischen Verfahrens an einem Individuum vor, das Verfahren umfassend: (a) Gewinnen oder erlangt haben eines gezielten Sequenzierungsergebnisses einer Sammlung von zellfreien Nukleinsäuremolekülen, wobei die Sammlung von zellfreien Nukleinsäuremolekülen aus einer Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums stammt, und wobei die gezielte Sequenzierung unter Verwendung von Nukleinsäuresonden zum Pull-Down von Sequenzen genomischer Loci durchgeführt wird, von denen bekannt ist, dass sie eine aberrante somatische Hypermutation in einem B-Zell-Krebs aufweisen; (b) Identifizieren oder identifiziert haben einer Vielzahl von Varianten in Phase innerhalb des zellfreien Nukleinsäure-Sequenzierungsergebnisses; (c) Bestimmen oder bestimmt haben, unter Verwendung eines statistischen Modells und der identifizierten Phasenvarianten, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleotide enthält, die von einem Neoplasma abgeleitet sind; und (d) Durchführen eines klinischen Verfahrens an dem Individuum zur Bestätigung des Vorhandenseins des B-Zell-Krebses, basierend auf der Bestimmung, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleinsäure-Sequenzen enthält, die wahrscheinlich von dem B-Zell-Krebs abgeleitet sind.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist die Biopsie eine von Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen sind die genomischen Loci ausgewählt aus (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen sind die Sequenzen der Nukleinsäuresonden aus Tabelle 6 ausgewählt.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist das klinische Verfahren ein Bluttest, eine medizinische Bildgebung oder eine körperliche Untersuchung.
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Behandlung eines Individuums gegen B-Zellen-Krebs vor, das Verfahren umfassend: (a) Gewinnen oder erlangt haben eines gezielten Sequenzierungsergebnisses einer Sammlung von zellfreien Nukleinsäuremolekülen, wobei die Sammlung von zellfreien Nukleinsäuremolekülen aus einer Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums stammt, und wobei die gezielte Sequenzierung unter Verwendung von Nukleinsäuresonden zum Pull-Down von Sequenzen genomischer Loci durchgeführt wird, von denen bekannt ist, dass sie eine aberrante somatische Hypermutation in einem B-Zellen-Krebs aufweisen; (b) Identifizieren oder identifiziert haben einer Vielzahl von Varianten in Phase innerhalb des Ergebnisses der zellfreien Nukleinsäure-Sequenzierung; (c) Bestimmen oder bestimmt haben, unter Verwendung eines statistischen Modells und der identifizierten Phasenvarianten, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleotide enthält, die von einem Neoplasma abgeleitet sind; und (d) Behandeln des Individuums zur Eindämmung des B-Zellen-Krebses, basierend auf der Bestimmung, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleinsäure-Sequenzen enthält, die von dem B-Zellen-Krebs abgeleitet sind.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist die Biopsie eine von Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen sind die genomischen Loci ausgewählt aus (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen sind die Sequenzen der Nukleinsäuresonden aus Tabelle 6 ausgewählt.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist die Behandlung Chemotherapie, Radiotherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie oder medizinische Überwachung.
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zum Nachweis einer krebsartigen minimalen Restkrankheit bei einem Individuum und zur Behandlung des Individuums aufgrund einer Krebskrankheit vor, das Verfahren umfassend: (a) Gewinnen oder erlangt haben eines gezielten Sequenzierungsergebnisses einer Sammlung von zellfreien Nukleinsäuremolekülen, wobei die Sammlung von zellfreien Nukleinsäuremolekülen aus einer Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums stammt, wobei die Flüssigkeits- oder Ausscheidungsbiopsie zum Nachweis einer minimalen Restkrankheit nach einer Reihe von Behandlungen entnommen wird, und wobei die gezielte Sequenzierung unter Verwendung von Nukleinsäuresonden zum Pull-Down von Sequenzen genomischer Loci durchgeführt wird, von denen bestimmt wurde, dass sie eine Vielzahl von Varianten in Phasen enthalten, wie durch ein früheres Sequenzierungsergebnis einer aus dem Krebs abgeleiteten früheren Biopsie bestimmt; (b) Identifizieren oder identifiziert haben wenigstens eines Satzes der Vielzahl von Varianten in Phase innerhalb des Ergebnisses der zellfreien Nukleinsäure-Sequenzierung; (c) Behandeln des Individuums zur Eindämmung des Krebses, basierend auf der Bestimmung, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleinsäure-Sequenzen enthält, die von dem Krebs abgeleitet sind.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist die Flüssigkeits- oder Ausscheidungsbiopsie eine von Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist die Behandlung Chemotherapie, Radiotherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie oder medizinische Überwachung.
In einem Aspekt sieht die vorliegende Offenbarung ein Computerprogrammprodukt vor, umfassend ein nicht-transitorisches, computerlesbares Medium mit darin codiertem, computerausführbarem Code, wobei der computerausführbare Code zur Ausführung zur Implementierung eines beliebigen der hier offenbaren Verfahren angepasst ist.
In einem Aspekt sieht die vorliegende Offenbarung ein System vor, das einen oder mehrere Computerprozessoren und einen damit gekoppelten Computerspeicher umfasst, wobei der Computerspeicher maschinenausführbaren Code enthält, der bei Ausführung durch den einen oder die mehreren Computerprozessoren ein beliebiges der hierin offenbarten Verfahren implementiert.
Zusätzliche Aspekte und Vorteile der vorliegenden Offenbarung werden für Fachleute aus der folgenden ausführlichen Beschreibung leicht ersichtlich, in der lediglich veranschaulichende Ausführungsformen der vorliegenden Offenbarung gezeigt und beschrieben werden. Wie zu erkennen sein wird, ist die vorliegende Offenbarung zu anderen und unterschiedlichen Ausführungsformen fähig, und ihre zahlreichen Details sind zu Modifikationen in verschiedenen offensichtlichen Hinsichten fähig, ohne dabei von der Offenbarung abzuweichen. Dementsprechend sind die Zeichnungen und die Beschreibung als veranschaulichend und nicht als einschränkend zu betrachten.
DURCH BEZUGNAHME EINBEZOGEN
Alle Veröffentlichungen, Patente und Patentanmeldungen, die in dieser Patentschrift erwähnt werden, sind hierin durch Bezugnahme in demselben Umfang einbezogen, als ob jede einzelne Veröffentlichung, jedes einzelne Patent oder jede einzelne Patentanmeldung ausdrücklich und individuell als durch Bezugnahme einbezogen angegeben wäre. Soweit die durch Bezugnahme einbezogenen Veröffentlichungen und Patente oder Patentanmeldungen der in der Patentschrift enthaltenen Offenbarung widersprechen, hat die Beschreibung Vorrang vor etwaigem widersprüchlichem Material.
Figurenliste
Verschiedene Merkmale der Erfindung sind in den beigefügten Patentansprüchen im Einzelnen dargelegt. Zum besseren Verständnis der Merkmale und Vorteile der vorliegenden Erfindung wird auf die folgende ausführliche Beschreibung, in der veranschaulichende Ausführungsformen dargelegt sind, in denen die Prinzipien der Erfindung genutzt werden, sowie auf die beigefügten Zeichnungen (hierin auch „Figur“ und „FIG.“) verwiesen.

1 veranschaulicht die Entdeckung von Phasenvarianten und deren Mutationssignaturen durch die Analyse von Ganzgenomsequenzierungsdaten. 1A ist eine Zeichnung, die den Unterschied zwischen dem Nachweis einer Einzelnukleotidvariante (SNV) (oben) und mehrerer Varianten ,in Phase‘ (Phasenvarianten, PVs; unten) auf individuellen zellfreien DNA-Molekülen darstellt. Theoretisch ist der Nachweis einer PV ein spezifischeres Ereignis als der Nachweis einer isolierten SNV. 1B. ist ein Streudiagramm, das die Verteilung der Anzahl der PVs aus Ganzgenomsequenzierungsdaten (Whole Genome Sequencing, WGS-Daten) für 24 verschiedene Krebshistologien, normalisiert durch die Gesamtzahl der SNV, zeigt. Die Balken zeigen den Medianwert und den Interquartilsbereich. (FL-NHL, follikuläres Lymphom; DLBCL-NHL, diffuses großzelliges B-Zell-Lymphom; Burkitt-NHL, Burkitt-Lymphom, Lungen-SCC, Plattenepithel-Lungenkrebs; Lungen-Adeno, Adenokarzinom der Lunge; Nieren-RCC, Nierenzellkarzinom; Knochen-Osteosarc, Osteosarkom; Leber-HCC, hepatozelluläres Karzinom; Brust-Adeno, Adenokarzinom der Brust; Pank-Adeno, Adenokarzinom der Bauchspeicheldrüse; Kopf-SCC, Plattenepithelkarzinom im Kopf- und Halsbereich; Ovar-Adeno, Adenokarzinom der Eierstöcke; Eso-Adeno, Adenokarzinom der Speiseröhre; Uterus-Adeno, Adenokarzinom der Gebärmutter; Magen-Adeno, Adenokarzinom des Magens; CLL, chronische lymphozytäre Leukämie; KoloRekt-Adeno, kolorektales Adenokarzinom; Prost-Adeno, Adenokarzinom der Prostata; ZNS-GBM, Glioblastoma multiforme; Pank-Endokrin, neuroendokriner Tumor der Bauchspeicheldrüse; Schildd.-Adeno, Adenokarzinom der Schilddrüse; ZNS-PiloAstro, Piloastrozytom; ZNS-Medullo, Medulloblastom). 1C. ist ein Wärmebild, das die Anreicherung von Mutationssignaturen durch Einzelbasensubstitution (Single Base Substitution, SBS) für PVs im Vergleich zu einzelnen SNV über verschiedene Krebsarten hinweg zeigt. Blau steht für Signaturen, die in PVs in bestimmten Histologien angereichert sind; Dunkelgrau steht für Signaturen, in denen nicht phasierte, einzelne SNV angereichert sind; und Rot steht für SNV, die isoliert auftreten. Nur Signaturen, die einen signifikanten Unterschied zwischen PVs und nicht phasierten SNV nach Korrektur für multiple Hypothesen aufweisen, sind dargestellt; andere Signaturen sind grau. Signaturen, die mit Rauchen, AID/AICDA und APOBEC in Verbindung gebracht werden, sind angegeben. 1D. stellt Balkendiagramme dar, die die Verteilung von in stereotypen Bereichen des Genoms auftretenden PVs bei B-Lymphoid-Malignitäten und Adenokarzinom der Lunge zeigen. In diesem Diagramm wurde das Genom in 1000bp-Bins unterteilt und die Anteil der Proben einer gegebenen Histologie mit einer PV in jedem 1000bp-Bin berechnet. Es sind nur Bins dargestellt, die bei einem beliebigen Krebsuntertyp eine Rezidivhäufigkeit von wenigstens 2 Prozent aufweisen. Die wichtigsten genomischen Loci sind ebenfalls markiert. 1E ist ein Vergleich der Duplex-Sequenzierung mit der Sequenzierung von Phasenvarianten. Ein Schema zum Vergleich der fehlerunterdrückten Sequenzierung durch Duplex-Sequenzierung und der Rückgewinnung von Phasenvarianten. Bei der Duplex-Sequenzierung ist die Rückgewinnung einer einzelnen SNV, die auf beiden Strängen einer ursprünglichen DNA-Doppelhelix (d. h. in-trans) beobachtet wurde, erforderlich. Dies erfordert eine unabhängige Rückgewinnung von zwei Molekülen durch Sequenzierung, da die Plus- und Minusstränge des ursprünglichen DNA-Moleküls unabhängig voneinander die Bibliothekspräparation und PCR durchlaufen. Im Gegensatz dazu erfordert die Rückgewinnung von PVs mehrere SNV, die auf demselben Einzelstrang der DNA (d. h. in cis) beobachtet werden. Daher ist die Rückgewinnung nur des Plus- oder des Minusstrangs (und nicht beider) für die Identifizierung von PVs ausreichend.
2 stellt die Gestaltung, die Validierung und die Anwendung der Phasenvarianten-Anreicherungssequenzierung dar. 2A ist eine schematische Darstellung der Gestaltung für die PhasED-Seq. WGS-Daten von DLBCL-Tumorproben wurden aggregiert (links), und Bereiche mit rezidivierenden putativen PVs identifiziert (Mitte). Daraufhin wurde ein Assay entwickelt, der die Genombereiche erfasst, in denen PVs am häufigsten vorkommen (rechts). Das Ergebnis war eine ~ 7500-fache Anreicherung von PVs im Vergleich zu WGS. Das rechte obere Panel zeigt die in silico erwartete Anzahl von PVs pro Fall pro Kilobase der Panelgröße (y-Achse) für steigende Panelgrößen (x-Achse). Die gestrichelte Linie zeigt die ausgewählten Bereiche in dem PhasED-Seq.-Panel. Das untere rechte Panel zeigt die Gesamtzahl der erwarteten PVs pro Fall (y-Achse), die in silico aus WGS-Daten ermittelt wurden, für steigende Panelgrößen (y-Achse). Der dunkle Bereich zeigt die ausgewählten Bereiche im PhasED-Seq.-Panel. 2B veranschaulicht zwei Felder, die den Ertrag an SNV (links) und PVs (rechts) für die Sequenzierung von Tumor-DNA und angepasster Keimbahn durch ein zuvor etabliertes Lymphom-CAPP-Seq.-Panel oder PhasED-Seq. zeigen; die Werte werden in silico bewertet, indem die WGS auf den Zielbereich von Interesse begrenzt wird. Die im rechten Feld angegebenen PVs umfassen Dublett-, Triplett- und Quadruplett-Phasenereignisse. 2C zeigt den Ertrag an SNV (links) und PVs (rechts) aus der experimentellen Sequenzierung von Tumor- und/oder zellfreier DNA aus CAPP-Seq. gegenüber PhasED-Seq., ähnlich wie in 2B. 2D ist ein Streudiagramm, das die Häufigkeit von PVs nach genomischer Position (in 1000bp-Bins) für Patienten mit DLBCL zeigt, die entweder durch WGS oder durch PhasED-Seq. identifiziert wurden. PVs in IGH, BCL2, MYC und BCL6 sind hervorgehoben. 2E zeigt Streudiagramme, die die Häufigkeit von PVs nach genomischer Position (in 50bp-Bins) für Patienten mit verschiedenen Lymphomtypen vergleichen. Die farbigen Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins eines bestimmten Gens von Interesse; die anderen (grauen) Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins des restlichen PhasED-Seq.-Sequenzierpanels. 2F zeigt Vulkandiagramme, die die Differenz in der relativen Häufigkeit von PVs in spezifischen genetischen Loci zwischen verschiedenen Lymphomarten zusammenfassen, einschließlich ABC-DLBCL vs. GCB-DLBCL (dunkelgrau, links); PMBCL vs. DLBCL (dunkelgrau, Mitte); und HL vs. DLBCL (dunkelgrau, rechts). Die x-Achse zeigt die relative Anreicherung von PVs an einem bestimmten Locus, während die y-Achse die statistische Signifikanz dieser Assoziation anzeigt. (Beispiel 10).
3 veranschaulicht die technische Leistung der PhasED-Seq. zum Nachweis von Krankheiten. 3A zeigt ein Balkendiagramm, das die Leistung der Hybriderfassungssequenzierung für die Rückgewinnung synthetischer 150bp Oligonukleotide von zwei Loci (MYC und BCL6) mit zunehmendem Mutationsgrad / Nicht-Referenzbasen zeigt. Die Fehlerbalken stellen das 95 %-Konfidenzintervall dar (n=3 Replikate jeder Erkrankung in eindeutigen Proben). 3B veranschaulicht ein Diagramm, das die Hintergrundfehlerrate (Beispiel 10) für verschiedene Arten der Fehlersuppression von 12 gesunden zellfreien Kontroll-DNA-Proben, die mit dem PhasED-Seq.-Panel sequenziert wurden, darstellt. PhasED-Seq. 2x' oder ,Dubletts` steht für den Nachweis von zwei phasengleichen Mutationen auf demselben DNA-Molekül; PhasED-Seq. 3x' oder ,Tripletts` steht für den Nachweis von drei phasengleichen Mutationen auf demselben DNA-Molekül. 3C stellt ein Balkendiagramm dar, das die Tiefe der eindeutigen molekularen Rückgewinnung (z. B. Tiefe nach Barcode-vermittelter PCR-Duplikatentfernung) aus Sequenzierungsdaten von 12 zellfreien DNA-Proben für verschiedene Arten der Fehlersuppression zeigt, einschließlich Barcode-Deduplizierung, Duplex-Sequenzierung und Rückgewinnung von PVs mit zunehmendem maximalen Abstand zwischen SNV in Phase. 3D veranschaulicht ein Balkendiagramm, das den kumulativen Anteil der PVs zeigt, die einen maximalen Abstand zwischen SNV aufweisen, der geringer ist als die Anzahl der Basenpaare auf der x-Achse. 3E zeigt ein Diagramm mit den Ergebnissen einer limitierenden Verdünnungsreihe, die patientenspezifische Tumorfraktionen von 1×10^-3 bis 0,5×10^-6 enthaltende zellfreie DNA-Proben simuliert; in jeder Verdünnung wurde cfDNA von 3 unabhängigen Patientenproben verwendet. Dieselben Sequenzierungsdaten wurden mit einer Vielzahl von Verfahren zur Fehlersuppression für die Rückgewinnung der erwarteten Tumorfraktionen analysiert, darunter iDES, Duplex-Sequenzierung und PhasED-Seq. (sowohl für die Rückgewinnung von Dublett- als auch Triplett-Molekülen). Die Punkte und Fehlerbalken stellen den Mittelwert, das Minimum und das Maximum für die drei betrachteten patientenspezifischen Tumormutationen dar. Der Unterschied zwischen beobachteten und erwarteten Tumorfraktionen für Proben < 1: 10.000 wurde mittels eines gepaarten t-Tests verglichen. *, P < 0,05, **, P < 0,005, ***, P < 0,0005. 3F veranschaulicht das Diagramm des Hintergrundsignals für den Nachweis tumorspezifischer Allele in 12 nicht verwandten, gesunden zellfreien DNA-Proben und der für die limitierende Verdünnungsreihe verwendeten gesunden cfDNA-Probe (n=13 Gesamtproben). In jeder Probe wurden tumorspezifische SNV oder PVs aus den 3 Patientenproben, die in dem in 3E gezeigten limitierenden Verdünnungsexperiment verwendet wurden, für insgesamt 39 Bewertungen bewertet. Die Balken stellen das arithmetische Mittel über alle 39 Bewertungen dar; der statistische Vergleich wurde mit dem Wilcoxon-Rangsummentest durchgeführt. *, P < 0,05, **, P < 0,005, ***, P < 0,0005. 3G veranschaulicht das Diagramm, das die theoretische Nachweisrate für eine Probe mit einer gegebenen Anzahl von PV-enthaltenden Bereichen gemäß einer einfachen binomialen Probennahme darstellt. Dieses Diagramm wurde unter der Annahme einer eindeutigen Sequenzierungstiefe von 5000x (Linie) erstellt, zusammen mit einer variierenden Anzahl unabhängiger 150bp PV-enthaltender Bereiche, von 3 Bereichen (blau) bis 67 Bereichen (lila). Die Konfidenzhüllkurven berücksichtigen eine Tiefe von 4000-6000x; zudem wird eine Falsch-positiv-Rate von 5 % angenommen. 3H veranschaulicht ein Diagramm, das die beobachtete Nachweisrate (y-Achse) für eine Probe einer gegebenen wahren Tumorfraktion (x-Achse) mit variierender Anzahl von PV-haltigen Bereichen darstellt. Für jede Anzahl von Tumor-Reporter-Bereichen zwischen 3 und 67 wurde diese Anzahl von 150bp-Fenstern aus jeder der 3 patientenspezifischen PV-Reporter-Listen 25-mal zufällig ausgewählt und zur Bewertung des Tumornachweises bei jeder Verdünnung herangezogen. Gefüllte Punkte stehen für „nasse“ Verdünnungsreihenversuche, während offene Punkte für In silico-Verdünnungsversuche stehen. Punkte und Fehlerbalken stellen den Mittelwert, das Minimum und das Maximum der drei patientenspezifischen PV-Reporter-Listen dar, die in der ursprünglichen Probennahme verwendet wurden. 31 zeigt ein Streudiagramm, in dem die vorhergesagte mit der beobachteten Nachweisrate für Proben aus den Verdünnungsreihen in den Panels 3G und 3H verglichen wird. Weitere Einzelheiten zu diesem Versuch sind in Beispiel 10 angegeben.
4 zeigt die klinische Anwendung der PhasED-Seq. für den ultrasensiblen Krankheitsnachweis und die Reaktionsbeobachtung bei DLBCL. 4A zeigt das Diagramm mit den ctDNA-Werten eines Patienten mit DLBCL, der auf die Erstlinien-Immunochemotherapie ansprach und anschließend einen Rückfall erlitt. Die mit CAPP-Seq. gemessenen Werte sind in dunkleren grauen Kreisen dargestellt, während die mit PhasED-Seq. gemessenen Werte in helleren grauen Kreisen dargestellt sind. Offene Kreise stehen für durch CAPP-Seq. nicht nachweisbare Werte. 4B stellt ein univariates Streudiagramm dar, das die mittlere Tumorallelfraktion zeigt, die durch PhasED-Seq. für klinische Proben zu Zeitpunkten minimaler Krankheit (d. h. nach 1 oder 2 Therapiezyklen) gemessen wurde. Das Diagramm ist unterteilt in durch Standard-CAPP-Seq. nachgewiesene und nicht nachgewiesene Proben; P-Wert aus Wilcoxon-Rangsummentest. 4C stellt ein Balkendiagramm dar, das den Bruchteil der DLBCL-Patienten zeigt, die mit CAPP-Seq. nach 1 oder 2 Behandlungszyklen nachweisbare ctDNA haben (dunkelgraue Balken), sowie den Bruchteil der zusätzlichen Patienten mit nachweisbarer Krankheit, wenn PhasED-Seq. zur Standard-CAPP-Seq. hinzugefügt wird (mittelgraue Balken). Der P-Wert stellt einen exakten Fisher-Test für den Nachweis durch CAPP-Seq. allein gegenüber der Kombination von PhasED-Seq. und CAPP-Seq. in 171 Proben nach 1 oder 2 Behandlungszyklen dar. 4D zeigt ein Wasserfalldiagramm, das die Veränderung der mit CAPP-Seq. gemessenen ctDNA-Werte nach 2 Zyklen der Erstlinientherapie bei Patienten mit DLBCL darstellt. Patienten mit nicht durch CAPP-Seq. nachweisbarer ctDNA sind als „ND“ (Not Detected, „nicht nachgewiesen“) in dunkleren Farben dargestellt. Die Farben der Balken zeigen auch die späteren klinischen Ergebnisse für diese Patienten an. 4E zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben für 52 DLBCL-Patienten mit nicht nachweisbarer ctDNA, gemessen durch CAPP-Seq., nach 2 Zyklen darstellt. 4F zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben von 52 in 4E gezeigten Patienten (durch CAPP-Seq. nicht nachweisbare ctDNA) stratifiziert nach ctDNA-Nachweis durch PhasED-Seq. zum gleichen Zeitpunkt (Zyklus 3, Tag 1) darstellt. 4G zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben für 89 Patienten mit DLBCL stratifiziert nach ctDNA bei Zyklus 3, Tag 1, unterteilt in 3 Schichten - Patienten, die keine gute molekulare Remission erreichen (dunkelgrau), Patienten mit einer guten molekulare Remission, die aber immer noch durch PhasED-Seq. und/oder CAPP-Seq. nachweisbare ctDNA haben (hellgrau), und Patienten, die eine stringente molekulare Remission haben (nicht durch PhasED-Seq. und CAPP-Seq. nachweisbare ctDNA; mittelgrau).
5 zeigt die Aufzählung von SNV und PVs bei verschiedenen Krebsarten aus WGS. 5A-C zeigen univariate Streudiagramme, die die Anzahl der SNV (5A), der PVs (5B) und der PVs unter Kontrolle der Gesamtzahl der SNV (5C) aus WGS-Daten für 24 verschiedene Krebshistologien darstellen. Die Balken zeigen den Medianwert und den Interquartilsbereich. (FL-NHL, follikuläres Lymphom; DLBCL-NHL, diffuses großzelliges B-Zell-Lymphom; Burkitt-NHL, Burkitt-Lymphom; Lungen-SCC, Plattenepithel-Lungenkrebs; Lungen-Adeno, Adenokarzinom der Lunge; Nieren-RCC, Nierenzellkarzinom; Knochen-Osteosarc, Osteosarkom; Leber-HCC, hepatozelluläres Karzinom; Brust-Adeno, Adenokarzinom der Brust; Pank-Adeno, Adenokarzinom der Bauchspeicheldrüse; Kopf-SCC, Plattenepithelkarzinom im Kopf- und Halsbereich; Ovar-Adeno, Adenokarzinom der Eierstöcke; Eso-Adeno, Adenokarzinom der Speiseröhre; Uterus-Adeno, Adenokarzinom der Gebärmutter; Magen-Adeno, Adenokarzinom des Magens; CLL, chronische lymphozytäre Leukämie; KoloRekt-Adeno, kolorektales Adenokarzinom; Prost-Adeno, Adenokarzinom der Prostata; ZNS-GBM, Glioblastoma multiforme; Pank-Endokrin, neuroendokriner Tumor der Bauchspeicheldrüse; Schildd.-Adeno, Adenokarzinom der Schilddrüse; ZNS-PiloAstro, Piloastrozytom; ZNS-Medullo, Medulloblastom).
6 zeigt den Beitrag von Mutationssignaturen in phasierten und nichtphasierten SNV in WGS (6A-6WW). Streudiagramme, die den Beitrag etablierter Mutationssignaturen für Einzelbasensubstitutionen (SBS) zu SNV in PVs, dargestellt in dunklen Farben, und SNV außerhalb möglicher Phasenbeziehungen, dargestellt in hellen Farben, aus WGS zeigen. Dies ist für 49 SBS-Mutationssignaturen in 24 Krebsunterarten dargestellt. Mutationssignaturen, die nach Korrektur der multiplen Hypothesentests einen signifikanten Unterschied im Beitrag zwischen phasierten und nichtphasierten SNV aufweisen, sind mit einem * gekennzeichnet. Diese Figuren stellen die in 1C zusammengefassten Rohdaten dar
7 zeigt die Verteilung der PVs in stereotypen Bereichen des Genoms. Die Balkendiagramme zeigen die in stereotypen Bereichen auftretenden PVs über das Genom mehrerer Krebsarten. In diesem Diagramm wurde das Genom in 1000bp-Bins unterteilt und die Anteil der Proben einer gegebenen Histologie mit einer PV in jedem 1000bp-Bin berechnet. Es sind nur Bins dargestellt, die bei einem beliebigen Krebsuntertyp eine Rezidivhäufigkeit von wenigstens 2 Prozent aufweisen. Die dargestellten Histologien sind wie in 1E; Unterarten des DLBCL mit aktivierten B-Zellen (ABC) und B-Zellen im Keimzentrum (GCB) sind ebenfalls dargestellt.
8 veranschaulicht die Anzahl und die genomische Lage von PVs aus WGS in lymphatischen Malignomen. 8A illustriert ein Balkendiagramm, das die Anzahl der unabhängigen 1000bp-Bereiche über das Genom zeigt, die wiederholt PVs für DLBCL, FL, BL und CLL enthalten (n=68, 74, 36 bzw. 151). 8B-D illustrieren Diagramme, die die Häufigkeit von PVs für multiple lymphatische Malignome mit Beziehungen zu spezifischen genetischen Loci zeigen, einschließlich 8B: BCL2, 8C: MYC, and 8D: ID3. Die Lage des Transkripts für ein gegebenes Gen ist unterhalb des Diagramms in Grau dargestellt; Exons sind in dunklerem Grau dargestellt. * kennzeichnet einen Bereich mit signifikant mehr PVs in einer bestimmten Krebs-Histologie im Vergleich zu allen anderen Histologien durch den exakten Fisher-Test (P < 0,05). 8E, ähnlich wie 8B-D, diese Diagramme zeigen die Häufigkeit von PVs bei verschiedenen Lymphom-Unterarten. Hier ist der IGH-Locus, bestehend aus IGHV-, IGHD- und IGHJ-Teilen, für ABC- und GCB-Subtyp DLBCLs (n = 25 bzw. 25) dargestellt. Dargestellt sind Codierungsbereiche für Ig-Teile, einschließlich Ig-konstanter Bereiche und V-Gene. (DLBCL, diffuses großzelliges B-Zell-Lymphom; FL, follikuläres Lymphom; BL, Burkitt-Lymphom, CLL, chronische lymphatische Leukämie).
9 zeigt die Leistung von PhasED-Seq. zur Rückgewinnung von PVs über Lymphome hinweg. 9A zeigt ein univariates Streudiagramm, das die Anteil aller durch WGS identifizierten PVs im gesamten Genom (n=79) zeigt, die durch das zuvor berichtete Lymphom-CAPP-Seq.-Panel⁸ (links) im Vergleich zu PhasED-Seq. (rechts) wiedererlangt wurden. 9B veranschaulicht die erwartete Ausbeute an SNV pro Fall, die aus WGS unter Verwendung eines zuvor etablierten Lymphom CAPP-Seq.-Panels oder des PhasED-Seq.-Panels identifiziert wurden. 9C veranschaulicht die erwartete Ausbeute an PVs pro Fall, die aus WGS unter Verwendung eines zuvor etablierten Lymphom CAPP-Seq.-Panels oder des PhasED-Seq.-Panels identifiziert wurden. Daten von drei unabhängigen, öffentlich zugänglichen Kohorten sind in 9A-9C dargestellt. 9D-9F zeigen Diagramme, die die Verbesserung der Rückgewinnung von PVs durch PhasED-Seq. im Vergleich zu CAPP-Seq. bei 16 Patienten zeigen, die mit beiden Assays sequenziert wurden. Dazu gehören Verbesserungen bei d) zwei SNV in Phase (z. B. 2x oder ,Dublett-PVs'), e) drei SNV in Phase (3x oder ,Triplett-PVs') und f) vier SNV in Phase (z. B. 4x oder , Quadruplett-PVs'). 9G-9K illustrieren Panels, die die Anzahl der bei Patienten mit verschiedenen Lymphomtypen identifizierten SNV und PVs zeigen. Diese Panels zeigen die Anzahl der g) SNV, h) Dublett-PVs, i) Triplett-PVs, j) Quadruplett-PVs und k) aller PVs. *, P < 0,05, **, P < 0,01, ***, P < 0,001. (DLBCL, diffuses großzelliges B-Zell-Lymphom; GCB, B-Zellen im Keimzentrum wie DLBCL; ABC, aktivierte B-Zellen wie DLBCL; PMBCL, primäres mediastinales B-Zell-Lymphom; HL, Hodgkin-Lymphom).
10 zeigt die lagespezifischen Unterschiede in PVs zwischen ABC-DLBCL und GCB-DLBC (10A-10Y.) Ähnlich wie 2D vergleichen diese Streudiagramme die Häufigkeit von PVs nach genomischer Lage (in 50bp-Bins) für Patienten mit verschiedenen Lymphomtypen; in dieser Figur ist der Unterschied zwischen ABC-DLBCL und GCB-DLBCL dargestellt. Die roten Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins eines bestimmten Gens von Interesse; die anderen (grauen) Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins aus dem Rest des PhasED-Seq.-Sequenzierpanels. Es werden nur Gene mit einem statistisch signifikantem Unterschied in den PVs zwischen ABC-DLBCL und GCB-DLBCL gezeigt. Die P-Werte stellen einen Wilcoxon-Rangsummentest von 50bp-Bins eines gegebenen Gens gegen alle anderen 50bp-Bins dar; siehe Beispiel 10.
11 illustriert die lagespezifischen Unterschiede in den PVs zwischen DLBCL und PMBCL (11A-11X). Ähnlich wie 2D vergleichen diese Streudiagramme die Häufigkeit von PVs nach genomischer Lage (in 50bp-Bins) für Patienten mit verschiedenen Lymphomtypen; in dieser Figur ist der Unterschied zwischen DLBCL und PMBCL dargestellt. Die blauen Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins eines bestimmten Gens von Interesse; die anderen (grauen) Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins aus dem Rest des PhasED-Seq.-Sequenzierpanels. Es werden nur Gene mit einem statistisch signifikantem Unterschied in den PVs zwischen DLBCL und PMBCL gezeigt. Die P-Werte stellen einen Wilcoxon-Rangsummentest von 50bp-Bins eines gegebenen Gens gegen alle anderen 50bp-Bins dar; siehe Beispiel 10.
12 zeigt die lagespezifischen Unterschiede in den PVs zwischen DLBCL und HL. Ähnlich wie in 2D vergleichen die Streudiagramme der 12A-12NN die Häufigkeit von PVs nach genomischer Lage (in 50bp-Bins) für Patienten mit verschiedenen Lymphomtypen; in dieser Figur ist der Unterschied zwischen DLBCL und HL dargestellt. Die grünen Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins eines bestimmten Gens von Interesse; die anderen (grauen) Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins aus dem Rest des PhasED-Seq.-Sequenzierpanels. Es werden nur Gene mit einem statistisch signifikantem Unterschied in den PVs zwischen DLBCL und HL gezeigt. Die P-Werte stellen einen Wilcoxon-Rangsummentest von 50bp-Bins eines gegebenen Gens gegen alle anderen 50bp-Bins dar; siehe Beispiel 10.
13 zeigt die Unterschiede in den PVs zwischen den Lymphomtypen bei Mutationen im IGH-Locus. Diese Figur zeigt die Häufigkeit von PVs aus PhasED-Seq. über den @/G77-Lokus für verschiedene Arten von B-Zell-Lymphomen. Die untere Spur zeigt die Struktur des @IGH-Locus und der Genteile, einschließlich der Ig-konstanten Gene und V-Gene. Die nächste (skizzierte) Spur zeigt die Häufigkeit von PVs in diesem Genombereich aus WGS-Daten (ICGC-Kohorte). Die restlichen Spuren zeigen die Häufigkeit von PVs aus PhasED-Seq. gezielten Sequenzierungsdaten, einschließlich 1) DLBCL, GCB-DLBCL , ABC-DLBCL, PMBCL und HL. Die vom PhasED-Seq.-Panel angezielten Bereiche sind ganz oben dargestellt. Ausgewählte Immunglobulinteile mit PVs, die in bestimmten Histologien angereichert sind, sind markiert (d. h. IGHV4-34, Sε, Sγ3 und Sγ1).
14 illustriert technische Aspekte der PhasED-Seq. durch Hybriderfassungssequenzierung. 14A zeigt ein Diagramm der theoretischen Bindungsenergie für typische 150-mere im gesamten Genom mit zunehmender Anteil der vom Referenzgenom mutierten Basen. Mutationen waren über die gesamte 150-mer-Sequenz verteilt, entweder gruppiert an einem Ende der Sequenz, gruppiert in der Mitte der Sequenz oder zufällig in der gesamten Sequenz. Punkt und Fehlerbalken stellen den Median und die Interquartilsbereiche von 10.000 In silico-Simulationen dar. 14B stellt ein Diagramm dar, das zwei Histogramme zusammenfassender Metriken der Mutationsrate von 151-bp-Fenstern im gesamten PhasED-Seq.-Panel für alle Patienten in dieser Studie zeigt. Das hellgraue Histogramm zeigt die maximalen mutierten Prozent in einem beliebigen 151-bp-Fenster für alle Patienten in dieser Studie; das dunkelgraue Histogramm zeigt die 95ste Perzentil-Mutationsrate über alle mutierten 151-bp-Fenster. 14C ist ein Diagramm, das das Perzentil der Mutationsrate über alle mutierten 151-bp-Fenster bei allen Patienten in dieser Studie zeigt. 14D stellt Wärmebilder dar, die die relative Fehlerrate (als log10(Fehlerrate)) für einzelne SNV (links, „ROT“), Dublett-PVs (Mitte, „GELB“) und Triplett-PVs (rechts, „BLAU“) zeigen. 14D zeigt, dass die Analyse basierend auf der Vielzahl von Phasenvarianten (z. B. Doppel- oder Triplett-PVs) eine niedrigere Fehlerrate ergibt als die Analyse basierend auf einzelnen SNV. Zusätzlich zeigt 14D, dass die Analyse unter Verwendung einer höheren Anzahl von Phasenvariantensätzen (z. B. Triplett-PVs mit der Bezeichnung „BLAU“) eine niedrigere Fehlerrate ergibt als die Analyse basierend auf einer geringeren Anzahl von Phasenvariantensätzen (z. B. Dublett-PVs mit der Bezeichnung „GELB“). Gezeigt ist die Fehlerrate einzelner SNV aus der Sequenzierung mit mehreren Verfahren zur Fehlerunterdrückung, einschließlich Barcode-Deduplizierung, iDES und Duplex-Sequenzierung. Die Fehlerraten werden nach Art der Mutation zusammengefasst. Im Falle von Triplett-PVs stellen die x- und y-Achse des Wärmebildes die erste und zweite Art der Basenveränderung in der PV dar; die dritte Veränderung wird über alle 12 möglichen Basenveränderungen gemittelt. 14E illustriert ein Diagramm, das die Fehlerrate für Dublett / 2x PVs als Funktion des genomischen Abstands zwischen den Komponenten-SNV zeigt.
15 und 16 zeigen den Vergleich der Quantifizierung von ctDNA durch PhasED-Seq. mit CAPP-Seq. und klinischen Anwendungen. 15 veranschaulicht die Nachweisrate von ctDNA aus Vorbehandlungsproben über 107 Patienten mit großzelligen B-Zell-Lymphomen mittels Standard-CAPP-Seq. (grün) sowie PhasED-Seq. unter Verwendung von Dubletts (hellblau), Tripletts (mittelblau) und Quadrupletts (dunkelblau). Die Spezifität des ctDNA-Nachweises ist ebenfalls dargestellt. In den unteren beiden Diagrammen ist die Falschnachweisrate bei 40 zurückgehaltenen gesunden KontrollcfDNA-Proben dargestellt. Die Größe der einzelnen Balken in diesen beiden Diagrammen zeigt die Nachweisrate für patientenspezifische cfDNA-Mutationen in diesen 40 zurückgehaltenen Kontrollen für alle 107 Fälle. 16A stellt eine Tabelle dar, die die Sensitivität und Spezifität für den ctDNA-Nachweis in Vorbehandlungsproben durch CAPP-Seq. und PhasED-Seq. unter Verwendung von Dubletts, Tripletts und Quadrupletts zusammenfasst, dargestellt in Panel A. Die Sensitivität wird für alle 107 Fälle berechnet, während die Spezifität für die 40 zurückgehaltenen Kontrollproben berechnet wird, die für jede der 107 unabhängigen patientenspezifischen Mutationslisten bewertet werden, was insgesamt 4280 unabhängige Tests ergibt. 16B illustriert ein Streudiagramm, das die Menge an ctDNA (gemessen als log10(haploide Genomäquivalente/ml)) zeigt, die durch CAPP-Seq. im Vergleich zu PhasED-Seq. in einzelnen Proben gemessen wurde. Proben, die vor Zyklus 1 der RCHOP-Therapie (d. h. vor der Behandlung), vor Zyklus 2 und vor Zyklus 3 entnommen wurden, sind in unabhängigen Farben (blau, grün bzw. rot; insgesamt 278 Proben) dargestellt. Nicht nachweisbare Werte liegen auf den Achsen. Spearman-Korrelation und P-Wert sind dargestellt.
17 zeigt den Nachweis von ctDNA nach zwei Zyklen der systemischen Therapie. 17A zeigt ein Streudiagramm, das die logarithmische Veränderung der ctDNA nach 2 Therapiezyklen (d. h. die Major Molecular Response (große molekulare Remission) oder MMR), gemessen mit CAPP-Seq. oder PhasED-Seq., für Patienten unter RCHOP-Therapie darstellt. Gepunktete Linien zeigen den zuvor festgelegten Schwellenwert einer 2,5-log-Reduktion in ctDNA für MMR. Nicht nachweisbare Proben fallen auf die Achsen; der Korrelationskoeffizient stellt einen Spearman rho für die 33 Proben dar, die sowohl mit CAPP-Seq. als auch mit PhasED-Seq. nachgewiesen wurden. 17B zeigt 2-x-2-Tabellen, in denen die Nachweisrate von ctDNA-Proben nach 2 Therapiezyklen durch PhasED-Seq. gegenüber CAPP-Seq. zusammengefasst ist. Patienten mit einer eventuellen Krankheitsprogression sind im unteren Panel dargestellt, während Patienten ohne eventuelle Krankheitsprogression im oberen Panel gezeigt sind. 17C zeigt Balkendiagramme, die den Bereich unter der Empfänger-Operator-Kurve (AUC) für die Klassifizierung von Patienten für das ereignisfreie Überleben nach 24 Monaten basierend auf CAPP-Seq. (helle Farben) oder PhasED-Seq. (dunkle Farben) nach 2 Therapiezyklen darstellen. Sowohl die Klassifizierung aller Patienten (n=89, links) als auch die Klassifizierung der Patienten, die eine MMR erreichen (n=69, rechts), sind dargestellt. 17D zeigt Kaplan-Meier-Diagramme, die das ereignisfreie Überleben von 69 Patienten zeigen, die eine MMR erreicht haben, stratifiziert nach ctDNA-Nachweis mit CAPP-Seq. (oben) oder PhasED-Seq. (unten).
18 illustriert den Nachweis von ctDNA nach einem Zyklus der systemischen Therapie. 18A zeigt ein Streudiagramm, das die log-fache Veränderung in ctDNA nach einem Therapiezyklus (d. h. die Early Molecular Response (frühe molekulare Remission) oder EMR), gemessen mit CAPP-Seq. oder PhasED-Seq., für Patienten unter RCHOP-Therapie darstellt. Gepunktete Linien zeigen den zuvor festgelegten Schwellenwert einer 2-log-Reduktion in ctDNA für EMR. Nicht nachweisbare Proben fallen auf die Achsen; der Korrelationskoeffizient stellt einen Spearman Rho für die 45 Proben dar, die sowohl mit CAPP-Seq. als auch mit PhasED-Seq. nachgewiesen wurden. 18B zeigt 2-x-2-Tabellen, in denen die Nachweisrate von ctDNA-Proben nach 1 Therapiezyklus durch PhasED-Seq. gegenüber CAPP-Seq. zusammengefasst ist. Patienten mit einer eventuellen Krankheitsprogression sind in Rot dargestellt, während Patienten ohne eventuelle Krankheitsprogression in Blau dargestellt sind. 18C zeigt Balkendiagramme, die den Bereich unter der Empfänger-Operator-Kurve (AUC) für die Klassifizierung von Patienten für das ereignisfreie Überleben nach 24 Monaten basierend auf CAPP-Seq. (helle Farben) oder PhasED-Seq. (dunkle Farben) nach 1 Therapiezyklus darstellen. Sowohl die Klassifizierung aller Patienten (n=82, links) als auch die Klassifizierung der Patienten, die eine EMR erreichen (n=63, rechts), sind dargestellt. 18D zeigt Kaplan-Meier-Diagramme, die das ereignisfreie Überleben von 63 Patienten zeigen, die eine EMR erreicht haben, stratifiziert nach ctDNA-Nachweis mit CAPP-Seq. (oben) oder PhasED-Seq. (unten). 18D zeigt ein Wasserfalldiagramm, das die Veränderung der mit CAPP-Seq. gemessenen ctDNA-Werte nach 1 Zyklus der Erstlinientherapie bei Patienten mit DLBCL darstellt. Patienten mit nicht durch CAPP-Seq. nachweisbarer ctDNA sind als „ND“ (Not Detected, „nicht nachgewiesen“) in dunkleren Farben dargestellt. Die Farben der Balken zeigen auch die späteren klinischen Ergebnisse für diese Patienten an. 18F zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben für 33 DLBCL-Patienten mit nicht nachweisbarer ctDNA, gemessen durch CAPP-Seq. nach 1 Zyklus darstellt. 18G zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben von 33 in 18F gezeigten Patienten (durch CAPP-Seq. nicht nachweisbare ctDNA) stratifiziert nach ctDNA-Nachweis durch PhasED-Seq. zum gleichen Zeitpunkt (Zyklus 2, Tag 1) darstellt. 18H zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben für 82 Patienten mit DLBCL stratifiziert nach ctDNA bei Zyklus 2, Tag 1, unterteilt in 3 Schichten - Patienten, die keine frühe molekulare Remission erreichen, Patienten mit einer frühen molekularen Remission, die aber immer noch durch PhasED-Seq. und/oder CAPP-Seq. nachweisbare ctDNA haben, und Patienten, die eine stringente molekulare Remission haben (nicht durch PhasED-Seq. und CAPP-Seq. nachweisbare ctDNA;).
19 illustriert eine Anteil von Patienten, bei denen PhasED-Seq. eine niedrigere LOD als die Duplexsequenzierung, die SNV basierend auf PCAWG-Daten (Ganzgenomsequenzierung) verfolgt, erreichen würde, aus denen die Anzahl von SNV und Phasenvarianten (PVs) in verschiedenen Tumorarten quantifiziert wurde.
20 zeigt die bei Lungenkrebs (Adenokarzinom, abgekürzt ,A‘, und Plattenepithelkarzinom, abgekürzt ,S') erzielten verbesserten LODs im Vergleich zur Duplex-Sequenzierung von Ganzgenom-Sequenzierungsdaten.
21 illustriert empirische Daten aus einem Versuch, bei dem WGS an Tumorgewebe durchgeführt wurde und für 5 Patienten mit soliden Tumoren (5 Lungenkarzinome) benutzerdefinierte Panels bestimmt wurden, um die LODs der benutzerdefinierten CAPP-Seq. im Vergleich zu PhasED-Seq. zu untersuchen und zu vergleichen, wobei sich bei 5/5 Patienten eine ~ 10x niedrigere LOD unter Verwendung von PhasED-Seq. ergab.
22A zeigt ein Proof-of-Principle-Beispiel einer Patientenvignette, in der die Verwendung benutzerdefinierter CAPP-Seq. und PhasED-Seq. für die Krankheitsbeobachtung bei Lungenkrebs verglichen wird und den früheren Nachweis eines Rückfalls unter Verwendung von PhasED-Seq. zeigt.
22B zeigt ein Proof-of-Principle-Beispiel für eine Patientenvignette, in der die Verwendung benutzerdefinierter CAPP-Seq. und PhasED-Seq. für den frühen Nachweis von Krankheiten bei Brustkrebs verglichen wird und die den früheren Nachweis der Krankheit mit PhasED-Seq. zeigt.
23A-23B zeigen, dass das hier beschriebene Verfahren (z. B. das in 3E und 3F dargestellte Verfahren) keine barcodevermittelte Fehlerunterdrückung erfordert.
24 illustriert ein Ablaufdiagramm eines Prozesses zur Durchführung einer klinischen Intervention und/oder Behandlung eines Individuums basierend auf dem Nachweis von Nukleinsäuresequenzen eines zirkulierenden Tumors in einem Sequenzierungsergebnis gemäß einer Ausführungsform.
25A-25C zeigen beispielhafte Ablaufdiagramme von Verfahren zum Bestimmen einer Erkrankung eines Subjekts basierend auf einem oder mehreren zellfreien Nukleinsäuremolekülen, die eine Vielzahl von Varianten umfassen.
25D zeigt ein beispielhaftes Ablaufdiagramm eines Verfahrens zur Behandlung einer Erkrankung eines Subjekts, basierend auf einem oder mehreren zellfreien Nukleinsäuremolekülen, die eine Vielzahl von Varianten umfassen.
25E zeigt ein beispielhaftes Ablaufdiagramm eines Verfahrens zur Bestimmung des Verlaufs (z. B. Progression oder Regression) einer Erkrankung eines Subjekts basierend auf einem oder mehreren zellfreien Nukleinsäuremolekülen, die eine Vielzahl von Varianten umfassen.
25F und 25G zeigen beispielhafte Ablaufdiagramme von Verfahren zur Bestimmung der Erkrankung eines Subjekts basierend auf einem oder mehreren zellfreien Nukleinsäuremolekülen, die eine Vielzahl von Varianten umfassen.
26A und 26B illustrieren schematisch verschiedene Fluoreszenzsonden zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle, die eine Vielzahl von Phasenvarianten umfassen.
27 zeigt ein Computersystem, das zur Implementierung der hierin vorgesehenen Verfahren programmiert oder anderweitig konfiguriert ist.

DETAILBESCHREIBUNG
Obwohl hierin verschiedene Ausführungsformen der Erfindung gezeigt und beschrieben wurden, wird es für den Fachmann offensichtlich sein, dass diese Ausführungsformen nur als Beispiel dienen. Für den Fachmann sind zahlreiche Variationen, Änderungen und Substitutionen möglich, ohne von der Erfindung abzuweichen. Es versteht sich, dass verschiedene Alternativen zu den hierin beschriebenen Ausführungsformen der Erfindung verwendet werden können.
Der Begriff „etwa“ oder „ungefähr“ bedeutet im Allgemeinen innerhalb eines akzeptablen Fehlerbereichs für den jeweiligen Wert, der zum Teil davon abhängen kann, wie der Wert gemessen oder bestimmt wird, z. B. von den Einschränkungen des Messsystems. Beispielsweise kann „etwa“ gemäß der gängigen Fachpraxis innerhalb einer oder mehr als einer Standardabweichung bedeuten. Alternativ kann „etwa“ einen Bereich von bis zu 20 %, bis zu 10 %, bis zu 5 % oder bis zu 1 % eines gegebenen Wertes bedeuten. Alternativ, insbesondere in Bezug auf biologische Systeme oder Prozesse, kann der Begriff innerhalb einer Größenordnung, bevorzugt innerhalb des 5-fachen und noch bevorzugter innerhalb des 2-fachen, eines Wertes bedeuten. Wenn in der Anmeldung und den Ansprüchen bestimmte Werte beschrieben werden, kann, sofern nicht anders angegeben, davon ausgegangen werden, dass der Begriff „etwa“ innerhalb eines akzeptablen Fehlerbereichs für den jeweiligen Wert liegend bedeutet.
Der Begriff „Phasenvarianten“, „Varianten in Phase“, „PV“ oder „somatische Varianten in Phase“, wie er hierin austauschbar verwendet wird, bezieht sich im Allgemeinen auf zwei oder mehr Mutationen (z. B. SNV oder Indels), die in cis (d. h. auf demselben Strang eines Nukleinsäuremoleküls) innerhalb eines einzigen zellfreien Nukleinsäuremoleküls auftreten. In einigen Fällen kann ein zellfreies Nukleinsäuremolekül ein zellfreies Desoxyribonukleinsäuremolekül (cfDNA-Molekül) sein. In einigen Fällen kann ein cfDNA-Molekül aus einem erkrankten Gewebe, wie etwa einem Tumor, (z. B. ein zirkulierendes Tumor-DNA-(ctDNA-)Molekül) abgeleitet sein.
Der Begriff „biologische Probe“ oder „Körperprobe“, wie er hierin austauschbar verwendet wird, bezieht sich im Allgemeinen auf eine von einem Subjekt erlangte Gewebe- oder Flüssigkeitsprobe. Eine biologische Probe kann direkt vom Subjekt erlangt werden. Alternativ kann eine biologische Probe von dem Subjekt abgeleitet werden (z. B. durch Verarbeitung einer ersten biologischen Probe, die von dem Subjekt erlangt wurde). Die biologische Probe kann ein oder mehrere Nukleinsäuremoleküle sein oder enthalten, wie beispielsweise DNA- oder Ribonukleinsäure-(RNA-)Moleküle. Die biologische Probe kann von einem beliebigen Organ, Gewebe oder einer biologischen Flüssigkeit abgeleitet sein. Eine biologische Probe kann zum Beispiel eine Körperflüssigkeit oder eine feste Gewebeprobe umfassen. Ein Beispiel für eine solide Gewebeprobe ist eine Tumorprobe, z. B. aus einer Biopsie eines soliden Tumors. Nicht einschränkende Beispiele für Körperflüssigkeiten beinhalten Blut, Serum, Plasma, Tumorzellen, Speichel, Urin, Liquor, Lymphflüssigkeit, Prostataflüssigkeit, Samenflüssigkeit, Milch, Sputum, Stuhl, Tränen und Derivate davon. In einigen Fällen können ein oder mehrere zellfreie Nukleinsäuremoleküle, wie hierin offenbart, aus einer biologischen Probe abgeleitet sein.
Der Begriff „Subjekt“, wie er hierin verwendet wird, bezieht sich allgemein auf beliebige Tiere, Säugetiere oder Menschen. Ein Subjekt kann eine oder mehrere Erkrankungen haben, potenziell haben oder im Verdacht stehen, eine oder mehrere Erkrankungen zu haben, wie beispielsweise eine Erkrankung. In einigen Fällen kann eine Erkrankung des Subjekts Krebs, ein oder mehrere mit Krebs assoziierte(s) Symptom(e) oder asymptomatisch in Bezug auf Krebs oder nicht diagnostiziert (z. B. nicht mit Krebs diagnostiziert) sein. In einigen Fällen kann das Subjekt an Krebs erkrankt sein, das Subjekt kann ein oder mehrere mit Krebs assoziierte Symptome aufweisen, das Subjekt kann frei von mit Krebs assoziierten Symptomen sein, oder das Subjekt kann nicht mit Krebs diagnostiziert worden sein. In einigen Beispielen ist das Subjekt ein Mensch.
Der Begriff „zellfreie DNA“ oder „cfDNA“, wie er hierin austauschbar verwendet wird, bezieht sich im Allgemeinen auf DNA-Fragmente, die frei im Blutstrom eines Subjekts zirkulieren. Zellfreie DNA-Fragmente können einen dinukleosomalen Schutz (z. B. eine Fragmentgröße von wenigstens 240 Basenpaaren („bp““)) aufweisen. Diese cfDNA-Fragmente mit dinukleosomalem Schutz wurden wahrscheinlich nicht zwischen dem Nukleosom geschnitten, was zu einer längeren Fragmentlänge (z. B. mit einer typischen Größenverteilung zentriert um 334 bp) führt. Zellfreie DNA-Fragmente können einen mononukleosomalen Schutz (z .B. eine Fragmentgröße von weniger als 240 Basenpaaren („“bp“)) aufweisen. Diese cfDNA-Fragmente mit mononukleosomalem Schutz wurden wahrscheinlich zwischen dem Nukleosom geschnitten, was zu einer kürzeren Fragmentlänge (z. B. mit einer typischen Größenverteilung zentriert um 167 bp) führt.
Der Begriff „Sequenzierungsdaten“, wie er hierin verwendet wird, bezieht sich allgemein auf „Rohsequenzlesungen“ und/oder „Konsensussequenzen“ von Nukleinsäuren, wie beispielsweise zellfreie Nukleinsäuren oder Derivate davon. Rohsequenzlesungen sind die Ausgabe eines DNA-Sequenzers und enthalten in der Regel redundante Sequenzen desselben Ausgangsmoleküls, zum Beispiel nach Amplifikation. „Konsensussequenzen“ sind aus redundanten Sequenzen eines Ausgangsmoleküls abgeleitete Sequenzen, die die Sequenz des ursprünglichen Ausgangsmoleküls darstellen sollen. Konsensussequenzen können durch Abstimmung (wobei jedes Mehrheitsnukleotid, z. B. das am häufigsten beobachtete Nukleotid an einer gegebenen Basenposition unter den Sequenzen das Konsensusnukleotid ist) oder durch andere Ansätze wie etwa den Vergleich mit einem Referenzgenom erzeugt werden. In einigen Fällen können Konsensussequenzen durch Markierung der ursprünglichen Ausgangsmoleküle mit eindeutigen oder nicht eindeutigen molekularen Markierungen erzeugt werden, die eine Verfolgung der Nachfolgesequenzen (z. B. nach Amplifikation) durch Verfolgung der Markierung und/oder Verwendung interner Sequenzleseinformationen ermöglichen.
Der Begriff „Referenzgenomsequenz“, wie er hierin verwendet wird, bezieht sich allgemein auf eine Nukleotidsequenz, mit der die Nukleotidsequenzen eines Subjekts verglichen werden.
Der Begriff „Genombereich“, wie er hierin verwendet wird, bezieht sich allgemein auf einen beliebigen Bereich (z. B. einen Bereich von Basenpaarpositionen) eines Genoms, z. B. eines gesamten Genoms, eines Chromosoms, eines Gens oder eines Exons. Ein Genombereich kann ein zusammenhängender oder ein nicht zusammenhängender Bereich sein. Ein „genetischer Locus“ (oder „Locus“) kann ein Teil oder die Gesamtheit eines Genombereichs (z. B. eines Gens, eines Teils eines Gens oder eines einzelnen Nukleotids eines Gens) sein.
Der Begriff „Wahrscheinlichkeit“, wie er hierin verwendet wird, bezieht sich allgemein auf eine Wahrscheinlichkeit, eine relative Wahrscheinlichkeit, ein Vorhandensein oder ein Fehlen oder einen Grad.
Der Begriff „Flüssigbiopsie“, wie er hierin verwendet wird, bezieht sich allgemein auf einen nicht-invasiven oder minimal-invasiven Labortest oder ein Assay (z. B. einer biologischen Probe oder zellfreier Nukleinsäuren). Die „Flüssigbiopsie“-Assays können Nachweise oder Messungen (z. B. geringere Allelhäufigkeiten, Genexpression oder Proteinexpression) von einem oder mehreren Markergenen melden, die mit einer Erkrankung eines Subjekts (z. B. Krebs- oder Tumor-assoziierte Markergene) in Verbindung stehen.
A. Einführung
Modifikationen (z. B. Mutationen) der genomischen DNA können sich in der Entstehung und/oder dem Fortschreiten einer oder mehrerer Erkrankungen (z. B. einer Erkrankung, wie Krebs oder Tumor) eines Subjekts manifestieren. Die vorliegende Offenbarung sieht Verfahren und Systeme zur Analyse zellfreier Nukleinsäuremoleküle, wie cfDNA, von einem Subjekts zur Bestimmung des Vorhandenseins oder Nichtvorhandenseins einer Erkrankung des Subjekts, der Prognose einer diagnostizierten Erkrankung des Subjekts, des Fortschreitens der Erkrankung des Subjekts im Laufe der Zeit, der therapeutischen Behandlung einer diagnostizierten Erkrankung des Subjekts oder des vorhergesagten Behandlungsergebnisses für eine Erkrankung des Subjekts vor.
Die Analyse zellfreier Nukleinsäuren, wie etwa cfDNA, wurde mit breiten Anwendungsmöglichkeiten, wie z. B. für pränatale Tests, Organtransplantation, Infektionskrankheiten und Onkologie, entwickelt. Im Zusammenhang mit dem Nachweis oder der Überwachung einer Krankheit eines Subjekts, wie z. B. Krebs, kann die zirkulierende Tumor-DNA (ctDNA) bei zahlreichen Krebsarten ein empfindlicher und spezifischer Biomarker sein. In einigen Fällen kann ctDNA zum Nachweis einer minimalen Restkrankheit (MRD) oder der Tumorlast nach einer Behandlung, wie beispielsweise einer Chemotherapie oder einer chirurgischen Resektion von soliden Tumoren, verwendet werden. Die Nachweisgrenze (Limit of Detection, LOD) für die ctDNA-Analyse kann jedoch durch eine Reihe von Faktoren eingeschränkt werden, darunter (i) geringe Ausgangs-DNA-Mengen aus einer typischen Blutabnahme und (ii) Hintergrundfehlerraten bei der Sequenzierung.
In einigen Fällen kann der auf ctDNA basierende Krebsnachweis durch die Verfolgung multipler somatischer Mutationen mit fehlerunterdrückter Sequenzierung verbessert werden, z. B. mit einer LOD von etwa 2 Teilen in 100.000 aus dem cfDNA-Input bei Verwendung von handelsüblichen Panels oder personalisierten Assays. In einigen Fällen kann die derzeitige LOD der ctDNA von Interesse jedoch unzureichend für den universellen Nachweis von MRD bei Patienten sein, bei denen ein Rückfall oder ein Fortschreiten der Krankheit droht. Ein Beispiel für einen solchen ,Nachweisverlust` ist das diffuse großzellige B-Zell-Lymphom (DLBCL). Bei DLBCL kann der vorläufige Nachweis von ctDNA nach nur zwei Zyklen kurativer Therapie eine starke molekulare Remission (Major Molecular Response, MMR) darstellen und ein starker prognostischer Marker für das endgültige klinische Ergebnis sein. Trotzdem ist bei fast einem Drittel der Patienten, bei denen die Krankheit letztlich fortschreitet, die ctDNA zu diesem Zwischenzeitpunkt mit den verfügbaren Techniken (z. B. Personalisierte Krebsprofilierung durch Tiefensequenzierung ,(Cancer Personalized Profiling by Deep Sequencing, CAPP-Seq.)) nicht nachweisbar, was „falsch-negative“ Messungen bedeutet. Derart hohe falsch-negative Raten wurden bei DLBCL-Patienten auch bei alternativen Verfahren wie der Überwachung von ctDNA durch Immunglobulin-Gen-Umordnungen beobachtet. Daher besteht ein Bedarf an verbesserten Verfahren zum ctDNA-basierten Krebsnachweis mit höherer Empfindlichkeit.
Somatische Varianten, die auf beiden komplementären Strängen der Ausgangs-DNA-Duplexe nachgewiesen werden, können zur Senkung der LOD des ctDNA-Nachweises verwendet werden, wodurch sich die Sensitivität des ctDNA-Nachweises vorteilhaft erhöht. Eine solche Duplex-Sequenzierung‘ kann das Hintergrundfehlerprofil reduzieren, da für den Nachweis einer Einzelnukleotidvariante (SNV) zwei konkordante Ereignisse erforderlich sind. Der Ansatz der Duplex-Sequenzierung allein kann jedoch durch die ineffiziente Rückgewinnung von DNA-Duplexen eingeschränkt sein, da die Rückgewinnung beider Originalstränge nur bei einer Minderheit aller rückerlangten Moleküle auftreten kann. Daher kann die Duplex-Sequenzierung für den realen ctDNA-Nachweis mit einer begrenzten Menge an Ausgangsproben suboptimal und ineffizient sein, wobei die Ausgangs-DNA aus praktischen Blutvolumina (z. B. zwischen etwa 4.000 und etwa 8.000 Genomen pro standardmäßigem 10-Milliliter-Blutabnahmeröhrchen) begrenzt ist und eine maximale Rückgewinnung der Genome unerlässlich ist.
Daher besteht nach wie vor ein erheblicher ungedeckter Bedarf für den Nachweis und die Analyse von ctDNA mit niedriger LOD (z. B. mit hoher Sensitivität), um beispielsweise das Vorhandensein oder Nichtvorhandensein einer Krankheit bei einem Subjekt, die Prognose der Krankheit, die Behandlung der Krankheit und/oder das voraussichtliche Ergebnis der Behandlung zu bestimmen.
B. Verfahren und Systeme zur Bestimmung oder Überwachung einer Erkrankung
Die vorliegende Offenbarung beschreibt Verfahren und Systeme zum Nachweis und zur Analyse zellfreier Nukleinsäuren mit einer Vielzahl von Phasenvarianten als Merkmal einer Erkrankung eines Subjekts. In einigen Aspekten können die zellfreien Nukleinsäuremoleküle cfDNA-Moleküle, wie beispielsweise ctDNA-Moleküle, umfassen. Die hierin offenbaren Verfahren und Systeme können von einer Vielzahl zellfreier Nukleinsäuremoleküle des Subjekts abgeleitete Sequenzierungsdaten verwenden, um eine Teilmenge der Vielzahl zellfreier Nukleinsäuremoleküle mit der Vielzahl von Phasenvarianten zu identifizieren und dadurch die Erkrankung des Subjekts zu bestimmen. Die hierin offenbarten Verfahren und Systeme können eine solche Untergruppe der Vielzahl zellfreier Nukleinsäuremoleküle, die die Vielzahl von Phasenvarianten aufweisen, direkt nachweisen und in einigen Fällen herunterziehen (oder erfassen), um so die Erkrankung des Subjekts mit oder ohne Sequenzierung zu bestimmen. Die hierin offenbarten Verfahren und Systeme können die Hintergrundfehlerrate reduzieren, die häufig bei dem Nachweis und der Analyse zellfreier Nukleinsäuremoleküle, wie cfDNA, auftreten.
In einigen Aspekten sind Verfahren und Systeme für die zellfreie Nukleinsäure-Sequenzierung und den Nachweis von Krebs vorgesehen. In einigen Ausführungsformen können zellfreie Nukleinsäuren (z. B. cfDNA oder cfRNA) aus einer Flüssigbiopsie einer Person extrahiert und für die Sequenzierung vorbereitet werden. Die Sequenzierungsergebnisse der zellfreien Nukleinsäuren können zum Nachweis somatischer Varianten in Phase (d. h. Phasenvarianten, wie hierin offenbart) als Hinweis auf zirkulierende Nukleinsäure-Sequenzen (ctDNA oder ctRNA) (d. h. Sequenzen, die von Nukleinsäuren einer Krebszelle abgeleitet sind oder aus diesen stammen) analysiert werden. Dementsprechend kann in einigen Fällen bei der Person Krebs durch Entnahme einer Flüssigbiopsie der Person und Sequenzierung der aus dieser Flüssigbiopsie abgeleiteten zellfreien Nukleinsäuren zum Nachweis zirkulierender Tumor-Nukleinsäuresequenzen nachgewiesen werden, und das Vorhandensein zirkulierender Tumor-Nukleinsäuresequenzen kann indikativ sein, dass die Person einen Krebs (z. B. eine bestimmte Art von Krebs) hat. In einigen Fällen kann basierend auf dem Nachweis des Krebses ein klinischer Eingriff und/oder eine Behandlung für die Person bestimmt und/oder durchgeführt werden.
Wie hier offenbart, kann das Vorhandensein somatischer Phasenvarianten ein starkes Indiz dafür sein, dass die diese Phasenvarianten enthaltenden Nukleinsäuren aus einer Körperprobe mit einer Erkrankung, wie einer Krebszelle, stammen (oder alternativ, dass die Nukleinsäuren aus einer Körperprobe stammen, die von einem Subjekt mit einer Erkrankung, wie Krebs, erlangt oder abgeleitet wurde). Der Nachweis von somatischen Phasenvarianten kann das Signal-Rausch-Verhältnis von Verfahren zum Nachweis zellfreier Nukleinsäuren verbessern (z. B. durch die Reduzierung oder Eliminierung von störenden „Rauschsignalen“), da es unwahrscheinlich ist, dass Phasenmutationen innerhalb eines kleinen genetischen Fensters auftreten, das ungefähr der Größe eines typischen zellfreien Nukleinsäuremoleküls (z. B. etwa 170 bp oder weniger) entsprich.
In einigen Aspekten kann eine Anzahl von Genombereichen als Hotspots für den Nachweis von Phasenvarianten, insbesondere bei verschiedenen Krebsarten, z.B. Lymphomen, verwendet werden. In einigen Fällen können Enzyme (z. B. AID, Apobec3a) die DNA in bestimmten Genen und an bestimmten Stellen stereotyp mutieren, was zur Entwicklung bestimmter Krebsarten führt. Dementsprechend können aus solchen Hotspot-Genombereichen abgeleitete zellfreie Nukleinsäuren erfasst oder gezielt (z. B. mit oder ohne Tiefensequenzierung) für den Krebsnachweis und/oder die Überwachung eingesetzt werden. Alternativ kann die Erfassungs- oder gezielte Sequenzierung in Bereichen durchgeführt werden, in denen zuvor Phasenvarianten aus einer Krebsquelle (z. B. einem Tumor) einer bestimmten Person nachgewiesen wurden, um Krebs bei dieser Person nachzuweisen.
In einigen Fällen kann die Erfassungssequenzierung zellfreier Nukleinsäuren als Screening-Diagnose durchgeführt werden. In einigen Fällen kann eine Screening-Diagnose zum Nachweis zirkulierender Tumor-Nukleinsäuren für Krebsarten entwickelt und eingesetzt werden, die stereotypische Bereiche von Phasenvarianten aufweisen. In einigen Fällen wird die Erfassungssequenzierung zellfreier Nukleinsäuren als Diagnostikum zum Nachweis von MRD oder Tumorlast durchgeführt, um zu bestimmen, ob während oder nach der Behandlung eine bestimmte Krankheit vorliegt. In einigen Fällen kann die Erfassungssequenzierung zellfreier Nukleinsäuren als Diagnostikum zur Bestimmung des Verlaufs (z. B. Progression oder Regression) einer Behandlung durchgeführt werden.
In einigen Aspekten können die Ergebnisse der zellfreien Nukleinsäure-Sequenzierung zum Nachweis analysiert werden, ob phasensomatische Einzelnukleotidvarianten (SNV) oder anderer Mutationen oder Varianten (z. B. Indels) innerhalb der zellfreien Nukleinsäureprobe existieren. In einigen Fällen kann das Vorhandensein bestimmter somatischer SNV oder anderer Varianten indikativ für zirkulierende Tumor-Nukleinsäure-Sequenzen und damit indikativ für einen im Subjekt vorhandenen Tumor sein. In einigen Fällen können mindestens zwei Phasenvarianten in einem zellfreien Nukleinsäuremolekül nachgewiesen werden. In einigen Fällen können mindestens drei Phasenvarianten in einem zellfreien Nukleinsäuremolekül nachgewiesen werden. In einigen Fällen können mindestens vier Phasenvarianten in einem zellfreien Nukleinsäuremolekül nachgewiesen werden. In einigen Fällen können mindestens fünf oder mehr Phasenvarianten in einem zellfreien Nukleinsäuremolekül nachgewiesen werden. In einigen Fällen gilt: Je mehr Phasenvarianten auf einem zellfreien Nukleinsäuremolekül nachgewiesen werden, desto größer ist die Wahrscheinlichkeit, dass das zellfreie Nukleinsäuremolekül von Krebs abgeleitet ist, im Gegensatz zum Nachweis einer harmlosen Sequenz somatischer Varianten, die durch die molekulare Aufbereitung der Sequenzbibliothek oder zufällige biologische Fehler entstehen. Dementsprechend kann die Wahrscheinlichkeit eines falsch-positiven Nachweises mit dem Nachweis von mehr Phasenvarianten innerhalb eines Moleküls sinken (wodurch z. B. die Spezifität des Nachweises erhöht wird).
In einigen Aspekten kann ein Ergebnis der zellfreien Nukleinsäure-Sequenzierung zum Nachweis analysiert werden, ob eine Insertion oder Deletion einer oder mehrerer Nukleobasen (d. h. Indel) in der zellfreien Nukleinsäureprobe, z. B. relativ zu einer Referenzgenomsequenz, vorliegt. Ohne an die Theorie gebunden sein zu wollen, kann das Vorhandensein von Indels in einem zellfreien Nukleinsäuremolekül (z. B. cfDNA) in einigen Fällen indikativ für eine Erkrankung eines Subjekts, z. B. eine Erkrankung wie Krebs, sein. In einigen Fällen kann eine genetische Variation als Ergebnis eines Indels als eine Variante oder Mutation behandelt werden, und somit können zwei Indels als zwei Phasenvarianten behandelt werden, wie hierin offenbart. In einigen Beispielen können innerhalb eines zellfreien Nukleinsäuremoleküls eine erste genetische Variation aus einer ersten Indel (eine erste Phasenvariante) und eine zweite genetische Variation aus einer zweiten Indel (eine zweite Phasenvariante) durch wenigstens 1 Nukleotid voneinander getrennt sein.
Innerhalb eines einzelnen zellfreien Nukleinsäuremoleküls (z. B. eines einzelnen cfDNA-Moleküls), wie hierin offenbart, kann eine erste Phasenvariante eine SNV und eine zweite Phasenvariante ein Teil eines anderen kleinen Nukleotidpolymorphismus sein, z. B. eine andere SNV oder ein Teil einer Multi-Nukleotid-Variante (MNV). Eine Multi-Nukleotid-Variante kann ein Cluster aus zwei oder mehr (z. B. mindestens 2, 3, 4, 5 oder mehr) benachbarten Varianten sein, die innerhalb desselben Strangs des Nukleinsäuremoleküls existieren. In einigen Fällen können die erste Phasenvariante und die zweite Phasenvariante Teile derselben MNV innerhalb des einzelnen zellfreien Nukleinsäuremoleküls sein. In einigen Fällen können die erste Phasenvariante und die zweite Phasenvariante von zwei verschiedenen MNV innerhalb des einzelnen zellfreien Nukleinsäuremoleküls stammen.
In einigen Aspekten kann ein statistisches Verfahren zur Berechnung der Wahrscheinlichkeit verwendet werden, dass nachgewiesene Phasenvarianten von einem Krebs stammen und nicht zufällig oder künstlich (z. B. aufgrund von Probenvorbereitungs- oder Sequenzierungsfehlern) sind. In einigen Fällen kann ein Monte-Carlo-Probennahmeverfahren zur Bestimmung der Wahrscheinlichkeit verwendet werden, dass nachgewiesene Phasenvarianten von einem Krebs stammen und nicht zufällig oder künstlich sind.
Aspekte der vorliegenden Offenbarung ermöglichen die Identifizierung oder den Nachweis zellfreier Nukleinsäuren (z. B. cfDNA-Moleküle) mit einer Vielzahl von Phasenvarianten, z. B. aus einer Flüssigbiopsie eines Subjekts. In einigen Fällen können eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten direkt nebeneinander liegen (z. B. benachbarte SNV). In einigen Fällen können eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt sein. Der Abstand zwischen der ersten Phasenvariante und der zweiten Phasenvariante kann durch die Länge des zellfreien Nukleinsäuremoleküls begrenzt sein.
Innerhalb eines einzelnen zellfreien Nukleinsäuremoleküls (z. B. eines einzelnen cfDNA-Moleküls), wie hierin offenbart, können eine erste Phasenvariante und eine zweite Phasenvariante durch wenigstens oder bis zu etwa 1 Nukleotid, wenigstens oder bis zu etwa 2 Nukleotide, wenigstens oder bis zu etwa 3 Nukleotide, wenigstens oder bis zu etwa 4 Nukleotide, wenigstens oder bis zu etwa 5 Nukleotide, wenigstens oder bis zu etwa 6 Nukleotide, wenigstens oder bis zu etwa 7 Nukleotide, wenigstens oder bis zu etwa 8 Nukleotide, wenigstens oder bis zu etwa 9 Nukleotide, wenigstens oder bis zu etwa 10 Nukleotide, wenigstens oder bis zu etwa 11 Nukleotide, wenigstens oder bis zu etwa 12 Nukleotide, wenigstens oder bis zu etwa 13 Nukleotide, wenigstens oder bis zu etwa 14 Nukleotide, wenigstens oder bis zu etwa 15 Nukleotide, wenigstens oder bis zu etwa 20 Nukleotide, wenigstens oder bis zu etwa 25 Nukleotide, wenigstens oder bis zu etwa 30 Nukleotide, wenigstens oder bis zu etwa 35 Nukleotide, wenigstens oder bis zu etwa 40 Nukleotide, wenigstens oder bis zu etwa 45 Nukleotide, wenigstens oder bis zu etwa 50 Nukleotide, wenigstens oder bis zu etwa 60 Nukleotide, wenigstens oder bis zu etwa 70 Nukleotide, wenigstens oder bis zu etwa 80 Nukleotide, wenigstens oder bis zu etwa 90 Nukleotide, wenigstens oder bis zu etwa 100 Nukleotide, wenigstens oder bis zu etwa 110 Nukleotide, wenigstens oder bis zu etwa 120 Nukleotide, wenigstens oder bis zu etwa 130 Nukleotide, wenigstens oder bis zu etwa 140 Nukleotide, wenigstens oder bis zu etwa 150 Nukleotide, wenigstens oder bis zu etwa 160 Nukleotide, wenigstens oder bis zu etwa 170 Nukleotide, oder wenigstens oder bis zu etwa 180 Nukleotide voneinander getrennt sein. Alternativ oder zusätzlich dazu können oder müssen innerhalb eines einzigen zellfreien Nukleinsäuremoleküls eine erste Phasenvariante und eine zweite Phasenvariante nicht durch ein oder mehrere Nukleotide getrennt sein und können somit direkt nebeneinander liegen.
Ein einzelnes zellfreies Nukleinsäuremolekül (z. B, ein einzelnes cfDNA-Molekül), wie hierin offenbart, kann wenigstens oder bis zu etwa 2 Phasenvarianten, wenigstens oder bis zu etwa 3 Phasenvarianten, wenigstens oder bis zu etwa 4 Phasenvarianten, wenigstens oder bis zu etwa 5 Phasenvarianten, wenigstens oder bis zu etwa 6 Phasenvarianten, wenigstens oder bis zu etwa 7 Phasenvarianten, wenigstens oder bis zu etwa 8 Phasenvarianten, wenigstens oder bis zu etwa 9 Phasenvarianten, wenigstens oder bis zu etwa 10 Phasenvarianten, wenigstens oder bis zu etwa 12 Phasenvarianten, wenigstens oder bis zu etwa 12 Phasenvarianten, wenigstens oder bis zu etwa 13 Phasenvarianten, wenigstens oder bis zu etwa 14 Phasenvarianten, wenigstens oder bis zu etwa 15 Phasenvarianten, wenigstens oder bis zu etwa 20 Phasenvarianten, oder wenigstens oder bis zu etwa 25 Phasenvarianten innerhalb desselben Moleküls umfassen.
Aus einer Vielzahl von (z. B. aus einer Flüssigbiopsie eines Subjekts) erlangten zellfreien Nukleinsäuremolekülen können zwei oder mehr (z. B. 10 oder mehr, 1.000 oder mehr, 10.000 oder mehr) zellfreie Nukleinsäuremoleküle als im Durchschnitt wenigstens oder bis zu etwa 2 Phasenvarianten, wenigstens oder bis zu etwa 3 Phasenvarianten, wenigstens oder bis zu etwa 4 Phasenvarianten, wenigstens oder bis zu etwa 5 Phasenvarianten, wenigstens oder bis zu etwa 6 Phasenvarianten, wenigstens oder bis zu etwa 7 Phasenvarianten, wenigstens oder bis zu etwa 8 Phasenvarianten, wenigstens oder bis zu etwa 9 Phasenvarianten, wenigsten oder bis zu etwa 10 Phasenvarianten, wenigstens oder bis zu etwa 12 Phasenvarianten, wenigstens oder bis zu etwa 12 Phasenvarianten, wenigstens oder bis zu etwa 13 Phasenvarianten, wenigstens oder bis zu etwa 14 Phasenvarianten, wenigstens oder bis zu etwa 15 Phasenvarianten, wenigstens oder bis zu etwa 20 Phasenvarianten oder wenigstens oder bis zu etwa 25 Phasenvarianten pro zellfreiem Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten identifiziert wurde, aufweisend identifiziert werden.
In einigen Fällen kann eine Vielzahl zellfreier Nukleinsäuremoleküle (z. B. cfDNA-Moleküle) aus einer biologischen Probe eines Subjekts (z. B. eines soliden Tumors oder einer Flüssigbiopsie) erlangt werden. Aus der Vielzahl zellfreier Nukleinsäuremoleküle können wenigstens oder bis zu 1, wenigstens oder bis zu 2, wenigstens oder bis zu 3, wenigstens oder bis zu 4, wenigstens oder bis zu 5, wenigstens oder bis zu 6, wenigstens oder bis zu 7, wenigstens oder bis zu 8, wenigstens oder bis zu 9, wenigstens oder bis zu 10, wenigstens oder bis zu 15, wenigstens oder bis zu 20, wenigstens oder bis zu 25, wenigstens oder bis zu 30, wenigstens oder bis zu 35, wenigstens oder bis zu 40, wenigstens oder bis zu 45, wenigstens oder bis zu 50, wenigstens oder bis zu 60, wenigstens oder bis zu 70, wenigstens oder bis zu 80, wenigstens oder bis zu 90, wenigstens oder bis zu 100, wenigstens oder bis zu 150, wenigstens oder bis zu 200, wenigstens oder bis zu 300, wenigstens oder bis zu 400, wenigstens oder bis zu 500, wenigstens oder bis zu 600, wenigstens oder bis zu 700, wenigstens oder bis zu 800, wenigstens oder bis zu 900, wenigstens oder bis zu 1.000, wenigstens oder bis zu 5.000, wenigstens oder bis zu 10.000, wenigstens oder bis zu 50.000 oder wenigstens oder bis zu 100.000 zellfreie Nukleinsäuremoleküle identifiziert werden, sodass jedes identifizierte zellfreie Nukleinsäuremolekül die Vielzahl von Phasenvarianten umfasst, wie hierin offenbart.
In einigen Fällen kann eine Vielzahl zellfreier Nukleinsäuremoleküle (z. B. cfDNA-Moleküle) aus einer biologischen Probe eines Subjekts (z. B. eines soliden Tumors oder einer Flüssigbiopsie) erlangt werden. Aus der Vielzahl zellfreier Nukleinsäuremoleküle können wenigstens oder bis zu 1, wenigstens oder bis zu 2, wenigstens oder bis zu 3, wenigstens oder bis zu 4, wenigstens oder bis zu 5, wenigstens oder bis zu 6, wenigstens oder bis zu 7, wenigstens oder bis zu 8, wenigstens oder bis zu 9, wenigstens oder bis zu 10, wenigstens oder bis zu 15, wenigstens oder bis zu 20, wenigstens oder bis zu 25, wenigstens oder bis zu 30, wenigstens oder bis zu 35, wenigstens oder bis zu 40, wenigstens oder bis zu 45, wenigstens oder bis zu 50, wenigstens oder bis zu 60, wenigstens oder bis zu 70, wenigstens oder bis zu 80, wenigstens oder bis zu 90, wenigstens oder bis zu 100, wenigstens oder bis zu 150, wenigstens oder bis zu 200, wenigstens oder bis zu 300, wenigstens oder bis zu 400, wenigstens oder bis zu 500, wenigstens oder bis zu 600, wenigstens oder bis zu 700, wenigstens oder bis zu 800, wenigstens oder bis zu 900 oder wenigstens oder bis zu 1.000 zellfreie Nukleinsäuremoleküle aus einem Ziel-Genombereich (z. B. einem genomischen Ziellocus) identifiziert werden, sodass jedes identifizierte zellfreie Nukleinsäuremolekül die Vielzahl von Phasenvarianten umfasst, wie hierin offenbart.
1A und 1E illustrieren schematisch Beispiele für (i) ein cfDNA-Molekül mit einer SNV und (ii) ein anderes cfDNA-Molekül mit einer Vielzahl von Phasenvarianten. Jede in der cfDNA identifizierte Variante kann auf das Vorhandensein einer weiteren genetischen Mutation in der Zelle hinweisen, aus der die cfNDA stammt. In alternativen Ausführungsformen kann es sich bei einer oder mehreren der Phasenvarianten um eine Insertion oder Deletion (Indel) anstelle einer SNV handeln.
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Bestimmung einer Erkrankung eines Subjekt vor, wie dargestellt im Ablaufdiagramm 2510 in 25A. Das Verfahren kann umfassen: (a) Gewinnung von Sequenzierungsdaten, die von einer Vielzahl von von dem Subjekt erlangten oder abgeleiteten zellfreien Nukleinsäuremolekülen abgeleitet sind, durch ein Computersystem (Prozess 2512). Das Verfahren kann ferner (b) die Verarbeitung der Sequenzierungsdaten durch das Computersystem zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle umfassen, wobei jedes der einen oder mehreren identifizierten zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst (Verfahren 2514). In einigen Fällen kann wenigstens ein Teil der ein oder mehreren zellfreien Nukleinsäuremoleküle eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten umfassen, die durch wenigstens ein Nukleotid getrennt sind, wie hierin offenbart. Das Verfahren kann optional (c) die Analyse wenigstens eines Teils der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle durch das Computersystem zur Bestimmung der Erkrankung des Subjekts umfassen (Prozess 2516).
In einigen Fällen können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 %, wenigstens oder bis zu etwa 50 %, wenigstens oder bis zu etwa 60 %, wenigstens oder bis zu etwa 70 %, wenigstens oder bis zu etwa 80 %, wenigstens oder bis zu etwa 90 %, wenigstens oder bis zu etwa 95 %, wenigstens oder bis zu etwa 99 % oder etwa 100 % des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten umfassen, die durch wenigstens ein Nukleotid getrennt sind, wie hierin offenbart. In einigen Beispielen kann eine Vielzahl von Phasenvarianten innerhalb eines einzelnen cfDNA-Moleküls (i) eine erste Vielzahl von Phasenvarianten, die durch wenigstens ein Nukleotid voneinander getrennt sind, und (ii) eine zweite Vielzahl von Phasenvarianten, die nebeneinander liegen (z. B. zwei Phasenvarianten innerhalb einer MNV), umfassen. In einigen Beispielen kann eine Vielzahl von Phasenvarianten innerhalb eines einzelnen cfDNA-Moleküls aus Phasenvarianten bestehen, die durch wenigstens ein Nukleotid voneinander getrennt sind.
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Bestimmung einer Erkrankung eines Subjekts vor, wie dargestellt im Ablaufdiagramm 2520 in 25B. Das Verfahren kann umfassen: (a) Gewinnung von Sequenzierungsdaten, die von einer Vielzahl von von einem Subjekt erlangten oder abgeleiteten zellfreien Nukleinsäuremolekülen abgeleitet sind, durch ein Computersystem (Prozess 2522). Das Verfahren kann ferner (b) die Verarbeitung der Sequenzierungsdaten durch das Computersystem zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle umfassen, wobei jedes der einen oder mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst (Verfahren 2524). In einigen Fällen kann eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt sein, wie hierin offenbart. Das Verfahren kann optional (c) die Analyse wenigstens eines Teils der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle durch das Computersystem zur Bestimmung der Erkrankung des Subjekts umfassen (Prozess 2526).
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Bestimmung einer Erkrankung eines Subjekts vor, wie im Ablaufdiagramm 2530 in 25C dargestellt. Das Verfahren kann (a) Gewinnung von Sequenzierungsdaten, die von einer Vielzahl von von dem Subjekt erlangten oder abgeleiteten zellfreien Nukleinsäuremolekülen abgeleitet sind, durch ein Computersystem umfassen (Prozess 2532). Das Verfahren kann ferner (b) die Verarbeitung der Sequenzierungsdaten zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle mit einer LOD von weniger als etwa 1 aus 50.000 Beobachtungen (oder zellfreien Nukleinsäuremolekülen) aus den Sequenzierungsdaten umfassen (Prozess 2534). In einigen Fällen umfasst jedes der ein oder mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz. Das Verfahren kann optional (c) die Analyse wenigstens eines Teils der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle zur Bestimmung der Erkrankung des Subjekts umfassen (Prozess 2536).
In einigen Fällen kann die LOD des Vorgangs der Identifizierung des einen oder der mehreren zellfreien Nukleinsäuremoleküle, wie hierin offenbart, weniger als etwa 1 aus 60.000, weniger als 1 aus 70.000, weniger als 10 aus 80.000, weniger als 1 aus 90.000, weniger als 1 aus 100.000, weniger als 1 aus 150.000, weniger als 1 aus 200.000, weniger als 1 aus 300.000, weniger als 1 aus 400.000, weniger als 1 aus 500.000, weniger als 1 aus 600.000, weniger als 1 aus 700.000, weniger als 1 aus 800.000, weniger als 1 aus 900.000, weniger als 1 aus 1.000.000, weniger als 1 aus 1.000.000, weniger als 1 aus 1.100.000, weniger als 1 aus 1.200.000, weniger als 1 aus 1.300.000, weniger als 1 aus 1.400.000, weniger als 1 aus 1.500.000 oder weniger als 1 aus 2.000.000 Beobachtungen aus den Sequenzierungsdaten betragen.
In einigen Fällen kann wenigstens ein zellfreies Nukleinsäuremolekül der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten umfassen, die durch wenigstens ein Nukleotid getrennt sind, wie hierin offenbart.
In einigen Fällen können eine oder mehrere der Vorgänge (a) bis (c) des gegenständlichen Verfahrens von einem Computersystem durchgeführt werden. In einem Beispiel können alle Vorgänge (a) bis (c) des gegenständlichen Verfahrens durch das Computersystem ausgeführt werden.
Die Sequenzierungsdaten, wie sie hierin offenbart sind, können aus einem oder mehreren Sequenzierungsverfahren erlangt werden. Ein Sequenzierverfahren kann ein First-Generation-Sequenzierverfahren (z. B. Maxam-Gilbert-Sequenzierung, Sanger-Sequenzierung) sein. Ein Sequenzierungsverfahren kann ein Hochdurchsatz-Sequenzierungsverfahren sein, wie etwa die Next-Generation-Sequenzierung (NGS) (z. B. Sequenzierung durch Synthese). Ein Hochdurchsatz-Sequenzierungsverfahren kann gleichzeitig (oder im Wesentlichen gleichzeitig) wenigstens etwa 10.000, wenigstens etwa 100.000, wenigstens etwa 1 Million, wenigstens etwa 10 Millionen, wenigstens etwa 100 Millionen, wenigstens etwa 1 Milliarde oder mehr Polynukleotidmoleküle (z. B. zellfreie Nukleinsäuremoleküle oder Derivate davon) sequenzieren. NGS kann eine beliebige Anzahl von Sequenzierungstechnologien (z. B. Sequenzierungstechnologien der zweiten Generation, Sequenzierungstechnologien der dritten Generation, Sequenzierungstechnologien der vierten Generation, usw.) sein. Nicht einschränkende Beispiele für Hochdurchsatz-Sequenzierungsverfahren beinhalten die massiv-parallele Signatursequenzierung, die Polony-Sequenzierung, die Pyrosequenzierung, die Sequenzierung durch Synthese, die kombinatorische Sondenanker-Synthese (cPAS), die Sequenzierung durch Ligation (z. B., Sequenzierung durch Oligonukleotid-Ligation und Nachweis (SOLiD)), Halbleiter-Sequenzierung (z.B. Ion Torrent Halbleiter-Sequenzierung), DNA-Nanoball-Sequenzierung und Einzelmolekül-Sequenzierung, Sequenzierung durch Hybridisierung.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können die Sequenzierungsdaten basierend auf einem beliebigen der offenbarten Sequenzierungsverfahren, das eine Nukleinsäure-Amplifikation (z. B. Polymerase-Kettenreaktion (PCR)) verwendet, erlangt werden. Nicht einschränkende Beispiele für solche Sequenzierungsverfahren können die 454-Pyrosequenzierung, die Polony-Sequenzierung und die SoLiD-Sequenzierung beinhalten. In einigen Fällen können Amplikons (z. B. Derivate der Vielzahl zellfreier Nukleinsäuremoleküle, die, wie hierin offenbart, von dem Subjekt erlangt oder abgeleitet wurden), die einem Genombereich von Interesse (z. B. einem mit einer Krankheit assoziierten Genombereich) entsprechen, durch PCR erzeugt, optional gepoolt und anschließend sequenziert werden, um Sequenzierungsdaten zu erzeugen. Da die Bereiche von Interesse vor der Sequenzierung durch PCR zu Amplikons amplifiziert werden, ist die Nukleinsäureprobe in einigen Beispielen bereits für den Bereich von Interesse angereichert, so dass ein beliebiges zusätzliches Pooling (z. B. Hybridisierung) vor der Sequenzierung (z. B. nichthybridisierungsbasiertes NGS) nicht erforderlich ist. Alternativ kann ein Pooling durch Hybridisierung zur zusätzlichen Anreicherung vor der Sequenzierung durchgeführt werden. Alternativ können die Sequenzierungsdaten auch ohne Erzeugung von PCR-Kopien, z. B. durch cPAS-Sequenzierung, erlangt werden.
Eine Reihe von Ausführungsformen verwenden Erfassungshybridisierungstechniken zur Durchführung einer gezielten Sequenzierung. Zur Verbesserung der Auflösung bestimmter genomischer Loci können bei der Durchführung von Sequenzierungen mit zellfreien Nukleinsäuren die Produkte der Bibliothek vor der Sequenzierung durch Hybridisierung erfasst werden. Die Capture-Hybridisierung kann besonders nützlich bei dem Versuch des Nachweises seltener und/oder somatischer Phasenvarianten in einer Probe an bestimmten genomischen Loci sein. In einigen Situationen ist der Nachweis seltener und/oder somatischer Phasenvarianten indikativ für die Quelle der Nukleinsäuren, einschließlich der von einer Krebsquelle abgeleiteten Nukleinsäuren. Dementsprechend ist die Capture-Hybridisierung ein Werkzeug, das den Nachweis von zirkulierende Tumor-Nukleinsäure innerhalb zellfreier Nukleinsäuren verbessern kann.
Bei verschiedenen Krebsarten kommt es immer wieder zu einer aberranten somatischen Hypermutation an bestimmten genomischen Loci. Beispielsweise induziert die enzymaktivierungsinduzierte Deaminase eine aberrante somatische Hypermutation in B-Zellen, die zu verschiedenen B-Zell-Lymphomen, einschließlich (aber nicht beschränkt auf) das diffuse großzellige B-Zell-Lymphom (DLBCL), das follikuläre Lymphom (FL), das Burkitt-Lymphom (BL) und die chronische lymphatische B-Zell-Leukämie (CLL), führt. Dementsprechend sind in zahlreichen Ausführungsformen die Sonden zum Herunterziehen (Pull-Down) (oder zur Erfassung) genomischer Loci gestaltet, von denen bekannt ist, dass sie in einem Lymphom eine aberrante somatische Hypermutation aufweisen. 1D und Tabelle 1 beschreiben eine Reihe von Bereichen, die bei DLBCL, FL, BL und CLL eine aberrante somatische Hypermutation aufweisen. In Tabelle 6 ist eine Liste von Nukleinsäuresonden aufgeführt, die zum Herunterziehen (Pull-Down) (oder zur Erfassung) genomischer Loci verwendet werden können, um eine aberrante somatische Hypermutation bei B-Zell-Krebs nachzuweisen.
Die Erfassungssequenzierung kann auch unter Verwendung personalisierter Nukleinsäuresonden durchgeführt werden, die für den Nachweis der Krebserkrankung einer Person gestaltet wurden. Eine an Krebs erkrankte Person kann ihren Krebs biopsieren und sequenzieren lassen, um somatische Phasenvarianten nachzuweisen, die sich im Krebs angesammelt haben. Basierend auf dem Sequenzierungsergebnis werden gemäß einer Reihe von Ausführungsformen Nukleinsäuresonden gestaltet und synthetisiert, die zum Herunterziehen der genomischen Loci, einschließlich der Positionen der Phasenvarianten, geeignet sind. Diese personalisierten gestalteten und synthetisierten Nukleinsäuresonden können für den Nachweis von zirkulierenden Tumor-Nukleinsäuren aus einer Flüssigbiopsie des betreffenden Individuums verwendet werden. Dementsprechend können die personalisierten Nukleinsäuresonden für die Bestimmung des Therapieansprechens und/oder den Nachweis von MRD nach der Behandlung nützlich sein.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können die Sequenzierungsdaten basierend auf einem beliebigen, Adapter verwendenden Sequenzierungsverfahren erlangt werden. Nukleinsäureproben (z. B. die Vielzahl zellfreier Nukleinsäuremoleküle des Subjekts, wie hierin offenbart) können mit einem oder mehreren Adaptern (oder Adaptersequenzen) zur Erkennung (z. B. durch Hybridisierung) der Probe oder beliebiger Derivate davon (z. B. Amplikons) konjugiert werden. In einigen Beispielen können die Nukleinsäureproben mit einem molekularen Barcode markiert werden, sodass jedes zellfreie Nukleinsäuremolekül der Vielzahl zellfreier Nukleinsäuremoleküle einen eindeutigen Barcode aufweisen kann. Alternativ oder zusätzlich können die Nukleinsäureproben mit einem Probenbarcode markiert werden, sodass z. B. die Vielzahl zellfreier Nukleinsäuremoleküle des Subjekts (z. B. eine Vielzahl zellfreier Nukleinsäuremoleküle, die aus einem bestimmten Körpergewebe des Subjekts erlangt wurden) denselben Barcode aufweisen können.
In alternativen Ausführungsformen können die hierin offenbarten Verfahren zur Identifizierung eines oder mehrerer, die Vielzahl von Phasenvarianten umfassender zellfreier Nukleinsäuremoleküle ohne molekulare Barcodierung, ohne Probenbarcodierung oder ohne molekulare Barcodierung und Probenbarcodierung durchgeführt werden, zumindest teilweise aufgrund der hohen Spezifität und der niedrigen LOD, die durch das Vertrauen auf die Identifizierung der Phasenvarianten im Gegensatz z. B. zu einer einzelnen SNV erreicht wird.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können die Sequenzierungsdaten ohne In silico-Entfernung oder -Unterdrückung von (i) Hintergrundfehlern und/oder (ii) Sequenzierungsfehlern erlangt und analysiert werden, was wenigstens teilweise auf die hohe Spezifität und die niedrige LOD, die durch das Vertrauen auf die Identifizierung der Phasenvarianten im Gegensatz zu z. B. einer einzelnen SNV oder Indel erreicht wird, zurückzuführen ist.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Verwendung der Vielzahl von Varianten als Bedingung für die Identifizierung gezielter zellfreier Nukleinsäuremoleküle mit spezifischen Mutationen von Interesse ohne In silico-Verfahren zur Fehlerunterdrückung eine Hintergrundfehlerrate ergeben, m wenigstens etwa das 5-fache, wenigstens etwa das 10-fache, wenigstens etwa das 20-fache, wenigstens etwa das 30-fache, wenigstens etwa das 40-fache, wenigstens etwa das 50-fache, wenigstens etwa das 60-fache, wenigstens etwa das 70-fache, wenigstens etwa das 80-fache, wenigstens etwa das 90-fache, wenigstens etwa das 100-fache, wenigstens etwa das 200-fache, wenigstens etwa das 400-fache, wenigstens etwa das 600-fache, wenigstens etwa das 800-fache oder wenigstens etwa das 1.000-fache niedriger ist als die der (i) Barcode-Deduplikation, (ii) integrierten digitalen Fehlerunterdrückung oder (iii) Duplex-Sequenzierung, Dieser Ansatz kann vorteilhaft das Signal-Rausch-Verhältnis (und damit die Sensitivität und/oder Spezifität) bei der Identifizierung gezielter zellfreier Nukleinsäuremoleküle mit bestimmten Mutationen von Interesse erhöhen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Erhöhung einer Mindestanzahl von Phasenvarianten (z. B. Erhöhung von wenigstens zwei Phasenvarianten auf wenigstens drei Phasenvarianten) pro zellfreiem Nukleinsäuremolekül, die als Bedingung für die Identifizierung zellfreier Nukleinsäuremoleküle mit spezifischen Mutationen von Interesse erforderlich ist, die Hintergrundfehlerrate um wenigstens etwa das 5-Fache, um wenigstens das 10-fache, um wenigstens das 20-fache, um wenigstens das 30-fache, um wenigstens das 40-fache, um wenigstens das 50-fache, um wenigstens das 60-fache, um wenigstens das 70-fache, um wenigstens das 80-fache, um wenigstens das 90-fache oder um wenigstens das 100-fache reduzieren. Dieser Ansatz kann vorteilhaft das Signal-Rausch-Verhältnis (und damit die Sensitivität und/oder Spezifität) bei der Identifizierung gezielter zellfreier Nukleinsäuremoleküle mit bestimmten Mutationen von Interesse erhöhen.
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Behandlung einer Erkrankung eines Subjekts vor, wie im Ablaufdiagramm 2540 in 25D dargestellt. Das Verfahren kann (a) die Identifizierung des Subjekts für die Behandlung der Erkrankung umfassen, wobei das Subjekt basierend auf der Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus einer Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet wurden, als an der Erkrankung leidend bestimmt wurde (Prozess 2542). Jedes des oder der identifizierten zellfreien Nukleinsäuremoleküle kann eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfassen. Wenigstens ein Teil (z. B. ein Teil oder alle) der Vielzahl von Phasenvarianten kann durch wenigstens ein Nukleotid getrennt sein, so dass eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt sind, wie hierin offenbart. In einigen Fällen ist ein Vorhandensein der Vielzahl von Phasenvarianten indikativ für die Erkrankung (z. B. eine Erkrankung, wie Krebs) des Subjekts. Das Verfahren kann ferner umfassen: (b) Unterziehen des Subjekts der Behandlung basierend auf Schritt (a) (Prozess 2544). Beispiele für eine solche Behandlung der Erkrankung des Subjekts sind an anderer Stelle in der vorliegenden Offenbarung offenbart.
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Überwachung eines Verlaufs (z. B. Progression oder Regression) einer Erkrankung eines Subjekts vor, wie in Ablaufdiagramm 2550 in 25E dargestellt. Das Verfahren kann (a) die Bestimmung eines ersten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines ersten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer ersten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden, umfassen (Prozess 2552). Das Verfahren kann ferner (b) die Bestimmung eines zweiten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines zweiten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer zweiten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden, umfassen (Prozess 2554). Die zweite Vielzahl von zellfreien Nukleinsäuremolekülen kann von dem Subjekt im Anschluss an die Gewinnung der ersten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt werden. Das Verfahren kann optional (c) die Bestimmung des Verlaufs (z. B. Progression oder Regression) der Erkrankung basierend zumindest teilweise auf dem ersten Stadium der Erkrankung und dem zweiten Stadium der Erkrankung umfassen (Prozess 2556). In einigen Fällen kann jedes des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle (z. B. jedes des ersten Satzes eines oder mehrerer identifizierter zellfreier Nukleinsäuremoleküle, jedes des zweiten Satzes eines oder mehrerer identifizierter zellfreier Nukleinsäuremoleküle) eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfassen. Wenigstens ein Teil (z. B. ein Teil oder alle) des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle kann, wie hierin offenbart, durch wenigstens ein Nukleotid getrennt sein. In einigen Fällen kann ein Vorhandensein der Vielzahl von Phasenvarianten indikativ für das Stadium der Erkrankung des Subjekts sein
In einigen Fällen kann die erste Vielzahl zellfreier Nukleinsäuremoleküle von dem Subjekt erlangt (z. B. durch eine Blutbiopsie) und analysiert werden, um ein erstes Stadium der Erkrankung (z. B. eine Erkrankung, wie Krebs) des Subjekts zu bestimmen (z. B. zu diagnostizieren). Die erste Vielzahl zellfreier Nukleinsäuremoleküle kann mit einem beliebigen der hierin offenbarten Verfahren (z. B. mit oder ohne Sequenzierung) analysiert werden, um den ersten Satz eines oder mehrerer die Vielzahl von Phasenvarianten umfassender zellfreier Nukleinsäuremoleküle zu identifizieren, und das Vorhandensein oder die Merkmale des ersten Satzes eines oder mehrerer zellfreier Nukleinsäuremoleküle können zur Bestimmung des ersten Stadiums der Erkrankung (z. B. einer ersten Diagnose) des Subjekts verwendet werden. Basierend auf dem ermittelten ersten Stadium der Erkrankung kann der Proband einer oder mehreren Behandlungen (z. B. Chemotherapie) unterzogen werden, wie hierin offenbart. Im Anschluss an die eine oder die mehreren Behandlungen kann die zweite Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt werden.
In einigen Fällen kann der Proband wenigstens oder bis zu etwa 1 Behandlung, wenigstens oder bis zu etwa 2 Behandlungen, wenigstens oder bis zu etwa 3 Behandlungen, wenigstens oder bis zu etwa 4 Behandlungen, wenigstens oder bis zu etwa 5 Behandlungen, wenigstens oder bis zu etwa 6 Behandlungen, wenigstens oder bis zu etwa 7 Behandlungen, wenigstens oder bis zu etwa 8 Behandlungen, wenigstens oder bis zu etwa 9 Behandlungen oder wenigstens oder bis zu etwa 10 Behandlungen basierend auf dem ermittelten ersten Stadium der Erkrankung unterzogen werden. In einigen Fällen kann der Proband basierend auf dem ermittelten ersten Stadium der Erkrankung einer Vielzahl von Behandlungen unterzogen werden, und eine erste Behandlung der Vielzahl von Behandlungen und eine zweite Behandlung der Vielzahl von Behandlungen können um wenigstens oder bis zu etwa 1 Tag, wenigstens oder bis zu etwa 7 Tage, wenigstens oder bis zu etwa 2 Wochen, wenigstens oder bis zu etwa 3 Wochen, wenigstens oder bis zu etwa 4 Wochen, wenigstens oder bis zu etwa 2 Monate, wenigstens oder bis zu etwa 3 Monate, wenigstens oder bis zu etwa 4 Monate, wenigstens oder bis zu etwa 5 Monate, wenigstens oder bis zu etwa 6 Monate, wenigstens oder bis zu etwa 12 Monate, wenigstens oder bis zu etwa 2 Jahre, wenigstens oder bis zu etwa 3 Jahre, wenigstens oder bis zu etwa 4 Jahre, wenigstens oder bis zu etwa 5 Jahre, oder wenigstens oder bis zu etwa 10 Jahre auseinander liegen. Die Vielzahl der Behandlungen für den Subjekt kann die gleiche sein. Alternativ kann sich die Vielzahl der Behandlungen durch die Art des Medikaments (z. B. verschiedene Chemotherapeutika), die Dosierung des Medikaments (z. B. Erhöhung der Dosierung, Verringerung der Dosierung), das Vorhandensein oder Fehlen eines Co-Therapeutikums (z. B. Chemotherapie und Immuntherapie), die Art der Verabreichung (z. B. intravenöse oder orale Verabreichung), die Häufigkeit der Verabreichung (z. B. täglich, wöchentlich, monatlich) usw. unterscheiden.
In einigen Fällen kann und muss der Proband zwischen der Bestimmung des ersten Stadiums der Erkrankung und der Bestimmung des zweiten Stadiums der Erkrankung nicht gegen die Erkrankung behandelt werden. Zum Beispiel kann die zweite Vielzahl zellfreier Nukleinsäuremoleküle ohne eine beliebige Behandlung von dem Subjekt erlangt werden (z. B. durch eine Flüssigbiopsie), um zu bestätigen, ob der Proband immer noch Anzeichen für das erste Stadium der Erkrankung aufweist.
In einigen Fällen kann die zweite Vielzahl zellfreier Nukleinsäuremoleküle von dem Subjekt (z. B, mittels Blutbiopsie) wenigstens oder bis zu etwa 1 Tag, wenigstens oder bis zu etwa 7 Tage, wenigstens oder bis zu etwa 2 Wochen, wenigstens oder bis zu etwa 3 Wochen, wenigstens oder bis zu etwa 4 Wochen, wenigstens oder bis zu etwa 2 Monate, wenigstens oder bis zu etwa 3 Monate, wenigstens oder bis zu etwa 4 Monate ,wenigstens oder etwa 5 Monate, wenigstens oder bis zu etwa 6 Monate, wenigstens oder bis zu etwa 12 Monate, wenigstens oder bis zu etwa 2 Jahre, wenigstens oder bis zu etwa 3 Jahre, wenigstens oder bis zu etwa 4 Jahre, wenigstens oder bis zu etwa 5 Jahre oder wenigstens oder bis zu etwa 10 Jahre nach dem Gewinnen der ersten Vielzahl zellfreier Nukleinsäuremoleküle von dem Subjekt erlangt werden.
In einigen Fällen können wenigstens oder bis zu etwa 2, wenigstens oder bis zu etwa 3, wenigstens oder bis zu etwa 4, wenigstens oder bis zu etwa 5, wenigstens oder bis zu etwa 6, wenigstens oder bis zu etwa 7, wenigstens oder bis zu etwa 8, wenigstens oder bis zu etwa 9 oder wenigstens oder bis zu etwa 10 verschiedene Proben, umfassend eine Vielzahl von Nukleinsäuremolekülen (z. B. wenigstens die erste Vielzahl zellfreier Nukleinsäuremoleküle und die zweite Vielzahl zellfreier Nukleinsäuremoleküle), im Laufe der Zeit (z. B. einmal pro Monat für 6 Monate, einmal alle zwei Monate für ein Jahr, einmal alle drei Monate für ein Jahr, einmal alle 6 Monate für ein oder mehrere Jahre, usw.) erlangt werden, um den Verlauf der Erkrankung des Subjekts zu beobachten, wie hierin offenbart.
In einigen Fällen kann der Schritt der Bestimmung des Verlaufs der Erkrankung basierend auf dem ersten Stadium der Erkrankung und dem zweiten Stadium der Erkrankung den Vergleich eines oder mehrerer Merkmale des ersten Stadiums und des zweiten Stadiums der Erkrankung umfassen, wie beispielsweise (i) eine Gesamtzahl zellfreier Nukleinsäuremoleküle, die als die Vielzahl von Phasenvarianten in jedem Stadium umfassend identifiziert wurden (z. B. pro gleichem Gewicht oder Volumen der biologischen Ausgangsprobe, pro gleicher Anzahl von anfänglich analysierten zellfreien Nukleinsäuremolekülen usw.), (ii) eine durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro zellfreiem Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten umfassend identifiziert wurde (d. h. zwei oder mehr Phasenvarianten), oder (iii) eine Anzahl zellfreier Nukleinsäuremoleküle, die als die Vielzahl von Phasenvarianten umfassend identifiziert wurden, geteilt durch eine Gesamtzahl zellfreier Nukleinsäuremoleküle, die eine Mutation umfassen, die sich mit einigen der Vielzahl von Phasenvarianten überschneidet (d. h. Allelfrequenz der Phasenvariante). Basierend auf einem solchen Vergleich kann die MRD der Erkrankung (z. B. Krebs oder Tumor) des Subjekts bestimmt werden. Basierend auf einem solchen Vergleich kann zum Beispiel die Tumor- oder Krebsbelastung des Subjekts ermittelt werden.
In einigen Fällen kann der Verlauf der Erkrankung eine Progression oder Verschlimmerung der Erkrankung sein. In einem Beispiel kann die Verschlimmerung der Erkrankung die Entwicklung einer Krebserkrankung von einem früheren Stadium zu einem späteren Stadium umfassen, wie etwa von Krebs im Stadium I zu Krebs im Stadium III. In einem anderen Beispiel kann die Verschlimmerung der Erkrankung eine Vergrößerung (z. B. des Volumens) eines soliden Tumors umfassen. In noch einem anderen Beispiel kann die Verschlimmerung der Erkrankung darin bestehen, dass sich Krebsmetastasen von einer Stelle zu einer anderen Stelle im Körper des Subjekts ausbreiten.
In einigen Beispielen kann (i) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem zweiten Stadium der Erkrankung des Subjekts umfassend identifiziert wurden, um wenigstens oder bis zu etwa das 0,1-fache, wenigstens oder bis zu etwa 0,2-fache, wenigstens oder bis zu etwa 0,3-fache, wenigstens oder bis zu etwa 0,4-fache, wenigstens oder bis zu etwa 0,5-fache, wenigstens oder bis zu etwa 0,6-fache, wenigstens oder bis zu etwa 0,7-fache, wenigstens oder bis zu etwa 0,8-fache, wenigstens oder bis zu etwa 0,9-fache, wenigstens oder bis zu etwa 1-fache, wenigstens oder bis zu etwa 2-fache, wenigstens oder bis zu etwa 3-fache, wenigstens oder bis zu etwa 4-fache, wenigstens oder bis zu etwa 5-fache, wenigstens oder bis zu etwa 6-fache, wenigstens oder bis zu etwa 7-fache, wenigstens oder bis zu etwa 8-fache, wenigstens oder bis zu etwa 9-fache, wenigstens oder bis zu etwa 10-fache, wenigstens oder bis zu etwa 15-fache, wenigstens oder bis zu etwa 20-fache, wenigstens oder bis zu etwa 30-fache, wenigstens oder bis zu etwa 40-fache, wenigstens oder bis zu etwa 50-fache, wenigstens oder bis zu etwa 60-fache, wenigstens oder bis zu etwa 70-fache, wenigstens oder bis zu etwa 80-fache, wenigstens oder bis zu etwa 90-fache, wenigstens oder bis zu etwa 100-fache, wenigstens oder bis zu etwa 200-fache, wenigstens oder bis zu etwa 300-fache, wenigstens oder bis zu etwa 400-fache, oder wenigstens oder bis zu etwa 500-fache höher sein als (ii) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem ersten Stadium der Erkrankung des Subjekts umfassend identifiziert wurden.
In einigen Beispielen kann (i) die durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem zweiten Stadium der Erkrankung des Subjekts umfassend identifiziert wurde, um wenigstens oder bis zu etwa das 0,1-fache, wenigstens oder bis zu etwa 0,2-fache, wenigstens oder bis zu etwa 0,3-fache, wenigstens oder bis zu etwa 0,4-fache, wenigstens oder bis zu etwa 0,5-fache, wenigstens oder bis zu etwa 0,6-fache, wenigstens oder bis zu etwa 0,7-fache, wenigstens oder bis zu etwa 0,8-fache, wenigstens oder bis zu etwa 0,9-fache, wenigstens oder bis zu etwa 1-fache, wenigstens oder bis zu etwa 2-fache, wenigstens oder bis zu etwa 3-fache, wenigstens oder bis zu etwa 4-fache, wenigstens oder bis zu etwa 5-fache, wenigstens oder bis zu etwa 6-fache, wenigstens oder bis zu etwa 7-fache, wenigstens oder bis zu etwa 8-fache, wenigstens oder bis zu etwa 9-fache, wenigstens oder bis zu etwa 10-fache, wenigstens oder bis zu etwa 15-fache, wenigstens oder bis zu etwa 20-fache, wenigstens oder bis zu etwa 30-fache, wenigstens oder bis zu etwa 40-fache, wenigstens oder bis zu etwa 50-fache, wenigstens oder bis zu etwa 60-fache, wenigstens oder bis zu etwa 70-fache, wenigstens oder bis zu etwa 80-fache, wenigstens oder bis zu etwa 90-fache, wenigstens oder bis zu etwa 100-fache, wenigstens oder bis zu etwa 200-fache, wenigstens oder bis zu etwa 300-fache, wenigstens oder bis zu etwa 400-fache, oder wenigstens oder bis zu etwa 500-fache höher sein als (ii) die durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem ersten Stadium der Erkrankung des Subjekts umfassend identifiziert wurde.
In einigen Fällen kann der Verlauf der Erkrankung eine Regression oder zumindest eine teilweise Remission der Erkrankung sein. In einem Beispiel kann die zumindest teilweise Remission der Erkrankung ein Downstaging einer Krebserkrankung von einem späteren Stadium in ein früheres Stadium, beispielsweise von einem Krebs im Stadium IV zu einem Krebs im Stadium II, umfassen. Alternativ kann es sich bei der zumindest teilweisen Remission der Erkrankung auch um eine vollständige Remission der Krebserkrankung handeln. In einem anderen Beispiel kann die zumindest teilweise Remission der Erkrankung eine Verringerung der Größe (z. B. des Volumens) eines soliden Tumors umfassen.
In einigen Beispielen kann (i) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem zweiten Stadium der Erkrankung des Subjekts umfassend identifiziert wurden, um wenigstens oder bis zu etwa das 0,1-fache, wenigstens oder bis zu etwa 0,2-fache, wenigstens oder bis zu etwa 0,3-fache, wenigstens oder bis zu etwa 0,4-fache, wenigstens oder bis zu etwa 0,5-fache, wenigstens oder bis zu etwa 0,6-fache, wenigstens oder bis zu etwa 0,7-fache, wenigstens oder bis zu etwa 0,8-fache, wenigstens oder bis zu etwa 0,9-fache, wenigstens oder bis zu etwa 1-fache, wenigstens oder bis zu etwa 2-fache, wenigstens oder bis zu etwa 3-fache, wenigstens oder bis zu etwa 4-fache, wenigstens oder bis zu etwa 5-fache, wenigstens oder bis zu etwa 6-fache, wenigstens oder bis zu etwa 7-fache, wenigstens oder bis zu etwa 8-fache, wenigstens oder bis zu etwa 9-fache, wenigstens oder bis zu etwa 10-fache, wenigstens oder bis zu etwa 15-fache, wenigstens oder bis zu etwa 20-fache, wenigstens oder bis zu etwa 30-fache, wenigstens oder bis zu etwa 40-fache, wenigstens oder bis zu etwa 50-fache, wenigstens oder bis zu etwa 60-fache, wenigstens oder bis zu etwa 70-fache, wenigstens oder bis zu etwa 80-fache, wenigstens oder bis zu etwa 90-fache, wenigstens oder bis zu etwa 100-fache, wenigstens oder bis zu etwa 200-fache, wenigstens oder bis zu etwa 300-fache, wenigstens oder bis zu etwa 400-fache, oder wenigstens oder bis zu etwa 500-fache niedriger sein als (ii) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem ersten Stadium der Erkrankung des Subjekts umfassend identifiziert wurden.
In einigen Beispielen kann (i) die durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem zweiten Status der Erkrankung des Subjekts umfassend identifiziert wurde, um wenigstens oder bis zu etwa das 0,1-fache, wenigstens oder bis zu etwa 0,2-fache, wenigstens oder bis zu etwa 0,3-fache, wenigstens oder bis zu etwa 0,4-fache, wenigstens oder bis zu etwa 0,5-fache, wenigstens oder bis zu etwa 0,6-fache, wenigstens oder bis zu etwa 0,7-fache, wenigstens oder bis zu etwa 0,8-fache, wenigstens oder bis zu etwa 0,9-fache, wenigstens oder bis zu etwa 1-fache, wenigstens oder bis zu etwa 2-fache, wenigstens oder bis zu etwa 3-fache, wenigstens oder bis zu etwa 4-fache, wenigstens oder bis zu etwa 5-fache, wenigstens oder bis zu etwa 6-fache, wenigstens oder bis zu etwa 7-fache, wenigstens oder bis zu etwa 8-fache, wenigstens oder bis zu etwa 9-fache, wenigstens oder bis zu etwa 10-fache, wenigstens oder bis zu etwa 15-fache, wenigstens oder bis zu etwa 20-fache, wenigstens oder bis zu etwa 30-fache, wenigstens oder bis zu etwa 40-fache, wenigstens oder bis zu etwa 50-fache, wenigstens oder bis zu etwa 60-fache, wenigstens oder bis zu etwa 70-fache, wenigstens oder bis zu etwa 80-fache, wenigstens oder bis zu etwa 90-fache, wenigstens oder bis zu etwa 100-fache, wenigstens oder bis zu etwa 200-fache, wenigstens oder bis zu etwa 300-fache, wenigstens oder bis zu etwa 400-fache, oder wenigstens oder bis zu etwa 500-fache niedriger sein als (ii) die durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem ersten Status der Erkrankung des Subjekts umfassend identifiziert wurde.
In einigen Fällen kann der Verlauf der Erkrankung zwischen den beiden Stadien der Erkrankung des Subjekts im Wesentlichen gleich bleiben. In einigen Beispielen kann (i) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem zweiten Stadium der Erkrankung des Subjekts umfassen identifiziert wurden, etwa gleich sein wie (ii) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem ersten Stadium der Erkrankung des Subjekts umfassend identifiziert wurden. In einigen Beispielen kann (i) eine durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem zweiten Stadium der Erkrankung des Subjekts umfassend identifiziert wurde, etwa gleich sein wie (ii) eine durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem ersten Stadium der Erkrankung des Subjekts umfassend identifiziert wurde.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können das eine oder die mehreren zellfreien Nukleinsäuremoleküle, die die Vielzahl der Phasenvarianten umfassen, aus der Vielzahl der zellfreien Nukleinsäuremoleküle durch ein oder mehrere Sequenzierungsverfahren identifiziert werden. Alternativ oder zusätzlich können das eine oder die mehreren zellfreien Nukleinsäuremoleküle, die die Vielzahl der Phasenvarianten umfassen, durch Pull down von (oder Erfassung von) der Vielzahl der zellfreien Nukleinsäuremoleküle mit einem Satz von Nukleinsäuresonden identifiziert werden. Das Pull-Down-(oder Capture-)Verfahren über den Satz von Nukleinsäuresonden kann zur Identifizierung der einen oder mehreren zellfreien Nukleinsäuremoleküle von Interesse ohne Sequenzierung ausreichen. In einigen Fällen kann der Satz von Nukleinsäuresonden zur Hybridisierung mit wenigstens einem Teil zellfreier Nukleinsäuremoleküle (z. B. cfDNA-Moleküle) aus einem oder mehreren mit der Erkrankung des Subjekts assoziierten Genombereichen ausgelegt sein. Daher kann ein Vorhandensein eines oder mehrerer von den Nukleinsäuresonden heruntergezogener zellfreier Nukleinsäuremoleküle indikativ dafür sein, dass das eine oder die mehreren zellfreien Nukleinsäuremoleküle aus der Erkrankung (z .B. ctDNA oder ctRNA) abgeleitet sind. Weitere Einzelheiten zu dem Satz von Nukleinsonden sind an anderer Stelle der vorliegenden Offenbarung offenbart.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können, basierend auf den von dem Subjekt erlangten oder abgeleiteten Sequenzierungsdaten aus der Vielzahl zellfreier Nukleinsäuremoleküle (z. B. cfDNA), (i) das eine oder die mehreren zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten umfassend identifiziert wurden, in silico von (ii) einem oder mehreren anderen zellfreien Nukleinsäuremolekülen, die nicht als die Vielzahl der Phasenvarianten umfassend identifiziert wurden (oder einem oder mehreren anderen zellfreien Nukleinsäuremolekülen, die nicht die Vielzahl der Phasenvarianten umfassen), getrennt werden. In einigen Fällen kann das Verfahren ferner die Erzeugung zusätzlicher Daten umfassen, die Sequenzierungsinformationen nur für (i) das eine oder die mehreren zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten umfassend identifiziert wurden, umfassen. In einigen Fällen kann das Verfahren ferner die Erzeugung anderer Daten umfassen, die Sequenzierungsinformationen nur für (ii) das eine oder die mehreren anderen zellfreien Nukleinsäuremoleküle, die nicht als die Vielzahl von Phasenvarianten umfassend identifiziert wurden (oder das eine oder die mehreren anderen zellfreien Nukleinsäuremoleküle, die nicht die Vielzahl von Phasenvarianten umfassen) umfassen.
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Bestimmung einer Erkrankung eines Subjekts vor, wie im Ablaufdiagramm 2560 in 25F dargestellt. Das Verfahren kann umfassen: (a) Bereitstellen eines Gemischs, umfassend (1) einen Satz von Nukleinsäuresonden und (2) eine Vielzahl von von dem Subjekt erlangter oder abgeleiteter zellfreier Nukleinsäuremoleküle (Prozess 2562). In einigen Fällen kann eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatz zur Hybridisierung mit einem zellfreien Zielnukleinsäuremolekül gestaltet sein, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind. So können eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt sein, wie hierin offenbart. In einigen Fällen kann die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens enthalten. Das aktivierbare Reporteragens kann entweder durch (i) Hybridisierung der individuellen Nukleinsäuresonde mit der Vielzahl von Phasenvarianten oder (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die mit der Vielzahl von Phasenvarianten hybridisiert wurde, aktiviert werden. Das Verfahren kann ferner (b) den Nachweis des aktivierten Reporteragens zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle umfassen (Prozess 2564). Jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle kann die Vielzahl der Phasenvarianten umfassen. Das Verfahren kann optional (c) die Analyse wenigstens eines Teils der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle zur Bestimmung der Erkrankung des Subjekts umfassen (Prozess 2566).
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Bestimmung einer Erkrankung eines Subjekts vor, wie im Ablaufdiagramm 2570 in 25G dargestellt. Das Verfahren kann umfassen: (a) Bereitstellen eines Gemischs, umfassend (1) einen Satz von Nukleinsäuresonden und (2) eine Vielzahl von von dem Subjekt erlangter oder abgeleiteter zellfreier Nukleinsäuremoleküle (Prozess 2572). In einigen Fällen kann eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatz zur Hybridisierung mit einem zellfreien Zielnukleinsäuremolekül gestaltet sein, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst. In einigen Fällen kann die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens enthalten. Das aktivierbare Reporteragens kann entweder durch (i) Hybridisierung der individuellen Nukleinsäuresonde mit der Vielzahl von Phasenvarianten oder (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die mit der Vielzahl von Phasenvarianten hybridisiert wurde, aktiviert werden. Das Verfahren kann ferner (b) den Nachweis des aktivierten Reporteragens zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle umfassen (Prozess 2574). Jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle kann die Vielzahl der Phasenvarianten umfassen, und ein LOD des Identifizierungsschritts kann weniger als etwa 1 aus 50.000 zellfreien Nukleinsäuremolekülen der Vielzahl der zellfreien Nukleinsäuremoleküle betragen, wie hierin offenbart. Das Verfahren kann optional (c) die Analyse wenigstens eines Teils der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle zur Bestimmung der Erkrankung des Subjekts umfassen (Prozess 2576).
In einigen Fällen ist eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt, wie hierin offenbart.
In einigen Fällen kann die LOD des Schritts der Identifizierung des einen oder der mehreren zellfreien Nukleinsäuremoleküle, wie hierin offenbart, weniger als etwa 1 aus 60.000, weniger als 1 aus 70.000, weniger als 10 aus 80.000, weniger als 1 aus 90.000, weniger als 1 aus 100.000, weniger als 1 aus 150.000, weniger als 1 aus 200.000, weniger als 1 aus 300.000, weniger als 1 aus 400.000, weniger als 1 aus 500.000, weniger als 1 aus 600.000, weniger als 1 aus 700.000, weniger als 1 aus 800.000, weniger als 1 aus 900.000, weniger als 1 aus 1.000.000, weniger als 1 aus 1.000.000, weniger als 1 aus 1.100.000, weniger als 1 aus 1.200.000, weniger als 1 aus 1.300.000, weniger als 1 aus 1.400.000, weniger als 1 aus 1.500.000, weniger als 1 aus 2.000.000, weniger als 1 aus 2.500.000, weniger als 1 aus 3.000.000, weniger als 1 aus 4.000.000 oder weniger als 1 aus 5.000.000 zellfreie Nukleinsäuremoleküle der Vielzahl zellfreier Nukelinsäuremokelüle betragen. Im Allgemeinen hat ein Verfahren mit einer niedrigeren LOD eine höhere Empfindlichkeit für einen solchen Nachweis.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das Verfahren ferner das Mischen (1) des Satzes von Nukleinsäuresonden und (2) der Vielzahl von zellfreien Nukleinsäuremolekülen umfassen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das aktivierbare Reporteragens einer Nukleinsäuresonde bei der Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl der Phasenvarianten aktiviert werden. Nicht einschränkende Beispiele für solche Nukleinsäuresonden können einen molekularen Beacon (Signalortungsgerät), eine Eclipse-Sonde, eine Amplifluor-Sonde, einen Skorpion-PCR-Primer und einen fluorogenen PCR-Primer mit Licht nach Erweiterung (LUX-Primer) beinhalten.
Beispielsweise kann die Nukleinsäuresonde ein molekulare Beacon sein, wie in 26A dargestellt. Der molekulare Beacon kann eine fluoreszenzmarkierte (z. B. farbstoffmarkierte) Oligonukleotidsonde sein, die Komplementarität zu einem gezielten zellenfreien Nukleinsäuremolekül 2603 in einem Bereich aufweist, der die Vielzahl der Phasenvarianten umfasst. Der molekulare Beacon kann eine Länge zwischen etwa 25 Nukleotiden und etwa 50 Nukleotiden haben. Der molekulare Beacon kann auch gestaltet sein, um teilweise selbst-komplementär zu sein, sodass er eine Haarnadelstruktur mit einem Stamm 2601a und einer Schleife 2601b bildet. Die 5'- und 3'-Enden der molekularen Beacon-Sonde können komplementäre Sequenzen (z. B. etwa 5-6 Nukleotide) aufweisen, die die Stammstruktur 2601a bilden. Der Schleifenabschnitt 2601b der Haarnadel kann zur spezifischen Hybridisierung mit einem Abschnitt (z. B. etwa 15-30 Nukleotide) der Zielsequenz, die zwei oder mehr Phasenvarianten umfasst, gestaltet sein. Die Haarnadel kann zur Hybridisierung mit einem Abschnitt gestaltet sein, der wenigstens 2, 3, 4, 5 oder mehr Phasenvarianten umfasst. Ein fluoreszierendes Reportermolekül kann an das 5'-Ende der molekularen Beacon-Sonde gebunden sein und ein Quencher, der die Fluoreszenz des fluoreszierenden Reporters quencht, kann an das 3'-Ende der molekularen Beacon-Sonde gebunden sein. Die Bildung der Haarnadel kann daher den fluoreszierenden Reporter und den Quencher zusammenbringen, sodass keine Fluoreszenz emittiert wird. Während des Annealing-(Glüh-)Vorgangs der Amplifikationsreaktion der von einem Subjekt erlangten oder abgeleiteten Vielzahl zellfreier Nukleinsäuremoleküle kann der Schleifenabschnitt des molekularen Beacons jedoch an seine Zielsequenz binden, wodurch der Stamm denaturiert wird. Auf diese Weise können der Reporter und der Quencher getrennt werden, wodurch das Quenching aufgehoben wird und der fluoreszierende Reporter aktiviert und nachweisbar ist. Da die Fluoreszenz des fluoreszierenden Reporters nur dann von der molekularen Beacon-Sonde emittiert wird, wenn die Sonde an die Zielsequenz gebunden ist, kann die Menge oder der Grad der nachgewiesenen Fluoreszenz proportional zur Menge des Ziels in der Reaktion sein (z. B. (i) einer Gesamtzahl zellfreier Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten in jedem Stadium umfassend identifiziert wurden oder (ii) einer durchschnittlichen Anzahl der Vielzahl von Phasenvarianten pro zellfreiem Nukleinsäuremolekül, das als die Vielzahl von Phasenvarianten umfassend identifiziert wurde, wie hierin offenbart).
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das aktivierbare Reporteragens bei der Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl der Phasenvarianten hybridisiert wurde, aktiviert werden. Mit anderen Worten, sobald die individuelle Nukleinsäuresonde mit dem Teil des zellfreien Zielnukleinsäuremoleküls hybridisiert ist, der die Vielzahl der Phasenvarianten umfasst, kann die Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde und der zellfreien Zielnukleinsäure das aktivierbare Reporteragens aktivieren. Nicht einschränkende Beispiele für derartige Nukleinsäuresonden können eine Hydrolysesonde (z. B. TaqMan-Sonde), duale Hybridisierungssonden und QZyme PCR-Primer beinhalten.
Beispielsweise kann die Nukleinsäuresonde eine Hydrolysesonde sein, wie in 26B dargestellt. Die Hydrolysesonde 2611 kann eine fluoreszenzmarkierte Oligonukleotidsonde sein, die spezifisch an einen Teil (z. B. zwischen etwa 10 und etwa 25 Nukleotiden) des zellfreien Zielnukleinsäuremoleküls 2613 hybridisieren kann, wobei der hybridisierte Teil zwei oder mehr Phasenvarianten umfasst. Die Hydrolysesonde 2611 kann mit einem fluoreszierenden Reporter am 5'-Ende und einem Quencher am 3'-Ende markiert sein. Ist die Hydrolysesonde intakt (z. B. nicht gespalten), wird die Fluoreszenz des Reporters aufgrund seiner Nähe zum Quencher gequencht ( 26B). Während des Annealing-Vorgangs der Amplifikationsreaktion der Vielzahl der von dem Subjekt erlangten oder abgeleiteten zellfreier Nukleinsäuremolekülen 5' → 3' Exonukleaseaktivität bestimmter thermostabiler Polymerasen (z. B. Taq oder Tth). Die Amplifikationsreaktion der Vielzahl der vom Subjekt erlangten oder abgeleiteten zellfreien Nukleinsäuremoleküle kann einen kombinierten Annealing-/Extensionsvorgang beinhalten, bei dem die Hydrolysesonde an das zellfreie Zielnukleinsäuremolekül hybridisiert und die dsDNA-spezifische 5' → 3'-Exonukleaseaktivität einer thermostabilen Polymerase (z. B. Taq oder Tth) den fluoreszierenden Reporter von der Hydrolysesonde abspaltet. Als Ergebnis wird der fluoreszierende Reporter vom Quencher getrennt, was zu einem Fluoreszenzsignal führt, das proportional zur Menge des Ziels in der Probe ist (z. B. (i) einer Gesamtzahl zellfreier Nukleinsäuremoleküle, die als die Vielzahl von Phasenvarianten in jedem Stadium umfassend identifiziert wurden, oder (ii) einer durchschnittlichen Anzahl der Vielzahl von Phasenvarianten für jedes zellfreie Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten umfassend identifiziert wurde, wie hierin offenbart).
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das Reporteragens einen Fluoreszenzreporter umfassen. Nicht einschränkende Beispiele für einen fluoreszierenden Reporter beinhalten Fluoresceinamidit (FAM, 2-[3-(Dimethylamino)-6-dimethyliminio-xanthen-9-yl]benzoat TAMRA, (2E)-2-[(2E,4E)-5-(2-tert-butyl-9-ethyl-6,8,8-trimethyl-pyrano[3,2-g]quinolin-1-ium-4-yl)penta-2,4-dienylidene]-1-(6-hydroxy-6-oxo-hexyl)-3,3-Dimethyl-indolin-5-sulfonat Dy 750, 6-Carboxy-2',4,4',5',7,7'-hexachlorofluorescein, 4,5,6,7-Tetrachlorofluorescein TET™, Sulforhodamin 101 Säurechlorid-Succinimidylester Texas Red-X, ALEXA-Farbstoffe, Bodipy-Farbstoffe, Cyanin-Farbstoffe, Rhodamin 123 (Hydrochlorid), Well RED-Farbstoffe, MAX und TEX 613. In einigen Fällen umfasst das Reporteragens außerdem einen Quencher, wie hierin offenbart. Nicht einschränkende Beispiele für einen Quencher können Black Hole Quencher, Iowa Black Quencher und 4-Dimethylaminoazobenzol-4'-sulfonylchlorid (DABCYL) beinhalten.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann jede den Nukleinsäuresondensatz verwendende PCR-Reaktion mittels Echtzeit-PCR (qPCR) durchgeführt werden. Alternativ kann die PCR-Reaktion unter Verwendung des Nukleinsäuresondensatzes mittels digitaler PCR (dPCR) durchgeführt werden.
24 zeigt ein beispielhaftes Ablaufdiagramm eines Verfahrens zur Durchführung einer klinischen Intervention und/oder Behandlung basierend auf dem Nachweis zirkulierender Nukleinsäuren in der biologischen Probe einer Person. In mehreren Ausführungsformen wird der Nachweis von zirkulierenden Tumor-Nukleinsäuren durch den Nachweis somatischer Varianten in Phase in einer zellfreien Nukleinsäureprobe bestimmt. In vielen Ausführungsformen zeigt der Nachweis von zirkulierenden Nukleinsäuren indikativ ein Vorliegen von Krebs an, sodass eine entsprechende klinische Intervention und/oder Behandlung durchgeführt werden kann.
Unter Bezugnahme auf 24 kann der Prozess 2400 mit der Gewinnung, Aufbereitung und Sequenzierung (2401) zellfreier Nukleinsäuren beginnen, die aus einer nichtinvasiven Biopsie (z. B. Flüssigkeits- oder Ausscheidungsbiopsie) erlangt wurden, wobei ein Erfassungssequenzierungsansatz für Bereiche verwendet wird, die nachweislich eine Vielzahl genetischer Mutationen oder Varianten beherbergen, die in Phase auftreten. In mehreren Ausführungsformen wird cfDNA und/oder cfRNA aus Plasma, Blut, Lymphe, Speichel, Urin, Stuhl und/oder anderen geeigneten Körperflüssigkeiten extrahiert. Zellfreie Nukleinsäuren können auf beliebige geeignete Weise isoliert und gereinigt werden. In einigen Ausführungsformen wird die Säulenreinigung verwendet (z. B. QIAamp Circulating Nucleic Acid Kit der Firma Qiagen, Hilden, Deutschland). In einigen Ausführungsformen können isolierte RNA-Fragmente zur weiteren nachgeordneten Analyse in komplementäre DNA umgewandelt werden.
In einigen Ausführungsformen wird vor einer Krebsindikation eine Biopsie entnommen. In einigen Ausführungsformen wird eine Biopsie entnommen, um ein frühes Screening zum Nachweis einer Krebserkrankung durchzuführen. In einigen Ausführungsformen wird eine Biopsie entnommen, um zu ermitteln, ob im Anschluss an eine Behandlung noch eine Krebserkrankung vorhanden ist. In einigen Ausführungsformen wird während der Behandlung eine Biopsie entnommen, um zu ermitteln, ob die Behandlung die gewünschte Reaktion hervorruft. Es kann ein Screening auf beliebige Krebsarten durchgeführt werden. In einigen Ausführungsformen wird ein Screening zum Nachweis einer Krebserkrankung durchgeführt, die somatische Phasenvarianten in stereotypen Bereichen des Genoms entwickelt, wie (beispielsweise) das Lymphom. In einigen Ausführungsformen wird ein Screening zum Nachweis einer Krebserkrankung durchgeführt, bei der somatische Phasenvarianten unter Verwendung einer zuvor entnommenen Krebsbiopsie entdeckt wurden.
In einigen Ausführungsformen wird eine Biopsie von einer Person entnommen, bei der ein bestimmtes Risiko für die Entwicklung einer Krebserkrankung besteht, wie z. B. bei Personen mit einer familiären Vorgeschichte der Erkrankung oder mit bestimmten Risikofaktoren (z. B. Exposition gegenüber Karzinogenen). In vielen Fällen wird eine Biopsie von einer beliebigen Person aus der Allgemeinbevölkerung entnommen. In einigen Ausführungsformen wird eine Biopsie von Personen entnommen, die einer bestimmten Altersgruppe mit erhöhtem Krebsrisiko angehören, wie beispielsweise ältere Personen über 50 Jahre. In einigen Ausführungsformen wird eine Biopsie von einer Person entnommen, bei der Krebs diagnostiziert und behandelt wurde.
In einigen Ausführungsformen werden extrahierte zellfreie Nukleinsäuren für die Sequenzierung vorbereitet. Dementsprechend werden zellfreie Nukleinsäuren zur Sequenzierung in eine Molekularbibliothek umgewandelt. In einigen Ausführungsformen werden Adapter und/oder Primer an zellfreie Nukleinsäuren angehängt, um die Sequenzierung zu ermöglichen. In einigen Ausführungsformen ist eine gezielte Sequenzierung bestimmter genomischer Loci durchzuführen, sodass bestimmte Sequenzen, die den bestimmten Loci entsprechen, vor der Sequenzierung durch Hybridisierung erfasst werden (z. B. Erfassungssequenzierung). In einigen Ausführungsformen wird die Erfassungssequenzierung unter Verwendung einer Reihe von Sonden durchgeführt, die Bereiche herunterziehen (oder erfassen), von denen bekannt ist, dass sie häufig Phasenvarianten für einen bestimmten Krebs (z. B. Lymphom) beherbergen. In einigen Ausführungsformen wird die Erfassungssequenzierung unter Verwendung eines Sondensatzes durchgeführt, der Bereiche herunterzieht (oder erfasst), die nachweislich Phasenvarianten beherbergen, die zuvor durch die Sequenzierung einer Biopsie des Krebses bestimmt wurden. Eine ausführlichere Beschreibung der Erfassungssequenzierung und der Sonden ist im Abschnitt „Erfassungssequenzierung“ bereitgestellt.
In einigen Ausführungsformen kann jede geeignete Sequenzierungstechnik verwendet werden, mit der Phasenvarianten nachgewiesen werden können, die indikativ für zirkulierende Tumor-Nukleinsäuren sind. Sequenzierungstechniken beinhalten (sind aber nicht beschränkt auf) 454-Sequenzierung, Illumina-Sequenzierung, SOLiD-Sequenzierung, Ion-Torrent-Sequenzierung, Single-Read-Sequenzierung, Paired-End-Sequenzierung, usw.
Prozess 2400 analysiert (2403) das Ergebnis der zellfreien Nukleinsäure-Sequenzierung zum Nachweis zirkulierender Tumor-Nukleinsäuresequenzen, die durch den Nachweis somatischer, in der Phase auftretender Varianten bestimmt werden. Da Krebs aktiv wächst und sich ausbreitet, geben neoplastische Zellen häufig Biomoleküle (insbesondere Nukleinsäuren) in das Gefäßsystem, die Lymphe und/oder Ausscheidungssysteme ab. Darüber hinaus brechen neoplastische Zellen aufgrund biophysikalischer Zwänge in ihrer lokalen Umgebung häufig auf und geben ihren inneren Zellinhalt in das Gefäßsystem, die Lymphe und/oder Ausscheidungssysteme ab. Dementsprechend ist der Nachweis distaler Primärtumore und/oder Metastasen aus einer Flüssigkeits- oder Ausscheidungsbiopsie möglich.
Der Nachweis zirkulierender Tumor-Nukleinsäuresequenzen deutet darauf hin, dass bei dem untersuchten Individuum ein Krebs vorliegt. Dementsprechend kann basierend auf dem Nachweis von zirkulierenden Tumor-Nukleinsäuren eine klinische Intervention und/oder Behandlung durchgeführt werden (2405). In einer Anzahl von Ausführungsformen wird ein klinisches Verfahren durchgeführt, wie (zum Beispiel) ein Bluttest, ein Gentest, eine medizinische Bildgebung, eine körperliche Untersuchung, eine Tumorbiopsie oder eine beliebige Kombination davon. In einigen Ausführungsformen werden Diagnosen zur Bestimmung des jeweiligen Krebsstadiums durchgeführt. In einer Anzahl von Ausführungsformen wird eine Behandlung durchgeführt, wie (zum Beispiel) Chemotherapie, Radiotherapie, Chemoradiotherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie, Operation, Transplantation, Transfusion, medizinische Überwachung oder eine beliebige Kombination davon. In einigen Ausführungsformen wird ein Individuum von medizinischem Fachpersonal, wie etwa einem Arzt, Mediziner, medizinischen Fachangestellten, einer Krankenschwester, einem Pfleger, Ernährungsberater oder dergleichen.
Verschiedene Ausführungsformen der vorliegenden Offenbarung zielen darauf ab, den Nachweis von Krebs zur Durchführung klinischer Interventionen zu nutzen. In einer Reihe von Ausführungsformen wird eine Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums mit den hierin beschriebenen Verfahren gescreent und verarbeitet, um anzuzeigen, dass das Individuum Krebs hat und daher eine Intervention durchzuführen ist. Klinische Interventionen beinhalten klinische Verfahren und Behandlungen. Klinische Verfahren beinhalten (sind aber nicht beschränkt auf) Bluttests, Gentests, medizinische Bildgebung, körperliche Untersuchungen und Tumorbiopsien. Behandlungen beinhalten (sind aber nicht beschränkt auf) Chemotherapie, Radiotherapie, Chemoradiotherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie, Chirurgie, Transplantation, Transfusion und medizinische Überwachung. In einigen Ausführungsformen werden Diagnosen zur Bestimmung des jeweiligen Krebsstadiums durchgeführt. In einigen Ausführungsformen wird ein Individuum von medizinischem Fachpersonal, wie etwa einem Arzt, Mediziner, medizinischen Fachangestellten, einer Krankenschwester, einem Pfleger, Ernährungsberater oder dergleichen.
In mehreren hierin beschriebenen Ausführungsformen kann ein Krebs anhand eines Sequenzierungsergebnisses von zellfreien Nukleinsäuren aus Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl nachgewiesen werden. In vielen Ausführungsformen wird Krebs nachgewiesen, wenn ein Sequenzierungsergebnis eine oder mehrere somatische Varianten aufweist, die innerhalb eines kurzen genetischen Fensters, z. B. der Länge eines zellfreien Moleküls (z. B. etwa 170 bp), in Phase vorliegen. In zahlreichen Ausführungsformen wird ein statistisches Verfahren zur Bestimmung verwendet, ob das Vorhandensein von Phasenvarianten aus einer kanzerogenen Quelle abgeleitet ist (im Gegensatz zu einem molekularen Artefakt oder einer anderen biologischen Quelle). In verschiedenen Ausführungsformen wird eine Monte-Carlo-Probennahme als statistisches Verfahren verwendet, um zu bestimmen, ob ein Sequenzierungsergebnis zellfreier Nukleinsäuren Sequenzen zirkulierender Tumor-Nukleinsäuren beinhaltet, basierend auf einem Score, der durch das Vorhandensein von Phasenvarianten bestimmt wird. Dementsprechend werden in einer Reihe von Ausführungsformen zellfreie Nukleinsäuren extrahiert, verarbeitet und sequenziert, und das Sequenzierungsergebnis wird zum Nachweis von Krebs analysiert. Dieses Verfahren ist besonders im klinischen Umfeld nützlich, um einen diagnostischen Scan bereitzustellen.
Ein beispielhaftes Verfahren für einen diagnostischen Scan eines Individuums auf B-Zell-Krebs ist wie folgt:

(a) Entnahme einer Flüssigkeits- oder Ausscheidungsbiopsie vom Individuum,
(b) Vorbereitung und Durchführung einer gezielten Sequenzierung zellfreier Nukleinsäuren aus der Biopsie unter Verwendung von Nukleinsäuresonden, die für den B-Zell-Krebs spezifisch sind,
(c) Nachweisen von Phasenvarianten in den Sequenzierungsergebnissen, die indikativ für zirkulierende Tumor-Nukleinsäuresequenzen sind, und
(d) Durchführen einer klinischen Intervention basierend auf dem Nachweis zirkulierender Tumor-Nukleinsäuresequenzen.

Ein beispielhaftes Verfahren für einen personalisierten diagnostischen Scan eines Individuums für einen Krebs, der zuvor zum Nachweis von Phasenvarianten in bestimmten genomischen Loci sequenziert wurde, ist wie folgt:

Entnahme einer Krebsbiopsie von dem Individuum
Sequenzieren der Krebsbiopsie zum Nachweis von Phasenvarianten, die sich in dem Krebs angesammelt haben
1. (a) Entwickeln und Synthetisieren von Nukleinsäuresonden für genomische Loci, die die Positionen der nachgewiesenen Phasenvarianten beinhalten,
2. (b) Entnahme einer Flüssigkeits- oder Ausscheidungsbiopsie vom Individuum,
3. (c) Präparieren und Durchführen einer gezielten Sequenzierung zellfreier Nukleinsäuren aus der Biopsie unter Verwendung der gestalteten und synthetisierten Nukleinsäuresonden,
4. (d) Nachweisen von Phasenvarianten in den Sequenzierungsergebnissen, die indikativ für zirkulierende Tumor-Nukleinsäuresequenzen sind, und
5. (e) Durchführen einer klinischen Intervention basierend auf dem Nachweis zirkulierender Tumor-Nukleinsäuresequenzen.

In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann wenigstens ein Teil des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle, die die Vielzahl der Phasenvarianten umfassen, zur Ermittlung der Erkrankung des Subjekts weiter analysiert werden. In dieser Analyse können (i) die identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle und (ii) andere zellfreie Nukleinsäuremoleküle der Vielzahl von zellfreien Nukleinsäuremolekülen, die nicht die Vielzahl von Phasenvarianten umfassen, als unterschiedliche Variablen analysiert werden. In einigen Fällen kann ein Verhältnis von (i) der Anzahl der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle und (ii) der Anzahl der anderen zellfreien Nukleinsäuremoleküle der Vielzahl von zellfreien Nukleinsäuremolekülen, die nicht die Vielzahl von Phasenvarianten umfassen, als Faktor zur Bestimmung der Erkrankung des Subjekts verwendet werden. In einigen Fällen kann der Vergleich (i) einer oder mehrerer Position(en) des oder der identifizierten zellfreien Nukleinsäuremoleküle relativ zu der Referenzgenomsequenz und (ii) einer oder mehrerer Position(en) der anderen zellfreien Nukleinsäuremoleküle der Vielzahl zellfreier Nukleinsäuremoleküle, die nicht die Vielzahl der Phasenvarianten umfassen, relativ zu der Referenzgenomsequenz als Faktor zur Bestimmung der Erkrankung des Subjekts verwendet werden.
Alternativ kann und muss die Analyse des identifizierten einen oder der mehreren zellfreien Nukleinsäuremoleküle, die die Vielzahl von Phasenvarianten umfassen, zur Bestimmung der Erkrankung des Subjekts nicht auf den anderen zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen basieren, die nicht die Vielzahl von Phasenvarianten umfassen. Wie hierin offenbart, können nicht-einschränkende Beispiele von Informationen oder Merkmalen des einen oder der mehreren zellfreien Nukleinsäuremoleküle, die die Vielzahl von Phasenvarianten umfassen, (i) eine Gesamtzahl solcher zellfreier Nukleinsäuremoleküle und (ii) eine durchschnittliche Anzahl der Vielzahl von Phasenvarianten für jedes Nukleinsäuremolekül in der Population der identifizierten zellfreien Nukleinsäuremoleküle beinhalten.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann daher eine Anzahl der Vielzahl von Phasenvarianten aus dem einen oder den mehreren als die Vielzahl von Phasenvarianten umfassend identifizierten zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts sein. In einigen Fällen kann ein Verhältnis von (i) der Anzahl der Vielzahl von Phasenvarianten aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen und (ii) einer Anzahl von Einzelnukleotidvarianten aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts sein. So kann beispielsweise eine bestimmte Erkrankung (z. B. das follikuläre Lymphom) ein anderes Signaturverhältnis aufweisen als eine andere Erkrankung (z. B. Brustkrebs). In einigen Beispielen für Krebs oder solide Tumore kann das hierin offenbarte Verhältnis zwischen etwa 0,01 und etwa 0,20 liegen. In einigen Beispielen für Krebs oder solide Tumore kann das hierin offenbarte Verhältnis etwa 0,01, etwa 0,02, etwa 0,03, etwa 0,04, etwa 0,05, etwa 0,06, etwa 0,07, etwa 0,08, etwa 0,09, etwa 0,10, etwa 0,11, etwa 0,12, etwa 0,13, etwa 0,14, etwa 0,15, etwa 0,16, etwa 0,17, etwa 0,18, etwa 0,19 oder etwa 0,20 betragen. In einigen Beispielen für Krebs oder solide Tumore kann das hierin offenbarte Verhältnis wenigstens oder bis zu etwa 0,01, wenigstens oder bis zu etwa 0,02, wenigstens oder bis zu etwa 0,03, wenigstens oder bis zu etwa 0,04, wenigstens oder bis zu etwa 0,05, wenigstens oder bis zu etwa 0,06, wenigstens oder bis zu etwa 0,07, wenigstens oder bis zu etwa 0,08, wenigstens oder bis zu etwa 0,09, wenigstens oder bis zu etwa 0,10, wenigstens oder bis zu etwa 0,11, wenigstens oder bis zu etwa 0,12, wenigstens oder bis zu etwa 0,13, wenigstens oder bis zu etwa 0,14, wenigstens oder bis zu etwa 0,15, wenigstens oder bis zu etwa 0,16, wenigstens oder bis zu etwa 0,17, wenigstens oder bis zu etwa 0,18, wenigstens oder bis zu etwa 0,19, oder wenigstens oder bis zu etwa 0,20 betragen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Häufigkeit der Vielzahl von Phasenvarianten in dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts sein. In einigen Fällen kann basierend auf den hierin offenbarten Sequenzierungsdaten eine durchschnittliche Häufigkeit der Vielzahl von Phasenvarianten pro vorbestimmter Bin-Länge (z. B. ein Bin von etwa 50 Basenpaaren) innerhalb jedes der identifizierten zellfreien Nukleinsäuremoleküle indikativ für die Erkrankung des Subjekts sein. In einigen Fällen kann basierend auf den hierin offenbarten Sequenzierungsdaten eine durchschnittliche Häufigkeit der Vielzahl von Phasenvarianten pro vorbestimmter Bin-Länge (z. B. ein Bin von etwa 50 Basenpaaren) innerhalb jedes der identifizierten zellfreien Nukleinsäuremoleküle, die mit einem bestimmten Gen (z. B. BCL2, PIM1) assoziiert sind, indikativ für die Erkrankung des Subjekts sein. Die Größe der Bin kann etwa 30, etwa 40, etwa 50, etwa 60, etwa 70 oder etwa 80 betragen.
In einigen Beispielen kann eine erste Erkrankung (z. B. Hodgkin-Lymphom oder HL) eine erste Durchschnittshäufigkeit und eine zweite Erkrankung (z. B. DLBCL) eine andere Durchschnittshäufigkeit aufweisen, wodurch die Identifizierung und/oder Bestimmung ermöglicht wird, ob der Proband eine bestimmte Erkrankung hat oder der Verdacht auf eine solche besteht. In einigen Beispielen kann eine erste Unterart einer Krankheit eine erste Durchschnittshäufigkeit und eine zweite Unterart derselben Krankheit eine andere Durchschnittshäufigkeit aufweisen, wodurch die Identifizierung und/oder Bestimmung ermöglicht wird, ob der Proband an einer bestimmten Unterart der Krankheit leidet oder der Verdacht darauf besteht. Zum Beispiel kann der Proband DLBCL haben, und ein oder mehrere zellfreie Nukleinsäuremoleküle, die von Keimzentrum-B-Zell-(GCB-)DLBCL oder aktiviertem B-Zell-(ABC-)DLBCL abgeleitet sind, können eine unterschiedliche durchschnittliche Häufigkeit der Vielzahl von Phasenvarianten pro vorbestimmter Bin-Länge aufweisen, wie hierin offenbart.
In einigen Beispielen kann eine Erkrankung des Subjekts eine vorbestimmte Anzahl von Phasenvarianten aufweisen, die sich über vorbestimmte genomische Loci erstrecken (d .h. eine vorbestimmte Häufigkeit von Phasenvarianten). Stimmt die vorbestimmte Häufigkeit der Phasenvarianten mit einer Häufigkeit der Vielzahl von Phasenvarianten in dem einen oder den mehreren zellfreien Nukleinsäuremolekülen überein, die aus einer Vielzahl von zellfreien Nukleinsäuremolekülen des Subjekts identifiziert wurden, kann dies indikativ für die Erkrankung des Subjekts sein.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können das eine oder die mehreren zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten umfassend identifiziert wurden, analysiert werden, um ihren genomischen Ursprung zu bestimmen (z. B. von welchem Genort sie stammen). Der genomische Ursprung des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle kann indikativ für die Erkrankung des Subjekts sein, da verschiedene Erkrankungen die Vielzahl von Phasenvarianten in verschiedenen Signaturgenen aufweisen können. Zum Beispiel kann ein Proband GCB DLBCL haben, und ein oder mehrere aus GCBs des Subjekts stammende zellfreie Nukleinsäuremoleküle können die Phasenvarianten im BCL2-Gen aufweisen, während ein oder mehrere aus ABCs desselben Subjekt stammende zellfreie Nukleinsäuremoleküle möglicherweise nicht so viele Phasenvarianten im BCL2-Gen aufweisen wie die aus GCBs. Andererseits kann ein Proband ABC DLBCL haben, und ein oder mehrere aus ABCs des Subjekts stammende zellfreie Nukleinsäuremoleküle können die Phasenvarianten im PIM1-Gen aufweisen, während ein oder mehrere aus GCBs desselben Subjekt stammende zellfreie Nukleinsäuremoleküle möglicherweise nicht so viele Phasenvarianten im PIM1-Gen aufweisen wie die aus ABCs.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 %, wenigstens oder bis zu etwa 50 %, wenigstens oder bis zu etwa 55 %, wenigstens oder bis zu etwa 60 %, wenigstens oder bis zu etwa 65 %, wenigstens oder bis zu etwa 70 %, wenigstens oder bis zu etwa 75 %, wenigstens oder bis zu etwa 80 %, wenigstens oder bis zu etwa 85 %, wenigstens oder bis zu etwa 90 %, wenigstens oder bis zu etwa 95 %, wenigstens oder bis zu etwa 99 % oder etwa 100 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 2 Nukleotide von einer benachbarten SNV entfernt ist.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % der einen oder mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 3 Nukleotide von einer benachbarten SNV entfernt ist.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 4 Nukleotide von einer benachbarten SNV entfernt ist.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 5 Nukleotide von einer benachbarten SNV entfernt ist.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 6 Nukleotide von einer benachbarten SNV entfernt ist.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 7 Nukleotide von einer benachbarten SNV entfernt ist.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 8 Nukleotide von einer benachbarten SNV entfernt ist.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 9 Nukleotide von einer benachbarten SNV entfernt ist.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 10 Nukleotide von einer benachbarten SNV entfernt ist.
C. Referenzgenomsequenz
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Referenzgenomsequenz wenigstens ein Teil einer Nukleinsäure-Sequenzdatenbank (d. h. eines Referenzgenoms) sein, die aus genetischen Daten zusammengesetzt ist und das Genom einer Referenzkohorte darstellen soll. In einigen Fällen kann eine Referenzkohorte eine Sammlung von Individuen mit einem/einer spezifischen oder variierenden Genotyp, Haplotyp, Demographie, Geschlecht, Nationalität, Alter, ethnischer Zugehörigkeit, Verwandtschaft, körperlicher Verfassung (z. B. gesund oder mit der gleichen oder einer anderen Erkrankung diagnostiziert, wie einer spezifischen Art von Krebs) oder anderen Gruppierungen sein. Eine wie hierin offenbarte Referenzgenomsequenz kann ein Mosaik (oder eine Konsensussequenz) der Genomen von zwei oder mehr Individuen sein. Die Referenzgenomsequenz kann wenigstens einen Teil eines öffentlich zugänglichen Referenzgenoms oder eines privaten Referenzgenoms umfassen. Nicht einschränkende Beispiele für ein menschliches Referenzgenom beinhalten hg19, hg18, hg17, hg16 und hg38.
In einigen Beispielen kann die Referenzgenomsequenz wenigstens oder bis zu etwa 500 Nukleobasen, wenigstens oder bis zu etwa 1 Kilobase (kb), wenigstens oder bis zu etwa 2 kb, wenigstens oder bis zu etwa 3 kb, wenigstens oder bis zu etwa 4 kb, wenigstens oder bis zu etwa 5 kb, wenigstens oder bis zu etwa 6 kb, wenigstens oder bis zu etwa 7 kb, wenigstens oder bis zu etwa 8 kb, wenigstens oder bis zu etwa 9 kb, wenigstens oder bis zu etwa 10 kb, wenigstens oder bis zu etwa 20 kb, wenigstens oder bis zu etwa 30 kb, wenigstens oder bis zu etwa 40 kb, wenigstens oder bis zu etwa 50 kb, wenigstens oder bis zu etwa 60 kb, wenigstens oder bis zu etwa 70 kb, wenigstens oder bis zu etwa 80 kb, wenigstens oder bis zu etwa 90 kb, wenigstens oder bis zu etwa 100 kb, wenigstens oder bis zu etwa 200 kb, wenigstens oder bis zu etwa 300 kb, wenigstens oder bis zu etwa 400 kb, wenigstens oder bis zu etwa 500 kb, wenigstens oder bis zu etwa 600 kb, wenigstens oder bis zu etwa 700 kb, wenigstens oder bis zu etwa 800 kb, wenigstens oder bis zu etwa 900 kb, wenigstens oder bis zu etwa 1.000 kb, wenigstens oder bis zu etwa 2.000 kb, wenigstens oder bis zu etwa 3.000 kb, wenigstens oder bis zu etwa 4.000 kb, wenigstens oder bis zu etwa 5.000 kb, wenigstens oder bis zu etwa 6.000 kb, wenigstens oder bis zu etwa 7.000 kB, wenigstens oder bis zu etwa 8.000 kb, wenigstens oder bis zu etwa 9.000 kb, wenigstens oder bis zu etwa 10.000 kb, wenigstens oder bis zu etwa 20.000 kb, wenigstens oder bis zu etwa 30.000 kb, wenigstens oder bis zu etwa 40.000 kb, wenigstens oder bis zu etwa 50.000 kb, wenigstens oder bis zu etwa 60.000 kb, wenigstens oder bis zu etwa 70.000 kb, wenigstens oder bis zu etwa 80.000 kb, wenigstens oder bis zu etwa 90.000 kb, oder wenigstens oder bis zu etwa 100.000 kb umfassen.
In einigen Fällen kann es sich bei der Referenzgenomsequenz um das gesamte Referenzgenom oder um einen Teil (z. B. einen für die Erkrankung relevanten Teil) des Genoms handeln. Die Referenzgenomsequenz kann zum Beispiel aus wenigstens 1, 2, 3, 4, 5 oder mehr Genen bestehen, die bei bestimmten Arten von Krebs eine aberrante somatische Hypermutation aufweisen. In einigen Fällen kann die Referenzgenomsequenz eine ganze chromosomale Sequenz oder ein Fragment davon sein. In einigen Fällen kann die Referenzgenomsequenz zwei oder mehr (z. B. wenigstens 2, 3, 4, 5 oder mehr) verschiedene Teile des Referenzgenoms umfassen, die nicht nebeneinander liegen (z. B. innerhalb desselben Chromosoms oder von verschiedenen Chromosomen).
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Referenzgenomsequenz wenigstens ein Teil eines Referenzgenoms eines ausgewählten Individuums sein, wie etwa eines gesunden Individuums oder des Subjekts eines der hierin offenbarten Verfahren.
In einigen Fällen kann die Referenzgenomsequenz von einem Individuum abgeleitet werden, das kein Proband ist (z. B. von einem gesunden Kontrollindividuum). In einigen Fällen kann die Referenzgenomsequenz alternativ aus einer Probe des Subjekts abgeleitet werden. In einigen Beispielen kann die Probe eine gesunde Probe des Subjekts sein. Die gesunde Probe des Subjekts kann jede beliebige Zelle des Subjekts sein, die gesund ist, z. B. ein gesundes Leukozyt. Durch den Vergleich der Sequenzierungsdaten der Vielzahl zellfreier Nukleinsäuremoleküle (z. B. cfDNA-Moleküle) des Subjekts mit wenigstens einem Teil der genomischen Sequenz einer gesunden Zelle desselben Subjekt können, wie hierin offenbart, ein oder mehrere die Vielzahl von Phasenvarianten enthaltende zellfreie Nukleinsäuremoleküle identifiziert und analysiert werden. In einigen Beispielen kann es sich bei der Probe um eine erkrankte Probe des Subjekts, wie etwa eine erkrankte Zelle (z. B. eine Tumorzelle) oder einen soliden Tumor handeln. Die Referenzgenomsequenz kann durch Sequenzierung wenigstens eines Teils einer erkrankten Zelle des Subjekts oder durch Sequenzierung einer Vielzahl von zellfreien Nukleinsäuremolekülen erlangt werden, die aus dem soliden Tumor des Subjekts erlangt wurden. Sobald bei dem Subjekt eine bestimmte Erkrankung)z. B. eine Erkrankung) diagnostiziert wurde, kann die Referenzgenomsequenz des Subjekts, die die Vielzahl der Phasenvarianten umfasst, zur Ermittlung verwendet werden, ob der Proband zu zukünftigen Zeitpunkten immer noch die gleichen Phasenvarianten aufweist. In diesem Zusammenhang können beliebige neue Phasenvarianten, die zwischen der „erkrankten“ Referenzgenomsequenz des Subjekts und neuen zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet wurden, identifiziert wurden, indikativ für ein geringeres Ausmaß aberranter somatischer Hypermutation in bestimmten genomischen Loci sein (z. B. wenigstens eine Teilremission).
In verschiedenen Ausführungsformen können diagnostische Scans für beliebige Neoplasmentypen durchgeführt werden, einschließlich (aber nicht beschränkt auf) akute lymphatische Leukämie (ALL), akute myeloische Leukämie (AML), Analkrebs, Astrozytome, Basalzellkarzinom, Gallengangskrebs, Blasenkrebs, Brustkrebs, Burkitt-Lymphom, Gebärmutterhalskrebs, chronische lymphozytäre Leukämie (CLL), chronische myeloische Leukämie (CML), chronische myeloproliferative Neoplasmen, Darmkrebs, diffuses großzelliges B-Zell-Lymphom, Endometriumkrebs, Ependymom, Speiseröhrenkrebs, Östhesioneuroblastom, Ewing-Sarkom, Eileiterkrebs, follikuläres Lymphom, Gallenblasenkrebs, Magenkrebs, gastrointestinaler Karzinoidtumor, Haarzellenleukämie, Leberzellkrebs, Hodgkin-Lymphom, Hypopharynxkrebs, Kaposi-Sarkom, Nierenkrebs, Langerhans-Zell-Histiozytose, Kehlkopfkrebs, Leukämie, Leberkrebs, Lungenkrebs, Lymphom, Melanom, Merkel-Zell-Krebs, Mesotheliom, Mundkrebs, Neuroblastom, Non-Hodgkin-Lymphom, nicht-kleinzelliger Lungenkrebs, Osteosarkom, Eierstockkrebs, Bauchspeicheldrüsenkrebs, neuroendokrine Tumore der Bauchspeicheldrüse, Rachenkrebs, Hypophysentumor, Prostatakrebs, Rektumkarzinom, Nierenzellkrebs, Retinoblastom, Hautkrebs, kleinzelliger Lungenkrebs, Dünndarmkrebs, Plattenepithelkarzinom des Halses, T-Zell-Lymphom, Hodenkrebs, Thymom, Schilddrüsenkrebs, Gebärmutterkrebs, Vaginalkrebs und vaskuläre Tumore.
In einer Reihe von Ausführungsformen wird ein diagnostischer Scan zum frühen Nachweis von Krebs eingesetzt. In einigen Ausführungsformen weist ein diagnostischer Scan Krebs bei Individuen mit Krebs im Stadium I, II oder III nach. In einigen Ausführungsformen wird ein diagnostischer Scan zum Nachweis von MRD oder Tumorlast verwendet. In einigen Ausführungsformen wird ein diagnostischer Scan verwendet, um den Verlauf (z. B. Progression oder Regression) der Behandlung zu ermitteln. Basierend auf dem diagnostischen Scan kann ein klinisches Verfahren und/oder eine Behandlung durchgeführt werden.
D. Nukleinsäuresonden
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz basierend auf einer der Subjekt-Referenzgenomsequenzen der vorliegenden Offenbarung gestaltet werden. In einigen Fällen kann der Nukleinsäuresondensatz basierend auf der Vielzahl von Phasenvarianten gestaltet werden, die durch den Vergleich von (i) Sequenzierungsdaten aus einem soliden Tumor des Subjekts und (ii) Sequenzierungsdaten aus einer gesunden Zelle des Subjekts oder einer gesunden Kohorte, wie hierin offenbart identifiziert wurden. Der Nukleinsäuresondensatz kann basierend auf der Vielzahl von Phasenvarianten gestaltet werden, die durch den Vergleich von (i) Sequenzierungsdaten aus einem soliden Tumor des Subjekts und (ii) Sequenzierungsdaten aus einer gesunden Zelle des Subjekts identifiziert wurden. Der Nukleinsäuresondensatz kann basierend auf der Vielzahl von Phasenvarianten gestaltet werden, die durch den Vergleich von (i) Sequenzierungsdaten aus einem soliden Tumor des Subjekts und (ii) Sequenzierungsdaten aus einer gesunden Zelle einer gesunden Kohorte identifiziert wurden.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Nukleinsäuresondensatz zur Hybridisierung mit Sequenzen der mit der Erkrankung assoziierten genomischen Loci gestaltet. Wie hierin offenbart, können die mit der Erkrankung assoziierten genomischen Loci als eine aberrante somatische Hypermutation erfahrend oder aufweisend bestimmt werden, wenn der Proband die Erkrankung hat. Alternativ dazu sind die Nukleinsäuresondensätze zur Hybridisierung mit Sequenzen stereotyper Bereiche gestaltet.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz zur Hybridisierung mit wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 %, wenigstens etwa 95 %, wenigstens etwa 99 % oder wenigstens etwa 100 % der in Tabelle 1 identifizierten Genombereiche gestaltet sein.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz zur Hybridisierung mit wenigstens einem Teil der zellfreien Nukleinsäure (z. B. cfDNA-)Molekülen gestaltet sein, die von wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 %, wenigstens etwa 95 %, wenigstens etwa 99 % oder etwa 100 % der in Tabelle 1 identifizierten Genombereiche abgeleitet sind.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann jede Nukleinsäuresonde des Nukleinsäuresondensatzes wenigstens etwa 50 %, wenigstens etwa 55 %, wenigstens etwa 60 %, wenigstens etwa 65 %, wenigstens etwa 70 %, wenigstens etwa 75 %, wenigstens etwa 80 %, wenigstens etwa 85 %, wenigstens etwa 90 % , wenigstens etwa 95 % Sequenzidentität, wenigstens etwa 99 % oder wenigstens etwa 100 % Sequenzidentität mit einer aus Tabelle 6 ausgewählten Sondensequenz aufweisen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz wenigstens etwa 1 %, wenigstens etwa 2 %, wenigstens etwa 3 %, wenigstens etwa 4 %, wenigstens etwa 5 %, wenigstens etwa 6 %, wenigstens etwa 7 %, wenigstens etwa 8 %, wenigstens etwa 9 %, wenigstens etwa 10 %, wenigstens etwa 15 %, wenigstens etwa 20 %, wenigstens etwa 25 %, wenigstens etwa 30 %, wenigstens etwa 35 %, wenigstens etwa 40 %, wenigstens etwa 45 %, wenigstens etwa 50 %, wenigstens etwa 55 %, wenigstens etwa 60 %, wenigstens etwa 65 %, wenigstens etwa 70 %, wenigstens etwa 75 %, wenigstens etwa 80 %, wenigstens etwa 85 %, wenigstens etwa 90 %, wenigstens etwa 95 %, wenigstens etwa 99 % oder etwa 100 % der Sondensequenzen in Tabelle 6 umfassen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz zur Abdeckung eines oder mehrerer Zielgenombereich gestaltet sein, die wenigstens oder bis zu etwa 500 Nukleobasen, wenigstens oder bis zu etwa 1 Kilobase (kb), wenigstens oder bis zu etwa 2 kb, wenigstens oder bis zu etwa 3 kb, wenigstens oder bis zu etwa 4 kb, wenigstens oder bis zu etwa 5 kb, wenigstens oder bis zu etwa 6 kb, wenigstens oder bis zu etwa 7 kb, wenigstens oder bis zu etwa 8 kb umfassen, wenigstens oder bis zu etwa 9 kb, wenigstens oder bis zu etwa 10 kb, wenigstens oder bis zu etwa 20 kb, wenigstens oder bis zu etwa 30 kb, wenigstens oder bis zu etwa 40 kb, wenigstens oder bis zu etwa 50 kb, wenigstens oder bis zu etwa 60 kb, wenigstens oder bis zu etwa 70 kb, wenigstens oder bis zu etwa 80 kb, wenigstens oder bis zu etwa 90 kb, wenigstens oder bis zu etwa 100 kb, wenigstens oder bis zu etwa 200 kb, wenigstens oder bis zu etwa 300 kb, wenigstens oder bis zu etwa 400 kb, oder wenigstens oder bis zu etwa 500 kb umfassen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann ein Zielgenombereich (z. B. ein genomischer Ziellocus) des einen oder mehrerer Zielgenombereiche höchstens etwa 200 Nukleobasen, höchstens etwa 300 Nukleobasen, 400 Nukleobasen, höchstens etwa 500 Nukleobasen, höchstens etwa 600 Nukleobasen, höchstens etwa 700 Nukleobasen, höchstens etwa 800 Nukleobasen, höchstens etwa 900 Nukleobasen, höchstens etwa 1 kb, höchstens etwa 2 kb, höchstens etwa 3 kb, höchstens etwa 4 kb, höchstens etwa 5 kb, höchstens etwa 6 kb, höchstens etwa 7 kb, höchstens etwa 8 kb, höchstens etwa 9 kb, höchstens etwa 10 kb, höchstens etwa 11 kb, höchstens etwa 12 kb, höchstens etwa 13 kb, höchstens etwa 14 kb, höchstens etwa 15 kb, höchstens etwa 16 kb, höchstens etwa 17 kb, höchstens etwa 18 kb, höchstens etwa 19 kb, höchstens etwa 20 kb, höchstens etwa 25 kb, höchstens etwa 30 kb, höchstens etwa 35 kb, höchstens etwa 40 kb, höchstens etwa 45 kb, höchstens etwa 50 kb, oder höchstens etwa 100 kb umfassen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz wenigstens oder bis zu etwa 10, wenigstens oder bis zu etwa 20, wenigstens oder bis zu etwa 30, wenigstens oder bis zu etwa 40, wenigstens oder bis zu etwa 50, wenigstens oder bis zu etwa 60, wenigstens oder bis zu etwa 70, wenigstens oder bis zu etwa 80, wenigstens oder bis zu etwa 90, wenigstens oder bis zu etwa 100, wenigstens oder bis zu etwa 200, wenigstens oder bis zu etwa 300, wenigstens oder bis zu etwa 400, wenigstens oder bis zu etwa 500, wenigstens oder bis zu etwa 600, wenigstens oder bis zu etwa 700, wenigstens oder bis zu etwa 800, wenigstens oder bis zu etwa 900, wenigstens oder bis zu etwa 1.000, wenigstens oder bis zu etwa 2.000, wenigstens oder bis zu etwa 3.000, wenigstens oder bis zu etwa 4.000 oder wenigstens oder bis zu etwa 5.000 verschiedene Nukleinsäuresonden umfassen, die zur Hybridisierung mit verschiedenen Ziel-Nukleinsäuresequenzen gestaltet sind.
In einigen Ausführungsformen eines der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz eine Länge von wenigstens oder bis zu etwa 50, wenigstens oder bis zu etwa 55, wenigstens oder bis zu etwa 60, wenigstens oder bis zu etwa 65, wenigstens oder bis zu etwa 70, wenigstens oder bis zu etwa 75, wenigstens oder bis zu etwa 80, wenigstens oder bis zu etwa 85, wenigstens oder bis zu etwa 90, wenigstens oder bis zu etwa 95, oder wenigstens oder bis zu etwa 100 Nukleotiden aufweisen.
In einem Aspekt sieht die vorliegende Offenbarung eine Zusammensetzung vor, umfassend einen Ködersatz, umfassend einen beliebigen Satz der hierin offenbaren Nukleinsäuresondensätze. Die einen solchen Ködersatz umfassende Zusammensetzung kann für beliebige der hierin offenbarten Verfahren verwendet werden. In einigen Fällen kann der Nukleinsäuresondensatz für das Pull-Down (oder die Erfassung) von cfDNA-Molekülen gestaltet sein. In einigen Fällen kann der Nukleinsäuresondensatz für das Pull-Down (oder die Erfassung) von cfRNA-Molekülen gestaltet sein.
In einigen Ausführungsformen kann der Ködersatz einen Nukleinsäuresondensatz umfassen, der für das Pull-Down zellfreier Nukleinsäuremoleküle (z. B. cfDNA-Moleküle), die aus den in Tabelle 1 aufgeführten Genombereichen abgeleitet sind, gestaltet ist. Der Nukleinsäuresondensatz kann für das Pull-Down zellfreier Nukleinsäuremoleküle gestaltet sein, die aus wenigstens oder bis zu etwa 1 %, wenigstens oder bis zu etwa 2 %, wenigstens oder bis zu etwa 3 %, wenigstens oder bis zu etwa 4 %, wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 6 %, wenigstens oder bis zu etwa 7 %, wenigstens oder bis zu etwa 8 %, wenigstens oder bis zu etwa 9 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 %, wenigstens oder bis zu etwa 50 %, wenigstens oder bis zu etwa 55 %, wenigstens oder bis zu etwa 60 %, wenigstens oder bis zu etwa 65 %, wenigstens oder bis zu etwa 70 %, wenigstens oder bis zu etwa 75 %, wenigstens oder bis zu etwa 80 %, wenigstens oder bis zu etwa 85 %, wenigstens oder bis zu etwa 90 %, wenigstens oder bis zu etwa 95 %, wenigstens oder bis zu etwa 99 % oder etwa 100 % der in Tabelle 1 aufgeführten Genombereiche abgeleitet sind. In einigen Fällen kann der Nukleinsäuresondensatz für das Pull-Down von cfDNA-Molekülen gestaltet sein. In manchen Fällen kann der Nukleinsäuresondensatz für das Pull-Down von cfRNA-Molekülen gestaltet sein.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen kann eine individuelle Nukleinsäuresonde (oder jede Nukelinsäuresonde) des Nukleinsäuresondensatzes ein Pull-Down-Tag umfassen. Der Pull-Down-Tag kann zur Anreicherung einer Probe (z. B. einer die Vielzahl von Nukleinsäuremolekülen umfassenden Probe, die von dem Subjekt erlangt oder abgeleitet wurde) für eine spezifische Untergruppe verwendet werden (z. B. für zellfreie Nukleinsäuremoleküle, die die Vielzahl von Phasenvarianten umfassen, wie hierin offenbart).
In einigen Fällen kann das Pull-Down-Tag einen Nukleinsäure-Barcode umfassen (z. B. auf einer oder beiden Seiten der Nukleinsäuresonde). Durch die Verwendung von Kügelchen oder Substraten, die Nukleinsäuresequenzen mit Komplementarität zum Nukleinsäure-Barcode enthalten, kann der Nukleinsäure-Barcode zum Pull-Down und Anreichern für beliebige Nukleinsäuresonden verwendet werden, die an ein zellfreies Zielnukleinsäuremolekül hybridisiert sind. Alternativ oder zusätzlich kann der Nukleinsäure-Barcode zur Identifizierung des zellfreien Zielnukleinsäuremoleküls aus beliebigen Sequenzierungsdaten (z. B. Sequenzierung durch Amplifikation) verwendet werden, die durch Verwendung eines der hierin offenbaren Nukleinsäuresondensätze erlangt wurden.
In einigen Fällen kann der Pull-Down-Tag Affinitätszielgruppe umfassen, die von einer Affinitätsbindungsgruppe spezifisch erkannt und gebunden werden kann. Die Affinitätsbindungsgruppe kann die Affinitätszielgruppe zur Bildung eines Affinitätspaares spezifisch binden. In einigen Fällen kann die Affinitätszielgruppe durch Verwendung von Kügelchen oder Substraten, die die Affinitätsbindungsgruppe umfassen, zum Pull-Down und zur Anreicherung beliebiger Nukleinsäuresonden verwendet werden, die an ein zellfreies Zielnukleinsäuremolekül hybridisiert sind. Alternativ kann der Pull-Down-Tag die Affinitätsbindungsgruppe umfassen, während die Kügelchen/Substrate die Affinitätszielgruppe umfassen können. Nicht einschränkende Beispiele für das Affinitätspaar können Biotin/Avidin, Antikörper/Antigen, Biotin/Streptavidin, Metall/Chelator, Ligand/Rezeptor, Nukleinsäure und Bindungsprotein sowie komplementäre Nukleinsäuren beinhalten. In einem Beispiel kann der Pull-Down-Tag Biotin umfassen.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen kann die Länge eines zellfreien Zielnukleinsäuremoleküls (z. B. cfDNA-Molekül), das von einer beliebigen Subjektnukleinsäuresonde heruntergezogen werden soll, etwa 100 Nukleotide bis etwa 200 Nukleotide betragen. Die Länge des zellfreien Zielnukleinsäuremoleküls kann wenigstens etwa 100 Nukleotide betragen. Die Länge des zellfreien Zielnukleinsäuremoleküls kann höchstens etwa 200 Nukleotide betragen. Die Länge des zellfreien Zielnukleinsäuremoleküls kann etwa 100 Nukleotide bis etwa 110 Nukleotide, etwa 100 Nukleotide bis etwa 120 Nukleotide, etwa 100 Nukleotide bis etwa 130 Nukleotide, etwa 100 Nukleotide bis etwa 140 Nukleotide, etwa 100 Nukleotide bis etwa 150 Nukleotide, etwa 100 Nukleotide bis etwa 160 Nukleotide betragen, etwa 100 Nukleotide bis etwa 170 Nukleotide, etwa 100 Nukleotide bis etwa 180 Nukleotide, etwa 100 Nukleotide bis etwa 190 Nukleotide, etwa 100 Nukleotide bis etwa 200 Nukleotide, etwa 110 Nukleotide bis etwa 120 Nukleotide, etwa 110 Nukleotide bis etwa 130 Nukleotide, etwa 110 Nukleotide bis etwa 140 Nukleotide, etwa 110 Nukleotide bis etwa 150 Nukleotide, etwa 110 Nukleotide bis etwa 160 Nukleotide, etwa 110 Nukleotide bis etwa 170 Nukleotide, etwa 110 Nukleotide bis etwa 180 Nukleotide, etwa 110 Nukleotide bis etwa 190 Nukleotide, etwa 110 Nukleotide bis etwa 200 Nukleotide, etwa 120 Nukleotide bis etwa 130 Nukleotide, etwa 120 Nukleotide bis etwa 140 Nukleotide, etwa 120 Nukleotide bis etwa 150 Nukleotide, etwa 120 Nukleotide bis etwa 160 Nukleotide, etwa 120 Nukleotide bis etwa 170 Nukleotide, etwa 120 Nukleotide bis etwa 180 Nukleotide, etwa 120 Nukleotide bis etwa 190 Nukleotide, etwa 120 Nukleotide bis etwa 200 Nukleotide, etwa 130 Nukleotide bis etwa 140 Nukleotide, etwa 130 Nukleotide bis etwa 150 Nukleotide, etwa 130 Nukleotide bis etwa 160 Nukleotide, etwa 130 Nukleotide bis etwa 170 Nukleotide, etwa 130 Nukleotide bis etwa 180 Nukleotide, etwa 130 Nukleotide bis etwa 190 Nukleotide, etwa 130 Nukleotide bis etwa 200 Nukleotide, etwa 140 Nukleotide bis etwa 150 Nukleotide, etwa 140 Nukleotide bis etwa 160 Nukleotide, etwa 140 Nukleotide bis etwa 170 Nukleotide, etwa 140 Nukleotide bis etwa 180 Nukleotide, etwa 140 Nukleotide bis etwa 190 Nukleotide, etwa 140 Nukleotide bis etwa 200 Nukleotide, etwa 150 Nukleotide bis etwa 160 Nukleotide, etwa 150 Nukleotide bis etwa 170 Nukleotide, etwa 150 Nukleotide bis etwa 180 Nukleotide, etwa 150 Nukleotide bis etwa 190 Nukleotide, etwa 150 Nukleotide bis etwa 200 Nukleotide, etwa 160 Nukleotide bis etwa 170 Nukleotide, etwa 160 Nukleotide bis etwa 180 Nukleotide, etwa 160 Nukleotide bis etwa 190 Nukleotide, etwa 160 Nukleotide bis etwa 200 Nukleotide, etwa 170 Nukleotide bis etwa 180 Nukleotide, etwa 170 Nukleotide bis etwa 190 Nukleotide, etwa 170 Nukleotide bis etwa 200 Nukleotide, etwa 180 Nukleotide bis etwa 190 Nukleotide, etwa 180 Nukleotide bis etwa 200 Nukleotide, oder etwa 190 Nukleotide bis etwa 200 Nukleotide betragen. Die Länge des zellfreien Zielnukleinsäuremoleküls kann etwa 100 Nukleotide, etwa 110 Nukleotide, etwa 120 Nukleotide, etwa 130 Nukleotide, etwa 140 Nukleotide, etwa 150 Nukleotide, etwa 160 Nukleotide, etwa 170 Nukleotide, etwa 180 Nukleotide, etwa 190 Nukleotide oder etwa 200 Nukleotide betragen. In einigen Beispielen kann die Länge des zellfreien Zielnukleinsäuremoleküls zwischen etwa 100 Nukleotiden und etwa 180 Nukleotiden liegen.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen können die Genombereiche mit einer Erkrankung assoziiert sein. Die Genombereiche können als aberrante somatische Hypermutation aufweisend bestimmt werden, wenn ein Proband die Erkrankung hat. Die Erkrankung kann zum Beispiel ein B-Zell-Lymphom oder eine Unterform davon umfassen, wie das diffuse großzellige B-Zell-Lymphom, das follikuläre Lymphom, das Burkitt-Lymphom und die chronische lymphatische B-Zell-Leukämie. Weitere Einzelheiten zu dieser Erkrankung sind nachfolgend angegeben.
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst die Zusammensetzung ferner eine Vielzahl von zellfreien Nukleinsäuremolekülen (z. B. cfDNA), die von dem Subjekt erlangt oder abgeleitet wurden.
E. Diagnostische oder therapeutische Anwendungen
Mehrere Ausführungsformen sind auf die Durchführung eines diagnostischen Scans der zellfreien Nukleinsäuren eines Individuums und anschließend, basierend auf den Krebs indizierenden Ergebnissen des Scans, auf die Durchführung weiterer klinischer Verfahren und/oder die Behandlung des Individuums gerichtet. Gemäß verschiedener Ausführungsformen können zahlreiche Arten von Neoplasmen nachgewiesen werden.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren, kann das Verfahren ferner die Bestimmung, dass der Proband die Erkrankung hat oder die Bestimmung eines Grades oder Status der Erkrankung des Subjekts, basierend auf dem einen oder mehreren zellfreien Nukleinsäuremolekülen, die die Vielzahl von Phasenvarianten umfassen, umfassen. In einigen Fällen kann das Verfahren ferner die Bestimmung umfassen, dass das eine oder die mehreren zellfreien Nukleinsäuremoleküle (die jeweils als eine Vielzahl von Phasenvarianten umfassend identifiziert wurden) aus einer mit der Erkrankung (z. B. Krebs) assoziierten Probe abgeleitet sind, basierend auf einer statistischen Modellanalyse (d. h. einer molekularen Analyse). Das Verfahren kann beispielsweise die Verwendung eines oder mehrerer Algorithmen (z. B. Monte-Carlos-Simulation) zur Bestimmung einer ersten Wahrscheinlichkeit, dass eine zellfreie Nukleinsäure, die als eine Vielzahl von Phasenvarianten umfassend identifiziert wurde, mit einer ersten Erkrankung assoziiert ist oder von ihr stammt (z. B. 80%), und einer zweiten Wahrscheinlichkeit, dass dieselbe zellfreie Nukleinsäure mit einer zweiten Erkrankung assoziiert ist oder von einer zweiten Erkrankung (oder von einer gesunden Zelle) stammt ist (z. B. 20%), umfassen. In einigen Fällen kann das Verfahren die Bestimmung einer Wahrscheinlichkeit, dass der Proband eine oder mehrere Erkrankungen hat, basierend auf der Analyse des einen oder der mehreren zellfreien Nukleinsäuremoleküle, von denen jedes als eine Vielzahl von Phasenvarianten umfassend identifiziert wurde, umfassen (d. h. eine Makro- oder globale Analyse). Zum Beispiel kann das Verfahren die Verwendung eines oder mehrerer Algorithmen (z. B. umfassend ein oder mehrere mathematische Modelle, wie hierin offenbart, wie z. B. Binomialstichproben) zur Analyse einer Vielzahl zellfreier Nukleinsäuremoleküle umfassen, von denen jedes als eine Vielzahl von Phasenvarianten umfassend identifiziert wurde, um dadurch eine erste Wahrscheinlichkeit des Subjekts, eine erste Erkrankung zu haben (z. B. 80 %) und eine zweite Wahrscheinlichkeit des Subjekts, eine zweite Erkrankung zu haben (oder gesund zu sein) (z. B. 20 %) zu bestimmen.
Die hierin offenbarte statistische Modellanalyse kann eine Näherungslösung durch eine numerische Annäherung wie ein binomiales Modell, ein ternäres Modell, eine Monte-Carlo-Simulation oder ein Finite-Differenzen-Verfahren sein. In einem Beispiel kann die hierin verwendete statistische Modellanalyse eine statistische Monte-Carlo-Analyse sein. In einem anderen Beispiel kann die hierin verwendete statistische Modellanalyse eine binomiale oder ternäre Modellanalyse sein.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das Verfahren die Überwachung eines Verlaufs der Erkrankung des Subjekts basierend auf dem einen oder mehreren identifizierten zellfreien Nukleinsäuremolekülen umfassen, sodass jedes der identifizierten zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten umfasst. In einigen Fällen kann der Verlauf der Erkrankung eine Verschlimmerung der Erkrankung sein, wie in der vorliegenden Offenbarung beschrieben (z. B. die Entwicklung von Krebs im Stadium I zu Krebs im Stadium III). In einigen Fällen kann der Verlauf der Erkrankung wenigstens eine Teilremission der Erkrankung sein, wie in der vorliegenden Offenbarung beschrieben (z. B. Downstaging von Krebs im Stadium IV zu Krebs im Stadium II). Alternativ kann in manchen Fällen der Verlauf der Erkrankung zwischen zwei verschiedenen Zeitpunkten im Wesentlichen gleich bleiben, wie in der vorliegenden Offenbarung beschrieben. In einem Beispiel kann das Verfahren die Bestimmung von Wahrscheinlichkeiten oder Wahrscheinlichkeiten verschiedener Verläufe der Erkrankung des Subjekts umfassen. Das Verfahren kann beispielsweise die Verwendung eines oder mehrerer Algorithmen (z. B. umfassend ein oder mehrere hierin offenbarte mathematische Modelle, wie z. B. Binomialstichproben) zur Bestimmung einer ersten Wahrscheinlichkeit, dass die Erkrankung des Subjekts schlechter ist als zuvor (z. B. 20 %), einer zweiten Wahrscheinlichkeit einer zumindest Teilremission der Erkrankung (z. B. 70 %) und einer dritten Wahrscheinlichkeit, dass die Erkrankung des Subjekts unverändert ist (z. B. 10 %), umfassen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das Verfahren die Durchführung eines anderen Verfahrens (z. B. Folgediagnoseverfahren) umfassen, um die Erkrankung des Subjekts, welche Erkrankung bestimmt wurde und/oder des beobachteteten Verlaufs davon zu bestätigen, wie in der vorliegenden Offenbarung vorgesehen. Nicht einschränkende Beispiele für ein anderes Verfahren können eine körperliche Untersuchung, eine medizinische Bildgebung, einen Gentest, eine Mammographie, eine Endoskopie, eine Stuhlprobe, einen Pap-Test, einen Alpha-Fetoprotein-Bluttest, einen CA-125-Test, einen Test auf prostataspezifisches Antigen (PSA), eine Biopsieentnahme, eine Knochenmarkspunktion und Tests zum Nachweis von Tumormarkern beinhalten. Die medizinische Bildgebung beinhaltet (ist aber nicht beschränkt auf) Röntgen, Magnetresonanztomographie (MRT), Computertomographie (CT), Ultraschall und Positronen-Emissions-Tomographie (PET). Die Endoskopie beinhaltet (ist aber nicht beschränkt auf) Bronchoskopie, Koloskopie, Kolposkopie, Zystoskopie, Ösophagoskopie, Gastroskopie, Laparoskopie, Neuroendoskopie, Proktoskopie und Sigmoidoskopie.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das Verfahren die Bestimmung einer Behandlung für die Erkrankung des Subjekts basierend auf dem einen oder mehreren identifizierten zellfreien Nukleinsäuremolekülen umfassen, wobei jedes identifizierte zellfreie Nukleinsäuremolekül eine Vielzahl von Phasenvarianten umfasst. In einigen Fällen kann die Behandlung basierend auf (i) der bestimmten Erkrankung des Subjekts und/oder (ii) dem bestimmten Verlauf der Erkrankung des Subjekts bestimmt werden. Darüber hinaus kann die Behandlung basierend auf einem oder mehreren der folgenden zusätzlichen Faktoren bestimmt werden: Geschlecht, Nationalität, Alter, ethnische Zugehörigkeit und andere körperliche Erkrankungen des Subjekts. In einigen Beispielen kann die Behandlung basierend auf einem oder mehreren Merkmalen der Vielzahl von Phasenvarianten der identifizierten zellfreien Nukleinsäuremoleküle, wie hierin offenbart, bestimmt werden.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren darf der Proband keiner Behandlung der Erkrankung unterzogen worden sein, d. h. der Proband darf nicht mit der Erkrankung (z. B. einem Lymphom) diagnostiziert worden sein. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Proband vor einem beliebigen Subjektverfahren der vorliegenden Offenbarung einer Behandlung der Erkrankung unterzogen worden sein. In einigen Fällen können die hierin offenbarten Verfahren zur Überwachung des Verlaufs der bei dem Subjekt diagnostizierten Erkrankung durchgeführt werden, um (i) die Wirksamkeit der bisherigen Behandlung zu bestimmen und (ii) zu beurteilen, ob die Behandlung beibehalten, modifiziert oder zugunsten einer neuen Behandlung abgebrochen werden soll.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können nicht einschränkende Beispiele für eine Behandlung (z. B. frühere Behandlung, neue Behandlung, die basierend auf den Verfahren der vorliegenden Offenbarung zu bestimmen ist, usw.) Chemotherapie, Radiotherapie, Chemoradiotherapie, Immuntherapie, adoptive Zelltherapie (z. B. chimäre Antigenrezeptor-(CAR-)T-Zelltherapie, CAR-NK-Zelltherapie, modifizierte T-Zellrezeptor-(TCR-)T-Zelltherapie usw.), Hormontherapie, gezielte Arzneimitteltherapie, Operation, Transplantation, Transfusion oder medizinische Überwachung beinhalten.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Erkrankung eine Erkrankung umfassen. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Erkrankung Neoplasma, Krebs oder Tumor umfassen. In einem Beispiel kann die Erkrankung einen soliden Tumor umfassen. In einem anderen Beispiel kann die Erkrankung ein Lymphom, wie das B-Zell-Lymphom (BCL), umfassen. Nicht einschränkende Beispiele für BCL können das diffuse großzellige B-Zell-Lymphom (DLBCL), das follikuläre Lymphom (FL), das Burkitt-Lymphom (BL), die chronische lymphatische B-Zell-Leukämie (CLL), das Marginalzonen-B-Zell-Lymphom (MZL) und das Mantelzell-Lymphom (MCL) beinhalten.
Wie hierin offenbart, kann die Behandlung einer Erkrankung eines Subjekts die Verabreichung eines oder mehrerer therapeutischer Mittel an den Subjekt umfassen. Das eine oder die mehreren therapeutischen Arzneimittel können dem Subjekt auf eine oder mehrere der folgenden Arten verabreicht werden: oral, intraperitoneal, intravenös, intraarteriell, transdermal, intramuskulär, liposomal, über eine lokale Verabreichung mittels Katheter oder Stent, subkutan, intraadiposal und intrathekal.
Nicht einschränkende Beispiele für therapeutische Arzneimittel können zytotoxische Wirkstoffe, Chemotherapeutika, wachstumshemmende Wirkstoffe, in der Strahlentherapie verwendete Wirkstoffe, Anti-Angiogenese-Wirkstoffe, apoptotische Wirkstoffe, Anti-Tubulin-Wirkstoffe und andere Wirkstoffe zur Behandlung von Krebs beinhalten, zum Beispiel Anti-CD20-Antikörper, Anti-PD1-Antikörper (z. B., Pembrolizumab), Thrombozyten-Wachstumsfaktor-Inhibitoren (z. B. GLEEVEC™ (Imatinib Mesylat)), ein COX-2-Inhibitor (z. B. Celecoxib), Interferone, Zytokine, Antagonisten (z. B. neutralisierende Antikörper), die an eines oder mehrere der folgenden Ziele binden PDGFR-ß, BlyS, APRIL, BCMA-Rezeptor(en), TRAIL/Apo2, andere bioaktive und organischchemische Wirkstoffe und dergleichen.
Nicht einschränkende Beispiele für ein zytotoxisches Agens können radioaktive Isotope (z. B. At211, I131, 1125, Y90, Re186, Re188, Sm153, Bi212, P32 und radioaktive Isotope von Lu), Chemotherapeutika, z. B., Methotrexat, Adriamycin, Vinca-Alkaloide (Vincristin, Vinblastin, Etoposid), Doxorubicin, Melphalan, Mitomycin C, Chlorambucil, Daunorubicin oder andere Interkalationsmittel, Enzyme und Fragmente davon wie nukleolytische Enzyme, Antibiotika und Toxine wie niedermolekulare Toxine oder enzymatisch aktive Toxine bakteriellen, pilzlichen, pflanzlichen oder tierischen Ursprungs beinhalten.
Nicht einschränkende Beispiele eines chemotherapeutischen Agens können Alkylierungsmittel wie Thiotepa und CYTOXAN® Cyclophosphamid; Alkylsulfonate wie Busulfan, Improsulfan und Piposulfan; Aziridine wie Benzodopa, Carboquon, Meturedopa und Uredopa; Ethylenimine und Methylamelamine einschließlich Altretamin, Triethylenemelamin, Triethylenphosphoramid, Triethiylenthiophosphoramid und Trimethylolmelamin; Acetogenine (insbesondere Bullatacin und Bullatacinon); Delta-9-Tetrahydrocannabinol (Dronabinol, MARINOL®); Beta-Lapachon; Lapachol; Colchicine; Betulinsäure; Camptothecin (einschließlich des synthetischen Analogons Topotecan (HYCAMTIN®), CPT-11 (Irinotecan, CAMPTOSAR®), Acetylcamptothecin, Scopolectin und 9-Aminocamptothecin); Bryostatin; Callystatin; CC-1065 (einschließlich seiner synthetischen Analoga Adozelesin, Carzelesin und Bizelesin); Podophyllotoxin; Podophyllinsäure; Teniposid; Cryptophycine (insbesondere Cryptophycin 1 und Cryptophycin 8); Dolastatin; Duocarmycin (einschließlich der synthetischen Analoga KW-2189 und CB1-TM1); Eleutherobin; Pancratistatin; ein Sarkodictyin; Spongistatin; Stickstoffsenf wie Chlorambucil, Chlornaphazin, Cyclophosphamid, Estramustin, Ifosfamid, Mechlorethamin, Mechlorethaminoxidhydrochlorid, Melphalan, Novembichin, Phenesterin, Prednimustin, Trofosfamid, Uracil Senf; Nitrosoharnstoffe wie Carmustin, Chlorozotocin, Fotemustin, Lomustin, Nimustin und Ranimnustin; Antibiotika wie die Enediyne-Antibiotika; Dynemicin, einschließlich Dynemicin A; ein Espiramicina; sowie Neocarzinostatin Chromophor und verwandte Chromoproteine enediyne Antibiotika-Chromophore), Aclacinomycine, Actinomycin, Anthramycin, Azaserin, Bleomycine, Cactinomycin, Carabicin, Carminomycin, Carzinophilin, Chromomycinis, Dactinomycin, Daunorubicin, Detorubicin, 6-Diazo-5-oxo-L-Norleucin, ADRIAMYCIN® Doxorubicin (einschließlich Morpholino-Doxorubicin, Cyanomorpholino-Doxorubicin, 2-Pyrrolino-Doxorubicin und Deoxydoxorubicin), Epirubicin, Esorubicin, Idarubicin, Marcellomycin, Mitomycine wie Mitomycin C, Mycophenolsäure, Nogalamycin, Olivomycine, Peplomycin, Potfiromycin, Puromycin, Quelamycin, Rodorubicin, Streptonigrin, Streptozocin, Tubercidin, Ubenimex, Zinostatin, Zorubicin; Anti-Metaboliten wie Methotrexat und 5-Fluorouracil (5-FU); Folsäure-Analoga wie Denopterin, Methotrexat, Pteropterin, Trimetrexat; Purin-Analoga wie Fludarabin, 6-Mercaptopurin, Thiamiprin, Thioguanin; Pyrimidin-Analoga wie Ancitabin, Azacitidin, 6-Azauridin, Carmofur, Cytarabin, Dideoxyuridin, Doxifluridin, Enocitabin, Floxuridin; Androgene wie Calusteron, Dromostanolonpropionat, Epitiostanol, Mepitiostan, Testolacton; Antiadrenale wie Aminoglutethimid, Mitotan, Trilostan; Folsäureauffüller wie Folinsäure; Aceglatone; Aldophosphamidglykosid; Aminolävulinsäure; Eniluracil; Amsacrine; Bestrabucil; Bisantren; Edatraxat; Defofamin; Demecolcin; Diaziquon; Eflornithin; Elliptiniumacetat; ein Epothilon; Etoglucid; Galliumnitrat; Hydroxyharnstoff; Lentinan; Lonidainin; Maytansinoide wie Maytansin und Ansamitocine; Mitoguazon; Mitoxantron; Mopidanmol; Nitraerin; Pentostatin; Phenamet; Pirarubicin; Losoxantron; 2-Ethylhydrazid; Procarbazin; PSK® Polysaccharid-Komplex (JHS Natural Products, Eugene, Oreg.); Razoxan; Rhizoxin; Sizofiran; Spirogermanium; Tenuazonsäure; Triazichon; 2,2',2''-Trichlortriethylamin; Trichothecene (insbesondere T-2-Toxin, Verrucarin A, Roridin A und Anguidin); Urethan; Vindesin (ELDISINE®, FILDESIN®); Dacarbazin; Mannomustin; Mitobronitol; Mitolactol; Pipobroman; Gacytosin; Arabinosid („Ara-C“); Thiotepa; Taxoide, zum Beispiel Taxane, die TAXOL® Paclitaxel (Bristol-Myers Squibb Oncology, Princeton, N. J.), ABRAXANE™ Cremophor-freie, Albuminentwickelte Nanopartikel-Formulierung von Paclitaxel (American Pharmaceutical Partners, Schaumberg, Ill.) und TAXOTEREE Docetaxel (Rhöne-Poulenc Rorer, Antony, Frankreich); Chlorambucil; Gemcitabin (GEMZAR®); 6-Thioguanin; Mercaptopurin; Methotrexat; Platinanaloga wie Cisplatin und Carboplatin; Vinblastin (VELBAN®); Platin; Etoposid (VP-16); Ifosfamid; Mitoxantron; Vincristin (ONCOVIN®); Oxaliplatin; Leucovovin; Vinorelbin (NAVELBINE®); Novantron; Edatrexat; Daunomycin; Aminopterin; Ibandronat; Topoisomerasehemmer RFS 2000; Difluormethylornithin (DMFO); Retinoide wie Retinsäure; Capecitabin (XELODA®); pharmazeutisch verträgliche Salze, Säuren oder Derivate beliebiger der Vorgenannten; sowie Kombinationen von zwei oder mehreren der Vorgenannten wie CHOP, eine Abkürzung für eine kombinierte Therapie aus Cyclophosphamid, Doxorubicin, Vincristin und Prednisolon, und FOLFOX, eine Abkürzung für ein Behandlungsschema mit Oxaliplatin (ELOXATlN™) in Kombination mit 5-FU und Leucovorin, beinhalten.
Beispiele für ein chemotherapeutisches Agens können auch „antihormonelle Agenzien“ oder „endokrine Therapeutika“ beinhalten, die darauf abzielen, die Wirkung von Hormonen, die das Krebswachstum fördern können, zu regulieren, zu reduzieren, zu blockieren oder zu hemmen, und die häufig in Form einer systemischen oder Ganzkörperbehandlung verabreicht werden. Sie können selbst Hormone sein. Beispiele beinhalten Anti-Östrogene und selektive Östrogenrezeptormodulatoren (SERMs), einschließlich beispielsweise Tamoxifen (einschließlich NOLVADEX® Tamoxifen), EVISTA® Raloxifen, Droloxifen, 4-Hydroxytamoxifen, Trioxifen, Keoxifen, LY117018, Onapriston und FARESTON® Toremifen; Anti-Progesterone; Östrogenrezeptor-Down-Regulatoren (ERDs); Agenzien zur Unterdrückung oder Abschaltung der Eierstöcke, zum Beispiel Leutinisierungshormon-Releasing-Hormon-(LHRH-)Agonisten wie LUPRON® und ELIGARD), Leuprolidacetat, Goserelinacetat, Buserelinacetat und Tripterelin; andere Antiandrogene wie Flutamid, Nilutamid und Bicalutamid; und Aromatasehemmer, die das die Östrogenproduktion in den Nebennieren regulierende Enzym Aromatase hemmen, wie z. B. 4(5)-Imidazole, Aminoglutethimid, MEGASEE Megestrolacetat, AROMASIN® Exemestan, Formestanie, Fadrozol, RIVISOR® Vorozol, FEMARAE Letrozol und ARIMIDEX® Anastrozol. Darüber hinaus beinhaltet diese Definition von chemotherapeutischen Agenzien Bisphosphonate wie Clodronat (zum Beispiel BONEFOS® oder OSTAC®), DIDROCAL® Etidronat, NE-58095, ZOMFTA® Zoledronsäure/Zoledronat, FOSAMAX® Alendronat, AREDIA® Pamidronat, SKELID® Tiludronat oder ACTONEL® Risedronat; sowie Troxacitabin (ein 1,3-Dioxolan-Nukleosid-Cytosin-Analogon); Antisense-Oligonukleotide, insbesondere solche, die die Expression von Genen in Signalwegen hemmen, die an der abnormen Zellproliferation beteiligt sind, wie z.B. PKC-alpha, Raf, H-Ras und der epidermale Wachstumsfaktor-Rezeptor (EGFR); Impfstoffe wie THERATOPE®-Impfstoff und Gentherapie-Impfstoffe, z.B. ALLOVECTIN®-Impfstoff, LEUVECTIN®-Impfstoff und VAXID®-Impfstoff; LURTOTECAN®-Topoisomerase-1-Inhibitor; ABARELIX® rmRH; Lapatinib-Ditosylat (ein niedermolekularer ErbB-2- und EGFR-Dual-Tyrosinkinase-Inhibitor, der auch als GW572016 bekannt ist); und pharmazeutisch verträgliche Salze, Säuren oder Derivate beliebiger der Vorgenannten.
Beispiele für ein chemotherapeutisches Agens können auch Antikörper wie Alemtuzumab (Campath), Bevacizumab (AVASTIN®, Genentech); Cetuximab (ERBITUX®, Imclone); Panitumumab (VECTIBIX®, Amgen), Rituximab (RITUXAN®, Genentech/Biogen Idee), Pertuzumab (OMNITARG®, 2C4, Genentech), Trastuzumab (HERCEPTIN®, Genentech), Tositumomab (Bexxar, Corixia) und das Antikörper-Konjugat Gemtuzumab Ozogamicin (MYLOTARG®, Wyeth) beinhalten. Weitere humanisierte monoklonale Antikörper mit therapeutischem Potenzial als Agenzien in Kombination mit den Verbindungen der Erfindung beinhalten: Apolizumab, Aselizumab, Atlizumab, Bapineuzumab, Bivatuzumab Mertansin, Cantuzumab Mertansin, Cedelizumab, Certolizumab Pegol, Cidfusituzumab, Cidtuzumab, Daclizumab, Eculizumab, Efalizumab, Epratuzumab, Erlizumab, FeMzumab, Fontolizumab, Gemtuzumab Ozogamicin, Inotuzumab Ozogamicin, Ipilimumab, Labetuzumab, Lintuzumab, Matuzumab, Mepolizumab, Motavizumab, Motovizumab, Natalizumab, Nimotuzumab, Nolovizumab, Numavizumab, Ocrelizumab, Omalizumab, Palivizumab, Pascolizumab, Pecfusituzumab, Pectuzumab, Pexelizumab, Ralivizumab, Ranibizumab, Reslivizumab, Reslizumab, Resyvizumab, Rovelizumab, Ruplizumab, Sibrotuzumab, Siplizumab, Sontuzumab, Tacatuzumab Tetraxetan, Tadocizumab, Talizumab, Tefibazumab, Tocilizumab, Toralizumab, Tucotuzumab Celmoleukin, Tucusituzumab, Umavizumab, Urtoxazumab, Ustekinumab, Visilizumab und das Anti-Interleukin-12 (ABT-874/J695, Wyeth Research und Abbott Laboratories), bei dem es sich um einen rekombinanten, ausschließlich humanen IgG1λ-Antikörper in voller Länge handelt, der genetisch modifiziert wurde, um das Interleukin-12 p40-Protein zu erkennen.
Beispiele für ein chemotherapeutisches Agens können auch „Tyrosinkinase-Inhibitoren“ wie ein EGFR-Targeting-Agens (z. B. kleines Molekül, Antikörper, usw.); einen niedermolekularen HER2-Tyrosinkinase-Inhibitor wie TAK165 von Takeda; CP-724.714, einen oralen selektiven Inhibitor der ErbB2-Rezeptor-Tyrosinkinase (Pfizer und OSI); Dual-HER-Inhibitoren wie EKB-569 (erhältlich von Wyeth), der bevorzugt EGFR bindet, aber sowohl HER2 als auch EGFR-überexprimierende Zellen inhibiert; Lapatinib (GSK572016; erhältlich von Glaxo-SmithKline), einen oralen HER2- und EGFR-Tyrosinkinase-Inhibitor; PKI-166 (erhältlich von Novartis); Pan-HER-Inhibitoren wie Canertinib (CI-1033; Pharmacia); Raf-1-Inhibitoren wie der von ISIS Pharmaceuticals erhältliche Antisense-Wirkstoff ISIS-5132, der die Raf-1-Signalübertragung inhibiert; nicht-HER-zielgerichtete TK-Hemmer wie Imatinib-Mesylat (GLEEVEC®, erhältlich von Glaxo SmithKline); Multi-Targeting-Tyrosinkinase-Inhibitoren wie Sunitinib (SUTENT®, erhältlich von Pfizer); VEGF-Rezeptor-Tyrosinkinase-Inhibitoren wie Vatalanib (PTK787/ZK222584, erhältlich von Novartis/Schering AG); MAPK extrazellulärer regulierter Kinase-I-Inhibitor CI-1040 (erhältlich von Pharmacia); Chinazoline wie PD 153035,4-(3-Chloranilino)-chinazolin; Pyridopyrimidine; Pyrimidopyrimidine; Pyrrolopyrimidine, wie CGP 59326, CGP 60261 und CGP 62706; Pyrazolopyrimidine, 4-(Phenylamino)-7H-Pyrrolo[2,3-d]pyrimidine; Curcumin (Diferuloylmethan, 4,5-bis-(4-fluoranilino)phthalimid); Tyrphostine mit Nitrothiophenanteilen; PD-0183805 (Warner-Lamber); Antisense-Moleküle (z. B. die an HERkodierende Nukleinsäure binden); Chinoxaline ( US-Pat. Nr. 5,804,396 ); Tryphostine ( US-Pat. Nr. 5,804,396 ); ZD6474 (Astra Zeneca); PTK-787 (Novartis/Schering AG); Pan-HER-Inhibitoren wie CI-1033 (Pfizer); Affinitac (ISIS 3521; Isis/Lilly); Imatinib-Mesylat (GLEEVEC®); PKI 166 (Novartis); GW2016 (Glaxo SmithKline); CI-1033 (Pfizer); EKB-569 (Wyeth); Semaxinib (Pfizer); ZD6474 (AstraZeneca); PTK-787 (Novartis/Schering AG); INC-1C11 (Imclone); und Rapamycin (Sirolimus, RAPAMUNE®) beinhalten.
Beispiele für ein chemotherapeutisches Agens können auch Dexamethason, Interferone, Colchicin, Metoprin, Cyclosporin, Amphotericin, Metronidazol, Alemtuzumab, Alitretinoin, Allopurinol, Amifostin, Arsentrioxid, Asparaginase, BCG live, Bevacuzimab, Bexarotene, Cladribin, Clofarabin, Darbepoetin alfa, Denileukin, Dexrazoxan, Epoetin alfa, Elotinib, Filgrastim, Histrelinacetat, Ibritumomab, Interferon alfa-2a, Interferon alfa-2b, Lenalidomid, Levamisol, Mesna, Methoxsalen, Nandrolon, Nelarabin, Nofetumomab, Oprelvekin, Palifermin, Pamidronat, Pegademase, Pegaspargase, Pegfilgrastim, Pemetrexed Dinatrium, Plicamycin, Porfimer-Natrium, Quinacrin, Rasburicase, Sargramostim, Temozolomid, VM-26, 6-TG, Toremifen, Tretinoin, ATRA, Valrubicin, Zoledronat und Zoledronsäure und pharmazeutisch akzeptable Salze davon beinhalten
Beispiele für ein chemotherapeutisches Agens können auch Hydrocortison, Hydrocortisonacetat, Cortisonacetat, Tixocortolpivalat, Triamcinolonacetonid, Triamcinolonalkohol, Mometason, Amcinonid, Budesonid, Desonid, Fluocinonid, Fluocinolonacetonid, Betamethason, Betamethason-Natriumphosphat, Dexamethason, Dexamethason-Natriumphosphat, Fluocortolon, Hydrocortison-17-butyrat, Hydrocortison-17-valerat, Aclometasondipropionat, Betamethasonvalerat, Betamethasondipropionat, Prednicarbat, Clobetason-17-butyrat, Clobetasol-17-propionat, Fluocortoloncaproat, Fluocortolonpivalat und Fluprednidenacetat: immunselektive entzündungshemmende Peptide (ImSAIDs) wie Phenylalanin-Glutamin-Glycin (FEG) und seine D-isomere Form (feG) (IMULAN BioTherapeutics, LLC); Antirheumatika wie Azathioprin, Ciclosporin (Cyclosporin A), D-Penicillamin, Goldsalze, Hydroxychloroquin, Leflunomideminocyclin, Sulfasalazin, Tumornekrosefaktor-alpha (TNFa)-Blocker wie Etanercept (ENBREL®), Infliximab (REMICADE®), Adalimumab (HUMIRA®), Certolizumab Pegol (CIMZIA®), Golimumab (SIMPONI®), Interleukin 1-(IL-1-)Blocker wie Anakinra (KINERET®), T-Zell-Kostimulationsblocker wie Abatacept (ORENCIA®), Interleukin 6-(IL-6-)Blocker wie Tocilizumab (ACTEMERA®); Interleukin 13-(IL-13-)Blocker wie Lebrikizumab; Interferon alpha-(IFN-)Blocker wie Rontalizumab; Beta-7-Integrin-Blocker wie rhuMAb Beta7; IgE-Signalweg-Blocker wie Anti-M1 prime; sekretierte homotrimere LTa3- und membrangebundene heterotrimere LTa/ß2-Blocker wie Anti-lymphotoxin alpha (LTa); verschiedene Prüfagenzien wie Thioplatin, PS-341, Phenylbutyrat, ET-18-OCH3 oder Famesyltransferase-Inhibitoren (L-739749, L-744832); Polyphenole wie Quercetin, Resveratrol, Piceatannol, Epigallocatechingallat, Theaflavine, Flavanole, Procyanidine, Betulinsäure und Derivate davon; Autophagie-Inhibitoren wie Chloroquin; Delta-9-Tetrahydrocannabinol (Dronabinol, MARINOL®); Beta-Lapachon; Lapachol; Colchicine; Betulinsäure; Acetylcamptothecin, Scopolectin und 9-Aminocamptothecin); Podophyllotoxin; Tegafur (UFTORAL®); Bexarotin (TARGRETIN®); Bisphosphonate wie Clodronat (zum Beispiel BONEFOS® oder OSTAC®), Etidronat (DIDROCAL®), NE-58095, Zoledronsäure/Zoledronat (ZOMETA®), Alendronat (FOSAMAX®), Pamidronat (AREDIA®), Tiludronat (SKELID®) oder Risedronat (ACTONEL®); und epidermaler Wachstumsfaktor-Rezeptor (EGF-R); Impfstoffe wie der THERATOPE®-Impfstoff; Perifosin, COX-2-Inhibitoren (z. g., Celecoxib oder Etoricoxib), Proteosom-Inhibitor (z. B., PS341); CCI-779; Tipifamib (R11577); Orofenib, ABT510; Bcl-2-Inhibitor wie Oblimersen-Natrium (GENASENSE®); Pixantron; Famesyltransferase-Inhibitoren wie Lonafamib (SCH 6636, SARASAR™); und pharmazeutisch verträgliche Salze, Säuren oder Derivate beliebiger der oben genannten; sowie Kombinationen von zwei oder mehreren der oben genannten beinhalten.
Gemäß vieler Ausführungsformen kann, sobald eine Krebsdiagnose indiziert ist, eine Reihe von Behandlungen durchgeführt werden, einschließlich (aber nicht beschränkt auf) Operation, Resektion, Chemotherapie, Strahlentherapie, Immuntherapie, gezielte Therapie, Hormontherapie, Stammzellentransplantation und Bluttransfusion. In einigen Ausführungsformen wird ein Antikrebs- und/oder chemotherapeutisches Agens verabreicht, einschließlich (aber nicht beschränkt auf) alkylierende Agenzien, Platin-Agenzien, Taxane, Vinca-Agenzien, Anti-Östrogen-Medikamente, Aromatase-Inhibitoren, Ovarial-Suppressions-Agenzien, endokrine/hormonelle Agenzien, Bisphophonat-Therapie-Agenzien und gezielte biologische Therapie-Agenzien. Medikamente beinhalten (sind aber nicht beschränkt auf) Cyclophosphamid, Fluorouracil (oder 5-Fluorouracil oder 5-FU), Methotrexat, Thiotepa, Carboplatin, Cisplatin, Taxane, Paclitaxel, proteingebundenes Paclitaxel, Docetaxel, Vinorelbin, Tamoxifen, Raloxifen, Toremifen, Fulvestrant, Gemcitabin, Irinotecan, Ixabepilon, Temozolomid, Topotecan, Vincristin, Vinblastin, Eribulin, Mutamycin, Capecitabin, Capecitabin, Anastrozol, Exemestan, Letrozol, Leuprolid, Abarelix, Buserelin, Goserelin, Megestrolacetat, Risedronat, Pamidronat, Ibandronat, Alendronat, Zoledronat, Tykerb, Daunorubicin, Doxorubicin, Epirubicin, Idarubicin, Valrubicin Mitoxantron, Bevacizumab, Cetuximab, Ipilimumab, Ado-Trastuzumab Emtansin, Afatinib, Aldesleukin, Alectinib, Alemtuzumab, Atezolizumab, Avelumab, Axtinib, Belimumab, Belinostat, Bevacizumab, Blinatumomab, Bortezomib, Bosutinib, Brentuximab Vedotin, Brigatinib, Cabozantinib, Canakinumab, Carfilzomib, Certinib, Cetuximab, Cobimetinib, Crizotinib, Dabrafenib, Daratumumab, Dasatinib, Denosumab, Dinutuximab, Durvalumab, Elotuzumab, Enasidenib, Erlotinib, Everolimus, Gefitinib, Ibritumomab Tiuxetan, Ibrutinib, Iidelalisib, Imatinib, Ipilimumab, Ixazomib, Lapatinib, Lenvatinib, Midostaurin, Necitumumab, Neratinib, Nilotinib, Niraparib, Nivolumab, Obinutuzumab, Ofatumumab, Olaparib, Olaratumab, Osimertinib, Palbociclib, Panitumumab, Panobinostat, Pembrolizumab, Pertuzumab, Ponatinib, Ramucirumab, Regorafenib, Ribociclib, Rituximab, Romidepsin, Rucaparib, Ruxolitinib, Siltuximab, Sipuleucel-T, Sonidegib, Sorafenib, Temsirolimus, Tocilizumab, Tofacitinib, Tositumomab, Trametinib, Trastuzumab, Vandetanib, Vemurafenib, Venetoclax, Vismodegib, Vorinostat und Ziv-Aflibercept. Gemäß verschiedener Ausführungsformen kann ein Individuum mit einem einzelnen Medikament oder einer Kombination von hierin beschriebenen Medikamenten behandelt werden. Eine gängige Behandlungskombination ist Cyclophosphamid, Methotrexat und 5-Fluorouracil (CMF).
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann jedes der zellfreien Nukleinsäuremoleküle (z. B. cfDNA, cfRNA) aus einer Zelle abgeleitet werden. Zum Beispiel kann eine Zell- oder Gewebeprobe von einem Subjekt erlangt und zur Entfernung aller Zellen aus der Probe verarbeitet werden, wodurch zellfreie Nukleinsäuremoleküle aus der Probe abgeleitet werden.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann eine Referenzgenomsequenz aus einer Zelle eines Individuums abgeleitet werden. Das Individuum kann eine gesunde Kontrolle oder der Proband sein, der den hierin offenbarten Verfahren zur Bestimmung oder Überwachung des Verlaufs einer Erkrankung unterzogen wird.
Eine Zelle kann eine gesunde Zelle sein. Alternativ kann eine Zelle eine erkrankte Zelle sein. Eine erkrankte Zelle kann veränderte Stoffwechsel-, Genexpressions- und/oder morphologische Merkmale aufweisen. Eine erkrankte Zelle kann eine Krebszelle, eine diabetische Zelle oder eine apoptotische Zelle sein. Eine erkrankte Zelle kann eine Zelle von einem erkrankten Subjekt sein. Beispielhafte Krankheiten können Blutkrankheiten, Krebskrankheiten, Stoffwechselstörungen, Augenkrankheiten, Organstörungen, Krankheiten des Bewegungsapparats, Herzkrankheiten und dergleichen beinhalten.
Eine Zelle kann eine Säugetierzelle sein oder aus einer Säugetierzelle abgeleitet sein. Eine Zelle kann eine Nagetierzelle sein oder aus einer Nagetierzelle abgeleitet sein. Eine Zelle kann eine menschliche Zelle sein oder aus einer menschlichen Zelle abgeleitet sein. Eine Zelle kann eine prokaryotische Zelle sein oder aus einer prokaryotischen Zelle abgeleitet sein. Eine Zelle kann eine bakterielle Zelle sein oder aus einer bakteriellen Zelle abgeleitet sein. Eine Zelle kann eine archäische Zelle sein oder aus einer archäischen Zelle abgeleitet sein. Eine Zelle kann eine eukaryotische Zelle sein oder aus einer eukaryotischen Zelle abgeleitet sein. Eine Zelle kann eine pluripotente Stammzelle sein. Eine Zelle kann eine Pflanzenzelle sein oder aus einer Pflanzenzelle abgeleitet sein. Eine Zelle kann eine tierische Zelle sein oder aus einer tierischen Zelle abgeleitet sein. Eine Zelle kann eine Wirbellosen-Zelle sein oder aus einer Wirbellosen-Zelle abgeleitet sein. Eine Zelle kann eine Wirbeltierzelle sein oder aus einer Wirbeltierzelle abgeleitet sein. Eine Zelle kann eine Mikrobenzelle sein oder aus einer Mikrobenzelle abgeleitet sein. Eine Zelle kann eine Pilzzelle sein oder aus einer Pilzzelle abgeleitet sein. Eine Zelle kann aus einem spezifischen Organ oder Gewebe stammen.
Nicht einschränkende Beispiele für eine oder mehrere Zellen können lymphoide Zellen beinhalten, wie B-Zellen, T-Zellen (zytotoxische T-Zellen, natürliche Killer-T-Zellen, regulatorische T-Zellen, T-Helferzellen), natürliche Killerzellen, Zytokin-induzierte Killerzellen (CIK); myeloische Zellen, wie Granulozyten (Basophile Granulozyten, Eosinophile Granulozyten, Neutrophile Granulozyten/Hypersegmentierte Neutrophile), Monozyten/Makrophagen, Erythrozyten (Retikulozyten), Mastzellen, Thrombozyten/Megakaryozyten, Dendritische Zellen; Zellen des endokrinen Systems, einschließlich Schilddrüsenzellen (Schilddrüsenepithelzellen, parafollikuläre Zellen), Nebenschilddrüsenzellen (Nebenschilddrüsenhauptzellen, oxyphile Zellen), Nebennierenzellen (Chromaffinzellen), Zirbeldrüsenzellen (Pinealozyten); Zellen des Nervensystems, einschließlich Gliazellen (Astrozyten, Mikroglia), Magnozelluläre neurosekretorische Zelle, Stellat-Zelle, Boettcher-Zelle und Hypophyse (Gonadotropin, Corticotropin, Thyrotropin, Somatotropin, Laktotropin); Zellen des Atmungssystems, einschließlich Pneumozyt (Typ-I-Pneumozyt, Typ-II-Pneumozyt), Clara-Zelle, Becherzelle, Staubzelle; Zellen des Kreislaufsystems, einschließlich Myokardiozyt, Perizyt; Zellen des Verdauungssystems, einschließlich Magen (Magenhauptzelle, Parietalzelle), Becherzelle, Paneth-Zelle, G-Zellen, D-Zellen, ECL-Zellen, I-Zellen, K-Zellen, S-Zellen; enteroendokrine Zellen, einschließlich enterochromaffme Zelle, APUD-Zelle, Leber (Hepatozyt, Kupffer-Zelle), Knorpel/Knochen/Muskel; Knochenzellen, einschließlich Osteoblast, Osteozyt, Osteoklast, Zähne (Zementoblast, Ameloblast); Knorpelzellen, einschließlich Chondroblast, Chondrozyt; Hautzellen, einschließlich Trichozyt, Keratinozyt, Melanozyt (Naevuszelle); Muskelzellen, einschließlich Myozyt; Zellen des Harnsystems, einschließlich Podozyt, Juxtaglomeruläre Zelle, Intraglomeruläre Mesangialzelle/Extraglomeruläre Mesangialzelle, Bürstensaumzelle des proximalen Tubulus der Niere, Macula densa-Zelle; Zellen des Fortpflanzungssystems, einschließlich Spermatozoon, Sertoli-Zelle, Leydig-Zelle, Ovum; und andere Zellen, einschließlich Adipozyt, Fibroblast, Sehnenzelle, epidermaler Keratinozyt (differenzierende epidermale Zelle), epidermale Basalzelle (Stammzelle), Keratinozyt der Finger- und Zehennägel, Nagelbettbasalzelle (Stammzelle), medulläre Haarschaftzelle, kortikale Haarschaftzelle, kutikuläre Haarschaftzelle, Kutikuläre Haarwurzelscheidenzelle, Haarwurzelscheidenzelle der Huxley-Schicht, Haarwurzelscheidenzelle der Henle-Schicht, Äußere Haarwurzelscheidenzelle, Haarmatrixzelle (Stammzelle), Feuchte geschichtete Barriere-Epithelzellen, Oberflächenepithelzelle des geschichteten Plattenepithels von Hornhaut, Zunge, Mundhöhle, Speiseröhre, Analkanal, distaler Harnröhre und Vagina, Basalzelle (Stammzelle) der Epithelien von Hornhaut, Zunge, Mundhöhle, Speiseröhre, Analkanal, distaler Harnröhre und Vagina, Harnröhrenepithelzelle (Auskleidung der Harnblase und der Harnwege), Exokrine sekretorische Epithelzellen, Speicheldrüsenschleimhautzelle (polysaccharidreiches Sekret), Seröse Zelle der Speicheldrüse (glykoproteinreiche Sekretion), Von-Ebner-Drüsenzelle in der Zunge (wäscht die Geschmacksknospen), Brustdrüsenzelle (Milchsekretion), Tränendrüsenzelle (Tränensekretion), Ceruminöse Drüsenzelle im Ohr (Wachssekretion), Dunkle Zelle der ekkrinen Schweißdrüse (Glykoproteinsekretion), Klare Zelle der ekkrinen Schweißdrüse (Sekretion kleiner Moleküle). Apokrine Schweißdrüsenzelle (Geruchssekretion, sexualhormonempfindlich), Moll-Drüsenzelle im Augenlid (spezialisierte Schweißdrüse), Talgdrüsenzelle (lipidreiche Talgsekretion), Bowman-Drüsenzelle in der Nase (wäscht das Geruchsepithel), Brunnersche Drüsenzelle im Zwölffingerdarm (Enzyme und alkalischer Schleim), Samenblasenzelle (sondert Bestandteile der Samenflüssigkeit ab, einschließlich Fruktose für schwimmende Spermien), Prostatadrüsenzelle (sondert Bestandteile der Samenflüssigkeit ab), Bulbourethraldrüsenzelle (Schleimabsonderung), Bartholin-Drüsenzelle (vaginale Gleitmittelsekretion), Littre-Drüsenzelle (Schleimsekretion), Gebärmutterschleimhautzelle (Kohlenhydratsekretion), Isolierte Becherzelle der Atemwege und des Verdauungstraktes (Schleimsekretion), Magenschleimhautzelle (Schleimsekretion), Zymogene Zelle der Magendrüse (Pepsinogensekretion), Oxyntische Zelle der Magendrüse (Salzsäuresekretion), Azinuszelle der Bauchspeicheldrüse (Sekretion von Bikarbonat und Verdauungsenzymen), Paneth-Zelle des Dünndarms (Lysozymsekretion), Typ-II-Pneumozyt der Lunge (Surfactant-Sekretion), Clara-Zelle der Lunge, Hormonzellen, Hypophysenvorderzellen, Somatotrope, Laktotrope, Thyreotrope, Gonadotrope, Corticotrope, Hypophysenzwischenzellen, Magnozelluläre neurosekretorische Zellen, Darm- und Atemwegszellen, Schilddrüsenzellen, Schilddrüsenepithelzellen, parafollikuläre Zellen, Nebenschilddrüsenzellen, Nebenschilddrüsenhauptzellen, oxyphile Zellen, Nebennierenzellen, chromaffine Zellen, Ley dig Zellen der Hoden, Theca interna-Zelle des Ovarialfollikels, Corpus luteum-Zelle des gerissenen Ovarialfollikels, Granulosa-Lutein-Zellen, Theca-Lutein-Zellen, Juxtaglomeruläre Zelle (Reninsekretion), Macula densa-Zelle der Niere, Stoffwechsel- und Speicherzellen, Zellen mit Barrierefunktion (Lunge, Darm, exokrine Drüsen und Urogenitaltrakt), Niere, Typ-I-Pneumozyt (Auskleidung des Luftraums der Lunge), Duktuszelle der Bauchspeicheldrüse (zentroazinäre Zelle), nicht gestreifte Duktuszelle (der Schweißdrüse, Speicheldrüse, Brustdrüse usw.), Ductuszellen (der Samenblase, der Prostata, etc.)), Epithelzellen, die geschlossene innere Körperhöhlen auskleiden, Flimmerzellen mit Antriebsfunktion, Zellen, die extrazelluläre Matrix sezernieren, kontraktile Zellen; Skelettmuskelzellen, Stammzellen, Herzmuskelzellen, Blut- und Immunsystemzellen, Erythrozyten (rote Blutkörperchen), Megakaryozyten (Thrombozytenvorläufer), Monozyten, Bindegewebsmakrophagen (verschiedene Typen), epidermale Langerhans-Zellen, Osteoklasten (in Knochen), dendritische Zellen (in lymphoidem Gewebe), Mikrogliazellen (im zentralen Nervensystem), neutrophile Granulozyten, eosinophile Granulozyten, basophile Granulozyten, Mastzellen, Helfer-T-Zellen, Suppressor-T-Zellen, zytotoxische T-Zellen, natürliche Killer-T-Zellen, B-Zellen, natürliche Killerzellen, Retikulozyten, Stammzellen und engagierte Vorläuferzellen für das Blut und das Immunsystem (verschiedene Typen), Pluripotente Stammzellen, Totipotente Stammzellen, Induzierte pluripotente Stammzellen, Adulte Stammzellen, Sinneswandlerzellen, Autonome Neuronenzellen, Sinnesorgane und periphere Neuronen unterstützende Zellen, Neuronen und Gliazellen des zentralen Nervensystems, Linsenzellen, Pigmentzellen, Melanozyten, Retinale pigmentierte Epithelzelle, Keimzellen, Oogonium/Oozyt, Spermatid, Spermatozyt, Spermatogoniumzelle (Stammzelle für Spermatozyt), Spermatozoon, Ammenzellen, Ovarialfollikelzelle, Sertoli-Zelle (im Hoden), Thymusepithelzelle, Interstitielle Zellen und Interstitielle Nierenzellen.
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Erkrankung ein Krebs oder ein Tumor sein. Nicht einschränkende Beispiele für solche Erkrankungen können Akanthom, Akinzellkarzinom, Akustikusneurinom, akrales lentiginöses Melanom, Akrospirom, akute eosinophile Leukämie, akute lymphoblastische Leukämie, akute megakaryoblastische Leukämie, akute monozytäre Leukämie, akute myeloblastische Leukämie mit Reifung, akute myeloische dendritische Zellleukämie, akute myeloische Leukämie, akute promyelozytische Leukämie, Adamantinom, Adenokarzinom, adenoides zystisches Karzinom, Adenom, Adenomatoider odontogenen Tumor, adrenokortikales Karzinom, adulte T-Zell-Leukämie, aggressive NK-Zell-Leukämie, AIDS-bezogene Krebserkrankungen, AIDS-bezogenes Lymphom, alveoläres Weichteilsarkom, ameloblastisches Fibrom, Analkrebs, anaplastisches großzelliges Lymphom, anaplastischen Schilddrüsenkrebs, angioimmunoblastisches T-Zell-Lymphom, Angiomyolipom, Angiosarkom, Blinddarmkrebs, Astrozytom, atypischen teratoiden rhabdoiden Tumor, Basalzellkarzinom, basal-ähnliches Karzinom, B-Zell-Leukämie, B-Zell-Lymphom, Bellini-Gang-Karzinom, Gallengangskrebs, Blasenkrebs, Blastom, Knochenkrebs, Knochentumor, Hirnstamm-Gliom, Hirntumor, Brustkrebs, Brenner-Tumor, Bronchialtumor, bronchioloalveoläres Karzinom, Brauner Tumor, Burkitt-Lymphom, Krebs mit unbekanntem Entstehungsort, karzinoiden Tumor, Karzinom, Karzinom in situ, Karzinom des Penis, Karzinom mit unbekanntem Entstehungsort, Karzinosarkom, Castleman-Erkrankung, embryonalen Tumor des Zentralnervensystems, zerebelläres Astrozytom, zerebrales Astrozytom, Gebärmutterhalskrebs, Cholangiokarzinom, Chondrom, Chondrosarkom, Chordom, Choriokarzinom, Choroidplexuspapillom, chronische lymphozytäre Leukämie, chronische monozytäre Leukämie, chronische myeloische Leukämie, chronische myeloproliferative Erkrankung, chronische neutrophile Leukämie, Klarzellentumor, Dickdarmkrebs, Darmkrebs, Kraniopharyngiom, kutanes T-Zell-Lymphom, Degos-Erkrankung, Dermatofibrosarcoma protuberans, Dermoidzyste, Desmoplastischer kleiner Rundzellentumor, Diffuses großes B-Zell-Lymphom, dysembryoplastischen neuroepithelialen Tumor, embryonales Karzinom, endodermalen Sinustumor, Endometriumkrebs, endometrialen Gebärmutterkrebs, endometrioiden Tumor, enteropathie-assoziiertes T-Zell-Lymphom, Ependymoblastom, Ependymom, epithelioides Sarkom, Erythroleukämie, Speiseröhrenkrebs, Esthesioneuroblastom, Ewing-Familie der Tumore, Ewing-Familie-Sarkom, Ewing-Sarkom, extrakraniellen Keimzelltumor, extragonadalen Keimzelltumor, extrahepatischen Gallengangskrebs, extramammäres Paget-Syndrom, Eileiterkrebs, Fetus in fetu, Fibrom, Fibrosarkom, follikuläres Lymphom, follikulären Schilddrüsenkrebs, Gallenblasenkrebs, Gallenblasenkrebs, Gangliogliom, Ganglioneurom, Magenkrebs, Magenlymphom, Magen-DarmKrebs, gastrointestinalen Karzinoid-Tumor, gastrointestinalen Stromatumor, gastrointestinalen Stromatumor, Keimzelltumor, Germinom, Gestations-Choriokarzinom, Gestations-trophoblastischen Tumor, Riesenzelltumor des Knochens, Glioblastoma multiforme, Gliom, Gliomatosis cerebri, Glomustumor, Glucagonom, Gonadoblastom, Granulosazelltumor, Haarzellenleukämie, Haarzellenleukämie, Kopf- und Halskrebs, Kopf- und Halskrebs, Herzkrebs, Hämangioblastom, Hämangioperizytom, Hämangiosarkom, hämatologische Malignität, hepatozelluläres Karzinom, hepatosplenisches T-Zell-Lymphom, hereditäres Brust-Eierstockkrebs-Syndrom, Hodgkin-Lymphom, Hodgkin-Lymphom, Hypopharynxkrebs, hypothalamisches Gliom, entzündlichen Brustkrebs, intraokulares Melanom, Inselzellkarzinom, Inselzelltumor, juvenile myelomonozytäre Leukämie, Kaposi-Sarkom, Kaposi-Sarkom, Nierenkrebs, Klatskin-Tumor, Krukenberg-Tumor, Kehlkopfkrebs, Kehlkopfkrebs, Lentigo-maligna-Melanom, Leukämie, Leukämie, Lippen- und Mundhöhlenkrebs, Liposarkom, Lungenkrebs, Luteom, Lymphangiom, Lymphangiosarkom, Lymphoepitheliom, Lymphoide Leukämie, Lymphom, Makroglobulinämie, bösartiges fibröses Histiozytom, bösartiges fibröses Histiozytom, bösartiges fibröses Histiozytom des Knochens, bösartiges Gliom, bösartiges Mesotheliom, bösartigen peripheren Nervenscheidentumor, bösartigen rhabdoiden Tumor, bösartigen Triton-Tumor, MALT-Lymphom, Mantelzell-Lymphom, Mastzell-Leukämie, mediastinalen Keimzelltumor, mediastinalen Tumor, medulläres Schilddrüsenkarzinom, Medulloblastom, Medulloepitheliom, Melanom, Melanom, Meningiom, Merkelzell-Karzinom, Mesotheliom, Mesotheliom, metastasierendes Plattenepithelkarzinom mit okkultem Primärtumor, metastasierendes Urothelkarzinom, gemischten Mullertumor, monozytäre Leukämie, Mundkrebs, muzinösen Tumor, multiples endokrines Neoplasie-Syndrom, multiples Myelom, Mycosis Fungoides, Mycosis fungoides, myelodysplastische Erkrankung, myelodysplastische Syndrome, myeloische Leukämie, myeloisches Sarkom, myeloproliferative Erkrankung, Myxom, Nasenhöhlenkrebs, Nasopharynxkrebs, Nasopharynxkarzinom, Neoplasma, Neurinom, Neuroblastom, Neurofibrom, Neurom, noduläres Melanom, Non-Hodgkin-Lymphom, Non-Hodgkin-Lymphom, Nonmelanom-Hautkrebs, Nichtkleinzelligen Lungenkrebs, Augenonkologie, Oligoastrozytom, Oligodendrogliom, Onkozytom, Sehnervenscheidenmeningeom, Mundkrebs, Mundkrebs, Oropharynxkrebs, Osteosarkom, Osteosarkom, Eierstockkrebs, Eierstockkrebs, Eierstockepithelkrebs, Eierstockkeimzelltumor, Eierstocktumor mit geringem malignen Potential, Paget'sche Erkrankung der Brust, Pancoast-Tumor, Bauchspeicheldrüsenkrebs, Bauchspeicheldrüsenkrebs, papillaren Schilddrüsenkrebs, Papillomatose, Paragangliom, Nasennebenhöhlenkrebs, Nebenschilddrüsenkrebs, Peniskrebs, perivaskulären epithelioiden Zelltumor, Pharynxkrebs, Pharynxkrebs, Pharynxkrebs, pinealen parenchymalen Tumor der intermediären Differenzierung, Pineoblastom, Pituizytom, Hypophysenadenom, Hypophysentumor, Plasmazellneoplasma, pleuropulmonales Blastom, Polyembryom, Vorläufer-T-Lymphom, primäres Lymphom des Zentralnervensystems, primäres Ergusslymphom, primäres Leberzellkarzinom, primäres Peritonealkarzinom, primitiven neuroektodermalen Tumor, Prostatakrebs, Pseudomyxoma peritonei, Rektalkrebs, Nierenzellkarzinom, Atemwegskarzinom mit Beteiligung des NUT-Gens auf Chromosom 15, Retinoblastom, Rhabdomyom, Rhabdomyosarkom, Richter-Transformation, Teratom des Sakrokokzygeums, Speicheldrüsenkrebs, Sarkom, Schwannomatose, Talgdrüsenkarzinom, sekundäre Neoplasie, Seminom, serösen Tumor, Sertoli-Leydig-Zelltumor, Geschlechtsstrangstromatumor, Sezary-Syndrom, Siegelringzellkarzinom, Hautkrebs, kleinzelligen Rundzellentumor, kleinzelliges Karzinom, kleinzelligen Lungenkrebs, kleinzelliges Lymphom, Dünndarmkrebs, Weichteilsarkom, Somatostatinom, Rußwarze, Rückenmarkstumor, Wirbelsäulentumor, Milzrandzonen-Lymphom, Plattenepithelkarzinom, Magenkrebs, oberflächlich streuendes Melanom, supratentorialen primitiven neuroektodermalen Tumor, oberflächenepithelialen Stromatumor, synoviales Sarkom, akute lymphoblastische Leukämie der T-Zelle, großkörnige lymphatische Leukämie der T-Zelle, T-Zell-Leukämie, T-Zell-Lymphom, Prolymphozytäre Leukämie der T-Zelle, Teratom, lymphatischen Krebs im Endstadium, Hodenkrebs, Thekoma, Kehlkopfkrebs, Thymuskarzinom, Thymom, Schilddrüsenkrebs, Übergangszellkarzinom von Nierenbecken und Harnleiter, Übergangszellkarzinom, Urachuskarzinom, Harnröhrenkrebs, urogenitales Neoplasma, Uterus-Sarkom, Aderhautmelanom, Vaginalkrebs, Verner-Morrison-Syndrom, verruköses Karzinom, Sehbahn-Gliom, Vulvakrebs, Waldenstrom-Makroglobulinämie, Warthins Tumor und Wilms-Tumor beinhalten.
Gemäß verschiedener Ausführungsformen können zahlreiche Arten von Neoplasmen nachgewiesen werden, einschließlich (aber nicht beschränkt auf) akute lymphatische Leukämie (ALL), akute myeloische Leukämie (AML), Analkrebs, Astrozytome, Basalzellkarzinom, Gallengangskrebs, Blasenkrebs, Brustkrebs, Burkitt-Lymphom, Gebärmutterhalskrebs, chronische lymphozytäre Leukämie (CLL), chronische myeloische Leukämie (CML), chronische myeloproliferative Neoplasmen, Darmkrebs, diffuses großzelliges B-Zell-Lymphom, Endometriumkrebs, Ependymom, Speiseröhrenkrebs, Osthesioneuroblastom, Ewing-Sarkom, Eileiterkrebs, follikuläres Lymphom, Gallenblasenkrebs, Magenkrebs, gastrointestinaler Karzinoidtumor, Haarzellenleukämie, Leberzellkrebs, Hodgkin-Lymphom, Hypopharynxkrebs, Kaposi-Sarkom, Nierenkrebs, Langerhans-Zell-Histiozytose, Kehlkopfkrebs, Leukämie, Leberkrebs, Lungenkrebs, Lymphom, Melanom, Merkel-Zell-Krebs, Mesotheliom, Mundkrebs, Neuroblastom, Non-Hodgkin-Lymphom, nichtkleinzelliger Lungenkrebs, Osteosarkom, Eierstockkrebs, Bauchspeicheldrüsenkrebs, neuroendokrine Tumore der Bauchspeicheldrüse, Rachenkrebs, Hypophysentumor, Prostatakrebs, Rektumkarzinom, Nierenzellkrebs, Retinoblastom, Hautkrebs, kleinzelliger Lungenkrebs, Dünndarmkrebs, Plattenepithelkarzinom des Halses, T-Zell-Lymphom, Hodenkrebs, Thymom, Schilddrüsenkrebs, Gebärmutterkrebs, Vaginalkrebs und vaskuläre Tumore.
Viele Ausführungsformen beziehen sich auf diagnostische oder begleitende diagnostische Scans, die während der Krebsbehandlung eines Individuums durchgeführt werden. Bei der Durchführung diagnostischer Scans während der Behandlung kann die Fähigkeit des Agens zur Behandlung des Krebswachstums beobachtet werden. Die meisten Krebstherapeutika führen zum Absterben und zur Nekrose neoplastischer Zellen, wodurch größere Mengen an Nukleinsäuren aus diesen Zellen in die untersuchten Proben freigesetzt werden sollten. Dementsprechend kann der Spiegel der zirkulierenden Nukleinsäuren im Laufe der Zeit beobachtet werden, da der Spiegel während der ersten Behandlungen ansteigen und mit der Abnahme der kanzerogenen Zellen abnehmen sollte. In einigen Ausführungsformen werden die Behandlungen basierend auf dem Behandlungseffekt auf die Krebszellen angepasst. Wirkt die Behandlung beispielsweise nicht zytotoxisch auf neoplastische Zellen, kann die Dosis erhöht oder ein Agens mit höherer Zytotoxizität verabreicht werden. Alternativ kann, wenn die Zytotoxizität der Krebszellen gut ist, jedoch die unerwünschten Nebenwirkungen hoch sind, die Dosierung verringert werden oder ein Agens mit weniger Nebenwirkungen verabreicht werden.
Verschiedene Ausführungsformen sind auch auf diagnostische Scans gerichtet, die nach der Behandlung eines Individuums durchgeführt werden, um eine Restkrankheit und/oder ein Wiederauftreten von Krebs nachzuweisen. Deutet ein diagnostischer Scan auf einen Krebsrückstand und/oder ein Wiederauftreten des Krebses hin, können weitere diagnostische Tests und/oder Behandlungen wie hierin beschrieben durchgeführt werden. Ist der Krebs und/oder das Individuum anfällig für ein Wiederauftreten, können diagnostische Scans zur Überwachung eines eventuellen Rückfalls häufig durchgeführt werden.
F. Computersysteme
In einem Aspekt sieht die vorliegende Offenbarung ein Computerprogrammprodukt vor, umfassend ein nichtflüchtiges, computerlesbares Medium mit darin codiertem, computerausführbarem Code, wobei der computerausführbare Code zur Ausführung zur Implementierung eines beliebigen der vorangehenden Verfahren angepasst ist.
Die vorliegende Offenbarung stellt Computersysteme zur Verfügung, die zur Implementierung der Verfahren der Offenbarung programmiert sind. Das System kann in einigen Fällen Komponenten wie einen Prozessor, ein Eingabemodul zur Eingabe von Sequenzierungsdaten oder davon abgeleiteter Daten, ein computerlesbares Medium, das Anweisungen enthält, die bei Ausführung durch den Prozessor einen Algorithmus für die Eingabe in Bezug auf ein oder mehrere zellfreie Nukleinsäuremoleküle durchführen, und ein Ausgabemodul, das ein oder mehrere mit der Erkrankung verbundene Indizien bereitstellt, beinhalten.
27 zeigt ein Computersystem 2701, das zur Implementierung eines Teils oder aller hierin offenbarten Verfahren programmiert oder anderweitig konfiguriert ist. Das Computersystem 2701 kann verschiedene Aspekte der vorliegenden Offenbarung regeln, wie zum Beispiel (i) Identifizieren eines oder mehrerer zellfreier Nukleinsäuremoleküle, die die Vielzahl von Phasenvarianten umfassen, aus Sequenzierungsdaten, die von einer Vielzahl zellfreier Nukleinsäuremoleküle abgeleitet sind, (ii) Analysieren beliebiger der identifizierten zellfreien Nukleinsäuremoleküle, (iii) Ermitteln einer Erkrankung des Subjekts, basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen, (iv) Überwachen eines Verlaufs der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen, (v) Identifizieren des Subjekts zumindest teilweise basierend auf den identifizierten zellfreien Nukleinsäuremolekülen, oder (vi) Ermitteln einer geeigneten Behandlung der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen. Das Computersystem 2701 kann ein elektronisches Gerät eines Benutzers oder ein Computersystem sein, das sich in Bezug auf das elektronische Gerät entfernt von diesem befindet. Das elektronische Gerät kann ein mobiles elektronisches Gerät sein.
Das Computersystem 2701 beinhaltet eine zentrale Verarbeitungseinheit (CPU, hierin auch „Prozessor“ und „Computerprozessor“) 2705, die ein Einzelkern- oder Mehrkernprozessor oder eine Vielzahl von Prozessoren für die Parallelverarbeitung sein kann. Das Computersystem 2701 beinhaltet ebenfalls einen Speicher oder Speicherplatz 2710 (z. B. Direktzugriffsspeicher, Festwertspeicher, Flash-Speicher), eine elektronische Speichereinheit 2715 (z. B. Festplatte), eine Kommunikationsschnittstelle 2720 (z. B. Netzwerkadapter) zur Kommunikation mit einem oder mehreren anderen Systemen und periphere Geräte 2725, wie z. B. Cache, andere Speicher, Datenspeicher und/oder elektronische Anzeigeadapter. Der Speicher 2710, die Speichereinheit 2715, die Schnittstelle 2720 und die Peripheriegeräte 2725 stehen über einen Kommunikationsbus (durchgezogene Linien), wie etwa eine Hauptplatine, mit der CPU 2705 in Verbindung. Die Speichereinheit 2715 kann eine Datenspeichereinheit (oder ein Datenrepository) zum Speichern von Daten sein. Das Computersystem 2701 kann mit Hilfe der Kommunikationsschnittstelle 2720 mit einem Computernetzwerk („Netzwerk“) 2730 wirkverbunden sein. Das Netzwerk 2730 kann das Internet, ein Internet und/oder Extranet oder ein Intranet und/oder Extranet sein, das mit dem Internet in Verbindung steht. In einigen Fällen ist das Netzwerk 2730 ein Telekommunikations- und/oder Datennetzwerk. Das Netzwerk 2730 kann einen oder mehrere Computerserver beinhalten, die eine verteilte Datenverarbeitung, wie beispielsweise Cloud Computing, ermöglichen können. Das Netzwerk 2730 kann in einigen Fällen mit Hilfe des Computersystems 2701 ein Peer-to-Peer-Netzwerk implementieren, das es den mit dem Computersystem 2701 verbundenen Geräten ermöglicht, sich als Client oder Server zu verhalten.
Die CPU 2705 kann eine Sequenz von maschinenlesbaren Anweisungen ausführen, die in einem Programm oder einer Software verkörpert sein können. Die Anweisungen können an einem Speicherplatz, wie etwa dem Speicher 2710, gespeichert werden. Die Anweisungen können an die CPU 2705 geleitet werden, die anschließend die CPU 2705 zur Implementierung der Verfahren der vorliegenden Offenbarung programmieren oder anderweitig konfigurieren kann. Beispiele für von der CPU 2705 durchgeführte Vorgänge können das Abrufen, Dekodieren, Ausführen und Zurückschreiben beinhalten.
Die CPU 2705 kann Teil einer Schaltung, beispielsweise einer integrierten Schaltung, sein. Eine oder mehrere andere Komponenten des Systems 2701 können in der Schaltung beinhaltet sein. In einigen Fällen ist die Schaltung eine anwendungsspezifische integrierte Schaltung (ASIC).
Die Speichereinheit 2715 kann Dateien, wie zum Beispiel Treiber, Bibliotheken und gespeicherte Programme, speichern. Die Speichereinheit 2715 kann Benutzerdaten wie z. B. Benutzereinstellungen und Benutzerprogramme speichern. In einigen Fällen kann das Computersystem 2701 eine oder mehrere zusätzliche, sich außerhalb des Computersystems 2701 befindliche Datenspeichereinheiten beinhalten, die sich beispielsweise auf einem entfernten Server befinden, der über ein Intranet oder das Internet mit dem Computersystem 2701 kommuniziert.
Das Computersystem 2701 kann über das Netzwerk 2730 mit einem oder mehreren entfernten Computersystemen kommunizieren. Das Computersystem 2701 kann beispielsweise mit einem entfernten Computersystem eines Benutzers kommunizieren. Beispiele für entfernte Computersysteme beinhalten PCs (z. B. tragbare PCs), Slate- oder Tablet-PCs (z. B. Apple® iPad, Samsung® Galaxy Tab), Telefone, Smartphones (z. B. Apple® iPhone, Android-fähige Geräte, Blackberry®) oder persönliche digitale Assistenten. Der Benutzer kann über das Netzwerk 2730 auf das Computersystem 2701 zugreifen.
Hierin beschriebene Verfahren können mittels eines maschinell (z. B. durch einen Computerprozessor) ausführbaren Codes implementiert werden, der in einem elektronischen Speicherplatz des Computersystems 2701, wie etwa im Speicher 2710 oder der elektronischen Speichereinheit 2715, gespeichert ist. Der maschinenausführbare oder maschinenlesbare Code kann in Form von Software bereitgestellt werden. Während der Nutzung kann der Code vom Prozessor 2705 ausgeführt werden. In einigen Fällen kann der Code aus der Speichereinheit 2715 abgerufen und für den schnellen Zugriff durch den Prozessor 2705 im Speicher 2710 abgelegt werden. In einigen Situationen kann die elektronische Speichereinheit 2715 ausgeschlossen werden, und maschinenausführbare Anweisungen werden im Speicher 2710 gespeichert.
Der Code kann vorkompiliert und für die Verwendung mit einer Maschine konfiguriert sein, die über einen Prozessor verfügt, der zur Ausführung des Codes geeignet ist, oder er kann während der Laufzeit kompiliert werden. Der Code kann in einer Programmiersprache bereitgestellt werden, die ausgewählt werden kann, damit der Code vorkompiliert oder wie kompiliert ausgeführt werden kann.
Aspekte der hierin vorgesehenen Systeme und Verfahren, wie zum Beispiel das Computersystem 2701, können als Programmierung verkörpert sein. Verschiedene Aspekte der Technologie können als „Produkte“ oder „Fertigungsartikel“ betrachtet werden, üblicherweise in Form von maschinen-(oder prozessor-)ausführbarem Code und/oder zugehörigen Daten, die auf einer Art von maschinenlesbarem Medium gespeichert oder darin verkörpert sind. Maschinenausführbarer Code kann in einer elektronischen Speichereinheit wie einem Speicher (z. B. Festwertspeicher, Direktzugriffsspeicher, Flash-Speicher) oder auf einer Festplatte gespeichert werden. Medien vom Typ „Speicher“ können beliebige oder alle greifbaren Speicher der Computer, Prozessoren oder dergleichen oder zugehörige Module davon beinhalten, wie beispielsweise verschiedene Halbleiterspeicher, Bandlaufwerke, Diskettenlaufwerke und dergleichen, die jederzeit nichtflüchtigen Speicher für die Softwareprogrammierung bereitstellen können. Die gesamte Software oder Teile davon können zeitweise über das Internet oder verschiedene andere Telekommunikationsnetze übertragen werden. Eine solche Kommunikation kann zum Beispiel das Laden der Software von einem Computer oder Prozessor auf einen anderen, zum Beispiel von einem Management-Server oder Host-Computer auf die Computerplattform eines Anwendungsservers, ermöglichen. So beinhaltet ein weiterer Medientyp, der die Softwareelemente tragen kann, optische, elektrische und elektromagnetische Wellen, wie sie über physische Schnittstellen zwischen lokalen Geräten, über kabelgebundene und optische Festnetze und über verschiedene Luftverbindungen verwendet werden. Die physischen Elemente, die diese Wellen tragen, wie beispielsweise drahtgebundene oder drahtlose Verbindungen, optische Verbindungen oder dergleichen, können ebenfalls als Träger der Software betrachtet werden. Wie hierin verwendet, beziehen sich Begriffe wie „Computer“ oder „maschinenlesbares Medium“ auf beliebige Medien, die an der Bereitstellung von Anweisungen für einen Prozessor zur Ausführung beteiligt sind, es sei denn, sie beschränken sich auf nicht-transitorische, greifbare „Speichermedien“.
Ein maschinenlesbares Medium, wie etwa ein computerausführbarer Code, kann daher viele Formen annehmen, einschließlich, aber nicht beschränkt auf ein materielles Speichermedium, ein Trägerwellenmedium oder ein physikalisches Übertragungsmedium. Nichtflüchtige Speichermedien beinhalten zum Beispiel optische oder magnetische Festplatten, wie beliebige Speichervorrichtungen in Computern oder dergleichen, die zur Implementierung der in den Zeichnungen gezeigten Datenbanken usw. verwendet werden können. Flüchtige Speichermedien beinhalten einen dynamischen Speicher, wie den Hauptspeicher einer solchen Computerplattform. Materielle Übertragungsmedien beinhalten Koaxialkabel, Kupferdraht und Glasfaserkabel, einschließlich der Drähte, die einen Bus innerhalb eines Computersystems umfassen. Trägerwellen können in Form elektrischer oder elektromagnetischer Signale, akustischer Wellen oder Lichtwellen übertragen werden, wie sie bei der Datenkommunikation über Hochfrequenz (RF) und Infrarot (IR) entstehen. Gängige Formen computerlesbarer Medien beinhalten daher beispielsweise: eine Diskette, eine flexible Platte, eine Festplatte, ein Magnetband, ein beliebiges anderes magnetisches Medium, eine CD-ROM, eine DVD oder DVD-ROM, ein beliebiges anderes optisches Medium, Lochkarten, Lochstreifen, ein beliebiges anderes physikalisches Speichermedium mit Lochmustern, einen RAM, einen ROM, einen PROM und EPROM, einen FLASH-EPROM, einen beliebigen anderen Speicherchip oder eine Kassette, eine Trägerwelle, die Daten oder Befehle transportiert, Kabel oder Verbindungen, die eine solche Trägerwelle transportieren, oder ein beliebiges anderes Medium, von dem ein Computer Programmiercode und/oder Daten lesen kann. Viele dieser Formen von computerlesbaren Medien können dazu dienen, eine oder mehrere Sequenzen von einer oder mehreren Anweisungen zur Ausführung an einen Prozessor zu übertragen.
Das Computersystem 2701 kann eine elektronische Anzeige 2735 beinhalten oder mit dieser in Verbindung stehen, die eine Benutzerschnittstelle (UI) 2740 zur Bereitstellung beispielsweise (i) einer Analyse beliebiger zellfreier Nukleinsäuremoleküle, (ii) einer Bestimmung der Erkrankung des Subjekts, die zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen basiert, (iii) eines ermittelten Verlaufs der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen, (iv) eines identifizierten Subjekts, bei dem zumindest teilweise basierend auf den identifizierten zellfreien Nukleinsäuremolekülen ein Verdacht auf die Erkrankung besteht, oder (v) einer ermittelten Behandlung der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen, umfasst. Beispiele für Benutzeroberflächen beinhalten, ohne Einschränkung, eine grafische Benutzeroberfläche (GUI) und eine webbasierte Benutzeroberfläche.
Verfahren und Systeme der vorliegenden Offenbarung können mittels eines oder mehrerer Algorithmen implementiert werden. Ein Algorithmus kann bei der Ausführung durch die zentrale Verarbeitungseinheit 2705 als Software implementiert werden. Der Algorithmus kann zum Beispiel (i) aus Sequenzierungsdaten, die von einer Vielzahl von zellfreien Nukleinsäuremolekülen abgeleitet sind, ein oder mehrere zellfreie Nukleinsäuremoleküle identifizieren, die die Vielzahl von Phasenvarianten umfassen, (ii) beliebige der identifizierten zellfreien Nukleinsäuremoleküle analysieren, (iii) eine Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen bestimmen, (iv) einen Verlauf der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen beobachten, (v) den Subjekt zumindest teilweise basierend auf den identifizierten zellfreien Nukleinsäuremolekülen identifizieren, oder (vi) eine geeignete Behandlung der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen bestimmen.
BEISPIELE
Die folgenden Beispiele sind repräsentativ für Ausführungsformen der hierin beschriebenen Stimulationen, Systeme und Verfahren und sind in keiner Weise als einschränkend zu verstehen.
Beispiel 1: Genomische Verteilung von Phasenvarianten
Beschrieben ist eine Alternative zur Duplex-Sequenzierung zur Verringerung der Hintergrundfehlerrate, die den Nachweis von „Phasenvarianten“ (PVs) umfasst, wobei zwei oder mehr Mutationen in cis auftreten (d. h. auf demselben DNA-Strang 1A und 1E). Ähnlich wie bei der Duplex-Sequenzierung bietet dieses Verfahren niedrigere Fehlerprofile aufgrund des übereinstimmenden Nachweises von zwei separaten Nicht-Referenzereignissen in einzelnen Molekülen. Anders als bei der Duplex-Sequenzierung finden jedoch beide Ereignisse auf demselben Sequenzierlesepaar statt, wodurch die Effizienz der Genomrückgewinnung erhöht wird. Phasenmutationen kommen bei verschiedenen Krebsarten vor, treten jedoch, wahrscheinlich aufgrund von zielgerichteter und aberranter somatischer Hypermutation (aSHM), die durch die aktivierungsinduzierte Deaminase (AID) angetrieben wird, in stereotypen Teilen des Genoms bei B-Zell-Malignomen auf. Die am weitesten verbreiteten Bereiche von aSHM in B-Zell-Non-Hodgkin-Lymphomen (NHL) sind identifiziert. Hierin beschrieben ist Phasenvarianten-Anreicherung und Nachweis-Sequenzierung (PhasED-Seq.), ein neuartiges Verfahren zum Nachweis von ctDNA durch Phasenvarianten in Tumorfraktionen in der Größenordnung von Teilen pro Million. Hierin beschrieben ist eine Demonstration, dass PhasED-Seq. den Nachweis von ctDNA in klinischen Proben sowohl während der Therapie als auch vor einem Krankheitsrückfall bedeutend verbessern kann.
Zur Identifizierung von Malignomen, bei denen PVs den Krankheitsnachweis möglicherweise verbessern können, wurde die Häufigkeit von PVs bei verschiedenen Krebsarten untersucht. Öffentlich verfügbare Ganzgenom-Sequenzierungsdaten wurden zur Identifizierung von Variantensätzen analysiert, die in einem Abstand von < 170bp voneinander auftreten, was der üblichen Länge eines einzelnen cfDNA-Fragments entspricht, das aus einem einzelnen Kern-Nukleosom und einem zugehörigen Linker besteht. Die Häufigkeit dieser „putativen Phasenvarianten“ (Beispiel 10) für die Gesamtzahl der SNV von 2538 Tumoren in 24 Krebshistologien einschließlich solider Tumoren und hämatologischer Malignome (1B, 5 und Tabelle 1) wurde identifiziert und zusammengefasst. PVs waren am signifikantesten in zwei B-Zell-Lymphomen angereichert (DLBCL und follikuläres Lymphom, FL, P < 0,05 im Vergleich zu allen anderen Histologien), einer Gruppe von Krankheiten mit Hypermutation, die durch AID/AICDA angetrieben wird.
Beispiel 2: PVs zugrundeliegende Mutationsmechanismen
Zur Untersuchung des Ursprungs der PVs wurden die Mutationssignaturen der Einzelbasensubstitution (SBS), die zu den innerhalb von 170 bp einer anderen SNV auftretenden SNV beitragen, und die isoliert auftretenden SNV (z. B. ohne eine andere SNV innerhalb von 170 bp) verglichen (Beispiel 10). Wie erwartet waren PVs in mehreren, mit gruppierten Mutationen assoziierten Mutationssignaturen stark angereichert. Signaturen von mit der Aktivität von AID assoziierten gruppierten Mutationen (SBS84 und SBS85) waren signifikant in PVs von B-Zell-Lymphomen und CLL angereichert, während Signaturen, die mit der Aktivität von APOBEC3B (SBS2 und SBS13) - einem weiteren Mechanismus der Kataegis-Hypermutation - assoziiert sind, signifikant in PVs von mehreren soliden Krebs-Histologien, einschließlich Eierstock-, Pankreas-, Prostata- und Brust-Adenokarzinomen, angereichert waren (1C und 6A-6WW). Signaturen von mit der Aktivität von AID assoziierten gruppierten Mutationen (SBS84 und SBS85) waren in PVs angereichert, die in Lymphomen und CLL vorkommen, während Signaturen, die mit der Aktivität von APOBEC3B (SBS2 und SBS13) assoziiert sind, signifikant in Brustkrebs angereichert waren (1C und 6A-6WW). PVs von mehreren Tumorarten wurden auch mit SBS4 assoziiert, einer mit dem Tabakkonsum assoziierten Signatur. Darüber hinaus wurde unter den PVs in verschiedenen Tumorhistologien eine neuartige Anreicherung in mehreren anderen Signaturen ohne eindeutig zugehörige Mechanismen beobachtet (z. B. SBS24, SBS37, SBS38 und SBS39). Im Gegensatz dazu waren altersassoziierte Mutationssignaturen wie SBS1 und SBS5 in isolierten SNV deutlich angereichert.
Beispiel 3: PVs treten in stereotypen Genombereichen bei lymphatischen Krebsarten auf
Zur Beurteilung der genomischen Verteilung der putativen PVs wurden diese Ereignisse zunächst in 1-kb-Bereiche eingeteilt, um ihre Häufigkeit in verschiedenen Tumortypen zu visualisieren. Es wurde eine auffallend stereotype Verteilung von PVs in einzelnen lymphatischen Neoplasmen (z. B. DLBCL, FL, Burkitt-Lymphom (BL) und chronischer lymphatischer Leukämie (CLL); 1D und 7) beobachtet. Im Gegensatz dazu wiesen nichtlymphatische Krebsarten in der Regel kein wesentliches Rezidiv von gruppierten PVs in stereotypisierten Bereichen auf. Dieses Fehlen von Stereotypen in Bezug auf die Position von PVs war auch bei der Betrachtung von Melanomen und Lungenkrebs, Krankheiten mit häufigen PVs, festzustellen.
Auffällig ist, dass die Mehrzahl der hypermutierten Bereiche allen drei Lymphom-Subtypen gemeinsam war, wobei die höchsten Dichten in bekannten Zielen von aSHM, einschließlich BCL2, BCL6 und MYC, sowie in den die schweren und leichten Ketten IGH, IGK und IGL codierenden Immunglobulin-(Ig-)Loci zu beobachten waren (Tabelle 2). Markant ist, dass bestimmte Bereiche innerhalb der Ig-Loci bei fast allen Lymphompatienten und auch bei Patienten mit CLL dicht mutiert waren (1D). Unter den Lymphom-Subtypen wiesen die DLBCL-Tumore die meisten 1-kb-Bereiche auf, die rezidivierende PVs enthielten (8A), was mit der höchsten Anzahl an rezidivierend mutierten Genen in diesem Tumortyp übereinstimmt. Insgesamt wurden 1639 eindeutige 1-kb-Bereiche identifiziert, die rezidivierende PVs in B-Lymphoid-Malignität enthalten. Von diesen Lymphom-assoziierten 1-kb-Bereichen fiel fast ein Drittel in Genombereiche, die zuvor mit physiologischer oder aberranter SHM in B-Zellen assoziiert waren. Genauer gesagt befanden sich 19 % (315/1639) in Ig-Bereichen, während 13 % (218/1639) in Teilen von 68 zuvor identifizierten Zielen von aSHM lagen (Tabelle 2). Während die meisten PVs in nicht-codierende Bereiche des Genoms fielen, wurden auch zusätzliche, rezidivierend betroffene Loci identifiziert, die bisher nicht als Ziele von aSHM beschrieben worden waren, einschließlich unter anderem XBP1, LPP und AICDA.
Die Verteilung der PVs innerhalb jeder lymphoiden Malignität korrelierte mit onkogenen Merkmalen, die mit der unterschiedlichen Pathophysiologie der entsprechenden Krankheit verbunden sind. Beispielsweise enthielten Fälle von FL - bei denen mehr als 90 % der Tumore onkogene BCL2-Fusionen aufweisen - mit signifikant höherer Wahrscheinlichkeit Phasenvarianten von BCL2 als andere lymphoide Malignitäten (1D und 8B). In ähnlicher Weise wiesen signifikant mehr Burkitt-Lymphome (BL) PVs in MYC und ID3 auf, zwei Treibergene, die stark mit der BL-Pathogenese assoziiert sind, als andere lymphoide Malignitäten (1D und 8C-8D). Die mit unterschiedlichen Ursprungszellen assoziierten molekularen DLBCL-Subtypen zeigten ebenfalls unterschiedliche Verteilungen von PVs (Tabelle 2). Während Keimzentrums-B-Zellen-ähnliche (GCB) und aktivierte B-Zellen-ähnliche (ABC) DLBCLs insgesamt eine ähnliche Häufigkeit von PVs aufwiesen (Median 798 vs. 516, P = 0,37), wurde eine signifikante Anreicherung von PVs in den telomeren IGH-Klassenwechselbereichen (Sγ1 und Sγ3) bei ABC-DLBCLs gefunden, was im Einklang mit früheren Berichten41 steht (8E). Umgekehrt wiesen GCB-DLBCLs mehr Phasenhaplotypen in zentromerischen IGH-Klassenwechselbereichen (Sα2 und Sε) und in BCL2 auf.
Beispiel 4: Gestaltung und Validierung eines PhasED-Seq. Panels für Lymphom
Um diese PV-reichen Bereiche zu validieren und ihren Nutzen für den Nachweis von Krankheiten anhand von ctDNA zu bewerten, wurde ein Sequenzierungspanel gestaltet, das auf putative PVs abzielt, die in WGS aus drei unabhängigen Kohorten von Patienten mit DLBCL sowie bei Patienten mit CLL identifiziert wurden (2A und Beispiel 10). Dieses endgültige Panel für Phasenvarianten-Anreicherung und -Nachweis (PhasED-Seq.) zielte auf ~115kb genomischen Raum, der sich auf PVs konzentrierte, zusammen mit zusätzlichen ~200kb, die auf Gene abzielten, die rezidiv in B-NHLs mutiert sind (Tabelle 3). Während der für PV-Erfassungsziele vorgesehene Raum von 115 kb nur 0,0035 % des menschlichen Genoms abdeckt, werden 26 % der in reifen B-Zell-Neoplasmen mit WGS-Profilen beobachteten Phasenvarianten erfasst (9A), was zu einer ~7500-fachen PV-Anreicherung durch PhasED-Seq. im Vergleich zu WGS führt.
Die erwartete SNV- und PV-Rückgewinnung wurde mit dem zuvor berichteten CAPP-Seq.-Selektor verglichen, der zur Maximierung der SNV pro Patient bei B-Zell-Lymphomen gestaltet wurde (9A-C). Bei Berücksichtigung diverser B-NHLs mit verfügbaren WGS-Daten konnte PhasED-Seq. im medianen Fall 3,0-mal mehr SNV (81 vs. 27) und 2,9-mal mehr PVs (50 vs. 17) rückgewinnen als das vorherige CAPP-Seq.-Panel. Diese Beobachtung betont die Wichtigkeit, nicht-codierende Teile des Genoms für eine maximale Mutationsrückgewinnung einzuschließen. Zur Validierung dieser Ertragsverbesserungen wurden 16 Tumor- oder Plasma-DNA-Proben von Patienten mit DLBCL (Tabelle 4) vor der Behandlung mit einem Profil versehen. Sowohl CAPP-Seq- als auch PhasED-Seq.-Panels wurden parallel auf jede Probe angewendet und danach bis zu einer hohen eindeutigen molekularen Tiefe sequenziert (2B). Verglichen mit der durch WGS etablierten erwarteten Anreicherung wurden ähnliche Verbesserungen bei der Ausbeute an SNV durch PhasED-Seq. im Vergleich zu CAPP-Seq. (2,7x; Median 304,5 vs. 114) beobachtet. Bei der Auszählung der in individuellen sequenzierten DNA-Fragmenten beobachteten PVs wurde jedoch eine Verbesserung zugunsten von PhasED-Seq. festgestellt, die über die erwartete Verbesserung durch WGS hinausging (7,7x; Median 5554 vs. 719,5 PVs/Fall). Diese Verbesserung ist möglicherweise entweder 1) auf die höhere Sequenzierungstiefe bei der gezielten Sequenzierung zurückzuführen, die zu einer Verbesserung des Nachweises seltener Allele führt, oder 2) auf die Auszählung von PVs höherer Ordnung bei der gezielten Sequenzierung mit PhasED-Seq. oder CAPP-Seq, die beim WGS-Design nicht berücksichtigt wurde (d. h. > 2 SNV pro Fragment; 9D-9F). Darüber hinaus wurde über 1-kb-Fenster im Panel eine robuste Korrelation zwischen der Häufigkeit putativer PVs in WGS-Daten und PVs aus der gezielten Sequenzierung durch PhasED-Seq. über 101 DLBCL-Proben (2C) beobachtet, was die Häufigkeit und Verteilung von PVs in B-Zell-Malignitäten weiter validiert.
Beispiel 5: Unterschiede bei Phasenvarianten zwischen Lymphom-Subtypen
Nach der Validierung des PhasED-Seq.-Panels wurden die biologischen Unterschiede in PVs zwischen verschiedenen B-Zell-Malignitäten, einschließlich DLBCL (n=101), primärem mediastinalem B-Zell-Lymphom (PMBCL) (n=16) und klassischem Hodgkin-Lymphom (cHL) (n=23), untersucht. Die Anzahl der pro Fall identifizierten SNV unterschied sich nicht signifikant zwischen den Lymphom-Subtypen (9G-9K). Bei Berücksichtigung der Mutationshaplotypen wies cHL jedoch eine deutlich geringere Last an PVs auf als DLBCL oder PMBCL. Zusätzlich zu dieser quantitativen Diskrepanz wurden auch Unterschiede in der genomischen Lage der PVs zwischen verschiedenen B-Zell-Lymphom-Subtypen beobachtet (2D-2E und 10-12). Dies beinhaltete bereits zuvor etablierte biologische Assoziationen in DLBCL-Subtypen, einschließlich häufigerer PVs in BCL2 bei DLBCL vom GCB-Typ als vom ABC-Typ, wobei die umgekehrte Assoziation für PIM1 beobachtet wurde. Es wurden auch häufigere PVs in CIITA bei PMBCL im Vergleich zu DLBCL beobachtet, einem Gen, in dem Bruchpunkte bei PMBCL häufig sind. Relative Anreicherungen wurden auch im gesamten IGH Locus beobachtet, mit häufigeren PVs in den Bereichen Sy3 und Sγ1 bei ABC-DLBCL (im Vergleich zu GCB-DLBCL) und interessanterweise häufigeren PVs im Locus Sε bei cHL im Vergleich zu DLBCL (2E und 13). Insgesamt wurden nach Korrektur zur Prüfung multipler Hypothesen signifikante relative Anreicherungen in 25 genetischen Loci zwischen ABC- und GCB-DLBCL, 24 zwischen DLBCL und PMBCL und 40 zwischen DLBCL und cHL gefunden (10-12).
Beispiel 6: Rückgewinnung von Phasenvarianten durch PhasED-Seq.
Um den Nachweis von ctDNA mit Hilfe von PVs zu erleichtern, ist eine effiziente Rückgewinnung von DNA-Molekülen erforderlich. Die Hybrid-Capture-Sequenzierung ist potenziell empfindlich gegenüber DNA-Unstimmigkeiten, da mit zunehmenden Mutationen die Hybridisierungseffizienz abnimmt. In der Tat können AID-Hotspots eine lokale Mutationsrate von 5-10 % aufweisen, mit noch höheren Raten in bestimmten Bereichen der IGH. Zur empirischen Bewertung der Auswirkungen der Mutationsrate auf die Capture-Effizienz wurde die DNA-Hybridisierung von 150-meren mit unterschiedlichen Mutationsraten in silico simuliert. Wie erwartet, nahm die vorhergesagte Bindungsenergie mit zunehmender Anzahl von Mutationen ab (14A). Insbesondere hatten zufällig verteilte Mutationen eine größere Auswirkung auf die Bindungsenergie als gruppierte Mutationen. Zur Beurteilung der Auswirkung dieser verminderten Bindungsaffinität wurden 150-mer-DNA-Oligonukleotide mit 0 bis 10 % Abweichung von der Referenzsequenz in MYC und BCL6, zwei Loci, die Ziele von aSHM sind, synthetisiert. Zur Beurteilung des Worst-Case-Szenarios für die Hybridisierung wurden die Nicht-Referenzbasen nicht in Gruppen, sondern zufällig verteilt (Beispiel 10). Eine äquimolare Mischung dieser Oligonukleotide wurde dann mit dem PhasED-Seq.-Panel erfasst. In Übereinstimmung mit den In silico-Vorhersagen führte eine höhere Mutationsrate zu einer geringeren Erfassungseffizienz (3A). Moleküle mit einer Mutationsrate von 5 % wurden mit einer Effizienz von 85 % im Vergleich zu ihren Gegenstücken im Wildtyp erfasst, während Moleküle mit einer Mutationsrate von 10 % mit einer relativen Effizienz von nur 27 % erfasst wurden. Zur Beurteilung der Prävalenz dieses Mutationsgrades in menschlichen Tumoren wurde die Verteilung der Varianten im Panel bei 140 Patienten mit B-Zell-Lymphomen untersucht, wobei der Anteil der mutierten Basen in sich überlappenden 151-bp-Fenstern berechnet wurde (Beispiel 10). Nur 7 % (10/140) der Patienten hatten ein beliebiges 151-bp-Fenster mit einer Mutationsrate von über 10 % (14B-C). In der Tat wurde bei dem Versuch mit synthetischen Oligonukleotiden eine 5 %ige Mutationsrate fast genauso effizient rückerlangt wie die Wildtyp-Sequenz. In mehr als der Hälfte aller betrachteten Fälle wies kein Locus eine Mutationsrate von > 5 % in einem beliebigen Fenster auf, während in allen Fällen > 90 % der Fenster < 5 % Mutationen aufwiesen. Insgesamt deuten diese Beobachtungen daraufhin, dass, trotz der Hybridisierungsverzerrungen, die Mehrheit der Phasenmutationen durch effiziente Hybriderfassung rückerlangt werden kann.
Beispiel 7: Fehlerprofil und Nachweisgrenze für Phasenvarianten-Sequenzierung
Bisherige Verfahren zur hochgradig fehlerunterdrückten Sequenzierung von cfDNA haben entweder eine Kombination aus molekularen und In silico-Verfahren zur Fehlerunterdrückung (z. B. integrierte digitale Fehlerunterdrückung, iDES) oder molekulare Duplex-Rückgewinnung angewandt. Beide haben jedoch ihre Grenzen, sei es beim Nachweis von Ereignissen bei extrem niedrigen Tumorfraktionen oder bei der effizienten Rückgewinnung der ursprünglichen DNA-Moleküle, was für die cfDNA-Analyse, bei der die Ausgangs-DNA begrenzt ist, von großer Bedeutung ist. Das Fehlerprofil und die Rückgewinnung von Ausgangsgenomen aus cfDNA-Plasmaproben von 12 gesunden Erwachsenen durch PhasED-Seq. wurden mit iDES-CAPP-Seq. und Duplex-Sequenzierung verglichen. Während die iDES-angereicherte CAPP-Seq. ein geringeres Hintergrundfehlerprofil aufwies als die Barcode-Deduplikation allein, bot die Duplex-Sequenzierung die niedrigste Hintergrundfehlerrate für nicht-referenzielle Einzelnukleotid-Substitutionen (3B, 3,3 × 10^-5 vs. 1,2 × 10^-5, P < 0,0001). Die Rate der Phasenfehler - z. B. mehrere Nicht-Referenzbasen auf demselben Sequenzierungsfragment - war jedoch deutlich niedriger als die Rate der Einzelfehler in iDES-angereicherten CAPP-Seq- oder Duplex-Sequenzierungsdaten. Dies galt sowohl für das Vorkommen von zwei (2-fach oder ,Dublett`-PVs) als auch von drei (3-fach oder ,Triplett‘-PVs) Substitutionen auf ein und demselben DNA-Molekül (3B, 8,0 × 10^-7 bzw. 3,4 × 10^-8, P < 0,0001). Phasenfehler, die Substitutionen von C zu T oder T zu C enthalten, waren häufiger als andere Arten von PVs (14D). Bemerkenswert ist, dass die Fehlerrate der Dublett-PVs in cfDNA auch mit dem Abstand zwischen Positionen korreliert, wobei die höchste PV-Fehlerrate aus benachbarten SNV (z. B. DNVs) besteht und die Fehlerrate mit zunehmendem Abstand zwischen den einzelnen Varianten abnimmt (14E). Unter Berücksichtigung der eindeutigen molekularen Tiefe wurden bei der Duplex-Sequenzierung nur 19 % aller eindeutigen cfDNA-Fragmente rückerlangt (3C). Im Gegensatz dazu war die eindeutige Tiefe der PVs innerhalb eines genomischen Abstands von <20 bp fast identisch mit der Tiefe der individuellen Positionen (z. B. der Moleküle, die individuelle SNV abdecken). In ähnlicher Weise wiesen PVs mit einer Größe von bis zu 80 bps eine Tiefe von mehr als 50 % des Medians der eindeutigen molekularen Tiefe für eine Probe auf. Wichtig ist, dass fast die Hälfte (48 %) aller PVs innerhalb von 80 bp voneinander lagen, was ihren Nutzen für den Krankheitsnachweis aus ausgangsbegrenzten cfDNA-Proben zeigt (3D).
Zum quantitativen Vergleich der Leistung von PhasED-Seq. mit alternativen Verfahren zum Nachweis von ctDNA wurden limitierende Verdünnungen von ctDNA von 3 Lymphompatienten mit gesunder Kontroll-cfDNA hergestellt, was zu erwarteten Tumoranteilen zwischen 0,1 % und 0,00005 % (1 Teil in 2.000.000; (Beispiel 10) führte. Der erwartete Tumoranteil wurde mit dem geschätzten Tumorgehalt in jeder dieser Verdünnungen unter Verwendung von PhasED-Seq. verglichen, um vom Tumor abgeleitete PVs zu verfolgen, sowie mit fehlerunterdrückten Nachweisen in Abhängigkeit von einzelnen SNV (z. B. iDES-angereicherter CAPP-Seq. oder Duplex-Sequenzierung; 3E). Alle Verfahren funktionierten gleich gut bis zu Tumoranteilen von 0,01 % (1 Teil in 10.000). Unterhalb dieses Wertes (z. B. 0,001 %, 0,0002 %, 0,0001 % und 0,00005 %) waren jedoch sowohl die PhasED-Seq. als auch die Duplex-Sequenzierung der iDES-angereicherten CAPP-Seq. deutlich überlegen (P<0,0001 für Duplex, ,2x`-PhasED-Seq. und ,3x'-PhasED-Seq.; 3E). Zusätzlich identifizierte die Verfolgung von 2 oder 3 Varianten in Phase (z. B. 2x- und 3x-PhasED-Seq.) im Vergleich zur Duplex-Sequenzierung den erwarteten Tumorgehalt genauer, mit einer überlegenen Linearität von bis zu 1 Teil in 2.000.000 (P = 0,005 für Duplex vs. 2x-PhasED-Seq., P = 0,002 für 3x-PhasED-Seq.) (Beispiel 10). Die Spezifität der PVs wurde durch die Suche nach Hinweisen auf vom Tumor abgeleitete SNV oder PVs in cfDNA-Proben von 12 nicht verwandten gesunden Subjekt und der für die Grenzverdünnung verwendeten gesunden Kontrolle bewertet. Auch hier zeigten sowohl die 2x-als auch die 3x-PhasED-Seq. signifikant niedrigere Hintergrundsignalwerte als die CAPP-Seq. und die Duplex-Sequenzierung (3F). Diese niedrigere Fehlerrate und der Hintergrund von PVs verbessert die Nachweisgrenze für den Nachweis von ctDNA-Krankheiten. In einigen Fällen erfordert das hierin beschriebene Verfahren der auf Sequenzierung basierenden cfDNA-Assays (z. B. das in 3E und 3F dargestellte Verfahren) keine molekularen Barcodes, um eine exquisite Fehlerunterdrückung und niedrige Nachweisgrenzen zu erreichen. Bei der Beurteilung des Signals durch das Verfahren ohne Barcode wurden Verdünnungsreihen von 1 : 1.000 bis 5 : 10.000.000 und „leere“ Kontrollen verwendet (23A-23B).
Diese Verdünnungsreihe wurde zur Beurteilung der Nachweisgrenze für eine gegebene Anzahl von PVs verwendet (3G-3I). Bei Berücksichtigung eines Satzes von PVs innerhalb von Bereichen mit 150 Basenpaaren (bp) kann die Wahrscheinlichkeit des Nachweises für eine gegebene Probe durch Binomialstichproben genau modelliert werden, wobei sowohl die Tiefe der Sequenzierung als auch die Anzahl der 150bp-Bereiche mit PVs berücksichtigt werden (Beispiel 10).
Beispiel 8: Verbesserungen beim Nachweis einer minimalen Resterkrankung mit geringer Last
Um den Nutzen der mit PhasED-Seq. gebotenen niedrigeren LOD für den Nachweis von MRD mit sehr geringer Last aus cfDNA zu prüfen, wurden serielle zellfreie DNA-Proben von einem Patienten sequenziert, der sich einer Erstlinientherapie für DLBCL unterzieht (4A). Mithilfe von CAPP-Seq. war bei diesem Patienten nach nur einem Therapiezyklus keine ctDNA mehr nachweisbar, und mehrere nachfolgende Proben während und nach der Behandlung blieben ebenfalls nicht nachweisbar. Bei diesem Patienten kam es > 250 Tage nach Therapiebeginn zu einem erneuten Auftreten von nachweisbarer ctDNA und schließlich 5 Monate später zu einer klinischen und radiologischen Progression der Krankheit, was auf falsch-negative Serienmessungen mit CAPP-Seq. hindeutet. Auffallend ist, dass alle vier Plasmaproben, die während und nach der Behandlung durch CAPP-Seq. nicht nachweisbar waren, durch PhasED-Seq. nachweisbare ctDNA-Spiegel aufwiesen, mit mittleren Allelfraktionen von nur 6 Teilen in 1.000.000. Diese erhöhte Empfindlichkeit verbesserte im Vergleich zur radiologischen Überwachung die Vorlaufzeit für den Krankheitsnachweis durch ctDNA von 5 mit CAPP-Seq. auf 10 Monate mit PhasED-Seq.
Anschließend wurde die Leistung des PhasED-Seq.-ctDNA-Nachweises in einer Kohorte aus 107 Patienten mit großzelligen B-Zell-Lymphomen und Blutproben, die nach 1 oder 2 Zyklen einer Standard-Immunchemotherapie verfügbar waren, beurteilt. Wichtig ist, dass die mit PhasED-Seq. gemessenen ctDNA-Konzentrationen stark mit denen korrelierten, die mit CAPP-Seq. gemessen wurden. Insgesamt wurden 443 Tumor-, Keimbahn- und zellfreie DNA-Proben, einschließlich cfDNA vor der Therapie (n=107) und nach 1 oder 2 Behandlungszyklen (n=82 und 89), ausgewertet. Vor der Therapie waren patientenspezifische PVs durch PhaseED-Seq. in 98 % der Proben nachweisbar, mit 95 % Spezifität in cfDNA von gesunden Kontrollen (15 und 16A). Wichtig ist, dass die mit PhasED-Seq. gemessenen ctDNA-Werte stark mit den mit CAPP-Seq. gemessenen Werten korrelierten, unter Berücksichtigung sowohl der Proben vor der Behandlung als auch der Proben nach der Behandlung (Spearman Rho=0,91, 16B). Als Nächstes wurden die quantitativen Spiegel von ctDNA, die mittels PhasED-Seq. und CAPP-Seq. aus cfDNA-Proben nach Beginn der Therapie gemessen wurden, verglichen. Insgesamt wurden 72 % (78/108) der durch PhasED-Seq. nach 1 oder 2 Zyklen nachweisbaren ctDNA-Proben auch durch konventionelle CAPP-Seq. nachgewiesen (4B). Unter den mit PhasED-Seq. nachgewiesenen 108 Proben war die Krankheitslast bei denjenigen mit durch CAPP-Seq. nicht nachweisbaren (28 %) gegenüber nachweisbaren (72 %) ctDNA-Spiegeln signifikant geringer, mit einem > 10-fachen Unterschied in den medianen ctDNA-Spiegeln (Tumorfraktion 2,2 × 10^-4 gegenüber 1,2 × 10^-5, P < 0,001, 4B). Insgesamt wiesen weitere 16 % (13/82) der Proben nach 1 Therapiezyklus und 19 % (17/89) der Proben nach 2 Therapiezyklen beim Vergleich von PhasED-Seq. mit CAPP-Seq. nachweisbare ctDNA auf (4C).
Die Kriterien für die molekulare Remission der ctDNA wurden zuvor für DLBCL-Patienten unter Verwendung von CAPP-Seq. beschrieben und beinhalten die eindeutige molekulare Remission (Major Molecular Resopnse, MMR), definiert als eine 2,5-log-Reduktion in ctDNA nach 2 Therapiezyklen22. Während die MMR zu diesem Zeitpunkt prognostisch für das Ergebnis ist, haben viele Patienten zu diesem Meilenstein nicht durch CAPP-Seq nachweisbare ctDNA (4D-4E). Wichtig ist, dass selbst bei Patienten mit nicht durch CAPP-Seq. nachweisbarer ctDNA der Nachweis von okkulten ultraniedrigen ctDNA-Spiegeln durch PhasED-Seq. prognostisch für Ergebnisse war, die das ereignisfreie und das Gesamtüberleben beinhalten (4D). Tatsächlich wiesen 58 % (52/89) der 89 Patienten mit zu diesem Zeitpunkt verfügbaren Proben bei der MMR-Zwischenbeurteilung nach Abschluss von 2 von 6 geplanten Therapiezyklen nicht durch CAPP-Seq. nachweisbare ctDNA auf. Bei der Verwendung von PhasED-Seq wiesen 33 % (17/52) der nicht durch CAPP-Seq. nachgewiesenen Proben Hinweise auf ctDNA auf, die durch PVs nachgewiesen wurden, mit Spiegeln von bis zu ~3:1.000.000 (17A-17D) - diese 17 Fälle, die zusätzlich durch PhasED-Seq. nachgewiesen wurden, stellen potenzielle falsch-negative Tests durch CAPP-Seq. dar. Ähnliche Ergebnisse wurden zum Zeitpunkt der frühen molekularen Remission (EMR) beobachtet (d. h. nach 1 Zyklus der Therapie, 18A-18H).
Während der Nachweis von ctDNA bei DLBCL nach 1 oder 2 Therapiezyklen ein bekannter negativer prognostischer Marker ist, sind die Ergebnisse für Patienten mit nicht nachweisbarer ctDNA zu diesen Zeitpunkten heterogen (4E und 18F). Wichtig ist, dass selbst bei Patienten mit nicht durch CAPP-Seq nachweisbarer ctDNA nach 1 oder 2 Therapiezyklen der Nachweis von extrem niedrigen ctDNA-Werten durch PhasED-Seq eine starke Prognose für die Ergebnisse einschließlich des ereignisfreien Überlebens beinhaltete (4F, 17C-D, 18C-D und 18G). Bei der Kombination des Nachweises durch PhasED-Seq. mit dem zuvor beschriebenen MMR-Schwellenwert konnten die Patienten in drei Gruppen eingeteilt werden: Patienten, die keine MMR erreichten, Patienten, die eine MMR erreichten, jedoch persistierende ctDNA aufwiesen, und Patienten mit nicht nachweisbarer ctDNA (4G). Interessanterweise hatten Patienten, die keine MMR erreichten, trotz zusätzlicher geplanter Erstlinientherapie (z. B. innerhalb des ersten Jahres der Behandlung) ein besonders hohes Risiko für frühe Ereignisse, während Patienten mit anhaltend niedrigen ctDNA-Werten offenbar ein höheres Risiko für spätere Rückfälle oder Progressionen hatten. Im Gegensatz dazu hatten Patienten mit nicht nachweisbarer ctDNA nach 2 Therapiezyklen durch PhasED-Seq. überwältigend günstige Ergebnisse, wobei 95 % ereignisfrei waren und 97 % eine Gesamtüberlebenszeit von 5 Jahren aufwiesen. Ähnliche Ergebnisse wurden zum EMR-Zeitpunkt nach 1 Zyklus der Therapie beobachtet (18H).
Beispiel 9: Beispielhafte Ausführungsformen des Mutationsnachweises mittels Next-Generation-Sequenzierung (NGS), wenn es sich bei der Mutation nicht um eine einzelne Basensubstation, sondern um ein Mutationspaar handelt
In vielen Fällen kann eine Einschränkung der cfDNA-Verfolgung darin bestehen, dass nur eine begrenzte Anzahl von Molekülen für den Nachweis zur Verfügung steht. Darüber hinaus gibt es mehrere potenzielle Einschränkungen bei der Verfolgung von Tumormolekülen aus zellfreier DNA, die nicht nur das Fehlerprofil bei der Sequenzierung, sondern auch die Anzahl der für den Nachweis verfügbaren Moleküle beinhalten. Die Anzahl der für den Nachweis verfügbaren Moleküle - hier als Anzahl der „auswertbaren Fragmente“ bezeichnet - kann sowohl als Funktion der Anzahl der rückerlangten eindeutigen Genome (z. B. der eindeutigen Sequenzierungstiefe) als auch der Anzahl der verfolgten somatischen Mutationen betrachtet werden. Genauer gesagt, die Anzahl der auswertbaren Fragmente ist gleich: EF = d * n.
Wobei d = die berücksichtigte eindeutige molekulare Tiefe und n = die Anzahl der verfolgten somatischen Veränderungen ist. Für die typischen zellfreien DNA-Proben werden oft weniger als 10.000 eindeutige Genome rückerlangt (d), sodass ein beliebiges empfindliches Verfahren zur Verfolgung von Mehrfachveränderungen erforderlich ist (n). Darüber hinaus besteht, wie bereits erwähnt, die größte Einschränkung bei der Duplex-Sequenzierung in der Schwierigkeit, eine ausreichende molekulare Tiefe (d) zu erhalten. So gibt es von einer typischen Plasmaprobe mit einer Duplex-Tiefe von ~1.500x, selbst wenn 100 somatische Veränderungen vorliegen, nur 150.000 auswertbare Fragmente. In diesem Szenario wird die Empfindlichkeit also durch die Anzahl der für den Nachweis verfügbaren Moleküle begrenzt. Im Gegensatz dazu berücksichtigen andere Verfahren wie iDES-angereicherte CAPP-Seq. alle rückerlangten Moleküle. Hier können bis zu 5.000-6.000x eindeutige haploide Genome rückerlangt werden. Daher kann die Anzahl der auswertbaren Fragmente, die dieselben 100 somatischen Veränderungen aufweisen, 500.000-600.000x sein. Das Fehlerprofil der einzelsträngigen Sequenzierung erlaubt jedoch selbst mit Fehlerunterdrückung einen Nachweis von bestenfalls 1 Teil in 50.000. Daher müssen Verfahren, die auf eine Verbesserung der Nachweisgrenzen für ctDNA abzielen, sowohl das Fehlerprofil der Sequenzierung als auch die Rückgewinnung einer ausreichenden Anzahl auswertbarer Fragmente überwinden, um diese niedrigeren Fehlerprofile zu nutzen.
Um diesen offensichtlichen Mangel zu beheben, ist das Verfahren der PhasED-Seq., wie es in der vorliegenden Offenbarung beschrieben wird, auf lymphoide Malignitäten und auf andere Krebshistologien anwendbar (z. B. mit einem „personalisierten“ Ansatz). Für einen personalisierten Ansatz wurden personalisierte Hybrid-Capture-Oligonukleotide (oder Primer für PCR-Amplikons) verwendet, um personalisierte somatische Mutationen zu erfassen, die bei der Sequenzierung des gesamten Exoms oder Genoms identifiziert wurden. Der PCAWG-Datensatz, der auf SNV untersucht wurde, die in einem Abstand von weniger als 170bp im genomischen Raum auftreten, wurde erneut analysiert. Es wurde festgestellt, dass bei 14 von 24 berücksichtigten Krebshistologien der mediane Fall > 100 mögliche Phasenvarianten enthielt, was mehrere solide Tumore wie Melanome (Median 2072), Plattenepithelkarzinome der Lunge (1268), Adenokarzinome der Lunge (644,5) und kolorektale Adenokarzinome (216,5) beinhaltete.
Anschließend wurde die erwartete Nachweisgrenze in allen Fällen des PCAWG-Datensatzes entweder unter Verwendung von Duplex-Sequenzierung oder PhasED-Seq. bewertet. Auch hier wurde die Nachweisgrenze durch die erwartete Anzahl auswertbarer Fragmente definiert und hängt somit sowohl von der Anzahl der verfolgten Varianten als auch von der erwarteten Tiefe der Sequenzierung ab. Unter Verwendung der Daten aus optimierten Hybriderfassungsbedingungen wurde ein Modell zur Vorhersage der erwarteten deduplizierten (einzelsträngigen) und duplexen (doppelsträngigen) molekularen Tiefe bei einem gegebenen DNA-Eingang und einer gegebenen Anzahl von Sequenzierungslesungen erstellt. Daraus und aus der Anzahl der SNV oder möglichen PVs aus dem PCAWG-Datensatz wurde für jeden Fall beurteilt, welches Verfahren zu einer größeren Anzahl auswertbarer Fragmente und damit zu einer höheren Nachweisgrenze führen würde. Die Ergebnisse dieser Übung, die von 64 Nanogramm (ng) cfDNA-Input und insgesamt 20 Millionen Sequenzierungsauslesungen ausgeht, sind in 19 dargestellt. Bemerkenswert ist, dass PhasED-Seq. bei den meisten Krebsarten (18/24 Histologien) eine niedrigere Nachweisgrenze hatte als die Duplex-Sequenzierung. Dies beinhaltete nicht nur B-Zell-Lymphome, sondern auch häufige solide Tumore, darunter Plattenepithelkarzinome und Adenokarzinome der Lunge, kolorektale Adenokarzinome, Adenokarzinome der Speiseröhre und des Magens sowie Adenokarzinome der Brust, um nur einige zu nennen. Am Beispiel von Lungenkrebs wurde eine fast 10-fach niedrigere Nachweisgrenze für den Plattenepithel- und Adenokarzinom-Lungenkrebsfall mit PhasED-Seq. im Vergleich zur Duplex-Sequenzierung festgestellt (20). Sowohl die PhasED-Seq. als auch die Duplex-Sequenzierung mit einem personalisierten Ansatz wiesen eine niedrigere Nachweisgrenze auf als nicht-personalisierte Ansätze (z. B. iDES-angereicherte CAPP-Seq.).
Zur weiteren Bestätigung der Anwendbarkeit von Phasenvarianten und PhasED-Seq. bei verschiedenen soliden Tumoren wurde WGS (20-30x) an gepaarter Tumor- und normaler DNA durchgeführt, um PVs von fünf soliden Tumorpatienten zu identifizieren, bei denen vor der Behandlung eine geringe ctDNA-Belastung vorhergesagt wurde (Lungenkrebs (n=5)). Nach der Identifizierung putativer PVs in jedem Fall wurde anschließend ein Satz personalisierter Hybrid-Capture Oligonukleotide gestaltet, um eine gezielte Resequenzierung von Tumor- und normaler DNA zur Validierung der Kandidaten-PVs durchzuführen. Abschließend wurden die Plasmaproben aller 5 Patienten mit Hilfe der personalisierten PhasED-Seq. zum Nachweis von ctDNA mit hoher molekularer Tiefe sequenziert. Unter Berücksichtigung dieser fünf Lungenkrebsfälle erzielte der PhasED-Seq.-Ansatz eine ~10-fache Verbesserung der analytischen Sensitivität und erreichte einen medianen LOD von 0,00018 % im Vergleich zu 0,0019 % bei der Verwendung der personalisierten CAPP-Seq. ( 21).
Um die klinische Bedeutung dieser verbesserten Nachweisgrenze für ctDNA aus PhasED-Seq. bei soliden Tumoren zu demonstrieren, wurden serielle Plasmaproben eines Patienten mit Adenokarzinom der Lunge im Stadium 3, der mit Chemoradiotherapie mit kurativer Absicht behandelt wurde (LUP814), sowohl mit CAPP-Seq. als auch mit PhasED-Seq. analysiert. Wie oben beschrieben, quantifizierten sowohl CAPP-Seq. als auch PhasED-Seq. eine ähnliche Menge an ctDNA vor der Therapie (~1 % Tumorfraktion). Bei 3 weiteren Proben nach Beginn der Therapie war die ctDNA jedoch mit der Standard-CAPP-Seq. nicht nachweisbar, was Proben während und nach der Chemobestrahlung und während der adjuvanten Immuntherapie mit Durvalumab beinhaltete. Trotz des fehlenden Nachweises einer Krankheit durch CAPP-Seq. hatte der Patient nach einem anfänglichen radiologischen Ansprechen eine bioptisch bestätigte rezidivierende Krankheit. Bei der Analyse derselben Proben mit PhasED-Seq. wurde jedoch in 3/3 (100 %) der Proben eine molekulare Restkrankheit nachgewiesen, wobei die mittlere Tumorfraktion bei nur 0,00016 % (1,6 Teile pro Million) lag. Darüber hinaus spiegelte der Trend in der ctDNA-Quantifizierung den Krankheitsverlauf des Patienten wider, mit einem anfänglichen Ansprechen auf die Chemoradiotherapie, aber einer Progression der Krankheit während der Immuntherapie. Wichtig ist, dass die Krankheit dieses Patienten zu allen Zeitpunkten nachweisbar blieb, mit nachweisbarer Krankheit bei Abschluss der Chemoradiotherapie 8 Monate vor der durch Biopsie bestätigten Krankheitsprogression des Patienten (22).
Beispiel 10: Verfahren zur Phasenvariante-Anreicherung für einen verbesserten Nachweis von Krankheiten aus zellfreier DNA
10(a): Analyse der Gesamtgenomsequenzierung
10(a)(1): Gesamtgenom-Sequenzierungsdaten putativer Phasenvarianten-Identifikation
Die Gesamtgenom-Sequenzierungsdaten wurden aus zwei Quellen erlangt. Die Daten für lymphoide Malignitäten (diffuses großzelliges B-Zell-Lymphom, DLBCL; follikuläres Lymphom, FL; Burkitt-Lymphom, BL; chronische lymphatische Leukämie, CLL) wurden am 7. Mai 2018 vom Datenportal des International Cancer Genome Consortium (ICGC) heruntergeladen. Die Daten aller anderen Histologien waren Teil der Pan-Krebs-Analyse von ganzen Genomen (pan-Cancer analysis of whole genomes, PCAWG) und wurden am 11. November 2019 heruntergeladen. Es wurden nur Krebshistologien mit mindestens 35 verfügbaren Fällen berücksichtigt. Einzelheiten zu dem berücksichtigten Datensatz sind in Tabelle 1 aufgeführt. Alle Proben wiesen somatische Mutationen auf, die durch WGS unter Verwendung abgestimmter Tumor- und Normalgenotypisierungen ermittelt wurden. Die Abfragen beschränkten sich auf Basensubstitutionen, die aus WGS erlangt wurden (Einzel-, Doppel-, Dreifach- und Oligonukleotidvarianten; SNV, DNVs, TNVs und ONVs). Nachdem die Fälle und Varianten von Interesse identifiziert waren, wurde als nächstes die Anzahl der putativen Phasenvarianten (PVs) in jedem Tumor identifiziert. Um als PV auf einem einzelnen zellfreien DNA-Molekül (cfDNA) zu funktionieren, müssen zwei Varianten, wie etwa zwei Einzelnukleotidvarianten (SNV), im Allgemeinen innerhalb eines genomischen Abstands auftreten, der geringer ist als die Länge eines typischen cfDNA-Moleküls (~170bp). Daher wurden putative PVs als zwei Varianten definiert, die auf demselben Chromosom innerhalb eines genomischen Abstands von < 170bp auftreten. DNVs, TNVs und ONVs wurden als Satz ihrer jeweiligen Komponenten-SNV betrachtet. Die Anzahl der SNV sowie die Identität der putativen PVs für jeden Fall sind in Tabelle 1 aufgeführt. Die Rohanzahl der SNV und der putativen PVs sowie die Anzahl der putativen PVs unter Berücksichtigung der Anzahl der SNV ist dargestellt in 5A-C.
10(a)(2): Mutationssignaturen von Phasenvarianten aus WGS
Zur Beurteilung der Mutationsprozesse, die mit Phasen- und Nicht-Phasen-Mutationen in verschiedenen Krebsarten/Subtypen verbunden sind, wurden die Mutationssignaturen einzelner Basensubstitutionen (SBS) für jeden oben beschriebenen WGS-Fall mit dem R-Paket ,deconstructSigs' ausgezählt. Die Liste der SNV für jeden Patienten wurde zunächst in zwei Gruppen aufgeteilt: 1) SNV, die innerhalb einer möglichen PV enthalten sind, d. h. mit einer benachbarten oder „nächsten Nachbar“-SNV in einer Entfernung von < 170bp, und 2) isolierte SNV (d. h. ohne Phase), die als in einem Abstand von ≥ 170bp zur nächstgelegenen SNV auftretend definiert sind. Anschließend wurde ,DeconstructSigs' unter Verwendung der 49 in COSMIC beschriebenen SBS-Signaturen (mit Ausnahme von Signaturen, die mit möglichen Sequenzierungsartefakten verbunden sind) angewendet, um den Beitrag jeder SBS-Signatur sowohl zu den Kandidaten für phasierte SNV als auch für nicht-phasierte SNV für jeden Patienten zu beurteilen. Um den Beitrag jeder SBS-Signatur zu den phasierten und isolierten SNV zu vergleichen, wurde ein Wilcoxon-Vorzeichen Rang-Test durchgeführt, um den relativen Beitrag jeder SBS-Signatur zwischen diesen beiden Kategorien für jede Krebsart zu vergleichen (6A-6WW). Zur Berücksichtigung mehrerer Hypothesen wurde die Bonferroni-Korrektur angewandt, indem jede beliebige SBS-Signatur, die sich in ihrem Beitrag zu den phasierten gegenüber den nichtphasierten SNV unterschied, als signifikant angesehen wurde, wenn der Wilcoxon-Vorzeichen Rang-Test einen P-Wert von < 0,05 / 49 oder 0,001 ergab. Die Verteilungen dieser Vergleiche sowie die Signifikanzprüfung sind in den 6A-6WW dargestellt. Eine Zusammenfassung dieser Analyse ist auch in 1C anhand einer Wärmebild-Darstellung dargestellt, wobei die „Wärme“ die Differenz zwischen dem mittleren Beitrag der SBS-Signatur zu Phasenvarianten und dem mittleren Beitrag zu isolierten/nicht-phasierten Varianten darstellt.
10(a) (3): Genomische Verteilung von Phasenvarianten aus WGS
Die Rezidivhäufigkeit für PVs wurde bei jedem Krebstyp über das gesamte Genom innerhalb jedes Tumortyps untersucht. Insbesondere wurde das menschliche Genom (Build GRCh37/hg19) zunächst in 1-kb-Bins (insgesamt 3.095.689 Bins) unterteilt. Danach wurde für jede Probe die Anzahl der in jedem 1-kb-Bin enthaltenen PVs (wie oben definiert) gezählt. Für diese Analyse wurden beliebige PVs mit mindestens einem ihrer Bestandteil-SNV innerhalb des 1-kb-Bins von Interesse einbezogen. Anschließend wurde für jeden Krebstyp in jedem genomischen Bin der Anteil der Patienten berechnet, deren Tumor eine PV aufwies. Zur Identifizierung von 1-kb-Bins, die rezidiv PVs in Patienten enthalten, wurde die Anteil der Patienten, die PVs in jedem 1-kb-Bin enthalten, gegen die genomischen Koordinaten (1D und 7) aufgetragen. Für diese Analyse wurden nur Bins aufgezeichnet, in denen mindestens 2 % der Proben bei mindestens einem Krebssubtyp eine PV enthielten.
10(a)(4): Identifizierung rezidiver 1-kb-Bins mit Phasenvarianten
Zur Identifizierung von 1-kb-Bins die rezidivierende PVs in B-Lymphoid-Malignitäten enthalten, wurden WGS-Daten der folgenden Krankheiten verwendet: DLBCL, FL, BL und CLL. Jede beliebige 1-kb-Bin, in der > 1 Probe aus diesen Tumortypen enthalten war, wurde als rezidiv PVs aus B-Lymphoid-Malignitäten enthaltend betrachtet. Die genomischen Koordinaten von 1kb-Bins, die rezidivierende PVs in lymphoiden Malignitäten enthalten, sind in Tabelle 2 aufgezählt und in 8A aufgezeichnet.
10(b): Gestaltung eines PhasED-Seq.-Panels für B-Lymphoid-Malignitäten
10(b)(1): Identifikation von rezidivierenden PVs aus WGS-Daten mit höherer Auflösung.
Angesichts der Prävalenz rezidivierender putativer PVs aus WGS-Daten bei B-Zell-Malignitäten wurde ein gezielter Sequenzierungsansatz für deren hybridisierungsvermitteltes Capture gestaltet - die Phasenvarianten-Anreicherungssequenzierung (Phased Variant Enrichment Sequencing, PhasED-Seq) -, um diese spezifischen PV-Ereignisse aus Tumor- oder zellfreier DNA anzureichern. Zusätzlich zu den vorstehend beschriebenen ICGC-Daten wurden in dieser Gestaltung auch WGS-Daten aus anderen Quellen verwendet, einschließlich sowohl B-Zell-NHLs als auch CLL.
Untersucht wurden auch frühere Erfahrungen mit der gezielten Sequenzierung von cfDNA bei NHLs. Es wurden Paare von SNV identifiziert, die in jeder B-Zell-Tumorprobe in einem Abstand von < 170bp voneinander auftreten. Anschließend wurden die genomischen „Fenster“, die PVs enthielten, wie folgt identifiziert: Für jedes Chromosom wurden die PVs nach genomischen Koordinaten relativ zu dem Referenzgenom sortiert. Daraufhin wurde die niedrigste (d. h. die am weitesten links liegende) Position für jeden beliebigen PV bei einem beliebigen Patienten identifiziert. Dies definierte die linke (5') Koordinate, die ein gewünschtes Fenster von Interesse darstellt, das aus dem Genom zu erfassen ist. Dieses Fenster wurde dann durch Wachstum seines 3'-Endes erweitert, um sukzessive PVs zu erfassen, bis eine Lücke von ≥340bp erreicht war, wobei 340-bp als Erfassung von zwei sukzessiven Fragmenten in Chromatosomengröße von ~170-bp gewählt wurde. Wurde eine solche Lücke erreicht, wurde ein neues Fenster begonnen und dieser iterative Prozess des Hinzufügens benachbarter PVs wurde erneut wiederholt, bis die nächste Lücke von ≥340bp erreicht war. Das Ergebnis ist eine BED-Datei mit genomischen Fenstern, die alle möglichen PVs aus allen berücksichtigten Proben enthält. Abschließend wurde jedes Fenster zusätzlich um 50bp auf jeder Seite aufgefüllt, um eine effiziente Erfassung flankierender Sequenzen in seltenen Fällen zu ermöglichen, in denen repetitive oder schlecht abbildende dazwischenliegende Sequenzen ihre direkte Anzielung zur Anreicherung ausschließen könnten.
Nach der Identifizierung der Bereiche von Interesse, die putative PVs enthalten, wurde dann jedes Fenster in 170bp-Segmente unterteilt (z. B. die ungefähre Größe eines chromatosomalen cfDNA-Moleküls). Danach wurde die Anzahl der eine PV enthaltenden Fälle in jedem Fall ausgezählt. Für jeden 170bp-Bereich wurde der Bereich in die endgültige Gestaltung des Panels einbezogen, wenn eines oder mehrere der folgenden Kriterien erfüllt waren: 1) mindestens ein Patient enthielt eine PV in dem 170bp-Bereich in 3 von 5 unabhängigen Datensätzen, 2) mindestens ein Patient enthielt eine PV in dem Bereich in 2 von 5 unabhängigen Datensätzen, wenn ein Datensatz vorherige CAPP-Seq-Erfahrung war, oder 3) mindestens ein Patient enthielt eine PV in dem Bereich in 2 von 5 unabhängigen Datensätzen, wobei insgesamt mindestens 3 Patienten eine PV in dem Bereich enthielten. Daraus ergaben sich 691 ,Kacheln‘, wobei jede Kachel einen 170bp großen Genombereich repräsentiert. Diese Kacheln wurden zusammen mit einem zusätzlichen ~200kb genomischen Raum, der in B-NHL rezidivierend mutierte Treibergene anzielt, zu einem einheitlichen gezielten Sequenzierungspanel kombiniert, wie es zuvor sowohl für die Tumor- als auch für die cfDNA-Genotypisierung mit NimbleDesign (Roche NimbleGen) beschrieben wurde. Die endgültigen Koordinaten dieses Panels sind in Tabelle 3 angegeben.
10(b)(2): Vergleich der Leistung, von PhasED-Seq und CAPP-Seq bei PV-Ertrag
Zur Bewertung der Leistung von PhasED-Seq. bei der Erfassung von SNV und PVs im Vergleich zum zuvor berichteten CAPP-Seq.-Selektor für B-Zell-Lymphome wurde die vorhergesagte Anzahl von SNV und PVs, die mit jedem Panel durch Beschränkung von WGS in silico auf die Erfassungsziele jedes Ansatzes (9A-C) rückerlangt werden können, quantifiziert. Die vorhergesagte Anzahl der Varianten wurde dann unter Verwendung des Wilcoxon-Vorzeichen Rang-Tests verglichen. Sowohl CAPP-Seq. als auch PhasED-Seq. wurden auch an 16 Proben von Patienten mit DLBCL durchgeführt. In diesen Proben wurde die Tumor- oder Plasma-DNA zusammen mit der entsprechenden Keimbahn-DNA sequenziert. Die sich daraus ergebende Anzahl von Varianten wurde erneut mit dem Wilcoxon-Vorzeichen-Rang-Test verglichen (2B, und 9D-9E). Die Sequenzierungstiefe für die in dieser Analyse enthaltenen Proben ist in Tabelle 4 angegeben.
10(c): Identifikation von Phasenvarianten aus gezielten Sequenzierungsdaten 10(c)(1): Patientenaufnahme und Entnahme klinischer Proben
Patienten mit B-Zell-Lymphomen, die sich einer Erstlinientherapie unterziehen, wurden von sechs Zentren in Nordamerika und Europa in diese Studie aufgenommen, darunter die Stanford University, das MD Anderson Cancer Center, das National Cancer Institute, die Universität Ost-Piemont (Italien), das Universitätsklinikum Essen (Deutschland) und CHU Dijon (Frankreich). Insgesamt wurden 343 zellfreie DNA-, 73 Tumor- und 183 Keimbahnproben von 183 Patienten in diese Studie einbezogen. Alle Patientenproben wurden mit einer schriftlichen Einverständniserklärung für die Verwendung zu Forschungszwecken entnommen und von den entsprechenden Prüfungsausschüssen (Institutional Review Boards) in Übereinstimmung mit der Deklaration von Helsinki genehmigt. Zellfreie, Tumor- und Keimbahn-DNA wurden wie zuvor beschrieben isoliert. Alle Röntgenuntersuchungen wurden im Rahmen der klinischen Standardversorgung durchgeführt.
10(c)(2): Präparation der Bibliothek und Sequenzierung
Zur Erzeugung von Sequenzierungsbibliotheken und gezielten Sequenzierungsdaten wurde CAPP-Seq. wie zuvor beschrieben angewendet. Kurz gesagt wurden zellfreie, Tumor- und Keimbahn-DNA zum Aufbau von Sequenzierbibliotheken durch Endreparatur, A-Tailing und Adapterligierung gemäß den Anweisungen des Herstellers des KAPA Hyper Prep Kits verwendet, wobei die Ligation über Nacht bei 4 °C durchgeführt wurde. CAPP-Seq.-Adapter mit eindeutigen molekularen Identifikatoren (UMIDs) wurden für die Barcodierung eindeutiger DNA-Duplexe und die anschließende Deduplizierung von Sequenzierlesepaaren verwendet. Anschließend wurde unter Verwendung des vorstehend beschriebenen PhasED-Seq.-Panels eine Hybriderfassung durchgeführt (SeqCap EZ Choice; NimbleGen). Die Affinitätserfassung wurde gemäß des Herstellerprotokolls durchgeführt, wobei alle Hybridisierungen bei 47 °C auf einem Eppendorf-Thermocycler stattfanden. Nach der Anreicherung wurden die Bibliotheken unter Verwendung eines Illumina HiSeq4000 Instruments mit 2×150bp Paired-End-Lesungen sequenziert.
10(c)(3): Vorverarbeitung und Ausrichtung.
Die FASTQ-Dateien wurden demultiplexiert und die UMIDs wurden mithilfe einer benutzerdefinierten Pipeline extrahiert, wie zuvor beschrieben. Nach der Demultiplexierung wurden die Lesungen mit Hilfe von BWA ALN an das menschliche Genom (Build GRCh37/hgl9) ausgerichtet. Die molekulare Barcode-vermittelte Fehlerunterdrückung und das Hintergrundpolieren (d. h. die integrierte digitale Fehlerunterdrückung; iDES) wurden dann wie zuvor beschrieben durchgeführt.
10(c)(4): Identifikation von Phasenvarianten und allelische Quantifizierung
Nach der Erstellung von UMID-fehlerbereinigten Ausrichtungsdateien (z. B. BAM-Dateien) wurden die PVs aus jeder Probe wie folgt identifiziert. Zunächst wurde eine abgestimmte Keimbahnsequenzierung von unbeteiligten mononukleären Zellen des peripheren Blutes (Peripheral Blood Mononuclear Cells, PBMCs) durchgeführt, um patientenspezifische konstitutionelle Einzelnukleotid-Polymorphismen (Single Nucleotide Polymorphisms, SNPs) zu identifizieren. Diese wurden definiert als Nichtreferenzpositionen mit einer Varianten-Allel-Anteil (VAF) von über 40 % bei einer Tiefe von wenigstens 10 oder einem VAF von über 0,25 % bei einer Tiefe von wenigstens 100. Als Nächstes wurden PVs anhand von Leseebenedaten für eine Probe von Interesse identifiziert. Nach der UMID-vermittelten Fehlersuppression verwendeten jede einzelne Paired-End (PE)-Lesung und alle identifizierten Nichtreferenzpositionen ,samtools calmd‘. Zur Identifizierung von Varianten, die auf demselben Vorlagen-DNA-Molekül vorkommen, die dann entweder in Lesung 1 oder in Lesung 2 fallen können, wurden anstelle einzelner Lesungen PE-Daten verwendet. Jedes Lesepaar, das ≥2 Nichtreferenzpositionen enthielt, wurde als mögliche somatische PV betrachtet. Für Lesungen mit > 2 Nichtreferenzpositionen wurde jede Permutation der Größe ≥ 2 unabhängig berücksichtigt: d. h. wenn 4 Nichtreferenzpositionen in einem Lesepaar identifiziert wurden, wurden alle Kombinationen von 2 SNV (d. h. ,Doublett‘-Phasenvarianten) und alle Kombinationen von 3 SNV (d. h. ,Triplett`-Phasenvarianten) unabhängig berücksichtigt. PVs, die putative Keimbahn-SNPs enthalten, wurden ebenfalls wie folgt entfernt: Wenn in einem gegebenen n-Mer (d. h. n SNV in Phase auf einem gegebenen Molekül) ≥n-1 der Komponentenvarianten als Keimbahn-SNPs identifiziert wurden, wurde die PV redigiert. Diese Filterstrategie stellt sicher, dass für beliebige verbleibende PV mindestens 2 der Komponenten-SNV nicht in der Keimbahn zu finden sind, was sowohl für die Sensitivität als auch für die Spezifität von Bedeutung ist.
Putative somatische PVs wurden unter Verwendung eines heuristischen Sperrlisten-Ansatzes unter Berücksichtigung der Sequenzierungsdaten von 170 Keimbahn-DNA-Proben, die als Kontrollen dienten, herausgefiltert. In jeder dieser Proben wurden PVs auf Lesepaaren wie vorstehend beschrieben identifiziert, jedoch ohne Filterung nach übereinstimmenden Keimlinien. Jede beliebige PV, die in einer oder mehreren dieser Kontrollproben in einem oder mehreren Paired-End-Lesungen auftrat, wurde in die Sperrliste eingeschlossen und aus den patientenspezifischen somatischen PV-Listen entfernt.
Zur Berechnung des VAF jeder PV wurde ein Zähler, der die Anzahl der eine PV von Interesse enthaltenden DNA-Moleküle darstellt, über einen Nenner, der die Gesamtzahl der den Genombereich von Interesse abdeckenden DNA-Moleküle darstellt, berechnet. Das heißt, der Zähler ist einfach die Gesamtzahl der einen gegebenen PV enthaltenden deduplizierten Lesepaare, während der Nenner die Anzahl der den genomischen Locus eines gegebenen PV umfassenden Lesepaare ist.
10(c)(5): Genotypisierung von Phasenvarianten aus Vorbehandlungsvroben
Die obige Strategie führte zu einer Liste von PVs mit einer Lesetiefe von≥1 in jeder Probe. Zur Identifizierung von PVs, die als tumorspezifische somatische Reporter für die Überwachung der Krankheit dienen, wurde für jeden Fall eine beste Genotypisierungs'-Probe identifiziert - entweder DNA aus einer Tumorgewebebiopsie (bevorzugt) oder zellfreie DNA aus der Vorbehandlungsphase. Nach der Identifizierung aller möglichen PVs in der ,besten Genotypisierungsprobe‘ wurde die Liste für die Spezifität wie folgt weiter gefiltert. Wenn für einen beliebigen n-Mer-PV-Satz ≥n-1 der konstituierenden SNV als Keimbahn-SNPs in den zuvor beschriebenen 170 Kontrollproben vorhanden waren, wurde die PV entfernt. Zudem wurden nur PVs berücksichtigt, die die folgenden Kriterien erfüllen: 1) AF > 1%; 2) Tiefe des PV-Locus von ≥100 Lesepaaren, und 3) mindestens eine Komponenten-SNV muss im Zielraum liegen. Schließlich, 4) jede beliebige PV, die diese Kriterien erfüllte, wurde in einer Kohorte von 12 gesunden cfDNA-Kontrollproben auf Leseunterstützung untersucht. Wenn eine beliebige Leseunterstützung in > 1 dieser 12 Proben vorhanden war, wurde die PV entfernt. Für die Genotypisierung zellfreier DNA-Proben, die durch SNV als geringe Tumorfraktion identifiziert wurden (d. h. < 1 % mittlere AF über alle SNV), wurde der AF-Schwellenwert für die Bestimmung der PVs auf > 0,2 % gelockert. Diese Filterung führte zu den PV-Listen, die für die Überwachung der Krankheit und den Nachweis von MRD verwendet wurden.
10(c)(6): Bestimmung der Tumorfraktion in einer Probe aus Phasenvarianten
Bei der Bewertung einer Probe für den Nachweis einer minimalen Restkrankheit (MRD) mit vorheriger Kenntnis des Tumorgenotyps kann das Vorhandensein beliebiger PV, die in der besten Genotypisierungsprobe vor der Behandlung identifiziert wurden, in der MRD-Probe von Interesse bewertet werden. Anhand einer Liste von k möglichen tumorabgeleiteten PVs, die in der besten Genotypisierungsprobe beobachtet wurden, wurden alle Lesepaare ermittelt, die mindestens 1 der k möglichen PVs abdecken. Dieser Wert, d, kann als die aggregierte informative Tiefe‘ über alle von cfDNA-Molekülen überspannten PVs in einem PhasED-Seq-Versuch betrachtet werden. Anschließend wurde untersucht, wie viele dieser d Lesepaare tatsächlich 1 oder mehr der k möglichen PVs enthielten - dieser Wert, x, steht für die Anzahl der tumorabgeleiteten Moleküle, die somatische PVs in einer gegebenen Probe enthalten. Die Anzahl der tumorabgeleiteten Moleküle, die PVs enthalten, geteilt durch die informative Tiefe - x/d - ist daher die Phasenvarianten-Tumorfraktion (PVAF) in einer gegebenen Probe. Zum Nachweis von MRD in jeder Probe wurde die PVAF unabhängig für Dublett-, Triplett- und Quadruplett-PVs berechnet.
10(c)(7): Monte-Carlo-Simulation zur empirischen Signifikanz des PV-Nachweises innerhalb einer Probe
Zur Beurteilung der statistischen Signifikanz des Nachweises von tumorabgeleiteten PVs in einer beliebigen Probe wurde ein empirischer Signifikanztest durchgeführt. Eine Teststatistik ƒ wurde zunächst wie folgt definiert - aus einer gegebenen Liste von k möglichen tumorabgeleiteten PVs, die in der besten Genotypisierungsprobe beobachtet wurden, wurde das arithmetische Mittel der Allelfraktionen über alle k PVs berechnet (Allelfraktion definiert als die Anzahl der Lesepaare, die eine individuelle PV (x_i) enthalten, im Verhältnis zur Anzahl der Lesepaare, die die PV-Positionen (d_i) umfassen): $f = \frac{\sum_{i = 1}^{k} \frac{x_{i}}{d_{i}}}{k}$
zur Bewertung der Hypothese, dass ƒ sich nicht signifikant von der Hintergrundfehlerrate ähnlicher PVs unterscheidet, die aus derselben Probe bewertet wurden. Zur Entwicklung einer Nullverteilung und Durchführung der statistischen Tests wurde ein Monte-Carlo-Ansatz verwendet:

1. Bei einer Gruppe von k PVs {pv₁ ...pv₁ ...pv_k} wurde eine ,alternative‘ Liste von PVs {pv'₁ ... pv'_i ... pv' _k} erstellt, sodass für jede alternative PV dieselbe Art von Basenänderung und derselbe Abstand zwischen SNV wie für die Test-PV vorlag. Wurde beispielsweise in der Genotypisierungsprobe eine Dublett-PV, chr14:106329929 C>T und chr14: 106329977 G>A, identifiziert und nach zwei alternativen Positionen im gleichen genomischen Abstand (hier 48bp) mit den Referenzbasen C und G gesucht und nach Lesepaaren mit den gleichen Arten von Basenveränderungen (d. h. C>T und G>A) bewertet, wird das unten stehende heuristische Suchschema verwendet.
2. Für jeden Tumor pv_i in der Gruppe von k wurden 50 solcher Alternativen identifiziert. Dies wurde mit einem zufälligen Suchalgorithmus durchgeführt, um den genomischen Raum zu scannen und Alternativen zu identifizieren. Um diese 50 Alternativen zu finden, wurde eine zufällige Position auf demselben Chromosom wie der Test pv_i identifiziert und dann nach denselben Arten von Referenzbasen im selben genomischen Abstand wie oben beschrieben gesucht. Die Syntenie der beobachteten/alternativen PVs wurde zur Kontrolle der Variation in den Bereichen in SHM/aSHM sowie der Kopienzahlvariation als potenzielle Störfaktoren der Nullverteilung verwendet. Alternative Positionen, die als Keimbahn-SNP identifiziert wurden, d. h. mit einer AF > 5 %, wurden ausgeschlossen.
3. Nach der Identifizierung von 50 solcher Alternativen für jede pv_i wurden 10.000 zufällige Permutationen von 1 Alternative für jede der k Original-PVs erzeugt und die Phasenvariantenfraktion ƒ' für diese alternativen Listen in der Probe von Interesse, die auf das Vorhandensein von MRD ausgewertet wird, wie vorstehend beschrieben, berechnet.
4. Es wurde ein empirischer P-Wert berechnet, der definiert ist als die Anteil der Fälle, in denen die wahre Phasenvariante ƒ als kleiner oder gleich der alternativen ƒ' über die 10.000 zufälligen PV-Listen als empirisches Maß für die Signifikanz der MRD-Signifikanz in der Blutprobe von Interesse beobachtet wird.

Während dieser Vergleich ein Maß für die Signifikanz des PV-Nachweises der Tumor-Reporter-Liste im Vergleich zur empirisch definierten Hintergrund-PV-Fehlerrate innerhalb der Probe von Interesse ist, wurde seine Beziehung zur Spezifität des Nachweises über Fälle und Kontrollproben hinweg ebenfalls bewertet, wie nachstehend beschrieben.
10(c)(8): Bewertung, der Spezifität von PhasED-Seq.
Zur Bestimmung der Spezifität des Nachweises von Krankheiten und MRD während PhasED-Seq. wurden zunächst patientenspezifische PVs von 107 Patienten mit DLBCL anhand von Tumor- oder Plasma-DNA aus der Vorbehandlung zusammen mit gepaarten Keimbahnproben identifiziert. Anschließend wurden 40 unabhängige Plasma-DNA-Proben von gesunden Individuen auf das Vorhandensein dieser patientenspezifischen PVs untersucht, wobei der oben beschriebene Monte-Carlo-Ansatz verwendet wurde. Ein Schwellenwert für die P-Werte wurde empirisch mit Hilfe von Monte Carlo ermittelt, sodass eine 95%ige Spezifität für den Nachweis von Krankheiten aus Dublett-, Triplett- und Quadruplett-PVs erreicht wurde. Der Schwellenwert für den P-Wert, der eine ≥95%ige Spezifität für jede Größe der PV ergibt, war wie folgt: < 0,041 für Dubletten, < 1 für Tripletten und < 1 für Quadrupletten. Die Ergebnisse dieser Spezifität bei der cfDNA-Kontrollanalyse sind in 15 und 16 dargestellt.
10(c)(9): Berechnung der Fehlerraten
Zur Bewertung des Fehlerprofils sowohl von isolierten SNV als auch von PVs wurde die Nicht-Referenzbasis-Beobachtungsrate jeder Art von Variante über alle Lesungen hinweg untersucht. Für isolierte SNV wurde die Fehlerrate für jede mögliche Basenveränderung e_n1>n1' als der Anteil der Zielbasen mit dem Referenzallel n1 berechnet, die zum alternativen Allel n1' mutiert sind, wenn alle möglichen Basenveränderungen des Referenzallels berücksichtigt werden. Positionen mit einer Nicht-Referenz-Allel-Rate von mehr als 5 % wurden als wahrscheinliche Keimbahnereignisse eingestuft und aus der Fehlerratenanalyse ausgeschlossen. Eine globale Fehlerrate, definiert als die Mutationsrate vom hg 19-Referenzallel zu einem beliebigen alternativen Allel, wurde ebenfalls berechnet.
Für Phasenvarianten wurde eine ähnliche Berechnung durchgeführt. Für die Fehlerrate einer gegebenen Art von Phasenvariante, die sich aus k konstituierenden Basisänderungen {e_n1>n1' ... e_nk>nk'} zusammensetzt, wurde die Fehlerrate berechnet, indem sowohl die Anzahl der Instanzen der Art der Basisänderung (d. h. der Zähler) als auch die Anzahl der möglichen Instanzen für die Basisänderung (d. h. der Nenner) bestimmt wurde. Zur Berechnung des Zählers, N, wurde die Anzahl des Auftretens der PV von Interesse über alle Lesepaare in einer gegebenen Probe gezählt. Um beispielsweise die Fehlerrate von C>T- und G>A-Phasendubletts zu berechnen, wurde zunächst die Anzahl der Lesepaare gezählt, die sowohl ein zu einem T mutiertes Referenz-C als auch ein zu einem A mutiertes Referenz-G beinhalten.
Zur Berechnung des Nenners D wurde auch die Anzahl der möglichen Instanzen dieser Art von Phasenvariante berechnet; dies wurde zunächst für jedes Lesepaar i durchgeführt und dann über alle Lesepaare summiert. Eine PV mit k Komponenten kann als eine bestimmte Menge von Referenzbasen P_A, P_C, P_G, P_T aufweisend zusammengefasst werden, wobei p_N die Anzahl der einzelnen Referenzbasen in der PV ist. In ähnlicher Weise enthält ein gegebenes Lesepaar einen bestimmten Satz von Referenzbasen b_A, b_C, b_G, b_T, wobei b_N die Nummer jeder Referenzbase im Lesepaar ist. Daher kann für jedes Lesepaar in einer gegebenen Probe die Anzahl möglicher Vorkommnisse des PV-Typs von Interesse kombinatorisch wie folgt berechnet werden: $D_{i} = (\begin{matrix} b_{A} \\ p_{A} \end{matrix}) (\begin{matrix} b_{C} \\ p_{C} \end{matrix}) (\begin{matrix} b_{G} \\ p_{G} \end{matrix}) (\begin{matrix} b_{T} \\ p_{T} \end{matrix})$
Betrachtet wird zum Beispiel ein Lesepaar mit 40 Referenz-As, 50 Referenz-Cs, 45 Referenz-Gs und 35 Referenz-Ts. Die Anzahl der Positionen für eine C>T- und G>A-PV ist: $D_{i} = (\begin{matrix} 40 \\ 0 \end{matrix}) (\begin{matrix} 50 \\ 1 \end{matrix}) (\begin{matrix} 45 \\ 1 \end{matrix}) (\begin{matrix} 35 \\ 0 \end{matrix}) = 2250$
Der aggregierte Nenner, D, für die Berechnung der Fehlerrate ist dann einfach die Summe dieses Wertes über alle Lesepaare. Die Fehlerrate für diese Art von PV ist dann einfach N/D.
10(d): Unterschiede bei Phasenvarianten zwischen Lymphom-Subtypen
Um die Verteilung der Phasenvarianten in verschiedenen Lymphomtypen zu vergleichen, wurden tumorspezifische PVs bei 101 DLBCL-, 16 PMBCL- und 23 cHL-Patienten durch Sequenzierung von Tumorbiopsieproben und/oder zellfreier DNA aus der Zeit vor der Behandlung sowie von gepaarten Keimbahnproben identifiziert. Nach der Identifizierung dieser tumorspezifischen PVs wurde ihre Verteilung im gesamten Panel für die gezielte Sequenzierung bewertet. Das Panel wurde zunächst in 50bp-Bins unterteilt. Anschließend wurde für jeden Patienten ermittelt, ob er Anzeichen einer PV innerhalb des 50bp-Bins aufwies, d. h. ob mindestens eine Komponente der PV innerhalb des Bins lag. Basierend auf der GENCODEv 19-Annotation des Referenzgenoms wurde das nächstgelegene Gen zu jedem 50bp-Bin bestimmt.
Um zu bewerten, wie die Verteilung der PVs zwischen den Subtypen von Lymphomen auf der Ebene spezifischer Gene variiert, wurde die Verteilung der PVs über die 50bp-Bins untersucht, die jedes Gen (oder das nächstgelegene Gen) umfassen. Betrachtet wird zum Beispiel ein gegebenes Gen mit n solcher 50bp-Bins, die im gezielten Sequenzierungspanel vertreten sind. Für jede Bin wurde zunächst die Anteil der Patienten, ƒ, in jedem Lymphomtyp mit einer innerhalb die 50bp-Bin fallenden PV bestimmt - d. h. Bestimmung von {ƒ_type1,1, ... ƒ_type1,n} und {ƒ_type2,1' ... ƒ_type2,n}. Anschließend wurden zwei beliebige Histologien hinsichtlich der Anteil der Fälle verglichen, die PVs in den jedem Gen zugewiesenen Satz von 50bp-Bins aufweisen. Diese Vergleiche sind für einzelne Gene in genspezifischen Diagrammen in 2D und 10-12 dargestellt.
Die Anreicherung von PVs wurde statistisch für einen bestimmten Lymphomtyp oder - subtyp im Vergleich zu einem anderen verglichen, indem die Differenz in der Anteil der Patienten berechnet wurde, die eine PV in jedem 50bp-Bin über alle Bins enthalten, die einem Gen zugeordnet sind (d.h. ein gegebenes Gen überlappen oder mit einem gegebenen nächstgelegenen Gen). Insbesondere wurde für jeden beliebigen Vergleich zwischen zwei Lymphomtypen (type₁ und type₂) dieser Satz von Unterschieden in der PV-Rate zunächst zwischen Histologien {ƒ_type1,1 - f_type2,1, ... ƒ_type1,n - ƒ_type2,n} identifiziert. Dieser Satz gen-spezifischer Unterschiede in der Häufigkeit von PVs wurden dann zwischen den Lymphomtypen mit der Verteilung aller anderen 50bp-Bins im SequenzierungsPanel durch den Wilcoxon-Rangsummentest verglichen. Für diesen Test wurde der Satz von n 50bp-Bins, die einem gegebenen Gen zugeordnet sind, mit allen anderen 50bp-Bins verglichen (d. h. 6755 - n, da es 6755 50bp-Bins im Sequenzierpanel gibt). Dieser P-Wert ist zusammen mit dem mittleren Unterschied in der Anteil der Patienten mit einer PV in jedem Bin für jedes Gen zwischen den Histologien als Vulkan-Diagramm in 2E dargestellt. Zur Berücksichtigung der globalen Differenz in der Rate der PVs zwischen verschiedenen Histologien wurde die mittlere Differenz in der Anteil der Patienten mit einer PV zwischen den Histologien auf 0 zentriert, indem die mittlere Differenz zwischen allen Genen abgezogen wurde.
10(e): Hybridisierungsbias
Zur Beurteilung der Auswirkungen von Mutationen auf die Hybridisierungseffizienz wurde zunächst die Affinität mutierter Moleküle zu Erfassungsködern des Wildtyps in silico geschätzt, indem DNA-Fragmente berücksichtigt wurden, die 0-30 % Mutationen im gesamten Fragment aufweisen. Für jeden Mutationszustand in diesem Bereich wurden zunächst 10.000 Bereiche mit einer Länge von jeweils 150 bp aus dem gesamten Genom zufällig ausgewählt. Diese 150-Mere wurden dann in silico zur Simulierung der gewünschten Mutationsrate auf 3 verschiedene Arten mutiert: 1) Mutation von ,gruppierten‘ oder zusammenhängenden Basen, ausgehend von den Enden einer Sequenz, 2) Mutation von gruppierten Basen, ausgehend von der Mitte der Sequenz, oder 3) Mutation von Basen, die an zufälligen Positionen in der Sequenz ausgewählt wurden. Danach wurde das Paket energy.c zur Berechnung der theoretischen Bindungsenergie (kcal/mol) zwischen den mutierten und den Wildtyp-Sequenzen verwendet, wobei auf ein Nearest-Neighbor-Modell zurückgegriffen wurde, das etablierte thermodynamische Parameter verwendet (14A).
Dieser In silico-Versuch wurde dann durch Testen der Auswirkungen der gleichen Mutationsraten in vitro repliziert. Insbesondere wurden Oligonukleotide (IDT) synthetisiert und zur Bildung von DNA-Duplexen, die 0-10 % Mutationen an definierten Positionen im Vergleich zur menschlichen Referenzgenomsequenz aufweisen, angelagert. Diese synthetischen DNA-Moleküle wurden daraufhin zusammen in äquimolaren Konzentrationen erfasst und die relative Erfassungseffizienz der mutierten Duplexe im Vergleich zu den nicht mutierten Wildtyp-Spezies quantifiziert (3A). Zwei Sätze von Oligonukleotidsequenzen wurden zur Erfassung von AIDvermittelten aberranten somatischen Hypermutationen, die mit jedem Gen verbunden sind, aus den kodierenden Bereichen von BCL6 und MYC ausgewählt (Tabelle 5). Die erhaltene Zuordnungsfähigkeit der mutierten Spezies wurde durch BWA ALN sichergestellt. Diese synthetischen Oligonukleotid-Duplexe wurden anschließend einer Bibliothekspräparation unterzogen und mit Hilfe von PhasED-Seq. erfasst und sequenziert, durchgeführt in Triplikaten unter Verwendung verschiedener Proben. Dies ermöglichte die Bewertung der relativen Effizienz der Hybriderfassung und der molekularen Rückgewinnung im direkten Vergleich zu Wildtyp-Molekülen, die mit dem Referenzgenom identisch sind.
10(f): Beurteilung der Nachweisgrenze mit limitierenden Verdünnungsreihen
Zur empirischen Bestimmung der analytischen Sensitivität der PhasED-Seq. wurde eine limitierte Verdünnungsreihe zellfreier DNA von 3 Patienten verwendet, die mit gesunder zellfreier Kontroll-DNA in definierten Konzentrationen versetzt wurde. Die Verdünnungsreihe enthielt Proben mit einer erwarteten mittleren Tumorfraktion von 0,1 %, 0,01 %, 0,001 %, 0,0002 %, 0,0001 % und 0,00005 % oder im Bereich von 1 Teil in 1.000 bis 1 Teil in 2.000.000. Die Sequenzierungscharakteristika und die Quantifizierung der ctDNA mittels CAPP-Seq., Duplex-Sequenzierung und PhasED-Seq. sind bereitgestellt. Zum Vergleich der Leistung der einzelnen Verfahren wurde die Differenz, δ, zwischen der beobachteten und der erwarteten Tumorfraktion für jeden Patienten i bei jeder Verdünnungskonzentration j berechnet: $δ_{i, j} = {\hat{t u m o r f r a c}}_{l, J} - t u m o r f r a c_{i, j}$
Dieser Wert wurde für Patienten i = {1,2,3} und Konzentrationen j = {0.001%, 0.0002%, 0.0001%, 0.00005% } für jedes ctDNA-Nachweisverfahren (CAPP-Seq., Duplex, Dublett-PhasED-Seq. und Triplett-PhasED-Seq.) berechnet. Die Leistung der einzelnen Verfahren wurde dann mittels eines gepaarten t-Tests für diesen Satz von Patienten und Konzentrationen miteinander verglichen.
10(g): Modell zur Vorhersage der Wahrscheinlichkeit des Nachweises für einen gegebenen Satz von Phasenvarianten
Um ein mathematisches Modell zur Vorhersage der Nachweiswahrscheinlichkeit für eine gegebene Probe von Interesse zu erstellen, wurde zunächst von der allgemeinen Annahme ausgegangen, dass der cfDNA-Nachweis als ein Zufallsprozess betrachtet werden kann, der auf einer binomialen Probenahme basiert. Im Gegensatz zu SNV, die in großen genomischen Abständen voneinander auftreten, kann der Nachweis von PVs jedoch stark voneinander abhängig sein, insbesondere wenn PVs degeneriert sind (d. h. wenn zwei PVs gemeinsame Komponenten-SNV haben) oder in unmittelbarer Nähe auftreten. Um dies zu berücksichtigen, wurden nur PVs, die > 150bp voneinander entfernt auftreten, als unabhängige ,Tumor-Reporter‘ betrachtet. Die Anzahl der ,Tumor-Reporter‘, die einen Nachweis der Krankheit in einer gegebenen Probe ermöglichen, kann somit wie folgt bestimmt werden. Das PhasED-Seq.-Panel wurde in 150bp-Bins aufgeteilt. Jede PV in einer Reporterliste eines gegebenen Patienten wurde dann in eine BED-Koordinate umgewandelt, die aus der Startposition (definiert als die am weitesten links stehende Komponente SNV) und der Endposition (definiert als die am weitesten rechts stehende Komponente SNV) besteht. Für jede PV wurde die 150bp-Bin aus dem die PV enthaltenden PhasED-Seq-Selektor-Panel bestimmt. Wenn eine PV zwei oder mehr 150bp-Bins umfasste, wurde sie beiden Bins zugewiesen. Die Anzahl der unabhängigen Tumor-Reporter wurde dann als die Anzahl der separaten 150bp-Bins definiert, die eine tumorspezifische PV enthalten.
Anschließend wurde ein mathematisches Modell entwickelt, das die erwartete Wahrscheinlichkeit des Nachweises für eine gegebene Probe mit einem gegebenen Tumoranteil mit einer gegebenen Anzahl unabhängiger Tumor-Reporter (z. B. 150 bp Bins) vergleicht. Bei einer gegebenen Anzahl von Tumor-Reportern r, bei einer gegebenen Tumorfraktion ƒ, mit einer gegebenen Sequenzierungstiefe d, kann die Wahrscheinlichkeit des Nachweises von 1 oder mehreren zellfreien DNA-Molekülen, die eine tumorspezifische PV enthalten, definiert werden als: $P r (d e t e c t i o n) = 1 - P r (n o n d e t e c t i o n)$
$= 1 - (\begin{matrix} d * r \\ 0 \end{matrix}) ƒ^{0} {(1 - ƒ)}^{d * r}$
basierend auf einer einfachen binomialen Probenahme. Da das Verfahren zum Nachweis von ctDNA jedoch auf eine Falsch-Positiv-Rate von 5 % trainiert wurde, wurde dieser Term für die Falsch Positiv-Rate ebenfalls in das Modell aufgenommen: $P r (d e t e c t i o n) = 1 - P r (n o n d e t e c t i o n) + 0.05 * (n o n d e t e c t i o n)$
$P r (d e t e c t i o n) = 1 - 0.95 * P r (n o n d e t e c t i o n)$
$= 1 - 0.95 * (\begin{matrix} d * r \\ 0 \end{matrix}) ƒ^{0} {(1 - ƒ)}^{d * r}$
3G zeigt die Ergebnisse dieses Modells für eine Auswahl von Tumor-Reportern r von 3 bis 67 in einer Tiefe d von 5000. Die Konfidenzhüllkurve in diesem Diagramm zeigt Lösungen für einen Tiefenbereich d von 4000 bis 6000.

Zur empirischen Validierung dieses Modells zur Bewertung der Wahrscheinlichkeit des Krankheitsnachweises wurden Proben aus limitierenden Verdünnungsreihen verwendet. In dieser Verdünnungsreihe wurden 3 Patienten-cfDNA-Proben, die jeweils patientenspezifische PVs enthielten, mit gesunder Kontroll-cfDNA verschnitten. Für jede Liste patientenspezifischer PVs wurden 25 zufällige Teilproben der 150bp-Bins mit patientenspezifischen PVs durchgeführt, um Reporterlisten mit einer variablen Anzahl tumorspezifischer Reporter zu erstellen. Es wurde eine maximale Bin-Anzahl von 67 gewählt, um eine Probenahme aus allen 3 patientenspezifischen PV-Listen zu ermöglichen, gefolgt von einer Reduzierung der Anzahl der Bins um 2x oder 3x je Vorgang. Dies führte zu Reporterlisten, die patientenspezifische PVs aus 3, 6, 17, 34 oder 67 unabhängigen 150bp-Bins enthielten. Der Krankheitsnachweis wurde dann anhand jeder dieser patientenspezifischen PV-Listen mit zunehmender Größe in jeder der „nassen“ limitierenden Verdünnungsproben von 1: 1.000 bis 1: 1.000.000 bewertet (3H, geschlossene Kreise). In silico-Mischungen wurden ferner unter Verwendung von Sequenzierungs-Lesungen aus limitierten Verdünnungsproben mit unterschiedlichem erwarteten Tumorgehalt erstellt und erneut auf die Wahrscheinlichkeit des Nachweises von Krankheiten unter Verwendung von patientenspezifischen Teilproben von PV-Reporterlisten unterschiedlicher Länge (offene Kreise) geprüft. Für diesen Versuch wurden sowohl die ,Nass`- als auch die ,In silico‘-Verdünnungs-Bam-Dateien abwärtskonvertiert, um eine Tiefe von ~4000-6000x zu erreichen, die der modellierten Tiefe entspricht. Der endgültige Mittelwert und die Standardabweichung der Tiefe über alle abwärts konvertierten Bam-Dateien betrug 4214x± 789. Die Wahrscheinlichkeit des Nachweises wurde über alle Tests bei einer gegebenen erwarteten Tumorfraktion für eine gegebene patientenspezifische PV-Liste zusammengefasst. Für jede gegebene Verdünnung wurden mehrere unabhängig voneinander abgetastete Sätze von Lesungen betrachtet, um eine bessere Schätzung der tatsächlichen Wahrscheinlichkeit des Nachweises zu ermöglichen. Im Einzelnen wurde die folgende Anzahl von Replikaten bei jeder angegebenen Verdünnung in Tabelle 7. betrachtet. Tabelle 7. Replikate bei jeder Verdünnung zur Vorhersage der Wahrscheinlichkeit des Nachweises für einen gegebenen Satz von Phasenvarianten.

Verdünnung	Replikate	*Anzahl der Tests (Replikate 25)**	Nass oder in silico
1 : 1.000	1	25	Nass
5 : 10.000	3	75	In silico
3,5 : 10.000	3	75	In silico
2 : 10.000	3	75	In silico
1 : 10.000	3	75	Nass
5 : 100.000	3	75	In silico
3,5 : 100.000	3	75	In silico
2 : 100.000	3	75	In silico
1 : 100.000	3	75	Nass
5 : 1.000.000	8	200	In silico
3,5 : 1.000.000	8	200	In silico
2 : 1.000.000	8	200	Nass
1 : 1.000.000	8	200	Nass

Die Gesamtzahl der Tests für jede patientenspezifische PV-Liste ist daher die Anzahl der zufällig unterabgetasteten PV-Listen (z. B. 25) multipliziert mit der Anzahl der unabhängig herunterabgetasteten Bam-Dateien; diese Zahl ist in der vorstehenden Tabelle angegeben. In 3H stellen die Punkte und Fehlerbalken den Mittelwert, das Minimum und das Maximum über alle drei Patienten dar. Die Übereinstimmung zwischen der vorhergesagten Wahrscheinlichkeit des Krankheitsnachweises aus dem theoretischen mathematischen Modell und den Nass- und In silico-Proben, die dieses Modell validieren, ist in 3I dargestellt.
10(h): Statistische Analysen und Software-Verfügbarkeit
Alle in diesem Schriftstück angegebenen P-Werte sind, sofern nicht anders angegeben, 2-seitig. Vergleiche von übereinstimmenden Proben und Populationen wurden mit dem Wilcoxon-Vorzeichen Rang-Test durchgeführt; Vergleiche von Proben, die aus nicht verwandten Populationen stammen, wurden mit dem Wilcoxon-Rangsummentest durchgeführt. Vergleiche von gepaarten Proben wurden mittels eines gepaarten t-Tests durchgeführt. Die Überlebenswahrscheinlichkeiten wurden mit dem Kaplan-Meier-Verfahren geschätzt; das Überleben von Patientengruppen basierend auf den ctDNA-Werten wurde mit dem Log-Rang-Test verglichen. Andere statistische Tests sind bei Verwendung im Schiftstücktext vermerkt. Alle Analysen wurden unter Verwendung von MATLAB, Version 2018b, R Statistical Software, Version 3.4.1, und GraphPad Prism, Version 8.0.2, durchgeführt. Der Beitrag bekannter Mutationsprozesse zu phasierten und isolierten SNV aus WGS wurde mit dem Paket ,deconstruct Sigs R' unter Verwendung des COSMIC-Signaturensets (v2) wie beschrieben bewertet. Die Berechnung der AUC unter Berücksichtigung von Überleben und Zensur wurde mit dem Paket ,RsurvivalROC‘ Version 1.0.3 mit Standardeinstellungen durchgeführt. Eine ausführbare Version der PhasED-Seq.-Software, die in C++17 entwickelt wurde, ist unter phasedseq(dot)stanford(dot)edu verfügbar.
Beispiel 11
Weitere Einzelheiten zu den in der vorliegenden Offenbarung beschriebenen Tabellen sind hierin bereitgestellt:
TABELLE 1: 1000bp-Bereiche von Interesse im gesamten Genom, die putative Phasenvarianten (PV) in verschiedenen lymphoiden Neoplasmen enthalten. Es sind nur Bereiche dargestellt, die > 1 Proband mit einer PV enthalten. Koordinaten sind in hg 19. Bereiche von Genen, die zuvor als Ziele der aktivierungsinduzierten Deaminase (AID) identifiziert wurden, sind markiert. Bereiche, die in > 5 % das Subjekt beliebiger Histologie (BL, CLL, DLBCL, FL) PVs enthalten, sind ebenfalls markiert. BL, Burkitt-Lymphom, CLL, chronische lymphatische Leukämie, DLBCL, diffuses großzelliges B-Zell-Lymphom, FL, follikuläres Lymphom.
TABELLE 2: 1000bp-Bereiche von Interesse im gesamten Genom, die putative Phasenvarianten (PV) in den ABC- und GCB-Subtypen des DLBCL enthalten. Es sind nur Bereiche dargestellt, die > 1 Proband mit einer PV enthalten. Koordinaten sind in hg 19. Bereiche von Genen, die zuvor als Ziele von AID identifiziert wurden, sind markiert. ABC, aktivierter B-Zell-Subtyp; GCB, Keimzentrum-B-Zell-Subtyp.
TABELLE 3: Die Bereiche, die für das in dieser Veröffentlichung beschriebene PhasED-Seq.-Fängerreagenz verwendet wurden, konzentrierten sich auf lymphoide Malignitäten. Koordinaten sind in hg 19. Das nächstgelegene Gen und der Grund für die Aufnahme (Phasenvariante vs. allgemeine DLBCL-Genotypisierung) ist ebenfalls angegeben.
TABELLE 4: Anreicherung von PVs an genetischen Loci über das gesamte PhasED-Seq.gezielte Sequenzierungspanel für verschiedene Arten von B-Zell-Lymphomen (DLBCL einschließlich ABC- und GCB-Subtypen, PMBCL und cHL). Der PhasED-Seq.-Selektor wurde in 50bp-Bins in hgl9-Koordinaten gegliedert und jede Bin wurde nach Gen oder nächstgelegenem Gen beschriftet. Der Mittelwert der Anteil der Fälle einer gegebenen Histologie mit einer PV über alle 50bp-Bins ist dargestellt. Die Signifikanz wurde durch einen Rangsummentest (Mann-Whitney U-Test) von 50bp-Bins für ein gegebenes Gen im Vergleich zum Rest des Sequenzierpanels bestimmt. Unkorrigierte P-Werte sind angegeben, die Korrektur der multiplen Hypothesentests wurde mit dem Bonferroni-Verfahren durchgeführt. DLBCL, diffuses großzelliges B-Zell-Lymphom, PMBCL, primäres mediastinales B-Zell-Lymphom, cHL, klassisches Hodgkin-Lymphom, ABC, aktiviertes B-Zell-DLBCL, GCB, Keimzentrum-B-Zell-DLBCL.
TABELLE 5: Sequenzen von Oligonukleotiden, die zur Beurteilung der Hybridisierung und der molekularen Rückgewinnung mit zunehmender Mutationslast synthetisiert wurden (SEQ-ID NR. 1331-1358).
TABELLE 6: Nukleinsäuresonden für die Erfassungssequenzierung von B-Zell-Krebsen (SEQ-ID NRn. 0001-1330).
Obwohl hierin bevorzugte Ausführungsformen der vorliegenden Erfindung gezeigt und beschrieben wurden, wird es für den Fachmann offensichtlich sein, dass diese Ausführungsformen nur als Beispiel dienen. Eine Einschränkung der Erfindung durch die in der Patentschrift aufgeführten Beispiele ist nicht beabsichtigt. Während die Erfindung unter Bezugnahme auf die vorgenannte Patentschrift beschrieben wurde, sind die Beschreibungen und Abbildungen der Ausführungsformen hierin nicht in einem einschränkenden Sinne zu verstehen. Dem Fachmann werden zahlreiche Variationen, Änderungen und Substitutionen einfallen, ohne von der Erfindung abzuweichen. Darüber hinaus versteht sich, dass alle Aspekte der Erfindung nicht auf die hierin dargelegten spezifischen Darstellungen, Konfigurationen oder relativen Verhältnisse beschränkt sind, die von einer Vielzahl von Bedingungen und Variablen abhängen. Es versteht sich, dass verschiedene Alternativen zu den hierin beschriebenen Ausführungsformen der Erfindung bei der Durchführung der Erfindung verwendet werden können. Es ist daher vorgesehen, dass die Erfindung auch beliebige derartige Alternativen, Modifikationen, Variationen oder Äquivalente umfasst. Es ist beabsichtigt, dass die folgenden Ansprüche den Umfang der Erfindung definieren und dass Verfahren und Strukturen innerhalb des Umfangs dieser Ansprüche und ihrer Äquivalente dadurch umfasst werden.

Tabelle 3

#	Chromosom	Regionsbeginn	Regionsende	Am nächsten liegendes Gen	Grund für Einschluss
1	chr1	2306311	2306832	MORN1	Genotypisierung
2	chr1	2334441	2334664	RER1	Genotypisierung
3	chr1	2334671	2335161	RER1	Genotypisierung
4	chr1	2488006	2488247	TNFRSF14	Phasenvarianten
5	chr1	2489111	2489330	TKFRSF14	Genotypisierung
6	chr1	2489726	2489973	TNFRSF14	Genotypisierung
7	chr1	2491206	2491455	TNFRSF14	Genotypisierung
8	chr1	2492036	2492175	TNFRSF14	Genotypisierung
9	chr1	2493051	2493333	TNFRSF14	Genotypisierung
10	chr1	2494241	2494376	TNFRSF14	Genotypisierung
11	chr1	2494556	2494745	TNFRSF14	Genotypisierung
12	chr1	3547350	3547715	WRAP73	Genotypisierung
13	chr1	3747620	3747798	CEP104	Genotypisierung
14	chr1	3800045	3800148	DFFB	Genotypisierung
15	chr1	3800155	3800363	DFFB	Genotypisierung
16	chr1	4472438	4472621	AJAP1	Genotypisierung
17	chr1	4476348	4476627	AJAP1	Genotypisierung
18	chr1	9784432	9784540	PIK3CD	Genotypisierung
19	chr1	23885407	23885541	ID3	Genotypisierung
20	chr1	23885582	23885938	ID3	Genotypisierung
21	chr1	27059146	27059321	ARID1A	Genotypisierung
22	chr1	27101071	27101294	ARID1A	Genotypisierung
23	chr1	27101401	27101613	ARID1A	Genotypisierung
24	chr1	27105466	27105671	ARID1A	Genotypisierung
25	chr1	27106311	27106523	ARID1A	Genotypisierung
26	chr1	27106711	27106920	ARID1A	Genotypisierung
27	chr1	29069531	29070185	YTHDF2	Genotypisierung
28	chr1	34404022	34404171	CSMD2	Phasenvarianten
29	chr1	35472492	35472739	ZMYM6	Genotypisierung
30	chr1	61553802	61554330	NFIA	Genotypisierung
31	chr1	72334891	72335045	NEGR1	Phasenvarianten
32	chr1	72335051	72335120	NEGR1	Phasenvarianten
33	chr1	85733207	85733640	BCL10	Phasenvarianten
34	chr1	85736272	85736619	BCL10	Genotypisierung
35	chr1	85741932	85742068	BCL10	Genotypisierung
36	chr1	86591437	86591909	COL24A1	Genotypisierung
37	chr1	107866871	107867579	NTNG1	Genotypisierung
38	chr1	109649126	109649304	Clorfl94	Genotypisierung
39	chr1	109822181	109822805	PSRC1	Genotypisierung
40	chr1	110561141	110561757	AHCYL1	Genotypisierung
41	chr1	111441722	111442219	CD53	Genotypisierung
42	chr1	111715727	111715908	CEPT1	Genotypisierung
43	chr1	117078642	117078856	CD58	Genotypisierung
44	chr1	117086927	117087172	CD58	Genotypisierung
45	chr1	120457960	120459297	NOTCH2	Genotypisierung
46	chr1	160319283	160319532	NCSTN	Genotypisierung
47	chr1	181452914	181453131	CACNA1E	Genotypisierung
48	chr1	185833555	185833832	HMCN1	Genotypisierung
49	chr1	185972790	185973006	HMCN1	Genotypisierung
50	chr1	186062580	186062797	HMCN1	Genotypisierung
51	chr1	186083050	186083301	HMCN1	Genotypisierung
52	chr1	186143590	186143828	HMCN1	Genotypisierung
53	chr1	186158895	186159102	HMCN1	Genotypisierung
54	chr1	190067139	190068194	FAM5C	Genotypisierung
55	chr1	201038552	201038756	CACNA1S	Genotypisierung
56	chr1	203274697	203275926	BTG2	Phasenvarianten
57	chr1	203276207	203276586	BTG2	Genotypisierung
58	chr1	226923691	226925200	ITPKB	Phasenvarianten
59	chr1	227842646	227842718	ZNF678	Genotypisierung
60	chr2	1652010	1652858	PXDN	Genotypisierung
61	chr2	48027958	48028159	MSH6	Genotypisierung
62	chr2	48059883	48060051	FBXO11	Genotypisierung
63	chr2	48065973	48066184	FBXO11	Genotypisierung
64	chr2	55237198	55237610	RTN4	Genotypisierung
65	chr2	56149510	56150116	EFEMP 1	Genotypisierung
66	chr2	58520800	58521222	FANCL	Genotypisierung
67	chr2	59821914	59822083	BCL11A	Genotypisierung
68	chr2	60773084	60773479	BCL11A	Genotypisierung
69	chr2	61118794	61118998	REL	Genotypisierung
70	chr2	61145504	61145785	REL	Genotypisierung
71	chr2	61148869	61149644	REL	Genotypisierung
72	chr2	61441169	61441870	USP34	Genotypisierung
73	chr2	61719434	61719642	XPO1	Genotypisierung
74	chr2	62934009	62934460	EHBP1	Genotypisierung
75	chr2	63217829	63218002	EHBP1	Genotypisierung
76	chr2	63335242	63335600	WDPCP	Genotypisierung
77	chr2	63631157	63631817	WDPCP	Genotypisierung
78	chr2	63826277	63826429	MDH1	Genotypisierung
79	chr2	65258145	65258367	SLC1A4	Phasenvarianten
80	chr2	65593035	65593153	SPRED2	Phasenvarianten
81	chr2	65593180	65593250	SPRED2	Phasenvarianten
82	chr2	77746602	77746988	LRRTM4	Genotypisierung
83	chr2	80801235	80801513	CTNNA2	Genotypisierung
84	chr2	88906681	88906861	EIF2AK3	Phasenvarianten
85	chr2	89127261	89127335	IGKC	Phasenvarianten
86	chr2	89127461	89127946	IGKC	Phasenvarianten
87	chr2	89128431	89128574	IGKC	Phasenvarianten
88	chr2	89131726	89132295	IGKC	Phasenvarianten
89	chr2	89140556	89140755	IGKC	Phasenvarianten
90	chr2	89140886	89141350	IGKC	Phasenvarianten
91	chr2	89157326	89157609	IGKC	Phasenvarianten
92	chr2	89157626	89158011	IGKC	Phasenvarianten
93	chr2	89158036	89158938	IGKC	Phasenvarianten
94	chr2	89158941	89159493	IGKJ5	Phasenvarianten
95	chr2	89159511	89161445	IGKJ1	Phasenvarianten
96	chr2	89161926	89162149	IGKJ1	Phasenvarianten
97	chr2	89162776	89163285	IGKJ1	Phasenvarianten
98	chr2	89163306	89163837	IGKJ1	Phasenvarianten
99	chr2	89163861	89164838	IGKJ1	Phasenvarianten
100	chr2	89164866	89165181	IGKJ1	Phasenvarianten
101	chr2	89165191	89165644	IGKJ 1	Phasenvarianten
102	chr2	89184966	89185186	IGKV4-1	Phasenvarianten
103	chr2	89185196	89185704	IGKV4-1	Phasenvarianten
104	chr2	89196226	89196411	1GKV5-2	Phasenvarianten
105	chr2	89196851	89197324	IGKV5-2	Phasenvarianten
106	chr2	89214836	89215040	IGKV5-2	Phasenvarianten
107	chr2	89246681	89246772	IGKV1-5	Phasenvarianten
108	chr2	89246786	89246857	IGKV1-5	Phasenvarianten
109	chr2	89246911	89247053	IGKV1 -5	Phasenvarianten
110	chr2	89247096	89247215	IGKV1-5	Phasenvarianten
111	chr2	89247526	89247628	IGKV1-5	Phasenvarianten
112	chr2	89247641	89247735	IGKV1-5	Phasenvarianten
113	chr2	89247831	89248010	IGKV1-5	Phasenvarianten
114	chr2	89265756	89265829	IGKV1-6	Genotypisierung
115	chr2	89265936	89266013	IGKV1-6	Genotypisierung
116	chr2	89291906	89291981	IGKV1-8	Phasenvarianten
117	chr2	89292131	89292217	IGKV1-8	Phasenvarianten
118	chr2	89442291	89442561	IGKV3-20	Phasenvarianten
119	chr2	89442616	89443259	IGKV3-20	Phasenvarianten
120	chr2	89475781	89476009	IGKV2-24	Genotypisierung
121	chr2	89476041	89476122	IGKV2-24	Genotypisierung
122	chr2	89544331	89544608	IGKV2-30	Genotypisierung
123	chr2	89544656	89544899	IGKV2-30	Phasenvarianten
124	chr2	89976276	89976426	IGKV2D-30	Genotypisierung
125	chr2	89986776	89987023	IGKV2D-29	Genotypisierung
126	chr2	89987031	89987108	IGKV2D-29	Genotypisierung
127	chr2	90025206	90025289	IGKV2D-26	Genotypisierung
128	chr2	90025296	90025378	IGKV2D-26	Genotypisierung
129	chr2	90025471	90025554	IGKV2D-26	Genotypisierung
130	chr2	90077981	90078054	IGKV3D-20	Genotypisierung
131	chr2	90078136	90078222	IGKV3D-20	Genotypisierung
132	chr2	90078251	90078335	IGKV3D-20	Genotypisierung
133	chr2	90121891	90122008	IGKV1D-17	Genotypisierung
134	chr2	90122021	90122157	IGKV1D-17	Genotypisierung
135	chr2	90212016	90212093	IGKV3D-11	Genotypisierung
136	chr2	90212196	90212278	IGKV3D-11	Genotypisierung
137	chr2	90249151	90249275	IGKV1D-43	Genotypisierung
138	chr2	90249346	90249419	IGKV1D-43	Genotypisierung
139	chr2	90259931	90260059	JGKV1D-8	Genotypisierung
140	chr2	90260181	90260258	IGKV1D-8	Genotypisierung
141	chr2	96809889	96810144	DUSP2	Genotypisierung
142	chr2	96810164	96810374	DUSP2	Phasenvarianten
143	chr2	100758483	100758660	AFF3	Phasenvarianten
144	chr2	103148733	103148948	SLC9A4	Genotypisierung
145	chr2	117951919	117952057	DDX18	Phasenvarianten
146	chr2	136872525	136872740	CXCR4	Genotypisierung
147	chr2	136874415	136874797	CXCR4	Phasenvarianten
148	chr2	136874920	136875662	CXCR4	Phasenvarianten
149	chr2	141245127	141245373	LRP1B	Genotypisierung
150	chr2	145162401	145162624	ZEB2	Genotypisierung
151	chr2	145187091	145187638	ZEB2	Genotypisierung
152	chr2	145270956	145271394	ZEB2	Genotypisierung
153	chr2	145275631	145275744	ZEB2	Genotypisierung
154	chr2	145275756	145276174	ZEB2	Genotypisierung
155	chr2	145278026	145278305	ZEB2	Genotypisierung
156	chr2	145278311	145278659	ZEB2	Genotypisierung
157	chr2	145692901	145693081	ZEB2	Genotypisierung
158	chr2	148680516	148680692	ACVR2A	Genotypisierung
159	chr2	169781120	169781352	ABCB11	Genotypisierung
160	chr2	170101185	170101401	LRP2	Genotypisierung
161	chr2	198950434	198951003	PLCL1	Genotypisierung
162	chr2	242793232	242793447	PDCD1	Genotypisierung
163	chr2	242794037	242794192	PDCD1	Genotypisierung
164	chr2	242794317	242794537	PDCD1	Genotypisierung
165	chr2	242794822	242795040	PDCD1	Genotypisierung
166	chr2	242800887	242801093	PDCD1	Genotypisierung
167	chr3	7620223	7620990	GRM7	Genotypisierung
168	chr3	16419204	16419479	RFTN1	Phasenvarianten
169	chr3	38180129	38180549	MYD88	Genotypisierung
170	chr3	38181334	38181509	MYD88	Genotypisierung
171	chr3	38181854	38182099	MYD88	Genotypisierung
172	chr3	38182194	38182407	MYD88	Genotypisierung
173	chr3	38182554	38182844	MYD88	Genotypisierung
174	chr3	49397608	49397717	RHOA	Genotypisierung
175	chr3	49397718	49397827	RHOA	Genotypisierung
176	chr3	49399903	49400084	RHOA	Genotypisierung
177	chr3	49405833	49406013	RHOA	Genotypisierung
178	chr3	49412838	49413046	RHOA	Genotypisierung
179	chr3	64547204	64547477	ADAMTS9	Genotypisierung
180	chr3	64579889	64580094	ADAMTS9	Genotypisierung
181	chr3	71551101	71551497	EIF4E3	Phasenvarianten
182	chr3	140281598	140281875	CLSTN2	Genotypisierung
183	chr3	164730700	164730888	S1	Genotypisierung
184	chr3	165548198	165548680	BCHE	Genotypisierung
185	chr3	176750699	176750928	TBL1XR1	Genotypisierung
186	chr3	176767759	176767977	TBL1X-R1	Genotypisierung
187	chr3	176769304	176769543	TBL1XR1	Genotypisierung
188	chr3	176771659	176771732	TBL1XR1	Genotypisierung
189	chr3	183209758	183209937	KLHL6	Genotypisierung
190	chr3	183210258	183210544	KLHL6	Genotypisierung
191	chr3	183272308	183272521	KLHL6	Phasenvarianten
192	chr3	183273063	183273456	KLHL6	Phasenvarianten
193	chr3	184580663	184580872	VPS8	Genotypisierung
194	chr3	185146278	185146873	MAP3K13	Genotypisierung
195	chr3	185197923	185198317	MAP3K13	Genotypisierung
196	chr3	185236908	185237109	LIPH	Genotypisierung
197	chr3	185446223	185446389	C3orf65	Genotypisierung
198	chr3	185538773	185538951	IGF2BP2	Genotypisierung
199	chr3	185697423	185697669	TRA2B	Genotypisierung
200	chr3	186714604	186715001	ST6GAL1	Phasenvarianten
201	chr3	186782529	186782790	ST6GAL1	Phasenvarianten
202	chr3	186783389	186784291	ST6GAL1	Phasenvarianten
203	chr3	187440189	187440445	BCL6	Genotypisierung
204	chr3	187442669	187442920	BCL6	Genotypisierung
205	chr3	187443239	187443438	BCL6	Genotypisierung
206	chr3	187446814	187447831	BCL6	Genotypisierung
207	chr3	187449434	187449655	BCL6	Genotypisierung
208	chr3	187451284	187451667	BCL6	Genotypisierung
209	chr3	187460134	187460530	BCL6	Phasenvarianten
210	chr3	187460824	187461302	BCL6	Phasenvarianten
211	chr3	187461319	187461381	BCL6	Phasenvarianten
212	chr3	187461454	187461918	BCL6	Phasenvarianten
213	chr3	187461924	187462343	BCL6	Phasenvarianten
214	chr3	187462374	187462887	BCL6	Phasenvarianten
215	chr3	187462924	187462999	BCL6	Phasenvarianten
216	chr3	187463004	187463525	BCL6	Phasenvarianten
217	chr3	187463709	187463781	BCL6	Phasenvarianten
218	chr3	187463794	187464109	BCL6	Phasenvarianten
219	chr3	187619334	187619708	BCL6	Phasenvarianten
220	chr3	187660817	187661390	BCL6	Phasenvarianten
221	chr3	187957432	187957507	AC022498.1	Phasenvarianten
222	chr3	187957512	187957754	AC022498.1	Phasenvarianten
223	chr3	187957767	187958110	AC022498.1	Phasenvarianten
224	chr3	187958282	187958675	AC022498.1	Phasenvarianten
225	chr3	187958787	187959184	AC022498.1	Phasenvarianten
226	chr3	187959462	187959686	AC022498.1	Phasenvarianten
227	chr3	188299217	188299605	LPP	Phasenvarianten
228	chr3	188471412	188471549	LPP	Phasenvarianten
229	chr3	188471567	188471937	LPP	Phasenvarianten
230	chr4	7728456	7728661	SORCS2	Genotypisierung
231	chr4	40198810	40199653	N4BP2	Phasenvarianten
232	chr4	40199660	40199873	N4BP2	Phasenvarianten
233	chr4	40199990	40200211	N4BP2	Phasenvarianten
234	chr4	40200505	40200727	RHOH	Phasenvarianten
235	chr4	40200730	40201571	RHOH	Phasenvarianten
236	chr4	80327792	80328151	GK2	Genotypisierung
237	chr4	88011077	88011285	AFF1	Genotypisierung
238	chr4	106157604	106157813	TET2	Genotypisierung
239	chr4	134727698	134727916	PABPC4L	Phasenvarianten
240	chr4	153249285	153249507	FBXW7	Genotypisierung
241	chr4	154624670	154625050	TLR2	Genotypisierung
242	chr4	187509884	187510410	FAT1	Genotypisierung
243	chr4	187557779	187557985	FAT1	Genotypisierung
244	chr4	188924114	188924897	ZFP42	Genotypisierung
245	chr5	5182145	5182494	ADAMTS16	Genotypisierung
246	chr5	11110990	11111137	CTNND2	Genotypisierung
247	chr5	11236740	11236956	CTNND2	Genotypisierung
248	chr5	11364700	11364923	CTNND2	Genotypisierung
249	chr5	11397080	11397377	CTNND2	Genotypisierung
250	chr5	11411600	11411807	CTNND2	Genotypisierung
251	chr5	13864465	13864696	DNAH5	Genotypisierung
252	chr5	21783415	21783668	CDH12	Genotypisierung
253	chr5	54964698	54964921	SLC38A9	Phasenvarianten
254	chr5	67590966	67591183	PIK3R1	Genotypisierung
255	chr5	75913716	75914448	F2RL2	Genotypisierung
256	chr5	83258967	83259183	EDIL3	Genotypisierung
257	chr5	112176756	112176958	APC	Genotypisierung
258	chr5	124079827	124080721	ZNF608	Phasenvarianten
259	chr5	131825017	131825239	IRF1	Genotypisierung
260	chr5	135381969	135382218	TGFBI	Genotypisierung
261	chr5	137801487	137801637	EGR1	Genotypisierung
262	chr5	137801697	137801804	EGR1	Genotypisierung
263	chr5	140208033	140208874	PCDHA6	Genotypisierung
264	chr5	158527642	158528019	EBF1	Phasenvarianten
265	chr5	176522449	176522613	FGFR4	Genotypisierung
266	chr6	392760	392967	IRF4	Phasenvarianten
267	chr6	393090	393309	IRF4	Phasenvarianten
268	chr6	394815	395025	IRF4	Genotypisierung
269	chr6	14117992	14118654	CD83	Phasenvarianten
270	chr6	14131732	14132021	CD83	Genotypisierung
271	chr6	14133857	14133996	CD83	Genotypisierung
272	chr6	14135317	14135496	CD83	Genotypisierung
273	chr6	26020709	26020958	HIST1H3A	Genotypisierung
274	chr6	26032014	26032217	HIST1H3B	Genotypisierung
275	chr6	26045744	26046077	HIST1H3C	Genotypisierung
276	chr6	26056034	26056315	HIST1H1C	Genotypisierung
277	chr6	26056319	26056558	HIST1H1C	Genotypisierung
278	chr6	26123614	26123778	HIST1H2BC	Phasenvarianten
279	chr6	26123879	26124098	HIST1H2BC	Genotypisierung
280	chr6	26124544	26124640	HJSTIH2AC	Genotypisierung
281	chr6	26124714	26124889	HIST1H2AC	Genotypisierung
282	chr6	26156649	26157377	HIST1H1E	Phasenvarianten
283	chr6	26158529	26158608	HIST1H2BD	Genotypisierung
284	chr6	26158739	26158835	HIST1H2BD	Genotypisierung
285	chr6	26197104	26197182	HIST1H3D	Genotypisierung
286	chr6	26197189	26197465	HIST1H3D	Genotypisierung
287	chr6	26216779	26216920	HIST1H2BG	Genotypisierung
288	chr6	26217214	26217431	HIST1H2AE	Genotypisierung
289	chr6	26234654	26234976	HIST1H1D	Genotypisierung
290	chr6	26250459	26250537	HIST1H3F	Genotypisierung
291	chr6	26250594	26250703	HIST1H3F	Genotypisierung
292	chr6	26252154	26252232	HIST1H2BH	Genotypisierung
293	chr6	27100079	27100185	HIST1H2BJ	Genotypisierung
294	chr6	27100939	27101039	HIST1H2AG	Genotypisierung
295	chr6	27101159	27101300	HIST1H2AG	Genotypisierung
296	chr6	27114004	27114216	HIST1H2BK	Phasenvarianten
297	chr6	27114319	27114396	HIST1H2BK	Genotypisierung
298	chr6	27114494	27114592	HIST1H2BK	Genotypisierung
299	chr6	27277284	27277495	POM121L2	Genotypisierung
300	chr6	27777783	27777900	HIST1H3H	Genotypisierung
301	chr6	27777928	27778106	HIST1H3H	Genotypisierung
302	chr6	27782718	27782926	HIST1H2BM	Genotypisierung
303	chr6	27799168	27799381	HIST1H4K	Genotypisierung
304	chr6	27833408	27833516	HIST1H2AL	Genotypisierung
305	chr6	27834968	27835075	HIST1H1B	Genotypisierung
306	chr6	27839658	27839805	HIST1H3I	Genotypisierung
307	chr6	27860479	27860659	HIST1H2AM	Genotypisierung
308	chr6	27860794	27860938	HIST1H2AM	Genotypisierung
309	chr6	27861244	27861344	HIST1H2BO	Genotypisierung
310	chr6	27861399	27861485	HIST1H2BO	Genotypisierung
311	chr6	37138284	37139559	PIM1	Phasenvarianten
312	chr6	37140749	37140956	PIM1	Genotypisierung
313	chr6	37141679	37141903	PIM1	Genotypisierung
314	chr6	41903611	41903834	CCND3	Genotypisierung
315	chr6	41904271	41904477	CCND3	Genotypisierung
316	chr6	41904941	41905155	CCND3	Genotypisierung
317	chr6	419080171	41908365	CCND3	Genotypisierung
318	chr6	41909196	41909441	CCND3	Genotypisierung
319	chr6	75965846	75966046	TMEM30A	Genotypisierung
320	chr6	75969006	75969288	TMEM30A	Genotypisierung
321	chr6	91004618	91004828	MAP3K7	Phasenvarianten
322	chr6	91005793	91005998	MAP3K7	Phasenvarianten
323	chr6	94120219	94120743	EPHA7	Genotypisierung
324	chr6	106534266	106534477	PRDM1	Genotypisierung
325	chr6	106536046	106536340	PRDM1	Genotypisierung
326	chr6	106543466	106543637	PRDM1	Genotypisierung
327	chr6	106547146	106547437	PRDM1	Genotypisierung
328	chr6	106552761	106552932	PRDM1	Genotypisierung
329	chr6	106552961	106553841	PRDM1	Genotypisierung
330	chr6	106554221	106554400	PRDM1	Genotypisierung
331	chr6	106554766	106555383	PRDM1	Genotypisierung
332	chr6	108040228	108040856	SCML4	Genotypisierung
333	chr6	108041553	108042219	SCML4	Genotypisierung
334	chr6	1 10777718	110778244	SLC22A16	Genotypisierung
335	chr6	134491382	134491589	SGK1	Genotypisierung
336	chr6	134491892	134492111	SGK1	Genotypisierung
337	chr6	134492132	134492333	SGK1	Genotypisierung
338	chr6	134492717	134492923	SHK1	Genotypisierung
339	chr6	134493307	134493474	SGK1	Genotypisierung
340	chr6	134493732	134494308	SGK1	Phasenvarianten
341	chr6	134494342	134494514	SGK1	Genotypisierung
342	chr6	134494552	134494718	SGK1	Phasenvarianten
343	chr6	134494722	134494795	SGK1	Phasenvarianten
344	chr6	134494967	134495974	SGK1	Phasenvarianten
345	chr6	138188483	138188650	TNFAIP3	Genotypisierung
346	chr6	138192338	138192683	TNFAIP3	Genotypisierung
347	chr6	138195963	138196172	TNFAIP3	Genotypisierung
348	chr6	138196803	138197021	TNFAIP3	Genotypisierung
349	chr6	138197108	138197313	TNFAIP3	Genotypisierung
350	chr6	138198193	138198407	TNFAIP3	Genotypisierung
351	chr6	138199548	138200525	TNFAIP3	Genotypisierung
352	chr6	138201178	138201404	TNFAIP3	Genotypisierung
353	chr6	138202138	138202494	TNFAIP3	Genotypisierung
354	chr6	150954420	150954823	PLEKHG1	Phasenvarianten
355	chr6	159238415	159238794	EZR	Phasenvarianten
356	chr7	2963818	2963952	CARD11	Genotypisierung
357	chr7	2963953	2964056	CARD11	Genotypisierung
358	chr7	2969593	2969738	CARD11	Genotypisierung
359	chr7	2976668	2976876	CARD11	Genotypisierung
360	chr7	2977493	2977712	CARD11	Genotypisierung
361	chr7	2978258	2978502	CARD11	Genotypisierung
362	chr7	2979398	2979601	CARD11	Genotypisierung
363	chr7	2983918	2984199	CARD11	Genotypisierung
364	chr7	2985403	2985610	CARD11	Genotypisierung
365	chr7	2987163	2987382	CARD11	Genotypisierung
366	chr7	5569095	5569200	ACTB	Genotypisierung
367	chr7	5569210	5569359	ACTB	Genotypisierung
368	chr7	80285799	80286074	CD36	Genotypisierung
369	chr7	82387830	82388061	PCLO	Genotypisierung
370	chr7	82453520	82453733	PCLO	Genotypisierung
371	chr7	82763800	82764050	PCLO	Genotypisierung
372	chr7	82784490	82784643	PCLO	Genotypisierung
373	chr7	106508490	106509161	PIK3CG	Genotypisierung
374	chr7	110545276	110545445	IMMP2L	Phasenvarianten
375	chr7	110697971	110698144	LRRN3	Phasenvarianten
376	chr7	110737411	110737634	LRRN3	Phasenvarianten
377	chr7	110746681	110746893	LRRN3	Phasenvarianten
378	chr7	110762936	110764629	LRRN3	Genotypisierung
379	chr7	110764636	110764981	LRRN3	Genotypisierung
380	chr7	119915406	119915800	KCND2	Genotypisierung
381	chr7	122634905	122635140	TAS2R16	Genotypisierung
382	chr7	140453012	140453121	BRAF	Genotypisierung
383	chr7	140453162	140453268	BRAF	Genotypisierung
384	chr7	146997183	146997422	CNTNAP2	Genotypisierung
385	chr7	148506318	148506416	EZH2	Genotypisierung
386	chr7	148506448	148506551	EZH2	Genotypisierung
387	chr7	148508658	148508867	EZH2	Genotypisierung
388	chr7	148513738	148513900	EZH2	Genotypisierung
389	chr7	148523533	148523743	EZH2	Genotypisierung
390	chr7	151943421	151943500	KMT2C	Phasenvarianten
391	chr8	623880	624090	ERICH1	Genotypisierung
392	chr8	3141724	3141942	CSMD1	Genotypisierung
393	chr8	4494931	4495105	CSMD1	Genotypisierung
394	chr8	8748687	8749284	MFHAS1	Genotypisierung
395	chr8	8750067	8750281	MFHAS1	Genotypisierung
396	chr8	18729445	18729937	PSD3	Genotypisierung
397	chr8	75898190	75898400	CRISPLD1	Genotypisierung
398	chr8	101730376	101730457	PABPC1	Genotypisierung
399	chr8	103663491	103664160	KLF10	Genotypisierung
400	chr8	104897561	104898479	RIMS2	Genotypisierung
401	chr8	113308014	113308283	CSMD3	Genotypisierung
402	chr8	113364624	113364791	CSMD3	Genotypisierung
403	chr8	113568994	113569205	CSMD3	Genotypisierung
404	chr8	116616145	116616886	TRPS1	Genotypisierung
405	chr8	122626847	122627163	HAS2	Genotypisierung
406	chr8	128492947	128493338	POU5F1B	Genotypisierung
407	chr8	128746807	128748893	MYC	Genotypisierung
408	chr8	128748902	128749969	MYC	Genotypisierung
409	chr8	128750367	128751183	MYC	Phasenvarianten
410	chr8	128752612	128753235	MYC	Genotypisierung
411	chr8	128754007	128754731	MYC	Genotypisierung
412	chr8	128754752	128756424	MYC	Genotypisierung
413	chr8	128756707	128756931	MYC	Genotypisierung
414	chr8	128756947	128757361	MYC	Genotypisierung
415	chr8	128757737	128757921	MYC	Genotypisierung
416	chr8	128764072	128764292	MYC	Genotypisierung
417	chr8	128951724	128951896	TMEM75	Genotypisierung
418	chr8	130692149	130692503	GSDMC	Genotypisierung
419	chr8	130760594	130761023	GSDMC	Genotypisierung
420	chr8	131373024	131373443	ASAP1	Genotypisierung
421	chr8	136569669	136569842	KHDRBS3	Genotypisierung
422	chr8	136659204	136659414	KHDRBS3	Genotypisierung
423	chr8	137101252	137101464	KHDRBS3	Genotypisierung
424	chr8	137528187	137528570	KHDRBS3	Genotypisierung
425	chr8	138849937	138850149	FAM135B	Genotypisierung
426	chr8	139600457	139601255	COL22A1	Genotypisierung
427	chr8	139601392	139601569	COL22A1	Genotypisierung
428	chr9	5450474	5450616	CD274	Genotypisierung
429	chr9	5456059	5456200	CD274	Genotypisierung
430	chr9	5457054	5457446	CD274	Genotypisierung
431	chr9	5462809	5463160	CD274	Genotypisierung
432	chr9	5465489	5465622	CD274	Genotypisierung
433	chr9	5466724	5466867	CD274	Genotypisierung
434	chr9	5467814	5468022	CD274	Genotypisierung
435	chr9	5510589	5510804	PDCD1LG2	Genotypisierung
436	chr9	5522484	5522636	PDCD1LG2	Genotypisierung
437	chr9	5534764	5535047	PDCD1LG2	Genotypisierung
438	chr9	5549309	5549627	PDCD1LG2	Genotypisierung
439	chr9	5557589	5557762	PDCD1LG2	Genotypisierung
440	chr9	5563119	5563251	PDCD1LG2	Genotypisierung
441	chr9	5569929	5570140	PDCD1LG2	Genotypisierung
442	chr9	13222185	13222409	MPDZ	Genotypisierung
443	chr9	16435498	16436307	BNC2	Genotypisierung
444	chr9	19957356	19958178	SLC24A2	Genotypisierung
445	chr9	20820916	20821095	FOCAD	Genotypisierung
446	chr9	20946676	20946849	FOCAD	Genotypisierung
447	chr9	21808814	21808891	MTAP	Genotypisierung
448	chr9	21808894	21808973	MTAP	Genotypisierung
449	chr9	21859249	21859469	MTAP	Genotypisierung
450	chr9	21970834	21971023	CDKN2A	Genotypisierung
451	chr9	21971069	21971170	CDKN2A	Genotypisierung
452	chr9	21974409	21974881	CDKN2A	Genotypisierung
453	chr9	21989304	21989976	CDKN2A	Genotypisierung
454	chr9	21994084	21994405	CDKN2A	Genotypisierung
455	chr9	22005929	22006067	CDKN2B	Genotypisierung
456	chr9	22006109	22006187	CDKN2B	Genotypisierung
457	chr9	22008649	22009012	CDKN2B	Genotypisierung
458	chr9	24545399	24545922	IZUMO3	Genotypisierung
459	chr9	24905444	24905729	IZUMO3	Genotypisierung
460	chr9	27950144	27950532	LINGO2	Genotypisierung
461	chr9	37024919	37025642	PAX5	Phasenvarianten
462	chr9	37025829	37025996	PAX5	Phasenvarianten
463	chr9	37026269	37027015	PAX5	Phasenvarianten
464	chr9	37033619	37033797	PAX5	Phasenvarianten
465	chr9	37293169	37293378	ZCCHC7	Phasenvarianten
466	chr9	37371494	37371879	ZCCHC7	Phasenvarianten
467	chr9	37384684	37384911	ZCCHC7	Phasenvarianten
468	chr9	37407369	37407588	GRHPR	Phasenvarianten
469	chr9	78686579	78686854	PCSK5	Genotypisierung
470	chr9	139390582	139390950	NOTCH1	Genotypisierung
471	chr9	139390952	139391172	NOTCH1	Genotypisierung
472	chr9	139402662	139402868	NOTCH1	Genotypisierung
473	chr10	5755066	5755273	FAM208B	Phasenvarianten
474	chr10	89500957	89501139	PAPSS2	Genotypisierung
475	chr10	89603602	89604077	KLLN	Genotypisierung
476	chr10	89624272	89624350	PTEN	Genotypisierung
477	chr10	89653752	89653825	PTEN	Genotypisierung
478	chr10	89653832	89653909	PTEN	Genotypisierung
479	chr10	89685272	89685379	PTEN	Genotypisierung
480	chr10	89690752	89690894	PTEN	Genotypisierung
481	chr10	89692737	89692810	PTEN	Genotypisierung
482	chr10	89692877	89692951	PTEN	Genotypisierung
483	chr10	89692972	89693037	PTEN	Genotypisierung
484	chr10	89711837	89711966	PTEN	Genotypisierung
485	chr10	89711982	89712058	PTEN	Genotypisierung
486	chr10	89717577	89717714	PTEN	Genotypisierung
487	chr10	89717742	897117811	PTEN	Genotypisierung
488	chr10	89720637	89720904	PTEN	Genotypisierung
489	chr10	90074239	90074419	RNLS	Genotypisierung
490	chr10	90537736	90538027	LIPN	Genotypisierung
491	chr10	90579966	90580319	LIPM	Genotypisierung
492	chr10	90699126	90699647	ACTA2	Genotypisierung
493	chr10	90773866	90774076	FAS	Genotypisierung
494	chr10	91092211	91092423	IFIT3	Genotypisierung
495	chr10	91358986	91359298	PANK1	Genotypisierung
496	chr10	131640289	131640505	EBF3	Genotypisierung
497	chr11	58978692	58978791	MPEG1	Genotypisierung
498	chr11	58978927	58979095	MPEG1	Genotypisierung
499	chr11	58979112	58979365	MPEG1	Genotypisierung
500	chr11	65190342	65190557	FRMD8	Phasenvarianten
501	chr11	65266552	65266924	SCYL1	Phasenvarianten
502	chr11	65267397	65267603	SCYL1	Phasenvarianten
503	chr11	65623422	65623506	CFL1	Genotypisierung
504	chr11	69346691	69346940	CCN D1	Genotypisierung
505	chr11	102188381	102188945	BIRC3	Phasenvarianten
506	chr11	111234536	111235068	POU2AF1	Genotypisierung
507	chr11	111249311	111249530	POU2AF1	Phasenvarianten
508	chr11	111613196	111613432	PPP2R1B	Genotypisierung
509	chr11	111781036	111781641	CRYAB	Genotypisierung
510	chr11	111904096	111904291	DLAT	Genotypisierung
511	chr11	112405016	112405330	AP002884.2	Genotypisierung
512	chr11	112405341	112405621	AP002884.2	Genotypisierung
513	chr11	117101043	117101217	PCSK7	Genotypisierung
514	chr11	117712683	117712997	FXYD6	Genotypisierung
515	chr11	118754793	118755011	CXCR5	Phasenvarianten
516	chr11	118764838	118765408	CXCR5	Genotypisierung
517	chr11	118967323	118968029	DPAGT1	Genotypisierung
518	chr11	120127163	120127588	POU2F3	Genotypisierung
519	chr11	120189028	120189629	POU2F3	Genotypisierung
520	chr11	125472640	125472915	STT3A	Genotypisierung
521	chr11	128391383	128391629	ETS1	Phasenvarianten
522	chr11	128391648	128392132	ETS1	Phasenvarianten
523	chr11	129739778	129740102	NFRKB	Genotypisierung
524	chr11	131747549	1317418030	NTM	Genotypisierung
525	chr11	134027789	134027980	NCAPD3	Genotypisierung
526	chr11	134118684	134118873	THYN1	Genotypisierung
527	chr11	134129469	134130211	ACAD8	Genotypisierung
528	chr11	134130464	134131097	ACAD8	Genotypisierung
529	chr11	134133389	134133972	ACAD8	Genotypisierung
530	chr12	6439713	6439920	TNFRSF1A	Genotypisierung
531	chr12	15813487	15813687	EPS8	Genotypisierung
532	chr12	18534682	18534856	PIK3C2G	Genotypisierung
533	chr12	18544037	18544241	PIK3C2G	Genotypisierung
534	chr12	18573807	18574017	PIK3C2G	Genotypisierung
535	chr12	18699197	18699459	PIK3C2G	Genotypisierung
536	chr12	18747397	18747562	PIK3C2G	Genotypisierung
537	chr12	18800762	18801046	PIK3C2G	Genotypisierung
538	chr12	18891267	18891560	CAPZA3	Genotypisierung
539	chr12	25205888	25206105	LRMP	Phasenvarianten
540	chr12	25206398	25206616	LRMP	Phasenvarianten
541	chr12	25206748	25206877	LRMP	Phasenvarianten
542	chr12	25207088	25207474	LRMP	Phasenvarianten
543	chr12	25398218	25398299	KRAS	Genotypisierung
544	chr12	48190731	48190983	HDAC7	Genotypisierung
545	chr12	49415991	49416144	KMT2D	Genotypisierung
546	chr12	49418306	49418550	KMT2D	Genotypisierung
547	chr12	49420531	49420750	KMT2D	Genotypisierung
548	chr12	49426451	49426592	KMT2D	Genotypisierung
549	chr12	49427886	49428116	KMT2D	Genotypisierung
550	chr12	49433331	49433507	KMT2D	Genotypisierung
551	chr12	49437926	49438391	KMT2D	Genotypisierung
552	chr12	49444391	49444595	KMT2D	Genotypisierung
553	chr12	49447196	49447491	KMT2D	Genotypisierung
554	chr12	57496552	57496735	STAT6	Genotypisierung
555	chr12	57498222	57498396	STAT6	Genotypisierung
556	chr12	57498912	57499150	STAT6	Genotypisierung
557	chr12	86198698	86199622	RASSF9	Genotypisierung
558	chr12	92537875	92538647	BTG1	Phasenvarianten
559	chr12	92538790	92539374	BTG1	Phasenvarianten
560	chr12	113495364	113496458	DTX1	Phasenvarianten
561	chr12	113496509	113496679	DTX1	Phasenvarianten
562	chr12	113496694	113496945	DTX1	Phasenvarianten
563	chr12	113497059	113497278	DTX1	Phasenvarianten
564	chr12	113515199	113515658	DTX1	Genotypisierung
565	chr12	113515664	113515934	DTX1	Genotypisierung
566	chr12	113530924	113531055	DTX1	Genotypisierung
567	chr12	113531319	113531531	DTX1	Genotypisierung
568	chr12	113531799	113531930	DTX1	Genotypisierung
569	chr12	113532569	113532781	DTX1	Genotypisierung
570	chr12	113532809	113533032	DTX1	Genotypisierung
571	chr12	113533099	113533237	DTX1	Genotypisierung
572	chr12	113534494	113534778	DTX1	Genotypisierung
573	chr12	122458781	122459524	BCL7A	Phasenvarianten
574	chr12	122460811	122461193	BCL7A	Phasenvarianten
575	chr12	122461316	122461882	BCL7A	Phasenvarianten
576	chr12	122462001	122462210	BCL7A	Phasenvarianten
577	chr12	122462716	122462935	BCL7A	Phasenvarianten
578	chr12	122463031	122463137	BCL7A	Phasenvarianten
579	chr13	32907206	32907376	BRCA2	Genotypisierung
580	chr13	32912226	32912828	BRCA2	Genotypisierung
581	chr13	41133662	41133842	FOXO1	Genotypisierung
582	chr13	41133922	41135026	FOXO1	Genotypisierung
583	chr13	41239682	41239755	FOXO1	Genotypisierung
584	chr13	41239827	41240356	FOXO1	Genotypisierung
585	chr13	41240362	41240788	FOXO1	Genotypisierung
586	chr13	46959165	46959379	KIAA0226L	Phasenvarianten
587	chr13	46961680	46962067	KIAA0226L	Phasenvarianten
588	chr13	51915233	51915552	SERPINE3	Genotypisierung
589	chr13	58207131	58209129	PCDH17	Genotypisierung
590	chr13	84453542	84455255	SLITRK 1	Genotypisierung
591	chr13	113516229	113516436	ATP11A	Phasenvarianten
592	chr14	23344697	23345206	LRP10	Genotypisierung
593	chr14	32615405	32615617	ARHGAP5	Genotypisierung
594	chr14	35873671	35873838	NFKBIA	Genotypisierung
595	chr14	64330252	64330462	SYNE2	Phasenvarianten
596	chr14	69258238	69259642	ZFP36L1	Phasenvarianten
597	chr14	84420586	84420796	FLRT2	Phasenvarianten
598	chr14	96179592	96180295	TCL1A	Phasenvarianten
599	chr14	106048955	106049032	IGHA2	Phasenvarianten
600	chr14	106054695	106055541	IGHA2	Genotypisierung
601	chr14	106055740	106055827	IGHA2	Genotypisierung
602	chr14	106055910	106055995	IGHA2	Genotypisierung
603	chr14	106056035	106056121	IGHA2	Genotypisierung
604	chr14	106068705	106068911	IGHE	Phasenvarianten
605	chr14	106069045	106069384	IGHE	Phasenvarianten
606	chr14	106071060	106071135	IGHE	Phasenvarianten
607	chr14	106071190	106071271	IGHE	Phasenvarianten
608	chr14	106092380	106092608	IGHG4	Genotypisierung
609	chr14	106092670	106093406	IGHG4	Genotypisierung
610	chr14	106093435	106093575	IGHG4	Genotypisierung
611	chr14	106093610	106094215	IGHG4	Genotypisierung
612	chr14	106094235	106094479	IGHG4	Genotypisierung
613	chr14	106094580	106094654	IGHG4	Genotypisierung
614	chr14	106094675	106094915	IGHG4	Genotypisierung
615	chr14	106095335	106095417	IGHG4	Phasenvarianten
616	chr14	106095480	106095560	IGHG4	Phasenvarianten
617	chr14	106110675	106110814	IGHG2	Phasenvarianten
618	chr14	106110830	106110904	IGHG2	Phasenvarianten
619	chr14	106110950	106111025	IGHG2	Phasenvarianten
620	chr14	106111100	106111311	IGHG2	Genotypisierung
621	chr14	106111390	106112121	IGHG2	Genotypisierung
622	chr14	106112160	106112302	IGHG2	Genotypisierung
623	chr14	106112335	106113010	IGHG2	Phasenvarianten
624	chr14	106113020	106113438	IGHG2	Phasenvarianten
625	chr14	106113450	106113625	IGHG2	Phasenvarianten
626	chr14	106113695	106113901	IGHG2	Phasenvarianten
627	chr14	106113905	106113984	IGHG2	Phasenvarianten
628	chr14	106114175	106114414	IGHG2	Phasenvarianten
629	chr14	106174970	106175819	IGHA1	Genotypisierung
630	chr14	106175820	106176042	IGHA1	Genotypisierung
631	chr14	106176070	106176217	IGHA1	Genotypisierung
632	chr14	106176235	106176320	ICHA1	Genotypisierung
633	chr14	106176375	106176932	IGHA1	Phasenvarianten
634	chr14	106176985	106177069	IGHA1	Phasenvarianten
635	chr14	106177425	106177536	IGHA1	Genotypisierung
636	chr14	106211960	106212864	IGHG1	Phasenvarianten
637	chr14	106212870	106212948	IGHG1	Phasenvarianten
638	chr14	106212980	106213124	IGHG1	Phasenvarianten
639	chr14	106213125	106213200	IGHG1	Phasenvarianten
640	chr14	106213210	106213525	IGHG1	Phasenvarianten
641	chr14	106213660	106214042	IGHG1	Phasenvarianten
642	chr14	106239250	106239357	IGHG3	Phasenvarianten
643	chr14	106239455	106239900	IGHG3	Phasenvarianten
644	chr14	106239990	106240155	IGHG3	Phasenvarianten
645	chr14	106240170	106240815	IGHG3	Phasenvarianten
646	chr14	106240820	106240892	IGHG3	Phasenvarianten
647	chr14	106240915	106241118	IGHG3	Phasenvarianten
648	chr14	106241200	106241278	IGHG3	Phasenvarianten
649	chr14	106241345	106241627	IGHG3	Phasenvarianten
650	chr14	106241630	106241705	IGHG3	Genotypisierung
651	chr14	106241710	106241975	IGHG3	Genotypisierung
652	chr14	106318100	106318327	IGHM	Phasenvarianten
653	chr14	106322055	106322271	IGHM	Phasenvarianten
654	chr14	106322905	106323129	IGHM	Phasenvarianten
655	chr14	106323470	106323656	IGHM	Phasenvarianten
656	chr14	106323805	106323896	IGHM	Phasenvarianten
657	chr14	106324010	106324087	IGHM	Phasenvarianten
658	chr14	106324155	106324245	IGHM	Phasenvarianten
659	chr14	106324290	106324369	IGHM	Phasenvarianten
660	chr14	106324490	106324577	IGHM	Phasenvarianten
661	chr14	106324750	106325340	IGHM	Phasenvarianten
662	chr14	106325360	106325513	IGHM	Phasenvarianten
663	chr14	106325515	106325791	IGHM	Phasenvarianten
664	chr14	106325820	106326095	IGHJ6	Phasenvarianten
665	chr14	106326245	106326338	IGHJ6	Phasenvarianten
666	chr14	106326450	106331808	IGHD7-27	Phasenvarianten
667	chr14	106357890	106357967	IGHD6-19	Phasenvarianten
668	chr14	106380360	106380541	IGHD3-3	Phasenvarianten
669	chr14	106380550	106380901	IGHD3-3	Phasenvarianten
670	chr14	106380910	106381109	IGHD3-3	Phasenvarianten
671	chr14	106381275	106381351	IGHD3-3	Phasenvarianten
672	chr14	106381485	106381633	IGHD2-2	Phasenvarianten
673	chr14	106381655	106381724	IGHD2-2	Phasenvarianten
674	chr14	106381890	106381968	IGHD2-2	Phasenvarianten
675	chr14	106381990	106382161	IGHD2-2	Phasenvarianten
676	chr14	106382325	106382403	IGHD2-2	Phasenvarianten
677	chr14	106382905	106383014	IGHD2-2	Phasenvarianten
678	chr14	106383030	106383140	IGHD2-2	Phasenvarianten
679	chr14	106383980	106384142	IGHD1-1	Phasenvarianten
680	chr14	106384630	106384702	IGHD1-1	Phasenvarianten
681	chr14	106384720	106384798	IGHD1-1	Phasenvarianten
682	chr14	106384825	106384957	IGHD1-1	Phasenvarianten
683	chr14	106405615	106405963	IGHV6-1	Genotypisierung
684	chr14	106452660	106452748	IGHV1-2	Genotypisierung
685	chr14	106452755	106452907	IGHV1-2	Genotypisierung
686	chr14	106452940	106453023	IGHV1-2	Genotypisierung
687	chr14	106471395	106471476	IGHV1-3	Genotypisierung
688	chr14	106471510	106471609	IGHV1-3	Genotypisierung
689	chr14	106494090	106494168	IGHV2-5	Phasenvarianten
690	chr14	106494210	106494365	IGHV2-5	Phasenvarianten
691	chr14	106494445	106494553	IGHV2-5	Phasenvarianten
692	chr14	106494565	106494640	IGHV2-5	Phasenvarianten
693	chr14	106494650	106494806	IGHV2-5	Phasenvarianten
694	chr14	106518495	106518570	IGHV3-7	Phasenvarianten
695	chr14	106518855	106518962	IGHV3-7	Phasenvarianten
696	chr14	106518970	106519111	IGHV3-7	Phasenvarianten
697	chr14	106539175	106539315	IGHV1-8	Genotypisierung
698	chr14	106552365	106552502	IGHV3-9	Genotypisierung
699	chr14	106573315	106573414	IGHV3-11	Genotypisierung
700	chr14	106573445	106573524	IGHV3-11	Genotypisierung
701	chr14	106573540	106573645	IGHV3-11	Phasenvarianten
702	chr14	106573685	106574021	IGHV3-11	Phasenvarianten
703	chr14	106586200	106586343	IGHV3-13	Genotypisierung
704	chr14	106610380	106610479	IGHV3-15	Genotypisierung
705	chr14	106610480	106610557	IGHV3-15	Genotypisierung
706	chr14	106610690	106610765	IGHV3-15	Phasenvarianten
707	chr14	106621885	106622026	IGHV3-16	Genotypisierung
708	chr14	106622035	106622108	IGHV3-16	Genotypisierung
709	chr14	106641655	106641789	IGHV1-18	Genotypisierung
710	chr14	106642110	106642265	IGHV1-18	Phasenvarianten
711	chr14	106667545	106667628	IGHV3-20	Genotypisierung
712	chr14	106667675	106667750	IGHV3-20	Genotypisierung
713	chr14	106667805	106667882	IGHV3-20	Genotypisierung
714	chr14	106691755	106691904	IGHV3-21	Genotypisierung
715	chr14	106725295	106725442	IGHV3-23	Phasenvarianten
716	chr14	106725550	106725663	IGHV3-23	Phasenvarianten
717	chr14	106725780	106725952	IGHV3-23	Phasenvarianten
718	chr14	106725995	106726188	IGHV3-23	Phasenvarianten
719	chr14	106732970	106733077	IGHV1-24	Phasenvarianten
720	chr14	106733185	106733270	IGHV1-24	Phasenvarianten
721	chr14	106733275	106733487	IGHV1-24	Phasenvarianten
722	chr14	106757725	106757888	IGHV2-26	Genotypisierung
723	chr14	106758470	106758653	IGHV2-26	Phasenvarianten
724	chr14	106780610	106780752	IGHV4-28	Genotypisierung
725	chr14	106791090	106791169	IGHV3-30	Phasenvarianten
726	chr14	106805290	106805428	IGHV4-31	Genotypisierung
727	chr14	106805945	106806076	IGHV4-31	Phasenvarianten
728	chr14	106806120	106806219	IGHV-4-31	Phasenvarianten
729	chr14	106815805	106815910	IGHV3-33	Phasenvarianten
730	chr14	106829685	106829757	IGHV4-34	Phasenvarianten
731	chr14	106829765	106829986	IGHV4-34	Phasenvarianten
732	chr14	106830125	106830196	IGHV4-34	Phasenvarianten
733	chr14	106830240	106830312	IGHV4-34	Phasenvarianten
734	chr14	106830315	106830884	IGHV4-34	Phasenvarianten
735	chr14.	106831185	106831594	IGHV4-34	Phasenvarianten
736	chr14	106845300	106845540	IGHV3-35	Genotypisierung
737	chr14	106846385	106846557	IGHV3-35	Phasenvarianten
738	chr14	106866380	106866461	IGHV3-38	Genotypisierung
739	chr14	106866475	106866638	IGHV3-38	Genotypisierung
740	chr14	106877715	106877858	IGHV4-39	Phasenvarianten
741	chr14	106877930	106878498	IGHV4-39	Phasenvarianten
742	chr14	106878540	106878612	IGHV4-39	Phasenvarianten
743	chr14	106878680	106878759	IGHV4-39	Phasenvarianten
744	chr14	106926180	106926405	IGHV3-43	Genotypisierung
745	chr14	106962965	106963167	IGHV1-45	Genotypisierung
746	chr14	106963170	106963280	IGHV1-45	Genotypisierung
747	chr14	106967130	106967209	IGHV1-46	Genotypisierung
748	chr14	106967315	106967397	IGHV1-46	Genotypisierung
749	chr14	106994300	106994376	IGHV3-48	Phasenvarianten
750	chr14	106994430	106994534	IGHV3-48	Phasenvarianten
751	chr14	106994545	106994618	IGHV3-48	Phasenvarianten
752	chr14	106994660	106994745	IGHV3-48	Phasenvarianten
753	chr14	106994760	106994904	IGHV3-48	Phasenvarianten
754	chr14	107013035	107013204	IGHV3-49	Genotypisierung
755	chr14	107034665	107034845	IGHV5-51	Genotypisierung
756	chr14	107034955	107035097	IGHV5-51	Genotypisierung
757	chr14	107078455	107078631	IGHV1-58	Genotypisierung
758	chr14	107083565	107083726	IGHV4-59	Phasenvarianten
759	chr14	107083790	107083923	IGHV4-59	Phasenvarianten
760	chr14	107113405	107113560	IGHV3-64	Phasenvarianten
761	chr14	107113820	107113922	IGHV3-64	Phasenvarianten
762	chr14	107114095	107114238	IGHV3-64	Phasenvarianten
763	chr14	107136755	107136899	IGHV3-66	Phasenvarianten
764	chr14	107169645	107169841	IGHV1-69	Phasenvarianten
765	chr14	107169970	107170195	IGHV1-69	Phasenvarianten
766	chr14	107170220	107170472	IGHV1-69	Phasenvarianten
767	chr14	107170475	107170563	IGHV1-69	Phasenvarianten
768	chr14	107170660	107170871	IGHV1-69	Phasenvarianten
769	chr14	107178305	107178377	IGHV2-70	Phasenvarianten
770	chr14	107178415	107178869	IGHV2-70	Phasenvarianten
771	chr14	107178880	107179116	IGHV2-70	Phasenvarianten
772	chr14	107179130	107179339	IGHV2-70	Phasenvarianten
773	chr14	107179360	107180001	IGHV2-70	Phasenvarianten
774	chr14	107199020	107199094	IGHV3-72	Genotypisierung
775	chr14	107199095	107199173	IGHV3-72	Genotypisierung
776	chr14	107210955	107211159	IGHV3-73	Genotypisierung
777	chr14	107218755	107218891	IGHV3-74	Genotypisierung
778	chr14	107258910	107259078	IGHV7-81	Phasenvarianten
779	chr14	107259100	107259206	IGHV7-81	Phasenvarianten
780	chr14	107259235	107239444	IGHV7-81	Phasenvarianten
781	chr14	107259555	107259635	IGHV7-81	Phasenvarianten
782	chr14	107282770	107282884	IGHV7-81	Genotypisierung
783	chr14	107282945	107283018	IGHV7-81	Genotypisierung
784	chr15	45003678	45003861	B2M	Genotypisierung
785	chr15	45007718	45007927	B2M	Genotypisierung
786	chr15	45008463	45008603	B2M	Genotypisierung
787	chr15	66727354	66727536	MAP2K1	Genotypisierung
788	chr15	66729014	66729123	MAP2K1	Genotypisierung
789	chr15	66729139	66729292	MAP2K1	Genotypisierung
790	chr15	86312062	86312565	KLHL25	Genotypisierung
791	chr16	2812096	2812786	SRRM2	Genotypisierung
792	chr16	3779106	3779320	CREBBP	Genotypisierung
793	chr16	3781171	3781464	CREBBP	Genotypisierung
794	chr16	3781756	3781972	CREBBP	Genotypisierung
795	chr16	3786011	3786223	CREBBP	Genotypisierung
796	chr16	3786591	3786885	CREBBP	Genotypisierung
797	chr16	3788511	3788716	CREBBP	Genotypisierung
798	chr16	3789521	3789770	CREBBP	Genotypisierung
799	chr16	3790376	3790580	CREBBP	Genotypisierung
800	chr16	3794846	3794994	CREBBP	Genotypisierung
801	chr16	3808801	3809009	CREBBP	Genotypisierung
802	chr16	3817706	3817915	CREBBP	Genotypisierung
803	chr16	3823711	3823942	CREBBP	Genotypisierung
804	chr16	3824536	3824719	CREBBP	Genotypisierung
805	chr16	3832716	3832942	CREBBP	Genotypisierung
806	chr16	3900236	3900462	CREBBP	Genotypisierung
807	chr16	3900561	3900914	CREBBP	Genotypisierung
808	chr16	10971440	10973882	CIITA	Phasenvarianten
809	chr16	10973885	10974203	CIITA	Phasenvarianten
810	chr16	11348520	11349249	SOCS1	Phasenvarianten
811	chr16	30093722	30093935	PPP4C	Genotypisierung
812	chr16	33523607	33523675	IGHV30R16-12	Phasenvarianten
813	chr16	81946175	81946356	PLCG2	Genotypisierung
814	chr16	81953055	81953307	PLCG2	Genotypisierung
815	chr16	81962120	81962263	PLCG2	Genotypisierung
816	chr16	85933003	85933569	IRF8	Phasenvarianten
817	chr16	85936563	85936836	IRF8	Genotypisierung
818	chr16	85942563	85942821	IRF8	Genotypisierung
819	chr16	85945108	85945330	IRF8	Genotypisierung
820	chr16	85946708	85946887	IRF8	Genotypisierung
821	chr16	85948018	85948170	IRF8	Genotypisierung
822	chr16	85951993	85952448	IRF8	Genotypisierung
823	chr16	85953683	85953837	IRF8	Genotypisierung
824	chr16	85954723	85954937	IRF8	Genotypisierung
825	chr17	5366796	5367031	DHX3 3	Genotypisierung
826	chr17	7576949	7577197	TP53	Genotypisierung
827	chr17	7577444	7577683	TP53	Genotypisierung
928	chr17	7578129	7578336	TP53	Genotypisierung
829	chr17	7578344	7578591	TP53	Genotypisierung
830	chr17	7579259	7579428	TP53	Genotypisierung
831	chr17	18001529	18001704	DRG2	Genotypisierung
832	chr17	18022119	18022791	MYO15A	Genotypisierung
833	chr17	40467709	40467857	STAT3	Genotypisierung
834	chr17	40469104	40469321	STAT3	Genotypisierung
835	chr17	40474309	40474530	STAT3	Genotypisierung
836	chr17	40474974	40475190	STAT3	Genotypisierung
837	chr17	40475254	40475394	STAT3	Genotypisierung
838	chr17	40478074	40478252	STAT3	Genotypisierung
839	chr17	40485844	40486132	STAT3	Genotypisierung
840	chr17	40489754	40489903	STAT3	Genotypisierung
841	chr17	40491284	40491489	STAT3	Genotypisierung
842	chr17	41847058	41847241	DUSP3	Genotypisierung
843	chr17	51900441	51900897	KIF2B	Genotypisierung
844	chr17	56408574	56408755	BZRAP1	Phasenvarianten
845	chr17	56408884	56409615	BZR-AP1	Phasenvarianten
846	chr17	62006520	62006919	CD79B	Genotypisierung
847	chr17	62007105	62007279	CD79B	Genotypisierung
848	chr17	62007410	62007761	CD79B	Genotypisierung
849	chr17	62008645	62008786	CD79B	Genotypisierung
850	chr17	62009505	62009659	CD79B	Genotypisierung
851	chr17	63010240	63010308	GNA13	Phasenvarianten
852	chr17	63010315	63010973	GNA13	Phasenvarianten
853	chr17	63014313	63014461	GNA13	Genotypisierung
854	chr17	63049573	63049774	GNA13	Genotypisierung
855	chr17	63052443	63052678	GNA13	Genotypisierung
856	chr17	75447868	75448421	9-Sep	Phasenvarianten
857	chr17	78343503	78343715	RNF213	Genotypisierung
858	chr17	79478953	79479026	ACTG1	Genotypisierung
859	chr18	1477565	1477666	ADCYAP1	Phasenvarianten
860	chr18	6947104	6947347	LAMA1	Genotypisierung
861	chr18	6980464	6980680	LAMA1	Genotypisierung
862	chr18	13825915	13826461	MC5R	Genotypisierung
863	chr18	30349775	30350300	AC012123.1	Phasenvarianten
864	chr18	48231684	48232112	MAPK4	Genotypisierung
865	chr18	48327694	48327901	MRO	Genotypisierung
866	chr18	48512954	48513347	ELAC1	Genotypisierung
867	chr18	48591759	48592011	SMAD4	Genotypisierung
868	chr18	48593364	48593571	SMAD4	Genotypisierung
869	chr18	48604604	48604852	SMAD4	Genotypisierung
870	chr18	48703169	48703965	MEX3C	Genotypisierung
871	chr18	53804515	53804796	TXNL1	Genotypisierung
872	chr18	55274405	55274580	NARS	Genotypisierung
873	chr18	55319680	55319999	ATP8B1	Genotypisierung
874	chr18	55329690	55329857	ATP8B1	Genotypisierung
875	chr18	55359005	55359259	ATP8B1	Genotypisierung
876	chr18	56054915	56055594	NEDD4L	Genotypisierung
877	chr18	56063365	56063826	NEDD4L	Genotypisierung
878	chr18	60763829	60764032	BCL2	Genotypisierung
879	chr18	60764299	60764540	BCL2	Genotypisierung
880	chr18	60774414	60774660	BCL2	Genotypisierung
881	chr18	60793369	60793654	BCL2	Genotypisierung
882	chr18	60795829	60796006	BCL2	Genotypisierung
883	chr18	60806264	60806836	BCL2	Phasenvarianten
884	chr18	60983784	60983991	BCL2	Phasenvarianten
885	chr18	60984454	60986731	BCL2	Phasenvarianten
886	chr18	60986844	60987047	BCL2	Phasenvarianten
887	chr18	60987964	60988511	BCL2	Phasenvarianten
888	chr18	64172116	64172531	CDH19	Genotypisierung
889	chr18	64176241	64176518	CDH19	Genotypisierung
890	chr18	64239166	64239357	CDH19	Genotypisierung
891	chr18	65179856	65181824	DSEL	Genotypisierung
892	chr18	73944893	73945380	ZNF516	Genotypisierung
893	chr18	75683734	75684502	GALR1	Genotypisierung
894	chr18	77092820	77093034	ATP9B	Genotypisierung
895	chr18	77170715	77171032	NFATC1	Genotypisierung
896	chr18	77208755	77208996	NFATC1	Genotypisierung
897	chr18	77227415	77227661	NFATC1	Genotypisierung
898	chr18	77288040	77288611	NFATC1	Genotypisierung
899	chr18	77794425	77795130	RBFA	Genotypisierung
900	chr19	1376440	1376662	MUM1	Genotypisierung
901	chr19	6586161	6586445	CD70	Genotypisierung
902	chr19	6590026	6590238	CD70	Genotypisierung
903	chr19	6590786	6591079	CD70	Genotypisierung
904	chr19	8028408	8028583	ELAVL1	Genotypisierung
905	chr19	10334563	10335187	S1PR2	Genotypisierung
906	chr19	10335308	10335585	S1PR2	Genotypisierung
907	chr19	10340823	10341376	S1PR2	Phasenvarianten
908	chr19	10341833	10341984	S1PR2	Genotypisierung
909	chr19	12902574	12902861	JUNB	Genotypisierung
910	chr19	19256469	19256851	MEF2B	Genotypisierung
911	chr19	19257044	19257222	MEF2B	Genotypisierung
912	chr19	19257339	19257480	MEF2B	Genotypisierung
913	chr19	19257489	19257741	MEF2B	Genotypisierung
914	chr19	19257824	19258036	MEF2B	Genotypisierung
915	chr19	19258484	19258662	MEF2B	Genotypisierung
916	chr19	19259984	19260176	MEF2B	Genotypisierung
917	chr19	19261414	19261588	MEF2B	Genotypisierung
918	chr19	19293309	19293478	MEF2BNB	Genotypisierung
919	chr19	42599890	42600121	POU2F2	Genotypisierung
920	chr19	51525626	51525937	KLK11	Genotypisierung
921	chr19	51559441	51560040	KLK13	Genotypisierung
922	chr19	51561771	51561943	KLK13	Genotypisierung
923	chr19	52381611	52381786	ZNF577	Genotypisierung
924	chr19	52403336	52403586	ZNF649	Genotypisierung
925	chr19	52961146	52961224	ZNF534	Genotypisierung
926	chr19	52961226	52961578	ZNF534	Genotypisierung
927	chr19	53598586	53599055	ZNF160	Genotypisierung
928	chr20	23028372	23028858	THBD	Genotypisierung
929	chr20	25003526	25003774	ACSS1	Genotypisierung
930	chr20	46131072	46131213	NCOA3	Phasenvarianten
931	chr20	46131217	46131287	NCOA3	Phasenvarianten
932	chr21	18981233	18981504	BTG3	Genotypisierung
933	chr21	28213258	28213536	ADAMTS1	Genotypisierung
934	chr21	28216763	28217005	ADAMTS1	Genotypisierung
935	chr22	22380472	22381038	IGLV4-69	Phasenvarianten
936	chr22	22385622	22385767	IGLV4-69	Genotypisierung
937	chr22	22385777	22385898	IGLV4-69	Genotypisierung
938	chr22	22453287	22453502	IGLV8-61	Genotypisierung
939	chr22	22453527	22453608	IGLV8-61	Genotypisierung
940	chr22	22516707	22516785	IGLV4-60	Phasenvarianten
941	chr22	22516827	22517113	IGLV4-60	Phasenvarianten
942	chr22	22550337	22550812	IGLV6-57	Genotypisierung
943	chr22	22556227	22556630	IGLV11-55	Genotypisierung
944	chr22	22569332	22569655	IGLV10-54	Genotypisierung
945	chr22	22673242	22673607	IGLV5-52	Genotypisierung
946	chr22	22677077	22677216	IGLV1-51	Phasenvarianten
947	chr22	22677227	22677337	IGLV1-51	Genotypisierung
948	chr22	22681927	22682007	IGLV1-50	Genotypisierung
949	chr22	22682097	22682213	IGLV1-50	Genotypisierung
950	chr22	22697727	22698123	IGLV9-49	Genotypisierung
951	chr22	22707427	22707509	IGLV5-48	Genotypisierung
952	chr22	22707517	22707658	IGLV5-48	Phasenvarianten
953	chr22	22707742	22707823	IGLV5-48	Genotypisierung
954	chr22	22712077	22712496	IGLV1-47	Phasenvarianten
955	chr22	22712512	22712625	IGLV1-47	Genotypisierung
956	chr22	22723897	22724189	IGLV7-46	Phasenvarianten
957	chr22	22724207	22724494	IGLV7-46	Phasenvarianten
958	chr22	22730452	22730552	IGLV5-45	Phasenvarianten
959	chr22	22730607	22730756	IGLV5-45	Phasenvarianten
960	chr22	22730887	22730955	IGLV5-45	Phasenvarianten
961	chr22	22735417	22735604	IGLV1-44	Phasenvarianten
962	chr22	22735792	22735878	IGLV1-44	Phasenvarianten
963	chr22	22749602	22749701	IGLV7-43	Phasenvarianten
964	chr22	22749732	22749853	IGLV7-43	Phasenvarianten
965	chr22	22749857	22749939	IGLV7-43	Phasenvarianten
966	chr22	22749942	22750074	IGLV7-43	Phasenvarianten
967	chr22	22750092	22750342	IGLV7-43	Phasenvarianten
968	chr22	22758647	22759294	IGLV1-40	Phasenvarianten
969	chr22	22759297	22759377	IGLV1-40	Phasenvarianten
970	chr22	22764167	22764309	IGLV1-40	Phasenvarianten
971	chr22	22764367	22764450	IGLV1-40	Phasenvarianten
972	chr22	22764552	22764634	IGLV1-40	Phasenvarianten
973	chr22	22782037	22782325	IGLV5-37	Genotypisierung
974	chr22	22786477	22786702	IGLV1-36	Genotypisierung
975	chr22	22786727	22786842	IGLV1-36	Genotypisierung
976	chr22	22930852	22931173	IGLV2-33	Genotypisierung
977	chr22	22937192	22937341	IGLV3-32	Genotypisierung
978	chr22	22937347	22937548	IGLV3-32	Genotypisierung
979	chr22	23010977	23011143	IGLV3-27	Genotypisierung
980	chr22	23011172	23011316	IGLV3-27	Genotypisierung
981	chr22	23029497	23029581	IGLV3-25	Genotypisierung
982	chr22	23029622	23029778	IGLV3-25	Genotypisierung
983	chr22	23040452	23040527	IGLV2-23	Phasenvarianten
984	chr22	23040592	23040811	IGLV2-23	Phasenvarianten
985	chr22	23040852	23041365	IGLV2-23	Phasenvarianten
986	chr22	23047067	23047329	IGLV3-22	Genotypisierung
987	chr22	23055367	23055445	IGLV3-21	Genotypisierung
988	chr22	23055497	23055577	IGLV3-21	Phasenvarianten
989	chr22	23055727	23055857	IGLV3-21	Phasenvarianten
990	chr22	23063307	23063661	IGLV3-19	Genotypisierung
991	chr22	23077337	23077435	IGLV2-18	Genotypisierung
992	chr22	23077537	23077615	IGLV2-18	Genotypisierung
993	chr22	23090122	23090205	IGLV3-16	Genotypisierung
994	chr22	23090287	23090372	IGLV3-16	Genotypisierung
995	chr22	23101392	23101473	IGLV2-14	Phasenvarianten
996	chr22	23101532	23101605	IGLV2-14	Phasenvarianten
997	chr22	23101652	23101735	IGLV2-14	Genotypisierung
998	chr22	23114792	23114874	IGLV3-12	Genotypisierung
999	chr22	23114947	23115052	IGLV3-12	Genotypisierung
1000	chr22	23135152	23135230	IGLV2-11	Genotypisierung
1001	chr22	23135247	23135399	IGLV2-11	Genotypisierung
1002	chr22	23135437	23135521	IGLV2-11	Genotypisierung
1003	chr22	23154347	23154477	IGLV3-10	Phasenvarianten
1004	chr22	23154597	23154815	IGLV3-10	Phasenvarianten
1005	chr22	23161917	23162052	IGLV3-9	Genotypisierung
1006	chr22	23162072	23162290	IGLV3-9	Genotypisierung
1007	chr22	23165422	23165496	IGLV2-8	Phasenvarianten
1008	chr22	23165542	23165680	IGLV2-8	Phasenvarianten
1009	chr22	23165727	23165811	IGLV2-8	Phasenvarianten
1010	chr22	23192412	23192818	IGLV4-3	Phasenvarianten
1011	chr22	23197917	23198053	IGLV4-3	Phasenvarianten
1012	chr22	23198067	23198475	IGLV4-3	Phasenvarianten
1013	chr22	23198587	23198732	IGLV4-3	Phasenvarianten
1014	chr22	23198797	23198869	IGLV4-3	Phasenvarianten
1015	chr22	23199022	23199127	IGLV4-3	Phasenvarianten
1016	chr22	23199182	23199261	IGLV4-3	Phasenvarianten
1017	chr22	23199277	23199671	IGLV4-3	Phasenvarianten
1018	chr22	23213857	23214141	IGLV4-3	Genotypisierung
1019	chr22	23214167	23214249	IGLV4-3	Genotypisierung
1020	chr22	23222927	23223065	IGLV3-1	Phasenvarianten
1021	chr22	23223077	23223319	IGLV3-1	Phasenvarianten
1022	chr22	23223327	23224010	IGLV3-1	Phasenvarianten
1023	chr22	23227062	23227279	IGLL5	Phasenvarianten
1024	chr22	23227567	23227896	IGLL5	Phasenvarianten
1025	chr22	23227897	23228624	IGLL5	Phasenvarianten
1026	chr22	23229332	23229550	IGLL5	Phasenvarianten
1027	chr22	23229562	23229739	IGLL5	Phasenvarianten
1028	chr22	23230012	23231063	IGLL5	Phasenvarianten
1029	chr22	23231072	23231764	IGLL5	Phasenvarianten
1030	chr22	23231927	23232005	IGLL5	Phasenvarianten
1031	chr22	23232062	23232346	IGLL5	Phasenvarianten
1032	chr22	23232362	23232465	IGLL5	Phasenvarianten
1033	chr22	23232517	23232737	IGLL5	Phasenvarianten
1034	chr22	23234612	23235837	IGLJ1	Phasenvarianten
1035	chr22	23235847	23236276	IGLJ1	Phasenvarianten
1036	chr22	23236277	23236378	IGLJ1	Phasenvarianten
1037	chr22	23236387	23236526	IGLJ1	Phasenvarianten
1038	chr22	23236557	23236851	IGLJ1	Phasenvarianten
1039	chr22	23236877	23237366	IGLC1	Phasenvarianten
1040	chr22	23241762	23241835	IGLJ2	Genotypisierung
1041	chr22	23242602	23242981	IGLC2	Phasenvarianten
1042	chr22	23244157	23244373	IGLC2	Phasenvarianten
1043	chr22	23247137	23247209	IGLJ3	Genotypisierung
1044	chr22	23247257	23247444	IGLJ3	Phasenvarianten
1045	chr22	23247467	23247630	IGLJ3	Phasenvarianten
1046	chr22	23248182	23248404	IGLC3	Phasenvarianten
1047	chr22	23252687	23252824	IGLJ4	Genotypisierung
1048	chr22	23256362	23256504	IGLJ5	Genotypisierung
1049	chr22	23260267	23260399	IGLJ6	Genotypisierung
1050	chr22	23263507	23263653	IGLJ7	Genotypisierung
1051	chr22	23263872	23264263	IGLJ7	Phasenvarianten
1052	chr22	23278157	23278381	IGLC7	Phasenvarianten
1053	chr22	23282767	23282839	IGLC7	Phasenvarianten
1054	chr22	23282842	23282956	IGLC7	Phasenvarianten
1055	chr22	23523567	23524204	BCR	Genotypisierung
1056	chr22	23524212	23524419	BCR	Genotypisierung
1057	chr22	23610547	23610791	BCR	Genotypisierung
1058	chr22	29191136	29191455	XBP1	Genotypisierung
1059	chr22	29191461	29191746	XBP1	Genotypisierung
1060	chr22	29192006	29192215	XBP1	Genotypisierung
1061	chr22	29193041	29193205	XBP1	Genotypisierung
1062	chr22	29196261	29196547	XBP1	Genotypisierung
1063	chr22	41513340	41513562	EP300	Genotypisierung
1064	chr22	41525845	41526047	EP300	Genotypisierung
1065	chr22	41527440	41527664	EP300	Genotypisierung
1066	chr22	41536110	41536291	EP300	Genotypisierung
1067	chr22	41545740	41545940	EP300	Genotypisierung
1068	chr22	41545995	41546223	EP300	Genotypisierung
1069	chr22	41565485	41565650	EP300	Genotypisierung
1070	chr22	41566385	41566592	EP300	Genotypisierung
1071	chr22	41568480	41568693	EP300	Genotypisierung
1072	chr22	41569600	41569814	EP300	Genotypisierung
1073	chr22	41572225	41572436	EP300	Genotypisierung
1074	chr22	41572800	41573022	EP300	Genotypisierung
1075	chr22	41573300	41573515	EP300	Genotypisierung
1076	chr22	41574255	41574486	EP300	Genotypisierung
1077	chr22	41574685	41574904	EP300	Genotypisierung
1078	chr22	47570209	47570414	TBC1D22A	Phasenvarianten
1079	chrX	1584324	1585521	P2RY8	Genotypisierung
1080	chrX	1655789	1656029	AKAP17A	Genotypisierung
1081	chrX	12993264	12993539	TMSB4X	Phasenvarianten
1082	chrX	12993544	12994173	TMSB4X	Phasenvarianten
1083	chrX	12994289	12994397	TMSB4X	Phasenvarianten
1084	chrX	12994444	12994514	TMSB4X	Phasenvarianten
1085	chrX	33146106	33146490	DMD	Phasenvarianten
1086	chrX	35820576	35821268	MAGEB16	Genotypisierung
1087	chrX	70347816	70348034	MED12	Genotypisierung
1088	chrX	70612661	70612778	TAF1	Genotypisierung
1089	chrX	73962123	73963110	KIAA2022	Genotypisierung
1090	chrX	86772953	86773345	KLHL4	Genotypisierung
1091	chrX	90026453	90026652	PABPC5	Phasenvarianten
1092	chrX	100610984	100611308	BTK	Genotypisierung
1093	chrX	119509280	119509492	ATP1B4	Genotypisierung
1094	chrX	141291052	141291326	MAGEC2	Genotypisierung
1095	chrX	141291357	141291566	MAGEC2	Genotypisierung
1096	chrX	153997383	153997622	DKC1	Genotypisierung

ZITATE ENTHALTEN IN DER BESCHREIBUNG
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
Zitierte Patentliteratur

US 62/931688 [0001]
CA 233975 [0003]
CA 241076 [0003]
CA 188298 [0003]
US 5804396 [0240]

Claims

Verfahren, umfassend: (a) Gewinnen von Sequenzierungsdaten, die von einer Vielzahl zellfreier Nukleinsäuremoleküle abgeleitet sind, die von einem Subjekt erlangt oder abgeleitet wurden, durch ein Computersystem; (b) Verarbeiten der Sequenzierungsdaten durch das Computersystem, um ein oder mehrere zellfreie Nukleinsäuremoleküle der Vielzahl zellfreier Nukleinsäuremoleküle zu identifizieren, wobei jedes der einen oder mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, wobei mindestens etwa 10 % der einen oder mehreren zellfreien Nukleinsäuremoleküle eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten umfassen, die durch wenigstens ein Nukleotid getrennt sind; und (c) Analysieren des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle durch das Computersystem zur Bestimmung einer Erkrankung des Subjekts.
Verfahren nach Anspruch 1, wobei die wenigstens etwa 10 % der zellfreien Nukleinsäuremoleküle wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % oder etwa 100 % der einen oder mehreren zellfreien Nukleinsäuremoleküle umfassen.
Verfahren, umfassend: (a) Gewinnen von Sequenzierungsdaten, die von einer Vielzahl zellfreier Nukleinsäuremoleküle abgeleitet sind, die von einem Subjekt erlangt oder abgeleitet wurden, durch ein Computersystem; (b) Verarbeiten der Sequenzierungsdaten durch das Computersystem, um ein oder mehrere zellfreie Nukleinsäuremoleküle der Vielzahl zellfreier Nukleinsäuremoleküle zu identifizieren, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind; und (c) Analysieren des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle durch das Computersystem zur Bestimmung einer Erkrankung des Subjekts.
Verfahren, umfassend: (a) Gewinnen von Sequenzierungsdaten, die von einer Vielzahl von zellfreien Nukleinsäuremolekülen abgeleitet sind, die von einem Subjekt erlangt oder abgeleitet sind; (b) Verarbeiten der Sequenzierungsdaten zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle mit einer Nachweisgrenze von weniger als etwa 1 aus 50.000 Beobachtungen aus den Sequenzierungsdaten; und (c) Analysieren des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle zur Bestimmung einer Erkrankung des Subjekts.
Verfahren nach Anspruch 4, wobei die Nachweisgrenze des Identifizierungsschritts bei weniger als etwa 1 von 100.000, weniger als etwa 1 von 500.000, weniger als etwa 1 von 1.000.000, weniger als etwa 1 von 1.500.000 oder weniger als etwa 1 von 2.000.000 Beobachtungen aus den Sequenzierungsdaten liegt.
Verfahren nach einem beliebigen der Ansprüche 4-5, wobei jedes der ein oder mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst.
Verfahren nach Anspruch 6, wobei eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt ist.
Verfahren nach einem beliebigen der Ansprüche 4 bis 7, wobei (a) bis (c) von einem Computersystem durchgeführt werden.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten basierend auf der Nukleinsäure-Amplifikation erzeugt werden.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten basierend auf der Polymerase-Kettenreaktion erzeugt werden.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten basierend auf der Amplikon-Sequenzierung erzeugt werden.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten basierend auf der Next-Generation-Sequenzierung (NGS) erzeugt werden.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten basierend auf einem nicht-hybridisierungsbasierten NGS erzeugt werden.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten ohne Verwendung einer molekularen Barcodierung von wenigstens einem Teil der Vielzahl von zellfreien Nukleinsäuremolekülen erzeugt werden.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten ohne Verwendung einer Probenbarcodierung von wenigstens einem Teil der Vielzahl von zellfreien Nukleinsäuremolekülen erlangt werden.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten ohne In silico-Entfernung oder Unterdrückung von (i) Hintergrundfehlern oder (ii) Sequenzierungsfehlern erlangt werden.
Verfahren zur Behandlung einer Erkrankung eines Subjekts, das Verfahren umfassend: (a) Identifizierung des Subjekts für die Behandlung der Erkrankung, wobei der Proband basierend auf der Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus einer Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet wurden, als an der Erkrankung leidend bestimmt wurde. wobei jedes des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind, und wobei das Vorhandensein der Vielzahl der Phasenvarianten indikativ für die Erkrankung des Subjekts ist; und (b) Unterziehen des Subjekts der Behandlung basierend auf der Identifizierung in (a).
Verfahren zur Überwachung eines Verlaufs einer Erkrankung eines Subjekts, das Verfahren umfassend: (a) Bestimmen eines ersten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines ersten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer ersten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden; (b) Bestimmen eines zweiten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines zweiten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer zweiten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden, wobei die zweite Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt im Anschluss an die Gewinnung der ersten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt wird; und (c) Bestimmen des Verlaufs der Erkrankung basierend auf dem ersten Stadium der Erkrankung und dem zweiten Stadium der Erkrankung, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind.
Verfahren nach Anspruch 18, wobei der Verlauf der Erkrankung eine Verschlechterung der Erkrankung ist.
Verfahren nach Anspruch 18, wobei der Verlauf der Erkrankung zumindest eine Teilremission der Erkrankung ist.
Verfahren nach einem beliebigen der Ansprüche 18-20, wobei ein Vorhandensein der Vielzahl von Phasenvarianten indikativ für den ersten Status oder den zweiten Status der Erkrankung des Subjekts ist.
Verfahren nach einem beliebigen der Ansprüche 18-21, wobei die zweite Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt wenigstens etwa 1 Woche, wenigstens etwa 2 Wochen, wenigstens etwa 3 Wochen, wenigstens etwa 4 Wochen, wenigstens etwa 2 Monate oder wenigstens etwa 3 Monate nach der Gewinnung der ersten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt wird.
Verfahren nach einem beliebigen der Ansprüche 18-22, wobei der Proband einer Behandlung der Erkrankung (i) vor der Gewinnung der zweiten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt und (ii) im Anschluss an die Gewinnung der ersten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt unterzogen wird.
Verfahren nach einem der Ansprüche 18 bis 23, wobei der Verlauf der Erkrankung indikativ für eine minimale Resterkrankung der Erkrankung des Subjekts ist.
Verfahren nach einem der Ansprüche 18 bis 24, wobei der Verlauf der Erkrankung indikativ für die Tumorlast oder Krebslast des Subjekts ist.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei das eine oder die mehreren zellfreien Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle mit einem Satz von Nukleinsäuresonden erfasst, wobei der Satz von Nukleinsäuresonden zur Hybridisierung mit wenigstens einem Teil der zellfreien Nukleinsäuremoleküle ausgelegt ist, die eine oder mehrere mit der Erkrankung assoziierte Genombereiche umfassen.
Verfahren, umfassend: (a) Bereitstellen eines Gemisches, umfassend (1) einen Nukleinsäuresondensatz und (2) eine Vielzahl von von dem Subjekt erlangter oder abgeleiteter zellfreier Nukleinsäuremoleküle, wobei eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatzes zur Hybridisierung mit wenigstens einem Teil eines zellfreien Zielnukleinsäuremoleküls gestaltet ist, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind, und wobei die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens umfasst, wobei die Aktivierung des aktivierbaren Reporteragens ausgewählt ist aus der Gruppe bestehend aus: (i) Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl von Phasenvarianten und (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl von Phasenvarianten hybridisiert wurde; (b) Nachweis des aktivierbaren Reporteragens, das zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle aktiviert ist, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle die Vielzahl der Phasenvarianten umfasst; und (c) Analysieren des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle zur Bestimmung einer Erkrankung des Subjekts.
Verfahren, umfassend: (a) Bereitstellen eines Gemisches, umfassend (1) einen Nukleinsäuresondensatz und (2) eine Vielzahl von von dem Subjekt erlangter oder abgeleiteter zellfreier Nukleinsäuremoleküle, wobei eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatzes zur Hybridisierung mit wenigstens einem Teil eines zellfreien Zielnukleinsäuremoleküls gestaltet ist, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, und wobei die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens umfasst, wobei die Aktivierung des aktivierbaren Reporteragens ausgewählt ist aus der Gruppe bestehend aus: (i) Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl von Phasenvarianten und (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl von Phasenvarianten hybridisiert wurde; (b) Nachweisen des aktivierbaren Reporteragens, das zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle der Vielzahl zellfreier Nukleinsäuremoleküle aktiviert ist, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle die Vielzahl von Phasenvarianten umfasst, wobei eine Nachweisgrenze des Identifizierungsschritts weniger als etwa 1 von 50.000 zellfreien Nukleinsäuremolekülen der Vielzahl zellfreier Nukleinsäuremoleküle beträgt; und (c) Analysieren des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle zur Bestimmung einer Erkrankung des Subjekts.
Verfahren nach Anspruch 28, wobei die Nachweisgrenze des Identifizierungsschritts weniger als etwa 1 von 100.000, weniger als etwa 1 von 500.000, weniger als etwa 1 von 1.000.000, weniger als etwa 1 von 1.500.000 oder weniger als etwa 1 von 2.000.000 zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen beträgt.
Verfahren nach Anspruch 28 oder 29, wobei eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt ist.
Verfahren nach einem beliebigen der Ansrpüche 27-30, wobei das aktivierbare Reporteragens bei der Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl der Phasenvarianten aktiviert wird.
Verfahren nach einem beliebigen der Ansprüche 27-30, wobei das aktivierbare Reporteragens bei der Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl der Phasenvarianten hybridisiert wurde, aktiviert wird.
Verfahren nach einem beliebigen der Ansprüche 27 bis 32, ferner umfassend das Mischen (1) des Nukleinsäuresondensatzes und (2) der Vielzahl von zellfreien Nukleinsäuremolekülen.
Verfahren nach einem beliebigen der Ansprüche 27 bis 33, wobei das aktivierbare Reporteragens ein Fluorophor ist.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Analyse des identifizierten einen oder der mehreren zellfreien Nukleinsäuremoleküle die Analyse (i) des identifizierten einen oder der mehreren zellfreien Nukleinsäuremoleküle und (ii) anderer zellfreier Nukleinsäuremoleküle der Vielzahl zellfreier Nukleinsäuremoleküle, die nicht die Vielzahl der Phasenvarianten als unterschiedliche Variablen umfassen.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Analyse des identifizierten einen oder der mehreren zellfreien Nukleinsäuremoleküle nicht auf anderen zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen, die nicht die Vielzahl von Phasenvarianten umfassen, basiert.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei eine Anzahl der Vielzahl von Phasenvarianten aus dem identifizierten einen oder den identifizierten mehreren zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts ist.
Verfahren nach Anspruch 37, wobei ein Verhältnis von (i) der Anzahl der Vielzahl von Phasenvarianten aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen und (ii) einer Anzahl von Einzelnukleotidvarianten (SNV) aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts ist.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei eine Häufigkeit der Vielzahl von Phasenvarianten in dem identifizierten einen oder den identifizierten mehreren zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts ist.
Verfahren nach Anspruch 39, wobei die Häufigkeit indikativ für eine mit der Erkrankung verbundene kranke Zelle ist.
Verfahren nach Anspruch 40, wobei die Erkrankung ein diffuses großzelliges B-Zell-Lymphom ist, und wobei die Häufigkeit indikativ dafür ist, ob das eine oder die mehreren zellfreien Nukleinsäuremoleküle von Keimzentrum-B-Zellen (GCB) oder aktivierten B-Zellen (ABC) abgeleitet sind.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei der genomische Ursprung des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle indikativ für die Erkrankung des Subjekts ist.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die erste und die zweite Phasenvariante durch wenigstens 2, wenigstens 3, wenigstens 4, wenigstens 5, wenigstens 6, wenigstens 7 oder wenigstens 8 Nukleotide getrennt sind.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die erste und die zweite Phasenvariante durch höchstens etwa 180, höchstens etwa 170, höchstens etwa 160, höchstens etwa 150 oder höchstens etwa 140 Nukleotide getrennt sind.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 % oder wenigstens etwa 50 % des einen oder der mehreren zellfreien Nukleinsäuremoleküle, die eine Vielzahl von Phasenvarianten umfassen, eine Einzelnukleotidvariante (SNV), die wenigstens 2 Nukleotide von einer benachbarten SNV entfernt ist, umfassen.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Vielzahl der Phasenvarianten wenigstens 3, wenigstens 4, wenigstens 5, wenigstens 10, wenigstens 15, wenigstens 20 oder wenigstens 25 Phasenvarianten innerhalb desselben zellfreien Nukleinsäuremoleküls umfasst.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei das eine oder die mehreren identifizierten zellfreien Nukleinsäuremoleküle wenigstens 2, wenigstens 3, wenigstens 4, wenigstens 5, wenigstens 10, wenigstens 50, wenigstens 100, wenigstens 500 oder wenigstens 1.000 zellfreie Nukleinsäuremoleküle umfassen.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Referenzgenomsequenz von einer Referenzkohorte abgeleitet ist.
Verfahren nach Anspruch 48, wobei die Referenzgenomsequenz eine Konsensussequenz aus der Referenzkohorte umfasst.
Verfahren nach Anspruc 48, wobei die Referenzgenomsequenz wenigstens einen Teil des menschlichen hg19-Genoms, hg18-Genoms, hg17-Genoms, hg16-Genoms oder hg38-Genoms umfasst.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Referenzgenomsequenz von einer Probe des Subjekts abgeleitet ist.
Verfahren nach Anspruch 51, wobei die Probe eine gesunde Probe ist.
Verfahren nach Anspruch 52, wobei die Probe eine gesunde Zelle umfasst.
Verfahren nach Anspruch 53, wobei die gesunde Zelle einen gesunden Leukozyten umfasst.
Verfahren nach Anspruch 51, wobei die Probe eine erkrankte Probe ist.
Verfahren nach Anspruch 55, wobei die erkrankte Probe eine erkrankte Zelle umfasst.
Verfahren nach Anspruch 56, wobei die erkrankte Zelle eine Tumorzelle umfasst.
Verfahren nach Anspruch 55, wobei die erkrankte Probe einen soliden Tumor umfasst.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei der Satz von Nukleinsäuresonden basierend auf der Vielzahl von Phasenvarianten konstruiert ist, die durch den Vergleich von (i) Sequenzierungsdaten aus einem soliden Tumor, Lymphom oder Bluttumor des Subjekts und (ii) Sequenzierungsdaten aus einer gesunden Zelle des Subjekts oder einer gesunden Kohorte identifiziert werden.
Verfahren nach Anspruch 59, wobei die gesunde Zelle von dem Subjekt stammt.
Verfahren nach Anspruch 59, wobei die gesunde Zelle aus der gesunden Kohorte stammt.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei der Satz von Nukleinsäuresonden zur Hybridisierung mit wenigstens einem Teil der Sequenzen der mit der Erkrankung assoziierten genomischen Loci bestimmt ist.
Verfahren nach Anspruch 62, wobei bekannt, dass die mit der Erkrankung assoziierten genomischen Loci eine aberrante somatische Hypermutation aufweisen, wenn der Proband die Erkrankung hat.
Das Verfahren nach einem beliebigen der vorhergehenden Ansprüche, wobei der Satz von Nukleinsäuresonden zur Hybridisierung an wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % oder etwa 100 % (i) der in Tabelle 1 identifizierten Genombereiche, (ii) der in Tabelle 3 identifizierten Genombereiche oder (iii) der in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereiche, konzipiert ist.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei jede Nukleinsäuresonde des Satzes von Nukleinsäuresonden wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % Sequenzübereinstimmung, wenigstens etwa 95 % Sequenzübereinstimmung oder etwa 100 % Sequenzübereinstimmung mit einer aus Tabelle 6 ausgewählten Sondensequenz aufweist.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei der Satz von Nukleinsäuresonden wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 % oder wenigstens etwa 90 % der Sondensequenzen in Tabelle 6 umfasst.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, ferner umfassend die Bestimmung, dass der Proband die Erkrankung hat oder die Bestimmung eines Grades oder Status der Erkrankung des Subjekts, basierend auf dem identifizierten einen oder den identifizierten mehreren zellfreien Nukleinsäuremolekülen, die die Vielzahl von Phasenvarianten umfassen.
Verfahren nach Anspruch 67, ferner umfassend das Bestimmen, dass das eine oder die mehreren zellfreien Nukleinsäuremoleküle aus einer mit der Erkrankung assoziierten Probe abgeleitet ist/sind, basierend auf der Durchführung einer statistischen Modellanalyse des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle.
Verfahren nach Anspruch 68, wobei die statistische Modellanalyse eine statistische Monte-Carlo-Analyse umfasst.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, ferner umfassend die Überwachung eines Verlaufs der Erkrankung des Subjekts basierend auf dem identifizierten einen oder den identifizierten mehreren zellfreien Nukleinsäuremolekülen.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, ferner umfassend die Durchführung eines anderen Verfahrens zur Bestätigung der Erkrankung des Subjekts.
Verfahren nach Anspruch 71, wobei das andere Verfahren einen Bluttest, einen Gentest, eine medizinische Bildgebung, eine körperliche Untersuchung oder eine Gewebebiopsie umfasst.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, ferner umfassend die Bestimmung einer Behandlung für die Erkrankung des Subjekts basierend auf dem identifizierten einen oder den identifizierten mehreren zellfreien Nukleinsäuremolekülen.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei der Proband vor (a) einer Behandlung der Erkrankung unterzogen wurde.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Behandlung Chemotherapie, Radiotherapie, Chemoradiotherapie, Immuntherapie, adoptive Zelltherapie, Hormontherapie, gezielte Arzneimitteltherapie, Operation, Transplantation, Transfusion oder medizinische Überwachung umfasst.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Vielzahl der zellfreien Nukleinsäuremoleküle eine Vielzahl von zellfreien Desoxyribonukleinsäuremolekülen (DNA-Molekülen) umfasst.
Das Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Erkrankung eine Erkrankung umfasst.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Vielzahl der zellfreien Nukleinsäuremoleküle von einer Körperprobe des Subjekts abgeleitet ist.
Verfahren nach Anspruch 78, wobei die Körperprobe Plasma, Serum, Blut, Liquor, Lymphflüssigkeit, Speichel, Urin oder Stuhl umfasst.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei der Proband ein Säugetier ist.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei der Proband ein Mensch ist.
Das Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Erkrankung ein Neoplasma, Krebs oder einen Tumor umfasst.
Verfahren nach Anspruch 82, wobei die Erkrankung einen soliden Tumor umfasst.
Verfahren nach Anspruch 82, wobei die Erkrankung ein Lymphom umfasst.
Verfahren nach Anspruch 84, wobei die Erkrankung ein B-Zell-Lymphom umfasst.
Verfahren nach Anspruch 85, wobei die Erkrankung einen Untertyp des B-Zell-Lymphoms, ausgewählt aus der Gruppe bestehend aus diffusem großzelligem B-Zell-Lymphom, follikulärem Lymphom, Burkitt-Lymphom und chronische lymphatische B-Zell-Leukämie, umfasst.
Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Vielzahl der Phasenvarianten zuvor durch Sequenzierung einer früheren Tumorprobe oder einer zellfreien Nukleinsäureprobe als tumorabgeleitet identifiziert wurde.
Zusammensetzung, die einen Ködersatz umfasst, der einen Satz von Nukleinsäuresonden umfasst, die zum Erfassen von zellfreien DNA-Molekülen konzipiert sind, die von wenigstens etwa 5 % der Genombereiche, die von in (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen aufgeführt sind, abgeleitet sind.
Zusammensetzung nach Anspruch 88, wobei der Satz von Nukleinsäuresonden für das Pull-Down von zellfreien DNA-Molekülen ausgelegt ist, die von wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % oder etwa 100 % von in (i) der in Tabelle 1 identifizierten Genombereiche, (ii) der in Tabelle 3 identifizierten Genombereiche oder (iii) der in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereiche festgelegten Genombereichen abgeleitet sind.
Zusammensetzung nach einem der Ansprüche 88-89, wobei der Satz von Nukleinsäuresonden zum Erfassen des einen oder der mehreren zellfreien DNA-Molekülen ausgelegt ist, die von höchstens etwa 10 %, höchstens etwa 20 %, höchstens etwa 30 %, höchstens etwa 40 %, höchstens etwa 50 %, höchstens etwa 60 %, höchstens etwa 70 %, höchstens etwa 80 %, höchstens etwa 90 % oder etwa 100 % von in (i) der in Tabelle 1 identifizierten Genombereiche, (ii) der in Tabelle 3 identifizierten Genombereiche oder (iii) der in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereiche festgelegten Genombereichen abgeleitet sind.
Zusammensetzung nach einem beliebigen der Ansprüche 88 bis 90, wobei der Ködersatz höchstens 5, höchstens 10, höchstens 50, höchstens 100, höchstens 500, höchstens 1000 oder höchstens 2000 Nukleinsäuresonden umfasst.
Zusammensetzung nach einem der Ansprüche 88 bis 91, wobei eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatzes einen Pull-Down-Tag umfasst.
Zusammensetzung nach einem beliebigen der Ansprüche 88 bis 92, wobei der Pull-Down-Tag einen Nukleinsäure-Barcode umfasst.
Zusammensetzung nach einem beliebigen der Ansprüche 88 bis 93, wobei der Pull-Down-Tag Biotin umfasst.
Zusammensetzung nach einem der Ansprüche 88 bis 94, wobei jedes der zellfreien DNA-Moleküle zwischen etwa 100 Nukleotiden und etwa 180 Nukleotiden lang ist.
Zusammensetzung nach einem beliebigen der Ansprüche 88 bis 95, wobei die Genombereiche mit einer Erkrankung assoziiert sind.
Zusammensetzung nach einem der Ansprüche 88 bis 96, wobei die Genombereiche eine aberrante somatische Hypermutation aufweisen, wenn ein Proband die Erkrankung hat.
Zusammensetzung nach einem der Ansprüche 88 bis 97, wobei die Erkrankung ein B-Zell-Lymphom umfasst.
Zusammensetzung nach Anspruch 98, wobei die Erkrankung eine Unterart des B-Zell-Lymphoms, die ausgewählt ist aus der Gruppe bestehend aus diffusem großzelligem B-Zell-Lymphom, follikulärem Lymphom, Burkitt-Lymphom und chronisch lymphatischer B-Zell-Leukämie umfasst.
Zusammensetzung nach einem der Ansprüche 88 bis 99, ferner umfassend eine Vielzahl zellfreier DNA-Moleküle, die von einem Subjekt erlangt oder abgeleitet wurden.
Verfahren zur Durchführung eines klinischen Verfahrens bei einem Individuum, das Verfahren umfassend: erlangen oder erlangt haben eines gezielten Sequenzierungsergebnisses einer Sammlung zellfreier Nukleinsäuremoleküle, wobei die Sammlung zellfreier Nukleinsäuremoleküle aus einer Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums stammt, und wobei die gezielte Sequenzierung unter Verwendung von Nukleinsäuresonden zum Herunterziehen von Sequenzen genomischer Loci durchgeführt wird, von denen bekannt ist, dass sie eine aberrante somatische Hypermutation in einem B-Zell-Krebs aufweisen; Identifizieren einer identifiziert haben einer Vielzahl von Varianten in Phase innerhalb des zellfreien Nukleinsäure-Sequenzierungsergebnisses; bestimmen oder bestimmt haben, unter Verwendung eines statistischen Modells und der identifizierten Phasenvarianten, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleotide enthält, die von einem Neoplasma abgeleitet sind; und Durchführen eines klinischen Verfahrens an dem Individuum zur Bestätigung des Vorhandenseins des B-Zell-Krebses, basierend auf der Bestimmung, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleinsäuresequenzen enthält, die wahrscheinlich von dem B-Zell-Krebs abgeleitet sind.
Verfahren nach Anspruch 101, wobei die Biopsie eine von Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl ist.
Verfahren nach Anspruch 101, wobei die genomischen Loci ausgewählt sind aus (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen.
Verfahren nach Anspruch 101, wobei die Sequenzen der Nukleinsäuresonden aus Tabelle 6 ausgewählt sind.
Verfahren nach Anspruch 101, wobei das klinische Verfahren ein Bluttest, eine medizinische Bildgebung oder eine körperliche Untersuchung ist.
Verfahren zur Behandlung eines Individuums gegen einen B-Zellen-Krebs, das Verfahren umfassend: erlangen oder erlangt haben eines gezielten Sequenzierungsergebnisses einer Sammlung zellfreier Nukleinsäuremoleküle, wobei die Sammlung zellfreier Nukleinsäuremoleküle aus einer Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums stammt, und wobei die gezielte Sequenzierung unter Verwendung von Nukleinsäuresonden zum Herunterziehen von Sequenzen genomischer Loci durchgeführt wird, von denen bekannt ist, dass sie eine aberrante somatische Hypermutation in einem B-Zell-Krebs aufweisen; Identifizieren einer identifiziert haben einer Vielzahl von Varianten in Phase innerhalb des zellfreien Nukleinsäure-Sequenzierungsergebnisses; bestimmen oder bestimmt haben, unter Verwendung eines statistischen Modells und der identifizierten Phasenvarianten, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleotide enthält, die von einem Neoplasma abgeleitet sind; und die Behandlung des Individuums zur Eindämmung des B-Zell-Krebses, basierend auf der Bestimmung, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleinsäuresequenzen enthält, die von dem B-Zell-Krebs abgeleitet sind.
Verfahren nach Anspruch 106, wobei die Biopsie eine von Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl ist.
Verfahren nach Anspruch 106, wobei die genomischen Loci ausgewählt sind aus (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen.
Verfahren nach Anspruch 106, wobei die Sequenzen der Nukleinsäuresonden aus Tabelle 6 ausgewählt sind.
Verfahren nach Anspruch 106, wobei die Behandlung eine Chemotherapie, Strahlentherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie oder medizinische Überwachung ist.
Verfahren zum Nachweis einer kanzerogenen minimalen Restkrankheit bei einem Individuum und zur Behandlung des Individuums gegen Krebs, das Verfahren umfassend: erlangen oder erlangt haben eines gezielten Sequenzierungsergebnisses einer Sammlung zellfreier Nukleinsäuremoleküle, wobei die Sammlung zellfreier Nukleinsäuremoleküle aus einer Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums erlangt wird, wobei die Flüssigkeits- oder Ausscheidungsbiopsie nach einer Reihe von Behandlungen zum Nachweis einer minimalen Restkrankheit entnommen wird, und wobei die gezielte Sequenzierung unter Verwendung von Nukleinsäuresonden zum Herunterziehen von Sequenzen genomischer Loci durchgeführt wird, von denen bestimmt wurde, dass sie eine Vielzahl von Varianten in Phase enthalten, wie durch ein früheres Sequenzierungsergebnis an einer früheren von dem Krebs abgeleiteten Biopsie bestimmt; Identifizieren einer identifiziert haben wenigstens eines Satzes der Vielzahl von Varianten in Phase innerhalb des zellfreien Nukleinsäure-Sequenzierungsergebnisses; und die Behandlung des Individuums zur Eindämmung des B-Zell-Krebses, basierend auf der Bestimmung, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleinsäuresequenzen enthält, die von dem Krebs abgeleitet sind.
Verfahren nach Anspruch 111, wobei die Flüssigkeits- oder Abfallbiopsie eine von Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl ist.
Verfahren nach Anspruch 111, wobei die Behandlung eine Chemotherapie, Strahlentherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie oder medizinische Überwachung ist.
Computerprogrammprodukt, umfassend ein nichtflüchtiges, computerlesbares Medium mit darin codiertem, computerausführbarem Code, wobei der computerausführbare Code zur Ausführung zur Implementierung eines Verfahrens nach einem beliebigen der vorstehenden Ansprüche geeignet ist.
System, umfassend einen oder mehrere Computerprozessoren und einen damit gekoppelten Computerspeicher, wobei der Computerspeicher einen maschinenausführbaren Code umfasst, der bei Ausführung durch den einen oder die mehreren Computerprozessoren ein Verfahren nach einem beliebigen der vorstehenden Ansprüche implementiert.