-
QUERVERWEIS
-
Diese Anmeldung beansprucht die Vorteile der vorläufigen US-Patentanmeldung Nr.
62/931,688 , eingereicht am 6. November 2019, die hierin durch Bezugnahme vollständig einbezogen ist.
-
SEQUENZPROTOKOLL
-
Die vorliegende Anmeldung enthält ein Sequenzprotokoll, das elektronisch im ASCII-Format eingereicht wurde und hiermit in vollem Umfang in die Anmeldung einbezogen wird. Die ASCII-Kopie, erstellt am 3. November 2020, heißt 58626-702_601_SL.txt und ist 307.199 Bytes groß.
-
STAATLICHE RECHTE
-
Diese Erfindung wurde mit staatlicher Unterstützung gemäß
CA233975 ,
CA241076 und
CA188298 von den US-Amerikanischen National Institutes of Health entwickelt. Der USamerikanische Staat bzw. dessen Regierung hat gewisse Rechte an der Erfindung.
-
HINTERGRUND
-
Nichtinvasive Bluttests, die somatische Veränderungen (z. B. mutierte Nukleinsäuren) auf der Grundlage der Analyse zellfreier Nukleinsäuren (z. B. zellfreier Desoxyribonukleinsäure (cfDNA) und zellfreier Ribonukleinsäure (cfRNA)) nachweisen können, sind aufgrund der relativ einfachen Gewinnung biologischer Spezimen (z. B. biologischer Flüssigkeiten) attraktive Kandidaten für Krebs-Screening-Anwendungen. Zirkulierende Tumor-Nukleinsäuren (z. B. ctDNA oder ctRNA, d. h. von Krebszellen erlangte Nukleinsäuren) können empfindliche und spezifische Biomarker für zahlreiche Krebs-Subtypen sein. Die derzeitigen Verfahren zum Nachweis der minimalen Restkrankheit (MRD) anhand von ctDNA können jedoch durch einen oder mehrere Faktoren, wie beispielsweise geringe Ausgangs-DNA-Mengen und hohe Hintergrundfehlerraten, eingeschränkt sein.
-
Jüngste Ansätze haben durch die Verfolgung multipler somatischer Mutationen mit fehlerunterdrückter Sequenzierung die ctDNA-MRD-Leistung verbessert, was zu Nachweisgrenzen von nur 4 Teilen in 100.000 aus limitierter cfDNA-Eingabe führt. Der Nachweis einer Restkrankheit während oder nach der Behandlung ist ein wirksames Instrument, wobei eine nachweisbare MRD selbst bei einer radiologischen Remission ein negatives prognostisches Zeichen darstellt. Die derzeitigen Nachweisgrenzen könnten jedoch unzureichend sein, um bei Patienten, bei denen ein Rückfall oder eine Progression der Krankheit zu erwarten ist, generell eine Restkrankheit nachzuweisen. Dieser „Nachweisverlust“ ist beispielhaft beim diffusen großzelligen B-Zell-Lymphom (DLBCL), bei dem der Nachweis von ctDNA nach zwei Zyklen einer Therapie mit kurativer Absicht ein starker prognostischer Marker ist. Trotzdem hat fast ein Drittel der Patienten, bei denen die Krankheit fortschreitet, an diesem Meilenstein keine nachweisbare ctDNA, was „falsch negative“ Tests bedeutet. Es wurden ähnliche falsch negative Ergebnisse bei Dickdarmkrebs und Brustkrebs beobachtet.
-
ZUSAMMENFASSUNG
-
Die vorliegende Offenbarung sieht Verfahren und Systeme zur Analyse zellfreier Nukleinsäuren (z. B. cfDNA, cfRNA) eines Subjekts vor. Verfahren und Systeme der vorliegenden Offenbarung können die von einem Subjekt abgeleiteten Sequenzierungsergebnisse nutzen, um krebserlangte Nukleinsäuren (z. B. ctDNA, ctRNA) nachzuweisen, z. B. zur Krankheitsdiagnose, zur Krankheitsbeobachtung oder zur Bestimmung von Behandlungen des Subjekts. Verfahren und Systeme der vorliegenden Offenbarung können eine erhöhte Empfindlichkeit, Spezifität und/oder Zuverlässigkeit des Nachweises von krebserlangten Nukleinsäuren aufweisen.
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren vor, umfassend: (a) Erlangen, durch ein Computersystem, von Sequenzierungsdaten, die aus einer Vielzahl zellfreier Nukleinsäuremolekülen erlangt sind, die von einem Subjekt erlangt oder abgeleitet werden; (b) Verarbeiten der Sequenzierungsdaten durch das Computersystem, um ein oder mehrere zellfreie Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle zu identifizieren, wobei jedes des einen oder mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, wobei wenigstens etwa 10 % des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten umfasst, die durch wenigstens ein Nukleotid getrennt sind; und (c) Analysieren des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle durch das Computersystem, um einen Zustand der Erkrankung zu ermitteln.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfassen die wenigstens etwa 10 % der zellfreien Nukleinsäuremoleküle wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % oder etwa 100 % des einen oder der mehreren zellfreien Nukleinsäuremoleküle.
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren vor, umfassend: (a) Erlangen, durch ein Computersystem, von Sequenzierungsdaten, die aus einer Vielzahl zellfreier Nukleinsäuremolekülen abgeleitet sind, die von einem Subjekt erlangt oder abgeleitet sind; (b) Verarbeiten der Sequenzierungsdaten durch das Computersystem, um ein oder mehrere zellfreie Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle zu identifizieren, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind; und (c) Analysieren des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle durch das Computersystem, um eine Erkrankung des Subjekts zu bestimmen.
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren vor, umfassend: (a) Erlangen von Sequenzierungsdaten, die von einer Vielzahl zellfreier Nukleinsäuremolekülen abgeleitet sind, die von einem Subjekt erlangt oder abgeleitet sind; (b) Verarbeiten der Sequenzierungsdaten, um ein oder mehrere zellfreie Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle mit einer Nachweisgrenze von weniger als etwa 1 von 50.000 Beobachtungen aus den Sequenzierungsdaten zu identifizieren, und (c) Analysieren des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle, um eine Erkrankung des Subjekts zu bestimmen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren liegt die Nachweisgrenze des Identifizierungsschritts bei weniger als etwa 1 von 100.000, weniger als etwa 1 von 500.000, weniger als etwa 1 von 1.000.000, weniger als etwa 1 von 1.500.000 oder weniger als etwa 1 von 2.000.000 Beobachtungen aus den Sequenzierungsdaten.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Prozesse (a) bis (c) von einem Computersystem durchgeführt.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten basierend auf einer Nukleinsäure-Amplifikation erzeugt. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten basierend auf der Polymerase-Kettenreaktion erzeugt. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten basierend auf der Amplikon-Sequenzierung erzeugt.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten basierend auf der Next-Generation-Sequenzierung (NGS) erzeugt. Alternativ werden in einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren die Sequenzierungsdaten basierend auf nicht-hybridisierungsbasierter NGS erzeugt.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten ohne Verwendung einer molekularen Barcodierung von wenigstens einem Teil der Vielzahl zellfreier Nukleinsäuremolekülen erzeugt. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten ohne Verwendung einer Probenbarcodierung von wenigstens einem Teil der Vielzahl zellfreier Nukleinsäuremolekülen erlangt.
-
In einigen Ausführungsformen eines der hierin offenbarten Verfahren werden die Sequenzierungsdaten ohne In silico-Entfernung oder Unterdrückung von (i) Hintergrundfehlern oder (ii) Sequenzierungsfehlern erhalten.
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Behandlung einer Erkrankung eines Subjekts vor, das Verfahren umfassend: (a) Identifizieren des Subjekts zur Behandlung der Erkrankung, wobei bei dem Subjekt, basierend auf der Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus einer Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden, ermittelt wurde, dass er die Erkrankung hat, wobei jedes des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind, und wobei das Vorhandensein der Vielzahl von Phasenvarianten indikativ für die Erkrankung des Subjekts ist; und (b) Unterziehen des Subjekts der Behandlung basierend auf der Identifizierung in (a).
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Überwachung des Verlaufs einer Erkrankung eines Subjekts vor, das Verfahren umfassend: (a) Ermitteln eines ersten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines ersten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer ersten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden; (b) Ermitteln eines zweiten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines zweiten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer zweiten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden, wobei die zweite Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt wird, nachdem die erste Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt wurde; und (c) Ermitteln des Verlaufs der Erkrankung basierend auf dem ersten Stadium der Erkrankung und dem zweiten Stadium der Erkrankung, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Verlauf der Erkrankung eine Verschlimmerung der Erkrankung.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Verlauf der Erkrankung wenigstens eine Teilremission der Erkrankung.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist das Vorhandensein der Vielzahl von Phasenvarianten indikativ für das erste Stadium oder das zweite Stadium der Erkrankung des Subjekts.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wird die zweite Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt wenigstens etwa 1 Woche, wenigstens etwa 2 Wochen, wenigstens etwa 3 Wochen, wenigstens etwa 4 Wochen, wenigstens etwa 2 Monate oder wenigstens etwa 3 Monate nach der Erlangung der ersten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wird das Subjekt einer Behandlung der Erkrankung (i) vor der Gewinnung der zweiten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt und (ii) im Anschluss an die Gewinnung der ersten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt unterzogen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Verlauf der Erkrankung indikativ für eine minimale Resterkrankung der Erkrankung des Subjekts. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Verlauf der Erkrankung indikativ für die Tumorlast oder die Krebslast des Subjekts.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden das eine oder die mehreren zellfreien Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle mit einem Nukleinsäuresondensatz erfasst, wobei der Nukleinsäuresondensatz zur Hybridisierung an wenigstens einen Teil der zellfreien Nukleinsäuremoleküle ausgelegt ist, die eine oder mehrere mit der Erkrankung assoziierte Genombereiche umfassen.
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren vor, umfassend: (a) Vorsehen eines Gemisches, umfassend (1) einen Nukleinsäuresondensatz und (2) eine Vielzahl von zellfreien Nukleinsäuremolekülen, die von einem Subjekt erlangt oder abgeleitet wird, wobei eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatzes zur Hybridisierung an wenigstens einen Teil eines zellfreien Zielnukleinsäuremoleküls gestaltet ist, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind, und wobei die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens umfasst, wobei die Aktivierung des aktivierbaren Reporteragens ausgewählt ist aus der Gruppe bestehend aus: (i) Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl der Phasenvarianten und (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl der Phasenvarianten hybridisiert wurde; (b) Nachweis des aktivierbaren Reporteragens, das zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle aktiviert ist, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle die Vielzahl der Phasenvarianten umfasst; und (c) Analysieren des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle zur Ermittlung einer Erkrankung des Subjekts.
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren vor, umfassend: (a) Vorsehen eines Gemisches, umfassend (1) einen Nukleinsäuresondensatz und (2) eine Vielzahl von zellfreien Nukleinsäuremolekülen, die von einem Subjekt erlangt oder abgeleitet wird, wobei eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatzes zur Hybridisierung an wenigstens einen Teil eines zellfreien Zielnukleinsäuremoleküls gestaltet ist, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, und wobei die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens umfasst, wobei die Aktivierung des aktivierbaren Reporteragens ausgewählt ist aus der Gruppe bestehend aus: (i) Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl der Phasenvarianten und (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl der Phasenvarianten hybridisiert wurde; (b) Nachweis des aktivierbaren Reporteragens, das zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle aktiviert ist, wobei eine Nachweisgrenze des Identifizierungsschritts weniger als etwa 1 aus 50.000 zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen ist; und (c) Analysieren des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle zur Ermittlung einer Erkrankung des Subjekts.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbaren Verfahren beträgt die Nachweisgrenze des Identifizierungsschritts weniger als etwa 1 von 100.000, weniger als etwa 1 von 500.000, weniger als etwa 1 von 1.000.000, weniger als etwa 1 von 1.500.000 oder weniger als etwa 1 von 2.000.000 zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wird das aktivierbare Reporteragens bei der Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl der Phasenvarianten aktiviert.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wird das aktivierbare Reporteragens bei der Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl der Phasenvarianten hybridisiert wurde, aktiviert.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das Verfahren ferner das Mischen (1) des Nukleinsäuresondensatzes und (2) der Vielzahl von zellfreien Nukleinsäuremolekülen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist das aktivierbare Reporteragens ein Fluorophor.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst die Analyse des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle die Analyse (i) des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle und (ii) anderer zellfreier Nukleinsäuremoleküle der Vielzahl zellfreier Nukleinsäuremoleküle, die nicht die Vielzahl der Phasenvarianten als unterschiedliche Variablen umfassen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren basiert die Analyse des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle nicht auf anderen zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen, die nicht die Vielzahl von Phasenvarianten umfassen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist eine Anzahl der Vielzahl von Phasenvarianten aus dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts. In einigen Ausführungsformen ist ein Verhältnis von (i) der Anzahl der Vielzahl von Phasenvarianten aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen und (ii) einer Anzahl von Einzelnukleotidvarianten (Single Nucleotide Variants, SNV) aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Häufigkeit der Vielzahl von Phasenvarianten in dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts. In einigen Ausführungsformen ist die Häufigkeit indikativ für eine mit der Erkrankung verbundene erkrankte Zelle. In einigen Ausführungsformen ist die Erkrankung ein diffuses großzelliges B-Zell-Lymphom, und wobei die Häufigkeit indikativ dafür ist, ob das eine oder die mehreren zellfreien Nukleinsäuremoleküle von Keimzentrum-B-Zellen (Germinal Center B-Cells, GCB) oder aktivierten B-Zellen (Activated B-Cell, ABC) abgeleitet sind.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Genomursprung des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle indikativ für die Erkrankung des Subjekts.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren sind die erste und die zweite Phasenvariante durch wenigstens 2, wenigstens 3, wenigstens 4, wenigstens 5, wenigstens 6, wenigstens 7 oder wenigstens 8 Nukleotide getrennt. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren sind die erste und die zweite Phasenvariante durch höchstens etwa 180, höchstens etwa 170, höchstens etwa 160, höchstens etwa 150 oder höchstens etwa 140 Nukleotide getrennt.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfassen wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 % oder wenigstens etwa 50 % des einen oder der mehreren zellfreien Nukleinsäuremoleküle, die eine Vielzahl von Phasenvarianten umfassen, eine Einzelnukleotidvariante (Single Nucleotide Variant, SNV), die wenigstens 2 Nukleotide von einer benachbarten SNV entfernt ist.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst die Vielzahl der Phasenvarianten wenigstens 3, wenigstens 4, wenigstens 5, wenigstens 10, wenigstens 15, wenigstens 20 oder wenigstens 25 Phasenvarianten innerhalb desselben zellfreien Nukleinsäuremoleküls.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das eine oder umfassen die mehreren identifizierten zellfreien Nukleinsäuremoleküle wenigstens 2, wenigstens 3, wenigstens 4, wenigstens 5, wenigstens 10, wenigstens 50, wenigstens 100, wenigstens 500 oder wenigstens 1.000 zellfreie Nukleinsäuremoleküle.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Referenzgenomsequenz von einer Referenzkohorte abgeleitet. In einigen Ausführungsformen umfasst die Referenzgenomsequenz eine Konsenssequenz aus der Referenzkohorte. In einigen Ausführungsformen umfasst die Referenzgenomsequenz wenigstens einen Teil des menschlichen hg 19-Genoms, hg18-Genoms, hg17-Genoms, hg16-Genoms oder hg38-Genoms.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Referenzgenomsequenz aus einer Probe des Subjekts abgeleitet.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Probe eine gesunde Probe. In einigen Ausführungsformen umfasst die Probe eine gesunde Zelle. In einigen Ausführungsformen umfasst die gesunde Zelle einen gesunden Leukozyten.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Probe eine erkrankte Probe. In einigen Ausführungsformen umfasst die erkrankte Probe eine erkrankte Zelle. In einigen Ausführungsformen umfasst die erkrankte Zelle eine Tumorzelle. In einigen Ausführungsformen umfasst die erkrankte Probe einen soliden Tumor.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wird der Nukleinsäuresondensatz basierend auf der Vielzahl von Phasenvarianten gestaltet, die durch den Vergleich von (i) Sequenzierungsdaten aus einem soliden Tumor, Lymphom oder Bluttumor des Subjekts und (ii) Sequenzierungsdaten aus einer gesunden Zelle des Subjekts oder einer gesunden Kohorte identifiziert werden. In einigen Ausführungsformen stammt die gesunde Zelle von dem Subjekt. In einigen Ausführungsformen stammt die gesunde Zelle aus der gesunden Kohorte.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Nukleinsäuresondensatz zur Hybridisierung an wenigstens einen Teil der Sequenzen der mit der Erkrankung assoziierten genomischen Loci gestaltet. In einigen Ausführungsformen ist bekannt, dass die mit der Erkrankung assoziierten genomischen Loci eine aberrante somatische Hypermutation aufweisen, wenn das Subjekt die Erkrankung hat.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Nukleinsäuresondensatz zur Hybridisierung an wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % oder etwa 100 % (i) der in Tabelle 1 identifizierten Genombereiche, (ii) der in Tabelle 3 identifizierten Genombereiche oder (iii) der in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereiche, gestaltet.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren weist jede Nukleinsäuresonde des Nukleinsäuresondensatz wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % Sequenzidentität, wenigstens etwa 95 % Sequenzidentität oder etwa 100 % Sequenzidentität mit einer aus Tabelle 6 ausgewählten Sondensequenz auf.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst der Nukleinsäuresondensatz wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 % oder wenigstens etwa 90 % der Sondensequenzen in Tabelle 6.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das Verfahren ferner die Bestimmung, dass das Subjekt die Erkrankung hat oder die Bestimmung eines Grades oder Stadiums der Erkrankung des Subjekts, basierend auf dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen, die die Vielzahl von Phasenvarianten umfassen. In einigen Ausführungsformen umfasst das Verfahren ferner das Bestimmen, dass das eine oder die mehreren zellfreien Nukleinsäuremoleküle aus einer mit der Erkrankung assoziierten Probe abgeleitet ist/sind, basierend auf der Durchführung einer statistischen Modellanalyse des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle. In einigen Ausführungsformen umfasst die statistische Modellanalyse eine statistische Monte-Carlo-Analyse.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das Verfahren ferner die Überwachung eines Verlaufs der Erkrankung des Subjekts basierend auf dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das Verfahren ferner das Durchführen eines anderen Verfahrens zur Bestätigung der Erkrankung des Subjekts. In einigen Ausführungsformen umfasst das andere Verfahren einen Bluttest, einen Gentest, eine medizinische Bildgebung, eine körperliche Untersuchung oder eine Gewebebiopsie.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das Verfahren ferner das Bestimmen einer Behandlung der Erkrankung des Subjekts basierend auf dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wurde das Subjekt vor (a) einer Behandlung der Erkrankung unterzogen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst die Behandlung Chemotherapie, Radiotherapie, Chemoradiotherapie, Immuntherapie, adoptive Zelltherapie, Hormontherapie, gezielte Arzneimitteltherapie, Operation, Transplantation, Transfusion oder medizinische Überwachung.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst die Vielzahl der zellfreien Nukleinsäuremoleküle eine Vielzahl von zellfreien Desoxyribonukleinsäuremolekülen (DNA-Molekülen).
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst Erkrankung eine Krankheit.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Vielzahl der zellfreien Nukleinsäuremoleküle aus einer Körperprobe des Subjekts abgeleitet. In einigen Ausführungsformen umfasst die Körperprobe Plasma, Serum, Blut, Liquor, Lymphflüssigkeit, Speichel, Urin oder Stuhl.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist das Subjekt ein Säugetier. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist das Subjekt ein Mensch.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst die Erkrankung Neoplasma, Krebs oder Tumor. In einigen Ausführungsformen umfasst die Erkrankung einen soliden Tumor. In einigen Ausführungsformen umfasst die Erkrankung ein Lymphom. In einigen Ausführungsformen umfasst die Erkrankung ein B-Zell-Lymphom. In einigen Ausführungsformen umfasst die Erkrankung einen Untertyp des B-Zell-Lymphoms, der ausgewählt ist aus der Gruppe bestehend aus diffusem großzelligem B-Zell-Lymphom, follikulärem Lymphom, Burkitt-Lymphom und chronisch lymphozytäre B-Zell-Leukämie.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wurde die Vielzahl der Phasenvarianten zuvor durch Sequenzierung einer früheren Tumorprobe oder einer zellfreien Nukleinsäureprobe als tumorabgeleitet identifiziert.
-
In einem Aspekt sieht die vorliegende Offenbarung eine Zusammensetzung vor, umfassend einen Ködersatz, der einen Nukleinsäuresondensatz umfasst, der zum Erfassen von zellfreien DNA-Molekülen gestaltet ist, die von wenigstens etwa 5 % der Genombereiche abgeleitet sind, die in (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen aufgeführt sind.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist der Nukleinsäuresondensatz für das Pull-Down (Abrufen, Herunterziehen) von zellfreien DNA-Molekülen gestaltet, die von wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % oder etwa 100 % von in (i) der in Tabelle 1 identifizierten Genombereiche, (ii) der in Tabelle 3 identifizierten Genombereiche oder (iii) der in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereiche festgelegten Genombereichen abgeleitet sind.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist der Nukleinsäuresondensatz zum Erfassen des einen oder der mehreren zellfreien DNA-Molekülen gestaltet, die von höchstens etwa 10 %, höchstens etwa 20 %, höchstens etwa 30 %, höchstens etwa 40 %, höchstens etwa 50 %, höchstens etwa 60 %, höchstens etwa 70 %, höchstens etwa 80 %, höchstens etwa 90 % oder etwa 100 % von (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen festgelegten Genombereichen abgeleitet sind.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst der Ködersatz höchstens 5, höchstens 10, höchstens 50, höchstens 100, höchstens 500, höchstens 1000 oder höchstens 2000 Nukleinsäuresonden.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatzes ein Pull-Down-Tag.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst das Pull-Down-Tag einen Nukleinsäure-Barcode.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst das Pull-Down-Tag Biotin.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist jedes der zellfreien DNA-Moleküle zwischen etwa 100 Nukleotiden und etwa 180 Nukleotiden lang.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen sind die Genombereiche mit einer Erkrankung assoziiert.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen weisen die Genombereiche eine aberrante somatische Hypermutation auf, wenn ein Subjekt die Erkrankung hat.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst die Erkrankung ein B-Zell-Lymphom. In einigen Ausführungsformen umfasst die Erkrankung einen Untertyp des B-Zell-Lymphoms, der ausgewählt ist aus der Gruppe bestehend aus diffusem großzelligem B-Zell-Lymphom, follikulärem Lymphom, Burkitt-Lymphom und chronisch lymphozytäre B-Zell-Leukämie.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst die Zusammensetzung ferner eine Vielzahl von zellfreien DNA-Molekülen, die von einem Subjekt erlangt oder abgeleitet wurden.
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Durchführung eines klinischen Verfahrens an einem Individuum vor, das Verfahren umfassend: (a) Gewinnen oder erlangt haben eines gezielten Sequenzierungsergebnisses einer Sammlung von zellfreien Nukleinsäuremolekülen, wobei die Sammlung von zellfreien Nukleinsäuremolekülen aus einer Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums stammt, und wobei die gezielte Sequenzierung unter Verwendung von Nukleinsäuresonden zum Pull-Down von Sequenzen genomischer Loci durchgeführt wird, von denen bekannt ist, dass sie eine aberrante somatische Hypermutation in einem B-Zell-Krebs aufweisen; (b) Identifizieren oder identifiziert haben einer Vielzahl von Varianten in Phase innerhalb des zellfreien Nukleinsäure-Sequenzierungsergebnisses; (c) Bestimmen oder bestimmt haben, unter Verwendung eines statistischen Modells und der identifizierten Phasenvarianten, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleotide enthält, die von einem Neoplasma abgeleitet sind; und (d) Durchführen eines klinischen Verfahrens an dem Individuum zur Bestätigung des Vorhandenseins des B-Zell-Krebses, basierend auf der Bestimmung, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleinsäure-Sequenzen enthält, die wahrscheinlich von dem B-Zell-Krebs abgeleitet sind.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist die Biopsie eine von Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen sind die genomischen Loci ausgewählt aus (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen sind die Sequenzen der Nukleinsäuresonden aus Tabelle 6 ausgewählt.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist das klinische Verfahren ein Bluttest, eine medizinische Bildgebung oder eine körperliche Untersuchung.
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Behandlung eines Individuums gegen B-Zellen-Krebs vor, das Verfahren umfassend: (a) Gewinnen oder erlangt haben eines gezielten Sequenzierungsergebnisses einer Sammlung von zellfreien Nukleinsäuremolekülen, wobei die Sammlung von zellfreien Nukleinsäuremolekülen aus einer Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums stammt, und wobei die gezielte Sequenzierung unter Verwendung von Nukleinsäuresonden zum Pull-Down von Sequenzen genomischer Loci durchgeführt wird, von denen bekannt ist, dass sie eine aberrante somatische Hypermutation in einem B-Zellen-Krebs aufweisen; (b) Identifizieren oder identifiziert haben einer Vielzahl von Varianten in Phase innerhalb des Ergebnisses der zellfreien Nukleinsäure-Sequenzierung; (c) Bestimmen oder bestimmt haben, unter Verwendung eines statistischen Modells und der identifizierten Phasenvarianten, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleotide enthält, die von einem Neoplasma abgeleitet sind; und (d) Behandeln des Individuums zur Eindämmung des B-Zellen-Krebses, basierend auf der Bestimmung, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleinsäure-Sequenzen enthält, die von dem B-Zellen-Krebs abgeleitet sind.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist die Biopsie eine von Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen sind die genomischen Loci ausgewählt aus (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen sind die Sequenzen der Nukleinsäuresonden aus Tabelle 6 ausgewählt.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist die Behandlung Chemotherapie, Radiotherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie oder medizinische Überwachung.
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zum Nachweis einer krebsartigen minimalen Restkrankheit bei einem Individuum und zur Behandlung des Individuums aufgrund einer Krebskrankheit vor, das Verfahren umfassend: (a) Gewinnen oder erlangt haben eines gezielten Sequenzierungsergebnisses einer Sammlung von zellfreien Nukleinsäuremolekülen, wobei die Sammlung von zellfreien Nukleinsäuremolekülen aus einer Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums stammt, wobei die Flüssigkeits- oder Ausscheidungsbiopsie zum Nachweis einer minimalen Restkrankheit nach einer Reihe von Behandlungen entnommen wird, und wobei die gezielte Sequenzierung unter Verwendung von Nukleinsäuresonden zum Pull-Down von Sequenzen genomischer Loci durchgeführt wird, von denen bestimmt wurde, dass sie eine Vielzahl von Varianten in Phasen enthalten, wie durch ein früheres Sequenzierungsergebnis einer aus dem Krebs abgeleiteten früheren Biopsie bestimmt; (b) Identifizieren oder identifiziert haben wenigstens eines Satzes der Vielzahl von Varianten in Phase innerhalb des Ergebnisses der zellfreien Nukleinsäure-Sequenzierung; (c) Behandeln des Individuums zur Eindämmung des Krebses, basierend auf der Bestimmung, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleinsäure-Sequenzen enthält, die von dem Krebs abgeleitet sind.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist die Flüssigkeits- oder Ausscheidungsbiopsie eine von Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist die Behandlung Chemotherapie, Radiotherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie oder medizinische Überwachung.
-
In einem Aspekt sieht die vorliegende Offenbarung ein Computerprogrammprodukt vor, umfassend ein nicht-transitorisches, computerlesbares Medium mit darin codiertem, computerausführbarem Code, wobei der computerausführbare Code zur Ausführung zur Implementierung eines beliebigen der hier offenbaren Verfahren angepasst ist.
-
In einem Aspekt sieht die vorliegende Offenbarung ein System vor, das einen oder mehrere Computerprozessoren und einen damit gekoppelten Computerspeicher umfasst, wobei der Computerspeicher maschinenausführbaren Code enthält, der bei Ausführung durch den einen oder die mehreren Computerprozessoren ein beliebiges der hierin offenbarten Verfahren implementiert.
-
Zusätzliche Aspekte und Vorteile der vorliegenden Offenbarung werden für Fachleute aus der folgenden ausführlichen Beschreibung leicht ersichtlich, in der lediglich veranschaulichende Ausführungsformen der vorliegenden Offenbarung gezeigt und beschrieben werden. Wie zu erkennen sein wird, ist die vorliegende Offenbarung zu anderen und unterschiedlichen Ausführungsformen fähig, und ihre zahlreichen Details sind zu Modifikationen in verschiedenen offensichtlichen Hinsichten fähig, ohne dabei von der Offenbarung abzuweichen. Dementsprechend sind die Zeichnungen und die Beschreibung als veranschaulichend und nicht als einschränkend zu betrachten.
-
DURCH BEZUGNAHME EINBEZOGEN
-
Alle Veröffentlichungen, Patente und Patentanmeldungen, die in dieser Patentschrift erwähnt werden, sind hierin durch Bezugnahme in demselben Umfang einbezogen, als ob jede einzelne Veröffentlichung, jedes einzelne Patent oder jede einzelne Patentanmeldung ausdrücklich und individuell als durch Bezugnahme einbezogen angegeben wäre. Soweit die durch Bezugnahme einbezogenen Veröffentlichungen und Patente oder Patentanmeldungen der in der Patentschrift enthaltenen Offenbarung widersprechen, hat die Beschreibung Vorrang vor etwaigem widersprüchlichem Material.
-
Figurenliste
-
Verschiedene Merkmale der Erfindung sind in den beigefügten Patentansprüchen im Einzelnen dargelegt. Zum besseren Verständnis der Merkmale und Vorteile der vorliegenden Erfindung wird auf die folgende ausführliche Beschreibung, in der veranschaulichende Ausführungsformen dargelegt sind, in denen die Prinzipien der Erfindung genutzt werden, sowie auf die beigefügten Zeichnungen (hierin auch „Figur“ und „FIG.“) verwiesen.
- 1 veranschaulicht die Entdeckung von Phasenvarianten und deren Mutationssignaturen durch die Analyse von Ganzgenomsequenzierungsdaten. 1A ist eine Zeichnung, die den Unterschied zwischen dem Nachweis einer Einzelnukleotidvariante (SNV) (oben) und mehrerer Varianten ,in Phase‘ (Phasenvarianten, PVs; unten) auf individuellen zellfreien DNA-Molekülen darstellt. Theoretisch ist der Nachweis einer PV ein spezifischeres Ereignis als der Nachweis einer isolierten SNV. 1B. ist ein Streudiagramm, das die Verteilung der Anzahl der PVs aus Ganzgenomsequenzierungsdaten (Whole Genome Sequencing, WGS-Daten) für 24 verschiedene Krebshistologien, normalisiert durch die Gesamtzahl der SNV, zeigt. Die Balken zeigen den Medianwert und den Interquartilsbereich. (FL-NHL, follikuläres Lymphom; DLBCL-NHL, diffuses großzelliges B-Zell-Lymphom; Burkitt-NHL, Burkitt-Lymphom, Lungen-SCC, Plattenepithel-Lungenkrebs; Lungen-Adeno, Adenokarzinom der Lunge; Nieren-RCC, Nierenzellkarzinom; Knochen-Osteosarc, Osteosarkom; Leber-HCC, hepatozelluläres Karzinom; Brust-Adeno, Adenokarzinom der Brust; Pank-Adeno, Adenokarzinom der Bauchspeicheldrüse; Kopf-SCC, Plattenepithelkarzinom im Kopf- und Halsbereich; Ovar-Adeno, Adenokarzinom der Eierstöcke; Eso-Adeno, Adenokarzinom der Speiseröhre; Uterus-Adeno, Adenokarzinom der Gebärmutter; Magen-Adeno, Adenokarzinom des Magens; CLL, chronische lymphozytäre Leukämie; KoloRekt-Adeno, kolorektales Adenokarzinom; Prost-Adeno, Adenokarzinom der Prostata; ZNS-GBM, Glioblastoma multiforme; Pank-Endokrin, neuroendokriner Tumor der Bauchspeicheldrüse; Schildd.-Adeno, Adenokarzinom der Schilddrüse; ZNS-PiloAstro, Piloastrozytom; ZNS-Medullo, Medulloblastom). 1C. ist ein Wärmebild, das die Anreicherung von Mutationssignaturen durch Einzelbasensubstitution (Single Base Substitution, SBS) für PVs im Vergleich zu einzelnen SNV über verschiedene Krebsarten hinweg zeigt. Blau steht für Signaturen, die in PVs in bestimmten Histologien angereichert sind; Dunkelgrau steht für Signaturen, in denen nicht phasierte, einzelne SNV angereichert sind; und Rot steht für SNV, die isoliert auftreten. Nur Signaturen, die einen signifikanten Unterschied zwischen PVs und nicht phasierten SNV nach Korrektur für multiple Hypothesen aufweisen, sind dargestellt; andere Signaturen sind grau. Signaturen, die mit Rauchen, AID/AICDA und APOBEC in Verbindung gebracht werden, sind angegeben. 1D. stellt Balkendiagramme dar, die die Verteilung von in stereotypen Bereichen des Genoms auftretenden PVs bei B-Lymphoid-Malignitäten und Adenokarzinom der Lunge zeigen. In diesem Diagramm wurde das Genom in 1000bp-Bins unterteilt und die Anteil der Proben einer gegebenen Histologie mit einer PV in jedem 1000bp-Bin berechnet. Es sind nur Bins dargestellt, die bei einem beliebigen Krebsuntertyp eine Rezidivhäufigkeit von wenigstens 2 Prozent aufweisen. Die wichtigsten genomischen Loci sind ebenfalls markiert. 1E ist ein Vergleich der Duplex-Sequenzierung mit der Sequenzierung von Phasenvarianten. Ein Schema zum Vergleich der fehlerunterdrückten Sequenzierung durch Duplex-Sequenzierung und der Rückgewinnung von Phasenvarianten. Bei der Duplex-Sequenzierung ist die Rückgewinnung einer einzelnen SNV, die auf beiden Strängen einer ursprünglichen DNA-Doppelhelix (d. h. in-trans) beobachtet wurde, erforderlich. Dies erfordert eine unabhängige Rückgewinnung von zwei Molekülen durch Sequenzierung, da die Plus- und Minusstränge des ursprünglichen DNA-Moleküls unabhängig voneinander die Bibliothekspräparation und PCR durchlaufen. Im Gegensatz dazu erfordert die Rückgewinnung von PVs mehrere SNV, die auf demselben Einzelstrang der DNA (d. h. in cis) beobachtet werden. Daher ist die Rückgewinnung nur des Plus- oder des Minusstrangs (und nicht beider) für die Identifizierung von PVs ausreichend.
- 2 stellt die Gestaltung, die Validierung und die Anwendung der Phasenvarianten-Anreicherungssequenzierung dar. 2A ist eine schematische Darstellung der Gestaltung für die PhasED-Seq. WGS-Daten von DLBCL-Tumorproben wurden aggregiert (links), und Bereiche mit rezidivierenden putativen PVs identifiziert (Mitte). Daraufhin wurde ein Assay entwickelt, der die Genombereiche erfasst, in denen PVs am häufigsten vorkommen (rechts). Das Ergebnis war eine ~ 7500-fache Anreicherung von PVs im Vergleich zu WGS. Das rechte obere Panel zeigt die in silico erwartete Anzahl von PVs pro Fall pro Kilobase der Panelgröße (y-Achse) für steigende Panelgrößen (x-Achse). Die gestrichelte Linie zeigt die ausgewählten Bereiche in dem PhasED-Seq.-Panel. Das untere rechte Panel zeigt die Gesamtzahl der erwarteten PVs pro Fall (y-Achse), die in silico aus WGS-Daten ermittelt wurden, für steigende Panelgrößen (y-Achse). Der dunkle Bereich zeigt die ausgewählten Bereiche im PhasED-Seq.-Panel. 2B veranschaulicht zwei Felder, die den Ertrag an SNV (links) und PVs (rechts) für die Sequenzierung von Tumor-DNA und angepasster Keimbahn durch ein zuvor etabliertes Lymphom-CAPP-Seq.-Panel oder PhasED-Seq. zeigen; die Werte werden in silico bewertet, indem die WGS auf den Zielbereich von Interesse begrenzt wird. Die im rechten Feld angegebenen PVs umfassen Dublett-, Triplett- und Quadruplett-Phasenereignisse. 2C zeigt den Ertrag an SNV (links) und PVs (rechts) aus der experimentellen Sequenzierung von Tumor- und/oder zellfreier DNA aus CAPP-Seq. gegenüber PhasED-Seq., ähnlich wie in 2B. 2D ist ein Streudiagramm, das die Häufigkeit von PVs nach genomischer Position (in 1000bp-Bins) für Patienten mit DLBCL zeigt, die entweder durch WGS oder durch PhasED-Seq. identifiziert wurden. PVs in IGH, BCL2, MYC und BCL6 sind hervorgehoben. 2E zeigt Streudiagramme, die die Häufigkeit von PVs nach genomischer Position (in 50bp-Bins) für Patienten mit verschiedenen Lymphomtypen vergleichen. Die farbigen Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins eines bestimmten Gens von Interesse; die anderen (grauen) Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins des restlichen PhasED-Seq.-Sequenzierpanels. 2F zeigt Vulkandiagramme, die die Differenz in der relativen Häufigkeit von PVs in spezifischen genetischen Loci zwischen verschiedenen Lymphomarten zusammenfassen, einschließlich ABC-DLBCL vs. GCB-DLBCL (dunkelgrau, links); PMBCL vs. DLBCL (dunkelgrau, Mitte); und HL vs. DLBCL (dunkelgrau, rechts). Die x-Achse zeigt die relative Anreicherung von PVs an einem bestimmten Locus, während die y-Achse die statistische Signifikanz dieser Assoziation anzeigt. (Beispiel 10).
- 3 veranschaulicht die technische Leistung der PhasED-Seq. zum Nachweis von Krankheiten. 3A zeigt ein Balkendiagramm, das die Leistung der Hybriderfassungssequenzierung für die Rückgewinnung synthetischer 150bp Oligonukleotide von zwei Loci (MYC und BCL6) mit zunehmendem Mutationsgrad / Nicht-Referenzbasen zeigt. Die Fehlerbalken stellen das 95 %-Konfidenzintervall dar (n=3 Replikate jeder Erkrankung in eindeutigen Proben). 3B veranschaulicht ein Diagramm, das die Hintergrundfehlerrate (Beispiel 10) für verschiedene Arten der Fehlersuppression von 12 gesunden zellfreien Kontroll-DNA-Proben, die mit dem PhasED-Seq.-Panel sequenziert wurden, darstellt. PhasED-Seq. 2x' oder ,Dubletts` steht für den Nachweis von zwei phasengleichen Mutationen auf demselben DNA-Molekül; PhasED-Seq. 3x' oder ,Tripletts` steht für den Nachweis von drei phasengleichen Mutationen auf demselben DNA-Molekül. 3C stellt ein Balkendiagramm dar, das die Tiefe der eindeutigen molekularen Rückgewinnung (z. B. Tiefe nach Barcode-vermittelter PCR-Duplikatentfernung) aus Sequenzierungsdaten von 12 zellfreien DNA-Proben für verschiedene Arten der Fehlersuppression zeigt, einschließlich Barcode-Deduplizierung, Duplex-Sequenzierung und Rückgewinnung von PVs mit zunehmendem maximalen Abstand zwischen SNV in Phase. 3D veranschaulicht ein Balkendiagramm, das den kumulativen Anteil der PVs zeigt, die einen maximalen Abstand zwischen SNV aufweisen, der geringer ist als die Anzahl der Basenpaare auf der x-Achse. 3E zeigt ein Diagramm mit den Ergebnissen einer limitierenden Verdünnungsreihe, die patientenspezifische Tumorfraktionen von 1×10-3 bis 0,5×10-6 enthaltende zellfreie DNA-Proben simuliert; in jeder Verdünnung wurde cfDNA von 3 unabhängigen Patientenproben verwendet. Dieselben Sequenzierungsdaten wurden mit einer Vielzahl von Verfahren zur Fehlersuppression für die Rückgewinnung der erwarteten Tumorfraktionen analysiert, darunter iDES, Duplex-Sequenzierung und PhasED-Seq. (sowohl für die Rückgewinnung von Dublett- als auch Triplett-Molekülen). Die Punkte und Fehlerbalken stellen den Mittelwert, das Minimum und das Maximum für die drei betrachteten patientenspezifischen Tumormutationen dar. Der Unterschied zwischen beobachteten und erwarteten Tumorfraktionen für Proben < 1: 10.000 wurde mittels eines gepaarten t-Tests verglichen. *, P < 0,05, **, P < 0,005, ***, P < 0,0005. 3F veranschaulicht das Diagramm des Hintergrundsignals für den Nachweis tumorspezifischer Allele in 12 nicht verwandten, gesunden zellfreien DNA-Proben und der für die limitierende Verdünnungsreihe verwendeten gesunden cfDNA-Probe (n=13 Gesamtproben). In jeder Probe wurden tumorspezifische SNV oder PVs aus den 3 Patientenproben, die in dem in 3E gezeigten limitierenden Verdünnungsexperiment verwendet wurden, für insgesamt 39 Bewertungen bewertet. Die Balken stellen das arithmetische Mittel über alle 39 Bewertungen dar; der statistische Vergleich wurde mit dem Wilcoxon-Rangsummentest durchgeführt. *, P < 0,05, **, P < 0,005, ***, P < 0,0005. 3G veranschaulicht das Diagramm, das die theoretische Nachweisrate für eine Probe mit einer gegebenen Anzahl von PV-enthaltenden Bereichen gemäß einer einfachen binomialen Probennahme darstellt. Dieses Diagramm wurde unter der Annahme einer eindeutigen Sequenzierungstiefe von 5000x (Linie) erstellt, zusammen mit einer variierenden Anzahl unabhängiger 150bp PV-enthaltender Bereiche, von 3 Bereichen (blau) bis 67 Bereichen (lila). Die Konfidenzhüllkurven berücksichtigen eine Tiefe von 4000-6000x; zudem wird eine Falsch-positiv-Rate von 5 % angenommen. 3H veranschaulicht ein Diagramm, das die beobachtete Nachweisrate (y-Achse) für eine Probe einer gegebenen wahren Tumorfraktion (x-Achse) mit variierender Anzahl von PV-haltigen Bereichen darstellt. Für jede Anzahl von Tumor-Reporter-Bereichen zwischen 3 und 67 wurde diese Anzahl von 150bp-Fenstern aus jeder der 3 patientenspezifischen PV-Reporter-Listen 25-mal zufällig ausgewählt und zur Bewertung des Tumornachweises bei jeder Verdünnung herangezogen. Gefüllte Punkte stehen für „nasse“ Verdünnungsreihenversuche, während offene Punkte für In silico-Verdünnungsversuche stehen. Punkte und Fehlerbalken stellen den Mittelwert, das Minimum und das Maximum der drei patientenspezifischen PV-Reporter-Listen dar, die in der ursprünglichen Probennahme verwendet wurden. 31 zeigt ein Streudiagramm, in dem die vorhergesagte mit der beobachteten Nachweisrate für Proben aus den Verdünnungsreihen in den Panels 3G und 3H verglichen wird. Weitere Einzelheiten zu diesem Versuch sind in Beispiel 10 angegeben.
- 4 zeigt die klinische Anwendung der PhasED-Seq. für den ultrasensiblen Krankheitsnachweis und die Reaktionsbeobachtung bei DLBCL. 4A zeigt das Diagramm mit den ctDNA-Werten eines Patienten mit DLBCL, der auf die Erstlinien-Immunochemotherapie ansprach und anschließend einen Rückfall erlitt. Die mit CAPP-Seq. gemessenen Werte sind in dunkleren grauen Kreisen dargestellt, während die mit PhasED-Seq. gemessenen Werte in helleren grauen Kreisen dargestellt sind. Offene Kreise stehen für durch CAPP-Seq. nicht nachweisbare Werte. 4B stellt ein univariates Streudiagramm dar, das die mittlere Tumorallelfraktion zeigt, die durch PhasED-Seq. für klinische Proben zu Zeitpunkten minimaler Krankheit (d. h. nach 1 oder 2 Therapiezyklen) gemessen wurde. Das Diagramm ist unterteilt in durch Standard-CAPP-Seq. nachgewiesene und nicht nachgewiesene Proben; P-Wert aus Wilcoxon-Rangsummentest. 4C stellt ein Balkendiagramm dar, das den Bruchteil der DLBCL-Patienten zeigt, die mit CAPP-Seq. nach 1 oder 2 Behandlungszyklen nachweisbare ctDNA haben (dunkelgraue Balken), sowie den Bruchteil der zusätzlichen Patienten mit nachweisbarer Krankheit, wenn PhasED-Seq. zur Standard-CAPP-Seq. hinzugefügt wird (mittelgraue Balken). Der P-Wert stellt einen exakten Fisher-Test für den Nachweis durch CAPP-Seq. allein gegenüber der Kombination von PhasED-Seq. und CAPP-Seq. in 171 Proben nach 1 oder 2 Behandlungszyklen dar. 4D zeigt ein Wasserfalldiagramm, das die Veränderung der mit CAPP-Seq. gemessenen ctDNA-Werte nach 2 Zyklen der Erstlinientherapie bei Patienten mit DLBCL darstellt. Patienten mit nicht durch CAPP-Seq. nachweisbarer ctDNA sind als „ND“ (Not Detected, „nicht nachgewiesen“) in dunkleren Farben dargestellt. Die Farben der Balken zeigen auch die späteren klinischen Ergebnisse für diese Patienten an. 4E zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben für 52 DLBCL-Patienten mit nicht nachweisbarer ctDNA, gemessen durch CAPP-Seq., nach 2 Zyklen darstellt. 4F zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben von 52 in 4E gezeigten Patienten (durch CAPP-Seq. nicht nachweisbare ctDNA) stratifiziert nach ctDNA-Nachweis durch PhasED-Seq. zum gleichen Zeitpunkt (Zyklus 3, Tag 1) darstellt. 4G zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben für 89 Patienten mit DLBCL stratifiziert nach ctDNA bei Zyklus 3, Tag 1, unterteilt in 3 Schichten - Patienten, die keine gute molekulare Remission erreichen (dunkelgrau), Patienten mit einer guten molekulare Remission, die aber immer noch durch PhasED-Seq. und/oder CAPP-Seq. nachweisbare ctDNA haben (hellgrau), und Patienten, die eine stringente molekulare Remission haben (nicht durch PhasED-Seq. und CAPP-Seq. nachweisbare ctDNA; mittelgrau).
- 5 zeigt die Aufzählung von SNV und PVs bei verschiedenen Krebsarten aus WGS. 5A-C zeigen univariate Streudiagramme, die die Anzahl der SNV (5A), der PVs (5B) und der PVs unter Kontrolle der Gesamtzahl der SNV (5C) aus WGS-Daten für 24 verschiedene Krebshistologien darstellen. Die Balken zeigen den Medianwert und den Interquartilsbereich. (FL-NHL, follikuläres Lymphom; DLBCL-NHL, diffuses großzelliges B-Zell-Lymphom; Burkitt-NHL, Burkitt-Lymphom; Lungen-SCC, Plattenepithel-Lungenkrebs; Lungen-Adeno, Adenokarzinom der Lunge; Nieren-RCC, Nierenzellkarzinom; Knochen-Osteosarc, Osteosarkom; Leber-HCC, hepatozelluläres Karzinom; Brust-Adeno, Adenokarzinom der Brust; Pank-Adeno, Adenokarzinom der Bauchspeicheldrüse; Kopf-SCC, Plattenepithelkarzinom im Kopf- und Halsbereich; Ovar-Adeno, Adenokarzinom der Eierstöcke; Eso-Adeno, Adenokarzinom der Speiseröhre; Uterus-Adeno, Adenokarzinom der Gebärmutter; Magen-Adeno, Adenokarzinom des Magens; CLL, chronische lymphozytäre Leukämie; KoloRekt-Adeno, kolorektales Adenokarzinom; Prost-Adeno, Adenokarzinom der Prostata; ZNS-GBM, Glioblastoma multiforme; Pank-Endokrin, neuroendokriner Tumor der Bauchspeicheldrüse; Schildd.-Adeno, Adenokarzinom der Schilddrüse; ZNS-PiloAstro, Piloastrozytom; ZNS-Medullo, Medulloblastom).
- 6 zeigt den Beitrag von Mutationssignaturen in phasierten und nichtphasierten SNV in WGS (6A-6WW). Streudiagramme, die den Beitrag etablierter Mutationssignaturen für Einzelbasensubstitutionen (SBS) zu SNV in PVs, dargestellt in dunklen Farben, und SNV außerhalb möglicher Phasenbeziehungen, dargestellt in hellen Farben, aus WGS zeigen. Dies ist für 49 SBS-Mutationssignaturen in 24 Krebsunterarten dargestellt. Mutationssignaturen, die nach Korrektur der multiplen Hypothesentests einen signifikanten Unterschied im Beitrag zwischen phasierten und nichtphasierten SNV aufweisen, sind mit einem * gekennzeichnet. Diese Figuren stellen die in 1C zusammengefassten Rohdaten dar
- 7 zeigt die Verteilung der PVs in stereotypen Bereichen des Genoms. Die Balkendiagramme zeigen die in stereotypen Bereichen auftretenden PVs über das Genom mehrerer Krebsarten. In diesem Diagramm wurde das Genom in 1000bp-Bins unterteilt und die Anteil der Proben einer gegebenen Histologie mit einer PV in jedem 1000bp-Bin berechnet. Es sind nur Bins dargestellt, die bei einem beliebigen Krebsuntertyp eine Rezidivhäufigkeit von wenigstens 2 Prozent aufweisen. Die dargestellten Histologien sind wie in 1E; Unterarten des DLBCL mit aktivierten B-Zellen (ABC) und B-Zellen im Keimzentrum (GCB) sind ebenfalls dargestellt.
- 8 veranschaulicht die Anzahl und die genomische Lage von PVs aus WGS in lymphatischen Malignomen. 8A illustriert ein Balkendiagramm, das die Anzahl der unabhängigen 1000bp-Bereiche über das Genom zeigt, die wiederholt PVs für DLBCL, FL, BL und CLL enthalten (n=68, 74, 36 bzw. 151). 8B-D illustrieren Diagramme, die die Häufigkeit von PVs für multiple lymphatische Malignome mit Beziehungen zu spezifischen genetischen Loci zeigen, einschließlich 8B: BCL2, 8C: MYC, and 8D: ID3. Die Lage des Transkripts für ein gegebenes Gen ist unterhalb des Diagramms in Grau dargestellt; Exons sind in dunklerem Grau dargestellt. * kennzeichnet einen Bereich mit signifikant mehr PVs in einer bestimmten Krebs-Histologie im Vergleich zu allen anderen Histologien durch den exakten Fisher-Test (P < 0,05). 8E, ähnlich wie 8B-D, diese Diagramme zeigen die Häufigkeit von PVs bei verschiedenen Lymphom-Unterarten. Hier ist der IGH-Locus, bestehend aus IGHV-, IGHD- und IGHJ-Teilen, für ABC- und GCB-Subtyp DLBCLs (n = 25 bzw. 25) dargestellt. Dargestellt sind Codierungsbereiche für Ig-Teile, einschließlich Ig-konstanter Bereiche und V-Gene. (DLBCL, diffuses großzelliges B-Zell-Lymphom; FL, follikuläres Lymphom; BL, Burkitt-Lymphom, CLL, chronische lymphatische Leukämie).
- 9 zeigt die Leistung von PhasED-Seq. zur Rückgewinnung von PVs über Lymphome hinweg. 9A zeigt ein univariates Streudiagramm, das die Anteil aller durch WGS identifizierten PVs im gesamten Genom (n=79) zeigt, die durch das zuvor berichtete Lymphom-CAPP-Seq.-Panel8 (links) im Vergleich zu PhasED-Seq. (rechts) wiedererlangt wurden. 9B veranschaulicht die erwartete Ausbeute an SNV pro Fall, die aus WGS unter Verwendung eines zuvor etablierten Lymphom CAPP-Seq.-Panels oder des PhasED-Seq.-Panels identifiziert wurden. 9C veranschaulicht die erwartete Ausbeute an PVs pro Fall, die aus WGS unter Verwendung eines zuvor etablierten Lymphom CAPP-Seq.-Panels oder des PhasED-Seq.-Panels identifiziert wurden. Daten von drei unabhängigen, öffentlich zugänglichen Kohorten sind in 9A-9C dargestellt. 9D-9F zeigen Diagramme, die die Verbesserung der Rückgewinnung von PVs durch PhasED-Seq. im Vergleich zu CAPP-Seq. bei 16 Patienten zeigen, die mit beiden Assays sequenziert wurden. Dazu gehören Verbesserungen bei d) zwei SNV in Phase (z. B. 2x oder ,Dublett-PVs'), e) drei SNV in Phase (3x oder ,Triplett-PVs') und f) vier SNV in Phase (z. B. 4x oder , Quadruplett-PVs'). 9G-9K illustrieren Panels, die die Anzahl der bei Patienten mit verschiedenen Lymphomtypen identifizierten SNV und PVs zeigen. Diese Panels zeigen die Anzahl der g) SNV, h) Dublett-PVs, i) Triplett-PVs, j) Quadruplett-PVs und k) aller PVs. *, P < 0,05, **, P < 0,01, ***, P < 0,001. (DLBCL, diffuses großzelliges B-Zell-Lymphom; GCB, B-Zellen im Keimzentrum wie DLBCL; ABC, aktivierte B-Zellen wie DLBCL; PMBCL, primäres mediastinales B-Zell-Lymphom; HL, Hodgkin-Lymphom).
- 10 zeigt die lagespezifischen Unterschiede in PVs zwischen ABC-DLBCL und GCB-DLBC (10A-10Y.) Ähnlich wie 2D vergleichen diese Streudiagramme die Häufigkeit von PVs nach genomischer Lage (in 50bp-Bins) für Patienten mit verschiedenen Lymphomtypen; in dieser Figur ist der Unterschied zwischen ABC-DLBCL und GCB-DLBCL dargestellt. Die roten Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins eines bestimmten Gens von Interesse; die anderen (grauen) Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins aus dem Rest des PhasED-Seq.-Sequenzierpanels. Es werden nur Gene mit einem statistisch signifikantem Unterschied in den PVs zwischen ABC-DLBCL und GCB-DLBCL gezeigt. Die P-Werte stellen einen Wilcoxon-Rangsummentest von 50bp-Bins eines gegebenen Gens gegen alle anderen 50bp-Bins dar; siehe Beispiel 10.
- 11 illustriert die lagespezifischen Unterschiede in den PVs zwischen DLBCL und PMBCL (11A-11X). Ähnlich wie 2D vergleichen diese Streudiagramme die Häufigkeit von PVs nach genomischer Lage (in 50bp-Bins) für Patienten mit verschiedenen Lymphomtypen; in dieser Figur ist der Unterschied zwischen DLBCL und PMBCL dargestellt. Die blauen Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins eines bestimmten Gens von Interesse; die anderen (grauen) Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins aus dem Rest des PhasED-Seq.-Sequenzierpanels. Es werden nur Gene mit einem statistisch signifikantem Unterschied in den PVs zwischen DLBCL und PMBCL gezeigt. Die P-Werte stellen einen Wilcoxon-Rangsummentest von 50bp-Bins eines gegebenen Gens gegen alle anderen 50bp-Bins dar; siehe Beispiel 10.
- 12 zeigt die lagespezifischen Unterschiede in den PVs zwischen DLBCL und HL. Ähnlich wie in 2D vergleichen die Streudiagramme der 12A-12NN die Häufigkeit von PVs nach genomischer Lage (in 50bp-Bins) für Patienten mit verschiedenen Lymphomtypen; in dieser Figur ist der Unterschied zwischen DLBCL und HL dargestellt. Die grünen Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins eines bestimmten Gens von Interesse; die anderen (grauen) Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins aus dem Rest des PhasED-Seq.-Sequenzierpanels. Es werden nur Gene mit einem statistisch signifikantem Unterschied in den PVs zwischen DLBCL und HL gezeigt. Die P-Werte stellen einen Wilcoxon-Rangsummentest von 50bp-Bins eines gegebenen Gens gegen alle anderen 50bp-Bins dar; siehe Beispiel 10.
- 13 zeigt die Unterschiede in den PVs zwischen den Lymphomtypen bei Mutationen im IGH-Locus. Diese Figur zeigt die Häufigkeit von PVs aus PhasED-Seq. über den @/G77-Lokus für verschiedene Arten von B-Zell-Lymphomen. Die untere Spur zeigt die Struktur des @IGH-Locus und der Genteile, einschließlich der Ig-konstanten Gene und V-Gene. Die nächste (skizzierte) Spur zeigt die Häufigkeit von PVs in diesem Genombereich aus WGS-Daten (ICGC-Kohorte). Die restlichen Spuren zeigen die Häufigkeit von PVs aus PhasED-Seq. gezielten Sequenzierungsdaten, einschließlich 1) DLBCL, GCB-DLBCL , ABC-DLBCL, PMBCL und HL. Die vom PhasED-Seq.-Panel angezielten Bereiche sind ganz oben dargestellt. Ausgewählte Immunglobulinteile mit PVs, die in bestimmten Histologien angereichert sind, sind markiert (d. h. IGHV4-34, Sε, Sγ3 und Sγ1).
- 14 illustriert technische Aspekte der PhasED-Seq. durch Hybriderfassungssequenzierung. 14A zeigt ein Diagramm der theoretischen Bindungsenergie für typische 150-mere im gesamten Genom mit zunehmender Anteil der vom Referenzgenom mutierten Basen. Mutationen waren über die gesamte 150-mer-Sequenz verteilt, entweder gruppiert an einem Ende der Sequenz, gruppiert in der Mitte der Sequenz oder zufällig in der gesamten Sequenz. Punkt und Fehlerbalken stellen den Median und die Interquartilsbereiche von 10.000 In silico-Simulationen dar. 14B stellt ein Diagramm dar, das zwei Histogramme zusammenfassender Metriken der Mutationsrate von 151-bp-Fenstern im gesamten PhasED-Seq.-Panel für alle Patienten in dieser Studie zeigt. Das hellgraue Histogramm zeigt die maximalen mutierten Prozent in einem beliebigen 151-bp-Fenster für alle Patienten in dieser Studie; das dunkelgraue Histogramm zeigt die 95ste Perzentil-Mutationsrate über alle mutierten 151-bp-Fenster. 14C ist ein Diagramm, das das Perzentil der Mutationsrate über alle mutierten 151-bp-Fenster bei allen Patienten in dieser Studie zeigt. 14D stellt Wärmebilder dar, die die relative Fehlerrate (als log10(Fehlerrate)) für einzelne SNV (links, „ROT“), Dublett-PVs (Mitte, „GELB“) und Triplett-PVs (rechts, „BLAU“) zeigen. 14D zeigt, dass die Analyse basierend auf der Vielzahl von Phasenvarianten (z. B. Doppel- oder Triplett-PVs) eine niedrigere Fehlerrate ergibt als die Analyse basierend auf einzelnen SNV. Zusätzlich zeigt 14D, dass die Analyse unter Verwendung einer höheren Anzahl von Phasenvariantensätzen (z. B. Triplett-PVs mit der Bezeichnung „BLAU“) eine niedrigere Fehlerrate ergibt als die Analyse basierend auf einer geringeren Anzahl von Phasenvariantensätzen (z. B. Dublett-PVs mit der Bezeichnung „GELB“). Gezeigt ist die Fehlerrate einzelner SNV aus der Sequenzierung mit mehreren Verfahren zur Fehlerunterdrückung, einschließlich Barcode-Deduplizierung, iDES und Duplex-Sequenzierung. Die Fehlerraten werden nach Art der Mutation zusammengefasst. Im Falle von Triplett-PVs stellen die x- und y-Achse des Wärmebildes die erste und zweite Art der Basenveränderung in der PV dar; die dritte Veränderung wird über alle 12 möglichen Basenveränderungen gemittelt. 14E illustriert ein Diagramm, das die Fehlerrate für Dublett / 2x PVs als Funktion des genomischen Abstands zwischen den Komponenten-SNV zeigt.
- 15 und 16 zeigen den Vergleich der Quantifizierung von ctDNA durch PhasED-Seq. mit CAPP-Seq. und klinischen Anwendungen. 15 veranschaulicht die Nachweisrate von ctDNA aus Vorbehandlungsproben über 107 Patienten mit großzelligen B-Zell-Lymphomen mittels Standard-CAPP-Seq. (grün) sowie PhasED-Seq. unter Verwendung von Dubletts (hellblau), Tripletts (mittelblau) und Quadrupletts (dunkelblau). Die Spezifität des ctDNA-Nachweises ist ebenfalls dargestellt. In den unteren beiden Diagrammen ist die Falschnachweisrate bei 40 zurückgehaltenen gesunden KontrollcfDNA-Proben dargestellt. Die Größe der einzelnen Balken in diesen beiden Diagrammen zeigt die Nachweisrate für patientenspezifische cfDNA-Mutationen in diesen 40 zurückgehaltenen Kontrollen für alle 107 Fälle. 16A stellt eine Tabelle dar, die die Sensitivität und Spezifität für den ctDNA-Nachweis in Vorbehandlungsproben durch CAPP-Seq. und PhasED-Seq. unter Verwendung von Dubletts, Tripletts und Quadrupletts zusammenfasst, dargestellt in Panel A. Die Sensitivität wird für alle 107 Fälle berechnet, während die Spezifität für die 40 zurückgehaltenen Kontrollproben berechnet wird, die für jede der 107 unabhängigen patientenspezifischen Mutationslisten bewertet werden, was insgesamt 4280 unabhängige Tests ergibt. 16B illustriert ein Streudiagramm, das die Menge an ctDNA (gemessen als log10(haploide Genomäquivalente/ml)) zeigt, die durch CAPP-Seq. im Vergleich zu PhasED-Seq. in einzelnen Proben gemessen wurde. Proben, die vor Zyklus 1 der RCHOP-Therapie (d. h. vor der Behandlung), vor Zyklus 2 und vor Zyklus 3 entnommen wurden, sind in unabhängigen Farben (blau, grün bzw. rot; insgesamt 278 Proben) dargestellt. Nicht nachweisbare Werte liegen auf den Achsen. Spearman-Korrelation und P-Wert sind dargestellt.
- 17 zeigt den Nachweis von ctDNA nach zwei Zyklen der systemischen Therapie. 17A zeigt ein Streudiagramm, das die logarithmische Veränderung der ctDNA nach 2 Therapiezyklen (d. h. die Major Molecular Response (große molekulare Remission) oder MMR), gemessen mit CAPP-Seq. oder PhasED-Seq., für Patienten unter RCHOP-Therapie darstellt. Gepunktete Linien zeigen den zuvor festgelegten Schwellenwert einer 2,5-log-Reduktion in ctDNA für MMR. Nicht nachweisbare Proben fallen auf die Achsen; der Korrelationskoeffizient stellt einen Spearman rho für die 33 Proben dar, die sowohl mit CAPP-Seq. als auch mit PhasED-Seq. nachgewiesen wurden. 17B zeigt 2-x-2-Tabellen, in denen die Nachweisrate von ctDNA-Proben nach 2 Therapiezyklen durch PhasED-Seq. gegenüber CAPP-Seq. zusammengefasst ist. Patienten mit einer eventuellen Krankheitsprogression sind im unteren Panel dargestellt, während Patienten ohne eventuelle Krankheitsprogression im oberen Panel gezeigt sind. 17C zeigt Balkendiagramme, die den Bereich unter der Empfänger-Operator-Kurve (AUC) für die Klassifizierung von Patienten für das ereignisfreie Überleben nach 24 Monaten basierend auf CAPP-Seq. (helle Farben) oder PhasED-Seq. (dunkle Farben) nach 2 Therapiezyklen darstellen. Sowohl die Klassifizierung aller Patienten (n=89, links) als auch die Klassifizierung der Patienten, die eine MMR erreichen (n=69, rechts), sind dargestellt. 17D zeigt Kaplan-Meier-Diagramme, die das ereignisfreie Überleben von 69 Patienten zeigen, die eine MMR erreicht haben, stratifiziert nach ctDNA-Nachweis mit CAPP-Seq. (oben) oder PhasED-Seq. (unten).
- 18 illustriert den Nachweis von ctDNA nach einem Zyklus der systemischen Therapie. 18A zeigt ein Streudiagramm, das die log-fache Veränderung in ctDNA nach einem Therapiezyklus (d. h. die Early Molecular Response (frühe molekulare Remission) oder EMR), gemessen mit CAPP-Seq. oder PhasED-Seq., für Patienten unter RCHOP-Therapie darstellt. Gepunktete Linien zeigen den zuvor festgelegten Schwellenwert einer 2-log-Reduktion in ctDNA für EMR. Nicht nachweisbare Proben fallen auf die Achsen; der Korrelationskoeffizient stellt einen Spearman Rho für die 45 Proben dar, die sowohl mit CAPP-Seq. als auch mit PhasED-Seq. nachgewiesen wurden. 18B zeigt 2-x-2-Tabellen, in denen die Nachweisrate von ctDNA-Proben nach 1 Therapiezyklus durch PhasED-Seq. gegenüber CAPP-Seq. zusammengefasst ist. Patienten mit einer eventuellen Krankheitsprogression sind in Rot dargestellt, während Patienten ohne eventuelle Krankheitsprogression in Blau dargestellt sind. 18C zeigt Balkendiagramme, die den Bereich unter der Empfänger-Operator-Kurve (AUC) für die Klassifizierung von Patienten für das ereignisfreie Überleben nach 24 Monaten basierend auf CAPP-Seq. (helle Farben) oder PhasED-Seq. (dunkle Farben) nach 1 Therapiezyklus darstellen. Sowohl die Klassifizierung aller Patienten (n=82, links) als auch die Klassifizierung der Patienten, die eine EMR erreichen (n=63, rechts), sind dargestellt. 18D zeigt Kaplan-Meier-Diagramme, die das ereignisfreie Überleben von 63 Patienten zeigen, die eine EMR erreicht haben, stratifiziert nach ctDNA-Nachweis mit CAPP-Seq. (oben) oder PhasED-Seq. (unten). 18D zeigt ein Wasserfalldiagramm, das die Veränderung der mit CAPP-Seq. gemessenen ctDNA-Werte nach 1 Zyklus der Erstlinientherapie bei Patienten mit DLBCL darstellt. Patienten mit nicht durch CAPP-Seq. nachweisbarer ctDNA sind als „ND“ (Not Detected, „nicht nachgewiesen“) in dunkleren Farben dargestellt. Die Farben der Balken zeigen auch die späteren klinischen Ergebnisse für diese Patienten an. 18F zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben für 33 DLBCL-Patienten mit nicht nachweisbarer ctDNA, gemessen durch CAPP-Seq. nach 1 Zyklus darstellt. 18G zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben von 33 in 18F gezeigten Patienten (durch CAPP-Seq. nicht nachweisbare ctDNA) stratifiziert nach ctDNA-Nachweis durch PhasED-Seq. zum gleichen Zeitpunkt (Zyklus 2, Tag 1) darstellt. 18H zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben für 82 Patienten mit DLBCL stratifiziert nach ctDNA bei Zyklus 2, Tag 1, unterteilt in 3 Schichten - Patienten, die keine frühe molekulare Remission erreichen, Patienten mit einer frühen molekularen Remission, die aber immer noch durch PhasED-Seq. und/oder CAPP-Seq. nachweisbare ctDNA haben, und Patienten, die eine stringente molekulare Remission haben (nicht durch PhasED-Seq. und CAPP-Seq. nachweisbare ctDNA;).
- 19 illustriert eine Anteil von Patienten, bei denen PhasED-Seq. eine niedrigere LOD als die Duplexsequenzierung, die SNV basierend auf PCAWG-Daten (Ganzgenomsequenzierung) verfolgt, erreichen würde, aus denen die Anzahl von SNV und Phasenvarianten (PVs) in verschiedenen Tumorarten quantifiziert wurde.
- 20 zeigt die bei Lungenkrebs (Adenokarzinom, abgekürzt ,A‘, und Plattenepithelkarzinom, abgekürzt ,S') erzielten verbesserten LODs im Vergleich zur Duplex-Sequenzierung von Ganzgenom-Sequenzierungsdaten.
- 21 illustriert empirische Daten aus einem Versuch, bei dem WGS an Tumorgewebe durchgeführt wurde und für 5 Patienten mit soliden Tumoren (5 Lungenkarzinome) benutzerdefinierte Panels bestimmt wurden, um die LODs der benutzerdefinierten CAPP-Seq. im Vergleich zu PhasED-Seq. zu untersuchen und zu vergleichen, wobei sich bei 5/5 Patienten eine ~ 10x niedrigere LOD unter Verwendung von PhasED-Seq. ergab.
- 22A zeigt ein Proof-of-Principle-Beispiel einer Patientenvignette, in der die Verwendung benutzerdefinierter CAPP-Seq. und PhasED-Seq. für die Krankheitsbeobachtung bei Lungenkrebs verglichen wird und den früheren Nachweis eines Rückfalls unter Verwendung von PhasED-Seq. zeigt.
- 22B zeigt ein Proof-of-Principle-Beispiel für eine Patientenvignette, in der die Verwendung benutzerdefinierter CAPP-Seq. und PhasED-Seq. für den frühen Nachweis von Krankheiten bei Brustkrebs verglichen wird und die den früheren Nachweis der Krankheit mit PhasED-Seq. zeigt.
- 23A-23B zeigen, dass das hier beschriebene Verfahren (z. B. das in 3E und 3F dargestellte Verfahren) keine barcodevermittelte Fehlerunterdrückung erfordert.
- 24 illustriert ein Ablaufdiagramm eines Prozesses zur Durchführung einer klinischen Intervention und/oder Behandlung eines Individuums basierend auf dem Nachweis von Nukleinsäuresequenzen eines zirkulierenden Tumors in einem Sequenzierungsergebnis gemäß einer Ausführungsform.
- 25A-25C zeigen beispielhafte Ablaufdiagramme von Verfahren zum Bestimmen einer Erkrankung eines Subjekts basierend auf einem oder mehreren zellfreien Nukleinsäuremolekülen, die eine Vielzahl von Varianten umfassen.
- 25D zeigt ein beispielhaftes Ablaufdiagramm eines Verfahrens zur Behandlung einer Erkrankung eines Subjekts, basierend auf einem oder mehreren zellfreien Nukleinsäuremolekülen, die eine Vielzahl von Varianten umfassen.
- 25E zeigt ein beispielhaftes Ablaufdiagramm eines Verfahrens zur Bestimmung des Verlaufs (z. B. Progression oder Regression) einer Erkrankung eines Subjekts basierend auf einem oder mehreren zellfreien Nukleinsäuremolekülen, die eine Vielzahl von Varianten umfassen.
- 25F und 25G zeigen beispielhafte Ablaufdiagramme von Verfahren zur Bestimmung der Erkrankung eines Subjekts basierend auf einem oder mehreren zellfreien Nukleinsäuremolekülen, die eine Vielzahl von Varianten umfassen.
- 26A und 26B illustrieren schematisch verschiedene Fluoreszenzsonden zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle, die eine Vielzahl von Phasenvarianten umfassen.
- 27 zeigt ein Computersystem, das zur Implementierung der hierin vorgesehenen Verfahren programmiert oder anderweitig konfiguriert ist.
-
DETAILBESCHREIBUNG
-
Obwohl hierin verschiedene Ausführungsformen der Erfindung gezeigt und beschrieben wurden, wird es für den Fachmann offensichtlich sein, dass diese Ausführungsformen nur als Beispiel dienen. Für den Fachmann sind zahlreiche Variationen, Änderungen und Substitutionen möglich, ohne von der Erfindung abzuweichen. Es versteht sich, dass verschiedene Alternativen zu den hierin beschriebenen Ausführungsformen der Erfindung verwendet werden können.
-
Der Begriff „etwa“ oder „ungefähr“ bedeutet im Allgemeinen innerhalb eines akzeptablen Fehlerbereichs für den jeweiligen Wert, der zum Teil davon abhängen kann, wie der Wert gemessen oder bestimmt wird, z. B. von den Einschränkungen des Messsystems. Beispielsweise kann „etwa“ gemäß der gängigen Fachpraxis innerhalb einer oder mehr als einer Standardabweichung bedeuten. Alternativ kann „etwa“ einen Bereich von bis zu 20 %, bis zu 10 %, bis zu 5 % oder bis zu 1 % eines gegebenen Wertes bedeuten. Alternativ, insbesondere in Bezug auf biologische Systeme oder Prozesse, kann der Begriff innerhalb einer Größenordnung, bevorzugt innerhalb des 5-fachen und noch bevorzugter innerhalb des 2-fachen, eines Wertes bedeuten. Wenn in der Anmeldung und den Ansprüchen bestimmte Werte beschrieben werden, kann, sofern nicht anders angegeben, davon ausgegangen werden, dass der Begriff „etwa“ innerhalb eines akzeptablen Fehlerbereichs für den jeweiligen Wert liegend bedeutet.
-
Der Begriff „Phasenvarianten“, „Varianten in Phase“, „PV“ oder „somatische Varianten in Phase“, wie er hierin austauschbar verwendet wird, bezieht sich im Allgemeinen auf zwei oder mehr Mutationen (z. B. SNV oder Indels), die in cis (d. h. auf demselben Strang eines Nukleinsäuremoleküls) innerhalb eines einzigen zellfreien Nukleinsäuremoleküls auftreten. In einigen Fällen kann ein zellfreies Nukleinsäuremolekül ein zellfreies Desoxyribonukleinsäuremolekül (cfDNA-Molekül) sein. In einigen Fällen kann ein cfDNA-Molekül aus einem erkrankten Gewebe, wie etwa einem Tumor, (z. B. ein zirkulierendes Tumor-DNA-(ctDNA-)Molekül) abgeleitet sein.
-
Der Begriff „biologische Probe“ oder „Körperprobe“, wie er hierin austauschbar verwendet wird, bezieht sich im Allgemeinen auf eine von einem Subjekt erlangte Gewebe- oder Flüssigkeitsprobe. Eine biologische Probe kann direkt vom Subjekt erlangt werden. Alternativ kann eine biologische Probe von dem Subjekt abgeleitet werden (z. B. durch Verarbeitung einer ersten biologischen Probe, die von dem Subjekt erlangt wurde). Die biologische Probe kann ein oder mehrere Nukleinsäuremoleküle sein oder enthalten, wie beispielsweise DNA- oder Ribonukleinsäure-(RNA-)Moleküle. Die biologische Probe kann von einem beliebigen Organ, Gewebe oder einer biologischen Flüssigkeit abgeleitet sein. Eine biologische Probe kann zum Beispiel eine Körperflüssigkeit oder eine feste Gewebeprobe umfassen. Ein Beispiel für eine solide Gewebeprobe ist eine Tumorprobe, z. B. aus einer Biopsie eines soliden Tumors. Nicht einschränkende Beispiele für Körperflüssigkeiten beinhalten Blut, Serum, Plasma, Tumorzellen, Speichel, Urin, Liquor, Lymphflüssigkeit, Prostataflüssigkeit, Samenflüssigkeit, Milch, Sputum, Stuhl, Tränen und Derivate davon. In einigen Fällen können ein oder mehrere zellfreie Nukleinsäuremoleküle, wie hierin offenbart, aus einer biologischen Probe abgeleitet sein.
-
Der Begriff „Subjekt“, wie er hierin verwendet wird, bezieht sich allgemein auf beliebige Tiere, Säugetiere oder Menschen. Ein Subjekt kann eine oder mehrere Erkrankungen haben, potenziell haben oder im Verdacht stehen, eine oder mehrere Erkrankungen zu haben, wie beispielsweise eine Erkrankung. In einigen Fällen kann eine Erkrankung des Subjekts Krebs, ein oder mehrere mit Krebs assoziierte(s) Symptom(e) oder asymptomatisch in Bezug auf Krebs oder nicht diagnostiziert (z. B. nicht mit Krebs diagnostiziert) sein. In einigen Fällen kann das Subjekt an Krebs erkrankt sein, das Subjekt kann ein oder mehrere mit Krebs assoziierte Symptome aufweisen, das Subjekt kann frei von mit Krebs assoziierten Symptomen sein, oder das Subjekt kann nicht mit Krebs diagnostiziert worden sein. In einigen Beispielen ist das Subjekt ein Mensch.
-
Der Begriff „zellfreie DNA“ oder „cfDNA“, wie er hierin austauschbar verwendet wird, bezieht sich im Allgemeinen auf DNA-Fragmente, die frei im Blutstrom eines Subjekts zirkulieren. Zellfreie DNA-Fragmente können einen dinukleosomalen Schutz (z. B. eine Fragmentgröße von wenigstens 240 Basenpaaren („bp““)) aufweisen. Diese cfDNA-Fragmente mit dinukleosomalem Schutz wurden wahrscheinlich nicht zwischen dem Nukleosom geschnitten, was zu einer längeren Fragmentlänge (z. B. mit einer typischen Größenverteilung zentriert um 334 bp) führt. Zellfreie DNA-Fragmente können einen mononukleosomalen Schutz (z .B. eine Fragmentgröße von weniger als 240 Basenpaaren („“bp“)) aufweisen. Diese cfDNA-Fragmente mit mononukleosomalem Schutz wurden wahrscheinlich zwischen dem Nukleosom geschnitten, was zu einer kürzeren Fragmentlänge (z. B. mit einer typischen Größenverteilung zentriert um 167 bp) führt.
-
Der Begriff „Sequenzierungsdaten“, wie er hierin verwendet wird, bezieht sich allgemein auf „Rohsequenzlesungen“ und/oder „Konsensussequenzen“ von Nukleinsäuren, wie beispielsweise zellfreie Nukleinsäuren oder Derivate davon. Rohsequenzlesungen sind die Ausgabe eines DNA-Sequenzers und enthalten in der Regel redundante Sequenzen desselben Ausgangsmoleküls, zum Beispiel nach Amplifikation. „Konsensussequenzen“ sind aus redundanten Sequenzen eines Ausgangsmoleküls abgeleitete Sequenzen, die die Sequenz des ursprünglichen Ausgangsmoleküls darstellen sollen. Konsensussequenzen können durch Abstimmung (wobei jedes Mehrheitsnukleotid, z. B. das am häufigsten beobachtete Nukleotid an einer gegebenen Basenposition unter den Sequenzen das Konsensusnukleotid ist) oder durch andere Ansätze wie etwa den Vergleich mit einem Referenzgenom erzeugt werden. In einigen Fällen können Konsensussequenzen durch Markierung der ursprünglichen Ausgangsmoleküle mit eindeutigen oder nicht eindeutigen molekularen Markierungen erzeugt werden, die eine Verfolgung der Nachfolgesequenzen (z. B. nach Amplifikation) durch Verfolgung der Markierung und/oder Verwendung interner Sequenzleseinformationen ermöglichen.
-
Der Begriff „Referenzgenomsequenz“, wie er hierin verwendet wird, bezieht sich allgemein auf eine Nukleotidsequenz, mit der die Nukleotidsequenzen eines Subjekts verglichen werden.
-
Der Begriff „Genombereich“, wie er hierin verwendet wird, bezieht sich allgemein auf einen beliebigen Bereich (z. B. einen Bereich von Basenpaarpositionen) eines Genoms, z. B. eines gesamten Genoms, eines Chromosoms, eines Gens oder eines Exons. Ein Genombereich kann ein zusammenhängender oder ein nicht zusammenhängender Bereich sein. Ein „genetischer Locus“ (oder „Locus“) kann ein Teil oder die Gesamtheit eines Genombereichs (z. B. eines Gens, eines Teils eines Gens oder eines einzelnen Nukleotids eines Gens) sein.
-
Der Begriff „Wahrscheinlichkeit“, wie er hierin verwendet wird, bezieht sich allgemein auf eine Wahrscheinlichkeit, eine relative Wahrscheinlichkeit, ein Vorhandensein oder ein Fehlen oder einen Grad.
-
Der Begriff „Flüssigbiopsie“, wie er hierin verwendet wird, bezieht sich allgemein auf einen nicht-invasiven oder minimal-invasiven Labortest oder ein Assay (z. B. einer biologischen Probe oder zellfreier Nukleinsäuren). Die „Flüssigbiopsie“-Assays können Nachweise oder Messungen (z. B. geringere Allelhäufigkeiten, Genexpression oder Proteinexpression) von einem oder mehreren Markergenen melden, die mit einer Erkrankung eines Subjekts (z. B. Krebs- oder Tumor-assoziierte Markergene) in Verbindung stehen.
-
A. Einführung
-
Modifikationen (z. B. Mutationen) der genomischen DNA können sich in der Entstehung und/oder dem Fortschreiten einer oder mehrerer Erkrankungen (z. B. einer Erkrankung, wie Krebs oder Tumor) eines Subjekts manifestieren. Die vorliegende Offenbarung sieht Verfahren und Systeme zur Analyse zellfreier Nukleinsäuremoleküle, wie cfDNA, von einem Subjekts zur Bestimmung des Vorhandenseins oder Nichtvorhandenseins einer Erkrankung des Subjekts, der Prognose einer diagnostizierten Erkrankung des Subjekts, des Fortschreitens der Erkrankung des Subjekts im Laufe der Zeit, der therapeutischen Behandlung einer diagnostizierten Erkrankung des Subjekts oder des vorhergesagten Behandlungsergebnisses für eine Erkrankung des Subjekts vor.
-
Die Analyse zellfreier Nukleinsäuren, wie etwa cfDNA, wurde mit breiten Anwendungsmöglichkeiten, wie z. B. für pränatale Tests, Organtransplantation, Infektionskrankheiten und Onkologie, entwickelt. Im Zusammenhang mit dem Nachweis oder der Überwachung einer Krankheit eines Subjekts, wie z. B. Krebs, kann die zirkulierende Tumor-DNA (ctDNA) bei zahlreichen Krebsarten ein empfindlicher und spezifischer Biomarker sein. In einigen Fällen kann ctDNA zum Nachweis einer minimalen Restkrankheit (MRD) oder der Tumorlast nach einer Behandlung, wie beispielsweise einer Chemotherapie oder einer chirurgischen Resektion von soliden Tumoren, verwendet werden. Die Nachweisgrenze (Limit of Detection, LOD) für die ctDNA-Analyse kann jedoch durch eine Reihe von Faktoren eingeschränkt werden, darunter (i) geringe Ausgangs-DNA-Mengen aus einer typischen Blutabnahme und (ii) Hintergrundfehlerraten bei der Sequenzierung.
-
In einigen Fällen kann der auf ctDNA basierende Krebsnachweis durch die Verfolgung multipler somatischer Mutationen mit fehlerunterdrückter Sequenzierung verbessert werden, z. B. mit einer LOD von etwa 2 Teilen in 100.000 aus dem cfDNA-Input bei Verwendung von handelsüblichen Panels oder personalisierten Assays. In einigen Fällen kann die derzeitige LOD der ctDNA von Interesse jedoch unzureichend für den universellen Nachweis von MRD bei Patienten sein, bei denen ein Rückfall oder ein Fortschreiten der Krankheit droht. Ein Beispiel für einen solchen ,Nachweisverlust` ist das diffuse großzellige B-Zell-Lymphom (DLBCL). Bei DLBCL kann der vorläufige Nachweis von ctDNA nach nur zwei Zyklen kurativer Therapie eine starke molekulare Remission (Major Molecular Response, MMR) darstellen und ein starker prognostischer Marker für das endgültige klinische Ergebnis sein. Trotzdem ist bei fast einem Drittel der Patienten, bei denen die Krankheit letztlich fortschreitet, die ctDNA zu diesem Zwischenzeitpunkt mit den verfügbaren Techniken (z. B. Personalisierte Krebsprofilierung durch Tiefensequenzierung ,(Cancer Personalized Profiling by Deep Sequencing, CAPP-Seq.)) nicht nachweisbar, was „falsch-negative“ Messungen bedeutet. Derart hohe falsch-negative Raten wurden bei DLBCL-Patienten auch bei alternativen Verfahren wie der Überwachung von ctDNA durch Immunglobulin-Gen-Umordnungen beobachtet. Daher besteht ein Bedarf an verbesserten Verfahren zum ctDNA-basierten Krebsnachweis mit höherer Empfindlichkeit.
-
Somatische Varianten, die auf beiden komplementären Strängen der Ausgangs-DNA-Duplexe nachgewiesen werden, können zur Senkung der LOD des ctDNA-Nachweises verwendet werden, wodurch sich die Sensitivität des ctDNA-Nachweises vorteilhaft erhöht. Eine solche Duplex-Sequenzierung‘ kann das Hintergrundfehlerprofil reduzieren, da für den Nachweis einer Einzelnukleotidvariante (SNV) zwei konkordante Ereignisse erforderlich sind. Der Ansatz der Duplex-Sequenzierung allein kann jedoch durch die ineffiziente Rückgewinnung von DNA-Duplexen eingeschränkt sein, da die Rückgewinnung beider Originalstränge nur bei einer Minderheit aller rückerlangten Moleküle auftreten kann. Daher kann die Duplex-Sequenzierung für den realen ctDNA-Nachweis mit einer begrenzten Menge an Ausgangsproben suboptimal und ineffizient sein, wobei die Ausgangs-DNA aus praktischen Blutvolumina (z. B. zwischen etwa 4.000 und etwa 8.000 Genomen pro standardmäßigem 10-Milliliter-Blutabnahmeröhrchen) begrenzt ist und eine maximale Rückgewinnung der Genome unerlässlich ist.
-
Daher besteht nach wie vor ein erheblicher ungedeckter Bedarf für den Nachweis und die Analyse von ctDNA mit niedriger LOD (z. B. mit hoher Sensitivität), um beispielsweise das Vorhandensein oder Nichtvorhandensein einer Krankheit bei einem Subjekt, die Prognose der Krankheit, die Behandlung der Krankheit und/oder das voraussichtliche Ergebnis der Behandlung zu bestimmen.
-
B. Verfahren und Systeme zur Bestimmung oder Überwachung einer Erkrankung
-
Die vorliegende Offenbarung beschreibt Verfahren und Systeme zum Nachweis und zur Analyse zellfreier Nukleinsäuren mit einer Vielzahl von Phasenvarianten als Merkmal einer Erkrankung eines Subjekts. In einigen Aspekten können die zellfreien Nukleinsäuremoleküle cfDNA-Moleküle, wie beispielsweise ctDNA-Moleküle, umfassen. Die hierin offenbaren Verfahren und Systeme können von einer Vielzahl zellfreier Nukleinsäuremoleküle des Subjekts abgeleitete Sequenzierungsdaten verwenden, um eine Teilmenge der Vielzahl zellfreier Nukleinsäuremoleküle mit der Vielzahl von Phasenvarianten zu identifizieren und dadurch die Erkrankung des Subjekts zu bestimmen. Die hierin offenbarten Verfahren und Systeme können eine solche Untergruppe der Vielzahl zellfreier Nukleinsäuremoleküle, die die Vielzahl von Phasenvarianten aufweisen, direkt nachweisen und in einigen Fällen herunterziehen (oder erfassen), um so die Erkrankung des Subjekts mit oder ohne Sequenzierung zu bestimmen. Die hierin offenbarten Verfahren und Systeme können die Hintergrundfehlerrate reduzieren, die häufig bei dem Nachweis und der Analyse zellfreier Nukleinsäuremoleküle, wie cfDNA, auftreten.
-
In einigen Aspekten sind Verfahren und Systeme für die zellfreie Nukleinsäure-Sequenzierung und den Nachweis von Krebs vorgesehen. In einigen Ausführungsformen können zellfreie Nukleinsäuren (z. B. cfDNA oder cfRNA) aus einer Flüssigbiopsie einer Person extrahiert und für die Sequenzierung vorbereitet werden. Die Sequenzierungsergebnisse der zellfreien Nukleinsäuren können zum Nachweis somatischer Varianten in Phase (d. h. Phasenvarianten, wie hierin offenbart) als Hinweis auf zirkulierende Nukleinsäure-Sequenzen (ctDNA oder ctRNA) (d. h. Sequenzen, die von Nukleinsäuren einer Krebszelle abgeleitet sind oder aus diesen stammen) analysiert werden. Dementsprechend kann in einigen Fällen bei der Person Krebs durch Entnahme einer Flüssigbiopsie der Person und Sequenzierung der aus dieser Flüssigbiopsie abgeleiteten zellfreien Nukleinsäuren zum Nachweis zirkulierender Tumor-Nukleinsäuresequenzen nachgewiesen werden, und das Vorhandensein zirkulierender Tumor-Nukleinsäuresequenzen kann indikativ sein, dass die Person einen Krebs (z. B. eine bestimmte Art von Krebs) hat. In einigen Fällen kann basierend auf dem Nachweis des Krebses ein klinischer Eingriff und/oder eine Behandlung für die Person bestimmt und/oder durchgeführt werden.
-
Wie hier offenbart, kann das Vorhandensein somatischer Phasenvarianten ein starkes Indiz dafür sein, dass die diese Phasenvarianten enthaltenden Nukleinsäuren aus einer Körperprobe mit einer Erkrankung, wie einer Krebszelle, stammen (oder alternativ, dass die Nukleinsäuren aus einer Körperprobe stammen, die von einem Subjekt mit einer Erkrankung, wie Krebs, erlangt oder abgeleitet wurde). Der Nachweis von somatischen Phasenvarianten kann das Signal-Rausch-Verhältnis von Verfahren zum Nachweis zellfreier Nukleinsäuren verbessern (z. B. durch die Reduzierung oder Eliminierung von störenden „Rauschsignalen“), da es unwahrscheinlich ist, dass Phasenmutationen innerhalb eines kleinen genetischen Fensters auftreten, das ungefähr der Größe eines typischen zellfreien Nukleinsäuremoleküls (z. B. etwa 170 bp oder weniger) entsprich.
-
In einigen Aspekten kann eine Anzahl von Genombereichen als Hotspots für den Nachweis von Phasenvarianten, insbesondere bei verschiedenen Krebsarten, z.B. Lymphomen, verwendet werden. In einigen Fällen können Enzyme (z. B. AID, Apobec3a) die DNA in bestimmten Genen und an bestimmten Stellen stereotyp mutieren, was zur Entwicklung bestimmter Krebsarten führt. Dementsprechend können aus solchen Hotspot-Genombereichen abgeleitete zellfreie Nukleinsäuren erfasst oder gezielt (z. B. mit oder ohne Tiefensequenzierung) für den Krebsnachweis und/oder die Überwachung eingesetzt werden. Alternativ kann die Erfassungs- oder gezielte Sequenzierung in Bereichen durchgeführt werden, in denen zuvor Phasenvarianten aus einer Krebsquelle (z. B. einem Tumor) einer bestimmten Person nachgewiesen wurden, um Krebs bei dieser Person nachzuweisen.
-
In einigen Fällen kann die Erfassungssequenzierung zellfreier Nukleinsäuren als Screening-Diagnose durchgeführt werden. In einigen Fällen kann eine Screening-Diagnose zum Nachweis zirkulierender Tumor-Nukleinsäuren für Krebsarten entwickelt und eingesetzt werden, die stereotypische Bereiche von Phasenvarianten aufweisen. In einigen Fällen wird die Erfassungssequenzierung zellfreier Nukleinsäuren als Diagnostikum zum Nachweis von MRD oder Tumorlast durchgeführt, um zu bestimmen, ob während oder nach der Behandlung eine bestimmte Krankheit vorliegt. In einigen Fällen kann die Erfassungssequenzierung zellfreier Nukleinsäuren als Diagnostikum zur Bestimmung des Verlaufs (z. B. Progression oder Regression) einer Behandlung durchgeführt werden.
-
In einigen Aspekten können die Ergebnisse der zellfreien Nukleinsäure-Sequenzierung zum Nachweis analysiert werden, ob phasensomatische Einzelnukleotidvarianten (SNV) oder anderer Mutationen oder Varianten (z. B. Indels) innerhalb der zellfreien Nukleinsäureprobe existieren. In einigen Fällen kann das Vorhandensein bestimmter somatischer SNV oder anderer Varianten indikativ für zirkulierende Tumor-Nukleinsäure-Sequenzen und damit indikativ für einen im Subjekt vorhandenen Tumor sein. In einigen Fällen können mindestens zwei Phasenvarianten in einem zellfreien Nukleinsäuremolekül nachgewiesen werden. In einigen Fällen können mindestens drei Phasenvarianten in einem zellfreien Nukleinsäuremolekül nachgewiesen werden. In einigen Fällen können mindestens vier Phasenvarianten in einem zellfreien Nukleinsäuremolekül nachgewiesen werden. In einigen Fällen können mindestens fünf oder mehr Phasenvarianten in einem zellfreien Nukleinsäuremolekül nachgewiesen werden. In einigen Fällen gilt: Je mehr Phasenvarianten auf einem zellfreien Nukleinsäuremolekül nachgewiesen werden, desto größer ist die Wahrscheinlichkeit, dass das zellfreie Nukleinsäuremolekül von Krebs abgeleitet ist, im Gegensatz zum Nachweis einer harmlosen Sequenz somatischer Varianten, die durch die molekulare Aufbereitung der Sequenzbibliothek oder zufällige biologische Fehler entstehen. Dementsprechend kann die Wahrscheinlichkeit eines falsch-positiven Nachweises mit dem Nachweis von mehr Phasenvarianten innerhalb eines Moleküls sinken (wodurch z. B. die Spezifität des Nachweises erhöht wird).
-
In einigen Aspekten kann ein Ergebnis der zellfreien Nukleinsäure-Sequenzierung zum Nachweis analysiert werden, ob eine Insertion oder Deletion einer oder mehrerer Nukleobasen (d. h. Indel) in der zellfreien Nukleinsäureprobe, z. B. relativ zu einer Referenzgenomsequenz, vorliegt. Ohne an die Theorie gebunden sein zu wollen, kann das Vorhandensein von Indels in einem zellfreien Nukleinsäuremolekül (z. B. cfDNA) in einigen Fällen indikativ für eine Erkrankung eines Subjekts, z. B. eine Erkrankung wie Krebs, sein. In einigen Fällen kann eine genetische Variation als Ergebnis eines Indels als eine Variante oder Mutation behandelt werden, und somit können zwei Indels als zwei Phasenvarianten behandelt werden, wie hierin offenbart. In einigen Beispielen können innerhalb eines zellfreien Nukleinsäuremoleküls eine erste genetische Variation aus einer ersten Indel (eine erste Phasenvariante) und eine zweite genetische Variation aus einer zweiten Indel (eine zweite Phasenvariante) durch wenigstens 1 Nukleotid voneinander getrennt sein.
-
Innerhalb eines einzelnen zellfreien Nukleinsäuremoleküls (z. B. eines einzelnen cfDNA-Moleküls), wie hierin offenbart, kann eine erste Phasenvariante eine SNV und eine zweite Phasenvariante ein Teil eines anderen kleinen Nukleotidpolymorphismus sein, z. B. eine andere SNV oder ein Teil einer Multi-Nukleotid-Variante (MNV). Eine Multi-Nukleotid-Variante kann ein Cluster aus zwei oder mehr (z. B. mindestens 2, 3, 4, 5 oder mehr) benachbarten Varianten sein, die innerhalb desselben Strangs des Nukleinsäuremoleküls existieren. In einigen Fällen können die erste Phasenvariante und die zweite Phasenvariante Teile derselben MNV innerhalb des einzelnen zellfreien Nukleinsäuremoleküls sein. In einigen Fällen können die erste Phasenvariante und die zweite Phasenvariante von zwei verschiedenen MNV innerhalb des einzelnen zellfreien Nukleinsäuremoleküls stammen.
-
In einigen Aspekten kann ein statistisches Verfahren zur Berechnung der Wahrscheinlichkeit verwendet werden, dass nachgewiesene Phasenvarianten von einem Krebs stammen und nicht zufällig oder künstlich (z. B. aufgrund von Probenvorbereitungs- oder Sequenzierungsfehlern) sind. In einigen Fällen kann ein Monte-Carlo-Probennahmeverfahren zur Bestimmung der Wahrscheinlichkeit verwendet werden, dass nachgewiesene Phasenvarianten von einem Krebs stammen und nicht zufällig oder künstlich sind.
-
Aspekte der vorliegenden Offenbarung ermöglichen die Identifizierung oder den Nachweis zellfreier Nukleinsäuren (z. B. cfDNA-Moleküle) mit einer Vielzahl von Phasenvarianten, z. B. aus einer Flüssigbiopsie eines Subjekts. In einigen Fällen können eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten direkt nebeneinander liegen (z. B. benachbarte SNV). In einigen Fällen können eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt sein. Der Abstand zwischen der ersten Phasenvariante und der zweiten Phasenvariante kann durch die Länge des zellfreien Nukleinsäuremoleküls begrenzt sein.
-
Innerhalb eines einzelnen zellfreien Nukleinsäuremoleküls (z. B. eines einzelnen cfDNA-Moleküls), wie hierin offenbart, können eine erste Phasenvariante und eine zweite Phasenvariante durch wenigstens oder bis zu etwa 1 Nukleotid, wenigstens oder bis zu etwa 2 Nukleotide, wenigstens oder bis zu etwa 3 Nukleotide, wenigstens oder bis zu etwa 4 Nukleotide, wenigstens oder bis zu etwa 5 Nukleotide, wenigstens oder bis zu etwa 6 Nukleotide, wenigstens oder bis zu etwa 7 Nukleotide, wenigstens oder bis zu etwa 8 Nukleotide, wenigstens oder bis zu etwa 9 Nukleotide, wenigstens oder bis zu etwa 10 Nukleotide, wenigstens oder bis zu etwa 11 Nukleotide, wenigstens oder bis zu etwa 12 Nukleotide, wenigstens oder bis zu etwa 13 Nukleotide, wenigstens oder bis zu etwa 14 Nukleotide, wenigstens oder bis zu etwa 15 Nukleotide, wenigstens oder bis zu etwa 20 Nukleotide, wenigstens oder bis zu etwa 25 Nukleotide, wenigstens oder bis zu etwa 30 Nukleotide, wenigstens oder bis zu etwa 35 Nukleotide, wenigstens oder bis zu etwa 40 Nukleotide, wenigstens oder bis zu etwa 45 Nukleotide, wenigstens oder bis zu etwa 50 Nukleotide, wenigstens oder bis zu etwa 60 Nukleotide, wenigstens oder bis zu etwa 70 Nukleotide, wenigstens oder bis zu etwa 80 Nukleotide, wenigstens oder bis zu etwa 90 Nukleotide, wenigstens oder bis zu etwa 100 Nukleotide, wenigstens oder bis zu etwa 110 Nukleotide, wenigstens oder bis zu etwa 120 Nukleotide, wenigstens oder bis zu etwa 130 Nukleotide, wenigstens oder bis zu etwa 140 Nukleotide, wenigstens oder bis zu etwa 150 Nukleotide, wenigstens oder bis zu etwa 160 Nukleotide, wenigstens oder bis zu etwa 170 Nukleotide, oder wenigstens oder bis zu etwa 180 Nukleotide voneinander getrennt sein. Alternativ oder zusätzlich dazu können oder müssen innerhalb eines einzigen zellfreien Nukleinsäuremoleküls eine erste Phasenvariante und eine zweite Phasenvariante nicht durch ein oder mehrere Nukleotide getrennt sein und können somit direkt nebeneinander liegen.
-
Ein einzelnes zellfreies Nukleinsäuremolekül (z. B, ein einzelnes cfDNA-Molekül), wie hierin offenbart, kann wenigstens oder bis zu etwa 2 Phasenvarianten, wenigstens oder bis zu etwa 3 Phasenvarianten, wenigstens oder bis zu etwa 4 Phasenvarianten, wenigstens oder bis zu etwa 5 Phasenvarianten, wenigstens oder bis zu etwa 6 Phasenvarianten, wenigstens oder bis zu etwa 7 Phasenvarianten, wenigstens oder bis zu etwa 8 Phasenvarianten, wenigstens oder bis zu etwa 9 Phasenvarianten, wenigstens oder bis zu etwa 10 Phasenvarianten, wenigstens oder bis zu etwa 12 Phasenvarianten, wenigstens oder bis zu etwa 12 Phasenvarianten, wenigstens oder bis zu etwa 13 Phasenvarianten, wenigstens oder bis zu etwa 14 Phasenvarianten, wenigstens oder bis zu etwa 15 Phasenvarianten, wenigstens oder bis zu etwa 20 Phasenvarianten, oder wenigstens oder bis zu etwa 25 Phasenvarianten innerhalb desselben Moleküls umfassen.
-
Aus einer Vielzahl von (z. B. aus einer Flüssigbiopsie eines Subjekts) erlangten zellfreien Nukleinsäuremolekülen können zwei oder mehr (z. B. 10 oder mehr, 1.000 oder mehr, 10.000 oder mehr) zellfreie Nukleinsäuremoleküle als im Durchschnitt wenigstens oder bis zu etwa 2 Phasenvarianten, wenigstens oder bis zu etwa 3 Phasenvarianten, wenigstens oder bis zu etwa 4 Phasenvarianten, wenigstens oder bis zu etwa 5 Phasenvarianten, wenigstens oder bis zu etwa 6 Phasenvarianten, wenigstens oder bis zu etwa 7 Phasenvarianten, wenigstens oder bis zu etwa 8 Phasenvarianten, wenigstens oder bis zu etwa 9 Phasenvarianten, wenigsten oder bis zu etwa 10 Phasenvarianten, wenigstens oder bis zu etwa 12 Phasenvarianten, wenigstens oder bis zu etwa 12 Phasenvarianten, wenigstens oder bis zu etwa 13 Phasenvarianten, wenigstens oder bis zu etwa 14 Phasenvarianten, wenigstens oder bis zu etwa 15 Phasenvarianten, wenigstens oder bis zu etwa 20 Phasenvarianten oder wenigstens oder bis zu etwa 25 Phasenvarianten pro zellfreiem Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten identifiziert wurde, aufweisend identifiziert werden.
-
In einigen Fällen kann eine Vielzahl zellfreier Nukleinsäuremoleküle (z. B. cfDNA-Moleküle) aus einer biologischen Probe eines Subjekts (z. B. eines soliden Tumors oder einer Flüssigbiopsie) erlangt werden. Aus der Vielzahl zellfreier Nukleinsäuremoleküle können wenigstens oder bis zu 1, wenigstens oder bis zu 2, wenigstens oder bis zu 3, wenigstens oder bis zu 4, wenigstens oder bis zu 5, wenigstens oder bis zu 6, wenigstens oder bis zu 7, wenigstens oder bis zu 8, wenigstens oder bis zu 9, wenigstens oder bis zu 10, wenigstens oder bis zu 15, wenigstens oder bis zu 20, wenigstens oder bis zu 25, wenigstens oder bis zu 30, wenigstens oder bis zu 35, wenigstens oder bis zu 40, wenigstens oder bis zu 45, wenigstens oder bis zu 50, wenigstens oder bis zu 60, wenigstens oder bis zu 70, wenigstens oder bis zu 80, wenigstens oder bis zu 90, wenigstens oder bis zu 100, wenigstens oder bis zu 150, wenigstens oder bis zu 200, wenigstens oder bis zu 300, wenigstens oder bis zu 400, wenigstens oder bis zu 500, wenigstens oder bis zu 600, wenigstens oder bis zu 700, wenigstens oder bis zu 800, wenigstens oder bis zu 900, wenigstens oder bis zu 1.000, wenigstens oder bis zu 5.000, wenigstens oder bis zu 10.000, wenigstens oder bis zu 50.000 oder wenigstens oder bis zu 100.000 zellfreie Nukleinsäuremoleküle identifiziert werden, sodass jedes identifizierte zellfreie Nukleinsäuremolekül die Vielzahl von Phasenvarianten umfasst, wie hierin offenbart.
-
In einigen Fällen kann eine Vielzahl zellfreier Nukleinsäuremoleküle (z. B. cfDNA-Moleküle) aus einer biologischen Probe eines Subjekts (z. B. eines soliden Tumors oder einer Flüssigbiopsie) erlangt werden. Aus der Vielzahl zellfreier Nukleinsäuremoleküle können wenigstens oder bis zu 1, wenigstens oder bis zu 2, wenigstens oder bis zu 3, wenigstens oder bis zu 4, wenigstens oder bis zu 5, wenigstens oder bis zu 6, wenigstens oder bis zu 7, wenigstens oder bis zu 8, wenigstens oder bis zu 9, wenigstens oder bis zu 10, wenigstens oder bis zu 15, wenigstens oder bis zu 20, wenigstens oder bis zu 25, wenigstens oder bis zu 30, wenigstens oder bis zu 35, wenigstens oder bis zu 40, wenigstens oder bis zu 45, wenigstens oder bis zu 50, wenigstens oder bis zu 60, wenigstens oder bis zu 70, wenigstens oder bis zu 80, wenigstens oder bis zu 90, wenigstens oder bis zu 100, wenigstens oder bis zu 150, wenigstens oder bis zu 200, wenigstens oder bis zu 300, wenigstens oder bis zu 400, wenigstens oder bis zu 500, wenigstens oder bis zu 600, wenigstens oder bis zu 700, wenigstens oder bis zu 800, wenigstens oder bis zu 900 oder wenigstens oder bis zu 1.000 zellfreie Nukleinsäuremoleküle aus einem Ziel-Genombereich (z. B. einem genomischen Ziellocus) identifiziert werden, sodass jedes identifizierte zellfreie Nukleinsäuremolekül die Vielzahl von Phasenvarianten umfasst, wie hierin offenbart.
-
1A und 1E illustrieren schematisch Beispiele für (i) ein cfDNA-Molekül mit einer SNV und (ii) ein anderes cfDNA-Molekül mit einer Vielzahl von Phasenvarianten. Jede in der cfDNA identifizierte Variante kann auf das Vorhandensein einer weiteren genetischen Mutation in der Zelle hinweisen, aus der die cfNDA stammt. In alternativen Ausführungsformen kann es sich bei einer oder mehreren der Phasenvarianten um eine Insertion oder Deletion (Indel) anstelle einer SNV handeln.
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Bestimmung einer Erkrankung eines Subjekt vor, wie dargestellt im Ablaufdiagramm 2510 in 25A. Das Verfahren kann umfassen: (a) Gewinnung von Sequenzierungsdaten, die von einer Vielzahl von von dem Subjekt erlangten oder abgeleiteten zellfreien Nukleinsäuremolekülen abgeleitet sind, durch ein Computersystem (Prozess 2512). Das Verfahren kann ferner (b) die Verarbeitung der Sequenzierungsdaten durch das Computersystem zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle umfassen, wobei jedes der einen oder mehreren identifizierten zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst (Verfahren 2514). In einigen Fällen kann wenigstens ein Teil der ein oder mehreren zellfreien Nukleinsäuremoleküle eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten umfassen, die durch wenigstens ein Nukleotid getrennt sind, wie hierin offenbart. Das Verfahren kann optional (c) die Analyse wenigstens eines Teils der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle durch das Computersystem zur Bestimmung der Erkrankung des Subjekts umfassen (Prozess 2516).
-
In einigen Fällen können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 %, wenigstens oder bis zu etwa 50 %, wenigstens oder bis zu etwa 60 %, wenigstens oder bis zu etwa 70 %, wenigstens oder bis zu etwa 80 %, wenigstens oder bis zu etwa 90 %, wenigstens oder bis zu etwa 95 %, wenigstens oder bis zu etwa 99 % oder etwa 100 % des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten umfassen, die durch wenigstens ein Nukleotid getrennt sind, wie hierin offenbart. In einigen Beispielen kann eine Vielzahl von Phasenvarianten innerhalb eines einzelnen cfDNA-Moleküls (i) eine erste Vielzahl von Phasenvarianten, die durch wenigstens ein Nukleotid voneinander getrennt sind, und (ii) eine zweite Vielzahl von Phasenvarianten, die nebeneinander liegen (z. B. zwei Phasenvarianten innerhalb einer MNV), umfassen. In einigen Beispielen kann eine Vielzahl von Phasenvarianten innerhalb eines einzelnen cfDNA-Moleküls aus Phasenvarianten bestehen, die durch wenigstens ein Nukleotid voneinander getrennt sind.
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Bestimmung einer Erkrankung eines Subjekts vor, wie dargestellt im Ablaufdiagramm 2520 in 25B. Das Verfahren kann umfassen: (a) Gewinnung von Sequenzierungsdaten, die von einer Vielzahl von von einem Subjekt erlangten oder abgeleiteten zellfreien Nukleinsäuremolekülen abgeleitet sind, durch ein Computersystem (Prozess 2522). Das Verfahren kann ferner (b) die Verarbeitung der Sequenzierungsdaten durch das Computersystem zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle umfassen, wobei jedes der einen oder mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst (Verfahren 2524). In einigen Fällen kann eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt sein, wie hierin offenbart. Das Verfahren kann optional (c) die Analyse wenigstens eines Teils der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle durch das Computersystem zur Bestimmung der Erkrankung des Subjekts umfassen (Prozess 2526).
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Bestimmung einer Erkrankung eines Subjekts vor, wie im Ablaufdiagramm 2530 in 25C dargestellt. Das Verfahren kann (a) Gewinnung von Sequenzierungsdaten, die von einer Vielzahl von von dem Subjekt erlangten oder abgeleiteten zellfreien Nukleinsäuremolekülen abgeleitet sind, durch ein Computersystem umfassen (Prozess 2532). Das Verfahren kann ferner (b) die Verarbeitung der Sequenzierungsdaten zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle mit einer LOD von weniger als etwa 1 aus 50.000 Beobachtungen (oder zellfreien Nukleinsäuremolekülen) aus den Sequenzierungsdaten umfassen (Prozess 2534). In einigen Fällen umfasst jedes der ein oder mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz. Das Verfahren kann optional (c) die Analyse wenigstens eines Teils der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle zur Bestimmung der Erkrankung des Subjekts umfassen (Prozess 2536).
-
In einigen Fällen kann die LOD des Vorgangs der Identifizierung des einen oder der mehreren zellfreien Nukleinsäuremoleküle, wie hierin offenbart, weniger als etwa 1 aus 60.000, weniger als 1 aus 70.000, weniger als 10 aus 80.000, weniger als 1 aus 90.000, weniger als 1 aus 100.000, weniger als 1 aus 150.000, weniger als 1 aus 200.000, weniger als 1 aus 300.000, weniger als 1 aus 400.000, weniger als 1 aus 500.000, weniger als 1 aus 600.000, weniger als 1 aus 700.000, weniger als 1 aus 800.000, weniger als 1 aus 900.000, weniger als 1 aus 1.000.000, weniger als 1 aus 1.000.000, weniger als 1 aus 1.100.000, weniger als 1 aus 1.200.000, weniger als 1 aus 1.300.000, weniger als 1 aus 1.400.000, weniger als 1 aus 1.500.000 oder weniger als 1 aus 2.000.000 Beobachtungen aus den Sequenzierungsdaten betragen.
-
In einigen Fällen kann wenigstens ein zellfreies Nukleinsäuremolekül der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten umfassen, die durch wenigstens ein Nukleotid getrennt sind, wie hierin offenbart.
-
In einigen Fällen können eine oder mehrere der Vorgänge (a) bis (c) des gegenständlichen Verfahrens von einem Computersystem durchgeführt werden. In einem Beispiel können alle Vorgänge (a) bis (c) des gegenständlichen Verfahrens durch das Computersystem ausgeführt werden.
-
Die Sequenzierungsdaten, wie sie hierin offenbart sind, können aus einem oder mehreren Sequenzierungsverfahren erlangt werden. Ein Sequenzierverfahren kann ein First-Generation-Sequenzierverfahren (z. B. Maxam-Gilbert-Sequenzierung, Sanger-Sequenzierung) sein. Ein Sequenzierungsverfahren kann ein Hochdurchsatz-Sequenzierungsverfahren sein, wie etwa die Next-Generation-Sequenzierung (NGS) (z. B. Sequenzierung durch Synthese). Ein Hochdurchsatz-Sequenzierungsverfahren kann gleichzeitig (oder im Wesentlichen gleichzeitig) wenigstens etwa 10.000, wenigstens etwa 100.000, wenigstens etwa 1 Million, wenigstens etwa 10 Millionen, wenigstens etwa 100 Millionen, wenigstens etwa 1 Milliarde oder mehr Polynukleotidmoleküle (z. B. zellfreie Nukleinsäuremoleküle oder Derivate davon) sequenzieren. NGS kann eine beliebige Anzahl von Sequenzierungstechnologien (z. B. Sequenzierungstechnologien der zweiten Generation, Sequenzierungstechnologien der dritten Generation, Sequenzierungstechnologien der vierten Generation, usw.) sein. Nicht einschränkende Beispiele für Hochdurchsatz-Sequenzierungsverfahren beinhalten die massiv-parallele Signatursequenzierung, die Polony-Sequenzierung, die Pyrosequenzierung, die Sequenzierung durch Synthese, die kombinatorische Sondenanker-Synthese (cPAS), die Sequenzierung durch Ligation (z. B., Sequenzierung durch Oligonukleotid-Ligation und Nachweis (SOLiD)), Halbleiter-Sequenzierung (z.B. Ion Torrent Halbleiter-Sequenzierung), DNA-Nanoball-Sequenzierung und Einzelmolekül-Sequenzierung, Sequenzierung durch Hybridisierung.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können die Sequenzierungsdaten basierend auf einem beliebigen der offenbarten Sequenzierungsverfahren, das eine Nukleinsäure-Amplifikation (z. B. Polymerase-Kettenreaktion (PCR)) verwendet, erlangt werden. Nicht einschränkende Beispiele für solche Sequenzierungsverfahren können die 454-Pyrosequenzierung, die Polony-Sequenzierung und die SoLiD-Sequenzierung beinhalten. In einigen Fällen können Amplikons (z. B. Derivate der Vielzahl zellfreier Nukleinsäuremoleküle, die, wie hierin offenbart, von dem Subjekt erlangt oder abgeleitet wurden), die einem Genombereich von Interesse (z. B. einem mit einer Krankheit assoziierten Genombereich) entsprechen, durch PCR erzeugt, optional gepoolt und anschließend sequenziert werden, um Sequenzierungsdaten zu erzeugen. Da die Bereiche von Interesse vor der Sequenzierung durch PCR zu Amplikons amplifiziert werden, ist die Nukleinsäureprobe in einigen Beispielen bereits für den Bereich von Interesse angereichert, so dass ein beliebiges zusätzliches Pooling (z. B. Hybridisierung) vor der Sequenzierung (z. B. nichthybridisierungsbasiertes NGS) nicht erforderlich ist. Alternativ kann ein Pooling durch Hybridisierung zur zusätzlichen Anreicherung vor der Sequenzierung durchgeführt werden. Alternativ können die Sequenzierungsdaten auch ohne Erzeugung von PCR-Kopien, z. B. durch cPAS-Sequenzierung, erlangt werden.
-
Eine Reihe von Ausführungsformen verwenden Erfassungshybridisierungstechniken zur Durchführung einer gezielten Sequenzierung. Zur Verbesserung der Auflösung bestimmter genomischer Loci können bei der Durchführung von Sequenzierungen mit zellfreien Nukleinsäuren die Produkte der Bibliothek vor der Sequenzierung durch Hybridisierung erfasst werden. Die Capture-Hybridisierung kann besonders nützlich bei dem Versuch des Nachweises seltener und/oder somatischer Phasenvarianten in einer Probe an bestimmten genomischen Loci sein. In einigen Situationen ist der Nachweis seltener und/oder somatischer Phasenvarianten indikativ für die Quelle der Nukleinsäuren, einschließlich der von einer Krebsquelle abgeleiteten Nukleinsäuren. Dementsprechend ist die Capture-Hybridisierung ein Werkzeug, das den Nachweis von zirkulierende Tumor-Nukleinsäure innerhalb zellfreier Nukleinsäuren verbessern kann.
-
Bei verschiedenen Krebsarten kommt es immer wieder zu einer aberranten somatischen Hypermutation an bestimmten genomischen Loci. Beispielsweise induziert die enzymaktivierungsinduzierte Deaminase eine aberrante somatische Hypermutation in B-Zellen, die zu verschiedenen B-Zell-Lymphomen, einschließlich (aber nicht beschränkt auf) das diffuse großzellige B-Zell-Lymphom (DLBCL), das follikuläre Lymphom (FL), das Burkitt-Lymphom (BL) und die chronische lymphatische B-Zell-Leukämie (CLL), führt. Dementsprechend sind in zahlreichen Ausführungsformen die Sonden zum Herunterziehen (Pull-Down) (oder zur Erfassung) genomischer Loci gestaltet, von denen bekannt ist, dass sie in einem Lymphom eine aberrante somatische Hypermutation aufweisen. 1D und Tabelle 1 beschreiben eine Reihe von Bereichen, die bei DLBCL, FL, BL und CLL eine aberrante somatische Hypermutation aufweisen. In Tabelle 6 ist eine Liste von Nukleinsäuresonden aufgeführt, die zum Herunterziehen (Pull-Down) (oder zur Erfassung) genomischer Loci verwendet werden können, um eine aberrante somatische Hypermutation bei B-Zell-Krebs nachzuweisen.
-
Die Erfassungssequenzierung kann auch unter Verwendung personalisierter Nukleinsäuresonden durchgeführt werden, die für den Nachweis der Krebserkrankung einer Person gestaltet wurden. Eine an Krebs erkrankte Person kann ihren Krebs biopsieren und sequenzieren lassen, um somatische Phasenvarianten nachzuweisen, die sich im Krebs angesammelt haben. Basierend auf dem Sequenzierungsergebnis werden gemäß einer Reihe von Ausführungsformen Nukleinsäuresonden gestaltet und synthetisiert, die zum Herunterziehen der genomischen Loci, einschließlich der Positionen der Phasenvarianten, geeignet sind. Diese personalisierten gestalteten und synthetisierten Nukleinsäuresonden können für den Nachweis von zirkulierenden Tumor-Nukleinsäuren aus einer Flüssigbiopsie des betreffenden Individuums verwendet werden. Dementsprechend können die personalisierten Nukleinsäuresonden für die Bestimmung des Therapieansprechens und/oder den Nachweis von MRD nach der Behandlung nützlich sein.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können die Sequenzierungsdaten basierend auf einem beliebigen, Adapter verwendenden Sequenzierungsverfahren erlangt werden. Nukleinsäureproben (z. B. die Vielzahl zellfreier Nukleinsäuremoleküle des Subjekts, wie hierin offenbart) können mit einem oder mehreren Adaptern (oder Adaptersequenzen) zur Erkennung (z. B. durch Hybridisierung) der Probe oder beliebiger Derivate davon (z. B. Amplikons) konjugiert werden. In einigen Beispielen können die Nukleinsäureproben mit einem molekularen Barcode markiert werden, sodass jedes zellfreie Nukleinsäuremolekül der Vielzahl zellfreier Nukleinsäuremoleküle einen eindeutigen Barcode aufweisen kann. Alternativ oder zusätzlich können die Nukleinsäureproben mit einem Probenbarcode markiert werden, sodass z. B. die Vielzahl zellfreier Nukleinsäuremoleküle des Subjekts (z. B. eine Vielzahl zellfreier Nukleinsäuremoleküle, die aus einem bestimmten Körpergewebe des Subjekts erlangt wurden) denselben Barcode aufweisen können.
-
In alternativen Ausführungsformen können die hierin offenbarten Verfahren zur Identifizierung eines oder mehrerer, die Vielzahl von Phasenvarianten umfassender zellfreier Nukleinsäuremoleküle ohne molekulare Barcodierung, ohne Probenbarcodierung oder ohne molekulare Barcodierung und Probenbarcodierung durchgeführt werden, zumindest teilweise aufgrund der hohen Spezifität und der niedrigen LOD, die durch das Vertrauen auf die Identifizierung der Phasenvarianten im Gegensatz z. B. zu einer einzelnen SNV erreicht wird.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können die Sequenzierungsdaten ohne In silico-Entfernung oder -Unterdrückung von (i) Hintergrundfehlern und/oder (ii) Sequenzierungsfehlern erlangt und analysiert werden, was wenigstens teilweise auf die hohe Spezifität und die niedrige LOD, die durch das Vertrauen auf die Identifizierung der Phasenvarianten im Gegensatz zu z. B. einer einzelnen SNV oder Indel erreicht wird, zurückzuführen ist.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Verwendung der Vielzahl von Varianten als Bedingung für die Identifizierung gezielter zellfreier Nukleinsäuremoleküle mit spezifischen Mutationen von Interesse ohne In silico-Verfahren zur Fehlerunterdrückung eine Hintergrundfehlerrate ergeben, m wenigstens etwa das 5-fache, wenigstens etwa das 10-fache, wenigstens etwa das 20-fache, wenigstens etwa das 30-fache, wenigstens etwa das 40-fache, wenigstens etwa das 50-fache, wenigstens etwa das 60-fache, wenigstens etwa das 70-fache, wenigstens etwa das 80-fache, wenigstens etwa das 90-fache, wenigstens etwa das 100-fache, wenigstens etwa das 200-fache, wenigstens etwa das 400-fache, wenigstens etwa das 600-fache, wenigstens etwa das 800-fache oder wenigstens etwa das 1.000-fache niedriger ist als die der (i) Barcode-Deduplikation, (ii) integrierten digitalen Fehlerunterdrückung oder (iii) Duplex-Sequenzierung, Dieser Ansatz kann vorteilhaft das Signal-Rausch-Verhältnis (und damit die Sensitivität und/oder Spezifität) bei der Identifizierung gezielter zellfreier Nukleinsäuremoleküle mit bestimmten Mutationen von Interesse erhöhen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Erhöhung einer Mindestanzahl von Phasenvarianten (z. B. Erhöhung von wenigstens zwei Phasenvarianten auf wenigstens drei Phasenvarianten) pro zellfreiem Nukleinsäuremolekül, die als Bedingung für die Identifizierung zellfreier Nukleinsäuremoleküle mit spezifischen Mutationen von Interesse erforderlich ist, die Hintergrundfehlerrate um wenigstens etwa das 5-Fache, um wenigstens das 10-fache, um wenigstens das 20-fache, um wenigstens das 30-fache, um wenigstens das 40-fache, um wenigstens das 50-fache, um wenigstens das 60-fache, um wenigstens das 70-fache, um wenigstens das 80-fache, um wenigstens das 90-fache oder um wenigstens das 100-fache reduzieren. Dieser Ansatz kann vorteilhaft das Signal-Rausch-Verhältnis (und damit die Sensitivität und/oder Spezifität) bei der Identifizierung gezielter zellfreier Nukleinsäuremoleküle mit bestimmten Mutationen von Interesse erhöhen.
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Behandlung einer Erkrankung eines Subjekts vor, wie im Ablaufdiagramm 2540 in 25D dargestellt. Das Verfahren kann (a) die Identifizierung des Subjekts für die Behandlung der Erkrankung umfassen, wobei das Subjekt basierend auf der Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus einer Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet wurden, als an der Erkrankung leidend bestimmt wurde (Prozess 2542). Jedes des oder der identifizierten zellfreien Nukleinsäuremoleküle kann eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfassen. Wenigstens ein Teil (z. B. ein Teil oder alle) der Vielzahl von Phasenvarianten kann durch wenigstens ein Nukleotid getrennt sein, so dass eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt sind, wie hierin offenbart. In einigen Fällen ist ein Vorhandensein der Vielzahl von Phasenvarianten indikativ für die Erkrankung (z. B. eine Erkrankung, wie Krebs) des Subjekts. Das Verfahren kann ferner umfassen: (b) Unterziehen des Subjekts der Behandlung basierend auf Schritt (a) (Prozess 2544). Beispiele für eine solche Behandlung der Erkrankung des Subjekts sind an anderer Stelle in der vorliegenden Offenbarung offenbart.
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Überwachung eines Verlaufs (z. B. Progression oder Regression) einer Erkrankung eines Subjekts vor, wie in Ablaufdiagramm 2550 in 25E dargestellt. Das Verfahren kann (a) die Bestimmung eines ersten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines ersten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer ersten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden, umfassen (Prozess 2552). Das Verfahren kann ferner (b) die Bestimmung eines zweiten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines zweiten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer zweiten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden, umfassen (Prozess 2554). Die zweite Vielzahl von zellfreien Nukleinsäuremolekülen kann von dem Subjekt im Anschluss an die Gewinnung der ersten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt werden. Das Verfahren kann optional (c) die Bestimmung des Verlaufs (z. B. Progression oder Regression) der Erkrankung basierend zumindest teilweise auf dem ersten Stadium der Erkrankung und dem zweiten Stadium der Erkrankung umfassen (Prozess 2556). In einigen Fällen kann jedes des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle (z. B. jedes des ersten Satzes eines oder mehrerer identifizierter zellfreier Nukleinsäuremoleküle, jedes des zweiten Satzes eines oder mehrerer identifizierter zellfreier Nukleinsäuremoleküle) eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfassen. Wenigstens ein Teil (z. B. ein Teil oder alle) des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle kann, wie hierin offenbart, durch wenigstens ein Nukleotid getrennt sein. In einigen Fällen kann ein Vorhandensein der Vielzahl von Phasenvarianten indikativ für das Stadium der Erkrankung des Subjekts sein
-
In einigen Fällen kann die erste Vielzahl zellfreier Nukleinsäuremoleküle von dem Subjekt erlangt (z. B. durch eine Blutbiopsie) und analysiert werden, um ein erstes Stadium der Erkrankung (z. B. eine Erkrankung, wie Krebs) des Subjekts zu bestimmen (z. B. zu diagnostizieren). Die erste Vielzahl zellfreier Nukleinsäuremoleküle kann mit einem beliebigen der hierin offenbarten Verfahren (z. B. mit oder ohne Sequenzierung) analysiert werden, um den ersten Satz eines oder mehrerer die Vielzahl von Phasenvarianten umfassender zellfreier Nukleinsäuremoleküle zu identifizieren, und das Vorhandensein oder die Merkmale des ersten Satzes eines oder mehrerer zellfreier Nukleinsäuremoleküle können zur Bestimmung des ersten Stadiums der Erkrankung (z. B. einer ersten Diagnose) des Subjekts verwendet werden. Basierend auf dem ermittelten ersten Stadium der Erkrankung kann der Proband einer oder mehreren Behandlungen (z. B. Chemotherapie) unterzogen werden, wie hierin offenbart. Im Anschluss an die eine oder die mehreren Behandlungen kann die zweite Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt werden.
-
In einigen Fällen kann der Proband wenigstens oder bis zu etwa 1 Behandlung, wenigstens oder bis zu etwa 2 Behandlungen, wenigstens oder bis zu etwa 3 Behandlungen, wenigstens oder bis zu etwa 4 Behandlungen, wenigstens oder bis zu etwa 5 Behandlungen, wenigstens oder bis zu etwa 6 Behandlungen, wenigstens oder bis zu etwa 7 Behandlungen, wenigstens oder bis zu etwa 8 Behandlungen, wenigstens oder bis zu etwa 9 Behandlungen oder wenigstens oder bis zu etwa 10 Behandlungen basierend auf dem ermittelten ersten Stadium der Erkrankung unterzogen werden. In einigen Fällen kann der Proband basierend auf dem ermittelten ersten Stadium der Erkrankung einer Vielzahl von Behandlungen unterzogen werden, und eine erste Behandlung der Vielzahl von Behandlungen und eine zweite Behandlung der Vielzahl von Behandlungen können um wenigstens oder bis zu etwa 1 Tag, wenigstens oder bis zu etwa 7 Tage, wenigstens oder bis zu etwa 2 Wochen, wenigstens oder bis zu etwa 3 Wochen, wenigstens oder bis zu etwa 4 Wochen, wenigstens oder bis zu etwa 2 Monate, wenigstens oder bis zu etwa 3 Monate, wenigstens oder bis zu etwa 4 Monate, wenigstens oder bis zu etwa 5 Monate, wenigstens oder bis zu etwa 6 Monate, wenigstens oder bis zu etwa 12 Monate, wenigstens oder bis zu etwa 2 Jahre, wenigstens oder bis zu etwa 3 Jahre, wenigstens oder bis zu etwa 4 Jahre, wenigstens oder bis zu etwa 5 Jahre, oder wenigstens oder bis zu etwa 10 Jahre auseinander liegen. Die Vielzahl der Behandlungen für den Subjekt kann die gleiche sein. Alternativ kann sich die Vielzahl der Behandlungen durch die Art des Medikaments (z. B. verschiedene Chemotherapeutika), die Dosierung des Medikaments (z. B. Erhöhung der Dosierung, Verringerung der Dosierung), das Vorhandensein oder Fehlen eines Co-Therapeutikums (z. B. Chemotherapie und Immuntherapie), die Art der Verabreichung (z. B. intravenöse oder orale Verabreichung), die Häufigkeit der Verabreichung (z. B. täglich, wöchentlich, monatlich) usw. unterscheiden.
-
In einigen Fällen kann und muss der Proband zwischen der Bestimmung des ersten Stadiums der Erkrankung und der Bestimmung des zweiten Stadiums der Erkrankung nicht gegen die Erkrankung behandelt werden. Zum Beispiel kann die zweite Vielzahl zellfreier Nukleinsäuremoleküle ohne eine beliebige Behandlung von dem Subjekt erlangt werden (z. B. durch eine Flüssigbiopsie), um zu bestätigen, ob der Proband immer noch Anzeichen für das erste Stadium der Erkrankung aufweist.
-
In einigen Fällen kann die zweite Vielzahl zellfreier Nukleinsäuremoleküle von dem Subjekt (z. B, mittels Blutbiopsie) wenigstens oder bis zu etwa 1 Tag, wenigstens oder bis zu etwa 7 Tage, wenigstens oder bis zu etwa 2 Wochen, wenigstens oder bis zu etwa 3 Wochen, wenigstens oder bis zu etwa 4 Wochen, wenigstens oder bis zu etwa 2 Monate, wenigstens oder bis zu etwa 3 Monate, wenigstens oder bis zu etwa 4 Monate ,wenigstens oder etwa 5 Monate, wenigstens oder bis zu etwa 6 Monate, wenigstens oder bis zu etwa 12 Monate, wenigstens oder bis zu etwa 2 Jahre, wenigstens oder bis zu etwa 3 Jahre, wenigstens oder bis zu etwa 4 Jahre, wenigstens oder bis zu etwa 5 Jahre oder wenigstens oder bis zu etwa 10 Jahre nach dem Gewinnen der ersten Vielzahl zellfreier Nukleinsäuremoleküle von dem Subjekt erlangt werden.
-
In einigen Fällen können wenigstens oder bis zu etwa 2, wenigstens oder bis zu etwa 3, wenigstens oder bis zu etwa 4, wenigstens oder bis zu etwa 5, wenigstens oder bis zu etwa 6, wenigstens oder bis zu etwa 7, wenigstens oder bis zu etwa 8, wenigstens oder bis zu etwa 9 oder wenigstens oder bis zu etwa 10 verschiedene Proben, umfassend eine Vielzahl von Nukleinsäuremolekülen (z. B. wenigstens die erste Vielzahl zellfreier Nukleinsäuremoleküle und die zweite Vielzahl zellfreier Nukleinsäuremoleküle), im Laufe der Zeit (z. B. einmal pro Monat für 6 Monate, einmal alle zwei Monate für ein Jahr, einmal alle drei Monate für ein Jahr, einmal alle 6 Monate für ein oder mehrere Jahre, usw.) erlangt werden, um den Verlauf der Erkrankung des Subjekts zu beobachten, wie hierin offenbart.
-
In einigen Fällen kann der Schritt der Bestimmung des Verlaufs der Erkrankung basierend auf dem ersten Stadium der Erkrankung und dem zweiten Stadium der Erkrankung den Vergleich eines oder mehrerer Merkmale des ersten Stadiums und des zweiten Stadiums der Erkrankung umfassen, wie beispielsweise (i) eine Gesamtzahl zellfreier Nukleinsäuremoleküle, die als die Vielzahl von Phasenvarianten in jedem Stadium umfassend identifiziert wurden (z. B. pro gleichem Gewicht oder Volumen der biologischen Ausgangsprobe, pro gleicher Anzahl von anfänglich analysierten zellfreien Nukleinsäuremolekülen usw.), (ii) eine durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro zellfreiem Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten umfassend identifiziert wurde (d. h. zwei oder mehr Phasenvarianten), oder (iii) eine Anzahl zellfreier Nukleinsäuremoleküle, die als die Vielzahl von Phasenvarianten umfassend identifiziert wurden, geteilt durch eine Gesamtzahl zellfreier Nukleinsäuremoleküle, die eine Mutation umfassen, die sich mit einigen der Vielzahl von Phasenvarianten überschneidet (d. h. Allelfrequenz der Phasenvariante). Basierend auf einem solchen Vergleich kann die MRD der Erkrankung (z. B. Krebs oder Tumor) des Subjekts bestimmt werden. Basierend auf einem solchen Vergleich kann zum Beispiel die Tumor- oder Krebsbelastung des Subjekts ermittelt werden.
-
In einigen Fällen kann der Verlauf der Erkrankung eine Progression oder Verschlimmerung der Erkrankung sein. In einem Beispiel kann die Verschlimmerung der Erkrankung die Entwicklung einer Krebserkrankung von einem früheren Stadium zu einem späteren Stadium umfassen, wie etwa von Krebs im Stadium I zu Krebs im Stadium III. In einem anderen Beispiel kann die Verschlimmerung der Erkrankung eine Vergrößerung (z. B. des Volumens) eines soliden Tumors umfassen. In noch einem anderen Beispiel kann die Verschlimmerung der Erkrankung darin bestehen, dass sich Krebsmetastasen von einer Stelle zu einer anderen Stelle im Körper des Subjekts ausbreiten.
-
In einigen Beispielen kann (i) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem zweiten Stadium der Erkrankung des Subjekts umfassend identifiziert wurden, um wenigstens oder bis zu etwa das 0,1-fache, wenigstens oder bis zu etwa 0,2-fache, wenigstens oder bis zu etwa 0,3-fache, wenigstens oder bis zu etwa 0,4-fache, wenigstens oder bis zu etwa 0,5-fache, wenigstens oder bis zu etwa 0,6-fache, wenigstens oder bis zu etwa 0,7-fache, wenigstens oder bis zu etwa 0,8-fache, wenigstens oder bis zu etwa 0,9-fache, wenigstens oder bis zu etwa 1-fache, wenigstens oder bis zu etwa 2-fache, wenigstens oder bis zu etwa 3-fache, wenigstens oder bis zu etwa 4-fache, wenigstens oder bis zu etwa 5-fache, wenigstens oder bis zu etwa 6-fache, wenigstens oder bis zu etwa 7-fache, wenigstens oder bis zu etwa 8-fache, wenigstens oder bis zu etwa 9-fache, wenigstens oder bis zu etwa 10-fache, wenigstens oder bis zu etwa 15-fache, wenigstens oder bis zu etwa 20-fache, wenigstens oder bis zu etwa 30-fache, wenigstens oder bis zu etwa 40-fache, wenigstens oder bis zu etwa 50-fache, wenigstens oder bis zu etwa 60-fache, wenigstens oder bis zu etwa 70-fache, wenigstens oder bis zu etwa 80-fache, wenigstens oder bis zu etwa 90-fache, wenigstens oder bis zu etwa 100-fache, wenigstens oder bis zu etwa 200-fache, wenigstens oder bis zu etwa 300-fache, wenigstens oder bis zu etwa 400-fache, oder wenigstens oder bis zu etwa 500-fache höher sein als (ii) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem ersten Stadium der Erkrankung des Subjekts umfassend identifiziert wurden.
-
In einigen Beispielen kann (i) die durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem zweiten Stadium der Erkrankung des Subjekts umfassend identifiziert wurde, um wenigstens oder bis zu etwa das 0,1-fache, wenigstens oder bis zu etwa 0,2-fache, wenigstens oder bis zu etwa 0,3-fache, wenigstens oder bis zu etwa 0,4-fache, wenigstens oder bis zu etwa 0,5-fache, wenigstens oder bis zu etwa 0,6-fache, wenigstens oder bis zu etwa 0,7-fache, wenigstens oder bis zu etwa 0,8-fache, wenigstens oder bis zu etwa 0,9-fache, wenigstens oder bis zu etwa 1-fache, wenigstens oder bis zu etwa 2-fache, wenigstens oder bis zu etwa 3-fache, wenigstens oder bis zu etwa 4-fache, wenigstens oder bis zu etwa 5-fache, wenigstens oder bis zu etwa 6-fache, wenigstens oder bis zu etwa 7-fache, wenigstens oder bis zu etwa 8-fache, wenigstens oder bis zu etwa 9-fache, wenigstens oder bis zu etwa 10-fache, wenigstens oder bis zu etwa 15-fache, wenigstens oder bis zu etwa 20-fache, wenigstens oder bis zu etwa 30-fache, wenigstens oder bis zu etwa 40-fache, wenigstens oder bis zu etwa 50-fache, wenigstens oder bis zu etwa 60-fache, wenigstens oder bis zu etwa 70-fache, wenigstens oder bis zu etwa 80-fache, wenigstens oder bis zu etwa 90-fache, wenigstens oder bis zu etwa 100-fache, wenigstens oder bis zu etwa 200-fache, wenigstens oder bis zu etwa 300-fache, wenigstens oder bis zu etwa 400-fache, oder wenigstens oder bis zu etwa 500-fache höher sein als (ii) die durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem ersten Stadium der Erkrankung des Subjekts umfassend identifiziert wurde.
-
In einigen Fällen kann der Verlauf der Erkrankung eine Regression oder zumindest eine teilweise Remission der Erkrankung sein. In einem Beispiel kann die zumindest teilweise Remission der Erkrankung ein Downstaging einer Krebserkrankung von einem späteren Stadium in ein früheres Stadium, beispielsweise von einem Krebs im Stadium IV zu einem Krebs im Stadium II, umfassen. Alternativ kann es sich bei der zumindest teilweisen Remission der Erkrankung auch um eine vollständige Remission der Krebserkrankung handeln. In einem anderen Beispiel kann die zumindest teilweise Remission der Erkrankung eine Verringerung der Größe (z. B. des Volumens) eines soliden Tumors umfassen.
-
In einigen Beispielen kann (i) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem zweiten Stadium der Erkrankung des Subjekts umfassend identifiziert wurden, um wenigstens oder bis zu etwa das 0,1-fache, wenigstens oder bis zu etwa 0,2-fache, wenigstens oder bis zu etwa 0,3-fache, wenigstens oder bis zu etwa 0,4-fache, wenigstens oder bis zu etwa 0,5-fache, wenigstens oder bis zu etwa 0,6-fache, wenigstens oder bis zu etwa 0,7-fache, wenigstens oder bis zu etwa 0,8-fache, wenigstens oder bis zu etwa 0,9-fache, wenigstens oder bis zu etwa 1-fache, wenigstens oder bis zu etwa 2-fache, wenigstens oder bis zu etwa 3-fache, wenigstens oder bis zu etwa 4-fache, wenigstens oder bis zu etwa 5-fache, wenigstens oder bis zu etwa 6-fache, wenigstens oder bis zu etwa 7-fache, wenigstens oder bis zu etwa 8-fache, wenigstens oder bis zu etwa 9-fache, wenigstens oder bis zu etwa 10-fache, wenigstens oder bis zu etwa 15-fache, wenigstens oder bis zu etwa 20-fache, wenigstens oder bis zu etwa 30-fache, wenigstens oder bis zu etwa 40-fache, wenigstens oder bis zu etwa 50-fache, wenigstens oder bis zu etwa 60-fache, wenigstens oder bis zu etwa 70-fache, wenigstens oder bis zu etwa 80-fache, wenigstens oder bis zu etwa 90-fache, wenigstens oder bis zu etwa 100-fache, wenigstens oder bis zu etwa 200-fache, wenigstens oder bis zu etwa 300-fache, wenigstens oder bis zu etwa 400-fache, oder wenigstens oder bis zu etwa 500-fache niedriger sein als (ii) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem ersten Stadium der Erkrankung des Subjekts umfassend identifiziert wurden.
-
In einigen Beispielen kann (i) die durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem zweiten Status der Erkrankung des Subjekts umfassend identifiziert wurde, um wenigstens oder bis zu etwa das 0,1-fache, wenigstens oder bis zu etwa 0,2-fache, wenigstens oder bis zu etwa 0,3-fache, wenigstens oder bis zu etwa 0,4-fache, wenigstens oder bis zu etwa 0,5-fache, wenigstens oder bis zu etwa 0,6-fache, wenigstens oder bis zu etwa 0,7-fache, wenigstens oder bis zu etwa 0,8-fache, wenigstens oder bis zu etwa 0,9-fache, wenigstens oder bis zu etwa 1-fache, wenigstens oder bis zu etwa 2-fache, wenigstens oder bis zu etwa 3-fache, wenigstens oder bis zu etwa 4-fache, wenigstens oder bis zu etwa 5-fache, wenigstens oder bis zu etwa 6-fache, wenigstens oder bis zu etwa 7-fache, wenigstens oder bis zu etwa 8-fache, wenigstens oder bis zu etwa 9-fache, wenigstens oder bis zu etwa 10-fache, wenigstens oder bis zu etwa 15-fache, wenigstens oder bis zu etwa 20-fache, wenigstens oder bis zu etwa 30-fache, wenigstens oder bis zu etwa 40-fache, wenigstens oder bis zu etwa 50-fache, wenigstens oder bis zu etwa 60-fache, wenigstens oder bis zu etwa 70-fache, wenigstens oder bis zu etwa 80-fache, wenigstens oder bis zu etwa 90-fache, wenigstens oder bis zu etwa 100-fache, wenigstens oder bis zu etwa 200-fache, wenigstens oder bis zu etwa 300-fache, wenigstens oder bis zu etwa 400-fache, oder wenigstens oder bis zu etwa 500-fache niedriger sein als (ii) die durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem ersten Status der Erkrankung des Subjekts umfassend identifiziert wurde.
-
In einigen Fällen kann der Verlauf der Erkrankung zwischen den beiden Stadien der Erkrankung des Subjekts im Wesentlichen gleich bleiben. In einigen Beispielen kann (i) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem zweiten Stadium der Erkrankung des Subjekts umfassen identifiziert wurden, etwa gleich sein wie (ii) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem ersten Stadium der Erkrankung des Subjekts umfassend identifiziert wurden. In einigen Beispielen kann (i) eine durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem zweiten Stadium der Erkrankung des Subjekts umfassend identifiziert wurde, etwa gleich sein wie (ii) eine durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem ersten Stadium der Erkrankung des Subjekts umfassend identifiziert wurde.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können das eine oder die mehreren zellfreien Nukleinsäuremoleküle, die die Vielzahl der Phasenvarianten umfassen, aus der Vielzahl der zellfreien Nukleinsäuremoleküle durch ein oder mehrere Sequenzierungsverfahren identifiziert werden. Alternativ oder zusätzlich können das eine oder die mehreren zellfreien Nukleinsäuremoleküle, die die Vielzahl der Phasenvarianten umfassen, durch Pull down von (oder Erfassung von) der Vielzahl der zellfreien Nukleinsäuremoleküle mit einem Satz von Nukleinsäuresonden identifiziert werden. Das Pull-Down-(oder Capture-)Verfahren über den Satz von Nukleinsäuresonden kann zur Identifizierung der einen oder mehreren zellfreien Nukleinsäuremoleküle von Interesse ohne Sequenzierung ausreichen. In einigen Fällen kann der Satz von Nukleinsäuresonden zur Hybridisierung mit wenigstens einem Teil zellfreier Nukleinsäuremoleküle (z. B. cfDNA-Moleküle) aus einem oder mehreren mit der Erkrankung des Subjekts assoziierten Genombereichen ausgelegt sein. Daher kann ein Vorhandensein eines oder mehrerer von den Nukleinsäuresonden heruntergezogener zellfreier Nukleinsäuremoleküle indikativ dafür sein, dass das eine oder die mehreren zellfreien Nukleinsäuremoleküle aus der Erkrankung (z .B. ctDNA oder ctRNA) abgeleitet sind. Weitere Einzelheiten zu dem Satz von Nukleinsonden sind an anderer Stelle der vorliegenden Offenbarung offenbart.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können, basierend auf den von dem Subjekt erlangten oder abgeleiteten Sequenzierungsdaten aus der Vielzahl zellfreier Nukleinsäuremoleküle (z. B. cfDNA), (i) das eine oder die mehreren zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten umfassend identifiziert wurden, in silico von (ii) einem oder mehreren anderen zellfreien Nukleinsäuremolekülen, die nicht als die Vielzahl der Phasenvarianten umfassend identifiziert wurden (oder einem oder mehreren anderen zellfreien Nukleinsäuremolekülen, die nicht die Vielzahl der Phasenvarianten umfassen), getrennt werden. In einigen Fällen kann das Verfahren ferner die Erzeugung zusätzlicher Daten umfassen, die Sequenzierungsinformationen nur für (i) das eine oder die mehreren zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten umfassend identifiziert wurden, umfassen. In einigen Fällen kann das Verfahren ferner die Erzeugung anderer Daten umfassen, die Sequenzierungsinformationen nur für (ii) das eine oder die mehreren anderen zellfreien Nukleinsäuremoleküle, die nicht als die Vielzahl von Phasenvarianten umfassend identifiziert wurden (oder das eine oder die mehreren anderen zellfreien Nukleinsäuremoleküle, die nicht die Vielzahl von Phasenvarianten umfassen) umfassen.
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Bestimmung einer Erkrankung eines Subjekts vor, wie im Ablaufdiagramm 2560 in 25F dargestellt. Das Verfahren kann umfassen: (a) Bereitstellen eines Gemischs, umfassend (1) einen Satz von Nukleinsäuresonden und (2) eine Vielzahl von von dem Subjekt erlangter oder abgeleiteter zellfreier Nukleinsäuremoleküle (Prozess 2562). In einigen Fällen kann eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatz zur Hybridisierung mit einem zellfreien Zielnukleinsäuremolekül gestaltet sein, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind. So können eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt sein, wie hierin offenbart. In einigen Fällen kann die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens enthalten. Das aktivierbare Reporteragens kann entweder durch (i) Hybridisierung der individuellen Nukleinsäuresonde mit der Vielzahl von Phasenvarianten oder (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die mit der Vielzahl von Phasenvarianten hybridisiert wurde, aktiviert werden. Das Verfahren kann ferner (b) den Nachweis des aktivierten Reporteragens zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle umfassen (Prozess 2564). Jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle kann die Vielzahl der Phasenvarianten umfassen. Das Verfahren kann optional (c) die Analyse wenigstens eines Teils der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle zur Bestimmung der Erkrankung des Subjekts umfassen (Prozess 2566).
-
In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Bestimmung einer Erkrankung eines Subjekts vor, wie im Ablaufdiagramm 2570 in 25G dargestellt. Das Verfahren kann umfassen: (a) Bereitstellen eines Gemischs, umfassend (1) einen Satz von Nukleinsäuresonden und (2) eine Vielzahl von von dem Subjekt erlangter oder abgeleiteter zellfreier Nukleinsäuremoleküle (Prozess 2572). In einigen Fällen kann eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatz zur Hybridisierung mit einem zellfreien Zielnukleinsäuremolekül gestaltet sein, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst. In einigen Fällen kann die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens enthalten. Das aktivierbare Reporteragens kann entweder durch (i) Hybridisierung der individuellen Nukleinsäuresonde mit der Vielzahl von Phasenvarianten oder (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die mit der Vielzahl von Phasenvarianten hybridisiert wurde, aktiviert werden. Das Verfahren kann ferner (b) den Nachweis des aktivierten Reporteragens zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle umfassen (Prozess 2574). Jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle kann die Vielzahl der Phasenvarianten umfassen, und ein LOD des Identifizierungsschritts kann weniger als etwa 1 aus 50.000 zellfreien Nukleinsäuremolekülen der Vielzahl der zellfreien Nukleinsäuremoleküle betragen, wie hierin offenbart. Das Verfahren kann optional (c) die Analyse wenigstens eines Teils der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle zur Bestimmung der Erkrankung des Subjekts umfassen (Prozess 2576).
-
In einigen Fällen ist eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt, wie hierin offenbart.
-
In einigen Fällen kann die LOD des Schritts der Identifizierung des einen oder der mehreren zellfreien Nukleinsäuremoleküle, wie hierin offenbart, weniger als etwa 1 aus 60.000, weniger als 1 aus 70.000, weniger als 10 aus 80.000, weniger als 1 aus 90.000, weniger als 1 aus 100.000, weniger als 1 aus 150.000, weniger als 1 aus 200.000, weniger als 1 aus 300.000, weniger als 1 aus 400.000, weniger als 1 aus 500.000, weniger als 1 aus 600.000, weniger als 1 aus 700.000, weniger als 1 aus 800.000, weniger als 1 aus 900.000, weniger als 1 aus 1.000.000, weniger als 1 aus 1.000.000, weniger als 1 aus 1.100.000, weniger als 1 aus 1.200.000, weniger als 1 aus 1.300.000, weniger als 1 aus 1.400.000, weniger als 1 aus 1.500.000, weniger als 1 aus 2.000.000, weniger als 1 aus 2.500.000, weniger als 1 aus 3.000.000, weniger als 1 aus 4.000.000 oder weniger als 1 aus 5.000.000 zellfreie Nukleinsäuremoleküle der Vielzahl zellfreier Nukelinsäuremokelüle betragen. Im Allgemeinen hat ein Verfahren mit einer niedrigeren LOD eine höhere Empfindlichkeit für einen solchen Nachweis.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das Verfahren ferner das Mischen (1) des Satzes von Nukleinsäuresonden und (2) der Vielzahl von zellfreien Nukleinsäuremolekülen umfassen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das aktivierbare Reporteragens einer Nukleinsäuresonde bei der Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl der Phasenvarianten aktiviert werden. Nicht einschränkende Beispiele für solche Nukleinsäuresonden können einen molekularen Beacon (Signalortungsgerät), eine Eclipse-Sonde, eine Amplifluor-Sonde, einen Skorpion-PCR-Primer und einen fluorogenen PCR-Primer mit Licht nach Erweiterung (LUX-Primer) beinhalten.
-
Beispielsweise kann die Nukleinsäuresonde ein molekulare Beacon sein, wie in 26A dargestellt. Der molekulare Beacon kann eine fluoreszenzmarkierte (z. B. farbstoffmarkierte) Oligonukleotidsonde sein, die Komplementarität zu einem gezielten zellenfreien Nukleinsäuremolekül 2603 in einem Bereich aufweist, der die Vielzahl der Phasenvarianten umfasst. Der molekulare Beacon kann eine Länge zwischen etwa 25 Nukleotiden und etwa 50 Nukleotiden haben. Der molekulare Beacon kann auch gestaltet sein, um teilweise selbst-komplementär zu sein, sodass er eine Haarnadelstruktur mit einem Stamm 2601a und einer Schleife 2601b bildet. Die 5'- und 3'-Enden der molekularen Beacon-Sonde können komplementäre Sequenzen (z. B. etwa 5-6 Nukleotide) aufweisen, die die Stammstruktur 2601a bilden. Der Schleifenabschnitt 2601b der Haarnadel kann zur spezifischen Hybridisierung mit einem Abschnitt (z. B. etwa 15-30 Nukleotide) der Zielsequenz, die zwei oder mehr Phasenvarianten umfasst, gestaltet sein. Die Haarnadel kann zur Hybridisierung mit einem Abschnitt gestaltet sein, der wenigstens 2, 3, 4, 5 oder mehr Phasenvarianten umfasst. Ein fluoreszierendes Reportermolekül kann an das 5'-Ende der molekularen Beacon-Sonde gebunden sein und ein Quencher, der die Fluoreszenz des fluoreszierenden Reporters quencht, kann an das 3'-Ende der molekularen Beacon-Sonde gebunden sein. Die Bildung der Haarnadel kann daher den fluoreszierenden Reporter und den Quencher zusammenbringen, sodass keine Fluoreszenz emittiert wird. Während des Annealing-(Glüh-)Vorgangs der Amplifikationsreaktion der von einem Subjekt erlangten oder abgeleiteten Vielzahl zellfreier Nukleinsäuremoleküle kann der Schleifenabschnitt des molekularen Beacons jedoch an seine Zielsequenz binden, wodurch der Stamm denaturiert wird. Auf diese Weise können der Reporter und der Quencher getrennt werden, wodurch das Quenching aufgehoben wird und der fluoreszierende Reporter aktiviert und nachweisbar ist. Da die Fluoreszenz des fluoreszierenden Reporters nur dann von der molekularen Beacon-Sonde emittiert wird, wenn die Sonde an die Zielsequenz gebunden ist, kann die Menge oder der Grad der nachgewiesenen Fluoreszenz proportional zur Menge des Ziels in der Reaktion sein (z. B. (i) einer Gesamtzahl zellfreier Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten in jedem Stadium umfassend identifiziert wurden oder (ii) einer durchschnittlichen Anzahl der Vielzahl von Phasenvarianten pro zellfreiem Nukleinsäuremolekül, das als die Vielzahl von Phasenvarianten umfassend identifiziert wurde, wie hierin offenbart).
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das aktivierbare Reporteragens bei der Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl der Phasenvarianten hybridisiert wurde, aktiviert werden. Mit anderen Worten, sobald die individuelle Nukleinsäuresonde mit dem Teil des zellfreien Zielnukleinsäuremoleküls hybridisiert ist, der die Vielzahl der Phasenvarianten umfasst, kann die Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde und der zellfreien Zielnukleinsäure das aktivierbare Reporteragens aktivieren. Nicht einschränkende Beispiele für derartige Nukleinsäuresonden können eine Hydrolysesonde (z. B. TaqMan-Sonde), duale Hybridisierungssonden und QZyme PCR-Primer beinhalten.
-
Beispielsweise kann die Nukleinsäuresonde eine Hydrolysesonde sein, wie in 26B dargestellt. Die Hydrolysesonde 2611 kann eine fluoreszenzmarkierte Oligonukleotidsonde sein, die spezifisch an einen Teil (z. B. zwischen etwa 10 und etwa 25 Nukleotiden) des zellfreien Zielnukleinsäuremoleküls 2613 hybridisieren kann, wobei der hybridisierte Teil zwei oder mehr Phasenvarianten umfasst. Die Hydrolysesonde 2611 kann mit einem fluoreszierenden Reporter am 5'-Ende und einem Quencher am 3'-Ende markiert sein. Ist die Hydrolysesonde intakt (z. B. nicht gespalten), wird die Fluoreszenz des Reporters aufgrund seiner Nähe zum Quencher gequencht ( 26B). Während des Annealing-Vorgangs der Amplifikationsreaktion der Vielzahl der von dem Subjekt erlangten oder abgeleiteten zellfreier Nukleinsäuremolekülen 5' → 3' Exonukleaseaktivität bestimmter thermostabiler Polymerasen (z. B. Taq oder Tth). Die Amplifikationsreaktion der Vielzahl der vom Subjekt erlangten oder abgeleiteten zellfreien Nukleinsäuremoleküle kann einen kombinierten Annealing-/Extensionsvorgang beinhalten, bei dem die Hydrolysesonde an das zellfreie Zielnukleinsäuremolekül hybridisiert und die dsDNA-spezifische 5' → 3'-Exonukleaseaktivität einer thermostabilen Polymerase (z. B. Taq oder Tth) den fluoreszierenden Reporter von der Hydrolysesonde abspaltet. Als Ergebnis wird der fluoreszierende Reporter vom Quencher getrennt, was zu einem Fluoreszenzsignal führt, das proportional zur Menge des Ziels in der Probe ist (z. B. (i) einer Gesamtzahl zellfreier Nukleinsäuremoleküle, die als die Vielzahl von Phasenvarianten in jedem Stadium umfassend identifiziert wurden, oder (ii) einer durchschnittlichen Anzahl der Vielzahl von Phasenvarianten für jedes zellfreie Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten umfassend identifiziert wurde, wie hierin offenbart).
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das Reporteragens einen Fluoreszenzreporter umfassen. Nicht einschränkende Beispiele für einen fluoreszierenden Reporter beinhalten Fluoresceinamidit (FAM, 2-[3-(Dimethylamino)-6-dimethyliminio-xanthen-9-yl]benzoat TAMRA, (2E)-2-[(2E,4E)-5-(2-tert-butyl-9-ethyl-6,8,8-trimethyl-pyrano[3,2-g]quinolin-1-ium-4-yl)penta-2,4-dienylidene]-1-(6-hydroxy-6-oxo-hexyl)-3,3-Dimethyl-indolin-5-sulfonat Dy 750, 6-Carboxy-2',4,4',5',7,7'-hexachlorofluorescein, 4,5,6,7-Tetrachlorofluorescein TET™, Sulforhodamin 101 Säurechlorid-Succinimidylester Texas Red-X, ALEXA-Farbstoffe, Bodipy-Farbstoffe, Cyanin-Farbstoffe, Rhodamin 123 (Hydrochlorid), Well RED-Farbstoffe, MAX und TEX 613. In einigen Fällen umfasst das Reporteragens außerdem einen Quencher, wie hierin offenbart. Nicht einschränkende Beispiele für einen Quencher können Black Hole Quencher, Iowa Black Quencher und 4-Dimethylaminoazobenzol-4'-sulfonylchlorid (DABCYL) beinhalten.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann jede den Nukleinsäuresondensatz verwendende PCR-Reaktion mittels Echtzeit-PCR (qPCR) durchgeführt werden. Alternativ kann die PCR-Reaktion unter Verwendung des Nukleinsäuresondensatzes mittels digitaler PCR (dPCR) durchgeführt werden.
-
24 zeigt ein beispielhaftes Ablaufdiagramm eines Verfahrens zur Durchführung einer klinischen Intervention und/oder Behandlung basierend auf dem Nachweis zirkulierender Nukleinsäuren in der biologischen Probe einer Person. In mehreren Ausführungsformen wird der Nachweis von zirkulierenden Tumor-Nukleinsäuren durch den Nachweis somatischer Varianten in Phase in einer zellfreien Nukleinsäureprobe bestimmt. In vielen Ausführungsformen zeigt der Nachweis von zirkulierenden Nukleinsäuren indikativ ein Vorliegen von Krebs an, sodass eine entsprechende klinische Intervention und/oder Behandlung durchgeführt werden kann.
-
Unter Bezugnahme auf 24 kann der Prozess 2400 mit der Gewinnung, Aufbereitung und Sequenzierung (2401) zellfreier Nukleinsäuren beginnen, die aus einer nichtinvasiven Biopsie (z. B. Flüssigkeits- oder Ausscheidungsbiopsie) erlangt wurden, wobei ein Erfassungssequenzierungsansatz für Bereiche verwendet wird, die nachweislich eine Vielzahl genetischer Mutationen oder Varianten beherbergen, die in Phase auftreten. In mehreren Ausführungsformen wird cfDNA und/oder cfRNA aus Plasma, Blut, Lymphe, Speichel, Urin, Stuhl und/oder anderen geeigneten Körperflüssigkeiten extrahiert. Zellfreie Nukleinsäuren können auf beliebige geeignete Weise isoliert und gereinigt werden. In einigen Ausführungsformen wird die Säulenreinigung verwendet (z. B. QIAamp Circulating Nucleic Acid Kit der Firma Qiagen, Hilden, Deutschland). In einigen Ausführungsformen können isolierte RNA-Fragmente zur weiteren nachgeordneten Analyse in komplementäre DNA umgewandelt werden.
-
In einigen Ausführungsformen wird vor einer Krebsindikation eine Biopsie entnommen. In einigen Ausführungsformen wird eine Biopsie entnommen, um ein frühes Screening zum Nachweis einer Krebserkrankung durchzuführen. In einigen Ausführungsformen wird eine Biopsie entnommen, um zu ermitteln, ob im Anschluss an eine Behandlung noch eine Krebserkrankung vorhanden ist. In einigen Ausführungsformen wird während der Behandlung eine Biopsie entnommen, um zu ermitteln, ob die Behandlung die gewünschte Reaktion hervorruft. Es kann ein Screening auf beliebige Krebsarten durchgeführt werden. In einigen Ausführungsformen wird ein Screening zum Nachweis einer Krebserkrankung durchgeführt, die somatische Phasenvarianten in stereotypen Bereichen des Genoms entwickelt, wie (beispielsweise) das Lymphom. In einigen Ausführungsformen wird ein Screening zum Nachweis einer Krebserkrankung durchgeführt, bei der somatische Phasenvarianten unter Verwendung einer zuvor entnommenen Krebsbiopsie entdeckt wurden.
-
In einigen Ausführungsformen wird eine Biopsie von einer Person entnommen, bei der ein bestimmtes Risiko für die Entwicklung einer Krebserkrankung besteht, wie z. B. bei Personen mit einer familiären Vorgeschichte der Erkrankung oder mit bestimmten Risikofaktoren (z. B. Exposition gegenüber Karzinogenen). In vielen Fällen wird eine Biopsie von einer beliebigen Person aus der Allgemeinbevölkerung entnommen. In einigen Ausführungsformen wird eine Biopsie von Personen entnommen, die einer bestimmten Altersgruppe mit erhöhtem Krebsrisiko angehören, wie beispielsweise ältere Personen über 50 Jahre. In einigen Ausführungsformen wird eine Biopsie von einer Person entnommen, bei der Krebs diagnostiziert und behandelt wurde.
-
In einigen Ausführungsformen werden extrahierte zellfreie Nukleinsäuren für die Sequenzierung vorbereitet. Dementsprechend werden zellfreie Nukleinsäuren zur Sequenzierung in eine Molekularbibliothek umgewandelt. In einigen Ausführungsformen werden Adapter und/oder Primer an zellfreie Nukleinsäuren angehängt, um die Sequenzierung zu ermöglichen. In einigen Ausführungsformen ist eine gezielte Sequenzierung bestimmter genomischer Loci durchzuführen, sodass bestimmte Sequenzen, die den bestimmten Loci entsprechen, vor der Sequenzierung durch Hybridisierung erfasst werden (z. B. Erfassungssequenzierung). In einigen Ausführungsformen wird die Erfassungssequenzierung unter Verwendung einer Reihe von Sonden durchgeführt, die Bereiche herunterziehen (oder erfassen), von denen bekannt ist, dass sie häufig Phasenvarianten für einen bestimmten Krebs (z. B. Lymphom) beherbergen. In einigen Ausführungsformen wird die Erfassungssequenzierung unter Verwendung eines Sondensatzes durchgeführt, der Bereiche herunterzieht (oder erfasst), die nachweislich Phasenvarianten beherbergen, die zuvor durch die Sequenzierung einer Biopsie des Krebses bestimmt wurden. Eine ausführlichere Beschreibung der Erfassungssequenzierung und der Sonden ist im Abschnitt „Erfassungssequenzierung“ bereitgestellt.
-
In einigen Ausführungsformen kann jede geeignete Sequenzierungstechnik verwendet werden, mit der Phasenvarianten nachgewiesen werden können, die indikativ für zirkulierende Tumor-Nukleinsäuren sind. Sequenzierungstechniken beinhalten (sind aber nicht beschränkt auf) 454-Sequenzierung, Illumina-Sequenzierung, SOLiD-Sequenzierung, Ion-Torrent-Sequenzierung, Single-Read-Sequenzierung, Paired-End-Sequenzierung, usw.
-
Prozess 2400 analysiert (2403) das Ergebnis der zellfreien Nukleinsäure-Sequenzierung zum Nachweis zirkulierender Tumor-Nukleinsäuresequenzen, die durch den Nachweis somatischer, in der Phase auftretender Varianten bestimmt werden. Da Krebs aktiv wächst und sich ausbreitet, geben neoplastische Zellen häufig Biomoleküle (insbesondere Nukleinsäuren) in das Gefäßsystem, die Lymphe und/oder Ausscheidungssysteme ab. Darüber hinaus brechen neoplastische Zellen aufgrund biophysikalischer Zwänge in ihrer lokalen Umgebung häufig auf und geben ihren inneren Zellinhalt in das Gefäßsystem, die Lymphe und/oder Ausscheidungssysteme ab. Dementsprechend ist der Nachweis distaler Primärtumore und/oder Metastasen aus einer Flüssigkeits- oder Ausscheidungsbiopsie möglich.
-
Der Nachweis zirkulierender Tumor-Nukleinsäuresequenzen deutet darauf hin, dass bei dem untersuchten Individuum ein Krebs vorliegt. Dementsprechend kann basierend auf dem Nachweis von zirkulierenden Tumor-Nukleinsäuren eine klinische Intervention und/oder Behandlung durchgeführt werden (2405). In einer Anzahl von Ausführungsformen wird ein klinisches Verfahren durchgeführt, wie (zum Beispiel) ein Bluttest, ein Gentest, eine medizinische Bildgebung, eine körperliche Untersuchung, eine Tumorbiopsie oder eine beliebige Kombination davon. In einigen Ausführungsformen werden Diagnosen zur Bestimmung des jeweiligen Krebsstadiums durchgeführt. In einer Anzahl von Ausführungsformen wird eine Behandlung durchgeführt, wie (zum Beispiel) Chemotherapie, Radiotherapie, Chemoradiotherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie, Operation, Transplantation, Transfusion, medizinische Überwachung oder eine beliebige Kombination davon. In einigen Ausführungsformen wird ein Individuum von medizinischem Fachpersonal, wie etwa einem Arzt, Mediziner, medizinischen Fachangestellten, einer Krankenschwester, einem Pfleger, Ernährungsberater oder dergleichen.
-
Verschiedene Ausführungsformen der vorliegenden Offenbarung zielen darauf ab, den Nachweis von Krebs zur Durchführung klinischer Interventionen zu nutzen. In einer Reihe von Ausführungsformen wird eine Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums mit den hierin beschriebenen Verfahren gescreent und verarbeitet, um anzuzeigen, dass das Individuum Krebs hat und daher eine Intervention durchzuführen ist. Klinische Interventionen beinhalten klinische Verfahren und Behandlungen. Klinische Verfahren beinhalten (sind aber nicht beschränkt auf) Bluttests, Gentests, medizinische Bildgebung, körperliche Untersuchungen und Tumorbiopsien. Behandlungen beinhalten (sind aber nicht beschränkt auf) Chemotherapie, Radiotherapie, Chemoradiotherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie, Chirurgie, Transplantation, Transfusion und medizinische Überwachung. In einigen Ausführungsformen werden Diagnosen zur Bestimmung des jeweiligen Krebsstadiums durchgeführt. In einigen Ausführungsformen wird ein Individuum von medizinischem Fachpersonal, wie etwa einem Arzt, Mediziner, medizinischen Fachangestellten, einer Krankenschwester, einem Pfleger, Ernährungsberater oder dergleichen.
-
In mehreren hierin beschriebenen Ausführungsformen kann ein Krebs anhand eines Sequenzierungsergebnisses von zellfreien Nukleinsäuren aus Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl nachgewiesen werden. In vielen Ausführungsformen wird Krebs nachgewiesen, wenn ein Sequenzierungsergebnis eine oder mehrere somatische Varianten aufweist, die innerhalb eines kurzen genetischen Fensters, z. B. der Länge eines zellfreien Moleküls (z. B. etwa 170 bp), in Phase vorliegen. In zahlreichen Ausführungsformen wird ein statistisches Verfahren zur Bestimmung verwendet, ob das Vorhandensein von Phasenvarianten aus einer kanzerogenen Quelle abgeleitet ist (im Gegensatz zu einem molekularen Artefakt oder einer anderen biologischen Quelle). In verschiedenen Ausführungsformen wird eine Monte-Carlo-Probennahme als statistisches Verfahren verwendet, um zu bestimmen, ob ein Sequenzierungsergebnis zellfreier Nukleinsäuren Sequenzen zirkulierender Tumor-Nukleinsäuren beinhaltet, basierend auf einem Score, der durch das Vorhandensein von Phasenvarianten bestimmt wird. Dementsprechend werden in einer Reihe von Ausführungsformen zellfreie Nukleinsäuren extrahiert, verarbeitet und sequenziert, und das Sequenzierungsergebnis wird zum Nachweis von Krebs analysiert. Dieses Verfahren ist besonders im klinischen Umfeld nützlich, um einen diagnostischen Scan bereitzustellen.
-
Ein beispielhaftes Verfahren für einen diagnostischen Scan eines Individuums auf B-Zell-Krebs ist wie folgt:
- (a) Entnahme einer Flüssigkeits- oder Ausscheidungsbiopsie vom Individuum,
- (b) Vorbereitung und Durchführung einer gezielten Sequenzierung zellfreier Nukleinsäuren aus der Biopsie unter Verwendung von Nukleinsäuresonden, die für den B-Zell-Krebs spezifisch sind,
- (c) Nachweisen von Phasenvarianten in den Sequenzierungsergebnissen, die indikativ für zirkulierende Tumor-Nukleinsäuresequenzen sind, und
- (d) Durchführen einer klinischen Intervention basierend auf dem Nachweis zirkulierender Tumor-Nukleinsäuresequenzen.
-
Ein beispielhaftes Verfahren für einen personalisierten diagnostischen Scan eines Individuums für einen Krebs, der zuvor zum Nachweis von Phasenvarianten in bestimmten genomischen Loci sequenziert wurde, ist wie folgt:
- Entnahme einer Krebsbiopsie von dem Individuum
- Sequenzieren der Krebsbiopsie zum Nachweis von Phasenvarianten, die sich in dem Krebs angesammelt haben
- (a) Entwickeln und Synthetisieren von Nukleinsäuresonden für genomische Loci, die die Positionen der nachgewiesenen Phasenvarianten beinhalten,
- (b) Entnahme einer Flüssigkeits- oder Ausscheidungsbiopsie vom Individuum,
- (c) Präparieren und Durchführen einer gezielten Sequenzierung zellfreier Nukleinsäuren aus der Biopsie unter Verwendung der gestalteten und synthetisierten Nukleinsäuresonden,
- (d) Nachweisen von Phasenvarianten in den Sequenzierungsergebnissen, die indikativ für zirkulierende Tumor-Nukleinsäuresequenzen sind, und
- (e) Durchführen einer klinischen Intervention basierend auf dem Nachweis zirkulierender Tumor-Nukleinsäuresequenzen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann wenigstens ein Teil des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle, die die Vielzahl der Phasenvarianten umfassen, zur Ermittlung der Erkrankung des Subjekts weiter analysiert werden. In dieser Analyse können (i) die identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle und (ii) andere zellfreie Nukleinsäuremoleküle der Vielzahl von zellfreien Nukleinsäuremolekülen, die nicht die Vielzahl von Phasenvarianten umfassen, als unterschiedliche Variablen analysiert werden. In einigen Fällen kann ein Verhältnis von (i) der Anzahl der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle und (ii) der Anzahl der anderen zellfreien Nukleinsäuremoleküle der Vielzahl von zellfreien Nukleinsäuremolekülen, die nicht die Vielzahl von Phasenvarianten umfassen, als Faktor zur Bestimmung der Erkrankung des Subjekts verwendet werden. In einigen Fällen kann der Vergleich (i) einer oder mehrerer Position(en) des oder der identifizierten zellfreien Nukleinsäuremoleküle relativ zu der Referenzgenomsequenz und (ii) einer oder mehrerer Position(en) der anderen zellfreien Nukleinsäuremoleküle der Vielzahl zellfreier Nukleinsäuremoleküle, die nicht die Vielzahl der Phasenvarianten umfassen, relativ zu der Referenzgenomsequenz als Faktor zur Bestimmung der Erkrankung des Subjekts verwendet werden.
-
Alternativ kann und muss die Analyse des identifizierten einen oder der mehreren zellfreien Nukleinsäuremoleküle, die die Vielzahl von Phasenvarianten umfassen, zur Bestimmung der Erkrankung des Subjekts nicht auf den anderen zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen basieren, die nicht die Vielzahl von Phasenvarianten umfassen. Wie hierin offenbart, können nicht-einschränkende Beispiele von Informationen oder Merkmalen des einen oder der mehreren zellfreien Nukleinsäuremoleküle, die die Vielzahl von Phasenvarianten umfassen, (i) eine Gesamtzahl solcher zellfreier Nukleinsäuremoleküle und (ii) eine durchschnittliche Anzahl der Vielzahl von Phasenvarianten für jedes Nukleinsäuremolekül in der Population der identifizierten zellfreien Nukleinsäuremoleküle beinhalten.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann daher eine Anzahl der Vielzahl von Phasenvarianten aus dem einen oder den mehreren als die Vielzahl von Phasenvarianten umfassend identifizierten zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts sein. In einigen Fällen kann ein Verhältnis von (i) der Anzahl der Vielzahl von Phasenvarianten aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen und (ii) einer Anzahl von Einzelnukleotidvarianten aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts sein. So kann beispielsweise eine bestimmte Erkrankung (z. B. das follikuläre Lymphom) ein anderes Signaturverhältnis aufweisen als eine andere Erkrankung (z. B. Brustkrebs). In einigen Beispielen für Krebs oder solide Tumore kann das hierin offenbarte Verhältnis zwischen etwa 0,01 und etwa 0,20 liegen. In einigen Beispielen für Krebs oder solide Tumore kann das hierin offenbarte Verhältnis etwa 0,01, etwa 0,02, etwa 0,03, etwa 0,04, etwa 0,05, etwa 0,06, etwa 0,07, etwa 0,08, etwa 0,09, etwa 0,10, etwa 0,11, etwa 0,12, etwa 0,13, etwa 0,14, etwa 0,15, etwa 0,16, etwa 0,17, etwa 0,18, etwa 0,19 oder etwa 0,20 betragen. In einigen Beispielen für Krebs oder solide Tumore kann das hierin offenbarte Verhältnis wenigstens oder bis zu etwa 0,01, wenigstens oder bis zu etwa 0,02, wenigstens oder bis zu etwa 0,03, wenigstens oder bis zu etwa 0,04, wenigstens oder bis zu etwa 0,05, wenigstens oder bis zu etwa 0,06, wenigstens oder bis zu etwa 0,07, wenigstens oder bis zu etwa 0,08, wenigstens oder bis zu etwa 0,09, wenigstens oder bis zu etwa 0,10, wenigstens oder bis zu etwa 0,11, wenigstens oder bis zu etwa 0,12, wenigstens oder bis zu etwa 0,13, wenigstens oder bis zu etwa 0,14, wenigstens oder bis zu etwa 0,15, wenigstens oder bis zu etwa 0,16, wenigstens oder bis zu etwa 0,17, wenigstens oder bis zu etwa 0,18, wenigstens oder bis zu etwa 0,19, oder wenigstens oder bis zu etwa 0,20 betragen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Häufigkeit der Vielzahl von Phasenvarianten in dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts sein. In einigen Fällen kann basierend auf den hierin offenbarten Sequenzierungsdaten eine durchschnittliche Häufigkeit der Vielzahl von Phasenvarianten pro vorbestimmter Bin-Länge (z. B. ein Bin von etwa 50 Basenpaaren) innerhalb jedes der identifizierten zellfreien Nukleinsäuremoleküle indikativ für die Erkrankung des Subjekts sein. In einigen Fällen kann basierend auf den hierin offenbarten Sequenzierungsdaten eine durchschnittliche Häufigkeit der Vielzahl von Phasenvarianten pro vorbestimmter Bin-Länge (z. B. ein Bin von etwa 50 Basenpaaren) innerhalb jedes der identifizierten zellfreien Nukleinsäuremoleküle, die mit einem bestimmten Gen (z. B. BCL2, PIM1) assoziiert sind, indikativ für die Erkrankung des Subjekts sein. Die Größe der Bin kann etwa 30, etwa 40, etwa 50, etwa 60, etwa 70 oder etwa 80 betragen.
-
In einigen Beispielen kann eine erste Erkrankung (z. B. Hodgkin-Lymphom oder HL) eine erste Durchschnittshäufigkeit und eine zweite Erkrankung (z. B. DLBCL) eine andere Durchschnittshäufigkeit aufweisen, wodurch die Identifizierung und/oder Bestimmung ermöglicht wird, ob der Proband eine bestimmte Erkrankung hat oder der Verdacht auf eine solche besteht. In einigen Beispielen kann eine erste Unterart einer Krankheit eine erste Durchschnittshäufigkeit und eine zweite Unterart derselben Krankheit eine andere Durchschnittshäufigkeit aufweisen, wodurch die Identifizierung und/oder Bestimmung ermöglicht wird, ob der Proband an einer bestimmten Unterart der Krankheit leidet oder der Verdacht darauf besteht. Zum Beispiel kann der Proband DLBCL haben, und ein oder mehrere zellfreie Nukleinsäuremoleküle, die von Keimzentrum-B-Zell-(GCB-)DLBCL oder aktiviertem B-Zell-(ABC-)DLBCL abgeleitet sind, können eine unterschiedliche durchschnittliche Häufigkeit der Vielzahl von Phasenvarianten pro vorbestimmter Bin-Länge aufweisen, wie hierin offenbart.
-
In einigen Beispielen kann eine Erkrankung des Subjekts eine vorbestimmte Anzahl von Phasenvarianten aufweisen, die sich über vorbestimmte genomische Loci erstrecken (d .h. eine vorbestimmte Häufigkeit von Phasenvarianten). Stimmt die vorbestimmte Häufigkeit der Phasenvarianten mit einer Häufigkeit der Vielzahl von Phasenvarianten in dem einen oder den mehreren zellfreien Nukleinsäuremolekülen überein, die aus einer Vielzahl von zellfreien Nukleinsäuremolekülen des Subjekts identifiziert wurden, kann dies indikativ für die Erkrankung des Subjekts sein.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können das eine oder die mehreren zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten umfassend identifiziert wurden, analysiert werden, um ihren genomischen Ursprung zu bestimmen (z. B. von welchem Genort sie stammen). Der genomische Ursprung des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle kann indikativ für die Erkrankung des Subjekts sein, da verschiedene Erkrankungen die Vielzahl von Phasenvarianten in verschiedenen Signaturgenen aufweisen können. Zum Beispiel kann ein Proband GCB DLBCL haben, und ein oder mehrere aus GCBs des Subjekts stammende zellfreie Nukleinsäuremoleküle können die Phasenvarianten im BCL2-Gen aufweisen, während ein oder mehrere aus ABCs desselben Subjekt stammende zellfreie Nukleinsäuremoleküle möglicherweise nicht so viele Phasenvarianten im BCL2-Gen aufweisen wie die aus GCBs. Andererseits kann ein Proband ABC DLBCL haben, und ein oder mehrere aus ABCs des Subjekts stammende zellfreie Nukleinsäuremoleküle können die Phasenvarianten im PIM1-Gen aufweisen, während ein oder mehrere aus GCBs desselben Subjekt stammende zellfreie Nukleinsäuremoleküle möglicherweise nicht so viele Phasenvarianten im PIM1-Gen aufweisen wie die aus ABCs.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 %, wenigstens oder bis zu etwa 50 %, wenigstens oder bis zu etwa 55 %, wenigstens oder bis zu etwa 60 %, wenigstens oder bis zu etwa 65 %, wenigstens oder bis zu etwa 70 %, wenigstens oder bis zu etwa 75 %, wenigstens oder bis zu etwa 80 %, wenigstens oder bis zu etwa 85 %, wenigstens oder bis zu etwa 90 %, wenigstens oder bis zu etwa 95 %, wenigstens oder bis zu etwa 99 % oder etwa 100 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 2 Nukleotide von einer benachbarten SNV entfernt ist.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % der einen oder mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 3 Nukleotide von einer benachbarten SNV entfernt ist.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 4 Nukleotide von einer benachbarten SNV entfernt ist.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 5 Nukleotide von einer benachbarten SNV entfernt ist.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 6 Nukleotide von einer benachbarten SNV entfernt ist.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 7 Nukleotide von einer benachbarten SNV entfernt ist.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 8 Nukleotide von einer benachbarten SNV entfernt ist.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 9 Nukleotide von einer benachbarten SNV entfernt ist.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 10 Nukleotide von einer benachbarten SNV entfernt ist.
-
C. Referenzgenomsequenz
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Referenzgenomsequenz wenigstens ein Teil einer Nukleinsäure-Sequenzdatenbank (d. h. eines Referenzgenoms) sein, die aus genetischen Daten zusammengesetzt ist und das Genom einer Referenzkohorte darstellen soll. In einigen Fällen kann eine Referenzkohorte eine Sammlung von Individuen mit einem/einer spezifischen oder variierenden Genotyp, Haplotyp, Demographie, Geschlecht, Nationalität, Alter, ethnischer Zugehörigkeit, Verwandtschaft, körperlicher Verfassung (z. B. gesund oder mit der gleichen oder einer anderen Erkrankung diagnostiziert, wie einer spezifischen Art von Krebs) oder anderen Gruppierungen sein. Eine wie hierin offenbarte Referenzgenomsequenz kann ein Mosaik (oder eine Konsensussequenz) der Genomen von zwei oder mehr Individuen sein. Die Referenzgenomsequenz kann wenigstens einen Teil eines öffentlich zugänglichen Referenzgenoms oder eines privaten Referenzgenoms umfassen. Nicht einschränkende Beispiele für ein menschliches Referenzgenom beinhalten hg19, hg18, hg17, hg16 und hg38.
-
In einigen Beispielen kann die Referenzgenomsequenz wenigstens oder bis zu etwa 500 Nukleobasen, wenigstens oder bis zu etwa 1 Kilobase (kb), wenigstens oder bis zu etwa 2 kb, wenigstens oder bis zu etwa 3 kb, wenigstens oder bis zu etwa 4 kb, wenigstens oder bis zu etwa 5 kb, wenigstens oder bis zu etwa 6 kb, wenigstens oder bis zu etwa 7 kb, wenigstens oder bis zu etwa 8 kb, wenigstens oder bis zu etwa 9 kb, wenigstens oder bis zu etwa 10 kb, wenigstens oder bis zu etwa 20 kb, wenigstens oder bis zu etwa 30 kb, wenigstens oder bis zu etwa 40 kb, wenigstens oder bis zu etwa 50 kb, wenigstens oder bis zu etwa 60 kb, wenigstens oder bis zu etwa 70 kb, wenigstens oder bis zu etwa 80 kb, wenigstens oder bis zu etwa 90 kb, wenigstens oder bis zu etwa 100 kb, wenigstens oder bis zu etwa 200 kb, wenigstens oder bis zu etwa 300 kb, wenigstens oder bis zu etwa 400 kb, wenigstens oder bis zu etwa 500 kb, wenigstens oder bis zu etwa 600 kb, wenigstens oder bis zu etwa 700 kb, wenigstens oder bis zu etwa 800 kb, wenigstens oder bis zu etwa 900 kb, wenigstens oder bis zu etwa 1.000 kb, wenigstens oder bis zu etwa 2.000 kb, wenigstens oder bis zu etwa 3.000 kb, wenigstens oder bis zu etwa 4.000 kb, wenigstens oder bis zu etwa 5.000 kb, wenigstens oder bis zu etwa 6.000 kb, wenigstens oder bis zu etwa 7.000 kB, wenigstens oder bis zu etwa 8.000 kb, wenigstens oder bis zu etwa 9.000 kb, wenigstens oder bis zu etwa 10.000 kb, wenigstens oder bis zu etwa 20.000 kb, wenigstens oder bis zu etwa 30.000 kb, wenigstens oder bis zu etwa 40.000 kb, wenigstens oder bis zu etwa 50.000 kb, wenigstens oder bis zu etwa 60.000 kb, wenigstens oder bis zu etwa 70.000 kb, wenigstens oder bis zu etwa 80.000 kb, wenigstens oder bis zu etwa 90.000 kb, oder wenigstens oder bis zu etwa 100.000 kb umfassen.
-
In einigen Fällen kann es sich bei der Referenzgenomsequenz um das gesamte Referenzgenom oder um einen Teil (z. B. einen für die Erkrankung relevanten Teil) des Genoms handeln. Die Referenzgenomsequenz kann zum Beispiel aus wenigstens 1, 2, 3, 4, 5 oder mehr Genen bestehen, die bei bestimmten Arten von Krebs eine aberrante somatische Hypermutation aufweisen. In einigen Fällen kann die Referenzgenomsequenz eine ganze chromosomale Sequenz oder ein Fragment davon sein. In einigen Fällen kann die Referenzgenomsequenz zwei oder mehr (z. B. wenigstens 2, 3, 4, 5 oder mehr) verschiedene Teile des Referenzgenoms umfassen, die nicht nebeneinander liegen (z. B. innerhalb desselben Chromosoms oder von verschiedenen Chromosomen).
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Referenzgenomsequenz wenigstens ein Teil eines Referenzgenoms eines ausgewählten Individuums sein, wie etwa eines gesunden Individuums oder des Subjekts eines der hierin offenbarten Verfahren.
-
In einigen Fällen kann die Referenzgenomsequenz von einem Individuum abgeleitet werden, das kein Proband ist (z. B. von einem gesunden Kontrollindividuum). In einigen Fällen kann die Referenzgenomsequenz alternativ aus einer Probe des Subjekts abgeleitet werden. In einigen Beispielen kann die Probe eine gesunde Probe des Subjekts sein. Die gesunde Probe des Subjekts kann jede beliebige Zelle des Subjekts sein, die gesund ist, z. B. ein gesundes Leukozyt. Durch den Vergleich der Sequenzierungsdaten der Vielzahl zellfreier Nukleinsäuremoleküle (z. B. cfDNA-Moleküle) des Subjekts mit wenigstens einem Teil der genomischen Sequenz einer gesunden Zelle desselben Subjekt können, wie hierin offenbart, ein oder mehrere die Vielzahl von Phasenvarianten enthaltende zellfreie Nukleinsäuremoleküle identifiziert und analysiert werden. In einigen Beispielen kann es sich bei der Probe um eine erkrankte Probe des Subjekts, wie etwa eine erkrankte Zelle (z. B. eine Tumorzelle) oder einen soliden Tumor handeln. Die Referenzgenomsequenz kann durch Sequenzierung wenigstens eines Teils einer erkrankten Zelle des Subjekts oder durch Sequenzierung einer Vielzahl von zellfreien Nukleinsäuremolekülen erlangt werden, die aus dem soliden Tumor des Subjekts erlangt wurden. Sobald bei dem Subjekt eine bestimmte Erkrankung)z. B. eine Erkrankung) diagnostiziert wurde, kann die Referenzgenomsequenz des Subjekts, die die Vielzahl der Phasenvarianten umfasst, zur Ermittlung verwendet werden, ob der Proband zu zukünftigen Zeitpunkten immer noch die gleichen Phasenvarianten aufweist. In diesem Zusammenhang können beliebige neue Phasenvarianten, die zwischen der „erkrankten“ Referenzgenomsequenz des Subjekts und neuen zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet wurden, identifiziert wurden, indikativ für ein geringeres Ausmaß aberranter somatischer Hypermutation in bestimmten genomischen Loci sein (z. B. wenigstens eine Teilremission).
-
In verschiedenen Ausführungsformen können diagnostische Scans für beliebige Neoplasmentypen durchgeführt werden, einschließlich (aber nicht beschränkt auf) akute lymphatische Leukämie (ALL), akute myeloische Leukämie (AML), Analkrebs, Astrozytome, Basalzellkarzinom, Gallengangskrebs, Blasenkrebs, Brustkrebs, Burkitt-Lymphom, Gebärmutterhalskrebs, chronische lymphozytäre Leukämie (CLL), chronische myeloische Leukämie (CML), chronische myeloproliferative Neoplasmen, Darmkrebs, diffuses großzelliges B-Zell-Lymphom, Endometriumkrebs, Ependymom, Speiseröhrenkrebs, Östhesioneuroblastom, Ewing-Sarkom, Eileiterkrebs, follikuläres Lymphom, Gallenblasenkrebs, Magenkrebs, gastrointestinaler Karzinoidtumor, Haarzellenleukämie, Leberzellkrebs, Hodgkin-Lymphom, Hypopharynxkrebs, Kaposi-Sarkom, Nierenkrebs, Langerhans-Zell-Histiozytose, Kehlkopfkrebs, Leukämie, Leberkrebs, Lungenkrebs, Lymphom, Melanom, Merkel-Zell-Krebs, Mesotheliom, Mundkrebs, Neuroblastom, Non-Hodgkin-Lymphom, nicht-kleinzelliger Lungenkrebs, Osteosarkom, Eierstockkrebs, Bauchspeicheldrüsenkrebs, neuroendokrine Tumore der Bauchspeicheldrüse, Rachenkrebs, Hypophysentumor, Prostatakrebs, Rektumkarzinom, Nierenzellkrebs, Retinoblastom, Hautkrebs, kleinzelliger Lungenkrebs, Dünndarmkrebs, Plattenepithelkarzinom des Halses, T-Zell-Lymphom, Hodenkrebs, Thymom, Schilddrüsenkrebs, Gebärmutterkrebs, Vaginalkrebs und vaskuläre Tumore.
-
In einer Reihe von Ausführungsformen wird ein diagnostischer Scan zum frühen Nachweis von Krebs eingesetzt. In einigen Ausführungsformen weist ein diagnostischer Scan Krebs bei Individuen mit Krebs im Stadium I, II oder III nach. In einigen Ausführungsformen wird ein diagnostischer Scan zum Nachweis von MRD oder Tumorlast verwendet. In einigen Ausführungsformen wird ein diagnostischer Scan verwendet, um den Verlauf (z. B. Progression oder Regression) der Behandlung zu ermitteln. Basierend auf dem diagnostischen Scan kann ein klinisches Verfahren und/oder eine Behandlung durchgeführt werden.
-
D. Nukleinsäuresonden
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz basierend auf einer der Subjekt-Referenzgenomsequenzen der vorliegenden Offenbarung gestaltet werden. In einigen Fällen kann der Nukleinsäuresondensatz basierend auf der Vielzahl von Phasenvarianten gestaltet werden, die durch den Vergleich von (i) Sequenzierungsdaten aus einem soliden Tumor des Subjekts und (ii) Sequenzierungsdaten aus einer gesunden Zelle des Subjekts oder einer gesunden Kohorte, wie hierin offenbart identifiziert wurden. Der Nukleinsäuresondensatz kann basierend auf der Vielzahl von Phasenvarianten gestaltet werden, die durch den Vergleich von (i) Sequenzierungsdaten aus einem soliden Tumor des Subjekts und (ii) Sequenzierungsdaten aus einer gesunden Zelle des Subjekts identifiziert wurden. Der Nukleinsäuresondensatz kann basierend auf der Vielzahl von Phasenvarianten gestaltet werden, die durch den Vergleich von (i) Sequenzierungsdaten aus einem soliden Tumor des Subjekts und (ii) Sequenzierungsdaten aus einer gesunden Zelle einer gesunden Kohorte identifiziert wurden.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Nukleinsäuresondensatz zur Hybridisierung mit Sequenzen der mit der Erkrankung assoziierten genomischen Loci gestaltet. Wie hierin offenbart, können die mit der Erkrankung assoziierten genomischen Loci als eine aberrante somatische Hypermutation erfahrend oder aufweisend bestimmt werden, wenn der Proband die Erkrankung hat. Alternativ dazu sind die Nukleinsäuresondensätze zur Hybridisierung mit Sequenzen stereotyper Bereiche gestaltet.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz zur Hybridisierung mit wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 %, wenigstens etwa 95 %, wenigstens etwa 99 % oder wenigstens etwa 100 % der in Tabelle 1 identifizierten Genombereiche gestaltet sein.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz zur Hybridisierung mit wenigstens einem Teil der zellfreien Nukleinsäure (z. B. cfDNA-)Molekülen gestaltet sein, die von wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 %, wenigstens etwa 95 %, wenigstens etwa 99 % oder etwa 100 % der in Tabelle 1 identifizierten Genombereiche abgeleitet sind.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann jede Nukleinsäuresonde des Nukleinsäuresondensatzes wenigstens etwa 50 %, wenigstens etwa 55 %, wenigstens etwa 60 %, wenigstens etwa 65 %, wenigstens etwa 70 %, wenigstens etwa 75 %, wenigstens etwa 80 %, wenigstens etwa 85 %, wenigstens etwa 90 % , wenigstens etwa 95 % Sequenzidentität, wenigstens etwa 99 % oder wenigstens etwa 100 % Sequenzidentität mit einer aus Tabelle 6 ausgewählten Sondensequenz aufweisen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz wenigstens etwa 1 %, wenigstens etwa 2 %, wenigstens etwa 3 %, wenigstens etwa 4 %, wenigstens etwa 5 %, wenigstens etwa 6 %, wenigstens etwa 7 %, wenigstens etwa 8 %, wenigstens etwa 9 %, wenigstens etwa 10 %, wenigstens etwa 15 %, wenigstens etwa 20 %, wenigstens etwa 25 %, wenigstens etwa 30 %, wenigstens etwa 35 %, wenigstens etwa 40 %, wenigstens etwa 45 %, wenigstens etwa 50 %, wenigstens etwa 55 %, wenigstens etwa 60 %, wenigstens etwa 65 %, wenigstens etwa 70 %, wenigstens etwa 75 %, wenigstens etwa 80 %, wenigstens etwa 85 %, wenigstens etwa 90 %, wenigstens etwa 95 %, wenigstens etwa 99 % oder etwa 100 % der Sondensequenzen in Tabelle 6 umfassen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz zur Abdeckung eines oder mehrerer Zielgenombereich gestaltet sein, die wenigstens oder bis zu etwa 500 Nukleobasen, wenigstens oder bis zu etwa 1 Kilobase (kb), wenigstens oder bis zu etwa 2 kb, wenigstens oder bis zu etwa 3 kb, wenigstens oder bis zu etwa 4 kb, wenigstens oder bis zu etwa 5 kb, wenigstens oder bis zu etwa 6 kb, wenigstens oder bis zu etwa 7 kb, wenigstens oder bis zu etwa 8 kb umfassen, wenigstens oder bis zu etwa 9 kb, wenigstens oder bis zu etwa 10 kb, wenigstens oder bis zu etwa 20 kb, wenigstens oder bis zu etwa 30 kb, wenigstens oder bis zu etwa 40 kb, wenigstens oder bis zu etwa 50 kb, wenigstens oder bis zu etwa 60 kb, wenigstens oder bis zu etwa 70 kb, wenigstens oder bis zu etwa 80 kb, wenigstens oder bis zu etwa 90 kb, wenigstens oder bis zu etwa 100 kb, wenigstens oder bis zu etwa 200 kb, wenigstens oder bis zu etwa 300 kb, wenigstens oder bis zu etwa 400 kb, oder wenigstens oder bis zu etwa 500 kb umfassen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann ein Zielgenombereich (z. B. ein genomischer Ziellocus) des einen oder mehrerer Zielgenombereiche höchstens etwa 200 Nukleobasen, höchstens etwa 300 Nukleobasen, 400 Nukleobasen, höchstens etwa 500 Nukleobasen, höchstens etwa 600 Nukleobasen, höchstens etwa 700 Nukleobasen, höchstens etwa 800 Nukleobasen, höchstens etwa 900 Nukleobasen, höchstens etwa 1 kb, höchstens etwa 2 kb, höchstens etwa 3 kb, höchstens etwa 4 kb, höchstens etwa 5 kb, höchstens etwa 6 kb, höchstens etwa 7 kb, höchstens etwa 8 kb, höchstens etwa 9 kb, höchstens etwa 10 kb, höchstens etwa 11 kb, höchstens etwa 12 kb, höchstens etwa 13 kb, höchstens etwa 14 kb, höchstens etwa 15 kb, höchstens etwa 16 kb, höchstens etwa 17 kb, höchstens etwa 18 kb, höchstens etwa 19 kb, höchstens etwa 20 kb, höchstens etwa 25 kb, höchstens etwa 30 kb, höchstens etwa 35 kb, höchstens etwa 40 kb, höchstens etwa 45 kb, höchstens etwa 50 kb, oder höchstens etwa 100 kb umfassen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz wenigstens oder bis zu etwa 10, wenigstens oder bis zu etwa 20, wenigstens oder bis zu etwa 30, wenigstens oder bis zu etwa 40, wenigstens oder bis zu etwa 50, wenigstens oder bis zu etwa 60, wenigstens oder bis zu etwa 70, wenigstens oder bis zu etwa 80, wenigstens oder bis zu etwa 90, wenigstens oder bis zu etwa 100, wenigstens oder bis zu etwa 200, wenigstens oder bis zu etwa 300, wenigstens oder bis zu etwa 400, wenigstens oder bis zu etwa 500, wenigstens oder bis zu etwa 600, wenigstens oder bis zu etwa 700, wenigstens oder bis zu etwa 800, wenigstens oder bis zu etwa 900, wenigstens oder bis zu etwa 1.000, wenigstens oder bis zu etwa 2.000, wenigstens oder bis zu etwa 3.000, wenigstens oder bis zu etwa 4.000 oder wenigstens oder bis zu etwa 5.000 verschiedene Nukleinsäuresonden umfassen, die zur Hybridisierung mit verschiedenen Ziel-Nukleinsäuresequenzen gestaltet sind.
-
In einigen Ausführungsformen eines der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz eine Länge von wenigstens oder bis zu etwa 50, wenigstens oder bis zu etwa 55, wenigstens oder bis zu etwa 60, wenigstens oder bis zu etwa 65, wenigstens oder bis zu etwa 70, wenigstens oder bis zu etwa 75, wenigstens oder bis zu etwa 80, wenigstens oder bis zu etwa 85, wenigstens oder bis zu etwa 90, wenigstens oder bis zu etwa 95, oder wenigstens oder bis zu etwa 100 Nukleotiden aufweisen.
-
In einem Aspekt sieht die vorliegende Offenbarung eine Zusammensetzung vor, umfassend einen Ködersatz, umfassend einen beliebigen Satz der hierin offenbaren Nukleinsäuresondensätze. Die einen solchen Ködersatz umfassende Zusammensetzung kann für beliebige der hierin offenbarten Verfahren verwendet werden. In einigen Fällen kann der Nukleinsäuresondensatz für das Pull-Down (oder die Erfassung) von cfDNA-Molekülen gestaltet sein. In einigen Fällen kann der Nukleinsäuresondensatz für das Pull-Down (oder die Erfassung) von cfRNA-Molekülen gestaltet sein.
-
In einigen Ausführungsformen kann der Ködersatz einen Nukleinsäuresondensatz umfassen, der für das Pull-Down zellfreier Nukleinsäuremoleküle (z. B. cfDNA-Moleküle), die aus den in Tabelle 1 aufgeführten Genombereichen abgeleitet sind, gestaltet ist. Der Nukleinsäuresondensatz kann für das Pull-Down zellfreier Nukleinsäuremoleküle gestaltet sein, die aus wenigstens oder bis zu etwa 1 %, wenigstens oder bis zu etwa 2 %, wenigstens oder bis zu etwa 3 %, wenigstens oder bis zu etwa 4 %, wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 6 %, wenigstens oder bis zu etwa 7 %, wenigstens oder bis zu etwa 8 %, wenigstens oder bis zu etwa 9 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 %, wenigstens oder bis zu etwa 50 %, wenigstens oder bis zu etwa 55 %, wenigstens oder bis zu etwa 60 %, wenigstens oder bis zu etwa 65 %, wenigstens oder bis zu etwa 70 %, wenigstens oder bis zu etwa 75 %, wenigstens oder bis zu etwa 80 %, wenigstens oder bis zu etwa 85 %, wenigstens oder bis zu etwa 90 %, wenigstens oder bis zu etwa 95 %, wenigstens oder bis zu etwa 99 % oder etwa 100 % der in Tabelle 1 aufgeführten Genombereiche abgeleitet sind. In einigen Fällen kann der Nukleinsäuresondensatz für das Pull-Down von cfDNA-Molekülen gestaltet sein. In manchen Fällen kann der Nukleinsäuresondensatz für das Pull-Down von cfRNA-Molekülen gestaltet sein.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen kann eine individuelle Nukleinsäuresonde (oder jede Nukelinsäuresonde) des Nukleinsäuresondensatzes ein Pull-Down-Tag umfassen. Der Pull-Down-Tag kann zur Anreicherung einer Probe (z. B. einer die Vielzahl von Nukleinsäuremolekülen umfassenden Probe, die von dem Subjekt erlangt oder abgeleitet wurde) für eine spezifische Untergruppe verwendet werden (z. B. für zellfreie Nukleinsäuremoleküle, die die Vielzahl von Phasenvarianten umfassen, wie hierin offenbart).
-
In einigen Fällen kann das Pull-Down-Tag einen Nukleinsäure-Barcode umfassen (z. B. auf einer oder beiden Seiten der Nukleinsäuresonde). Durch die Verwendung von Kügelchen oder Substraten, die Nukleinsäuresequenzen mit Komplementarität zum Nukleinsäure-Barcode enthalten, kann der Nukleinsäure-Barcode zum Pull-Down und Anreichern für beliebige Nukleinsäuresonden verwendet werden, die an ein zellfreies Zielnukleinsäuremolekül hybridisiert sind. Alternativ oder zusätzlich kann der Nukleinsäure-Barcode zur Identifizierung des zellfreien Zielnukleinsäuremoleküls aus beliebigen Sequenzierungsdaten (z. B. Sequenzierung durch Amplifikation) verwendet werden, die durch Verwendung eines der hierin offenbaren Nukleinsäuresondensätze erlangt wurden.
-
In einigen Fällen kann der Pull-Down-Tag Affinitätszielgruppe umfassen, die von einer Affinitätsbindungsgruppe spezifisch erkannt und gebunden werden kann. Die Affinitätsbindungsgruppe kann die Affinitätszielgruppe zur Bildung eines Affinitätspaares spezifisch binden. In einigen Fällen kann die Affinitätszielgruppe durch Verwendung von Kügelchen oder Substraten, die die Affinitätsbindungsgruppe umfassen, zum Pull-Down und zur Anreicherung beliebiger Nukleinsäuresonden verwendet werden, die an ein zellfreies Zielnukleinsäuremolekül hybridisiert sind. Alternativ kann der Pull-Down-Tag die Affinitätsbindungsgruppe umfassen, während die Kügelchen/Substrate die Affinitätszielgruppe umfassen können. Nicht einschränkende Beispiele für das Affinitätspaar können Biotin/Avidin, Antikörper/Antigen, Biotin/Streptavidin, Metall/Chelator, Ligand/Rezeptor, Nukleinsäure und Bindungsprotein sowie komplementäre Nukleinsäuren beinhalten. In einem Beispiel kann der Pull-Down-Tag Biotin umfassen.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen kann die Länge eines zellfreien Zielnukleinsäuremoleküls (z. B. cfDNA-Molekül), das von einer beliebigen Subjektnukleinsäuresonde heruntergezogen werden soll, etwa 100 Nukleotide bis etwa 200 Nukleotide betragen. Die Länge des zellfreien Zielnukleinsäuremoleküls kann wenigstens etwa 100 Nukleotide betragen. Die Länge des zellfreien Zielnukleinsäuremoleküls kann höchstens etwa 200 Nukleotide betragen. Die Länge des zellfreien Zielnukleinsäuremoleküls kann etwa 100 Nukleotide bis etwa 110 Nukleotide, etwa 100 Nukleotide bis etwa 120 Nukleotide, etwa 100 Nukleotide bis etwa 130 Nukleotide, etwa 100 Nukleotide bis etwa 140 Nukleotide, etwa 100 Nukleotide bis etwa 150 Nukleotide, etwa 100 Nukleotide bis etwa 160 Nukleotide betragen, etwa 100 Nukleotide bis etwa 170 Nukleotide, etwa 100 Nukleotide bis etwa 180 Nukleotide, etwa 100 Nukleotide bis etwa 190 Nukleotide, etwa 100 Nukleotide bis etwa 200 Nukleotide, etwa 110 Nukleotide bis etwa 120 Nukleotide, etwa 110 Nukleotide bis etwa 130 Nukleotide, etwa 110 Nukleotide bis etwa 140 Nukleotide, etwa 110 Nukleotide bis etwa 150 Nukleotide, etwa 110 Nukleotide bis etwa 160 Nukleotide, etwa 110 Nukleotide bis etwa 170 Nukleotide, etwa 110 Nukleotide bis etwa 180 Nukleotide, etwa 110 Nukleotide bis etwa 190 Nukleotide, etwa 110 Nukleotide bis etwa 200 Nukleotide, etwa 120 Nukleotide bis etwa 130 Nukleotide, etwa 120 Nukleotide bis etwa 140 Nukleotide, etwa 120 Nukleotide bis etwa 150 Nukleotide, etwa 120 Nukleotide bis etwa 160 Nukleotide, etwa 120 Nukleotide bis etwa 170 Nukleotide, etwa 120 Nukleotide bis etwa 180 Nukleotide, etwa 120 Nukleotide bis etwa 190 Nukleotide, etwa 120 Nukleotide bis etwa 200 Nukleotide, etwa 130 Nukleotide bis etwa 140 Nukleotide, etwa 130 Nukleotide bis etwa 150 Nukleotide, etwa 130 Nukleotide bis etwa 160 Nukleotide, etwa 130 Nukleotide bis etwa 170 Nukleotide, etwa 130 Nukleotide bis etwa 180 Nukleotide, etwa 130 Nukleotide bis etwa 190 Nukleotide, etwa 130 Nukleotide bis etwa 200 Nukleotide, etwa 140 Nukleotide bis etwa 150 Nukleotide, etwa 140 Nukleotide bis etwa 160 Nukleotide, etwa 140 Nukleotide bis etwa 170 Nukleotide, etwa 140 Nukleotide bis etwa 180 Nukleotide, etwa 140 Nukleotide bis etwa 190 Nukleotide, etwa 140 Nukleotide bis etwa 200 Nukleotide, etwa 150 Nukleotide bis etwa 160 Nukleotide, etwa 150 Nukleotide bis etwa 170 Nukleotide, etwa 150 Nukleotide bis etwa 180 Nukleotide, etwa 150 Nukleotide bis etwa 190 Nukleotide, etwa 150 Nukleotide bis etwa 200 Nukleotide, etwa 160 Nukleotide bis etwa 170 Nukleotide, etwa 160 Nukleotide bis etwa 180 Nukleotide, etwa 160 Nukleotide bis etwa 190 Nukleotide, etwa 160 Nukleotide bis etwa 200 Nukleotide, etwa 170 Nukleotide bis etwa 180 Nukleotide, etwa 170 Nukleotide bis etwa 190 Nukleotide, etwa 170 Nukleotide bis etwa 200 Nukleotide, etwa 180 Nukleotide bis etwa 190 Nukleotide, etwa 180 Nukleotide bis etwa 200 Nukleotide, oder etwa 190 Nukleotide bis etwa 200 Nukleotide betragen. Die Länge des zellfreien Zielnukleinsäuremoleküls kann etwa 100 Nukleotide, etwa 110 Nukleotide, etwa 120 Nukleotide, etwa 130 Nukleotide, etwa 140 Nukleotide, etwa 150 Nukleotide, etwa 160 Nukleotide, etwa 170 Nukleotide, etwa 180 Nukleotide, etwa 190 Nukleotide oder etwa 200 Nukleotide betragen. In einigen Beispielen kann die Länge des zellfreien Zielnukleinsäuremoleküls zwischen etwa 100 Nukleotiden und etwa 180 Nukleotiden liegen.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen können die Genombereiche mit einer Erkrankung assoziiert sein. Die Genombereiche können als aberrante somatische Hypermutation aufweisend bestimmt werden, wenn ein Proband die Erkrankung hat. Die Erkrankung kann zum Beispiel ein B-Zell-Lymphom oder eine Unterform davon umfassen, wie das diffuse großzellige B-Zell-Lymphom, das follikuläre Lymphom, das Burkitt-Lymphom und die chronische lymphatische B-Zell-Leukämie. Weitere Einzelheiten zu dieser Erkrankung sind nachfolgend angegeben.
-
In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst die Zusammensetzung ferner eine Vielzahl von zellfreien Nukleinsäuremolekülen (z. B. cfDNA), die von dem Subjekt erlangt oder abgeleitet wurden.
-
E. Diagnostische oder therapeutische Anwendungen
-
Mehrere Ausführungsformen sind auf die Durchführung eines diagnostischen Scans der zellfreien Nukleinsäuren eines Individuums und anschließend, basierend auf den Krebs indizierenden Ergebnissen des Scans, auf die Durchführung weiterer klinischer Verfahren und/oder die Behandlung des Individuums gerichtet. Gemäß verschiedener Ausführungsformen können zahlreiche Arten von Neoplasmen nachgewiesen werden.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren, kann das Verfahren ferner die Bestimmung, dass der Proband die Erkrankung hat oder die Bestimmung eines Grades oder Status der Erkrankung des Subjekts, basierend auf dem einen oder mehreren zellfreien Nukleinsäuremolekülen, die die Vielzahl von Phasenvarianten umfassen, umfassen. In einigen Fällen kann das Verfahren ferner die Bestimmung umfassen, dass das eine oder die mehreren zellfreien Nukleinsäuremoleküle (die jeweils als eine Vielzahl von Phasenvarianten umfassend identifiziert wurden) aus einer mit der Erkrankung (z. B. Krebs) assoziierten Probe abgeleitet sind, basierend auf einer statistischen Modellanalyse (d. h. einer molekularen Analyse). Das Verfahren kann beispielsweise die Verwendung eines oder mehrerer Algorithmen (z. B. Monte-Carlos-Simulation) zur Bestimmung einer ersten Wahrscheinlichkeit, dass eine zellfreie Nukleinsäure, die als eine Vielzahl von Phasenvarianten umfassend identifiziert wurde, mit einer ersten Erkrankung assoziiert ist oder von ihr stammt (z. B. 80%), und einer zweiten Wahrscheinlichkeit, dass dieselbe zellfreie Nukleinsäure mit einer zweiten Erkrankung assoziiert ist oder von einer zweiten Erkrankung (oder von einer gesunden Zelle) stammt ist (z. B. 20%), umfassen. In einigen Fällen kann das Verfahren die Bestimmung einer Wahrscheinlichkeit, dass der Proband eine oder mehrere Erkrankungen hat, basierend auf der Analyse des einen oder der mehreren zellfreien Nukleinsäuremoleküle, von denen jedes als eine Vielzahl von Phasenvarianten umfassend identifiziert wurde, umfassen (d. h. eine Makro- oder globale Analyse). Zum Beispiel kann das Verfahren die Verwendung eines oder mehrerer Algorithmen (z. B. umfassend ein oder mehrere mathematische Modelle, wie hierin offenbart, wie z. B. Binomialstichproben) zur Analyse einer Vielzahl zellfreier Nukleinsäuremoleküle umfassen, von denen jedes als eine Vielzahl von Phasenvarianten umfassend identifiziert wurde, um dadurch eine erste Wahrscheinlichkeit des Subjekts, eine erste Erkrankung zu haben (z. B. 80 %) und eine zweite Wahrscheinlichkeit des Subjekts, eine zweite Erkrankung zu haben (oder gesund zu sein) (z. B. 20 %) zu bestimmen.
-
Die hierin offenbarte statistische Modellanalyse kann eine Näherungslösung durch eine numerische Annäherung wie ein binomiales Modell, ein ternäres Modell, eine Monte-Carlo-Simulation oder ein Finite-Differenzen-Verfahren sein. In einem Beispiel kann die hierin verwendete statistische Modellanalyse eine statistische Monte-Carlo-Analyse sein. In einem anderen Beispiel kann die hierin verwendete statistische Modellanalyse eine binomiale oder ternäre Modellanalyse sein.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das Verfahren die Überwachung eines Verlaufs der Erkrankung des Subjekts basierend auf dem einen oder mehreren identifizierten zellfreien Nukleinsäuremolekülen umfassen, sodass jedes der identifizierten zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten umfasst. In einigen Fällen kann der Verlauf der Erkrankung eine Verschlimmerung der Erkrankung sein, wie in der vorliegenden Offenbarung beschrieben (z. B. die Entwicklung von Krebs im Stadium I zu Krebs im Stadium III). In einigen Fällen kann der Verlauf der Erkrankung wenigstens eine Teilremission der Erkrankung sein, wie in der vorliegenden Offenbarung beschrieben (z. B. Downstaging von Krebs im Stadium IV zu Krebs im Stadium II). Alternativ kann in manchen Fällen der Verlauf der Erkrankung zwischen zwei verschiedenen Zeitpunkten im Wesentlichen gleich bleiben, wie in der vorliegenden Offenbarung beschrieben. In einem Beispiel kann das Verfahren die Bestimmung von Wahrscheinlichkeiten oder Wahrscheinlichkeiten verschiedener Verläufe der Erkrankung des Subjekts umfassen. Das Verfahren kann beispielsweise die Verwendung eines oder mehrerer Algorithmen (z. B. umfassend ein oder mehrere hierin offenbarte mathematische Modelle, wie z. B. Binomialstichproben) zur Bestimmung einer ersten Wahrscheinlichkeit, dass die Erkrankung des Subjekts schlechter ist als zuvor (z. B. 20 %), einer zweiten Wahrscheinlichkeit einer zumindest Teilremission der Erkrankung (z. B. 70 %) und einer dritten Wahrscheinlichkeit, dass die Erkrankung des Subjekts unverändert ist (z. B. 10 %), umfassen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das Verfahren die Durchführung eines anderen Verfahrens (z. B. Folgediagnoseverfahren) umfassen, um die Erkrankung des Subjekts, welche Erkrankung bestimmt wurde und/oder des beobachteteten Verlaufs davon zu bestätigen, wie in der vorliegenden Offenbarung vorgesehen. Nicht einschränkende Beispiele für ein anderes Verfahren können eine körperliche Untersuchung, eine medizinische Bildgebung, einen Gentest, eine Mammographie, eine Endoskopie, eine Stuhlprobe, einen Pap-Test, einen Alpha-Fetoprotein-Bluttest, einen CA-125-Test, einen Test auf prostataspezifisches Antigen (PSA), eine Biopsieentnahme, eine Knochenmarkspunktion und Tests zum Nachweis von Tumormarkern beinhalten. Die medizinische Bildgebung beinhaltet (ist aber nicht beschränkt auf) Röntgen, Magnetresonanztomographie (MRT), Computertomographie (CT), Ultraschall und Positronen-Emissions-Tomographie (PET). Die Endoskopie beinhaltet (ist aber nicht beschränkt auf) Bronchoskopie, Koloskopie, Kolposkopie, Zystoskopie, Ösophagoskopie, Gastroskopie, Laparoskopie, Neuroendoskopie, Proktoskopie und Sigmoidoskopie.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das Verfahren die Bestimmung einer Behandlung für die Erkrankung des Subjekts basierend auf dem einen oder mehreren identifizierten zellfreien Nukleinsäuremolekülen umfassen, wobei jedes identifizierte zellfreie Nukleinsäuremolekül eine Vielzahl von Phasenvarianten umfasst. In einigen Fällen kann die Behandlung basierend auf (i) der bestimmten Erkrankung des Subjekts und/oder (ii) dem bestimmten Verlauf der Erkrankung des Subjekts bestimmt werden. Darüber hinaus kann die Behandlung basierend auf einem oder mehreren der folgenden zusätzlichen Faktoren bestimmt werden: Geschlecht, Nationalität, Alter, ethnische Zugehörigkeit und andere körperliche Erkrankungen des Subjekts. In einigen Beispielen kann die Behandlung basierend auf einem oder mehreren Merkmalen der Vielzahl von Phasenvarianten der identifizierten zellfreien Nukleinsäuremoleküle, wie hierin offenbart, bestimmt werden.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren darf der Proband keiner Behandlung der Erkrankung unterzogen worden sein, d. h. der Proband darf nicht mit der Erkrankung (z. B. einem Lymphom) diagnostiziert worden sein. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Proband vor einem beliebigen Subjektverfahren der vorliegenden Offenbarung einer Behandlung der Erkrankung unterzogen worden sein. In einigen Fällen können die hierin offenbarten Verfahren zur Überwachung des Verlaufs der bei dem Subjekt diagnostizierten Erkrankung durchgeführt werden, um (i) die Wirksamkeit der bisherigen Behandlung zu bestimmen und (ii) zu beurteilen, ob die Behandlung beibehalten, modifiziert oder zugunsten einer neuen Behandlung abgebrochen werden soll.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können nicht einschränkende Beispiele für eine Behandlung (z. B. frühere Behandlung, neue Behandlung, die basierend auf den Verfahren der vorliegenden Offenbarung zu bestimmen ist, usw.) Chemotherapie, Radiotherapie, Chemoradiotherapie, Immuntherapie, adoptive Zelltherapie (z. B. chimäre Antigenrezeptor-(CAR-)T-Zelltherapie, CAR-NK-Zelltherapie, modifizierte T-Zellrezeptor-(TCR-)T-Zelltherapie usw.), Hormontherapie, gezielte Arzneimitteltherapie, Operation, Transplantation, Transfusion oder medizinische Überwachung beinhalten.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Erkrankung eine Erkrankung umfassen. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Erkrankung Neoplasma, Krebs oder Tumor umfassen. In einem Beispiel kann die Erkrankung einen soliden Tumor umfassen. In einem anderen Beispiel kann die Erkrankung ein Lymphom, wie das B-Zell-Lymphom (BCL), umfassen. Nicht einschränkende Beispiele für BCL können das diffuse großzellige B-Zell-Lymphom (DLBCL), das follikuläre Lymphom (FL), das Burkitt-Lymphom (BL), die chronische lymphatische B-Zell-Leukämie (CLL), das Marginalzonen-B-Zell-Lymphom (MZL) und das Mantelzell-Lymphom (MCL) beinhalten.
-
Wie hierin offenbart, kann die Behandlung einer Erkrankung eines Subjekts die Verabreichung eines oder mehrerer therapeutischer Mittel an den Subjekt umfassen. Das eine oder die mehreren therapeutischen Arzneimittel können dem Subjekt auf eine oder mehrere der folgenden Arten verabreicht werden: oral, intraperitoneal, intravenös, intraarteriell, transdermal, intramuskulär, liposomal, über eine lokale Verabreichung mittels Katheter oder Stent, subkutan, intraadiposal und intrathekal.
-
Nicht einschränkende Beispiele für therapeutische Arzneimittel können zytotoxische Wirkstoffe, Chemotherapeutika, wachstumshemmende Wirkstoffe, in der Strahlentherapie verwendete Wirkstoffe, Anti-Angiogenese-Wirkstoffe, apoptotische Wirkstoffe, Anti-Tubulin-Wirkstoffe und andere Wirkstoffe zur Behandlung von Krebs beinhalten, zum Beispiel Anti-CD20-Antikörper, Anti-PD1-Antikörper (z. B., Pembrolizumab), Thrombozyten-Wachstumsfaktor-Inhibitoren (z. B. GLEEVEC™ (Imatinib Mesylat)), ein COX-2-Inhibitor (z. B. Celecoxib), Interferone, Zytokine, Antagonisten (z. B. neutralisierende Antikörper), die an eines oder mehrere der folgenden Ziele binden PDGFR-ß, BlyS, APRIL, BCMA-Rezeptor(en), TRAIL/Apo2, andere bioaktive und organischchemische Wirkstoffe und dergleichen.
-
Nicht einschränkende Beispiele für ein zytotoxisches Agens können radioaktive Isotope (z. B. At211, I131, 1125, Y90, Re186, Re188, Sm153, Bi212, P32 und radioaktive Isotope von Lu), Chemotherapeutika, z. B., Methotrexat, Adriamycin, Vinca-Alkaloide (Vincristin, Vinblastin, Etoposid), Doxorubicin, Melphalan, Mitomycin C, Chlorambucil, Daunorubicin oder andere Interkalationsmittel, Enzyme und Fragmente davon wie nukleolytische Enzyme, Antibiotika und Toxine wie niedermolekulare Toxine oder enzymatisch aktive Toxine bakteriellen, pilzlichen, pflanzlichen oder tierischen Ursprungs beinhalten.
-
Nicht einschränkende Beispiele eines chemotherapeutischen Agens können Alkylierungsmittel wie Thiotepa und CYTOXAN® Cyclophosphamid; Alkylsulfonate wie Busulfan, Improsulfan und Piposulfan; Aziridine wie Benzodopa, Carboquon, Meturedopa und Uredopa; Ethylenimine und Methylamelamine einschließlich Altretamin, Triethylenemelamin, Triethylenphosphoramid, Triethiylenthiophosphoramid und Trimethylolmelamin; Acetogenine (insbesondere Bullatacin und Bullatacinon); Delta-9-Tetrahydrocannabinol (Dronabinol, MARINOL®); Beta-Lapachon; Lapachol; Colchicine; Betulinsäure; Camptothecin (einschließlich des synthetischen Analogons Topotecan (HYCAMTIN®), CPT-11 (Irinotecan, CAMPTOSAR®), Acetylcamptothecin, Scopolectin und 9-Aminocamptothecin); Bryostatin; Callystatin; CC-1065 (einschließlich seiner synthetischen Analoga Adozelesin, Carzelesin und Bizelesin); Podophyllotoxin; Podophyllinsäure; Teniposid; Cryptophycine (insbesondere Cryptophycin 1 und Cryptophycin 8); Dolastatin; Duocarmycin (einschließlich der synthetischen Analoga KW-2189 und CB1-TM1); Eleutherobin; Pancratistatin; ein Sarkodictyin; Spongistatin; Stickstoffsenf wie Chlorambucil, Chlornaphazin, Cyclophosphamid, Estramustin, Ifosfamid, Mechlorethamin, Mechlorethaminoxidhydrochlorid, Melphalan, Novembichin, Phenesterin, Prednimustin, Trofosfamid, Uracil Senf; Nitrosoharnstoffe wie Carmustin, Chlorozotocin, Fotemustin, Lomustin, Nimustin und Ranimnustin; Antibiotika wie die Enediyne-Antibiotika; Dynemicin, einschließlich Dynemicin A; ein Espiramicina; sowie Neocarzinostatin Chromophor und verwandte Chromoproteine enediyne Antibiotika-Chromophore), Aclacinomycine, Actinomycin, Anthramycin, Azaserin, Bleomycine, Cactinomycin, Carabicin, Carminomycin, Carzinophilin, Chromomycinis, Dactinomycin, Daunorubicin, Detorubicin, 6-Diazo-5-oxo-L-Norleucin, ADRIAMYCIN® Doxorubicin (einschließlich Morpholino-Doxorubicin, Cyanomorpholino-Doxorubicin, 2-Pyrrolino-Doxorubicin und Deoxydoxorubicin), Epirubicin, Esorubicin, Idarubicin, Marcellomycin, Mitomycine wie Mitomycin C, Mycophenolsäure, Nogalamycin, Olivomycine, Peplomycin, Potfiromycin, Puromycin, Quelamycin, Rodorubicin, Streptonigrin, Streptozocin, Tubercidin, Ubenimex, Zinostatin, Zorubicin; Anti-Metaboliten wie Methotrexat und 5-Fluorouracil (5-FU); Folsäure-Analoga wie Denopterin, Methotrexat, Pteropterin, Trimetrexat; Purin-Analoga wie Fludarabin, 6-Mercaptopurin, Thiamiprin, Thioguanin; Pyrimidin-Analoga wie Ancitabin, Azacitidin, 6-Azauridin, Carmofur, Cytarabin, Dideoxyuridin, Doxifluridin, Enocitabin, Floxuridin; Androgene wie Calusteron, Dromostanolonpropionat, Epitiostanol, Mepitiostan, Testolacton; Antiadrenale wie Aminoglutethimid, Mitotan, Trilostan; Folsäureauffüller wie Folinsäure; Aceglatone; Aldophosphamidglykosid; Aminolävulinsäure; Eniluracil; Amsacrine; Bestrabucil; Bisantren; Edatraxat; Defofamin; Demecolcin; Diaziquon; Eflornithin; Elliptiniumacetat; ein Epothilon; Etoglucid; Galliumnitrat; Hydroxyharnstoff; Lentinan; Lonidainin; Maytansinoide wie Maytansin und Ansamitocine; Mitoguazon; Mitoxantron; Mopidanmol; Nitraerin; Pentostatin; Phenamet; Pirarubicin; Losoxantron; 2-Ethylhydrazid; Procarbazin; PSK® Polysaccharid-Komplex (JHS Natural Products, Eugene, Oreg.); Razoxan; Rhizoxin; Sizofiran; Spirogermanium; Tenuazonsäure; Triazichon; 2,2',2''-Trichlortriethylamin; Trichothecene (insbesondere T-2-Toxin, Verrucarin A, Roridin A und Anguidin); Urethan; Vindesin (ELDISINE®, FILDESIN®); Dacarbazin; Mannomustin; Mitobronitol; Mitolactol; Pipobroman; Gacytosin; Arabinosid („Ara-C“); Thiotepa; Taxoide, zum Beispiel Taxane, die TAXOL® Paclitaxel (Bristol-Myers Squibb Oncology, Princeton, N. J.), ABRAXANE™ Cremophor-freie, Albuminentwickelte Nanopartikel-Formulierung von Paclitaxel (American Pharmaceutical Partners, Schaumberg, Ill.) und TAXOTEREE Docetaxel (Rhöne-Poulenc Rorer, Antony, Frankreich); Chlorambucil; Gemcitabin (GEMZAR®); 6-Thioguanin; Mercaptopurin; Methotrexat; Platinanaloga wie Cisplatin und Carboplatin; Vinblastin (VELBAN®); Platin; Etoposid (VP-16); Ifosfamid; Mitoxantron; Vincristin (ONCOVIN®); Oxaliplatin; Leucovovin; Vinorelbin (NAVELBINE®); Novantron; Edatrexat; Daunomycin; Aminopterin; Ibandronat; Topoisomerasehemmer RFS 2000; Difluormethylornithin (DMFO); Retinoide wie Retinsäure; Capecitabin (XELODA®); pharmazeutisch verträgliche Salze, Säuren oder Derivate beliebiger der Vorgenannten; sowie Kombinationen von zwei oder mehreren der Vorgenannten wie CHOP, eine Abkürzung für eine kombinierte Therapie aus Cyclophosphamid, Doxorubicin, Vincristin und Prednisolon, und FOLFOX, eine Abkürzung für ein Behandlungsschema mit Oxaliplatin (ELOXATlN™) in Kombination mit 5-FU und Leucovorin, beinhalten.
-
Beispiele für ein chemotherapeutisches Agens können auch „antihormonelle Agenzien“ oder „endokrine Therapeutika“ beinhalten, die darauf abzielen, die Wirkung von Hormonen, die das Krebswachstum fördern können, zu regulieren, zu reduzieren, zu blockieren oder zu hemmen, und die häufig in Form einer systemischen oder Ganzkörperbehandlung verabreicht werden. Sie können selbst Hormone sein. Beispiele beinhalten Anti-Östrogene und selektive Östrogenrezeptormodulatoren (SERMs), einschließlich beispielsweise Tamoxifen (einschließlich NOLVADEX® Tamoxifen), EVISTA® Raloxifen, Droloxifen, 4-Hydroxytamoxifen, Trioxifen, Keoxifen, LY117018, Onapriston und FARESTON® Toremifen; Anti-Progesterone; Östrogenrezeptor-Down-Regulatoren (ERDs); Agenzien zur Unterdrückung oder Abschaltung der Eierstöcke, zum Beispiel Leutinisierungshormon-Releasing-Hormon-(LHRH-)Agonisten wie LUPRON® und ELIGARD), Leuprolidacetat, Goserelinacetat, Buserelinacetat und Tripterelin; andere Antiandrogene wie Flutamid, Nilutamid und Bicalutamid; und Aromatasehemmer, die das die Östrogenproduktion in den Nebennieren regulierende Enzym Aromatase hemmen, wie z. B. 4(5)-Imidazole, Aminoglutethimid, MEGASEE Megestrolacetat, AROMASIN® Exemestan, Formestanie, Fadrozol, RIVISOR® Vorozol, FEMARAE Letrozol und ARIMIDEX® Anastrozol. Darüber hinaus beinhaltet diese Definition von chemotherapeutischen Agenzien Bisphosphonate wie Clodronat (zum Beispiel BONEFOS® oder OSTAC®), DIDROCAL® Etidronat, NE-58095, ZOMFTA® Zoledronsäure/Zoledronat, FOSAMAX® Alendronat, AREDIA® Pamidronat, SKELID® Tiludronat oder ACTONEL® Risedronat; sowie Troxacitabin (ein 1,3-Dioxolan-Nukleosid-Cytosin-Analogon); Antisense-Oligonukleotide, insbesondere solche, die die Expression von Genen in Signalwegen hemmen, die an der abnormen Zellproliferation beteiligt sind, wie z.B. PKC-alpha, Raf, H-Ras und der epidermale Wachstumsfaktor-Rezeptor (EGFR); Impfstoffe wie THERATOPE®-Impfstoff und Gentherapie-Impfstoffe, z.B. ALLOVECTIN®-Impfstoff, LEUVECTIN®-Impfstoff und VAXID®-Impfstoff; LURTOTECAN®-Topoisomerase-1-Inhibitor; ABARELIX® rmRH; Lapatinib-Ditosylat (ein niedermolekularer ErbB-2- und EGFR-Dual-Tyrosinkinase-Inhibitor, der auch als GW572016 bekannt ist); und pharmazeutisch verträgliche Salze, Säuren oder Derivate beliebiger der Vorgenannten.
-
Beispiele für ein chemotherapeutisches Agens können auch Antikörper wie Alemtuzumab (Campath), Bevacizumab (AVASTIN®, Genentech); Cetuximab (ERBITUX®, Imclone); Panitumumab (VECTIBIX®, Amgen), Rituximab (RITUXAN®, Genentech/Biogen Idee), Pertuzumab (OMNITARG®, 2C4, Genentech), Trastuzumab (HERCEPTIN®, Genentech), Tositumomab (Bexxar, Corixia) und das Antikörper-Konjugat Gemtuzumab Ozogamicin (MYLOTARG®, Wyeth) beinhalten. Weitere humanisierte monoklonale Antikörper mit therapeutischem Potenzial als Agenzien in Kombination mit den Verbindungen der Erfindung beinhalten: Apolizumab, Aselizumab, Atlizumab, Bapineuzumab, Bivatuzumab Mertansin, Cantuzumab Mertansin, Cedelizumab, Certolizumab Pegol, Cidfusituzumab, Cidtuzumab, Daclizumab, Eculizumab, Efalizumab, Epratuzumab, Erlizumab, FeMzumab, Fontolizumab, Gemtuzumab Ozogamicin, Inotuzumab Ozogamicin, Ipilimumab, Labetuzumab, Lintuzumab, Matuzumab, Mepolizumab, Motavizumab, Motovizumab, Natalizumab, Nimotuzumab, Nolovizumab, Numavizumab, Ocrelizumab, Omalizumab, Palivizumab, Pascolizumab, Pecfusituzumab, Pectuzumab, Pexelizumab, Ralivizumab, Ranibizumab, Reslivizumab, Reslizumab, Resyvizumab, Rovelizumab, Ruplizumab, Sibrotuzumab, Siplizumab, Sontuzumab, Tacatuzumab Tetraxetan, Tadocizumab, Talizumab, Tefibazumab, Tocilizumab, Toralizumab, Tucotuzumab Celmoleukin, Tucusituzumab, Umavizumab, Urtoxazumab, Ustekinumab, Visilizumab und das Anti-Interleukin-12 (ABT-874/J695, Wyeth Research und Abbott Laboratories), bei dem es sich um einen rekombinanten, ausschließlich humanen IgG1λ-Antikörper in voller Länge handelt, der genetisch modifiziert wurde, um das Interleukin-12 p40-Protein zu erkennen.
-
Beispiele für ein chemotherapeutisches Agens können auch „Tyrosinkinase-Inhibitoren“ wie ein EGFR-Targeting-Agens (z. B. kleines Molekül, Antikörper, usw.); einen niedermolekularen HER2-Tyrosinkinase-Inhibitor wie TAK165 von Takeda; CP-724.714, einen oralen selektiven Inhibitor der ErbB2-Rezeptor-Tyrosinkinase (Pfizer und OSI); Dual-HER-Inhibitoren wie EKB-569 (erhältlich von Wyeth), der bevorzugt EGFR bindet, aber sowohl HER2 als auch EGFR-überexprimierende Zellen inhibiert; Lapatinib (GSK572016; erhältlich von Glaxo-SmithKline), einen oralen HER2- und EGFR-Tyrosinkinase-Inhibitor; PKI-166 (erhältlich von Novartis); Pan-HER-Inhibitoren wie Canertinib (CI-1033; Pharmacia); Raf-1-Inhibitoren wie der von ISIS Pharmaceuticals erhältliche Antisense-Wirkstoff ISIS-5132, der die Raf-1-Signalübertragung inhibiert; nicht-HER-zielgerichtete TK-Hemmer wie Imatinib-Mesylat (GLEEVEC®, erhältlich von Glaxo SmithKline); Multi-Targeting-Tyrosinkinase-Inhibitoren wie Sunitinib (SUTENT®, erhältlich von Pfizer); VEGF-Rezeptor-Tyrosinkinase-Inhibitoren wie Vatalanib (PTK787/ZK222584, erhältlich von Novartis/Schering AG); MAPK extrazellulärer regulierter Kinase-I-Inhibitor CI-1040 (erhältlich von Pharmacia); Chinazoline wie PD 153035,4-(3-Chloranilino)-chinazolin; Pyridopyrimidine; Pyrimidopyrimidine; Pyrrolopyrimidine, wie CGP 59326, CGP 60261 und CGP 62706; Pyrazolopyrimidine, 4-(Phenylamino)-7H-Pyrrolo[2,3-d]pyrimidine; Curcumin (Diferuloylmethan, 4,5-bis-(4-fluoranilino)phthalimid); Tyrphostine mit Nitrothiophenanteilen; PD-0183805 (Warner-Lamber); Antisense-Moleküle (z. B. die an HERkodierende Nukleinsäure binden); Chinoxaline (
US-Pat. Nr. 5,804,396 ); Tryphostine (
US-Pat. Nr. 5,804,396 ); ZD6474 (Astra Zeneca); PTK-787 (Novartis/Schering AG); Pan-HER-Inhibitoren wie CI-1033 (Pfizer); Affinitac (ISIS 3521; Isis/Lilly); Imatinib-Mesylat (GLEEVEC®); PKI 166 (Novartis); GW2016 (Glaxo SmithKline); CI-1033 (Pfizer); EKB-569 (Wyeth); Semaxinib (Pfizer); ZD6474 (AstraZeneca); PTK-787 (Novartis/Schering AG); INC-1C11 (Imclone); und Rapamycin (Sirolimus, RAPAMUNE®) beinhalten.
-
Beispiele für ein chemotherapeutisches Agens können auch Dexamethason, Interferone, Colchicin, Metoprin, Cyclosporin, Amphotericin, Metronidazol, Alemtuzumab, Alitretinoin, Allopurinol, Amifostin, Arsentrioxid, Asparaginase, BCG live, Bevacuzimab, Bexarotene, Cladribin, Clofarabin, Darbepoetin alfa, Denileukin, Dexrazoxan, Epoetin alfa, Elotinib, Filgrastim, Histrelinacetat, Ibritumomab, Interferon alfa-2a, Interferon alfa-2b, Lenalidomid, Levamisol, Mesna, Methoxsalen, Nandrolon, Nelarabin, Nofetumomab, Oprelvekin, Palifermin, Pamidronat, Pegademase, Pegaspargase, Pegfilgrastim, Pemetrexed Dinatrium, Plicamycin, Porfimer-Natrium, Quinacrin, Rasburicase, Sargramostim, Temozolomid, VM-26, 6-TG, Toremifen, Tretinoin, ATRA, Valrubicin, Zoledronat und Zoledronsäure und pharmazeutisch akzeptable Salze davon beinhalten
-
Beispiele für ein chemotherapeutisches Agens können auch Hydrocortison, Hydrocortisonacetat, Cortisonacetat, Tixocortolpivalat, Triamcinolonacetonid, Triamcinolonalkohol, Mometason, Amcinonid, Budesonid, Desonid, Fluocinonid, Fluocinolonacetonid, Betamethason, Betamethason-Natriumphosphat, Dexamethason, Dexamethason-Natriumphosphat, Fluocortolon, Hydrocortison-17-butyrat, Hydrocortison-17-valerat, Aclometasondipropionat, Betamethasonvalerat, Betamethasondipropionat, Prednicarbat, Clobetason-17-butyrat, Clobetasol-17-propionat, Fluocortoloncaproat, Fluocortolonpivalat und Fluprednidenacetat: immunselektive entzündungshemmende Peptide (ImSAIDs) wie Phenylalanin-Glutamin-Glycin (FEG) und seine D-isomere Form (feG) (IMULAN BioTherapeutics, LLC); Antirheumatika wie Azathioprin, Ciclosporin (Cyclosporin A), D-Penicillamin, Goldsalze, Hydroxychloroquin, Leflunomideminocyclin, Sulfasalazin, Tumornekrosefaktor-alpha (TNFa)-Blocker wie Etanercept (ENBREL®), Infliximab (REMICADE®), Adalimumab (HUMIRA®), Certolizumab Pegol (CIMZIA®), Golimumab (SIMPONI®), Interleukin 1-(IL-1-)Blocker wie Anakinra (KINERET®), T-Zell-Kostimulationsblocker wie Abatacept (ORENCIA®), Interleukin 6-(IL-6-)Blocker wie Tocilizumab (ACTEMERA®); Interleukin 13-(IL-13-)Blocker wie Lebrikizumab; Interferon alpha-(IFN-)Blocker wie Rontalizumab; Beta-7-Integrin-Blocker wie rhuMAb Beta7; IgE-Signalweg-Blocker wie Anti-M1 prime; sekretierte homotrimere LTa3- und membrangebundene heterotrimere LTa/ß2-Blocker wie Anti-lymphotoxin alpha (LTa); verschiedene Prüfagenzien wie Thioplatin, PS-341, Phenylbutyrat, ET-18-OCH3 oder Famesyltransferase-Inhibitoren (L-739749, L-744832); Polyphenole wie Quercetin, Resveratrol, Piceatannol, Epigallocatechingallat, Theaflavine, Flavanole, Procyanidine, Betulinsäure und Derivate davon; Autophagie-Inhibitoren wie Chloroquin; Delta-9-Tetrahydrocannabinol (Dronabinol, MARINOL®); Beta-Lapachon; Lapachol; Colchicine; Betulinsäure; Acetylcamptothecin, Scopolectin und 9-Aminocamptothecin); Podophyllotoxin; Tegafur (UFTORAL®); Bexarotin (TARGRETIN®); Bisphosphonate wie Clodronat (zum Beispiel BONEFOS® oder OSTAC®), Etidronat (DIDROCAL®), NE-58095, Zoledronsäure/Zoledronat (ZOMETA®), Alendronat (FOSAMAX®), Pamidronat (AREDIA®), Tiludronat (SKELID®) oder Risedronat (ACTONEL®); und epidermaler Wachstumsfaktor-Rezeptor (EGF-R); Impfstoffe wie der THERATOPE®-Impfstoff; Perifosin, COX-2-Inhibitoren (z. g., Celecoxib oder Etoricoxib), Proteosom-Inhibitor (z. B., PS341); CCI-779; Tipifamib (R11577); Orofenib, ABT510; Bcl-2-Inhibitor wie Oblimersen-Natrium (GENASENSE®); Pixantron; Famesyltransferase-Inhibitoren wie Lonafamib (SCH 6636, SARASAR™); und pharmazeutisch verträgliche Salze, Säuren oder Derivate beliebiger der oben genannten; sowie Kombinationen von zwei oder mehreren der oben genannten beinhalten.
-
Gemäß vieler Ausführungsformen kann, sobald eine Krebsdiagnose indiziert ist, eine Reihe von Behandlungen durchgeführt werden, einschließlich (aber nicht beschränkt auf) Operation, Resektion, Chemotherapie, Strahlentherapie, Immuntherapie, gezielte Therapie, Hormontherapie, Stammzellentransplantation und Bluttransfusion. In einigen Ausführungsformen wird ein Antikrebs- und/oder chemotherapeutisches Agens verabreicht, einschließlich (aber nicht beschränkt auf) alkylierende Agenzien, Platin-Agenzien, Taxane, Vinca-Agenzien, Anti-Östrogen-Medikamente, Aromatase-Inhibitoren, Ovarial-Suppressions-Agenzien, endokrine/hormonelle Agenzien, Bisphophonat-Therapie-Agenzien und gezielte biologische Therapie-Agenzien. Medikamente beinhalten (sind aber nicht beschränkt auf) Cyclophosphamid, Fluorouracil (oder 5-Fluorouracil oder 5-FU), Methotrexat, Thiotepa, Carboplatin, Cisplatin, Taxane, Paclitaxel, proteingebundenes Paclitaxel, Docetaxel, Vinorelbin, Tamoxifen, Raloxifen, Toremifen, Fulvestrant, Gemcitabin, Irinotecan, Ixabepilon, Temozolomid, Topotecan, Vincristin, Vinblastin, Eribulin, Mutamycin, Capecitabin, Capecitabin, Anastrozol, Exemestan, Letrozol, Leuprolid, Abarelix, Buserelin, Goserelin, Megestrolacetat, Risedronat, Pamidronat, Ibandronat, Alendronat, Zoledronat, Tykerb, Daunorubicin, Doxorubicin, Epirubicin, Idarubicin, Valrubicin Mitoxantron, Bevacizumab, Cetuximab, Ipilimumab, Ado-Trastuzumab Emtansin, Afatinib, Aldesleukin, Alectinib, Alemtuzumab, Atezolizumab, Avelumab, Axtinib, Belimumab, Belinostat, Bevacizumab, Blinatumomab, Bortezomib, Bosutinib, Brentuximab Vedotin, Brigatinib, Cabozantinib, Canakinumab, Carfilzomib, Certinib, Cetuximab, Cobimetinib, Crizotinib, Dabrafenib, Daratumumab, Dasatinib, Denosumab, Dinutuximab, Durvalumab, Elotuzumab, Enasidenib, Erlotinib, Everolimus, Gefitinib, Ibritumomab Tiuxetan, Ibrutinib, Iidelalisib, Imatinib, Ipilimumab, Ixazomib, Lapatinib, Lenvatinib, Midostaurin, Necitumumab, Neratinib, Nilotinib, Niraparib, Nivolumab, Obinutuzumab, Ofatumumab, Olaparib, Olaratumab, Osimertinib, Palbociclib, Panitumumab, Panobinostat, Pembrolizumab, Pertuzumab, Ponatinib, Ramucirumab, Regorafenib, Ribociclib, Rituximab, Romidepsin, Rucaparib, Ruxolitinib, Siltuximab, Sipuleucel-T, Sonidegib, Sorafenib, Temsirolimus, Tocilizumab, Tofacitinib, Tositumomab, Trametinib, Trastuzumab, Vandetanib, Vemurafenib, Venetoclax, Vismodegib, Vorinostat und Ziv-Aflibercept. Gemäß verschiedener Ausführungsformen kann ein Individuum mit einem einzelnen Medikament oder einer Kombination von hierin beschriebenen Medikamenten behandelt werden. Eine gängige Behandlungskombination ist Cyclophosphamid, Methotrexat und 5-Fluorouracil (CMF).
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann jedes der zellfreien Nukleinsäuremoleküle (z. B. cfDNA, cfRNA) aus einer Zelle abgeleitet werden. Zum Beispiel kann eine Zell- oder Gewebeprobe von einem Subjekt erlangt und zur Entfernung aller Zellen aus der Probe verarbeitet werden, wodurch zellfreie Nukleinsäuremoleküle aus der Probe abgeleitet werden.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann eine Referenzgenomsequenz aus einer Zelle eines Individuums abgeleitet werden. Das Individuum kann eine gesunde Kontrolle oder der Proband sein, der den hierin offenbarten Verfahren zur Bestimmung oder Überwachung des Verlaufs einer Erkrankung unterzogen wird.
-
Eine Zelle kann eine gesunde Zelle sein. Alternativ kann eine Zelle eine erkrankte Zelle sein. Eine erkrankte Zelle kann veränderte Stoffwechsel-, Genexpressions- und/oder morphologische Merkmale aufweisen. Eine erkrankte Zelle kann eine Krebszelle, eine diabetische Zelle oder eine apoptotische Zelle sein. Eine erkrankte Zelle kann eine Zelle von einem erkrankten Subjekt sein. Beispielhafte Krankheiten können Blutkrankheiten, Krebskrankheiten, Stoffwechselstörungen, Augenkrankheiten, Organstörungen, Krankheiten des Bewegungsapparats, Herzkrankheiten und dergleichen beinhalten.
-
Eine Zelle kann eine Säugetierzelle sein oder aus einer Säugetierzelle abgeleitet sein. Eine Zelle kann eine Nagetierzelle sein oder aus einer Nagetierzelle abgeleitet sein. Eine Zelle kann eine menschliche Zelle sein oder aus einer menschlichen Zelle abgeleitet sein. Eine Zelle kann eine prokaryotische Zelle sein oder aus einer prokaryotischen Zelle abgeleitet sein. Eine Zelle kann eine bakterielle Zelle sein oder aus einer bakteriellen Zelle abgeleitet sein. Eine Zelle kann eine archäische Zelle sein oder aus einer archäischen Zelle abgeleitet sein. Eine Zelle kann eine eukaryotische Zelle sein oder aus einer eukaryotischen Zelle abgeleitet sein. Eine Zelle kann eine pluripotente Stammzelle sein. Eine Zelle kann eine Pflanzenzelle sein oder aus einer Pflanzenzelle abgeleitet sein. Eine Zelle kann eine tierische Zelle sein oder aus einer tierischen Zelle abgeleitet sein. Eine Zelle kann eine Wirbellosen-Zelle sein oder aus einer Wirbellosen-Zelle abgeleitet sein. Eine Zelle kann eine Wirbeltierzelle sein oder aus einer Wirbeltierzelle abgeleitet sein. Eine Zelle kann eine Mikrobenzelle sein oder aus einer Mikrobenzelle abgeleitet sein. Eine Zelle kann eine Pilzzelle sein oder aus einer Pilzzelle abgeleitet sein. Eine Zelle kann aus einem spezifischen Organ oder Gewebe stammen.
-
Nicht einschränkende Beispiele für eine oder mehrere Zellen können lymphoide Zellen beinhalten, wie B-Zellen, T-Zellen (zytotoxische T-Zellen, natürliche Killer-T-Zellen, regulatorische T-Zellen, T-Helferzellen), natürliche Killerzellen, Zytokin-induzierte Killerzellen (CIK); myeloische Zellen, wie Granulozyten (Basophile Granulozyten, Eosinophile Granulozyten, Neutrophile Granulozyten/Hypersegmentierte Neutrophile), Monozyten/Makrophagen, Erythrozyten (Retikulozyten), Mastzellen, Thrombozyten/Megakaryozyten, Dendritische Zellen; Zellen des endokrinen Systems, einschließlich Schilddrüsenzellen (Schilddrüsenepithelzellen, parafollikuläre Zellen), Nebenschilddrüsenzellen (Nebenschilddrüsenhauptzellen, oxyphile Zellen), Nebennierenzellen (Chromaffinzellen), Zirbeldrüsenzellen (Pinealozyten); Zellen des Nervensystems, einschließlich Gliazellen (Astrozyten, Mikroglia), Magnozelluläre neurosekretorische Zelle, Stellat-Zelle, Boettcher-Zelle und Hypophyse (Gonadotropin, Corticotropin, Thyrotropin, Somatotropin, Laktotropin); Zellen des Atmungssystems, einschließlich Pneumozyt (Typ-I-Pneumozyt, Typ-II-Pneumozyt), Clara-Zelle, Becherzelle, Staubzelle; Zellen des Kreislaufsystems, einschließlich Myokardiozyt, Perizyt; Zellen des Verdauungssystems, einschließlich Magen (Magenhauptzelle, Parietalzelle), Becherzelle, Paneth-Zelle, G-Zellen, D-Zellen, ECL-Zellen, I-Zellen, K-Zellen, S-Zellen; enteroendokrine Zellen, einschließlich enterochromaffme Zelle, APUD-Zelle, Leber (Hepatozyt, Kupffer-Zelle), Knorpel/Knochen/Muskel; Knochenzellen, einschließlich Osteoblast, Osteozyt, Osteoklast, Zähne (Zementoblast, Ameloblast); Knorpelzellen, einschließlich Chondroblast, Chondrozyt; Hautzellen, einschließlich Trichozyt, Keratinozyt, Melanozyt (Naevuszelle); Muskelzellen, einschließlich Myozyt; Zellen des Harnsystems, einschließlich Podozyt, Juxtaglomeruläre Zelle, Intraglomeruläre Mesangialzelle/Extraglomeruläre Mesangialzelle, Bürstensaumzelle des proximalen Tubulus der Niere, Macula densa-Zelle; Zellen des Fortpflanzungssystems, einschließlich Spermatozoon, Sertoli-Zelle, Leydig-Zelle, Ovum; und andere Zellen, einschließlich Adipozyt, Fibroblast, Sehnenzelle, epidermaler Keratinozyt (differenzierende epidermale Zelle), epidermale Basalzelle (Stammzelle), Keratinozyt der Finger- und Zehennägel, Nagelbettbasalzelle (Stammzelle), medulläre Haarschaftzelle, kortikale Haarschaftzelle, kutikuläre Haarschaftzelle, Kutikuläre Haarwurzelscheidenzelle, Haarwurzelscheidenzelle der Huxley-Schicht, Haarwurzelscheidenzelle der Henle-Schicht, Äußere Haarwurzelscheidenzelle, Haarmatrixzelle (Stammzelle), Feuchte geschichtete Barriere-Epithelzellen, Oberflächenepithelzelle des geschichteten Plattenepithels von Hornhaut, Zunge, Mundhöhle, Speiseröhre, Analkanal, distaler Harnröhre und Vagina, Basalzelle (Stammzelle) der Epithelien von Hornhaut, Zunge, Mundhöhle, Speiseröhre, Analkanal, distaler Harnröhre und Vagina, Harnröhrenepithelzelle (Auskleidung der Harnblase und der Harnwege), Exokrine sekretorische Epithelzellen, Speicheldrüsenschleimhautzelle (polysaccharidreiches Sekret), Seröse Zelle der Speicheldrüse (glykoproteinreiche Sekretion), Von-Ebner-Drüsenzelle in der Zunge (wäscht die Geschmacksknospen), Brustdrüsenzelle (Milchsekretion), Tränendrüsenzelle (Tränensekretion), Ceruminöse Drüsenzelle im Ohr (Wachssekretion), Dunkle Zelle der ekkrinen Schweißdrüse (Glykoproteinsekretion), Klare Zelle der ekkrinen Schweißdrüse (Sekretion kleiner Moleküle). Apokrine Schweißdrüsenzelle (Geruchssekretion, sexualhormonempfindlich), Moll-Drüsenzelle im Augenlid (spezialisierte Schweißdrüse), Talgdrüsenzelle (lipidreiche Talgsekretion), Bowman-Drüsenzelle in der Nase (wäscht das Geruchsepithel), Brunnersche Drüsenzelle im Zwölffingerdarm (Enzyme und alkalischer Schleim), Samenblasenzelle (sondert Bestandteile der Samenflüssigkeit ab, einschließlich Fruktose für schwimmende Spermien), Prostatadrüsenzelle (sondert Bestandteile der Samenflüssigkeit ab), Bulbourethraldrüsenzelle (Schleimabsonderung), Bartholin-Drüsenzelle (vaginale Gleitmittelsekretion), Littre-Drüsenzelle (Schleimsekretion), Gebärmutterschleimhautzelle (Kohlenhydratsekretion), Isolierte Becherzelle der Atemwege und des Verdauungstraktes (Schleimsekretion), Magenschleimhautzelle (Schleimsekretion), Zymogene Zelle der Magendrüse (Pepsinogensekretion), Oxyntische Zelle der Magendrüse (Salzsäuresekretion), Azinuszelle der Bauchspeicheldrüse (Sekretion von Bikarbonat und Verdauungsenzymen), Paneth-Zelle des Dünndarms (Lysozymsekretion), Typ-II-Pneumozyt der Lunge (Surfactant-Sekretion), Clara-Zelle der Lunge, Hormonzellen, Hypophysenvorderzellen, Somatotrope, Laktotrope, Thyreotrope, Gonadotrope, Corticotrope, Hypophysenzwischenzellen, Magnozelluläre neurosekretorische Zellen, Darm- und Atemwegszellen, Schilddrüsenzellen, Schilddrüsenepithelzellen, parafollikuläre Zellen, Nebenschilddrüsenzellen, Nebenschilddrüsenhauptzellen, oxyphile Zellen, Nebennierenzellen, chromaffine Zellen, Ley dig Zellen der Hoden, Theca interna-Zelle des Ovarialfollikels, Corpus luteum-Zelle des gerissenen Ovarialfollikels, Granulosa-Lutein-Zellen, Theca-Lutein-Zellen, Juxtaglomeruläre Zelle (Reninsekretion), Macula densa-Zelle der Niere, Stoffwechsel- und Speicherzellen, Zellen mit Barrierefunktion (Lunge, Darm, exokrine Drüsen und Urogenitaltrakt), Niere, Typ-I-Pneumozyt (Auskleidung des Luftraums der Lunge), Duktuszelle der Bauchspeicheldrüse (zentroazinäre Zelle), nicht gestreifte Duktuszelle (der Schweißdrüse, Speicheldrüse, Brustdrüse usw.), Ductuszellen (der Samenblase, der Prostata, etc.)), Epithelzellen, die geschlossene innere Körperhöhlen auskleiden, Flimmerzellen mit Antriebsfunktion, Zellen, die extrazelluläre Matrix sezernieren, kontraktile Zellen; Skelettmuskelzellen, Stammzellen, Herzmuskelzellen, Blut- und Immunsystemzellen, Erythrozyten (rote Blutkörperchen), Megakaryozyten (Thrombozytenvorläufer), Monozyten, Bindegewebsmakrophagen (verschiedene Typen), epidermale Langerhans-Zellen, Osteoklasten (in Knochen), dendritische Zellen (in lymphoidem Gewebe), Mikrogliazellen (im zentralen Nervensystem), neutrophile Granulozyten, eosinophile Granulozyten, basophile Granulozyten, Mastzellen, Helfer-T-Zellen, Suppressor-T-Zellen, zytotoxische T-Zellen, natürliche Killer-T-Zellen, B-Zellen, natürliche Killerzellen, Retikulozyten, Stammzellen und engagierte Vorläuferzellen für das Blut und das Immunsystem (verschiedene Typen), Pluripotente Stammzellen, Totipotente Stammzellen, Induzierte pluripotente Stammzellen, Adulte Stammzellen, Sinneswandlerzellen, Autonome Neuronenzellen, Sinnesorgane und periphere Neuronen unterstützende Zellen, Neuronen und Gliazellen des zentralen Nervensystems, Linsenzellen, Pigmentzellen, Melanozyten, Retinale pigmentierte Epithelzelle, Keimzellen, Oogonium/Oozyt, Spermatid, Spermatozyt, Spermatogoniumzelle (Stammzelle für Spermatozyt), Spermatozoon, Ammenzellen, Ovarialfollikelzelle, Sertoli-Zelle (im Hoden), Thymusepithelzelle, Interstitielle Zellen und Interstitielle Nierenzellen.
-
In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Erkrankung ein Krebs oder ein Tumor sein. Nicht einschränkende Beispiele für solche Erkrankungen können Akanthom, Akinzellkarzinom, Akustikusneurinom, akrales lentiginöses Melanom, Akrospirom, akute eosinophile Leukämie, akute lymphoblastische Leukämie, akute megakaryoblastische Leukämie, akute monozytäre Leukämie, akute myeloblastische Leukämie mit Reifung, akute myeloische dendritische Zellleukämie, akute myeloische Leukämie, akute promyelozytische Leukämie, Adamantinom, Adenokarzinom, adenoides zystisches Karzinom, Adenom, Adenomatoider odontogenen Tumor, adrenokortikales Karzinom, adulte T-Zell-Leukämie, aggressive NK-Zell-Leukämie, AIDS-bezogene Krebserkrankungen, AIDS-bezogenes Lymphom, alveoläres Weichteilsarkom, ameloblastisches Fibrom, Analkrebs, anaplastisches großzelliges Lymphom, anaplastischen Schilddrüsenkrebs, angioimmunoblastisches T-Zell-Lymphom, Angiomyolipom, Angiosarkom, Blinddarmkrebs, Astrozytom, atypischen teratoiden rhabdoiden Tumor, Basalzellkarzinom, basal-ähnliches Karzinom, B-Zell-Leukämie, B-Zell-Lymphom, Bellini-Gang-Karzinom, Gallengangskrebs, Blasenkrebs, Blastom, Knochenkrebs, Knochentumor, Hirnstamm-Gliom, Hirntumor, Brustkrebs, Brenner-Tumor, Bronchialtumor, bronchioloalveoläres Karzinom, Brauner Tumor, Burkitt-Lymphom, Krebs mit unbekanntem Entstehungsort, karzinoiden Tumor, Karzinom, Karzinom in situ, Karzinom des Penis, Karzinom mit unbekanntem Entstehungsort, Karzinosarkom, Castleman-Erkrankung, embryonalen Tumor des Zentralnervensystems, zerebelläres Astrozytom, zerebrales Astrozytom, Gebärmutterhalskrebs, Cholangiokarzinom, Chondrom, Chondrosarkom, Chordom, Choriokarzinom, Choroidplexuspapillom, chronische lymphozytäre Leukämie, chronische monozytäre Leukämie, chronische myeloische Leukämie, chronische myeloproliferative Erkrankung, chronische neutrophile Leukämie, Klarzellentumor, Dickdarmkrebs, Darmkrebs, Kraniopharyngiom, kutanes T-Zell-Lymphom, Degos-Erkrankung, Dermatofibrosarcoma protuberans, Dermoidzyste, Desmoplastischer kleiner Rundzellentumor, Diffuses großes B-Zell-Lymphom, dysembryoplastischen neuroepithelialen Tumor, embryonales Karzinom, endodermalen Sinustumor, Endometriumkrebs, endometrialen Gebärmutterkrebs, endometrioiden Tumor, enteropathie-assoziiertes T-Zell-Lymphom, Ependymoblastom, Ependymom, epithelioides Sarkom, Erythroleukämie, Speiseröhrenkrebs, Esthesioneuroblastom, Ewing-Familie der Tumore, Ewing-Familie-Sarkom, Ewing-Sarkom, extrakraniellen Keimzelltumor, extragonadalen Keimzelltumor, extrahepatischen Gallengangskrebs, extramammäres Paget-Syndrom, Eileiterkrebs, Fetus in fetu, Fibrom, Fibrosarkom, follikuläres Lymphom, follikulären Schilddrüsenkrebs, Gallenblasenkrebs, Gallenblasenkrebs, Gangliogliom, Ganglioneurom, Magenkrebs, Magenlymphom, Magen-DarmKrebs, gastrointestinalen Karzinoid-Tumor, gastrointestinalen Stromatumor, gastrointestinalen Stromatumor, Keimzelltumor, Germinom, Gestations-Choriokarzinom, Gestations-trophoblastischen Tumor, Riesenzelltumor des Knochens, Glioblastoma multiforme, Gliom, Gliomatosis cerebri, Glomustumor, Glucagonom, Gonadoblastom, Granulosazelltumor, Haarzellenleukämie, Haarzellenleukämie, Kopf- und Halskrebs, Kopf- und Halskrebs, Herzkrebs, Hämangioblastom, Hämangioperizytom, Hämangiosarkom, hämatologische Malignität, hepatozelluläres Karzinom, hepatosplenisches T-Zell-Lymphom, hereditäres Brust-Eierstockkrebs-Syndrom, Hodgkin-Lymphom, Hodgkin-Lymphom, Hypopharynxkrebs, hypothalamisches Gliom, entzündlichen Brustkrebs, intraokulares Melanom, Inselzellkarzinom, Inselzelltumor, juvenile myelomonozytäre Leukämie, Kaposi-Sarkom, Kaposi-Sarkom, Nierenkrebs, Klatskin-Tumor, Krukenberg-Tumor, Kehlkopfkrebs, Kehlkopfkrebs, Lentigo-maligna-Melanom, Leukämie, Leukämie, Lippen- und Mundhöhlenkrebs, Liposarkom, Lungenkrebs, Luteom, Lymphangiom, Lymphangiosarkom, Lymphoepitheliom, Lymphoide Leukämie, Lymphom, Makroglobulinämie, bösartiges fibröses Histiozytom, bösartiges fibröses Histiozytom, bösartiges fibröses Histiozytom des Knochens, bösartiges Gliom, bösartiges Mesotheliom, bösartigen peripheren Nervenscheidentumor, bösartigen rhabdoiden Tumor, bösartigen Triton-Tumor, MALT-Lymphom, Mantelzell-Lymphom, Mastzell-Leukämie, mediastinalen Keimzelltumor, mediastinalen Tumor, medulläres Schilddrüsenkarzinom, Medulloblastom, Medulloepitheliom, Melanom, Melanom, Meningiom, Merkelzell-Karzinom, Mesotheliom, Mesotheliom, metastasierendes Plattenepithelkarzinom mit okkultem Primärtumor, metastasierendes Urothelkarzinom, gemischten Mullertumor, monozytäre Leukämie, Mundkrebs, muzinösen Tumor, multiples endokrines Neoplasie-Syndrom, multiples Myelom, Mycosis Fungoides, Mycosis fungoides, myelodysplastische Erkrankung, myelodysplastische Syndrome, myeloische Leukämie, myeloisches Sarkom, myeloproliferative Erkrankung, Myxom, Nasenhöhlenkrebs, Nasopharynxkrebs, Nasopharynxkarzinom, Neoplasma, Neurinom, Neuroblastom, Neurofibrom, Neurom, noduläres Melanom, Non-Hodgkin-Lymphom, Non-Hodgkin-Lymphom, Nonmelanom-Hautkrebs, Nichtkleinzelligen Lungenkrebs, Augenonkologie, Oligoastrozytom, Oligodendrogliom, Onkozytom, Sehnervenscheidenmeningeom, Mundkrebs, Mundkrebs, Oropharynxkrebs, Osteosarkom, Osteosarkom, Eierstockkrebs, Eierstockkrebs, Eierstockepithelkrebs, Eierstockkeimzelltumor, Eierstocktumor mit geringem malignen Potential, Paget'sche Erkrankung der Brust, Pancoast-Tumor, Bauchspeicheldrüsenkrebs, Bauchspeicheldrüsenkrebs, papillaren Schilddrüsenkrebs, Papillomatose, Paragangliom, Nasennebenhöhlenkrebs, Nebenschilddrüsenkrebs, Peniskrebs, perivaskulären epithelioiden Zelltumor, Pharynxkrebs, Pharynxkrebs, Pharynxkrebs, pinealen parenchymalen Tumor der intermediären Differenzierung, Pineoblastom, Pituizytom, Hypophysenadenom, Hypophysentumor, Plasmazellneoplasma, pleuropulmonales Blastom, Polyembryom, Vorläufer-T-Lymphom, primäres Lymphom des Zentralnervensystems, primäres Ergusslymphom, primäres Leberzellkarzinom, primäres Peritonealkarzinom, primitiven neuroektodermalen Tumor, Prostatakrebs, Pseudomyxoma peritonei, Rektalkrebs, Nierenzellkarzinom, Atemwegskarzinom mit Beteiligung des NUT-Gens auf Chromosom 15, Retinoblastom, Rhabdomyom, Rhabdomyosarkom, Richter-Transformation, Teratom des Sakrokokzygeums, Speicheldrüsenkrebs, Sarkom, Schwannomatose, Talgdrüsenkarzinom, sekundäre Neoplasie, Seminom, serösen Tumor, Sertoli-Leydig-Zelltumor, Geschlechtsstrangstromatumor, Sezary-Syndrom, Siegelringzellkarzinom, Hautkrebs, kleinzelligen Rundzellentumor, kleinzelliges Karzinom, kleinzelligen Lungenkrebs, kleinzelliges Lymphom, Dünndarmkrebs, Weichteilsarkom, Somatostatinom, Rußwarze, Rückenmarkstumor, Wirbelsäulentumor, Milzrandzonen-Lymphom, Plattenepithelkarzinom, Magenkrebs, oberflächlich streuendes Melanom, supratentorialen primitiven neuroektodermalen Tumor, oberflächenepithelialen Stromatumor, synoviales Sarkom, akute lymphoblastische Leukämie der T-Zelle, großkörnige lymphatische Leukämie der T-Zelle, T-Zell-Leukämie, T-Zell-Lymphom, Prolymphozytäre Leukämie der T-Zelle, Teratom, lymphatischen Krebs im Endstadium, Hodenkrebs, Thekoma, Kehlkopfkrebs, Thymuskarzinom, Thymom, Schilddrüsenkrebs, Übergangszellkarzinom von Nierenbecken und Harnleiter, Übergangszellkarzinom, Urachuskarzinom, Harnröhrenkrebs, urogenitales Neoplasma, Uterus-Sarkom, Aderhautmelanom, Vaginalkrebs, Verner-Morrison-Syndrom, verruköses Karzinom, Sehbahn-Gliom, Vulvakrebs, Waldenstrom-Makroglobulinämie, Warthins Tumor und Wilms-Tumor beinhalten.
-
Gemäß verschiedener Ausführungsformen können zahlreiche Arten von Neoplasmen nachgewiesen werden, einschließlich (aber nicht beschränkt auf) akute lymphatische Leukämie (ALL), akute myeloische Leukämie (AML), Analkrebs, Astrozytome, Basalzellkarzinom, Gallengangskrebs, Blasenkrebs, Brustkrebs, Burkitt-Lymphom, Gebärmutterhalskrebs, chronische lymphozytäre Leukämie (CLL), chronische myeloische Leukämie (CML), chronische myeloproliferative Neoplasmen, Darmkrebs, diffuses großzelliges B-Zell-Lymphom, Endometriumkrebs, Ependymom, Speiseröhrenkrebs, Osthesioneuroblastom, Ewing-Sarkom, Eileiterkrebs, follikuläres Lymphom, Gallenblasenkrebs, Magenkrebs, gastrointestinaler Karzinoidtumor, Haarzellenleukämie, Leberzellkrebs, Hodgkin-Lymphom, Hypopharynxkrebs, Kaposi-Sarkom, Nierenkrebs, Langerhans-Zell-Histiozytose, Kehlkopfkrebs, Leukämie, Leberkrebs, Lungenkrebs, Lymphom, Melanom, Merkel-Zell-Krebs, Mesotheliom, Mundkrebs, Neuroblastom, Non-Hodgkin-Lymphom, nichtkleinzelliger Lungenkrebs, Osteosarkom, Eierstockkrebs, Bauchspeicheldrüsenkrebs, neuroendokrine Tumore der Bauchspeicheldrüse, Rachenkrebs, Hypophysentumor, Prostatakrebs, Rektumkarzinom, Nierenzellkrebs, Retinoblastom, Hautkrebs, kleinzelliger Lungenkrebs, Dünndarmkrebs, Plattenepithelkarzinom des Halses, T-Zell-Lymphom, Hodenkrebs, Thymom, Schilddrüsenkrebs, Gebärmutterkrebs, Vaginalkrebs und vaskuläre Tumore.
-
Viele Ausführungsformen beziehen sich auf diagnostische oder begleitende diagnostische Scans, die während der Krebsbehandlung eines Individuums durchgeführt werden. Bei der Durchführung diagnostischer Scans während der Behandlung kann die Fähigkeit des Agens zur Behandlung des Krebswachstums beobachtet werden. Die meisten Krebstherapeutika führen zum Absterben und zur Nekrose neoplastischer Zellen, wodurch größere Mengen an Nukleinsäuren aus diesen Zellen in die untersuchten Proben freigesetzt werden sollten. Dementsprechend kann der Spiegel der zirkulierenden Nukleinsäuren im Laufe der Zeit beobachtet werden, da der Spiegel während der ersten Behandlungen ansteigen und mit der Abnahme der kanzerogenen Zellen abnehmen sollte. In einigen Ausführungsformen werden die Behandlungen basierend auf dem Behandlungseffekt auf die Krebszellen angepasst. Wirkt die Behandlung beispielsweise nicht zytotoxisch auf neoplastische Zellen, kann die Dosis erhöht oder ein Agens mit höherer Zytotoxizität verabreicht werden. Alternativ kann, wenn die Zytotoxizität der Krebszellen gut ist, jedoch die unerwünschten Nebenwirkungen hoch sind, die Dosierung verringert werden oder ein Agens mit weniger Nebenwirkungen verabreicht werden.
-
Verschiedene Ausführungsformen sind auch auf diagnostische Scans gerichtet, die nach der Behandlung eines Individuums durchgeführt werden, um eine Restkrankheit und/oder ein Wiederauftreten von Krebs nachzuweisen. Deutet ein diagnostischer Scan auf einen Krebsrückstand und/oder ein Wiederauftreten des Krebses hin, können weitere diagnostische Tests und/oder Behandlungen wie hierin beschrieben durchgeführt werden. Ist der Krebs und/oder das Individuum anfällig für ein Wiederauftreten, können diagnostische Scans zur Überwachung eines eventuellen Rückfalls häufig durchgeführt werden.
-
F. Computersysteme
-
In einem Aspekt sieht die vorliegende Offenbarung ein Computerprogrammprodukt vor, umfassend ein nichtflüchtiges, computerlesbares Medium mit darin codiertem, computerausführbarem Code, wobei der computerausführbare Code zur Ausführung zur Implementierung eines beliebigen der vorangehenden Verfahren angepasst ist.
-
Die vorliegende Offenbarung stellt Computersysteme zur Verfügung, die zur Implementierung der Verfahren der Offenbarung programmiert sind. Das System kann in einigen Fällen Komponenten wie einen Prozessor, ein Eingabemodul zur Eingabe von Sequenzierungsdaten oder davon abgeleiteter Daten, ein computerlesbares Medium, das Anweisungen enthält, die bei Ausführung durch den Prozessor einen Algorithmus für die Eingabe in Bezug auf ein oder mehrere zellfreie Nukleinsäuremoleküle durchführen, und ein Ausgabemodul, das ein oder mehrere mit der Erkrankung verbundene Indizien bereitstellt, beinhalten.
-
27 zeigt ein Computersystem 2701, das zur Implementierung eines Teils oder aller hierin offenbarten Verfahren programmiert oder anderweitig konfiguriert ist. Das Computersystem 2701 kann verschiedene Aspekte der vorliegenden Offenbarung regeln, wie zum Beispiel (i) Identifizieren eines oder mehrerer zellfreier Nukleinsäuremoleküle, die die Vielzahl von Phasenvarianten umfassen, aus Sequenzierungsdaten, die von einer Vielzahl zellfreier Nukleinsäuremoleküle abgeleitet sind, (ii) Analysieren beliebiger der identifizierten zellfreien Nukleinsäuremoleküle, (iii) Ermitteln einer Erkrankung des Subjekts, basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen, (iv) Überwachen eines Verlaufs der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen, (v) Identifizieren des Subjekts zumindest teilweise basierend auf den identifizierten zellfreien Nukleinsäuremolekülen, oder (vi) Ermitteln einer geeigneten Behandlung der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen. Das Computersystem 2701 kann ein elektronisches Gerät eines Benutzers oder ein Computersystem sein, das sich in Bezug auf das elektronische Gerät entfernt von diesem befindet. Das elektronische Gerät kann ein mobiles elektronisches Gerät sein.
-
Das Computersystem 2701 beinhaltet eine zentrale Verarbeitungseinheit (CPU, hierin auch „Prozessor“ und „Computerprozessor“) 2705, die ein Einzelkern- oder Mehrkernprozessor oder eine Vielzahl von Prozessoren für die Parallelverarbeitung sein kann. Das Computersystem 2701 beinhaltet ebenfalls einen Speicher oder Speicherplatz 2710 (z. B. Direktzugriffsspeicher, Festwertspeicher, Flash-Speicher), eine elektronische Speichereinheit 2715 (z. B. Festplatte), eine Kommunikationsschnittstelle 2720 (z. B. Netzwerkadapter) zur Kommunikation mit einem oder mehreren anderen Systemen und periphere Geräte 2725, wie z. B. Cache, andere Speicher, Datenspeicher und/oder elektronische Anzeigeadapter. Der Speicher 2710, die Speichereinheit 2715, die Schnittstelle 2720 und die Peripheriegeräte 2725 stehen über einen Kommunikationsbus (durchgezogene Linien), wie etwa eine Hauptplatine, mit der CPU 2705 in Verbindung. Die Speichereinheit 2715 kann eine Datenspeichereinheit (oder ein Datenrepository) zum Speichern von Daten sein. Das Computersystem 2701 kann mit Hilfe der Kommunikationsschnittstelle 2720 mit einem Computernetzwerk („Netzwerk“) 2730 wirkverbunden sein. Das Netzwerk 2730 kann das Internet, ein Internet und/oder Extranet oder ein Intranet und/oder Extranet sein, das mit dem Internet in Verbindung steht. In einigen Fällen ist das Netzwerk 2730 ein Telekommunikations- und/oder Datennetzwerk. Das Netzwerk 2730 kann einen oder mehrere Computerserver beinhalten, die eine verteilte Datenverarbeitung, wie beispielsweise Cloud Computing, ermöglichen können. Das Netzwerk 2730 kann in einigen Fällen mit Hilfe des Computersystems 2701 ein Peer-to-Peer-Netzwerk implementieren, das es den mit dem Computersystem 2701 verbundenen Geräten ermöglicht, sich als Client oder Server zu verhalten.
-
Die CPU 2705 kann eine Sequenz von maschinenlesbaren Anweisungen ausführen, die in einem Programm oder einer Software verkörpert sein können. Die Anweisungen können an einem Speicherplatz, wie etwa dem Speicher 2710, gespeichert werden. Die Anweisungen können an die CPU 2705 geleitet werden, die anschließend die CPU 2705 zur Implementierung der Verfahren der vorliegenden Offenbarung programmieren oder anderweitig konfigurieren kann. Beispiele für von der CPU 2705 durchgeführte Vorgänge können das Abrufen, Dekodieren, Ausführen und Zurückschreiben beinhalten.
-
Die CPU 2705 kann Teil einer Schaltung, beispielsweise einer integrierten Schaltung, sein. Eine oder mehrere andere Komponenten des Systems 2701 können in der Schaltung beinhaltet sein. In einigen Fällen ist die Schaltung eine anwendungsspezifische integrierte Schaltung (ASIC).
-
Die Speichereinheit 2715 kann Dateien, wie zum Beispiel Treiber, Bibliotheken und gespeicherte Programme, speichern. Die Speichereinheit 2715 kann Benutzerdaten wie z. B. Benutzereinstellungen und Benutzerprogramme speichern. In einigen Fällen kann das Computersystem 2701 eine oder mehrere zusätzliche, sich außerhalb des Computersystems 2701 befindliche Datenspeichereinheiten beinhalten, die sich beispielsweise auf einem entfernten Server befinden, der über ein Intranet oder das Internet mit dem Computersystem 2701 kommuniziert.
-
Das Computersystem 2701 kann über das Netzwerk 2730 mit einem oder mehreren entfernten Computersystemen kommunizieren. Das Computersystem 2701 kann beispielsweise mit einem entfernten Computersystem eines Benutzers kommunizieren. Beispiele für entfernte Computersysteme beinhalten PCs (z. B. tragbare PCs), Slate- oder Tablet-PCs (z. B. Apple® iPad, Samsung® Galaxy Tab), Telefone, Smartphones (z. B. Apple® iPhone, Android-fähige Geräte, Blackberry®) oder persönliche digitale Assistenten. Der Benutzer kann über das Netzwerk 2730 auf das Computersystem 2701 zugreifen.
-
Hierin beschriebene Verfahren können mittels eines maschinell (z. B. durch einen Computerprozessor) ausführbaren Codes implementiert werden, der in einem elektronischen Speicherplatz des Computersystems 2701, wie etwa im Speicher 2710 oder der elektronischen Speichereinheit 2715, gespeichert ist. Der maschinenausführbare oder maschinenlesbare Code kann in Form von Software bereitgestellt werden. Während der Nutzung kann der Code vom Prozessor 2705 ausgeführt werden. In einigen Fällen kann der Code aus der Speichereinheit 2715 abgerufen und für den schnellen Zugriff durch den Prozessor 2705 im Speicher 2710 abgelegt werden. In einigen Situationen kann die elektronische Speichereinheit 2715 ausgeschlossen werden, und maschinenausführbare Anweisungen werden im Speicher 2710 gespeichert.
-
Der Code kann vorkompiliert und für die Verwendung mit einer Maschine konfiguriert sein, die über einen Prozessor verfügt, der zur Ausführung des Codes geeignet ist, oder er kann während der Laufzeit kompiliert werden. Der Code kann in einer Programmiersprache bereitgestellt werden, die ausgewählt werden kann, damit der Code vorkompiliert oder wie kompiliert ausgeführt werden kann.
-
Aspekte der hierin vorgesehenen Systeme und Verfahren, wie zum Beispiel das Computersystem 2701, können als Programmierung verkörpert sein. Verschiedene Aspekte der Technologie können als „Produkte“ oder „Fertigungsartikel“ betrachtet werden, üblicherweise in Form von maschinen-(oder prozessor-)ausführbarem Code und/oder zugehörigen Daten, die auf einer Art von maschinenlesbarem Medium gespeichert oder darin verkörpert sind. Maschinenausführbarer Code kann in einer elektronischen Speichereinheit wie einem Speicher (z. B. Festwertspeicher, Direktzugriffsspeicher, Flash-Speicher) oder auf einer Festplatte gespeichert werden. Medien vom Typ „Speicher“ können beliebige oder alle greifbaren Speicher der Computer, Prozessoren oder dergleichen oder zugehörige Module davon beinhalten, wie beispielsweise verschiedene Halbleiterspeicher, Bandlaufwerke, Diskettenlaufwerke und dergleichen, die jederzeit nichtflüchtigen Speicher für die Softwareprogrammierung bereitstellen können. Die gesamte Software oder Teile davon können zeitweise über das Internet oder verschiedene andere Telekommunikationsnetze übertragen werden. Eine solche Kommunikation kann zum Beispiel das Laden der Software von einem Computer oder Prozessor auf einen anderen, zum Beispiel von einem Management-Server oder Host-Computer auf die Computerplattform eines Anwendungsservers, ermöglichen. So beinhaltet ein weiterer Medientyp, der die Softwareelemente tragen kann, optische, elektrische und elektromagnetische Wellen, wie sie über physische Schnittstellen zwischen lokalen Geräten, über kabelgebundene und optische Festnetze und über verschiedene Luftverbindungen verwendet werden. Die physischen Elemente, die diese Wellen tragen, wie beispielsweise drahtgebundene oder drahtlose Verbindungen, optische Verbindungen oder dergleichen, können ebenfalls als Träger der Software betrachtet werden. Wie hierin verwendet, beziehen sich Begriffe wie „Computer“ oder „maschinenlesbares Medium“ auf beliebige Medien, die an der Bereitstellung von Anweisungen für einen Prozessor zur Ausführung beteiligt sind, es sei denn, sie beschränken sich auf nicht-transitorische, greifbare „Speichermedien“.
-
Ein maschinenlesbares Medium, wie etwa ein computerausführbarer Code, kann daher viele Formen annehmen, einschließlich, aber nicht beschränkt auf ein materielles Speichermedium, ein Trägerwellenmedium oder ein physikalisches Übertragungsmedium. Nichtflüchtige Speichermedien beinhalten zum Beispiel optische oder magnetische Festplatten, wie beliebige Speichervorrichtungen in Computern oder dergleichen, die zur Implementierung der in den Zeichnungen gezeigten Datenbanken usw. verwendet werden können. Flüchtige Speichermedien beinhalten einen dynamischen Speicher, wie den Hauptspeicher einer solchen Computerplattform. Materielle Übertragungsmedien beinhalten Koaxialkabel, Kupferdraht und Glasfaserkabel, einschließlich der Drähte, die einen Bus innerhalb eines Computersystems umfassen. Trägerwellen können in Form elektrischer oder elektromagnetischer Signale, akustischer Wellen oder Lichtwellen übertragen werden, wie sie bei der Datenkommunikation über Hochfrequenz (RF) und Infrarot (IR) entstehen. Gängige Formen computerlesbarer Medien beinhalten daher beispielsweise: eine Diskette, eine flexible Platte, eine Festplatte, ein Magnetband, ein beliebiges anderes magnetisches Medium, eine CD-ROM, eine DVD oder DVD-ROM, ein beliebiges anderes optisches Medium, Lochkarten, Lochstreifen, ein beliebiges anderes physikalisches Speichermedium mit Lochmustern, einen RAM, einen ROM, einen PROM und EPROM, einen FLASH-EPROM, einen beliebigen anderen Speicherchip oder eine Kassette, eine Trägerwelle, die Daten oder Befehle transportiert, Kabel oder Verbindungen, die eine solche Trägerwelle transportieren, oder ein beliebiges anderes Medium, von dem ein Computer Programmiercode und/oder Daten lesen kann. Viele dieser Formen von computerlesbaren Medien können dazu dienen, eine oder mehrere Sequenzen von einer oder mehreren Anweisungen zur Ausführung an einen Prozessor zu übertragen.
-
Das Computersystem 2701 kann eine elektronische Anzeige 2735 beinhalten oder mit dieser in Verbindung stehen, die eine Benutzerschnittstelle (UI) 2740 zur Bereitstellung beispielsweise (i) einer Analyse beliebiger zellfreier Nukleinsäuremoleküle, (ii) einer Bestimmung der Erkrankung des Subjekts, die zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen basiert, (iii) eines ermittelten Verlaufs der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen, (iv) eines identifizierten Subjekts, bei dem zumindest teilweise basierend auf den identifizierten zellfreien Nukleinsäuremolekülen ein Verdacht auf die Erkrankung besteht, oder (v) einer ermittelten Behandlung der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen, umfasst. Beispiele für Benutzeroberflächen beinhalten, ohne Einschränkung, eine grafische Benutzeroberfläche (GUI) und eine webbasierte Benutzeroberfläche.
-
Verfahren und Systeme der vorliegenden Offenbarung können mittels eines oder mehrerer Algorithmen implementiert werden. Ein Algorithmus kann bei der Ausführung durch die zentrale Verarbeitungseinheit 2705 als Software implementiert werden. Der Algorithmus kann zum Beispiel (i) aus Sequenzierungsdaten, die von einer Vielzahl von zellfreien Nukleinsäuremolekülen abgeleitet sind, ein oder mehrere zellfreie Nukleinsäuremoleküle identifizieren, die die Vielzahl von Phasenvarianten umfassen, (ii) beliebige der identifizierten zellfreien Nukleinsäuremoleküle analysieren, (iii) eine Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen bestimmen, (iv) einen Verlauf der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen beobachten, (v) den Subjekt zumindest teilweise basierend auf den identifizierten zellfreien Nukleinsäuremolekülen identifizieren, oder (vi) eine geeignete Behandlung der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen bestimmen.
-
BEISPIELE
-
Die folgenden Beispiele sind repräsentativ für Ausführungsformen der hierin beschriebenen Stimulationen, Systeme und Verfahren und sind in keiner Weise als einschränkend zu verstehen.
-
Beispiel 1: Genomische Verteilung von Phasenvarianten
-
Beschrieben ist eine Alternative zur Duplex-Sequenzierung zur Verringerung der Hintergrundfehlerrate, die den Nachweis von „Phasenvarianten“ (PVs) umfasst, wobei zwei oder mehr Mutationen in cis auftreten (d. h. auf demselben DNA-Strang 1A und 1E). Ähnlich wie bei der Duplex-Sequenzierung bietet dieses Verfahren niedrigere Fehlerprofile aufgrund des übereinstimmenden Nachweises von zwei separaten Nicht-Referenzereignissen in einzelnen Molekülen. Anders als bei der Duplex-Sequenzierung finden jedoch beide Ereignisse auf demselben Sequenzierlesepaar statt, wodurch die Effizienz der Genomrückgewinnung erhöht wird. Phasenmutationen kommen bei verschiedenen Krebsarten vor, treten jedoch, wahrscheinlich aufgrund von zielgerichteter und aberranter somatischer Hypermutation (aSHM), die durch die aktivierungsinduzierte Deaminase (AID) angetrieben wird, in stereotypen Teilen des Genoms bei B-Zell-Malignomen auf. Die am weitesten verbreiteten Bereiche von aSHM in B-Zell-Non-Hodgkin-Lymphomen (NHL) sind identifiziert. Hierin beschrieben ist Phasenvarianten-Anreicherung und Nachweis-Sequenzierung (PhasED-Seq.), ein neuartiges Verfahren zum Nachweis von ctDNA durch Phasenvarianten in Tumorfraktionen in der Größenordnung von Teilen pro Million. Hierin beschrieben ist eine Demonstration, dass PhasED-Seq. den Nachweis von ctDNA in klinischen Proben sowohl während der Therapie als auch vor einem Krankheitsrückfall bedeutend verbessern kann.
-
Zur Identifizierung von Malignomen, bei denen PVs den Krankheitsnachweis möglicherweise verbessern können, wurde die Häufigkeit von PVs bei verschiedenen Krebsarten untersucht. Öffentlich verfügbare Ganzgenom-Sequenzierungsdaten wurden zur Identifizierung von Variantensätzen analysiert, die in einem Abstand von < 170bp voneinander auftreten, was der üblichen Länge eines einzelnen cfDNA-Fragments entspricht, das aus einem einzelnen Kern-Nukleosom und einem zugehörigen Linker besteht. Die Häufigkeit dieser „putativen Phasenvarianten“ (Beispiel 10) für die Gesamtzahl der SNV von 2538 Tumoren in 24 Krebshistologien einschließlich solider Tumoren und hämatologischer Malignome (1B, 5 und Tabelle 1) wurde identifiziert und zusammengefasst. PVs waren am signifikantesten in zwei B-Zell-Lymphomen angereichert (DLBCL und follikuläres Lymphom, FL, P < 0,05 im Vergleich zu allen anderen Histologien), einer Gruppe von Krankheiten mit Hypermutation, die durch AID/AICDA angetrieben wird.
-
Beispiel 2: PVs zugrundeliegende Mutationsmechanismen
-
Zur Untersuchung des Ursprungs der PVs wurden die Mutationssignaturen der Einzelbasensubstitution (SBS), die zu den innerhalb von 170 bp einer anderen SNV auftretenden SNV beitragen, und die isoliert auftretenden SNV (z. B. ohne eine andere SNV innerhalb von 170 bp) verglichen (Beispiel 10). Wie erwartet waren PVs in mehreren, mit gruppierten Mutationen assoziierten Mutationssignaturen stark angereichert. Signaturen von mit der Aktivität von AID assoziierten gruppierten Mutationen (SBS84 und SBS85) waren signifikant in PVs von B-Zell-Lymphomen und CLL angereichert, während Signaturen, die mit der Aktivität von APOBEC3B (SBS2 und SBS13) - einem weiteren Mechanismus der Kataegis-Hypermutation - assoziiert sind, signifikant in PVs von mehreren soliden Krebs-Histologien, einschließlich Eierstock-, Pankreas-, Prostata- und Brust-Adenokarzinomen, angereichert waren (1C und 6A-6WW). Signaturen von mit der Aktivität von AID assoziierten gruppierten Mutationen (SBS84 und SBS85) waren in PVs angereichert, die in Lymphomen und CLL vorkommen, während Signaturen, die mit der Aktivität von APOBEC3B (SBS2 und SBS13) assoziiert sind, signifikant in Brustkrebs angereichert waren (1C und 6A-6WW). PVs von mehreren Tumorarten wurden auch mit SBS4 assoziiert, einer mit dem Tabakkonsum assoziierten Signatur. Darüber hinaus wurde unter den PVs in verschiedenen Tumorhistologien eine neuartige Anreicherung in mehreren anderen Signaturen ohne eindeutig zugehörige Mechanismen beobachtet (z. B. SBS24, SBS37, SBS38 und SBS39). Im Gegensatz dazu waren altersassoziierte Mutationssignaturen wie SBS1 und SBS5 in isolierten SNV deutlich angereichert.
-
Beispiel 3: PVs treten in stereotypen Genombereichen bei lymphatischen Krebsarten auf
-
Zur Beurteilung der genomischen Verteilung der putativen PVs wurden diese Ereignisse zunächst in 1-kb-Bereiche eingeteilt, um ihre Häufigkeit in verschiedenen Tumortypen zu visualisieren. Es wurde eine auffallend stereotype Verteilung von PVs in einzelnen lymphatischen Neoplasmen (z. B. DLBCL, FL, Burkitt-Lymphom (BL) und chronischer lymphatischer Leukämie (CLL); 1D und 7) beobachtet. Im Gegensatz dazu wiesen nichtlymphatische Krebsarten in der Regel kein wesentliches Rezidiv von gruppierten PVs in stereotypisierten Bereichen auf. Dieses Fehlen von Stereotypen in Bezug auf die Position von PVs war auch bei der Betrachtung von Melanomen und Lungenkrebs, Krankheiten mit häufigen PVs, festzustellen.
-
Auffällig ist, dass die Mehrzahl der hypermutierten Bereiche allen drei Lymphom-Subtypen gemeinsam war, wobei die höchsten Dichten in bekannten Zielen von aSHM, einschließlich BCL2, BCL6 und MYC, sowie in den die schweren und leichten Ketten IGH, IGK und IGL codierenden Immunglobulin-(Ig-)Loci zu beobachten waren (Tabelle 2). Markant ist, dass bestimmte Bereiche innerhalb der Ig-Loci bei fast allen Lymphompatienten und auch bei Patienten mit CLL dicht mutiert waren (1D). Unter den Lymphom-Subtypen wiesen die DLBCL-Tumore die meisten 1-kb-Bereiche auf, die rezidivierende PVs enthielten (8A), was mit der höchsten Anzahl an rezidivierend mutierten Genen in diesem Tumortyp übereinstimmt. Insgesamt wurden 1639 eindeutige 1-kb-Bereiche identifiziert, die rezidivierende PVs in B-Lymphoid-Malignität enthalten. Von diesen Lymphom-assoziierten 1-kb-Bereichen fiel fast ein Drittel in Genombereiche, die zuvor mit physiologischer oder aberranter SHM in B-Zellen assoziiert waren. Genauer gesagt befanden sich 19 % (315/1639) in Ig-Bereichen, während 13 % (218/1639) in Teilen von 68 zuvor identifizierten Zielen von aSHM lagen (Tabelle 2). Während die meisten PVs in nicht-codierende Bereiche des Genoms fielen, wurden auch zusätzliche, rezidivierend betroffene Loci identifiziert, die bisher nicht als Ziele von aSHM beschrieben worden waren, einschließlich unter anderem XBP1, LPP und AICDA.
-
Die Verteilung der PVs innerhalb jeder lymphoiden Malignität korrelierte mit onkogenen Merkmalen, die mit der unterschiedlichen Pathophysiologie der entsprechenden Krankheit verbunden sind. Beispielsweise enthielten Fälle von FL - bei denen mehr als 90 % der Tumore onkogene BCL2-Fusionen aufweisen - mit signifikant höherer Wahrscheinlichkeit Phasenvarianten von BCL2 als andere lymphoide Malignitäten (1D und 8B). In ähnlicher Weise wiesen signifikant mehr Burkitt-Lymphome (BL) PVs in MYC und ID3 auf, zwei Treibergene, die stark mit der BL-Pathogenese assoziiert sind, als andere lymphoide Malignitäten (1D und 8C-8D). Die mit unterschiedlichen Ursprungszellen assoziierten molekularen DLBCL-Subtypen zeigten ebenfalls unterschiedliche Verteilungen von PVs (Tabelle 2). Während Keimzentrums-B-Zellen-ähnliche (GCB) und aktivierte B-Zellen-ähnliche (ABC) DLBCLs insgesamt eine ähnliche Häufigkeit von PVs aufwiesen (Median 798 vs. 516, P = 0,37), wurde eine signifikante Anreicherung von PVs in den telomeren IGH-Klassenwechselbereichen (Sγ1 und Sγ3) bei ABC-DLBCLs gefunden, was im Einklang mit früheren Berichten41 steht (8E). Umgekehrt wiesen GCB-DLBCLs mehr Phasenhaplotypen in zentromerischen IGH-Klassenwechselbereichen (Sα2 und Sε) und in BCL2 auf.
-
Beispiel 4: Gestaltung und Validierung eines PhasED-Seq. Panels für Lymphom
-
Um diese PV-reichen Bereiche zu validieren und ihren Nutzen für den Nachweis von Krankheiten anhand von ctDNA zu bewerten, wurde ein Sequenzierungspanel gestaltet, das auf putative PVs abzielt, die in WGS aus drei unabhängigen Kohorten von Patienten mit DLBCL sowie bei Patienten mit CLL identifiziert wurden (2A und Beispiel 10). Dieses endgültige Panel für Phasenvarianten-Anreicherung und -Nachweis (PhasED-Seq.) zielte auf ~115kb genomischen Raum, der sich auf PVs konzentrierte, zusammen mit zusätzlichen ~200kb, die auf Gene abzielten, die rezidiv in B-NHLs mutiert sind (Tabelle 3). Während der für PV-Erfassungsziele vorgesehene Raum von 115 kb nur 0,0035 % des menschlichen Genoms abdeckt, werden 26 % der in reifen B-Zell-Neoplasmen mit WGS-Profilen beobachteten Phasenvarianten erfasst (9A), was zu einer ~7500-fachen PV-Anreicherung durch PhasED-Seq. im Vergleich zu WGS führt.
-
Die erwartete SNV- und PV-Rückgewinnung wurde mit dem zuvor berichteten CAPP-Seq.-Selektor verglichen, der zur Maximierung der SNV pro Patient bei B-Zell-Lymphomen gestaltet wurde (9A-C). Bei Berücksichtigung diverser B-NHLs mit verfügbaren WGS-Daten konnte PhasED-Seq. im medianen Fall 3,0-mal mehr SNV (81 vs. 27) und 2,9-mal mehr PVs (50 vs. 17) rückgewinnen als das vorherige CAPP-Seq.-Panel. Diese Beobachtung betont die Wichtigkeit, nicht-codierende Teile des Genoms für eine maximale Mutationsrückgewinnung einzuschließen. Zur Validierung dieser Ertragsverbesserungen wurden 16 Tumor- oder Plasma-DNA-Proben von Patienten mit DLBCL (Tabelle 4) vor der Behandlung mit einem Profil versehen. Sowohl CAPP-Seq- als auch PhasED-Seq.-Panels wurden parallel auf jede Probe angewendet und danach bis zu einer hohen eindeutigen molekularen Tiefe sequenziert (2B). Verglichen mit der durch WGS etablierten erwarteten Anreicherung wurden ähnliche Verbesserungen bei der Ausbeute an SNV durch PhasED-Seq. im Vergleich zu CAPP-Seq. (2,7x; Median 304,5 vs. 114) beobachtet. Bei der Auszählung der in individuellen sequenzierten DNA-Fragmenten beobachteten PVs wurde jedoch eine Verbesserung zugunsten von PhasED-Seq. festgestellt, die über die erwartete Verbesserung durch WGS hinausging (7,7x; Median 5554 vs. 719,5 PVs/Fall). Diese Verbesserung ist möglicherweise entweder 1) auf die höhere Sequenzierungstiefe bei der gezielten Sequenzierung zurückzuführen, die zu einer Verbesserung des Nachweises seltener Allele führt, oder 2) auf die Auszählung von PVs höherer Ordnung bei der gezielten Sequenzierung mit PhasED-Seq. oder CAPP-Seq, die beim WGS-Design nicht berücksichtigt wurde (d. h. > 2 SNV pro Fragment; 9D-9F). Darüber hinaus wurde über 1-kb-Fenster im Panel eine robuste Korrelation zwischen der Häufigkeit putativer PVs in WGS-Daten und PVs aus der gezielten Sequenzierung durch PhasED-Seq. über 101 DLBCL-Proben (2C) beobachtet, was die Häufigkeit und Verteilung von PVs in B-Zell-Malignitäten weiter validiert.
-
Beispiel 5: Unterschiede bei Phasenvarianten zwischen Lymphom-Subtypen
-
Nach der Validierung des PhasED-Seq.-Panels wurden die biologischen Unterschiede in PVs zwischen verschiedenen B-Zell-Malignitäten, einschließlich DLBCL (n=101), primärem mediastinalem B-Zell-Lymphom (PMBCL) (n=16) und klassischem Hodgkin-Lymphom (cHL) (n=23), untersucht. Die Anzahl der pro Fall identifizierten SNV unterschied sich nicht signifikant zwischen den Lymphom-Subtypen (9G-9K). Bei Berücksichtigung der Mutationshaplotypen wies cHL jedoch eine deutlich geringere Last an PVs auf als DLBCL oder PMBCL. Zusätzlich zu dieser quantitativen Diskrepanz wurden auch Unterschiede in der genomischen Lage der PVs zwischen verschiedenen B-Zell-Lymphom-Subtypen beobachtet (2D-2E und 10-12). Dies beinhaltete bereits zuvor etablierte biologische Assoziationen in DLBCL-Subtypen, einschließlich häufigerer PVs in BCL2 bei DLBCL vom GCB-Typ als vom ABC-Typ, wobei die umgekehrte Assoziation für PIM1 beobachtet wurde. Es wurden auch häufigere PVs in CIITA bei PMBCL im Vergleich zu DLBCL beobachtet, einem Gen, in dem Bruchpunkte bei PMBCL häufig sind. Relative Anreicherungen wurden auch im gesamten IGH Locus beobachtet, mit häufigeren PVs in den Bereichen Sy3 und Sγ1 bei ABC-DLBCL (im Vergleich zu GCB-DLBCL) und interessanterweise häufigeren PVs im Locus Sε bei cHL im Vergleich zu DLBCL (2E und 13). Insgesamt wurden nach Korrektur zur Prüfung multipler Hypothesen signifikante relative Anreicherungen in 25 genetischen Loci zwischen ABC- und GCB-DLBCL, 24 zwischen DLBCL und PMBCL und 40 zwischen DLBCL und cHL gefunden (10-12).
-
Beispiel 6: Rückgewinnung von Phasenvarianten durch PhasED-Seq.
-
Um den Nachweis von ctDNA mit Hilfe von PVs zu erleichtern, ist eine effiziente Rückgewinnung von DNA-Molekülen erforderlich. Die Hybrid-Capture-Sequenzierung ist potenziell empfindlich gegenüber DNA-Unstimmigkeiten, da mit zunehmenden Mutationen die Hybridisierungseffizienz abnimmt. In der Tat können AID-Hotspots eine lokale Mutationsrate von 5-10 % aufweisen, mit noch höheren Raten in bestimmten Bereichen der IGH. Zur empirischen Bewertung der Auswirkungen der Mutationsrate auf die Capture-Effizienz wurde die DNA-Hybridisierung von 150-meren mit unterschiedlichen Mutationsraten in silico simuliert. Wie erwartet, nahm die vorhergesagte Bindungsenergie mit zunehmender Anzahl von Mutationen ab (14A). Insbesondere hatten zufällig verteilte Mutationen eine größere Auswirkung auf die Bindungsenergie als gruppierte Mutationen. Zur Beurteilung der Auswirkung dieser verminderten Bindungsaffinität wurden 150-mer-DNA-Oligonukleotide mit 0 bis 10 % Abweichung von der Referenzsequenz in MYC und BCL6, zwei Loci, die Ziele von aSHM sind, synthetisiert. Zur Beurteilung des Worst-Case-Szenarios für die Hybridisierung wurden die Nicht-Referenzbasen nicht in Gruppen, sondern zufällig verteilt (Beispiel 10). Eine äquimolare Mischung dieser Oligonukleotide wurde dann mit dem PhasED-Seq.-Panel erfasst. In Übereinstimmung mit den In silico-Vorhersagen führte eine höhere Mutationsrate zu einer geringeren Erfassungseffizienz (3A). Moleküle mit einer Mutationsrate von 5 % wurden mit einer Effizienz von 85 % im Vergleich zu ihren Gegenstücken im Wildtyp erfasst, während Moleküle mit einer Mutationsrate von 10 % mit einer relativen Effizienz von nur 27 % erfasst wurden. Zur Beurteilung der Prävalenz dieses Mutationsgrades in menschlichen Tumoren wurde die Verteilung der Varianten im Panel bei 140 Patienten mit B-Zell-Lymphomen untersucht, wobei der Anteil der mutierten Basen in sich überlappenden 151-bp-Fenstern berechnet wurde (Beispiel 10). Nur 7 % (10/140) der Patienten hatten ein beliebiges 151-bp-Fenster mit einer Mutationsrate von über 10 % (14B-C). In der Tat wurde bei dem Versuch mit synthetischen Oligonukleotiden eine 5 %ige Mutationsrate fast genauso effizient rückerlangt wie die Wildtyp-Sequenz. In mehr als der Hälfte aller betrachteten Fälle wies kein Locus eine Mutationsrate von > 5 % in einem beliebigen Fenster auf, während in allen Fällen > 90 % der Fenster < 5 % Mutationen aufwiesen. Insgesamt deuten diese Beobachtungen daraufhin, dass, trotz der Hybridisierungsverzerrungen, die Mehrheit der Phasenmutationen durch effiziente Hybriderfassung rückerlangt werden kann.
-
Beispiel 7: Fehlerprofil und Nachweisgrenze für Phasenvarianten-Sequenzierung
-
Bisherige Verfahren zur hochgradig fehlerunterdrückten Sequenzierung von cfDNA haben entweder eine Kombination aus molekularen und In silico-Verfahren zur Fehlerunterdrückung (z. B. integrierte digitale Fehlerunterdrückung, iDES) oder molekulare Duplex-Rückgewinnung angewandt. Beide haben jedoch ihre Grenzen, sei es beim Nachweis von Ereignissen bei extrem niedrigen Tumorfraktionen oder bei der effizienten Rückgewinnung der ursprünglichen DNA-Moleküle, was für die cfDNA-Analyse, bei der die Ausgangs-DNA begrenzt ist, von großer Bedeutung ist. Das Fehlerprofil und die Rückgewinnung von Ausgangsgenomen aus cfDNA-Plasmaproben von 12 gesunden Erwachsenen durch PhasED-Seq. wurden mit iDES-CAPP-Seq. und Duplex-Sequenzierung verglichen. Während die iDES-angereicherte CAPP-Seq. ein geringeres Hintergrundfehlerprofil aufwies als die Barcode-Deduplikation allein, bot die Duplex-Sequenzierung die niedrigste Hintergrundfehlerrate für nicht-referenzielle Einzelnukleotid-Substitutionen (3B, 3,3 × 10-5 vs. 1,2 × 10-5, P < 0,0001). Die Rate der Phasenfehler - z. B. mehrere Nicht-Referenzbasen auf demselben Sequenzierungsfragment - war jedoch deutlich niedriger als die Rate der Einzelfehler in iDES-angereicherten CAPP-Seq- oder Duplex-Sequenzierungsdaten. Dies galt sowohl für das Vorkommen von zwei (2-fach oder ,Dublett`-PVs) als auch von drei (3-fach oder ,Triplett‘-PVs) Substitutionen auf ein und demselben DNA-Molekül (3B, 8,0 × 10-7 bzw. 3,4 × 10-8, P < 0,0001). Phasenfehler, die Substitutionen von C zu T oder T zu C enthalten, waren häufiger als andere Arten von PVs (14D). Bemerkenswert ist, dass die Fehlerrate der Dublett-PVs in cfDNA auch mit dem Abstand zwischen Positionen korreliert, wobei die höchste PV-Fehlerrate aus benachbarten SNV (z. B. DNVs) besteht und die Fehlerrate mit zunehmendem Abstand zwischen den einzelnen Varianten abnimmt (14E). Unter Berücksichtigung der eindeutigen molekularen Tiefe wurden bei der Duplex-Sequenzierung nur 19 % aller eindeutigen cfDNA-Fragmente rückerlangt (3C). Im Gegensatz dazu war die eindeutige Tiefe der PVs innerhalb eines genomischen Abstands von <20 bp fast identisch mit der Tiefe der individuellen Positionen (z. B. der Moleküle, die individuelle SNV abdecken). In ähnlicher Weise wiesen PVs mit einer Größe von bis zu 80 bps eine Tiefe von mehr als 50 % des Medians der eindeutigen molekularen Tiefe für eine Probe auf. Wichtig ist, dass fast die Hälfte (48 %) aller PVs innerhalb von 80 bp voneinander lagen, was ihren Nutzen für den Krankheitsnachweis aus ausgangsbegrenzten cfDNA-Proben zeigt (3D).
-
Zum quantitativen Vergleich der Leistung von PhasED-Seq. mit alternativen Verfahren zum Nachweis von ctDNA wurden limitierende Verdünnungen von ctDNA von 3 Lymphompatienten mit gesunder Kontroll-cfDNA hergestellt, was zu erwarteten Tumoranteilen zwischen 0,1 % und 0,00005 % (1 Teil in 2.000.000; (Beispiel 10) führte. Der erwartete Tumoranteil wurde mit dem geschätzten Tumorgehalt in jeder dieser Verdünnungen unter Verwendung von PhasED-Seq. verglichen, um vom Tumor abgeleitete PVs zu verfolgen, sowie mit fehlerunterdrückten Nachweisen in Abhängigkeit von einzelnen SNV (z. B. iDES-angereicherter CAPP-Seq. oder Duplex-Sequenzierung; 3E). Alle Verfahren funktionierten gleich gut bis zu Tumoranteilen von 0,01 % (1 Teil in 10.000). Unterhalb dieses Wertes (z. B. 0,001 %, 0,0002 %, 0,0001 % und 0,00005 %) waren jedoch sowohl die PhasED-Seq. als auch die Duplex-Sequenzierung der iDES-angereicherten CAPP-Seq. deutlich überlegen (P<0,0001 für Duplex, ,2x`-PhasED-Seq. und ,3x'-PhasED-Seq.; 3E). Zusätzlich identifizierte die Verfolgung von 2 oder 3 Varianten in Phase (z. B. 2x- und 3x-PhasED-Seq.) im Vergleich zur Duplex-Sequenzierung den erwarteten Tumorgehalt genauer, mit einer überlegenen Linearität von bis zu 1 Teil in 2.000.000 (P = 0,005 für Duplex vs. 2x-PhasED-Seq., P = 0,002 für 3x-PhasED-Seq.) (Beispiel 10). Die Spezifität der PVs wurde durch die Suche nach Hinweisen auf vom Tumor abgeleitete SNV oder PVs in cfDNA-Proben von 12 nicht verwandten gesunden Subjekt und der für die Grenzverdünnung verwendeten gesunden Kontrolle bewertet. Auch hier zeigten sowohl die 2x-als auch die 3x-PhasED-Seq. signifikant niedrigere Hintergrundsignalwerte als die CAPP-Seq. und die Duplex-Sequenzierung (3F). Diese niedrigere Fehlerrate und der Hintergrund von PVs verbessert die Nachweisgrenze für den Nachweis von ctDNA-Krankheiten. In einigen Fällen erfordert das hierin beschriebene Verfahren der auf Sequenzierung basierenden cfDNA-Assays (z. B. das in 3E und 3F dargestellte Verfahren) keine molekularen Barcodes, um eine exquisite Fehlerunterdrückung und niedrige Nachweisgrenzen zu erreichen. Bei der Beurteilung des Signals durch das Verfahren ohne Barcode wurden Verdünnungsreihen von 1 : 1.000 bis 5 : 10.000.000 und „leere“ Kontrollen verwendet (23A-23B).
-
Diese Verdünnungsreihe wurde zur Beurteilung der Nachweisgrenze für eine gegebene Anzahl von PVs verwendet (3G-3I). Bei Berücksichtigung eines Satzes von PVs innerhalb von Bereichen mit 150 Basenpaaren (bp) kann die Wahrscheinlichkeit des Nachweises für eine gegebene Probe durch Binomialstichproben genau modelliert werden, wobei sowohl die Tiefe der Sequenzierung als auch die Anzahl der 150bp-Bereiche mit PVs berücksichtigt werden (Beispiel 10).
-
Beispiel 8: Verbesserungen beim Nachweis einer minimalen Resterkrankung mit geringer Last
-
Um den Nutzen der mit PhasED-Seq. gebotenen niedrigeren LOD für den Nachweis von MRD mit sehr geringer Last aus cfDNA zu prüfen, wurden serielle zellfreie DNA-Proben von einem Patienten sequenziert, der sich einer Erstlinientherapie für DLBCL unterzieht (4A). Mithilfe von CAPP-Seq. war bei diesem Patienten nach nur einem Therapiezyklus keine ctDNA mehr nachweisbar, und mehrere nachfolgende Proben während und nach der Behandlung blieben ebenfalls nicht nachweisbar. Bei diesem Patienten kam es > 250 Tage nach Therapiebeginn zu einem erneuten Auftreten von nachweisbarer ctDNA und schließlich 5 Monate später zu einer klinischen und radiologischen Progression der Krankheit, was auf falsch-negative Serienmessungen mit CAPP-Seq. hindeutet. Auffallend ist, dass alle vier Plasmaproben, die während und nach der Behandlung durch CAPP-Seq. nicht nachweisbar waren, durch PhasED-Seq. nachweisbare ctDNA-Spiegel aufwiesen, mit mittleren Allelfraktionen von nur 6 Teilen in 1.000.000. Diese erhöhte Empfindlichkeit verbesserte im Vergleich zur radiologischen Überwachung die Vorlaufzeit für den Krankheitsnachweis durch ctDNA von 5 mit CAPP-Seq. auf 10 Monate mit PhasED-Seq.
-
Anschließend wurde die Leistung des PhasED-Seq.-ctDNA-Nachweises in einer Kohorte aus 107 Patienten mit großzelligen B-Zell-Lymphomen und Blutproben, die nach 1 oder 2 Zyklen einer Standard-Immunchemotherapie verfügbar waren, beurteilt. Wichtig ist, dass die mit PhasED-Seq. gemessenen ctDNA-Konzentrationen stark mit denen korrelierten, die mit CAPP-Seq. gemessen wurden. Insgesamt wurden 443 Tumor-, Keimbahn- und zellfreie DNA-Proben, einschließlich cfDNA vor der Therapie (n=107) und nach 1 oder 2 Behandlungszyklen (n=82 und 89), ausgewertet. Vor der Therapie waren patientenspezifische PVs durch PhaseED-Seq. in 98 % der Proben nachweisbar, mit 95 % Spezifität in cfDNA von gesunden Kontrollen (15 und 16A). Wichtig ist, dass die mit PhasED-Seq. gemessenen ctDNA-Werte stark mit den mit CAPP-Seq. gemessenen Werten korrelierten, unter Berücksichtigung sowohl der Proben vor der Behandlung als auch der Proben nach der Behandlung (Spearman Rho=0,91, 16B). Als Nächstes wurden die quantitativen Spiegel von ctDNA, die mittels PhasED-Seq. und CAPP-Seq. aus cfDNA-Proben nach Beginn der Therapie gemessen wurden, verglichen. Insgesamt wurden 72 % (78/108) der durch PhasED-Seq. nach 1 oder 2 Zyklen nachweisbaren ctDNA-Proben auch durch konventionelle CAPP-Seq. nachgewiesen (4B). Unter den mit PhasED-Seq. nachgewiesenen 108 Proben war die Krankheitslast bei denjenigen mit durch CAPP-Seq. nicht nachweisbaren (28 %) gegenüber nachweisbaren (72 %) ctDNA-Spiegeln signifikant geringer, mit einem > 10-fachen Unterschied in den medianen ctDNA-Spiegeln (Tumorfraktion 2,2 × 10-4 gegenüber 1,2 × 10-5, P < 0,001, 4B). Insgesamt wiesen weitere 16 % (13/82) der Proben nach 1 Therapiezyklus und 19 % (17/89) der Proben nach 2 Therapiezyklen beim Vergleich von PhasED-Seq. mit CAPP-Seq. nachweisbare ctDNA auf (4C).
-
Die Kriterien für die molekulare Remission der ctDNA wurden zuvor für DLBCL-Patienten unter Verwendung von CAPP-Seq. beschrieben und beinhalten die eindeutige molekulare Remission (Major Molecular Resopnse, MMR), definiert als eine 2,5-log-Reduktion in ctDNA nach 2 Therapiezyklen22. Während die MMR zu diesem Zeitpunkt prognostisch für das Ergebnis ist, haben viele Patienten zu diesem Meilenstein nicht durch CAPP-Seq nachweisbare ctDNA (4D-4E). Wichtig ist, dass selbst bei Patienten mit nicht durch CAPP-Seq. nachweisbarer ctDNA der Nachweis von okkulten ultraniedrigen ctDNA-Spiegeln durch PhasED-Seq. prognostisch für Ergebnisse war, die das ereignisfreie und das Gesamtüberleben beinhalten (4D). Tatsächlich wiesen 58 % (52/89) der 89 Patienten mit zu diesem Zeitpunkt verfügbaren Proben bei der MMR-Zwischenbeurteilung nach Abschluss von 2 von 6 geplanten Therapiezyklen nicht durch CAPP-Seq. nachweisbare ctDNA auf. Bei der Verwendung von PhasED-Seq wiesen 33 % (17/52) der nicht durch CAPP-Seq. nachgewiesenen Proben Hinweise auf ctDNA auf, die durch PVs nachgewiesen wurden, mit Spiegeln von bis zu ~3:1.000.000 (17A-17D) - diese 17 Fälle, die zusätzlich durch PhasED-Seq. nachgewiesen wurden, stellen potenzielle falsch-negative Tests durch CAPP-Seq. dar. Ähnliche Ergebnisse wurden zum Zeitpunkt der frühen molekularen Remission (EMR) beobachtet (d. h. nach 1 Zyklus der Therapie, 18A-18H).
-
Während der Nachweis von ctDNA bei DLBCL nach 1 oder 2 Therapiezyklen ein bekannter negativer prognostischer Marker ist, sind die Ergebnisse für Patienten mit nicht nachweisbarer ctDNA zu diesen Zeitpunkten heterogen (4E und 18F). Wichtig ist, dass selbst bei Patienten mit nicht durch CAPP-Seq nachweisbarer ctDNA nach 1 oder 2 Therapiezyklen der Nachweis von extrem niedrigen ctDNA-Werten durch PhasED-Seq eine starke Prognose für die Ergebnisse einschließlich des ereignisfreien Überlebens beinhaltete (4F, 17C-D, 18C-D und 18G). Bei der Kombination des Nachweises durch PhasED-Seq. mit dem zuvor beschriebenen MMR-Schwellenwert konnten die Patienten in drei Gruppen eingeteilt werden: Patienten, die keine MMR erreichten, Patienten, die eine MMR erreichten, jedoch persistierende ctDNA aufwiesen, und Patienten mit nicht nachweisbarer ctDNA (4G). Interessanterweise hatten Patienten, die keine MMR erreichten, trotz zusätzlicher geplanter Erstlinientherapie (z. B. innerhalb des ersten Jahres der Behandlung) ein besonders hohes Risiko für frühe Ereignisse, während Patienten mit anhaltend niedrigen ctDNA-Werten offenbar ein höheres Risiko für spätere Rückfälle oder Progressionen hatten. Im Gegensatz dazu hatten Patienten mit nicht nachweisbarer ctDNA nach 2 Therapiezyklen durch PhasED-Seq. überwältigend günstige Ergebnisse, wobei 95 % ereignisfrei waren und 97 % eine Gesamtüberlebenszeit von 5 Jahren aufwiesen. Ähnliche Ergebnisse wurden zum EMR-Zeitpunkt nach 1 Zyklus der Therapie beobachtet (18H).
-
Beispiel 9: Beispielhafte Ausführungsformen des Mutationsnachweises mittels Next-Generation-Sequenzierung (NGS), wenn es sich bei der Mutation nicht um eine einzelne Basensubstation, sondern um ein Mutationspaar handelt
-
In vielen Fällen kann eine Einschränkung der cfDNA-Verfolgung darin bestehen, dass nur eine begrenzte Anzahl von Molekülen für den Nachweis zur Verfügung steht. Darüber hinaus gibt es mehrere potenzielle Einschränkungen bei der Verfolgung von Tumormolekülen aus zellfreier DNA, die nicht nur das Fehlerprofil bei der Sequenzierung, sondern auch die Anzahl der für den Nachweis verfügbaren Moleküle beinhalten. Die Anzahl der für den Nachweis verfügbaren Moleküle - hier als Anzahl der „auswertbaren Fragmente“ bezeichnet - kann sowohl als Funktion der Anzahl der rückerlangten eindeutigen Genome (z. B. der eindeutigen Sequenzierungstiefe) als auch der Anzahl der verfolgten somatischen Mutationen betrachtet werden. Genauer gesagt, die Anzahl der auswertbaren Fragmente ist gleich: EF = d * n.
-
Wobei d = die berücksichtigte eindeutige molekulare Tiefe und n = die Anzahl der verfolgten somatischen Veränderungen ist. Für die typischen zellfreien DNA-Proben werden oft weniger als 10.000 eindeutige Genome rückerlangt (d), sodass ein beliebiges empfindliches Verfahren zur Verfolgung von Mehrfachveränderungen erforderlich ist (n). Darüber hinaus besteht, wie bereits erwähnt, die größte Einschränkung bei der Duplex-Sequenzierung in der Schwierigkeit, eine ausreichende molekulare Tiefe (d) zu erhalten. So gibt es von einer typischen Plasmaprobe mit einer Duplex-Tiefe von ~1.500x, selbst wenn 100 somatische Veränderungen vorliegen, nur 150.000 auswertbare Fragmente. In diesem Szenario wird die Empfindlichkeit also durch die Anzahl der für den Nachweis verfügbaren Moleküle begrenzt. Im Gegensatz dazu berücksichtigen andere Verfahren wie iDES-angereicherte CAPP-Seq. alle rückerlangten Moleküle. Hier können bis zu 5.000-6.000x eindeutige haploide Genome rückerlangt werden. Daher kann die Anzahl der auswertbaren Fragmente, die dieselben 100 somatischen Veränderungen aufweisen, 500.000-600.000x sein. Das Fehlerprofil der einzelsträngigen Sequenzierung erlaubt jedoch selbst mit Fehlerunterdrückung einen Nachweis von bestenfalls 1 Teil in 50.000. Daher müssen Verfahren, die auf eine Verbesserung der Nachweisgrenzen für ctDNA abzielen, sowohl das Fehlerprofil der Sequenzierung als auch die Rückgewinnung einer ausreichenden Anzahl auswertbarer Fragmente überwinden, um diese niedrigeren Fehlerprofile zu nutzen.
-
Um diesen offensichtlichen Mangel zu beheben, ist das Verfahren der PhasED-Seq., wie es in der vorliegenden Offenbarung beschrieben wird, auf lymphoide Malignitäten und auf andere Krebshistologien anwendbar (z. B. mit einem „personalisierten“ Ansatz). Für einen personalisierten Ansatz wurden personalisierte Hybrid-Capture-Oligonukleotide (oder Primer für PCR-Amplikons) verwendet, um personalisierte somatische Mutationen zu erfassen, die bei der Sequenzierung des gesamten Exoms oder Genoms identifiziert wurden. Der PCAWG-Datensatz, der auf SNV untersucht wurde, die in einem Abstand von weniger als 170bp im genomischen Raum auftreten, wurde erneut analysiert. Es wurde festgestellt, dass bei 14 von 24 berücksichtigten Krebshistologien der mediane Fall > 100 mögliche Phasenvarianten enthielt, was mehrere solide Tumore wie Melanome (Median 2072), Plattenepithelkarzinome der Lunge (1268), Adenokarzinome der Lunge (644,5) und kolorektale Adenokarzinome (216,5) beinhaltete.
-
Anschließend wurde die erwartete Nachweisgrenze in allen Fällen des PCAWG-Datensatzes entweder unter Verwendung von Duplex-Sequenzierung oder PhasED-Seq. bewertet. Auch hier wurde die Nachweisgrenze durch die erwartete Anzahl auswertbarer Fragmente definiert und hängt somit sowohl von der Anzahl der verfolgten Varianten als auch von der erwarteten Tiefe der Sequenzierung ab. Unter Verwendung der Daten aus optimierten Hybriderfassungsbedingungen wurde ein Modell zur Vorhersage der erwarteten deduplizierten (einzelsträngigen) und duplexen (doppelsträngigen) molekularen Tiefe bei einem gegebenen DNA-Eingang und einer gegebenen Anzahl von Sequenzierungslesungen erstellt. Daraus und aus der Anzahl der SNV oder möglichen PVs aus dem PCAWG-Datensatz wurde für jeden Fall beurteilt, welches Verfahren zu einer größeren Anzahl auswertbarer Fragmente und damit zu einer höheren Nachweisgrenze führen würde. Die Ergebnisse dieser Übung, die von 64 Nanogramm (ng) cfDNA-Input und insgesamt 20 Millionen Sequenzierungsauslesungen ausgeht, sind in 19 dargestellt. Bemerkenswert ist, dass PhasED-Seq. bei den meisten Krebsarten (18/24 Histologien) eine niedrigere Nachweisgrenze hatte als die Duplex-Sequenzierung. Dies beinhaltete nicht nur B-Zell-Lymphome, sondern auch häufige solide Tumore, darunter Plattenepithelkarzinome und Adenokarzinome der Lunge, kolorektale Adenokarzinome, Adenokarzinome der Speiseröhre und des Magens sowie Adenokarzinome der Brust, um nur einige zu nennen. Am Beispiel von Lungenkrebs wurde eine fast 10-fach niedrigere Nachweisgrenze für den Plattenepithel- und Adenokarzinom-Lungenkrebsfall mit PhasED-Seq. im Vergleich zur Duplex-Sequenzierung festgestellt (20). Sowohl die PhasED-Seq. als auch die Duplex-Sequenzierung mit einem personalisierten Ansatz wiesen eine niedrigere Nachweisgrenze auf als nicht-personalisierte Ansätze (z. B. iDES-angereicherte CAPP-Seq.).
-
Zur weiteren Bestätigung der Anwendbarkeit von Phasenvarianten und PhasED-Seq. bei verschiedenen soliden Tumoren wurde WGS (20-30x) an gepaarter Tumor- und normaler DNA durchgeführt, um PVs von fünf soliden Tumorpatienten zu identifizieren, bei denen vor der Behandlung eine geringe ctDNA-Belastung vorhergesagt wurde (Lungenkrebs (n=5)). Nach der Identifizierung putativer PVs in jedem Fall wurde anschließend ein Satz personalisierter Hybrid-Capture Oligonukleotide gestaltet, um eine gezielte Resequenzierung von Tumor- und normaler DNA zur Validierung der Kandidaten-PVs durchzuführen. Abschließend wurden die Plasmaproben aller 5 Patienten mit Hilfe der personalisierten PhasED-Seq. zum Nachweis von ctDNA mit hoher molekularer Tiefe sequenziert. Unter Berücksichtigung dieser fünf Lungenkrebsfälle erzielte der PhasED-Seq.-Ansatz eine ~10-fache Verbesserung der analytischen Sensitivität und erreichte einen medianen LOD von 0,00018 % im Vergleich zu 0,0019 % bei der Verwendung der personalisierten CAPP-Seq. ( 21).
-
Um die klinische Bedeutung dieser verbesserten Nachweisgrenze für ctDNA aus PhasED-Seq. bei soliden Tumoren zu demonstrieren, wurden serielle Plasmaproben eines Patienten mit Adenokarzinom der Lunge im Stadium 3, der mit Chemoradiotherapie mit kurativer Absicht behandelt wurde (LUP814), sowohl mit CAPP-Seq. als auch mit PhasED-Seq. analysiert. Wie oben beschrieben, quantifizierten sowohl CAPP-Seq. als auch PhasED-Seq. eine ähnliche Menge an ctDNA vor der Therapie (~1 % Tumorfraktion). Bei 3 weiteren Proben nach Beginn der Therapie war die ctDNA jedoch mit der Standard-CAPP-Seq. nicht nachweisbar, was Proben während und nach der Chemobestrahlung und während der adjuvanten Immuntherapie mit Durvalumab beinhaltete. Trotz des fehlenden Nachweises einer Krankheit durch CAPP-Seq. hatte der Patient nach einem anfänglichen radiologischen Ansprechen eine bioptisch bestätigte rezidivierende Krankheit. Bei der Analyse derselben Proben mit PhasED-Seq. wurde jedoch in 3/3 (100 %) der Proben eine molekulare Restkrankheit nachgewiesen, wobei die mittlere Tumorfraktion bei nur 0,00016 % (1,6 Teile pro Million) lag. Darüber hinaus spiegelte der Trend in der ctDNA-Quantifizierung den Krankheitsverlauf des Patienten wider, mit einem anfänglichen Ansprechen auf die Chemoradiotherapie, aber einer Progression der Krankheit während der Immuntherapie. Wichtig ist, dass die Krankheit dieses Patienten zu allen Zeitpunkten nachweisbar blieb, mit nachweisbarer Krankheit bei Abschluss der Chemoradiotherapie 8 Monate vor der durch Biopsie bestätigten Krankheitsprogression des Patienten (22).
-
Beispiel 10: Verfahren zur Phasenvariante-Anreicherung für einen verbesserten Nachweis von Krankheiten aus zellfreier DNA
-
10(a): Analyse der Gesamtgenomsequenzierung
-
10(a)(1): Gesamtgenom-Sequenzierungsdaten putativer Phasenvarianten-Identifikation
-
Die Gesamtgenom-Sequenzierungsdaten wurden aus zwei Quellen erlangt. Die Daten für lymphoide Malignitäten (diffuses großzelliges B-Zell-Lymphom, DLBCL; follikuläres Lymphom, FL; Burkitt-Lymphom, BL; chronische lymphatische Leukämie, CLL) wurden am 7. Mai 2018 vom Datenportal des International Cancer Genome Consortium (ICGC) heruntergeladen. Die Daten aller anderen Histologien waren Teil der Pan-Krebs-Analyse von ganzen Genomen (pan-Cancer analysis of whole genomes, PCAWG) und wurden am 11. November 2019 heruntergeladen. Es wurden nur Krebshistologien mit mindestens 35 verfügbaren Fällen berücksichtigt. Einzelheiten zu dem berücksichtigten Datensatz sind in Tabelle 1 aufgeführt. Alle Proben wiesen somatische Mutationen auf, die durch WGS unter Verwendung abgestimmter Tumor- und Normalgenotypisierungen ermittelt wurden. Die Abfragen beschränkten sich auf Basensubstitutionen, die aus WGS erlangt wurden (Einzel-, Doppel-, Dreifach- und Oligonukleotidvarianten; SNV, DNVs, TNVs und ONVs). Nachdem die Fälle und Varianten von Interesse identifiziert waren, wurde als nächstes die Anzahl der putativen Phasenvarianten (PVs) in jedem Tumor identifiziert. Um als PV auf einem einzelnen zellfreien DNA-Molekül (cfDNA) zu funktionieren, müssen zwei Varianten, wie etwa zwei Einzelnukleotidvarianten (SNV), im Allgemeinen innerhalb eines genomischen Abstands auftreten, der geringer ist als die Länge eines typischen cfDNA-Moleküls (~170bp). Daher wurden putative PVs als zwei Varianten definiert, die auf demselben Chromosom innerhalb eines genomischen Abstands von < 170bp auftreten. DNVs, TNVs und ONVs wurden als Satz ihrer jeweiligen Komponenten-SNV betrachtet. Die Anzahl der SNV sowie die Identität der putativen PVs für jeden Fall sind in Tabelle 1 aufgeführt. Die Rohanzahl der SNV und der putativen PVs sowie die Anzahl der putativen PVs unter Berücksichtigung der Anzahl der SNV ist dargestellt in 5A-C.
-
10(a)(2): Mutationssignaturen von Phasenvarianten aus WGS
-
Zur Beurteilung der Mutationsprozesse, die mit Phasen- und Nicht-Phasen-Mutationen in verschiedenen Krebsarten/Subtypen verbunden sind, wurden die Mutationssignaturen einzelner Basensubstitutionen (SBS) für jeden oben beschriebenen WGS-Fall mit dem R-Paket ,deconstructSigs' ausgezählt. Die Liste der SNV für jeden Patienten wurde zunächst in zwei Gruppen aufgeteilt: 1) SNV, die innerhalb einer möglichen PV enthalten sind, d. h. mit einer benachbarten oder „nächsten Nachbar“-SNV in einer Entfernung von < 170bp, und 2) isolierte SNV (d. h. ohne Phase), die als in einem Abstand von ≥ 170bp zur nächstgelegenen SNV auftretend definiert sind. Anschließend wurde ,DeconstructSigs' unter Verwendung der 49 in COSMIC beschriebenen SBS-Signaturen (mit Ausnahme von Signaturen, die mit möglichen Sequenzierungsartefakten verbunden sind) angewendet, um den Beitrag jeder SBS-Signatur sowohl zu den Kandidaten für phasierte SNV als auch für nicht-phasierte SNV für jeden Patienten zu beurteilen. Um den Beitrag jeder SBS-Signatur zu den phasierten und isolierten SNV zu vergleichen, wurde ein Wilcoxon-Vorzeichen Rang-Test durchgeführt, um den relativen Beitrag jeder SBS-Signatur zwischen diesen beiden Kategorien für jede Krebsart zu vergleichen (6A-6WW). Zur Berücksichtigung mehrerer Hypothesen wurde die Bonferroni-Korrektur angewandt, indem jede beliebige SBS-Signatur, die sich in ihrem Beitrag zu den phasierten gegenüber den nichtphasierten SNV unterschied, als signifikant angesehen wurde, wenn der Wilcoxon-Vorzeichen Rang-Test einen P-Wert von < 0,05 / 49 oder 0,001 ergab. Die Verteilungen dieser Vergleiche sowie die Signifikanzprüfung sind in den 6A-6WW dargestellt. Eine Zusammenfassung dieser Analyse ist auch in 1C anhand einer Wärmebild-Darstellung dargestellt, wobei die „Wärme“ die Differenz zwischen dem mittleren Beitrag der SBS-Signatur zu Phasenvarianten und dem mittleren Beitrag zu isolierten/nicht-phasierten Varianten darstellt.
-
10(a) (3): Genomische Verteilung von Phasenvarianten aus WGS
-
Die Rezidivhäufigkeit für PVs wurde bei jedem Krebstyp über das gesamte Genom innerhalb jedes Tumortyps untersucht. Insbesondere wurde das menschliche Genom (Build GRCh37/hg19) zunächst in 1-kb-Bins (insgesamt 3.095.689 Bins) unterteilt. Danach wurde für jede Probe die Anzahl der in jedem 1-kb-Bin enthaltenen PVs (wie oben definiert) gezählt. Für diese Analyse wurden beliebige PVs mit mindestens einem ihrer Bestandteil-SNV innerhalb des 1-kb-Bins von Interesse einbezogen. Anschließend wurde für jeden Krebstyp in jedem genomischen Bin der Anteil der Patienten berechnet, deren Tumor eine PV aufwies. Zur Identifizierung von 1-kb-Bins, die rezidiv PVs in Patienten enthalten, wurde die Anteil der Patienten, die PVs in jedem 1-kb-Bin enthalten, gegen die genomischen Koordinaten (1D und 7) aufgetragen. Für diese Analyse wurden nur Bins aufgezeichnet, in denen mindestens 2 % der Proben bei mindestens einem Krebssubtyp eine PV enthielten.
-
10(a)(4): Identifizierung rezidiver 1-kb-Bins mit Phasenvarianten
-
Zur Identifizierung von 1-kb-Bins die rezidivierende PVs in B-Lymphoid-Malignitäten enthalten, wurden WGS-Daten der folgenden Krankheiten verwendet: DLBCL, FL, BL und CLL. Jede beliebige 1-kb-Bin, in der > 1 Probe aus diesen Tumortypen enthalten war, wurde als rezidiv PVs aus B-Lymphoid-Malignitäten enthaltend betrachtet. Die genomischen Koordinaten von 1kb-Bins, die rezidivierende PVs in lymphoiden Malignitäten enthalten, sind in Tabelle 2 aufgezählt und in 8A aufgezeichnet.
-
10(b): Gestaltung eines PhasED-Seq.-Panels für B-Lymphoid-Malignitäten
-
10(b)(1): Identifikation von rezidivierenden PVs aus WGS-Daten mit höherer Auflösung.
-
Angesichts der Prävalenz rezidivierender putativer PVs aus WGS-Daten bei B-Zell-Malignitäten wurde ein gezielter Sequenzierungsansatz für deren hybridisierungsvermitteltes Capture gestaltet - die Phasenvarianten-Anreicherungssequenzierung (Phased Variant Enrichment Sequencing, PhasED-Seq) -, um diese spezifischen PV-Ereignisse aus Tumor- oder zellfreier DNA anzureichern. Zusätzlich zu den vorstehend beschriebenen ICGC-Daten wurden in dieser Gestaltung auch WGS-Daten aus anderen Quellen verwendet, einschließlich sowohl B-Zell-NHLs als auch CLL.
-
Untersucht wurden auch frühere Erfahrungen mit der gezielten Sequenzierung von cfDNA bei NHLs. Es wurden Paare von SNV identifiziert, die in jeder B-Zell-Tumorprobe in einem Abstand von < 170bp voneinander auftreten. Anschließend wurden die genomischen „Fenster“, die PVs enthielten, wie folgt identifiziert: Für jedes Chromosom wurden die PVs nach genomischen Koordinaten relativ zu dem Referenzgenom sortiert. Daraufhin wurde die niedrigste (d. h. die am weitesten links liegende) Position für jeden beliebigen PV bei einem beliebigen Patienten identifiziert. Dies definierte die linke (5') Koordinate, die ein gewünschtes Fenster von Interesse darstellt, das aus dem Genom zu erfassen ist. Dieses Fenster wurde dann durch Wachstum seines 3'-Endes erweitert, um sukzessive PVs zu erfassen, bis eine Lücke von ≥340bp erreicht war, wobei 340-bp als Erfassung von zwei sukzessiven Fragmenten in Chromatosomengröße von ~170-bp gewählt wurde. Wurde eine solche Lücke erreicht, wurde ein neues Fenster begonnen und dieser iterative Prozess des Hinzufügens benachbarter PVs wurde erneut wiederholt, bis die nächste Lücke von ≥340bp erreicht war. Das Ergebnis ist eine BED-Datei mit genomischen Fenstern, die alle möglichen PVs aus allen berücksichtigten Proben enthält. Abschließend wurde jedes Fenster zusätzlich um 50bp auf jeder Seite aufgefüllt, um eine effiziente Erfassung flankierender Sequenzen in seltenen Fällen zu ermöglichen, in denen repetitive oder schlecht abbildende dazwischenliegende Sequenzen ihre direkte Anzielung zur Anreicherung ausschließen könnten.
-
Nach der Identifizierung der Bereiche von Interesse, die putative PVs enthalten, wurde dann jedes Fenster in 170bp-Segmente unterteilt (z. B. die ungefähre Größe eines chromatosomalen cfDNA-Moleküls). Danach wurde die Anzahl der eine PV enthaltenden Fälle in jedem Fall ausgezählt. Für jeden 170bp-Bereich wurde der Bereich in die endgültige Gestaltung des Panels einbezogen, wenn eines oder mehrere der folgenden Kriterien erfüllt waren: 1) mindestens ein Patient enthielt eine PV in dem 170bp-Bereich in 3 von 5 unabhängigen Datensätzen, 2) mindestens ein Patient enthielt eine PV in dem Bereich in 2 von 5 unabhängigen Datensätzen, wenn ein Datensatz vorherige CAPP-Seq-Erfahrung war, oder 3) mindestens ein Patient enthielt eine PV in dem Bereich in 2 von 5 unabhängigen Datensätzen, wobei insgesamt mindestens 3 Patienten eine PV in dem Bereich enthielten. Daraus ergaben sich 691 ,Kacheln‘, wobei jede Kachel einen 170bp großen Genombereich repräsentiert. Diese Kacheln wurden zusammen mit einem zusätzlichen ~200kb genomischen Raum, der in B-NHL rezidivierend mutierte Treibergene anzielt, zu einem einheitlichen gezielten Sequenzierungspanel kombiniert, wie es zuvor sowohl für die Tumor- als auch für die cfDNA-Genotypisierung mit NimbleDesign (Roche NimbleGen) beschrieben wurde. Die endgültigen Koordinaten dieses Panels sind in Tabelle 3 angegeben.
-
10(b)(2): Vergleich der Leistung, von PhasED-Seq und CAPP-Seq bei PV-Ertrag
-
Zur Bewertung der Leistung von PhasED-Seq. bei der Erfassung von SNV und PVs im Vergleich zum zuvor berichteten CAPP-Seq.-Selektor für B-Zell-Lymphome wurde die vorhergesagte Anzahl von SNV und PVs, die mit jedem Panel durch Beschränkung von WGS in silico auf die Erfassungsziele jedes Ansatzes (9A-C) rückerlangt werden können, quantifiziert. Die vorhergesagte Anzahl der Varianten wurde dann unter Verwendung des Wilcoxon-Vorzeichen Rang-Tests verglichen. Sowohl CAPP-Seq. als auch PhasED-Seq. wurden auch an 16 Proben von Patienten mit DLBCL durchgeführt. In diesen Proben wurde die Tumor- oder Plasma-DNA zusammen mit der entsprechenden Keimbahn-DNA sequenziert. Die sich daraus ergebende Anzahl von Varianten wurde erneut mit dem Wilcoxon-Vorzeichen-Rang-Test verglichen (2B, und 9D-9E). Die Sequenzierungstiefe für die in dieser Analyse enthaltenen Proben ist in Tabelle 4 angegeben.
-
10(c): Identifikation von Phasenvarianten aus gezielten Sequenzierungsdaten 10(c)(1): Patientenaufnahme und Entnahme klinischer Proben
-
Patienten mit B-Zell-Lymphomen, die sich einer Erstlinientherapie unterziehen, wurden von sechs Zentren in Nordamerika und Europa in diese Studie aufgenommen, darunter die Stanford University, das MD Anderson Cancer Center, das National Cancer Institute, die Universität Ost-Piemont (Italien), das Universitätsklinikum Essen (Deutschland) und CHU Dijon (Frankreich). Insgesamt wurden 343 zellfreie DNA-, 73 Tumor- und 183 Keimbahnproben von 183 Patienten in diese Studie einbezogen. Alle Patientenproben wurden mit einer schriftlichen Einverständniserklärung für die Verwendung zu Forschungszwecken entnommen und von den entsprechenden Prüfungsausschüssen (Institutional Review Boards) in Übereinstimmung mit der Deklaration von Helsinki genehmigt. Zellfreie, Tumor- und Keimbahn-DNA wurden wie zuvor beschrieben isoliert. Alle Röntgenuntersuchungen wurden im Rahmen der klinischen Standardversorgung durchgeführt.
-
10(c)(2): Präparation der Bibliothek und Sequenzierung
-
Zur Erzeugung von Sequenzierungsbibliotheken und gezielten Sequenzierungsdaten wurde CAPP-Seq. wie zuvor beschrieben angewendet. Kurz gesagt wurden zellfreie, Tumor- und Keimbahn-DNA zum Aufbau von Sequenzierbibliotheken durch Endreparatur, A-Tailing und Adapterligierung gemäß den Anweisungen des Herstellers des KAPA Hyper Prep Kits verwendet, wobei die Ligation über Nacht bei 4 °C durchgeführt wurde. CAPP-Seq.-Adapter mit eindeutigen molekularen Identifikatoren (UMIDs) wurden für die Barcodierung eindeutiger DNA-Duplexe und die anschließende Deduplizierung von Sequenzierlesepaaren verwendet. Anschließend wurde unter Verwendung des vorstehend beschriebenen PhasED-Seq.-Panels eine Hybriderfassung durchgeführt (SeqCap EZ Choice; NimbleGen). Die Affinitätserfassung wurde gemäß des Herstellerprotokolls durchgeführt, wobei alle Hybridisierungen bei 47 °C auf einem Eppendorf-Thermocycler stattfanden. Nach der Anreicherung wurden die Bibliotheken unter Verwendung eines Illumina HiSeq4000 Instruments mit 2×150bp Paired-End-Lesungen sequenziert.
-
10(c)(3): Vorverarbeitung und Ausrichtung.
-
Die FASTQ-Dateien wurden demultiplexiert und die UMIDs wurden mithilfe einer benutzerdefinierten Pipeline extrahiert, wie zuvor beschrieben. Nach der Demultiplexierung wurden die Lesungen mit Hilfe von BWA ALN an das menschliche Genom (Build GRCh37/hgl9) ausgerichtet. Die molekulare Barcode-vermittelte Fehlerunterdrückung und das Hintergrundpolieren (d. h. die integrierte digitale Fehlerunterdrückung; iDES) wurden dann wie zuvor beschrieben durchgeführt.
-
10(c)(4): Identifikation von Phasenvarianten und allelische Quantifizierung
-
Nach der Erstellung von UMID-fehlerbereinigten Ausrichtungsdateien (z. B. BAM-Dateien) wurden die PVs aus jeder Probe wie folgt identifiziert. Zunächst wurde eine abgestimmte Keimbahnsequenzierung von unbeteiligten mononukleären Zellen des peripheren Blutes (Peripheral Blood Mononuclear Cells, PBMCs) durchgeführt, um patientenspezifische konstitutionelle Einzelnukleotid-Polymorphismen (Single Nucleotide Polymorphisms, SNPs) zu identifizieren. Diese wurden definiert als Nichtreferenzpositionen mit einer Varianten-Allel-Anteil (VAF) von über 40 % bei einer Tiefe von wenigstens 10 oder einem VAF von über 0,25 % bei einer Tiefe von wenigstens 100. Als Nächstes wurden PVs anhand von Leseebenedaten für eine Probe von Interesse identifiziert. Nach der UMID-vermittelten Fehlersuppression verwendeten jede einzelne Paired-End (PE)-Lesung und alle identifizierten Nichtreferenzpositionen ,samtools calmd‘. Zur Identifizierung von Varianten, die auf demselben Vorlagen-DNA-Molekül vorkommen, die dann entweder in Lesung 1 oder in Lesung 2 fallen können, wurden anstelle einzelner Lesungen PE-Daten verwendet. Jedes Lesepaar, das ≥2 Nichtreferenzpositionen enthielt, wurde als mögliche somatische PV betrachtet. Für Lesungen mit > 2 Nichtreferenzpositionen wurde jede Permutation der Größe ≥ 2 unabhängig berücksichtigt: d. h. wenn 4 Nichtreferenzpositionen in einem Lesepaar identifiziert wurden, wurden alle Kombinationen von 2 SNV (d. h. ,Doublett‘-Phasenvarianten) und alle Kombinationen von 3 SNV (d. h. ,Triplett`-Phasenvarianten) unabhängig berücksichtigt. PVs, die putative Keimbahn-SNPs enthalten, wurden ebenfalls wie folgt entfernt: Wenn in einem gegebenen n-Mer (d. h. n SNV in Phase auf einem gegebenen Molekül) ≥n-1 der Komponentenvarianten als Keimbahn-SNPs identifiziert wurden, wurde die PV redigiert. Diese Filterstrategie stellt sicher, dass für beliebige verbleibende PV mindestens 2 der Komponenten-SNV nicht in der Keimbahn zu finden sind, was sowohl für die Sensitivität als auch für die Spezifität von Bedeutung ist.
-
Putative somatische PVs wurden unter Verwendung eines heuristischen Sperrlisten-Ansatzes unter Berücksichtigung der Sequenzierungsdaten von 170 Keimbahn-DNA-Proben, die als Kontrollen dienten, herausgefiltert. In jeder dieser Proben wurden PVs auf Lesepaaren wie vorstehend beschrieben identifiziert, jedoch ohne Filterung nach übereinstimmenden Keimlinien. Jede beliebige PV, die in einer oder mehreren dieser Kontrollproben in einem oder mehreren Paired-End-Lesungen auftrat, wurde in die Sperrliste eingeschlossen und aus den patientenspezifischen somatischen PV-Listen entfernt.
-
Zur Berechnung des VAF jeder PV wurde ein Zähler, der die Anzahl der eine PV von Interesse enthaltenden DNA-Moleküle darstellt, über einen Nenner, der die Gesamtzahl der den Genombereich von Interesse abdeckenden DNA-Moleküle darstellt, berechnet. Das heißt, der Zähler ist einfach die Gesamtzahl der einen gegebenen PV enthaltenden deduplizierten Lesepaare, während der Nenner die Anzahl der den genomischen Locus eines gegebenen PV umfassenden Lesepaare ist.
-
10(c)(5): Genotypisierung von Phasenvarianten aus Vorbehandlungsvroben
-
Die obige Strategie führte zu einer Liste von PVs mit einer Lesetiefe von≥1 in jeder Probe. Zur Identifizierung von PVs, die als tumorspezifische somatische Reporter für die Überwachung der Krankheit dienen, wurde für jeden Fall eine beste Genotypisierungs'-Probe identifiziert - entweder DNA aus einer Tumorgewebebiopsie (bevorzugt) oder zellfreie DNA aus der Vorbehandlungsphase. Nach der Identifizierung aller möglichen PVs in der ,besten Genotypisierungsprobe‘ wurde die Liste für die Spezifität wie folgt weiter gefiltert. Wenn für einen beliebigen n-Mer-PV-Satz ≥n-1 der konstituierenden SNV als Keimbahn-SNPs in den zuvor beschriebenen 170 Kontrollproben vorhanden waren, wurde die PV entfernt. Zudem wurden nur PVs berücksichtigt, die die folgenden Kriterien erfüllen: 1) AF > 1%; 2) Tiefe des PV-Locus von ≥100 Lesepaaren, und 3) mindestens eine Komponenten-SNV muss im Zielraum liegen. Schließlich, 4) jede beliebige PV, die diese Kriterien erfüllte, wurde in einer Kohorte von 12 gesunden cfDNA-Kontrollproben auf Leseunterstützung untersucht. Wenn eine beliebige Leseunterstützung in > 1 dieser 12 Proben vorhanden war, wurde die PV entfernt. Für die Genotypisierung zellfreier DNA-Proben, die durch SNV als geringe Tumorfraktion identifiziert wurden (d. h. < 1 % mittlere AF über alle SNV), wurde der AF-Schwellenwert für die Bestimmung der PVs auf > 0,2 % gelockert. Diese Filterung führte zu den PV-Listen, die für die Überwachung der Krankheit und den Nachweis von MRD verwendet wurden.
-
10(c)(6): Bestimmung der Tumorfraktion in einer Probe aus Phasenvarianten
-
Bei der Bewertung einer Probe für den Nachweis einer minimalen Restkrankheit (MRD) mit vorheriger Kenntnis des Tumorgenotyps kann das Vorhandensein beliebiger PV, die in der besten Genotypisierungsprobe vor der Behandlung identifiziert wurden, in der MRD-Probe von Interesse bewertet werden. Anhand einer Liste von k möglichen tumorabgeleiteten PVs, die in der besten Genotypisierungsprobe beobachtet wurden, wurden alle Lesepaare ermittelt, die mindestens 1 der k möglichen PVs abdecken. Dieser Wert, d, kann als die aggregierte informative Tiefe‘ über alle von cfDNA-Molekülen überspannten PVs in einem PhasED-Seq-Versuch betrachtet werden. Anschließend wurde untersucht, wie viele dieser d Lesepaare tatsächlich 1 oder mehr der k möglichen PVs enthielten - dieser Wert, x, steht für die Anzahl der tumorabgeleiteten Moleküle, die somatische PVs in einer gegebenen Probe enthalten. Die Anzahl der tumorabgeleiteten Moleküle, die PVs enthalten, geteilt durch die informative Tiefe - x/d - ist daher die Phasenvarianten-Tumorfraktion (PVAF) in einer gegebenen Probe. Zum Nachweis von MRD in jeder Probe wurde die PVAF unabhängig für Dublett-, Triplett- und Quadruplett-PVs berechnet.
-
10(c)(7): Monte-Carlo-Simulation zur empirischen Signifikanz des PV-Nachweises innerhalb einer Probe
-
Zur Beurteilung der statistischen Signifikanz des Nachweises von tumorabgeleiteten PVs in einer beliebigen Probe wurde ein empirischer Signifikanztest durchgeführt. Eine Teststatistik ƒ wurde zunächst wie folgt definiert - aus einer gegebenen Liste von k möglichen tumorabgeleiteten PVs, die in der besten Genotypisierungsprobe beobachtet wurden, wurde das arithmetische Mittel der Allelfraktionen über alle k PVs berechnet (Allelfraktion definiert als die Anzahl der Lesepaare, die eine individuelle PV (x
i) enthalten, im Verhältnis zur Anzahl der Lesepaare, die die PV-Positionen (d
i) umfassen):
zur Bewertung der Hypothese, dass ƒ sich nicht signifikant von der Hintergrundfehlerrate ähnlicher PVs unterscheidet, die aus derselben Probe bewertet wurden. Zur Entwicklung einer Nullverteilung und Durchführung der statistischen Tests wurde ein Monte-Carlo-Ansatz verwendet:
- 1. Bei einer Gruppe von k PVs {pv1 ...pv1 ...pvk} wurde eine ,alternative‘ Liste von PVs {pv'1 ... pv'i ... pv' k} erstellt, sodass für jede alternative PV dieselbe Art von Basenänderung und derselbe Abstand zwischen SNV wie für die Test-PV vorlag. Wurde beispielsweise in der Genotypisierungsprobe eine Dublett-PV, chr14:106329929 C>T und chr14: 106329977 G>A, identifiziert und nach zwei alternativen Positionen im gleichen genomischen Abstand (hier 48bp) mit den Referenzbasen C und G gesucht und nach Lesepaaren mit den gleichen Arten von Basenveränderungen (d. h. C>T und G>A) bewertet, wird das unten stehende heuristische Suchschema verwendet.
- 2. Für jeden Tumor pvi in der Gruppe von k wurden 50 solcher Alternativen identifiziert. Dies wurde mit einem zufälligen Suchalgorithmus durchgeführt, um den genomischen Raum zu scannen und Alternativen zu identifizieren. Um diese 50 Alternativen zu finden, wurde eine zufällige Position auf demselben Chromosom wie der Test pvi identifiziert und dann nach denselben Arten von Referenzbasen im selben genomischen Abstand wie oben beschrieben gesucht. Die Syntenie der beobachteten/alternativen PVs wurde zur Kontrolle der Variation in den Bereichen in SHM/aSHM sowie der Kopienzahlvariation als potenzielle Störfaktoren der Nullverteilung verwendet. Alternative Positionen, die als Keimbahn-SNP identifiziert wurden, d. h. mit einer AF > 5 %, wurden ausgeschlossen.
- 3. Nach der Identifizierung von 50 solcher Alternativen für jede pvi wurden 10.000 zufällige Permutationen von 1 Alternative für jede der k Original-PVs erzeugt und die Phasenvariantenfraktion ƒ' für diese alternativen Listen in der Probe von Interesse, die auf das Vorhandensein von MRD ausgewertet wird, wie vorstehend beschrieben, berechnet.
- 4. Es wurde ein empirischer P-Wert berechnet, der definiert ist als die Anteil der Fälle, in denen die wahre Phasenvariante ƒ als kleiner oder gleich der alternativen ƒ' über die 10.000 zufälligen PV-Listen als empirisches Maß für die Signifikanz der MRD-Signifikanz in der Blutprobe von Interesse beobachtet wird.
-
Während dieser Vergleich ein Maß für die Signifikanz des PV-Nachweises der Tumor-Reporter-Liste im Vergleich zur empirisch definierten Hintergrund-PV-Fehlerrate innerhalb der Probe von Interesse ist, wurde seine Beziehung zur Spezifität des Nachweises über Fälle und Kontrollproben hinweg ebenfalls bewertet, wie nachstehend beschrieben.
-
10(c)(8): Bewertung, der Spezifität von PhasED-Seq.
-
Zur Bestimmung der Spezifität des Nachweises von Krankheiten und MRD während PhasED-Seq. wurden zunächst patientenspezifische PVs von 107 Patienten mit DLBCL anhand von Tumor- oder Plasma-DNA aus der Vorbehandlung zusammen mit gepaarten Keimbahnproben identifiziert. Anschließend wurden 40 unabhängige Plasma-DNA-Proben von gesunden Individuen auf das Vorhandensein dieser patientenspezifischen PVs untersucht, wobei der oben beschriebene Monte-Carlo-Ansatz verwendet wurde. Ein Schwellenwert für die P-Werte wurde empirisch mit Hilfe von Monte Carlo ermittelt, sodass eine 95%ige Spezifität für den Nachweis von Krankheiten aus Dublett-, Triplett- und Quadruplett-PVs erreicht wurde. Der Schwellenwert für den P-Wert, der eine ≥95%ige Spezifität für jede Größe der PV ergibt, war wie folgt: < 0,041 für Dubletten, < 1 für Tripletten und < 1 für Quadrupletten. Die Ergebnisse dieser Spezifität bei der cfDNA-Kontrollanalyse sind in 15 und 16 dargestellt.
-
10(c)(9): Berechnung der Fehlerraten
-
Zur Bewertung des Fehlerprofils sowohl von isolierten SNV als auch von PVs wurde die Nicht-Referenzbasis-Beobachtungsrate jeder Art von Variante über alle Lesungen hinweg untersucht. Für isolierte SNV wurde die Fehlerrate für jede mögliche Basenveränderung en1>n1' als der Anteil der Zielbasen mit dem Referenzallel n1 berechnet, die zum alternativen Allel n1' mutiert sind, wenn alle möglichen Basenveränderungen des Referenzallels berücksichtigt werden. Positionen mit einer Nicht-Referenz-Allel-Rate von mehr als 5 % wurden als wahrscheinliche Keimbahnereignisse eingestuft und aus der Fehlerratenanalyse ausgeschlossen. Eine globale Fehlerrate, definiert als die Mutationsrate vom hg 19-Referenzallel zu einem beliebigen alternativen Allel, wurde ebenfalls berechnet.
-
Für Phasenvarianten wurde eine ähnliche Berechnung durchgeführt. Für die Fehlerrate einer gegebenen Art von Phasenvariante, die sich aus k konstituierenden Basisänderungen {en1>n1' ... enk>nk'} zusammensetzt, wurde die Fehlerrate berechnet, indem sowohl die Anzahl der Instanzen der Art der Basisänderung (d. h. der Zähler) als auch die Anzahl der möglichen Instanzen für die Basisänderung (d. h. der Nenner) bestimmt wurde. Zur Berechnung des Zählers, N, wurde die Anzahl des Auftretens der PV von Interesse über alle Lesepaare in einer gegebenen Probe gezählt. Um beispielsweise die Fehlerrate von C>T- und G>A-Phasendubletts zu berechnen, wurde zunächst die Anzahl der Lesepaare gezählt, die sowohl ein zu einem T mutiertes Referenz-C als auch ein zu einem A mutiertes Referenz-G beinhalten.
-
Zur Berechnung des Nenners D wurde auch die Anzahl der möglichen Instanzen dieser Art von Phasenvariante berechnet; dies wurde zunächst für jedes Lesepaar i durchgeführt und dann über alle Lesepaare summiert. Eine PV mit k Komponenten kann als eine bestimmte Menge von Referenzbasen P
A, P
C, P
G, P
T aufweisend zusammengefasst werden, wobei p
N die Anzahl der einzelnen Referenzbasen in der PV ist. In ähnlicher Weise enthält ein gegebenes Lesepaar einen bestimmten Satz von Referenzbasen b
A, b
C, b
G, b
T, wobei b
N die Nummer jeder Referenzbase im Lesepaar ist. Daher kann für jedes Lesepaar in einer gegebenen Probe die Anzahl möglicher Vorkommnisse des PV-Typs von Interesse kombinatorisch wie folgt berechnet werden:
-
Betrachtet wird zum Beispiel ein Lesepaar mit 40 Referenz-As, 50 Referenz-Cs, 45 Referenz-Gs und 35 Referenz-Ts. Die Anzahl der Positionen für eine C>T- und G>A-PV ist:
-
Der aggregierte Nenner, D, für die Berechnung der Fehlerrate ist dann einfach die Summe dieses Wertes über alle Lesepaare. Die Fehlerrate für diese Art von PV ist dann einfach N/D.
-
10(d): Unterschiede bei Phasenvarianten zwischen Lymphom-Subtypen
-
Um die Verteilung der Phasenvarianten in verschiedenen Lymphomtypen zu vergleichen, wurden tumorspezifische PVs bei 101 DLBCL-, 16 PMBCL- und 23 cHL-Patienten durch Sequenzierung von Tumorbiopsieproben und/oder zellfreier DNA aus der Zeit vor der Behandlung sowie von gepaarten Keimbahnproben identifiziert. Nach der Identifizierung dieser tumorspezifischen PVs wurde ihre Verteilung im gesamten Panel für die gezielte Sequenzierung bewertet. Das Panel wurde zunächst in 50bp-Bins unterteilt. Anschließend wurde für jeden Patienten ermittelt, ob er Anzeichen einer PV innerhalb des 50bp-Bins aufwies, d. h. ob mindestens eine Komponente der PV innerhalb des Bins lag. Basierend auf der GENCODEv 19-Annotation des Referenzgenoms wurde das nächstgelegene Gen zu jedem 50bp-Bin bestimmt.
-
Um zu bewerten, wie die Verteilung der PVs zwischen den Subtypen von Lymphomen auf der Ebene spezifischer Gene variiert, wurde die Verteilung der PVs über die 50bp-Bins untersucht, die jedes Gen (oder das nächstgelegene Gen) umfassen. Betrachtet wird zum Beispiel ein gegebenes Gen mit n solcher 50bp-Bins, die im gezielten Sequenzierungspanel vertreten sind. Für jede Bin wurde zunächst die Anteil der Patienten, ƒ, in jedem Lymphomtyp mit einer innerhalb die 50bp-Bin fallenden PV bestimmt - d. h. Bestimmung von {ƒtype1,1, ... ƒtype1,n} und {ƒtype2,1' ... ƒtype2,n}. Anschließend wurden zwei beliebige Histologien hinsichtlich der Anteil der Fälle verglichen, die PVs in den jedem Gen zugewiesenen Satz von 50bp-Bins aufweisen. Diese Vergleiche sind für einzelne Gene in genspezifischen Diagrammen in 2D und 10-12 dargestellt.
-
Die Anreicherung von PVs wurde statistisch für einen bestimmten Lymphomtyp oder - subtyp im Vergleich zu einem anderen verglichen, indem die Differenz in der Anteil der Patienten berechnet wurde, die eine PV in jedem 50bp-Bin über alle Bins enthalten, die einem Gen zugeordnet sind (d.h. ein gegebenes Gen überlappen oder mit einem gegebenen nächstgelegenen Gen). Insbesondere wurde für jeden beliebigen Vergleich zwischen zwei Lymphomtypen (type1 und type2) dieser Satz von Unterschieden in der PV-Rate zunächst zwischen Histologien {ƒtype1,1 - ftype2,1, ... ƒtype1,n - ƒtype2,n} identifiziert. Dieser Satz gen-spezifischer Unterschiede in der Häufigkeit von PVs wurden dann zwischen den Lymphomtypen mit der Verteilung aller anderen 50bp-Bins im SequenzierungsPanel durch den Wilcoxon-Rangsummentest verglichen. Für diesen Test wurde der Satz von n 50bp-Bins, die einem gegebenen Gen zugeordnet sind, mit allen anderen 50bp-Bins verglichen (d. h. 6755 - n, da es 6755 50bp-Bins im Sequenzierpanel gibt). Dieser P-Wert ist zusammen mit dem mittleren Unterschied in der Anteil der Patienten mit einer PV in jedem Bin für jedes Gen zwischen den Histologien als Vulkan-Diagramm in 2E dargestellt. Zur Berücksichtigung der globalen Differenz in der Rate der PVs zwischen verschiedenen Histologien wurde die mittlere Differenz in der Anteil der Patienten mit einer PV zwischen den Histologien auf 0 zentriert, indem die mittlere Differenz zwischen allen Genen abgezogen wurde.
-
10(e): Hybridisierungsbias
-
Zur Beurteilung der Auswirkungen von Mutationen auf die Hybridisierungseffizienz wurde zunächst die Affinität mutierter Moleküle zu Erfassungsködern des Wildtyps in silico geschätzt, indem DNA-Fragmente berücksichtigt wurden, die 0-30 % Mutationen im gesamten Fragment aufweisen. Für jeden Mutationszustand in diesem Bereich wurden zunächst 10.000 Bereiche mit einer Länge von jeweils 150 bp aus dem gesamten Genom zufällig ausgewählt. Diese 150-Mere wurden dann in silico zur Simulierung der gewünschten Mutationsrate auf 3 verschiedene Arten mutiert: 1) Mutation von ,gruppierten‘ oder zusammenhängenden Basen, ausgehend von den Enden einer Sequenz, 2) Mutation von gruppierten Basen, ausgehend von der Mitte der Sequenz, oder 3) Mutation von Basen, die an zufälligen Positionen in der Sequenz ausgewählt wurden. Danach wurde das Paket energy.c zur Berechnung der theoretischen Bindungsenergie (kcal/mol) zwischen den mutierten und den Wildtyp-Sequenzen verwendet, wobei auf ein Nearest-Neighbor-Modell zurückgegriffen wurde, das etablierte thermodynamische Parameter verwendet (14A).
-
Dieser In silico-Versuch wurde dann durch Testen der Auswirkungen der gleichen Mutationsraten in vitro repliziert. Insbesondere wurden Oligonukleotide (IDT) synthetisiert und zur Bildung von DNA-Duplexen, die 0-10 % Mutationen an definierten Positionen im Vergleich zur menschlichen Referenzgenomsequenz aufweisen, angelagert. Diese synthetischen DNA-Moleküle wurden daraufhin zusammen in äquimolaren Konzentrationen erfasst und die relative Erfassungseffizienz der mutierten Duplexe im Vergleich zu den nicht mutierten Wildtyp-Spezies quantifiziert (3A). Zwei Sätze von Oligonukleotidsequenzen wurden zur Erfassung von AIDvermittelten aberranten somatischen Hypermutationen, die mit jedem Gen verbunden sind, aus den kodierenden Bereichen von BCL6 und MYC ausgewählt (Tabelle 5). Die erhaltene Zuordnungsfähigkeit der mutierten Spezies wurde durch BWA ALN sichergestellt. Diese synthetischen Oligonukleotid-Duplexe wurden anschließend einer Bibliothekspräparation unterzogen und mit Hilfe von PhasED-Seq. erfasst und sequenziert, durchgeführt in Triplikaten unter Verwendung verschiedener Proben. Dies ermöglichte die Bewertung der relativen Effizienz der Hybriderfassung und der molekularen Rückgewinnung im direkten Vergleich zu Wildtyp-Molekülen, die mit dem Referenzgenom identisch sind.
-
10(f): Beurteilung der Nachweisgrenze mit limitierenden Verdünnungsreihen
-
Zur empirischen Bestimmung der analytischen Sensitivität der PhasED-Seq. wurde eine limitierte Verdünnungsreihe zellfreier DNA von 3 Patienten verwendet, die mit gesunder zellfreier Kontroll-DNA in definierten Konzentrationen versetzt wurde. Die Verdünnungsreihe enthielt Proben mit einer erwarteten mittleren Tumorfraktion von 0,1 %, 0,01 %, 0,001 %, 0,0002 %, 0,0001 % und 0,00005 % oder im Bereich von 1 Teil in 1.000 bis 1 Teil in 2.000.000. Die Sequenzierungscharakteristika und die Quantifizierung der ctDNA mittels CAPP-Seq., Duplex-Sequenzierung und PhasED-Seq. sind bereitgestellt. Zum Vergleich der Leistung der einzelnen Verfahren wurde die Differenz, δ, zwischen der beobachteten und der erwarteten Tumorfraktion für jeden Patienten i bei jeder Verdünnungskonzentration j berechnet:
-
Dieser Wert wurde für Patienten i = {1,2,3} und Konzentrationen j = {0.001%, 0.0002%, 0.0001%, 0.00005% } für jedes ctDNA-Nachweisverfahren (CAPP-Seq., Duplex, Dublett-PhasED-Seq. und Triplett-PhasED-Seq.) berechnet. Die Leistung der einzelnen Verfahren wurde dann mittels eines gepaarten t-Tests für diesen Satz von Patienten und Konzentrationen miteinander verglichen.
-
10(g): Modell zur Vorhersage der Wahrscheinlichkeit des Nachweises für einen gegebenen Satz von Phasenvarianten
-
Um ein mathematisches Modell zur Vorhersage der Nachweiswahrscheinlichkeit für eine gegebene Probe von Interesse zu erstellen, wurde zunächst von der allgemeinen Annahme ausgegangen, dass der cfDNA-Nachweis als ein Zufallsprozess betrachtet werden kann, der auf einer binomialen Probenahme basiert. Im Gegensatz zu SNV, die in großen genomischen Abständen voneinander auftreten, kann der Nachweis von PVs jedoch stark voneinander abhängig sein, insbesondere wenn PVs degeneriert sind (d. h. wenn zwei PVs gemeinsame Komponenten-SNV haben) oder in unmittelbarer Nähe auftreten. Um dies zu berücksichtigen, wurden nur PVs, die > 150bp voneinander entfernt auftreten, als unabhängige ,Tumor-Reporter‘ betrachtet. Die Anzahl der ,Tumor-Reporter‘, die einen Nachweis der Krankheit in einer gegebenen Probe ermöglichen, kann somit wie folgt bestimmt werden. Das PhasED-Seq.-Panel wurde in 150bp-Bins aufgeteilt. Jede PV in einer Reporterliste eines gegebenen Patienten wurde dann in eine BED-Koordinate umgewandelt, die aus der Startposition (definiert als die am weitesten links stehende Komponente SNV) und der Endposition (definiert als die am weitesten rechts stehende Komponente SNV) besteht. Für jede PV wurde die 150bp-Bin aus dem die PV enthaltenden PhasED-Seq-Selektor-Panel bestimmt. Wenn eine PV zwei oder mehr 150bp-Bins umfasste, wurde sie beiden Bins zugewiesen. Die Anzahl der unabhängigen Tumor-Reporter wurde dann als die Anzahl der separaten 150bp-Bins definiert, die eine tumorspezifische PV enthalten.
-
Anschließend wurde ein mathematisches Modell entwickelt, das die erwartete Wahrscheinlichkeit des Nachweises für eine gegebene Probe mit einem gegebenen Tumoranteil mit einer gegebenen Anzahl unabhängiger Tumor-Reporter (z. B. 150 bp Bins) vergleicht. Bei einer gegebenen Anzahl von Tumor-Reportern r, bei einer gegebenen Tumorfraktion ƒ, mit einer gegebenen Sequenzierungstiefe d, kann die Wahrscheinlichkeit des Nachweises von 1 oder mehreren zellfreien DNA-Molekülen, die eine tumorspezifische PV enthalten, definiert werden als:
basierend auf einer einfachen binomialen Probenahme. Da das Verfahren zum Nachweis von ctDNA jedoch auf eine Falsch-Positiv-Rate von 5 % trainiert wurde, wurde dieser Term für die Falsch Positiv-Rate ebenfalls in das Modell aufgenommen:
3G zeigt die Ergebnisse dieses Modells für eine Auswahl von Tumor-Reportern r von 3 bis 67 in einer Tiefe d von 5000. Die Konfidenzhüllkurve in diesem Diagramm zeigt Lösungen für einen Tiefenbereich d von 4000 bis 6000.
-
Zur empirischen Validierung dieses Modells zur Bewertung der Wahrscheinlichkeit des Krankheitsnachweises wurden Proben aus limitierenden Verdünnungsreihen verwendet. In dieser Verdünnungsreihe wurden 3 Patienten-cfDNA-Proben, die jeweils patientenspezifische PVs enthielten, mit gesunder Kontroll-cfDNA verschnitten. Für jede Liste patientenspezifischer PVs wurden 25 zufällige Teilproben der 150bp-Bins mit patientenspezifischen PVs durchgeführt, um Reporterlisten mit einer variablen Anzahl tumorspezifischer Reporter zu erstellen. Es wurde eine maximale Bin-Anzahl von 67 gewählt, um eine Probenahme aus allen 3 patientenspezifischen PV-Listen zu ermöglichen, gefolgt von einer Reduzierung der Anzahl der Bins um 2x oder 3x je Vorgang. Dies führte zu Reporterlisten, die patientenspezifische PVs aus 3, 6, 17, 34 oder 67 unabhängigen 150bp-Bins enthielten. Der Krankheitsnachweis wurde dann anhand jeder dieser patientenspezifischen PV-Listen mit zunehmender Größe in jeder der „nassen“ limitierenden Verdünnungsproben von 1: 1.000 bis 1: 1.000.000 bewertet (
3H, geschlossene Kreise). In silico-Mischungen wurden ferner unter Verwendung von Sequenzierungs-Lesungen aus limitierten Verdünnungsproben mit unterschiedlichem erwarteten Tumorgehalt erstellt und erneut auf die Wahrscheinlichkeit des Nachweises von Krankheiten unter Verwendung von patientenspezifischen Teilproben von PV-Reporterlisten unterschiedlicher Länge (offene Kreise) geprüft. Für diesen Versuch wurden sowohl die ,Nass`- als auch die ,In silico‘-Verdünnungs-Bam-Dateien abwärtskonvertiert, um eine Tiefe von ~4000-6000x zu erreichen, die der modellierten Tiefe entspricht. Der endgültige Mittelwert und die Standardabweichung der Tiefe über alle abwärts konvertierten Bam-Dateien betrug 4214x± 789. Die Wahrscheinlichkeit des Nachweises wurde über alle Tests bei einer gegebenen erwarteten Tumorfraktion für eine gegebene patientenspezifische PV-Liste zusammengefasst. Für jede gegebene Verdünnung wurden mehrere unabhängig voneinander abgetastete Sätze von Lesungen betrachtet, um eine bessere Schätzung der tatsächlichen Wahrscheinlichkeit des Nachweises zu ermöglichen. Im Einzelnen wurde die folgende Anzahl von Replikaten bei jeder angegebenen Verdünnung in Tabelle 7. betrachtet. Tabelle 7. Replikate bei jeder Verdünnung zur Vorhersage der Wahrscheinlichkeit des Nachweises für einen gegebenen Satz von Phasenvarianten.
Verdünnung | Replikate | Anzahl der Tests (Replikate * 25) | Nass oder in silico |
1 : 1.000 | 1 | 25 | Nass |
5 : 10.000 | 3 | 75 | In silico |
3,5 : 10.000 | 3 | 75 | In silico |
2 : 10.000 | 3 | 75 | In silico |
1 : 10.000 | 3 | 75 | Nass |
5 : 100.000 | 3 | 75 | In silico |
3,5 : 100.000 | 3 | 75 | In silico |
2 : 100.000 | 3 | 75 | In silico |
1 : 100.000 | 3 | 75 | Nass |
5 : 1.000.000 | 8 | 200 | In silico |
3,5 : 1.000.000 | 8 | 200 | In silico |
2 : 1.000.000 | 8 | 200 | Nass |
1 : 1.000.000 | 8 | 200 | Nass |
-
Die Gesamtzahl der Tests für jede patientenspezifische PV-Liste ist daher die Anzahl der zufällig unterabgetasteten PV-Listen (z. B. 25) multipliziert mit der Anzahl der unabhängig herunterabgetasteten Bam-Dateien; diese Zahl ist in der vorstehenden Tabelle angegeben. In 3H stellen die Punkte und Fehlerbalken den Mittelwert, das Minimum und das Maximum über alle drei Patienten dar. Die Übereinstimmung zwischen der vorhergesagten Wahrscheinlichkeit des Krankheitsnachweises aus dem theoretischen mathematischen Modell und den Nass- und In silico-Proben, die dieses Modell validieren, ist in 3I dargestellt.
-
10(h): Statistische Analysen und Software-Verfügbarkeit
-
Alle in diesem Schriftstück angegebenen P-Werte sind, sofern nicht anders angegeben, 2-seitig. Vergleiche von übereinstimmenden Proben und Populationen wurden mit dem Wilcoxon-Vorzeichen Rang-Test durchgeführt; Vergleiche von Proben, die aus nicht verwandten Populationen stammen, wurden mit dem Wilcoxon-Rangsummentest durchgeführt. Vergleiche von gepaarten Proben wurden mittels eines gepaarten t-Tests durchgeführt. Die Überlebenswahrscheinlichkeiten wurden mit dem Kaplan-Meier-Verfahren geschätzt; das Überleben von Patientengruppen basierend auf den ctDNA-Werten wurde mit dem Log-Rang-Test verglichen. Andere statistische Tests sind bei Verwendung im Schiftstücktext vermerkt. Alle Analysen wurden unter Verwendung von MATLAB, Version 2018b, R Statistical Software, Version 3.4.1, und GraphPad Prism, Version 8.0.2, durchgeführt. Der Beitrag bekannter Mutationsprozesse zu phasierten und isolierten SNV aus WGS wurde mit dem Paket ,deconstruct Sigs R' unter Verwendung des COSMIC-Signaturensets (v2) wie beschrieben bewertet. Die Berechnung der AUC unter Berücksichtigung von Überleben und Zensur wurde mit dem Paket ,RsurvivalROC‘ Version 1.0.3 mit Standardeinstellungen durchgeführt. Eine ausführbare Version der PhasED-Seq.-Software, die in C++17 entwickelt wurde, ist unter phasedseq(dot)stanford(dot)edu verfügbar.
-
Beispiel 11
-
Weitere Einzelheiten zu den in der vorliegenden Offenbarung beschriebenen Tabellen sind hierin bereitgestellt:
-
TABELLE 1: 1000bp-Bereiche von Interesse im gesamten Genom, die putative Phasenvarianten (PV) in verschiedenen lymphoiden Neoplasmen enthalten. Es sind nur Bereiche dargestellt, die > 1 Proband mit einer PV enthalten. Koordinaten sind in hg 19. Bereiche von Genen, die zuvor als Ziele der aktivierungsinduzierten Deaminase (AID) identifiziert wurden, sind markiert. Bereiche, die in > 5 % das Subjekt beliebiger Histologie (BL, CLL, DLBCL, FL) PVs enthalten, sind ebenfalls markiert. BL, Burkitt-Lymphom, CLL, chronische lymphatische Leukämie, DLBCL, diffuses großzelliges B-Zell-Lymphom, FL, follikuläres Lymphom.
-
TABELLE 2: 1000bp-Bereiche von Interesse im gesamten Genom, die putative Phasenvarianten (PV) in den ABC- und GCB-Subtypen des DLBCL enthalten. Es sind nur Bereiche dargestellt, die > 1 Proband mit einer PV enthalten. Koordinaten sind in hg 19. Bereiche von Genen, die zuvor als Ziele von AID identifiziert wurden, sind markiert. ABC, aktivierter B-Zell-Subtyp; GCB, Keimzentrum-B-Zell-Subtyp.
-
TABELLE 3: Die Bereiche, die für das in dieser Veröffentlichung beschriebene PhasED-Seq.-Fängerreagenz verwendet wurden, konzentrierten sich auf lymphoide Malignitäten. Koordinaten sind in hg 19. Das nächstgelegene Gen und der Grund für die Aufnahme (Phasenvariante vs. allgemeine DLBCL-Genotypisierung) ist ebenfalls angegeben.
-
TABELLE 4: Anreicherung von PVs an genetischen Loci über das gesamte PhasED-Seq.gezielte Sequenzierungspanel für verschiedene Arten von B-Zell-Lymphomen (DLBCL einschließlich ABC- und GCB-Subtypen, PMBCL und cHL). Der PhasED-Seq.-Selektor wurde in 50bp-Bins in hgl9-Koordinaten gegliedert und jede Bin wurde nach Gen oder nächstgelegenem Gen beschriftet. Der Mittelwert der Anteil der Fälle einer gegebenen Histologie mit einer PV über alle 50bp-Bins ist dargestellt. Die Signifikanz wurde durch einen Rangsummentest (Mann-Whitney U-Test) von 50bp-Bins für ein gegebenes Gen im Vergleich zum Rest des Sequenzierpanels bestimmt. Unkorrigierte P-Werte sind angegeben, die Korrektur der multiplen Hypothesentests wurde mit dem Bonferroni-Verfahren durchgeführt. DLBCL, diffuses großzelliges B-Zell-Lymphom, PMBCL, primäres mediastinales B-Zell-Lymphom, cHL, klassisches Hodgkin-Lymphom, ABC, aktiviertes B-Zell-DLBCL, GCB, Keimzentrum-B-Zell-DLBCL.
-
TABELLE 5: Sequenzen von Oligonukleotiden, die zur Beurteilung der Hybridisierung und der molekularen Rückgewinnung mit zunehmender Mutationslast synthetisiert wurden (SEQ-ID NR. 1331-1358).
-
TABELLE 6: Nukleinsäuresonden für die Erfassungssequenzierung von B-Zell-Krebsen (SEQ-ID NRn. 0001-1330).
-
Obwohl hierin bevorzugte Ausführungsformen der vorliegenden Erfindung gezeigt und beschrieben wurden, wird es für den Fachmann offensichtlich sein, dass diese Ausführungsformen nur als Beispiel dienen. Eine Einschränkung der Erfindung durch die in der Patentschrift aufgeführten Beispiele ist nicht beabsichtigt. Während die Erfindung unter Bezugnahme auf die vorgenannte Patentschrift beschrieben wurde, sind die Beschreibungen und Abbildungen der Ausführungsformen hierin nicht in einem einschränkenden Sinne zu verstehen. Dem Fachmann werden zahlreiche Variationen, Änderungen und Substitutionen einfallen, ohne von der Erfindung abzuweichen. Darüber hinaus versteht sich, dass alle Aspekte der Erfindung nicht auf die hierin dargelegten spezifischen Darstellungen, Konfigurationen oder relativen Verhältnisse beschränkt sind, die von einer Vielzahl von Bedingungen und Variablen abhängen. Es versteht sich, dass verschiedene Alternativen zu den hierin beschriebenen Ausführungsformen der Erfindung bei der Durchführung der Erfindung verwendet werden können. Es ist daher vorgesehen, dass die Erfindung auch beliebige derartige Alternativen, Modifikationen, Variationen oder Äquivalente umfasst. Es ist beabsichtigt, dass die folgenden Ansprüche den Umfang der Erfindung definieren und dass Verfahren und Strukturen innerhalb des Umfangs dieser Ansprüche und ihrer Äquivalente dadurch umfasst werden.
-
-
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- US 62/931688 [0001]
- CA 233975 [0003]
- CA 241076 [0003]
- CA 188298 [0003]
- US 5804396 [0240]