DE112020005433T5 - Verfahren und Systeme zur Analyse von Nukleinsäuremolekülen - Google Patents

Verfahren und Systeme zur Analyse von Nukleinsäuremolekülen Download PDF

Info

Publication number
DE112020005433T5
DE112020005433T5 DE112020005433.0T DE112020005433T DE112020005433T5 DE 112020005433 T5 DE112020005433 T5 DE 112020005433T5 DE 112020005433 T DE112020005433 T DE 112020005433T DE 112020005433 T5 DE112020005433 T5 DE 112020005433T5
Authority
DE
Germany
Prior art keywords
cell
nucleic acid
acid molecules
free nucleic
subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE112020005433.0T
Other languages
English (en)
Inventor
David M. Kurtz
Maximilian Diehn
Arash Ash Alizadeh
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leland Stanford Junior University
Original Assignee
Leland Stanford Junior University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Leland Stanford Junior University filed Critical Leland Stanford Junior University
Publication of DE112020005433T5 publication Critical patent/DE112020005433T5/de
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1089Design, preparation, screening or analysis of libraries using computer algorithms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/70Mechanisms involved in disease identification
    • G01N2800/7023(Hyper)proliferation
    • G01N2800/7028Cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Epidemiology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Plant Pathology (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)

Abstract

Es werden Verfahren und Materialien zum Nachweis von Krebs aus einer Biopsie beschrieben. In einigen Fällen können zellfreie Nukleinsäuren sequenziert werden, und das Sequenzierungsergebnis kann zum Nachweis von Sequenzen verwendet werden, die von einem Neoplasma abgeleitet sind. Der Nachweis somatischer, in Phase auftretender Varianten kann in einem diagnostischen Scan auf das Vorhandensein von Krebs hinweisen und eine klinische Intervention kann durchgeführt werden.

Description

  • QUERVERWEIS
  • Diese Anmeldung beansprucht die Vorteile der vorläufigen US-Patentanmeldung Nr. 62/931,688 , eingereicht am 6. November 2019, die hierin durch Bezugnahme vollständig einbezogen ist.
  • SEQUENZPROTOKOLL
  • Die vorliegende Anmeldung enthält ein Sequenzprotokoll, das elektronisch im ASCII-Format eingereicht wurde und hiermit in vollem Umfang in die Anmeldung einbezogen wird. Die ASCII-Kopie, erstellt am 3. November 2020, heißt 58626-702_601_SL.txt und ist 307.199 Bytes groß.
  • STAATLICHE RECHTE
  • Diese Erfindung wurde mit staatlicher Unterstützung gemäß CA233975 , CA241076 und CA188298 von den US-Amerikanischen National Institutes of Health entwickelt. Der USamerikanische Staat bzw. dessen Regierung hat gewisse Rechte an der Erfindung.
  • HINTERGRUND
  • Nichtinvasive Bluttests, die somatische Veränderungen (z. B. mutierte Nukleinsäuren) auf der Grundlage der Analyse zellfreier Nukleinsäuren (z. B. zellfreier Desoxyribonukleinsäure (cfDNA) und zellfreier Ribonukleinsäure (cfRNA)) nachweisen können, sind aufgrund der relativ einfachen Gewinnung biologischer Spezimen (z. B. biologischer Flüssigkeiten) attraktive Kandidaten für Krebs-Screening-Anwendungen. Zirkulierende Tumor-Nukleinsäuren (z. B. ctDNA oder ctRNA, d. h. von Krebszellen erlangte Nukleinsäuren) können empfindliche und spezifische Biomarker für zahlreiche Krebs-Subtypen sein. Die derzeitigen Verfahren zum Nachweis der minimalen Restkrankheit (MRD) anhand von ctDNA können jedoch durch einen oder mehrere Faktoren, wie beispielsweise geringe Ausgangs-DNA-Mengen und hohe Hintergrundfehlerraten, eingeschränkt sein.
  • Jüngste Ansätze haben durch die Verfolgung multipler somatischer Mutationen mit fehlerunterdrückter Sequenzierung die ctDNA-MRD-Leistung verbessert, was zu Nachweisgrenzen von nur 4 Teilen in 100.000 aus limitierter cfDNA-Eingabe führt. Der Nachweis einer Restkrankheit während oder nach der Behandlung ist ein wirksames Instrument, wobei eine nachweisbare MRD selbst bei einer radiologischen Remission ein negatives prognostisches Zeichen darstellt. Die derzeitigen Nachweisgrenzen könnten jedoch unzureichend sein, um bei Patienten, bei denen ein Rückfall oder eine Progression der Krankheit zu erwarten ist, generell eine Restkrankheit nachzuweisen. Dieser „Nachweisverlust“ ist beispielhaft beim diffusen großzelligen B-Zell-Lymphom (DLBCL), bei dem der Nachweis von ctDNA nach zwei Zyklen einer Therapie mit kurativer Absicht ein starker prognostischer Marker ist. Trotzdem hat fast ein Drittel der Patienten, bei denen die Krankheit fortschreitet, an diesem Meilenstein keine nachweisbare ctDNA, was „falsch negative“ Tests bedeutet. Es wurden ähnliche falsch negative Ergebnisse bei Dickdarmkrebs und Brustkrebs beobachtet.
  • ZUSAMMENFASSUNG
  • Die vorliegende Offenbarung sieht Verfahren und Systeme zur Analyse zellfreier Nukleinsäuren (z. B. cfDNA, cfRNA) eines Subjekts vor. Verfahren und Systeme der vorliegenden Offenbarung können die von einem Subjekt abgeleiteten Sequenzierungsergebnisse nutzen, um krebserlangte Nukleinsäuren (z. B. ctDNA, ctRNA) nachzuweisen, z. B. zur Krankheitsdiagnose, zur Krankheitsbeobachtung oder zur Bestimmung von Behandlungen des Subjekts. Verfahren und Systeme der vorliegenden Offenbarung können eine erhöhte Empfindlichkeit, Spezifität und/oder Zuverlässigkeit des Nachweises von krebserlangten Nukleinsäuren aufweisen.
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren vor, umfassend: (a) Erlangen, durch ein Computersystem, von Sequenzierungsdaten, die aus einer Vielzahl zellfreier Nukleinsäuremolekülen erlangt sind, die von einem Subjekt erlangt oder abgeleitet werden; (b) Verarbeiten der Sequenzierungsdaten durch das Computersystem, um ein oder mehrere zellfreie Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle zu identifizieren, wobei jedes des einen oder mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, wobei wenigstens etwa 10 % des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten umfasst, die durch wenigstens ein Nukleotid getrennt sind; und (c) Analysieren des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle durch das Computersystem, um einen Zustand der Erkrankung zu ermitteln.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfassen die wenigstens etwa 10 % der zellfreien Nukleinsäuremoleküle wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % oder etwa 100 % des einen oder der mehreren zellfreien Nukleinsäuremoleküle.
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren vor, umfassend: (a) Erlangen, durch ein Computersystem, von Sequenzierungsdaten, die aus einer Vielzahl zellfreier Nukleinsäuremolekülen abgeleitet sind, die von einem Subjekt erlangt oder abgeleitet sind; (b) Verarbeiten der Sequenzierungsdaten durch das Computersystem, um ein oder mehrere zellfreie Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle zu identifizieren, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind; und (c) Analysieren des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle durch das Computersystem, um eine Erkrankung des Subjekts zu bestimmen.
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren vor, umfassend: (a) Erlangen von Sequenzierungsdaten, die von einer Vielzahl zellfreier Nukleinsäuremolekülen abgeleitet sind, die von einem Subjekt erlangt oder abgeleitet sind; (b) Verarbeiten der Sequenzierungsdaten, um ein oder mehrere zellfreie Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle mit einer Nachweisgrenze von weniger als etwa 1 von 50.000 Beobachtungen aus den Sequenzierungsdaten zu identifizieren, und (c) Analysieren des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle, um eine Erkrankung des Subjekts zu bestimmen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren liegt die Nachweisgrenze des Identifizierungsschritts bei weniger als etwa 1 von 100.000, weniger als etwa 1 von 500.000, weniger als etwa 1 von 1.000.000, weniger als etwa 1 von 1.500.000 oder weniger als etwa 1 von 2.000.000 Beobachtungen aus den Sequenzierungsdaten.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Prozesse (a) bis (c) von einem Computersystem durchgeführt.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten basierend auf einer Nukleinsäure-Amplifikation erzeugt. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten basierend auf der Polymerase-Kettenreaktion erzeugt. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten basierend auf der Amplikon-Sequenzierung erzeugt.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten basierend auf der Next-Generation-Sequenzierung (NGS) erzeugt. Alternativ werden in einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren die Sequenzierungsdaten basierend auf nicht-hybridisierungsbasierter NGS erzeugt.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten ohne Verwendung einer molekularen Barcodierung von wenigstens einem Teil der Vielzahl zellfreier Nukleinsäuremolekülen erzeugt. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden die Sequenzierungsdaten ohne Verwendung einer Probenbarcodierung von wenigstens einem Teil der Vielzahl zellfreier Nukleinsäuremolekülen erlangt.
  • In einigen Ausführungsformen eines der hierin offenbarten Verfahren werden die Sequenzierungsdaten ohne In silico-Entfernung oder Unterdrückung von (i) Hintergrundfehlern oder (ii) Sequenzierungsfehlern erhalten.
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Behandlung einer Erkrankung eines Subjekts vor, das Verfahren umfassend: (a) Identifizieren des Subjekts zur Behandlung der Erkrankung, wobei bei dem Subjekt, basierend auf der Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus einer Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden, ermittelt wurde, dass er die Erkrankung hat, wobei jedes des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind, und wobei das Vorhandensein der Vielzahl von Phasenvarianten indikativ für die Erkrankung des Subjekts ist; und (b) Unterziehen des Subjekts der Behandlung basierend auf der Identifizierung in (a).
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Überwachung des Verlaufs einer Erkrankung eines Subjekts vor, das Verfahren umfassend: (a) Ermitteln eines ersten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines ersten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer ersten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden; (b) Ermitteln eines zweiten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines zweiten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer zweiten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden, wobei die zweite Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt wird, nachdem die erste Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt wurde; und (c) Ermitteln des Verlaufs der Erkrankung basierend auf dem ersten Stadium der Erkrankung und dem zweiten Stadium der Erkrankung, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Verlauf der Erkrankung eine Verschlimmerung der Erkrankung.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Verlauf der Erkrankung wenigstens eine Teilremission der Erkrankung.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist das Vorhandensein der Vielzahl von Phasenvarianten indikativ für das erste Stadium oder das zweite Stadium der Erkrankung des Subjekts.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wird die zweite Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt wenigstens etwa 1 Woche, wenigstens etwa 2 Wochen, wenigstens etwa 3 Wochen, wenigstens etwa 4 Wochen, wenigstens etwa 2 Monate oder wenigstens etwa 3 Monate nach der Erlangung der ersten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wird das Subjekt einer Behandlung der Erkrankung (i) vor der Gewinnung der zweiten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt und (ii) im Anschluss an die Gewinnung der ersten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt unterzogen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Verlauf der Erkrankung indikativ für eine minimale Resterkrankung der Erkrankung des Subjekts. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Verlauf der Erkrankung indikativ für die Tumorlast oder die Krebslast des Subjekts.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren werden das eine oder die mehreren zellfreien Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle mit einem Nukleinsäuresondensatz erfasst, wobei der Nukleinsäuresondensatz zur Hybridisierung an wenigstens einen Teil der zellfreien Nukleinsäuremoleküle ausgelegt ist, die eine oder mehrere mit der Erkrankung assoziierte Genombereiche umfassen.
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren vor, umfassend: (a) Vorsehen eines Gemisches, umfassend (1) einen Nukleinsäuresondensatz und (2) eine Vielzahl von zellfreien Nukleinsäuremolekülen, die von einem Subjekt erlangt oder abgeleitet wird, wobei eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatzes zur Hybridisierung an wenigstens einen Teil eines zellfreien Zielnukleinsäuremoleküls gestaltet ist, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind, und wobei die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens umfasst, wobei die Aktivierung des aktivierbaren Reporteragens ausgewählt ist aus der Gruppe bestehend aus: (i) Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl der Phasenvarianten und (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl der Phasenvarianten hybridisiert wurde; (b) Nachweis des aktivierbaren Reporteragens, das zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle aktiviert ist, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle die Vielzahl der Phasenvarianten umfasst; und (c) Analysieren des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle zur Ermittlung einer Erkrankung des Subjekts.
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren vor, umfassend: (a) Vorsehen eines Gemisches, umfassend (1) einen Nukleinsäuresondensatz und (2) eine Vielzahl von zellfreien Nukleinsäuremolekülen, die von einem Subjekt erlangt oder abgeleitet wird, wobei eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatzes zur Hybridisierung an wenigstens einen Teil eines zellfreien Zielnukleinsäuremoleküls gestaltet ist, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, und wobei die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens umfasst, wobei die Aktivierung des aktivierbaren Reporteragens ausgewählt ist aus der Gruppe bestehend aus: (i) Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl der Phasenvarianten und (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl der Phasenvarianten hybridisiert wurde; (b) Nachweis des aktivierbaren Reporteragens, das zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle aktiviert ist, wobei eine Nachweisgrenze des Identifizierungsschritts weniger als etwa 1 aus 50.000 zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen ist; und (c) Analysieren des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle zur Ermittlung einer Erkrankung des Subjekts.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbaren Verfahren beträgt die Nachweisgrenze des Identifizierungsschritts weniger als etwa 1 von 100.000, weniger als etwa 1 von 500.000, weniger als etwa 1 von 1.000.000, weniger als etwa 1 von 1.500.000 oder weniger als etwa 1 von 2.000.000 zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wird das aktivierbare Reporteragens bei der Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl der Phasenvarianten aktiviert.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wird das aktivierbare Reporteragens bei der Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl der Phasenvarianten hybridisiert wurde, aktiviert.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das Verfahren ferner das Mischen (1) des Nukleinsäuresondensatzes und (2) der Vielzahl von zellfreien Nukleinsäuremolekülen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist das aktivierbare Reporteragens ein Fluorophor.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst die Analyse des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle die Analyse (i) des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle und (ii) anderer zellfreier Nukleinsäuremoleküle der Vielzahl zellfreier Nukleinsäuremoleküle, die nicht die Vielzahl der Phasenvarianten als unterschiedliche Variablen umfassen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren basiert die Analyse des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle nicht auf anderen zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen, die nicht die Vielzahl von Phasenvarianten umfassen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist eine Anzahl der Vielzahl von Phasenvarianten aus dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts. In einigen Ausführungsformen ist ein Verhältnis von (i) der Anzahl der Vielzahl von Phasenvarianten aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen und (ii) einer Anzahl von Einzelnukleotidvarianten (Single Nucleotide Variants, SNV) aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Häufigkeit der Vielzahl von Phasenvarianten in dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts. In einigen Ausführungsformen ist die Häufigkeit indikativ für eine mit der Erkrankung verbundene erkrankte Zelle. In einigen Ausführungsformen ist die Erkrankung ein diffuses großzelliges B-Zell-Lymphom, und wobei die Häufigkeit indikativ dafür ist, ob das eine oder die mehreren zellfreien Nukleinsäuremoleküle von Keimzentrum-B-Zellen (Germinal Center B-Cells, GCB) oder aktivierten B-Zellen (Activated B-Cell, ABC) abgeleitet sind.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Genomursprung des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle indikativ für die Erkrankung des Subjekts.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren sind die erste und die zweite Phasenvariante durch wenigstens 2, wenigstens 3, wenigstens 4, wenigstens 5, wenigstens 6, wenigstens 7 oder wenigstens 8 Nukleotide getrennt. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren sind die erste und die zweite Phasenvariante durch höchstens etwa 180, höchstens etwa 170, höchstens etwa 160, höchstens etwa 150 oder höchstens etwa 140 Nukleotide getrennt.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfassen wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 % oder wenigstens etwa 50 % des einen oder der mehreren zellfreien Nukleinsäuremoleküle, die eine Vielzahl von Phasenvarianten umfassen, eine Einzelnukleotidvariante (Single Nucleotide Variant, SNV), die wenigstens 2 Nukleotide von einer benachbarten SNV entfernt ist.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst die Vielzahl der Phasenvarianten wenigstens 3, wenigstens 4, wenigstens 5, wenigstens 10, wenigstens 15, wenigstens 20 oder wenigstens 25 Phasenvarianten innerhalb desselben zellfreien Nukleinsäuremoleküls.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das eine oder umfassen die mehreren identifizierten zellfreien Nukleinsäuremoleküle wenigstens 2, wenigstens 3, wenigstens 4, wenigstens 5, wenigstens 10, wenigstens 50, wenigstens 100, wenigstens 500 oder wenigstens 1.000 zellfreie Nukleinsäuremoleküle.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Referenzgenomsequenz von einer Referenzkohorte abgeleitet. In einigen Ausführungsformen umfasst die Referenzgenomsequenz eine Konsenssequenz aus der Referenzkohorte. In einigen Ausführungsformen umfasst die Referenzgenomsequenz wenigstens einen Teil des menschlichen hg 19-Genoms, hg18-Genoms, hg17-Genoms, hg16-Genoms oder hg38-Genoms.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Referenzgenomsequenz aus einer Probe des Subjekts abgeleitet.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Probe eine gesunde Probe. In einigen Ausführungsformen umfasst die Probe eine gesunde Zelle. In einigen Ausführungsformen umfasst die gesunde Zelle einen gesunden Leukozyten.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Probe eine erkrankte Probe. In einigen Ausführungsformen umfasst die erkrankte Probe eine erkrankte Zelle. In einigen Ausführungsformen umfasst die erkrankte Zelle eine Tumorzelle. In einigen Ausführungsformen umfasst die erkrankte Probe einen soliden Tumor.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wird der Nukleinsäuresondensatz basierend auf der Vielzahl von Phasenvarianten gestaltet, die durch den Vergleich von (i) Sequenzierungsdaten aus einem soliden Tumor, Lymphom oder Bluttumor des Subjekts und (ii) Sequenzierungsdaten aus einer gesunden Zelle des Subjekts oder einer gesunden Kohorte identifiziert werden. In einigen Ausführungsformen stammt die gesunde Zelle von dem Subjekt. In einigen Ausführungsformen stammt die gesunde Zelle aus der gesunden Kohorte.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Nukleinsäuresondensatz zur Hybridisierung an wenigstens einen Teil der Sequenzen der mit der Erkrankung assoziierten genomischen Loci gestaltet. In einigen Ausführungsformen ist bekannt, dass die mit der Erkrankung assoziierten genomischen Loci eine aberrante somatische Hypermutation aufweisen, wenn das Subjekt die Erkrankung hat.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Nukleinsäuresondensatz zur Hybridisierung an wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % oder etwa 100 % (i) der in Tabelle 1 identifizierten Genombereiche, (ii) der in Tabelle 3 identifizierten Genombereiche oder (iii) der in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereiche, gestaltet.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren weist jede Nukleinsäuresonde des Nukleinsäuresondensatz wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % Sequenzidentität, wenigstens etwa 95 % Sequenzidentität oder etwa 100 % Sequenzidentität mit einer aus Tabelle 6 ausgewählten Sondensequenz auf.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst der Nukleinsäuresondensatz wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 % oder wenigstens etwa 90 % der Sondensequenzen in Tabelle 6.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das Verfahren ferner die Bestimmung, dass das Subjekt die Erkrankung hat oder die Bestimmung eines Grades oder Stadiums der Erkrankung des Subjekts, basierend auf dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen, die die Vielzahl von Phasenvarianten umfassen. In einigen Ausführungsformen umfasst das Verfahren ferner das Bestimmen, dass das eine oder die mehreren zellfreien Nukleinsäuremoleküle aus einer mit der Erkrankung assoziierten Probe abgeleitet ist/sind, basierend auf der Durchführung einer statistischen Modellanalyse des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle. In einigen Ausführungsformen umfasst die statistische Modellanalyse eine statistische Monte-Carlo-Analyse.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das Verfahren ferner die Überwachung eines Verlaufs der Erkrankung des Subjekts basierend auf dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das Verfahren ferner das Durchführen eines anderen Verfahrens zur Bestätigung der Erkrankung des Subjekts. In einigen Ausführungsformen umfasst das andere Verfahren einen Bluttest, einen Gentest, eine medizinische Bildgebung, eine körperliche Untersuchung oder eine Gewebebiopsie.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst das Verfahren ferner das Bestimmen einer Behandlung der Erkrankung des Subjekts basierend auf dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wurde das Subjekt vor (a) einer Behandlung der Erkrankung unterzogen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst die Behandlung Chemotherapie, Radiotherapie, Chemoradiotherapie, Immuntherapie, adoptive Zelltherapie, Hormontherapie, gezielte Arzneimitteltherapie, Operation, Transplantation, Transfusion oder medizinische Überwachung.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst die Vielzahl der zellfreien Nukleinsäuremoleküle eine Vielzahl von zellfreien Desoxyribonukleinsäuremolekülen (DNA-Molekülen).
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst Erkrankung eine Krankheit.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist die Vielzahl der zellfreien Nukleinsäuremoleküle aus einer Körperprobe des Subjekts abgeleitet. In einigen Ausführungsformen umfasst die Körperprobe Plasma, Serum, Blut, Liquor, Lymphflüssigkeit, Speichel, Urin oder Stuhl.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist das Subjekt ein Säugetier. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist das Subjekt ein Mensch.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren umfasst die Erkrankung Neoplasma, Krebs oder Tumor. In einigen Ausführungsformen umfasst die Erkrankung einen soliden Tumor. In einigen Ausführungsformen umfasst die Erkrankung ein Lymphom. In einigen Ausführungsformen umfasst die Erkrankung ein B-Zell-Lymphom. In einigen Ausführungsformen umfasst die Erkrankung einen Untertyp des B-Zell-Lymphoms, der ausgewählt ist aus der Gruppe bestehend aus diffusem großzelligem B-Zell-Lymphom, follikulärem Lymphom, Burkitt-Lymphom und chronisch lymphozytäre B-Zell-Leukämie.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren wurde die Vielzahl der Phasenvarianten zuvor durch Sequenzierung einer früheren Tumorprobe oder einer zellfreien Nukleinsäureprobe als tumorabgeleitet identifiziert.
  • In einem Aspekt sieht die vorliegende Offenbarung eine Zusammensetzung vor, umfassend einen Ködersatz, der einen Nukleinsäuresondensatz umfasst, der zum Erfassen von zellfreien DNA-Molekülen gestaltet ist, die von wenigstens etwa 5 % der Genombereiche abgeleitet sind, die in (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen aufgeführt sind.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist der Nukleinsäuresondensatz für das Pull-Down (Abrufen, Herunterziehen) von zellfreien DNA-Molekülen gestaltet, die von wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % oder etwa 100 % von in (i) der in Tabelle 1 identifizierten Genombereiche, (ii) der in Tabelle 3 identifizierten Genombereiche oder (iii) der in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereiche festgelegten Genombereichen abgeleitet sind.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist der Nukleinsäuresondensatz zum Erfassen des einen oder der mehreren zellfreien DNA-Molekülen gestaltet, die von höchstens etwa 10 %, höchstens etwa 20 %, höchstens etwa 30 %, höchstens etwa 40 %, höchstens etwa 50 %, höchstens etwa 60 %, höchstens etwa 70 %, höchstens etwa 80 %, höchstens etwa 90 % oder etwa 100 % von (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen festgelegten Genombereichen abgeleitet sind.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst der Ködersatz höchstens 5, höchstens 10, höchstens 50, höchstens 100, höchstens 500, höchstens 1000 oder höchstens 2000 Nukleinsäuresonden.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatzes ein Pull-Down-Tag.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst das Pull-Down-Tag einen Nukleinsäure-Barcode.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst das Pull-Down-Tag Biotin.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist jedes der zellfreien DNA-Moleküle zwischen etwa 100 Nukleotiden und etwa 180 Nukleotiden lang.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen sind die Genombereiche mit einer Erkrankung assoziiert.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen weisen die Genombereiche eine aberrante somatische Hypermutation auf, wenn ein Subjekt die Erkrankung hat.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst die Erkrankung ein B-Zell-Lymphom. In einigen Ausführungsformen umfasst die Erkrankung einen Untertyp des B-Zell-Lymphoms, der ausgewählt ist aus der Gruppe bestehend aus diffusem großzelligem B-Zell-Lymphom, follikulärem Lymphom, Burkitt-Lymphom und chronisch lymphozytäre B-Zell-Leukämie.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst die Zusammensetzung ferner eine Vielzahl von zellfreien DNA-Molekülen, die von einem Subjekt erlangt oder abgeleitet wurden.
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Durchführung eines klinischen Verfahrens an einem Individuum vor, das Verfahren umfassend: (a) Gewinnen oder erlangt haben eines gezielten Sequenzierungsergebnisses einer Sammlung von zellfreien Nukleinsäuremolekülen, wobei die Sammlung von zellfreien Nukleinsäuremolekülen aus einer Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums stammt, und wobei die gezielte Sequenzierung unter Verwendung von Nukleinsäuresonden zum Pull-Down von Sequenzen genomischer Loci durchgeführt wird, von denen bekannt ist, dass sie eine aberrante somatische Hypermutation in einem B-Zell-Krebs aufweisen; (b) Identifizieren oder identifiziert haben einer Vielzahl von Varianten in Phase innerhalb des zellfreien Nukleinsäure-Sequenzierungsergebnisses; (c) Bestimmen oder bestimmt haben, unter Verwendung eines statistischen Modells und der identifizierten Phasenvarianten, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleotide enthält, die von einem Neoplasma abgeleitet sind; und (d) Durchführen eines klinischen Verfahrens an dem Individuum zur Bestätigung des Vorhandenseins des B-Zell-Krebses, basierend auf der Bestimmung, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleinsäure-Sequenzen enthält, die wahrscheinlich von dem B-Zell-Krebs abgeleitet sind.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist die Biopsie eine von Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen sind die genomischen Loci ausgewählt aus (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen sind die Sequenzen der Nukleinsäuresonden aus Tabelle 6 ausgewählt.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist das klinische Verfahren ein Bluttest, eine medizinische Bildgebung oder eine körperliche Untersuchung.
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Behandlung eines Individuums gegen B-Zellen-Krebs vor, das Verfahren umfassend: (a) Gewinnen oder erlangt haben eines gezielten Sequenzierungsergebnisses einer Sammlung von zellfreien Nukleinsäuremolekülen, wobei die Sammlung von zellfreien Nukleinsäuremolekülen aus einer Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums stammt, und wobei die gezielte Sequenzierung unter Verwendung von Nukleinsäuresonden zum Pull-Down von Sequenzen genomischer Loci durchgeführt wird, von denen bekannt ist, dass sie eine aberrante somatische Hypermutation in einem B-Zellen-Krebs aufweisen; (b) Identifizieren oder identifiziert haben einer Vielzahl von Varianten in Phase innerhalb des Ergebnisses der zellfreien Nukleinsäure-Sequenzierung; (c) Bestimmen oder bestimmt haben, unter Verwendung eines statistischen Modells und der identifizierten Phasenvarianten, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleotide enthält, die von einem Neoplasma abgeleitet sind; und (d) Behandeln des Individuums zur Eindämmung des B-Zellen-Krebses, basierend auf der Bestimmung, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleinsäure-Sequenzen enthält, die von dem B-Zellen-Krebs abgeleitet sind.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist die Biopsie eine von Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen sind die genomischen Loci ausgewählt aus (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen sind die Sequenzen der Nukleinsäuresonden aus Tabelle 6 ausgewählt.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist die Behandlung Chemotherapie, Radiotherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie oder medizinische Überwachung.
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zum Nachweis einer krebsartigen minimalen Restkrankheit bei einem Individuum und zur Behandlung des Individuums aufgrund einer Krebskrankheit vor, das Verfahren umfassend: (a) Gewinnen oder erlangt haben eines gezielten Sequenzierungsergebnisses einer Sammlung von zellfreien Nukleinsäuremolekülen, wobei die Sammlung von zellfreien Nukleinsäuremolekülen aus einer Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums stammt, wobei die Flüssigkeits- oder Ausscheidungsbiopsie zum Nachweis einer minimalen Restkrankheit nach einer Reihe von Behandlungen entnommen wird, und wobei die gezielte Sequenzierung unter Verwendung von Nukleinsäuresonden zum Pull-Down von Sequenzen genomischer Loci durchgeführt wird, von denen bestimmt wurde, dass sie eine Vielzahl von Varianten in Phasen enthalten, wie durch ein früheres Sequenzierungsergebnis einer aus dem Krebs abgeleiteten früheren Biopsie bestimmt; (b) Identifizieren oder identifiziert haben wenigstens eines Satzes der Vielzahl von Varianten in Phase innerhalb des Ergebnisses der zellfreien Nukleinsäure-Sequenzierung; (c) Behandeln des Individuums zur Eindämmung des Krebses, basierend auf der Bestimmung, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleinsäure-Sequenzen enthält, die von dem Krebs abgeleitet sind.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist die Flüssigkeits- oder Ausscheidungsbiopsie eine von Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen ist die Behandlung Chemotherapie, Radiotherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie oder medizinische Überwachung.
  • In einem Aspekt sieht die vorliegende Offenbarung ein Computerprogrammprodukt vor, umfassend ein nicht-transitorisches, computerlesbares Medium mit darin codiertem, computerausführbarem Code, wobei der computerausführbare Code zur Ausführung zur Implementierung eines beliebigen der hier offenbaren Verfahren angepasst ist.
  • In einem Aspekt sieht die vorliegende Offenbarung ein System vor, das einen oder mehrere Computerprozessoren und einen damit gekoppelten Computerspeicher umfasst, wobei der Computerspeicher maschinenausführbaren Code enthält, der bei Ausführung durch den einen oder die mehreren Computerprozessoren ein beliebiges der hierin offenbarten Verfahren implementiert.
  • Zusätzliche Aspekte und Vorteile der vorliegenden Offenbarung werden für Fachleute aus der folgenden ausführlichen Beschreibung leicht ersichtlich, in der lediglich veranschaulichende Ausführungsformen der vorliegenden Offenbarung gezeigt und beschrieben werden. Wie zu erkennen sein wird, ist die vorliegende Offenbarung zu anderen und unterschiedlichen Ausführungsformen fähig, und ihre zahlreichen Details sind zu Modifikationen in verschiedenen offensichtlichen Hinsichten fähig, ohne dabei von der Offenbarung abzuweichen. Dementsprechend sind die Zeichnungen und die Beschreibung als veranschaulichend und nicht als einschränkend zu betrachten.
  • DURCH BEZUGNAHME EINBEZOGEN
  • Alle Veröffentlichungen, Patente und Patentanmeldungen, die in dieser Patentschrift erwähnt werden, sind hierin durch Bezugnahme in demselben Umfang einbezogen, als ob jede einzelne Veröffentlichung, jedes einzelne Patent oder jede einzelne Patentanmeldung ausdrücklich und individuell als durch Bezugnahme einbezogen angegeben wäre. Soweit die durch Bezugnahme einbezogenen Veröffentlichungen und Patente oder Patentanmeldungen der in der Patentschrift enthaltenen Offenbarung widersprechen, hat die Beschreibung Vorrang vor etwaigem widersprüchlichem Material.
  • Figurenliste
  • Verschiedene Merkmale der Erfindung sind in den beigefügten Patentansprüchen im Einzelnen dargelegt. Zum besseren Verständnis der Merkmale und Vorteile der vorliegenden Erfindung wird auf die folgende ausführliche Beschreibung, in der veranschaulichende Ausführungsformen dargelegt sind, in denen die Prinzipien der Erfindung genutzt werden, sowie auf die beigefügten Zeichnungen (hierin auch „Figur“ und „FIG.“) verwiesen.
    • 1 veranschaulicht die Entdeckung von Phasenvarianten und deren Mutationssignaturen durch die Analyse von Ganzgenomsequenzierungsdaten. 1A ist eine Zeichnung, die den Unterschied zwischen dem Nachweis einer Einzelnukleotidvariante (SNV) (oben) und mehrerer Varianten ,in Phase‘ (Phasenvarianten, PVs; unten) auf individuellen zellfreien DNA-Molekülen darstellt. Theoretisch ist der Nachweis einer PV ein spezifischeres Ereignis als der Nachweis einer isolierten SNV. 1B. ist ein Streudiagramm, das die Verteilung der Anzahl der PVs aus Ganzgenomsequenzierungsdaten (Whole Genome Sequencing, WGS-Daten) für 24 verschiedene Krebshistologien, normalisiert durch die Gesamtzahl der SNV, zeigt. Die Balken zeigen den Medianwert und den Interquartilsbereich. (FL-NHL, follikuläres Lymphom; DLBCL-NHL, diffuses großzelliges B-Zell-Lymphom; Burkitt-NHL, Burkitt-Lymphom, Lungen-SCC, Plattenepithel-Lungenkrebs; Lungen-Adeno, Adenokarzinom der Lunge; Nieren-RCC, Nierenzellkarzinom; Knochen-Osteosarc, Osteosarkom; Leber-HCC, hepatozelluläres Karzinom; Brust-Adeno, Adenokarzinom der Brust; Pank-Adeno, Adenokarzinom der Bauchspeicheldrüse; Kopf-SCC, Plattenepithelkarzinom im Kopf- und Halsbereich; Ovar-Adeno, Adenokarzinom der Eierstöcke; Eso-Adeno, Adenokarzinom der Speiseröhre; Uterus-Adeno, Adenokarzinom der Gebärmutter; Magen-Adeno, Adenokarzinom des Magens; CLL, chronische lymphozytäre Leukämie; KoloRekt-Adeno, kolorektales Adenokarzinom; Prost-Adeno, Adenokarzinom der Prostata; ZNS-GBM, Glioblastoma multiforme; Pank-Endokrin, neuroendokriner Tumor der Bauchspeicheldrüse; Schildd.-Adeno, Adenokarzinom der Schilddrüse; ZNS-PiloAstro, Piloastrozytom; ZNS-Medullo, Medulloblastom). 1C. ist ein Wärmebild, das die Anreicherung von Mutationssignaturen durch Einzelbasensubstitution (Single Base Substitution, SBS) für PVs im Vergleich zu einzelnen SNV über verschiedene Krebsarten hinweg zeigt. Blau steht für Signaturen, die in PVs in bestimmten Histologien angereichert sind; Dunkelgrau steht für Signaturen, in denen nicht phasierte, einzelne SNV angereichert sind; und Rot steht für SNV, die isoliert auftreten. Nur Signaturen, die einen signifikanten Unterschied zwischen PVs und nicht phasierten SNV nach Korrektur für multiple Hypothesen aufweisen, sind dargestellt; andere Signaturen sind grau. Signaturen, die mit Rauchen, AID/AICDA und APOBEC in Verbindung gebracht werden, sind angegeben. 1D. stellt Balkendiagramme dar, die die Verteilung von in stereotypen Bereichen des Genoms auftretenden PVs bei B-Lymphoid-Malignitäten und Adenokarzinom der Lunge zeigen. In diesem Diagramm wurde das Genom in 1000bp-Bins unterteilt und die Anteil der Proben einer gegebenen Histologie mit einer PV in jedem 1000bp-Bin berechnet. Es sind nur Bins dargestellt, die bei einem beliebigen Krebsuntertyp eine Rezidivhäufigkeit von wenigstens 2 Prozent aufweisen. Die wichtigsten genomischen Loci sind ebenfalls markiert. 1E ist ein Vergleich der Duplex-Sequenzierung mit der Sequenzierung von Phasenvarianten. Ein Schema zum Vergleich der fehlerunterdrückten Sequenzierung durch Duplex-Sequenzierung und der Rückgewinnung von Phasenvarianten. Bei der Duplex-Sequenzierung ist die Rückgewinnung einer einzelnen SNV, die auf beiden Strängen einer ursprünglichen DNA-Doppelhelix (d. h. in-trans) beobachtet wurde, erforderlich. Dies erfordert eine unabhängige Rückgewinnung von zwei Molekülen durch Sequenzierung, da die Plus- und Minusstränge des ursprünglichen DNA-Moleküls unabhängig voneinander die Bibliothekspräparation und PCR durchlaufen. Im Gegensatz dazu erfordert die Rückgewinnung von PVs mehrere SNV, die auf demselben Einzelstrang der DNA (d. h. in cis) beobachtet werden. Daher ist die Rückgewinnung nur des Plus- oder des Minusstrangs (und nicht beider) für die Identifizierung von PVs ausreichend.
    • 2 stellt die Gestaltung, die Validierung und die Anwendung der Phasenvarianten-Anreicherungssequenzierung dar. 2A ist eine schematische Darstellung der Gestaltung für die PhasED-Seq. WGS-Daten von DLBCL-Tumorproben wurden aggregiert (links), und Bereiche mit rezidivierenden putativen PVs identifiziert (Mitte). Daraufhin wurde ein Assay entwickelt, der die Genombereiche erfasst, in denen PVs am häufigsten vorkommen (rechts). Das Ergebnis war eine ~ 7500-fache Anreicherung von PVs im Vergleich zu WGS. Das rechte obere Panel zeigt die in silico erwartete Anzahl von PVs pro Fall pro Kilobase der Panelgröße (y-Achse) für steigende Panelgrößen (x-Achse). Die gestrichelte Linie zeigt die ausgewählten Bereiche in dem PhasED-Seq.-Panel. Das untere rechte Panel zeigt die Gesamtzahl der erwarteten PVs pro Fall (y-Achse), die in silico aus WGS-Daten ermittelt wurden, für steigende Panelgrößen (y-Achse). Der dunkle Bereich zeigt die ausgewählten Bereiche im PhasED-Seq.-Panel. 2B veranschaulicht zwei Felder, die den Ertrag an SNV (links) und PVs (rechts) für die Sequenzierung von Tumor-DNA und angepasster Keimbahn durch ein zuvor etabliertes Lymphom-CAPP-Seq.-Panel oder PhasED-Seq. zeigen; die Werte werden in silico bewertet, indem die WGS auf den Zielbereich von Interesse begrenzt wird. Die im rechten Feld angegebenen PVs umfassen Dublett-, Triplett- und Quadruplett-Phasenereignisse. 2C zeigt den Ertrag an SNV (links) und PVs (rechts) aus der experimentellen Sequenzierung von Tumor- und/oder zellfreier DNA aus CAPP-Seq. gegenüber PhasED-Seq., ähnlich wie in 2B. 2D ist ein Streudiagramm, das die Häufigkeit von PVs nach genomischer Position (in 1000bp-Bins) für Patienten mit DLBCL zeigt, die entweder durch WGS oder durch PhasED-Seq. identifiziert wurden. PVs in IGH, BCL2, MYC und BCL6 sind hervorgehoben. 2E zeigt Streudiagramme, die die Häufigkeit von PVs nach genomischer Position (in 50bp-Bins) für Patienten mit verschiedenen Lymphomtypen vergleichen. Die farbigen Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins eines bestimmten Gens von Interesse; die anderen (grauen) Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins des restlichen PhasED-Seq.-Sequenzierpanels. 2F zeigt Vulkandiagramme, die die Differenz in der relativen Häufigkeit von PVs in spezifischen genetischen Loci zwischen verschiedenen Lymphomarten zusammenfassen, einschließlich ABC-DLBCL vs. GCB-DLBCL (dunkelgrau, links); PMBCL vs. DLBCL (dunkelgrau, Mitte); und HL vs. DLBCL (dunkelgrau, rechts). Die x-Achse zeigt die relative Anreicherung von PVs an einem bestimmten Locus, während die y-Achse die statistische Signifikanz dieser Assoziation anzeigt. (Beispiel 10).
    • 3 veranschaulicht die technische Leistung der PhasED-Seq. zum Nachweis von Krankheiten. 3A zeigt ein Balkendiagramm, das die Leistung der Hybriderfassungssequenzierung für die Rückgewinnung synthetischer 150bp Oligonukleotide von zwei Loci (MYC und BCL6) mit zunehmendem Mutationsgrad / Nicht-Referenzbasen zeigt. Die Fehlerbalken stellen das 95 %-Konfidenzintervall dar (n=3 Replikate jeder Erkrankung in eindeutigen Proben). 3B veranschaulicht ein Diagramm, das die Hintergrundfehlerrate (Beispiel 10) für verschiedene Arten der Fehlersuppression von 12 gesunden zellfreien Kontroll-DNA-Proben, die mit dem PhasED-Seq.-Panel sequenziert wurden, darstellt. PhasED-Seq. 2x' oder ,Dubletts` steht für den Nachweis von zwei phasengleichen Mutationen auf demselben DNA-Molekül; PhasED-Seq. 3x' oder ,Tripletts` steht für den Nachweis von drei phasengleichen Mutationen auf demselben DNA-Molekül. 3C stellt ein Balkendiagramm dar, das die Tiefe der eindeutigen molekularen Rückgewinnung (z. B. Tiefe nach Barcode-vermittelter PCR-Duplikatentfernung) aus Sequenzierungsdaten von 12 zellfreien DNA-Proben für verschiedene Arten der Fehlersuppression zeigt, einschließlich Barcode-Deduplizierung, Duplex-Sequenzierung und Rückgewinnung von PVs mit zunehmendem maximalen Abstand zwischen SNV in Phase. 3D veranschaulicht ein Balkendiagramm, das den kumulativen Anteil der PVs zeigt, die einen maximalen Abstand zwischen SNV aufweisen, der geringer ist als die Anzahl der Basenpaare auf der x-Achse. 3E zeigt ein Diagramm mit den Ergebnissen einer limitierenden Verdünnungsreihe, die patientenspezifische Tumorfraktionen von 1×10-3 bis 0,5×10-6 enthaltende zellfreie DNA-Proben simuliert; in jeder Verdünnung wurde cfDNA von 3 unabhängigen Patientenproben verwendet. Dieselben Sequenzierungsdaten wurden mit einer Vielzahl von Verfahren zur Fehlersuppression für die Rückgewinnung der erwarteten Tumorfraktionen analysiert, darunter iDES, Duplex-Sequenzierung und PhasED-Seq. (sowohl für die Rückgewinnung von Dublett- als auch Triplett-Molekülen). Die Punkte und Fehlerbalken stellen den Mittelwert, das Minimum und das Maximum für die drei betrachteten patientenspezifischen Tumormutationen dar. Der Unterschied zwischen beobachteten und erwarteten Tumorfraktionen für Proben < 1: 10.000 wurde mittels eines gepaarten t-Tests verglichen. *, P < 0,05, **, P < 0,005, ***, P < 0,0005. 3F veranschaulicht das Diagramm des Hintergrundsignals für den Nachweis tumorspezifischer Allele in 12 nicht verwandten, gesunden zellfreien DNA-Proben und der für die limitierende Verdünnungsreihe verwendeten gesunden cfDNA-Probe (n=13 Gesamtproben). In jeder Probe wurden tumorspezifische SNV oder PVs aus den 3 Patientenproben, die in dem in 3E gezeigten limitierenden Verdünnungsexperiment verwendet wurden, für insgesamt 39 Bewertungen bewertet. Die Balken stellen das arithmetische Mittel über alle 39 Bewertungen dar; der statistische Vergleich wurde mit dem Wilcoxon-Rangsummentest durchgeführt. *, P < 0,05, **, P < 0,005, ***, P < 0,0005. 3G veranschaulicht das Diagramm, das die theoretische Nachweisrate für eine Probe mit einer gegebenen Anzahl von PV-enthaltenden Bereichen gemäß einer einfachen binomialen Probennahme darstellt. Dieses Diagramm wurde unter der Annahme einer eindeutigen Sequenzierungstiefe von 5000x (Linie) erstellt, zusammen mit einer variierenden Anzahl unabhängiger 150bp PV-enthaltender Bereiche, von 3 Bereichen (blau) bis 67 Bereichen (lila). Die Konfidenzhüllkurven berücksichtigen eine Tiefe von 4000-6000x; zudem wird eine Falsch-positiv-Rate von 5 % angenommen. 3H veranschaulicht ein Diagramm, das die beobachtete Nachweisrate (y-Achse) für eine Probe einer gegebenen wahren Tumorfraktion (x-Achse) mit variierender Anzahl von PV-haltigen Bereichen darstellt. Für jede Anzahl von Tumor-Reporter-Bereichen zwischen 3 und 67 wurde diese Anzahl von 150bp-Fenstern aus jeder der 3 patientenspezifischen PV-Reporter-Listen 25-mal zufällig ausgewählt und zur Bewertung des Tumornachweises bei jeder Verdünnung herangezogen. Gefüllte Punkte stehen für „nasse“ Verdünnungsreihenversuche, während offene Punkte für In silico-Verdünnungsversuche stehen. Punkte und Fehlerbalken stellen den Mittelwert, das Minimum und das Maximum der drei patientenspezifischen PV-Reporter-Listen dar, die in der ursprünglichen Probennahme verwendet wurden. 31 zeigt ein Streudiagramm, in dem die vorhergesagte mit der beobachteten Nachweisrate für Proben aus den Verdünnungsreihen in den Panels 3G und 3H verglichen wird. Weitere Einzelheiten zu diesem Versuch sind in Beispiel 10 angegeben.
    • 4 zeigt die klinische Anwendung der PhasED-Seq. für den ultrasensiblen Krankheitsnachweis und die Reaktionsbeobachtung bei DLBCL. 4A zeigt das Diagramm mit den ctDNA-Werten eines Patienten mit DLBCL, der auf die Erstlinien-Immunochemotherapie ansprach und anschließend einen Rückfall erlitt. Die mit CAPP-Seq. gemessenen Werte sind in dunkleren grauen Kreisen dargestellt, während die mit PhasED-Seq. gemessenen Werte in helleren grauen Kreisen dargestellt sind. Offene Kreise stehen für durch CAPP-Seq. nicht nachweisbare Werte. 4B stellt ein univariates Streudiagramm dar, das die mittlere Tumorallelfraktion zeigt, die durch PhasED-Seq. für klinische Proben zu Zeitpunkten minimaler Krankheit (d. h. nach 1 oder 2 Therapiezyklen) gemessen wurde. Das Diagramm ist unterteilt in durch Standard-CAPP-Seq. nachgewiesene und nicht nachgewiesene Proben; P-Wert aus Wilcoxon-Rangsummentest. 4C stellt ein Balkendiagramm dar, das den Bruchteil der DLBCL-Patienten zeigt, die mit CAPP-Seq. nach 1 oder 2 Behandlungszyklen nachweisbare ctDNA haben (dunkelgraue Balken), sowie den Bruchteil der zusätzlichen Patienten mit nachweisbarer Krankheit, wenn PhasED-Seq. zur Standard-CAPP-Seq. hinzugefügt wird (mittelgraue Balken). Der P-Wert stellt einen exakten Fisher-Test für den Nachweis durch CAPP-Seq. allein gegenüber der Kombination von PhasED-Seq. und CAPP-Seq. in 171 Proben nach 1 oder 2 Behandlungszyklen dar. 4D zeigt ein Wasserfalldiagramm, das die Veränderung der mit CAPP-Seq. gemessenen ctDNA-Werte nach 2 Zyklen der Erstlinientherapie bei Patienten mit DLBCL darstellt. Patienten mit nicht durch CAPP-Seq. nachweisbarer ctDNA sind als „ND“ (Not Detected, „nicht nachgewiesen“) in dunkleren Farben dargestellt. Die Farben der Balken zeigen auch die späteren klinischen Ergebnisse für diese Patienten an. 4E zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben für 52 DLBCL-Patienten mit nicht nachweisbarer ctDNA, gemessen durch CAPP-Seq., nach 2 Zyklen darstellt. 4F zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben von 52 in 4E gezeigten Patienten (durch CAPP-Seq. nicht nachweisbare ctDNA) stratifiziert nach ctDNA-Nachweis durch PhasED-Seq. zum gleichen Zeitpunkt (Zyklus 3, Tag 1) darstellt. 4G zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben für 89 Patienten mit DLBCL stratifiziert nach ctDNA bei Zyklus 3, Tag 1, unterteilt in 3 Schichten - Patienten, die keine gute molekulare Remission erreichen (dunkelgrau), Patienten mit einer guten molekulare Remission, die aber immer noch durch PhasED-Seq. und/oder CAPP-Seq. nachweisbare ctDNA haben (hellgrau), und Patienten, die eine stringente molekulare Remission haben (nicht durch PhasED-Seq. und CAPP-Seq. nachweisbare ctDNA; mittelgrau).
    • 5 zeigt die Aufzählung von SNV und PVs bei verschiedenen Krebsarten aus WGS. 5A-C zeigen univariate Streudiagramme, die die Anzahl der SNV (5A), der PVs (5B) und der PVs unter Kontrolle der Gesamtzahl der SNV (5C) aus WGS-Daten für 24 verschiedene Krebshistologien darstellen. Die Balken zeigen den Medianwert und den Interquartilsbereich. (FL-NHL, follikuläres Lymphom; DLBCL-NHL, diffuses großzelliges B-Zell-Lymphom; Burkitt-NHL, Burkitt-Lymphom; Lungen-SCC, Plattenepithel-Lungenkrebs; Lungen-Adeno, Adenokarzinom der Lunge; Nieren-RCC, Nierenzellkarzinom; Knochen-Osteosarc, Osteosarkom; Leber-HCC, hepatozelluläres Karzinom; Brust-Adeno, Adenokarzinom der Brust; Pank-Adeno, Adenokarzinom der Bauchspeicheldrüse; Kopf-SCC, Plattenepithelkarzinom im Kopf- und Halsbereich; Ovar-Adeno, Adenokarzinom der Eierstöcke; Eso-Adeno, Adenokarzinom der Speiseröhre; Uterus-Adeno, Adenokarzinom der Gebärmutter; Magen-Adeno, Adenokarzinom des Magens; CLL, chronische lymphozytäre Leukämie; KoloRekt-Adeno, kolorektales Adenokarzinom; Prost-Adeno, Adenokarzinom der Prostata; ZNS-GBM, Glioblastoma multiforme; Pank-Endokrin, neuroendokriner Tumor der Bauchspeicheldrüse; Schildd.-Adeno, Adenokarzinom der Schilddrüse; ZNS-PiloAstro, Piloastrozytom; ZNS-Medullo, Medulloblastom).
    • 6 zeigt den Beitrag von Mutationssignaturen in phasierten und nichtphasierten SNV in WGS (6A-6WW). Streudiagramme, die den Beitrag etablierter Mutationssignaturen für Einzelbasensubstitutionen (SBS) zu SNV in PVs, dargestellt in dunklen Farben, und SNV außerhalb möglicher Phasenbeziehungen, dargestellt in hellen Farben, aus WGS zeigen. Dies ist für 49 SBS-Mutationssignaturen in 24 Krebsunterarten dargestellt. Mutationssignaturen, die nach Korrektur der multiplen Hypothesentests einen signifikanten Unterschied im Beitrag zwischen phasierten und nichtphasierten SNV aufweisen, sind mit einem * gekennzeichnet. Diese Figuren stellen die in 1C zusammengefassten Rohdaten dar
    • 7 zeigt die Verteilung der PVs in stereotypen Bereichen des Genoms. Die Balkendiagramme zeigen die in stereotypen Bereichen auftretenden PVs über das Genom mehrerer Krebsarten. In diesem Diagramm wurde das Genom in 1000bp-Bins unterteilt und die Anteil der Proben einer gegebenen Histologie mit einer PV in jedem 1000bp-Bin berechnet. Es sind nur Bins dargestellt, die bei einem beliebigen Krebsuntertyp eine Rezidivhäufigkeit von wenigstens 2 Prozent aufweisen. Die dargestellten Histologien sind wie in 1E; Unterarten des DLBCL mit aktivierten B-Zellen (ABC) und B-Zellen im Keimzentrum (GCB) sind ebenfalls dargestellt.
    • 8 veranschaulicht die Anzahl und die genomische Lage von PVs aus WGS in lymphatischen Malignomen. 8A illustriert ein Balkendiagramm, das die Anzahl der unabhängigen 1000bp-Bereiche über das Genom zeigt, die wiederholt PVs für DLBCL, FL, BL und CLL enthalten (n=68, 74, 36 bzw. 151). 8B-D illustrieren Diagramme, die die Häufigkeit von PVs für multiple lymphatische Malignome mit Beziehungen zu spezifischen genetischen Loci zeigen, einschließlich 8B: BCL2, 8C: MYC, and 8D: ID3. Die Lage des Transkripts für ein gegebenes Gen ist unterhalb des Diagramms in Grau dargestellt; Exons sind in dunklerem Grau dargestellt. * kennzeichnet einen Bereich mit signifikant mehr PVs in einer bestimmten Krebs-Histologie im Vergleich zu allen anderen Histologien durch den exakten Fisher-Test (P < 0,05). 8E, ähnlich wie 8B-D, diese Diagramme zeigen die Häufigkeit von PVs bei verschiedenen Lymphom-Unterarten. Hier ist der IGH-Locus, bestehend aus IGHV-, IGHD- und IGHJ-Teilen, für ABC- und GCB-Subtyp DLBCLs (n = 25 bzw. 25) dargestellt. Dargestellt sind Codierungsbereiche für Ig-Teile, einschließlich Ig-konstanter Bereiche und V-Gene. (DLBCL, diffuses großzelliges B-Zell-Lymphom; FL, follikuläres Lymphom; BL, Burkitt-Lymphom, CLL, chronische lymphatische Leukämie).
    • 9 zeigt die Leistung von PhasED-Seq. zur Rückgewinnung von PVs über Lymphome hinweg. 9A zeigt ein univariates Streudiagramm, das die Anteil aller durch WGS identifizierten PVs im gesamten Genom (n=79) zeigt, die durch das zuvor berichtete Lymphom-CAPP-Seq.-Panel8 (links) im Vergleich zu PhasED-Seq. (rechts) wiedererlangt wurden. 9B veranschaulicht die erwartete Ausbeute an SNV pro Fall, die aus WGS unter Verwendung eines zuvor etablierten Lymphom CAPP-Seq.-Panels oder des PhasED-Seq.-Panels identifiziert wurden. 9C veranschaulicht die erwartete Ausbeute an PVs pro Fall, die aus WGS unter Verwendung eines zuvor etablierten Lymphom CAPP-Seq.-Panels oder des PhasED-Seq.-Panels identifiziert wurden. Daten von drei unabhängigen, öffentlich zugänglichen Kohorten sind in 9A-9C dargestellt. 9D-9F zeigen Diagramme, die die Verbesserung der Rückgewinnung von PVs durch PhasED-Seq. im Vergleich zu CAPP-Seq. bei 16 Patienten zeigen, die mit beiden Assays sequenziert wurden. Dazu gehören Verbesserungen bei d) zwei SNV in Phase (z. B. 2x oder ,Dublett-PVs'), e) drei SNV in Phase (3x oder ,Triplett-PVs') und f) vier SNV in Phase (z. B. 4x oder , Quadruplett-PVs'). 9G-9K illustrieren Panels, die die Anzahl der bei Patienten mit verschiedenen Lymphomtypen identifizierten SNV und PVs zeigen. Diese Panels zeigen die Anzahl der g) SNV, h) Dublett-PVs, i) Triplett-PVs, j) Quadruplett-PVs und k) aller PVs. *, P < 0,05, **, P < 0,01, ***, P < 0,001. (DLBCL, diffuses großzelliges B-Zell-Lymphom; GCB, B-Zellen im Keimzentrum wie DLBCL; ABC, aktivierte B-Zellen wie DLBCL; PMBCL, primäres mediastinales B-Zell-Lymphom; HL, Hodgkin-Lymphom).
    • 10 zeigt die lagespezifischen Unterschiede in PVs zwischen ABC-DLBCL und GCB-DLBC (10A-10Y.) Ähnlich wie 2D vergleichen diese Streudiagramme die Häufigkeit von PVs nach genomischer Lage (in 50bp-Bins) für Patienten mit verschiedenen Lymphomtypen; in dieser Figur ist der Unterschied zwischen ABC-DLBCL und GCB-DLBCL dargestellt. Die roten Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins eines bestimmten Gens von Interesse; die anderen (grauen) Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins aus dem Rest des PhasED-Seq.-Sequenzierpanels. Es werden nur Gene mit einem statistisch signifikantem Unterschied in den PVs zwischen ABC-DLBCL und GCB-DLBCL gezeigt. Die P-Werte stellen einen Wilcoxon-Rangsummentest von 50bp-Bins eines gegebenen Gens gegen alle anderen 50bp-Bins dar; siehe Beispiel 10.
    • 11 illustriert die lagespezifischen Unterschiede in den PVs zwischen DLBCL und PMBCL (11A-11X). Ähnlich wie 2D vergleichen diese Streudiagramme die Häufigkeit von PVs nach genomischer Lage (in 50bp-Bins) für Patienten mit verschiedenen Lymphomtypen; in dieser Figur ist der Unterschied zwischen DLBCL und PMBCL dargestellt. Die blauen Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins eines bestimmten Gens von Interesse; die anderen (grauen) Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins aus dem Rest des PhasED-Seq.-Sequenzierpanels. Es werden nur Gene mit einem statistisch signifikantem Unterschied in den PVs zwischen DLBCL und PMBCL gezeigt. Die P-Werte stellen einen Wilcoxon-Rangsummentest von 50bp-Bins eines gegebenen Gens gegen alle anderen 50bp-Bins dar; siehe Beispiel 10.
    • 12 zeigt die lagespezifischen Unterschiede in den PVs zwischen DLBCL und HL. Ähnlich wie in 2D vergleichen die Streudiagramme der 12A-12NN die Häufigkeit von PVs nach genomischer Lage (in 50bp-Bins) für Patienten mit verschiedenen Lymphomtypen; in dieser Figur ist der Unterschied zwischen DLBCL und HL dargestellt. Die grünen Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins eines bestimmten Gens von Interesse; die anderen (grauen) Kreise zeigen die relative Häufigkeit von PVs in 50bp-Bins aus dem Rest des PhasED-Seq.-Sequenzierpanels. Es werden nur Gene mit einem statistisch signifikantem Unterschied in den PVs zwischen DLBCL und HL gezeigt. Die P-Werte stellen einen Wilcoxon-Rangsummentest von 50bp-Bins eines gegebenen Gens gegen alle anderen 50bp-Bins dar; siehe Beispiel 10.
    • 13 zeigt die Unterschiede in den PVs zwischen den Lymphomtypen bei Mutationen im IGH-Locus. Diese Figur zeigt die Häufigkeit von PVs aus PhasED-Seq. über den @/G77-Lokus für verschiedene Arten von B-Zell-Lymphomen. Die untere Spur zeigt die Struktur des @IGH-Locus und der Genteile, einschließlich der Ig-konstanten Gene und V-Gene. Die nächste (skizzierte) Spur zeigt die Häufigkeit von PVs in diesem Genombereich aus WGS-Daten (ICGC-Kohorte). Die restlichen Spuren zeigen die Häufigkeit von PVs aus PhasED-Seq. gezielten Sequenzierungsdaten, einschließlich 1) DLBCL, GCB-DLBCL , ABC-DLBCL, PMBCL und HL. Die vom PhasED-Seq.-Panel angezielten Bereiche sind ganz oben dargestellt. Ausgewählte Immunglobulinteile mit PVs, die in bestimmten Histologien angereichert sind, sind markiert (d. h. IGHV4-34, Sε, Sγ3 und Sγ1).
    • 14 illustriert technische Aspekte der PhasED-Seq. durch Hybriderfassungssequenzierung. 14A zeigt ein Diagramm der theoretischen Bindungsenergie für typische 150-mere im gesamten Genom mit zunehmender Anteil der vom Referenzgenom mutierten Basen. Mutationen waren über die gesamte 150-mer-Sequenz verteilt, entweder gruppiert an einem Ende der Sequenz, gruppiert in der Mitte der Sequenz oder zufällig in der gesamten Sequenz. Punkt und Fehlerbalken stellen den Median und die Interquartilsbereiche von 10.000 In silico-Simulationen dar. 14B stellt ein Diagramm dar, das zwei Histogramme zusammenfassender Metriken der Mutationsrate von 151-bp-Fenstern im gesamten PhasED-Seq.-Panel für alle Patienten in dieser Studie zeigt. Das hellgraue Histogramm zeigt die maximalen mutierten Prozent in einem beliebigen 151-bp-Fenster für alle Patienten in dieser Studie; das dunkelgraue Histogramm zeigt die 95ste Perzentil-Mutationsrate über alle mutierten 151-bp-Fenster. 14C ist ein Diagramm, das das Perzentil der Mutationsrate über alle mutierten 151-bp-Fenster bei allen Patienten in dieser Studie zeigt. 14D stellt Wärmebilder dar, die die relative Fehlerrate (als log10(Fehlerrate)) für einzelne SNV (links, „ROT“), Dublett-PVs (Mitte, „GELB“) und Triplett-PVs (rechts, „BLAU“) zeigen. 14D zeigt, dass die Analyse basierend auf der Vielzahl von Phasenvarianten (z. B. Doppel- oder Triplett-PVs) eine niedrigere Fehlerrate ergibt als die Analyse basierend auf einzelnen SNV. Zusätzlich zeigt 14D, dass die Analyse unter Verwendung einer höheren Anzahl von Phasenvariantensätzen (z. B. Triplett-PVs mit der Bezeichnung „BLAU“) eine niedrigere Fehlerrate ergibt als die Analyse basierend auf einer geringeren Anzahl von Phasenvariantensätzen (z. B. Dublett-PVs mit der Bezeichnung „GELB“). Gezeigt ist die Fehlerrate einzelner SNV aus der Sequenzierung mit mehreren Verfahren zur Fehlerunterdrückung, einschließlich Barcode-Deduplizierung, iDES und Duplex-Sequenzierung. Die Fehlerraten werden nach Art der Mutation zusammengefasst. Im Falle von Triplett-PVs stellen die x- und y-Achse des Wärmebildes die erste und zweite Art der Basenveränderung in der PV dar; die dritte Veränderung wird über alle 12 möglichen Basenveränderungen gemittelt. 14E illustriert ein Diagramm, das die Fehlerrate für Dublett / 2x PVs als Funktion des genomischen Abstands zwischen den Komponenten-SNV zeigt.
    • 15 und 16 zeigen den Vergleich der Quantifizierung von ctDNA durch PhasED-Seq. mit CAPP-Seq. und klinischen Anwendungen. 15 veranschaulicht die Nachweisrate von ctDNA aus Vorbehandlungsproben über 107 Patienten mit großzelligen B-Zell-Lymphomen mittels Standard-CAPP-Seq. (grün) sowie PhasED-Seq. unter Verwendung von Dubletts (hellblau), Tripletts (mittelblau) und Quadrupletts (dunkelblau). Die Spezifität des ctDNA-Nachweises ist ebenfalls dargestellt. In den unteren beiden Diagrammen ist die Falschnachweisrate bei 40 zurückgehaltenen gesunden KontrollcfDNA-Proben dargestellt. Die Größe der einzelnen Balken in diesen beiden Diagrammen zeigt die Nachweisrate für patientenspezifische cfDNA-Mutationen in diesen 40 zurückgehaltenen Kontrollen für alle 107 Fälle. 16A stellt eine Tabelle dar, die die Sensitivität und Spezifität für den ctDNA-Nachweis in Vorbehandlungsproben durch CAPP-Seq. und PhasED-Seq. unter Verwendung von Dubletts, Tripletts und Quadrupletts zusammenfasst, dargestellt in Panel A. Die Sensitivität wird für alle 107 Fälle berechnet, während die Spezifität für die 40 zurückgehaltenen Kontrollproben berechnet wird, die für jede der 107 unabhängigen patientenspezifischen Mutationslisten bewertet werden, was insgesamt 4280 unabhängige Tests ergibt. 16B illustriert ein Streudiagramm, das die Menge an ctDNA (gemessen als log10(haploide Genomäquivalente/ml)) zeigt, die durch CAPP-Seq. im Vergleich zu PhasED-Seq. in einzelnen Proben gemessen wurde. Proben, die vor Zyklus 1 der RCHOP-Therapie (d. h. vor der Behandlung), vor Zyklus 2 und vor Zyklus 3 entnommen wurden, sind in unabhängigen Farben (blau, grün bzw. rot; insgesamt 278 Proben) dargestellt. Nicht nachweisbare Werte liegen auf den Achsen. Spearman-Korrelation und P-Wert sind dargestellt.
    • 17 zeigt den Nachweis von ctDNA nach zwei Zyklen der systemischen Therapie. 17A zeigt ein Streudiagramm, das die logarithmische Veränderung der ctDNA nach 2 Therapiezyklen (d. h. die Major Molecular Response (große molekulare Remission) oder MMR), gemessen mit CAPP-Seq. oder PhasED-Seq., für Patienten unter RCHOP-Therapie darstellt. Gepunktete Linien zeigen den zuvor festgelegten Schwellenwert einer 2,5-log-Reduktion in ctDNA für MMR. Nicht nachweisbare Proben fallen auf die Achsen; der Korrelationskoeffizient stellt einen Spearman rho für die 33 Proben dar, die sowohl mit CAPP-Seq. als auch mit PhasED-Seq. nachgewiesen wurden. 17B zeigt 2-x-2-Tabellen, in denen die Nachweisrate von ctDNA-Proben nach 2 Therapiezyklen durch PhasED-Seq. gegenüber CAPP-Seq. zusammengefasst ist. Patienten mit einer eventuellen Krankheitsprogression sind im unteren Panel dargestellt, während Patienten ohne eventuelle Krankheitsprogression im oberen Panel gezeigt sind. 17C zeigt Balkendiagramme, die den Bereich unter der Empfänger-Operator-Kurve (AUC) für die Klassifizierung von Patienten für das ereignisfreie Überleben nach 24 Monaten basierend auf CAPP-Seq. (helle Farben) oder PhasED-Seq. (dunkle Farben) nach 2 Therapiezyklen darstellen. Sowohl die Klassifizierung aller Patienten (n=89, links) als auch die Klassifizierung der Patienten, die eine MMR erreichen (n=69, rechts), sind dargestellt. 17D zeigt Kaplan-Meier-Diagramme, die das ereignisfreie Überleben von 69 Patienten zeigen, die eine MMR erreicht haben, stratifiziert nach ctDNA-Nachweis mit CAPP-Seq. (oben) oder PhasED-Seq. (unten).
    • 18 illustriert den Nachweis von ctDNA nach einem Zyklus der systemischen Therapie. 18A zeigt ein Streudiagramm, das die log-fache Veränderung in ctDNA nach einem Therapiezyklus (d. h. die Early Molecular Response (frühe molekulare Remission) oder EMR), gemessen mit CAPP-Seq. oder PhasED-Seq., für Patienten unter RCHOP-Therapie darstellt. Gepunktete Linien zeigen den zuvor festgelegten Schwellenwert einer 2-log-Reduktion in ctDNA für EMR. Nicht nachweisbare Proben fallen auf die Achsen; der Korrelationskoeffizient stellt einen Spearman Rho für die 45 Proben dar, die sowohl mit CAPP-Seq. als auch mit PhasED-Seq. nachgewiesen wurden. 18B zeigt 2-x-2-Tabellen, in denen die Nachweisrate von ctDNA-Proben nach 1 Therapiezyklus durch PhasED-Seq. gegenüber CAPP-Seq. zusammengefasst ist. Patienten mit einer eventuellen Krankheitsprogression sind in Rot dargestellt, während Patienten ohne eventuelle Krankheitsprogression in Blau dargestellt sind. 18C zeigt Balkendiagramme, die den Bereich unter der Empfänger-Operator-Kurve (AUC) für die Klassifizierung von Patienten für das ereignisfreie Überleben nach 24 Monaten basierend auf CAPP-Seq. (helle Farben) oder PhasED-Seq. (dunkle Farben) nach 1 Therapiezyklus darstellen. Sowohl die Klassifizierung aller Patienten (n=82, links) als auch die Klassifizierung der Patienten, die eine EMR erreichen (n=63, rechts), sind dargestellt. 18D zeigt Kaplan-Meier-Diagramme, die das ereignisfreie Überleben von 63 Patienten zeigen, die eine EMR erreicht haben, stratifiziert nach ctDNA-Nachweis mit CAPP-Seq. (oben) oder PhasED-Seq. (unten). 18D zeigt ein Wasserfalldiagramm, das die Veränderung der mit CAPP-Seq. gemessenen ctDNA-Werte nach 1 Zyklus der Erstlinientherapie bei Patienten mit DLBCL darstellt. Patienten mit nicht durch CAPP-Seq. nachweisbarer ctDNA sind als „ND“ (Not Detected, „nicht nachgewiesen“) in dunkleren Farben dargestellt. Die Farben der Balken zeigen auch die späteren klinischen Ergebnisse für diese Patienten an. 18F zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben für 33 DLBCL-Patienten mit nicht nachweisbarer ctDNA, gemessen durch CAPP-Seq. nach 1 Zyklus darstellt. 18G zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben von 33 in 18F gezeigten Patienten (durch CAPP-Seq. nicht nachweisbare ctDNA) stratifiziert nach ctDNA-Nachweis durch PhasED-Seq. zum gleichen Zeitpunkt (Zyklus 2, Tag 1) darstellt. 18H zeigt ein Kaplan-Meier-Diagramm, das das ereignisfreie Überleben für 82 Patienten mit DLBCL stratifiziert nach ctDNA bei Zyklus 2, Tag 1, unterteilt in 3 Schichten - Patienten, die keine frühe molekulare Remission erreichen, Patienten mit einer frühen molekularen Remission, die aber immer noch durch PhasED-Seq. und/oder CAPP-Seq. nachweisbare ctDNA haben, und Patienten, die eine stringente molekulare Remission haben (nicht durch PhasED-Seq. und CAPP-Seq. nachweisbare ctDNA;).
    • 19 illustriert eine Anteil von Patienten, bei denen PhasED-Seq. eine niedrigere LOD als die Duplexsequenzierung, die SNV basierend auf PCAWG-Daten (Ganzgenomsequenzierung) verfolgt, erreichen würde, aus denen die Anzahl von SNV und Phasenvarianten (PVs) in verschiedenen Tumorarten quantifiziert wurde.
    • 20 zeigt die bei Lungenkrebs (Adenokarzinom, abgekürzt ,A‘, und Plattenepithelkarzinom, abgekürzt ,S') erzielten verbesserten LODs im Vergleich zur Duplex-Sequenzierung von Ganzgenom-Sequenzierungsdaten.
    • 21 illustriert empirische Daten aus einem Versuch, bei dem WGS an Tumorgewebe durchgeführt wurde und für 5 Patienten mit soliden Tumoren (5 Lungenkarzinome) benutzerdefinierte Panels bestimmt wurden, um die LODs der benutzerdefinierten CAPP-Seq. im Vergleich zu PhasED-Seq. zu untersuchen und zu vergleichen, wobei sich bei 5/5 Patienten eine ~ 10x niedrigere LOD unter Verwendung von PhasED-Seq. ergab.
    • 22A zeigt ein Proof-of-Principle-Beispiel einer Patientenvignette, in der die Verwendung benutzerdefinierter CAPP-Seq. und PhasED-Seq. für die Krankheitsbeobachtung bei Lungenkrebs verglichen wird und den früheren Nachweis eines Rückfalls unter Verwendung von PhasED-Seq. zeigt.
    • 22B zeigt ein Proof-of-Principle-Beispiel für eine Patientenvignette, in der die Verwendung benutzerdefinierter CAPP-Seq. und PhasED-Seq. für den frühen Nachweis von Krankheiten bei Brustkrebs verglichen wird und die den früheren Nachweis der Krankheit mit PhasED-Seq. zeigt.
    • 23A-23B zeigen, dass das hier beschriebene Verfahren (z. B. das in 3E und 3F dargestellte Verfahren) keine barcodevermittelte Fehlerunterdrückung erfordert.
    • 24 illustriert ein Ablaufdiagramm eines Prozesses zur Durchführung einer klinischen Intervention und/oder Behandlung eines Individuums basierend auf dem Nachweis von Nukleinsäuresequenzen eines zirkulierenden Tumors in einem Sequenzierungsergebnis gemäß einer Ausführungsform.
    • 25A-25C zeigen beispielhafte Ablaufdiagramme von Verfahren zum Bestimmen einer Erkrankung eines Subjekts basierend auf einem oder mehreren zellfreien Nukleinsäuremolekülen, die eine Vielzahl von Varianten umfassen.
    • 25D zeigt ein beispielhaftes Ablaufdiagramm eines Verfahrens zur Behandlung einer Erkrankung eines Subjekts, basierend auf einem oder mehreren zellfreien Nukleinsäuremolekülen, die eine Vielzahl von Varianten umfassen.
    • 25E zeigt ein beispielhaftes Ablaufdiagramm eines Verfahrens zur Bestimmung des Verlaufs (z. B. Progression oder Regression) einer Erkrankung eines Subjekts basierend auf einem oder mehreren zellfreien Nukleinsäuremolekülen, die eine Vielzahl von Varianten umfassen.
    • 25F und 25G zeigen beispielhafte Ablaufdiagramme von Verfahren zur Bestimmung der Erkrankung eines Subjekts basierend auf einem oder mehreren zellfreien Nukleinsäuremolekülen, die eine Vielzahl von Varianten umfassen.
    • 26A und 26B illustrieren schematisch verschiedene Fluoreszenzsonden zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle, die eine Vielzahl von Phasenvarianten umfassen.
    • 27 zeigt ein Computersystem, das zur Implementierung der hierin vorgesehenen Verfahren programmiert oder anderweitig konfiguriert ist.
  • DETAILBESCHREIBUNG
  • Obwohl hierin verschiedene Ausführungsformen der Erfindung gezeigt und beschrieben wurden, wird es für den Fachmann offensichtlich sein, dass diese Ausführungsformen nur als Beispiel dienen. Für den Fachmann sind zahlreiche Variationen, Änderungen und Substitutionen möglich, ohne von der Erfindung abzuweichen. Es versteht sich, dass verschiedene Alternativen zu den hierin beschriebenen Ausführungsformen der Erfindung verwendet werden können.
  • Der Begriff „etwa“ oder „ungefähr“ bedeutet im Allgemeinen innerhalb eines akzeptablen Fehlerbereichs für den jeweiligen Wert, der zum Teil davon abhängen kann, wie der Wert gemessen oder bestimmt wird, z. B. von den Einschränkungen des Messsystems. Beispielsweise kann „etwa“ gemäß der gängigen Fachpraxis innerhalb einer oder mehr als einer Standardabweichung bedeuten. Alternativ kann „etwa“ einen Bereich von bis zu 20 %, bis zu 10 %, bis zu 5 % oder bis zu 1 % eines gegebenen Wertes bedeuten. Alternativ, insbesondere in Bezug auf biologische Systeme oder Prozesse, kann der Begriff innerhalb einer Größenordnung, bevorzugt innerhalb des 5-fachen und noch bevorzugter innerhalb des 2-fachen, eines Wertes bedeuten. Wenn in der Anmeldung und den Ansprüchen bestimmte Werte beschrieben werden, kann, sofern nicht anders angegeben, davon ausgegangen werden, dass der Begriff „etwa“ innerhalb eines akzeptablen Fehlerbereichs für den jeweiligen Wert liegend bedeutet.
  • Der Begriff „Phasenvarianten“, „Varianten in Phase“, „PV“ oder „somatische Varianten in Phase“, wie er hierin austauschbar verwendet wird, bezieht sich im Allgemeinen auf zwei oder mehr Mutationen (z. B. SNV oder Indels), die in cis (d. h. auf demselben Strang eines Nukleinsäuremoleküls) innerhalb eines einzigen zellfreien Nukleinsäuremoleküls auftreten. In einigen Fällen kann ein zellfreies Nukleinsäuremolekül ein zellfreies Desoxyribonukleinsäuremolekül (cfDNA-Molekül) sein. In einigen Fällen kann ein cfDNA-Molekül aus einem erkrankten Gewebe, wie etwa einem Tumor, (z. B. ein zirkulierendes Tumor-DNA-(ctDNA-)Molekül) abgeleitet sein.
  • Der Begriff „biologische Probe“ oder „Körperprobe“, wie er hierin austauschbar verwendet wird, bezieht sich im Allgemeinen auf eine von einem Subjekt erlangte Gewebe- oder Flüssigkeitsprobe. Eine biologische Probe kann direkt vom Subjekt erlangt werden. Alternativ kann eine biologische Probe von dem Subjekt abgeleitet werden (z. B. durch Verarbeitung einer ersten biologischen Probe, die von dem Subjekt erlangt wurde). Die biologische Probe kann ein oder mehrere Nukleinsäuremoleküle sein oder enthalten, wie beispielsweise DNA- oder Ribonukleinsäure-(RNA-)Moleküle. Die biologische Probe kann von einem beliebigen Organ, Gewebe oder einer biologischen Flüssigkeit abgeleitet sein. Eine biologische Probe kann zum Beispiel eine Körperflüssigkeit oder eine feste Gewebeprobe umfassen. Ein Beispiel für eine solide Gewebeprobe ist eine Tumorprobe, z. B. aus einer Biopsie eines soliden Tumors. Nicht einschränkende Beispiele für Körperflüssigkeiten beinhalten Blut, Serum, Plasma, Tumorzellen, Speichel, Urin, Liquor, Lymphflüssigkeit, Prostataflüssigkeit, Samenflüssigkeit, Milch, Sputum, Stuhl, Tränen und Derivate davon. In einigen Fällen können ein oder mehrere zellfreie Nukleinsäuremoleküle, wie hierin offenbart, aus einer biologischen Probe abgeleitet sein.
  • Der Begriff „Subjekt“, wie er hierin verwendet wird, bezieht sich allgemein auf beliebige Tiere, Säugetiere oder Menschen. Ein Subjekt kann eine oder mehrere Erkrankungen haben, potenziell haben oder im Verdacht stehen, eine oder mehrere Erkrankungen zu haben, wie beispielsweise eine Erkrankung. In einigen Fällen kann eine Erkrankung des Subjekts Krebs, ein oder mehrere mit Krebs assoziierte(s) Symptom(e) oder asymptomatisch in Bezug auf Krebs oder nicht diagnostiziert (z. B. nicht mit Krebs diagnostiziert) sein. In einigen Fällen kann das Subjekt an Krebs erkrankt sein, das Subjekt kann ein oder mehrere mit Krebs assoziierte Symptome aufweisen, das Subjekt kann frei von mit Krebs assoziierten Symptomen sein, oder das Subjekt kann nicht mit Krebs diagnostiziert worden sein. In einigen Beispielen ist das Subjekt ein Mensch.
  • Der Begriff „zellfreie DNA“ oder „cfDNA“, wie er hierin austauschbar verwendet wird, bezieht sich im Allgemeinen auf DNA-Fragmente, die frei im Blutstrom eines Subjekts zirkulieren. Zellfreie DNA-Fragmente können einen dinukleosomalen Schutz (z. B. eine Fragmentgröße von wenigstens 240 Basenpaaren („bp““)) aufweisen. Diese cfDNA-Fragmente mit dinukleosomalem Schutz wurden wahrscheinlich nicht zwischen dem Nukleosom geschnitten, was zu einer längeren Fragmentlänge (z. B. mit einer typischen Größenverteilung zentriert um 334 bp) führt. Zellfreie DNA-Fragmente können einen mononukleosomalen Schutz (z .B. eine Fragmentgröße von weniger als 240 Basenpaaren („“bp“)) aufweisen. Diese cfDNA-Fragmente mit mononukleosomalem Schutz wurden wahrscheinlich zwischen dem Nukleosom geschnitten, was zu einer kürzeren Fragmentlänge (z. B. mit einer typischen Größenverteilung zentriert um 167 bp) führt.
  • Der Begriff „Sequenzierungsdaten“, wie er hierin verwendet wird, bezieht sich allgemein auf „Rohsequenzlesungen“ und/oder „Konsensussequenzen“ von Nukleinsäuren, wie beispielsweise zellfreie Nukleinsäuren oder Derivate davon. Rohsequenzlesungen sind die Ausgabe eines DNA-Sequenzers und enthalten in der Regel redundante Sequenzen desselben Ausgangsmoleküls, zum Beispiel nach Amplifikation. „Konsensussequenzen“ sind aus redundanten Sequenzen eines Ausgangsmoleküls abgeleitete Sequenzen, die die Sequenz des ursprünglichen Ausgangsmoleküls darstellen sollen. Konsensussequenzen können durch Abstimmung (wobei jedes Mehrheitsnukleotid, z. B. das am häufigsten beobachtete Nukleotid an einer gegebenen Basenposition unter den Sequenzen das Konsensusnukleotid ist) oder durch andere Ansätze wie etwa den Vergleich mit einem Referenzgenom erzeugt werden. In einigen Fällen können Konsensussequenzen durch Markierung der ursprünglichen Ausgangsmoleküle mit eindeutigen oder nicht eindeutigen molekularen Markierungen erzeugt werden, die eine Verfolgung der Nachfolgesequenzen (z. B. nach Amplifikation) durch Verfolgung der Markierung und/oder Verwendung interner Sequenzleseinformationen ermöglichen.
  • Der Begriff „Referenzgenomsequenz“, wie er hierin verwendet wird, bezieht sich allgemein auf eine Nukleotidsequenz, mit der die Nukleotidsequenzen eines Subjekts verglichen werden.
  • Der Begriff „Genombereich“, wie er hierin verwendet wird, bezieht sich allgemein auf einen beliebigen Bereich (z. B. einen Bereich von Basenpaarpositionen) eines Genoms, z. B. eines gesamten Genoms, eines Chromosoms, eines Gens oder eines Exons. Ein Genombereich kann ein zusammenhängender oder ein nicht zusammenhängender Bereich sein. Ein „genetischer Locus“ (oder „Locus“) kann ein Teil oder die Gesamtheit eines Genombereichs (z. B. eines Gens, eines Teils eines Gens oder eines einzelnen Nukleotids eines Gens) sein.
  • Der Begriff „Wahrscheinlichkeit“, wie er hierin verwendet wird, bezieht sich allgemein auf eine Wahrscheinlichkeit, eine relative Wahrscheinlichkeit, ein Vorhandensein oder ein Fehlen oder einen Grad.
  • Der Begriff „Flüssigbiopsie“, wie er hierin verwendet wird, bezieht sich allgemein auf einen nicht-invasiven oder minimal-invasiven Labortest oder ein Assay (z. B. einer biologischen Probe oder zellfreier Nukleinsäuren). Die „Flüssigbiopsie“-Assays können Nachweise oder Messungen (z. B. geringere Allelhäufigkeiten, Genexpression oder Proteinexpression) von einem oder mehreren Markergenen melden, die mit einer Erkrankung eines Subjekts (z. B. Krebs- oder Tumor-assoziierte Markergene) in Verbindung stehen.
  • A. Einführung
  • Modifikationen (z. B. Mutationen) der genomischen DNA können sich in der Entstehung und/oder dem Fortschreiten einer oder mehrerer Erkrankungen (z. B. einer Erkrankung, wie Krebs oder Tumor) eines Subjekts manifestieren. Die vorliegende Offenbarung sieht Verfahren und Systeme zur Analyse zellfreier Nukleinsäuremoleküle, wie cfDNA, von einem Subjekts zur Bestimmung des Vorhandenseins oder Nichtvorhandenseins einer Erkrankung des Subjekts, der Prognose einer diagnostizierten Erkrankung des Subjekts, des Fortschreitens der Erkrankung des Subjekts im Laufe der Zeit, der therapeutischen Behandlung einer diagnostizierten Erkrankung des Subjekts oder des vorhergesagten Behandlungsergebnisses für eine Erkrankung des Subjekts vor.
  • Die Analyse zellfreier Nukleinsäuren, wie etwa cfDNA, wurde mit breiten Anwendungsmöglichkeiten, wie z. B. für pränatale Tests, Organtransplantation, Infektionskrankheiten und Onkologie, entwickelt. Im Zusammenhang mit dem Nachweis oder der Überwachung einer Krankheit eines Subjekts, wie z. B. Krebs, kann die zirkulierende Tumor-DNA (ctDNA) bei zahlreichen Krebsarten ein empfindlicher und spezifischer Biomarker sein. In einigen Fällen kann ctDNA zum Nachweis einer minimalen Restkrankheit (MRD) oder der Tumorlast nach einer Behandlung, wie beispielsweise einer Chemotherapie oder einer chirurgischen Resektion von soliden Tumoren, verwendet werden. Die Nachweisgrenze (Limit of Detection, LOD) für die ctDNA-Analyse kann jedoch durch eine Reihe von Faktoren eingeschränkt werden, darunter (i) geringe Ausgangs-DNA-Mengen aus einer typischen Blutabnahme und (ii) Hintergrundfehlerraten bei der Sequenzierung.
  • In einigen Fällen kann der auf ctDNA basierende Krebsnachweis durch die Verfolgung multipler somatischer Mutationen mit fehlerunterdrückter Sequenzierung verbessert werden, z. B. mit einer LOD von etwa 2 Teilen in 100.000 aus dem cfDNA-Input bei Verwendung von handelsüblichen Panels oder personalisierten Assays. In einigen Fällen kann die derzeitige LOD der ctDNA von Interesse jedoch unzureichend für den universellen Nachweis von MRD bei Patienten sein, bei denen ein Rückfall oder ein Fortschreiten der Krankheit droht. Ein Beispiel für einen solchen ,Nachweisverlust` ist das diffuse großzellige B-Zell-Lymphom (DLBCL). Bei DLBCL kann der vorläufige Nachweis von ctDNA nach nur zwei Zyklen kurativer Therapie eine starke molekulare Remission (Major Molecular Response, MMR) darstellen und ein starker prognostischer Marker für das endgültige klinische Ergebnis sein. Trotzdem ist bei fast einem Drittel der Patienten, bei denen die Krankheit letztlich fortschreitet, die ctDNA zu diesem Zwischenzeitpunkt mit den verfügbaren Techniken (z. B. Personalisierte Krebsprofilierung durch Tiefensequenzierung ,(Cancer Personalized Profiling by Deep Sequencing, CAPP-Seq.)) nicht nachweisbar, was „falsch-negative“ Messungen bedeutet. Derart hohe falsch-negative Raten wurden bei DLBCL-Patienten auch bei alternativen Verfahren wie der Überwachung von ctDNA durch Immunglobulin-Gen-Umordnungen beobachtet. Daher besteht ein Bedarf an verbesserten Verfahren zum ctDNA-basierten Krebsnachweis mit höherer Empfindlichkeit.
  • Somatische Varianten, die auf beiden komplementären Strängen der Ausgangs-DNA-Duplexe nachgewiesen werden, können zur Senkung der LOD des ctDNA-Nachweises verwendet werden, wodurch sich die Sensitivität des ctDNA-Nachweises vorteilhaft erhöht. Eine solche Duplex-Sequenzierung‘ kann das Hintergrundfehlerprofil reduzieren, da für den Nachweis einer Einzelnukleotidvariante (SNV) zwei konkordante Ereignisse erforderlich sind. Der Ansatz der Duplex-Sequenzierung allein kann jedoch durch die ineffiziente Rückgewinnung von DNA-Duplexen eingeschränkt sein, da die Rückgewinnung beider Originalstränge nur bei einer Minderheit aller rückerlangten Moleküle auftreten kann. Daher kann die Duplex-Sequenzierung für den realen ctDNA-Nachweis mit einer begrenzten Menge an Ausgangsproben suboptimal und ineffizient sein, wobei die Ausgangs-DNA aus praktischen Blutvolumina (z. B. zwischen etwa 4.000 und etwa 8.000 Genomen pro standardmäßigem 10-Milliliter-Blutabnahmeröhrchen) begrenzt ist und eine maximale Rückgewinnung der Genome unerlässlich ist.
  • Daher besteht nach wie vor ein erheblicher ungedeckter Bedarf für den Nachweis und die Analyse von ctDNA mit niedriger LOD (z. B. mit hoher Sensitivität), um beispielsweise das Vorhandensein oder Nichtvorhandensein einer Krankheit bei einem Subjekt, die Prognose der Krankheit, die Behandlung der Krankheit und/oder das voraussichtliche Ergebnis der Behandlung zu bestimmen.
  • B. Verfahren und Systeme zur Bestimmung oder Überwachung einer Erkrankung
  • Die vorliegende Offenbarung beschreibt Verfahren und Systeme zum Nachweis und zur Analyse zellfreier Nukleinsäuren mit einer Vielzahl von Phasenvarianten als Merkmal einer Erkrankung eines Subjekts. In einigen Aspekten können die zellfreien Nukleinsäuremoleküle cfDNA-Moleküle, wie beispielsweise ctDNA-Moleküle, umfassen. Die hierin offenbaren Verfahren und Systeme können von einer Vielzahl zellfreier Nukleinsäuremoleküle des Subjekts abgeleitete Sequenzierungsdaten verwenden, um eine Teilmenge der Vielzahl zellfreier Nukleinsäuremoleküle mit der Vielzahl von Phasenvarianten zu identifizieren und dadurch die Erkrankung des Subjekts zu bestimmen. Die hierin offenbarten Verfahren und Systeme können eine solche Untergruppe der Vielzahl zellfreier Nukleinsäuremoleküle, die die Vielzahl von Phasenvarianten aufweisen, direkt nachweisen und in einigen Fällen herunterziehen (oder erfassen), um so die Erkrankung des Subjekts mit oder ohne Sequenzierung zu bestimmen. Die hierin offenbarten Verfahren und Systeme können die Hintergrundfehlerrate reduzieren, die häufig bei dem Nachweis und der Analyse zellfreier Nukleinsäuremoleküle, wie cfDNA, auftreten.
  • In einigen Aspekten sind Verfahren und Systeme für die zellfreie Nukleinsäure-Sequenzierung und den Nachweis von Krebs vorgesehen. In einigen Ausführungsformen können zellfreie Nukleinsäuren (z. B. cfDNA oder cfRNA) aus einer Flüssigbiopsie einer Person extrahiert und für die Sequenzierung vorbereitet werden. Die Sequenzierungsergebnisse der zellfreien Nukleinsäuren können zum Nachweis somatischer Varianten in Phase (d. h. Phasenvarianten, wie hierin offenbart) als Hinweis auf zirkulierende Nukleinsäure-Sequenzen (ctDNA oder ctRNA) (d. h. Sequenzen, die von Nukleinsäuren einer Krebszelle abgeleitet sind oder aus diesen stammen) analysiert werden. Dementsprechend kann in einigen Fällen bei der Person Krebs durch Entnahme einer Flüssigbiopsie der Person und Sequenzierung der aus dieser Flüssigbiopsie abgeleiteten zellfreien Nukleinsäuren zum Nachweis zirkulierender Tumor-Nukleinsäuresequenzen nachgewiesen werden, und das Vorhandensein zirkulierender Tumor-Nukleinsäuresequenzen kann indikativ sein, dass die Person einen Krebs (z. B. eine bestimmte Art von Krebs) hat. In einigen Fällen kann basierend auf dem Nachweis des Krebses ein klinischer Eingriff und/oder eine Behandlung für die Person bestimmt und/oder durchgeführt werden.
  • Wie hier offenbart, kann das Vorhandensein somatischer Phasenvarianten ein starkes Indiz dafür sein, dass die diese Phasenvarianten enthaltenden Nukleinsäuren aus einer Körperprobe mit einer Erkrankung, wie einer Krebszelle, stammen (oder alternativ, dass die Nukleinsäuren aus einer Körperprobe stammen, die von einem Subjekt mit einer Erkrankung, wie Krebs, erlangt oder abgeleitet wurde). Der Nachweis von somatischen Phasenvarianten kann das Signal-Rausch-Verhältnis von Verfahren zum Nachweis zellfreier Nukleinsäuren verbessern (z. B. durch die Reduzierung oder Eliminierung von störenden „Rauschsignalen“), da es unwahrscheinlich ist, dass Phasenmutationen innerhalb eines kleinen genetischen Fensters auftreten, das ungefähr der Größe eines typischen zellfreien Nukleinsäuremoleküls (z. B. etwa 170 bp oder weniger) entsprich.
  • In einigen Aspekten kann eine Anzahl von Genombereichen als Hotspots für den Nachweis von Phasenvarianten, insbesondere bei verschiedenen Krebsarten, z.B. Lymphomen, verwendet werden. In einigen Fällen können Enzyme (z. B. AID, Apobec3a) die DNA in bestimmten Genen und an bestimmten Stellen stereotyp mutieren, was zur Entwicklung bestimmter Krebsarten führt. Dementsprechend können aus solchen Hotspot-Genombereichen abgeleitete zellfreie Nukleinsäuren erfasst oder gezielt (z. B. mit oder ohne Tiefensequenzierung) für den Krebsnachweis und/oder die Überwachung eingesetzt werden. Alternativ kann die Erfassungs- oder gezielte Sequenzierung in Bereichen durchgeführt werden, in denen zuvor Phasenvarianten aus einer Krebsquelle (z. B. einem Tumor) einer bestimmten Person nachgewiesen wurden, um Krebs bei dieser Person nachzuweisen.
  • In einigen Fällen kann die Erfassungssequenzierung zellfreier Nukleinsäuren als Screening-Diagnose durchgeführt werden. In einigen Fällen kann eine Screening-Diagnose zum Nachweis zirkulierender Tumor-Nukleinsäuren für Krebsarten entwickelt und eingesetzt werden, die stereotypische Bereiche von Phasenvarianten aufweisen. In einigen Fällen wird die Erfassungssequenzierung zellfreier Nukleinsäuren als Diagnostikum zum Nachweis von MRD oder Tumorlast durchgeführt, um zu bestimmen, ob während oder nach der Behandlung eine bestimmte Krankheit vorliegt. In einigen Fällen kann die Erfassungssequenzierung zellfreier Nukleinsäuren als Diagnostikum zur Bestimmung des Verlaufs (z. B. Progression oder Regression) einer Behandlung durchgeführt werden.
  • In einigen Aspekten können die Ergebnisse der zellfreien Nukleinsäure-Sequenzierung zum Nachweis analysiert werden, ob phasensomatische Einzelnukleotidvarianten (SNV) oder anderer Mutationen oder Varianten (z. B. Indels) innerhalb der zellfreien Nukleinsäureprobe existieren. In einigen Fällen kann das Vorhandensein bestimmter somatischer SNV oder anderer Varianten indikativ für zirkulierende Tumor-Nukleinsäure-Sequenzen und damit indikativ für einen im Subjekt vorhandenen Tumor sein. In einigen Fällen können mindestens zwei Phasenvarianten in einem zellfreien Nukleinsäuremolekül nachgewiesen werden. In einigen Fällen können mindestens drei Phasenvarianten in einem zellfreien Nukleinsäuremolekül nachgewiesen werden. In einigen Fällen können mindestens vier Phasenvarianten in einem zellfreien Nukleinsäuremolekül nachgewiesen werden. In einigen Fällen können mindestens fünf oder mehr Phasenvarianten in einem zellfreien Nukleinsäuremolekül nachgewiesen werden. In einigen Fällen gilt: Je mehr Phasenvarianten auf einem zellfreien Nukleinsäuremolekül nachgewiesen werden, desto größer ist die Wahrscheinlichkeit, dass das zellfreie Nukleinsäuremolekül von Krebs abgeleitet ist, im Gegensatz zum Nachweis einer harmlosen Sequenz somatischer Varianten, die durch die molekulare Aufbereitung der Sequenzbibliothek oder zufällige biologische Fehler entstehen. Dementsprechend kann die Wahrscheinlichkeit eines falsch-positiven Nachweises mit dem Nachweis von mehr Phasenvarianten innerhalb eines Moleküls sinken (wodurch z. B. die Spezifität des Nachweises erhöht wird).
  • In einigen Aspekten kann ein Ergebnis der zellfreien Nukleinsäure-Sequenzierung zum Nachweis analysiert werden, ob eine Insertion oder Deletion einer oder mehrerer Nukleobasen (d. h. Indel) in der zellfreien Nukleinsäureprobe, z. B. relativ zu einer Referenzgenomsequenz, vorliegt. Ohne an die Theorie gebunden sein zu wollen, kann das Vorhandensein von Indels in einem zellfreien Nukleinsäuremolekül (z. B. cfDNA) in einigen Fällen indikativ für eine Erkrankung eines Subjekts, z. B. eine Erkrankung wie Krebs, sein. In einigen Fällen kann eine genetische Variation als Ergebnis eines Indels als eine Variante oder Mutation behandelt werden, und somit können zwei Indels als zwei Phasenvarianten behandelt werden, wie hierin offenbart. In einigen Beispielen können innerhalb eines zellfreien Nukleinsäuremoleküls eine erste genetische Variation aus einer ersten Indel (eine erste Phasenvariante) und eine zweite genetische Variation aus einer zweiten Indel (eine zweite Phasenvariante) durch wenigstens 1 Nukleotid voneinander getrennt sein.
  • Innerhalb eines einzelnen zellfreien Nukleinsäuremoleküls (z. B. eines einzelnen cfDNA-Moleküls), wie hierin offenbart, kann eine erste Phasenvariante eine SNV und eine zweite Phasenvariante ein Teil eines anderen kleinen Nukleotidpolymorphismus sein, z. B. eine andere SNV oder ein Teil einer Multi-Nukleotid-Variante (MNV). Eine Multi-Nukleotid-Variante kann ein Cluster aus zwei oder mehr (z. B. mindestens 2, 3, 4, 5 oder mehr) benachbarten Varianten sein, die innerhalb desselben Strangs des Nukleinsäuremoleküls existieren. In einigen Fällen können die erste Phasenvariante und die zweite Phasenvariante Teile derselben MNV innerhalb des einzelnen zellfreien Nukleinsäuremoleküls sein. In einigen Fällen können die erste Phasenvariante und die zweite Phasenvariante von zwei verschiedenen MNV innerhalb des einzelnen zellfreien Nukleinsäuremoleküls stammen.
  • In einigen Aspekten kann ein statistisches Verfahren zur Berechnung der Wahrscheinlichkeit verwendet werden, dass nachgewiesene Phasenvarianten von einem Krebs stammen und nicht zufällig oder künstlich (z. B. aufgrund von Probenvorbereitungs- oder Sequenzierungsfehlern) sind. In einigen Fällen kann ein Monte-Carlo-Probennahmeverfahren zur Bestimmung der Wahrscheinlichkeit verwendet werden, dass nachgewiesene Phasenvarianten von einem Krebs stammen und nicht zufällig oder künstlich sind.
  • Aspekte der vorliegenden Offenbarung ermöglichen die Identifizierung oder den Nachweis zellfreier Nukleinsäuren (z. B. cfDNA-Moleküle) mit einer Vielzahl von Phasenvarianten, z. B. aus einer Flüssigbiopsie eines Subjekts. In einigen Fällen können eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten direkt nebeneinander liegen (z. B. benachbarte SNV). In einigen Fällen können eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt sein. Der Abstand zwischen der ersten Phasenvariante und der zweiten Phasenvariante kann durch die Länge des zellfreien Nukleinsäuremoleküls begrenzt sein.
  • Innerhalb eines einzelnen zellfreien Nukleinsäuremoleküls (z. B. eines einzelnen cfDNA-Moleküls), wie hierin offenbart, können eine erste Phasenvariante und eine zweite Phasenvariante durch wenigstens oder bis zu etwa 1 Nukleotid, wenigstens oder bis zu etwa 2 Nukleotide, wenigstens oder bis zu etwa 3 Nukleotide, wenigstens oder bis zu etwa 4 Nukleotide, wenigstens oder bis zu etwa 5 Nukleotide, wenigstens oder bis zu etwa 6 Nukleotide, wenigstens oder bis zu etwa 7 Nukleotide, wenigstens oder bis zu etwa 8 Nukleotide, wenigstens oder bis zu etwa 9 Nukleotide, wenigstens oder bis zu etwa 10 Nukleotide, wenigstens oder bis zu etwa 11 Nukleotide, wenigstens oder bis zu etwa 12 Nukleotide, wenigstens oder bis zu etwa 13 Nukleotide, wenigstens oder bis zu etwa 14 Nukleotide, wenigstens oder bis zu etwa 15 Nukleotide, wenigstens oder bis zu etwa 20 Nukleotide, wenigstens oder bis zu etwa 25 Nukleotide, wenigstens oder bis zu etwa 30 Nukleotide, wenigstens oder bis zu etwa 35 Nukleotide, wenigstens oder bis zu etwa 40 Nukleotide, wenigstens oder bis zu etwa 45 Nukleotide, wenigstens oder bis zu etwa 50 Nukleotide, wenigstens oder bis zu etwa 60 Nukleotide, wenigstens oder bis zu etwa 70 Nukleotide, wenigstens oder bis zu etwa 80 Nukleotide, wenigstens oder bis zu etwa 90 Nukleotide, wenigstens oder bis zu etwa 100 Nukleotide, wenigstens oder bis zu etwa 110 Nukleotide, wenigstens oder bis zu etwa 120 Nukleotide, wenigstens oder bis zu etwa 130 Nukleotide, wenigstens oder bis zu etwa 140 Nukleotide, wenigstens oder bis zu etwa 150 Nukleotide, wenigstens oder bis zu etwa 160 Nukleotide, wenigstens oder bis zu etwa 170 Nukleotide, oder wenigstens oder bis zu etwa 180 Nukleotide voneinander getrennt sein. Alternativ oder zusätzlich dazu können oder müssen innerhalb eines einzigen zellfreien Nukleinsäuremoleküls eine erste Phasenvariante und eine zweite Phasenvariante nicht durch ein oder mehrere Nukleotide getrennt sein und können somit direkt nebeneinander liegen.
  • Ein einzelnes zellfreies Nukleinsäuremolekül (z. B, ein einzelnes cfDNA-Molekül), wie hierin offenbart, kann wenigstens oder bis zu etwa 2 Phasenvarianten, wenigstens oder bis zu etwa 3 Phasenvarianten, wenigstens oder bis zu etwa 4 Phasenvarianten, wenigstens oder bis zu etwa 5 Phasenvarianten, wenigstens oder bis zu etwa 6 Phasenvarianten, wenigstens oder bis zu etwa 7 Phasenvarianten, wenigstens oder bis zu etwa 8 Phasenvarianten, wenigstens oder bis zu etwa 9 Phasenvarianten, wenigstens oder bis zu etwa 10 Phasenvarianten, wenigstens oder bis zu etwa 12 Phasenvarianten, wenigstens oder bis zu etwa 12 Phasenvarianten, wenigstens oder bis zu etwa 13 Phasenvarianten, wenigstens oder bis zu etwa 14 Phasenvarianten, wenigstens oder bis zu etwa 15 Phasenvarianten, wenigstens oder bis zu etwa 20 Phasenvarianten, oder wenigstens oder bis zu etwa 25 Phasenvarianten innerhalb desselben Moleküls umfassen.
  • Aus einer Vielzahl von (z. B. aus einer Flüssigbiopsie eines Subjekts) erlangten zellfreien Nukleinsäuremolekülen können zwei oder mehr (z. B. 10 oder mehr, 1.000 oder mehr, 10.000 oder mehr) zellfreie Nukleinsäuremoleküle als im Durchschnitt wenigstens oder bis zu etwa 2 Phasenvarianten, wenigstens oder bis zu etwa 3 Phasenvarianten, wenigstens oder bis zu etwa 4 Phasenvarianten, wenigstens oder bis zu etwa 5 Phasenvarianten, wenigstens oder bis zu etwa 6 Phasenvarianten, wenigstens oder bis zu etwa 7 Phasenvarianten, wenigstens oder bis zu etwa 8 Phasenvarianten, wenigstens oder bis zu etwa 9 Phasenvarianten, wenigsten oder bis zu etwa 10 Phasenvarianten, wenigstens oder bis zu etwa 12 Phasenvarianten, wenigstens oder bis zu etwa 12 Phasenvarianten, wenigstens oder bis zu etwa 13 Phasenvarianten, wenigstens oder bis zu etwa 14 Phasenvarianten, wenigstens oder bis zu etwa 15 Phasenvarianten, wenigstens oder bis zu etwa 20 Phasenvarianten oder wenigstens oder bis zu etwa 25 Phasenvarianten pro zellfreiem Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten identifiziert wurde, aufweisend identifiziert werden.
  • In einigen Fällen kann eine Vielzahl zellfreier Nukleinsäuremoleküle (z. B. cfDNA-Moleküle) aus einer biologischen Probe eines Subjekts (z. B. eines soliden Tumors oder einer Flüssigbiopsie) erlangt werden. Aus der Vielzahl zellfreier Nukleinsäuremoleküle können wenigstens oder bis zu 1, wenigstens oder bis zu 2, wenigstens oder bis zu 3, wenigstens oder bis zu 4, wenigstens oder bis zu 5, wenigstens oder bis zu 6, wenigstens oder bis zu 7, wenigstens oder bis zu 8, wenigstens oder bis zu 9, wenigstens oder bis zu 10, wenigstens oder bis zu 15, wenigstens oder bis zu 20, wenigstens oder bis zu 25, wenigstens oder bis zu 30, wenigstens oder bis zu 35, wenigstens oder bis zu 40, wenigstens oder bis zu 45, wenigstens oder bis zu 50, wenigstens oder bis zu 60, wenigstens oder bis zu 70, wenigstens oder bis zu 80, wenigstens oder bis zu 90, wenigstens oder bis zu 100, wenigstens oder bis zu 150, wenigstens oder bis zu 200, wenigstens oder bis zu 300, wenigstens oder bis zu 400, wenigstens oder bis zu 500, wenigstens oder bis zu 600, wenigstens oder bis zu 700, wenigstens oder bis zu 800, wenigstens oder bis zu 900, wenigstens oder bis zu 1.000, wenigstens oder bis zu 5.000, wenigstens oder bis zu 10.000, wenigstens oder bis zu 50.000 oder wenigstens oder bis zu 100.000 zellfreie Nukleinsäuremoleküle identifiziert werden, sodass jedes identifizierte zellfreie Nukleinsäuremolekül die Vielzahl von Phasenvarianten umfasst, wie hierin offenbart.
  • In einigen Fällen kann eine Vielzahl zellfreier Nukleinsäuremoleküle (z. B. cfDNA-Moleküle) aus einer biologischen Probe eines Subjekts (z. B. eines soliden Tumors oder einer Flüssigbiopsie) erlangt werden. Aus der Vielzahl zellfreier Nukleinsäuremoleküle können wenigstens oder bis zu 1, wenigstens oder bis zu 2, wenigstens oder bis zu 3, wenigstens oder bis zu 4, wenigstens oder bis zu 5, wenigstens oder bis zu 6, wenigstens oder bis zu 7, wenigstens oder bis zu 8, wenigstens oder bis zu 9, wenigstens oder bis zu 10, wenigstens oder bis zu 15, wenigstens oder bis zu 20, wenigstens oder bis zu 25, wenigstens oder bis zu 30, wenigstens oder bis zu 35, wenigstens oder bis zu 40, wenigstens oder bis zu 45, wenigstens oder bis zu 50, wenigstens oder bis zu 60, wenigstens oder bis zu 70, wenigstens oder bis zu 80, wenigstens oder bis zu 90, wenigstens oder bis zu 100, wenigstens oder bis zu 150, wenigstens oder bis zu 200, wenigstens oder bis zu 300, wenigstens oder bis zu 400, wenigstens oder bis zu 500, wenigstens oder bis zu 600, wenigstens oder bis zu 700, wenigstens oder bis zu 800, wenigstens oder bis zu 900 oder wenigstens oder bis zu 1.000 zellfreie Nukleinsäuremoleküle aus einem Ziel-Genombereich (z. B. einem genomischen Ziellocus) identifiziert werden, sodass jedes identifizierte zellfreie Nukleinsäuremolekül die Vielzahl von Phasenvarianten umfasst, wie hierin offenbart.
  • 1A und 1E illustrieren schematisch Beispiele für (i) ein cfDNA-Molekül mit einer SNV und (ii) ein anderes cfDNA-Molekül mit einer Vielzahl von Phasenvarianten. Jede in der cfDNA identifizierte Variante kann auf das Vorhandensein einer weiteren genetischen Mutation in der Zelle hinweisen, aus der die cfNDA stammt. In alternativen Ausführungsformen kann es sich bei einer oder mehreren der Phasenvarianten um eine Insertion oder Deletion (Indel) anstelle einer SNV handeln.
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Bestimmung einer Erkrankung eines Subjekt vor, wie dargestellt im Ablaufdiagramm 2510 in 25A. Das Verfahren kann umfassen: (a) Gewinnung von Sequenzierungsdaten, die von einer Vielzahl von von dem Subjekt erlangten oder abgeleiteten zellfreien Nukleinsäuremolekülen abgeleitet sind, durch ein Computersystem (Prozess 2512). Das Verfahren kann ferner (b) die Verarbeitung der Sequenzierungsdaten durch das Computersystem zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle umfassen, wobei jedes der einen oder mehreren identifizierten zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst (Verfahren 2514). In einigen Fällen kann wenigstens ein Teil der ein oder mehreren zellfreien Nukleinsäuremoleküle eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten umfassen, die durch wenigstens ein Nukleotid getrennt sind, wie hierin offenbart. Das Verfahren kann optional (c) die Analyse wenigstens eines Teils der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle durch das Computersystem zur Bestimmung der Erkrankung des Subjekts umfassen (Prozess 2516).
  • In einigen Fällen können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 %, wenigstens oder bis zu etwa 50 %, wenigstens oder bis zu etwa 60 %, wenigstens oder bis zu etwa 70 %, wenigstens oder bis zu etwa 80 %, wenigstens oder bis zu etwa 90 %, wenigstens oder bis zu etwa 95 %, wenigstens oder bis zu etwa 99 % oder etwa 100 % des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten umfassen, die durch wenigstens ein Nukleotid getrennt sind, wie hierin offenbart. In einigen Beispielen kann eine Vielzahl von Phasenvarianten innerhalb eines einzelnen cfDNA-Moleküls (i) eine erste Vielzahl von Phasenvarianten, die durch wenigstens ein Nukleotid voneinander getrennt sind, und (ii) eine zweite Vielzahl von Phasenvarianten, die nebeneinander liegen (z. B. zwei Phasenvarianten innerhalb einer MNV), umfassen. In einigen Beispielen kann eine Vielzahl von Phasenvarianten innerhalb eines einzelnen cfDNA-Moleküls aus Phasenvarianten bestehen, die durch wenigstens ein Nukleotid voneinander getrennt sind.
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Bestimmung einer Erkrankung eines Subjekts vor, wie dargestellt im Ablaufdiagramm 2520 in 25B. Das Verfahren kann umfassen: (a) Gewinnung von Sequenzierungsdaten, die von einer Vielzahl von von einem Subjekt erlangten oder abgeleiteten zellfreien Nukleinsäuremolekülen abgeleitet sind, durch ein Computersystem (Prozess 2522). Das Verfahren kann ferner (b) die Verarbeitung der Sequenzierungsdaten durch das Computersystem zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle umfassen, wobei jedes der einen oder mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst (Verfahren 2524). In einigen Fällen kann eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt sein, wie hierin offenbart. Das Verfahren kann optional (c) die Analyse wenigstens eines Teils der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle durch das Computersystem zur Bestimmung der Erkrankung des Subjekts umfassen (Prozess 2526).
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Bestimmung einer Erkrankung eines Subjekts vor, wie im Ablaufdiagramm 2530 in 25C dargestellt. Das Verfahren kann (a) Gewinnung von Sequenzierungsdaten, die von einer Vielzahl von von dem Subjekt erlangten oder abgeleiteten zellfreien Nukleinsäuremolekülen abgeleitet sind, durch ein Computersystem umfassen (Prozess 2532). Das Verfahren kann ferner (b) die Verarbeitung der Sequenzierungsdaten zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle mit einer LOD von weniger als etwa 1 aus 50.000 Beobachtungen (oder zellfreien Nukleinsäuremolekülen) aus den Sequenzierungsdaten umfassen (Prozess 2534). In einigen Fällen umfasst jedes der ein oder mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz. Das Verfahren kann optional (c) die Analyse wenigstens eines Teils der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle zur Bestimmung der Erkrankung des Subjekts umfassen (Prozess 2536).
  • In einigen Fällen kann die LOD des Vorgangs der Identifizierung des einen oder der mehreren zellfreien Nukleinsäuremoleküle, wie hierin offenbart, weniger als etwa 1 aus 60.000, weniger als 1 aus 70.000, weniger als 10 aus 80.000, weniger als 1 aus 90.000, weniger als 1 aus 100.000, weniger als 1 aus 150.000, weniger als 1 aus 200.000, weniger als 1 aus 300.000, weniger als 1 aus 400.000, weniger als 1 aus 500.000, weniger als 1 aus 600.000, weniger als 1 aus 700.000, weniger als 1 aus 800.000, weniger als 1 aus 900.000, weniger als 1 aus 1.000.000, weniger als 1 aus 1.000.000, weniger als 1 aus 1.100.000, weniger als 1 aus 1.200.000, weniger als 1 aus 1.300.000, weniger als 1 aus 1.400.000, weniger als 1 aus 1.500.000 oder weniger als 1 aus 2.000.000 Beobachtungen aus den Sequenzierungsdaten betragen.
  • In einigen Fällen kann wenigstens ein zellfreies Nukleinsäuremolekül der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten umfassen, die durch wenigstens ein Nukleotid getrennt sind, wie hierin offenbart.
  • In einigen Fällen können eine oder mehrere der Vorgänge (a) bis (c) des gegenständlichen Verfahrens von einem Computersystem durchgeführt werden. In einem Beispiel können alle Vorgänge (a) bis (c) des gegenständlichen Verfahrens durch das Computersystem ausgeführt werden.
  • Die Sequenzierungsdaten, wie sie hierin offenbart sind, können aus einem oder mehreren Sequenzierungsverfahren erlangt werden. Ein Sequenzierverfahren kann ein First-Generation-Sequenzierverfahren (z. B. Maxam-Gilbert-Sequenzierung, Sanger-Sequenzierung) sein. Ein Sequenzierungsverfahren kann ein Hochdurchsatz-Sequenzierungsverfahren sein, wie etwa die Next-Generation-Sequenzierung (NGS) (z. B. Sequenzierung durch Synthese). Ein Hochdurchsatz-Sequenzierungsverfahren kann gleichzeitig (oder im Wesentlichen gleichzeitig) wenigstens etwa 10.000, wenigstens etwa 100.000, wenigstens etwa 1 Million, wenigstens etwa 10 Millionen, wenigstens etwa 100 Millionen, wenigstens etwa 1 Milliarde oder mehr Polynukleotidmoleküle (z. B. zellfreie Nukleinsäuremoleküle oder Derivate davon) sequenzieren. NGS kann eine beliebige Anzahl von Sequenzierungstechnologien (z. B. Sequenzierungstechnologien der zweiten Generation, Sequenzierungstechnologien der dritten Generation, Sequenzierungstechnologien der vierten Generation, usw.) sein. Nicht einschränkende Beispiele für Hochdurchsatz-Sequenzierungsverfahren beinhalten die massiv-parallele Signatursequenzierung, die Polony-Sequenzierung, die Pyrosequenzierung, die Sequenzierung durch Synthese, die kombinatorische Sondenanker-Synthese (cPAS), die Sequenzierung durch Ligation (z. B., Sequenzierung durch Oligonukleotid-Ligation und Nachweis (SOLiD)), Halbleiter-Sequenzierung (z.B. Ion Torrent Halbleiter-Sequenzierung), DNA-Nanoball-Sequenzierung und Einzelmolekül-Sequenzierung, Sequenzierung durch Hybridisierung.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können die Sequenzierungsdaten basierend auf einem beliebigen der offenbarten Sequenzierungsverfahren, das eine Nukleinsäure-Amplifikation (z. B. Polymerase-Kettenreaktion (PCR)) verwendet, erlangt werden. Nicht einschränkende Beispiele für solche Sequenzierungsverfahren können die 454-Pyrosequenzierung, die Polony-Sequenzierung und die SoLiD-Sequenzierung beinhalten. In einigen Fällen können Amplikons (z. B. Derivate der Vielzahl zellfreier Nukleinsäuremoleküle, die, wie hierin offenbart, von dem Subjekt erlangt oder abgeleitet wurden), die einem Genombereich von Interesse (z. B. einem mit einer Krankheit assoziierten Genombereich) entsprechen, durch PCR erzeugt, optional gepoolt und anschließend sequenziert werden, um Sequenzierungsdaten zu erzeugen. Da die Bereiche von Interesse vor der Sequenzierung durch PCR zu Amplikons amplifiziert werden, ist die Nukleinsäureprobe in einigen Beispielen bereits für den Bereich von Interesse angereichert, so dass ein beliebiges zusätzliches Pooling (z. B. Hybridisierung) vor der Sequenzierung (z. B. nichthybridisierungsbasiertes NGS) nicht erforderlich ist. Alternativ kann ein Pooling durch Hybridisierung zur zusätzlichen Anreicherung vor der Sequenzierung durchgeführt werden. Alternativ können die Sequenzierungsdaten auch ohne Erzeugung von PCR-Kopien, z. B. durch cPAS-Sequenzierung, erlangt werden.
  • Eine Reihe von Ausführungsformen verwenden Erfassungshybridisierungstechniken zur Durchführung einer gezielten Sequenzierung. Zur Verbesserung der Auflösung bestimmter genomischer Loci können bei der Durchführung von Sequenzierungen mit zellfreien Nukleinsäuren die Produkte der Bibliothek vor der Sequenzierung durch Hybridisierung erfasst werden. Die Capture-Hybridisierung kann besonders nützlich bei dem Versuch des Nachweises seltener und/oder somatischer Phasenvarianten in einer Probe an bestimmten genomischen Loci sein. In einigen Situationen ist der Nachweis seltener und/oder somatischer Phasenvarianten indikativ für die Quelle der Nukleinsäuren, einschließlich der von einer Krebsquelle abgeleiteten Nukleinsäuren. Dementsprechend ist die Capture-Hybridisierung ein Werkzeug, das den Nachweis von zirkulierende Tumor-Nukleinsäure innerhalb zellfreier Nukleinsäuren verbessern kann.
  • Bei verschiedenen Krebsarten kommt es immer wieder zu einer aberranten somatischen Hypermutation an bestimmten genomischen Loci. Beispielsweise induziert die enzymaktivierungsinduzierte Deaminase eine aberrante somatische Hypermutation in B-Zellen, die zu verschiedenen B-Zell-Lymphomen, einschließlich (aber nicht beschränkt auf) das diffuse großzellige B-Zell-Lymphom (DLBCL), das follikuläre Lymphom (FL), das Burkitt-Lymphom (BL) und die chronische lymphatische B-Zell-Leukämie (CLL), führt. Dementsprechend sind in zahlreichen Ausführungsformen die Sonden zum Herunterziehen (Pull-Down) (oder zur Erfassung) genomischer Loci gestaltet, von denen bekannt ist, dass sie in einem Lymphom eine aberrante somatische Hypermutation aufweisen. 1D und Tabelle 1 beschreiben eine Reihe von Bereichen, die bei DLBCL, FL, BL und CLL eine aberrante somatische Hypermutation aufweisen. In Tabelle 6 ist eine Liste von Nukleinsäuresonden aufgeführt, die zum Herunterziehen (Pull-Down) (oder zur Erfassung) genomischer Loci verwendet werden können, um eine aberrante somatische Hypermutation bei B-Zell-Krebs nachzuweisen.
  • Die Erfassungssequenzierung kann auch unter Verwendung personalisierter Nukleinsäuresonden durchgeführt werden, die für den Nachweis der Krebserkrankung einer Person gestaltet wurden. Eine an Krebs erkrankte Person kann ihren Krebs biopsieren und sequenzieren lassen, um somatische Phasenvarianten nachzuweisen, die sich im Krebs angesammelt haben. Basierend auf dem Sequenzierungsergebnis werden gemäß einer Reihe von Ausführungsformen Nukleinsäuresonden gestaltet und synthetisiert, die zum Herunterziehen der genomischen Loci, einschließlich der Positionen der Phasenvarianten, geeignet sind. Diese personalisierten gestalteten und synthetisierten Nukleinsäuresonden können für den Nachweis von zirkulierenden Tumor-Nukleinsäuren aus einer Flüssigbiopsie des betreffenden Individuums verwendet werden. Dementsprechend können die personalisierten Nukleinsäuresonden für die Bestimmung des Therapieansprechens und/oder den Nachweis von MRD nach der Behandlung nützlich sein.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können die Sequenzierungsdaten basierend auf einem beliebigen, Adapter verwendenden Sequenzierungsverfahren erlangt werden. Nukleinsäureproben (z. B. die Vielzahl zellfreier Nukleinsäuremoleküle des Subjekts, wie hierin offenbart) können mit einem oder mehreren Adaptern (oder Adaptersequenzen) zur Erkennung (z. B. durch Hybridisierung) der Probe oder beliebiger Derivate davon (z. B. Amplikons) konjugiert werden. In einigen Beispielen können die Nukleinsäureproben mit einem molekularen Barcode markiert werden, sodass jedes zellfreie Nukleinsäuremolekül der Vielzahl zellfreier Nukleinsäuremoleküle einen eindeutigen Barcode aufweisen kann. Alternativ oder zusätzlich können die Nukleinsäureproben mit einem Probenbarcode markiert werden, sodass z. B. die Vielzahl zellfreier Nukleinsäuremoleküle des Subjekts (z. B. eine Vielzahl zellfreier Nukleinsäuremoleküle, die aus einem bestimmten Körpergewebe des Subjekts erlangt wurden) denselben Barcode aufweisen können.
  • In alternativen Ausführungsformen können die hierin offenbarten Verfahren zur Identifizierung eines oder mehrerer, die Vielzahl von Phasenvarianten umfassender zellfreier Nukleinsäuremoleküle ohne molekulare Barcodierung, ohne Probenbarcodierung oder ohne molekulare Barcodierung und Probenbarcodierung durchgeführt werden, zumindest teilweise aufgrund der hohen Spezifität und der niedrigen LOD, die durch das Vertrauen auf die Identifizierung der Phasenvarianten im Gegensatz z. B. zu einer einzelnen SNV erreicht wird.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können die Sequenzierungsdaten ohne In silico-Entfernung oder -Unterdrückung von (i) Hintergrundfehlern und/oder (ii) Sequenzierungsfehlern erlangt und analysiert werden, was wenigstens teilweise auf die hohe Spezifität und die niedrige LOD, die durch das Vertrauen auf die Identifizierung der Phasenvarianten im Gegensatz zu z. B. einer einzelnen SNV oder Indel erreicht wird, zurückzuführen ist.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Verwendung der Vielzahl von Varianten als Bedingung für die Identifizierung gezielter zellfreier Nukleinsäuremoleküle mit spezifischen Mutationen von Interesse ohne In silico-Verfahren zur Fehlerunterdrückung eine Hintergrundfehlerrate ergeben, m wenigstens etwa das 5-fache, wenigstens etwa das 10-fache, wenigstens etwa das 20-fache, wenigstens etwa das 30-fache, wenigstens etwa das 40-fache, wenigstens etwa das 50-fache, wenigstens etwa das 60-fache, wenigstens etwa das 70-fache, wenigstens etwa das 80-fache, wenigstens etwa das 90-fache, wenigstens etwa das 100-fache, wenigstens etwa das 200-fache, wenigstens etwa das 400-fache, wenigstens etwa das 600-fache, wenigstens etwa das 800-fache oder wenigstens etwa das 1.000-fache niedriger ist als die der (i) Barcode-Deduplikation, (ii) integrierten digitalen Fehlerunterdrückung oder (iii) Duplex-Sequenzierung, Dieser Ansatz kann vorteilhaft das Signal-Rausch-Verhältnis (und damit die Sensitivität und/oder Spezifität) bei der Identifizierung gezielter zellfreier Nukleinsäuremoleküle mit bestimmten Mutationen von Interesse erhöhen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Erhöhung einer Mindestanzahl von Phasenvarianten (z. B. Erhöhung von wenigstens zwei Phasenvarianten auf wenigstens drei Phasenvarianten) pro zellfreiem Nukleinsäuremolekül, die als Bedingung für die Identifizierung zellfreier Nukleinsäuremoleküle mit spezifischen Mutationen von Interesse erforderlich ist, die Hintergrundfehlerrate um wenigstens etwa das 5-Fache, um wenigstens das 10-fache, um wenigstens das 20-fache, um wenigstens das 30-fache, um wenigstens das 40-fache, um wenigstens das 50-fache, um wenigstens das 60-fache, um wenigstens das 70-fache, um wenigstens das 80-fache, um wenigstens das 90-fache oder um wenigstens das 100-fache reduzieren. Dieser Ansatz kann vorteilhaft das Signal-Rausch-Verhältnis (und damit die Sensitivität und/oder Spezifität) bei der Identifizierung gezielter zellfreier Nukleinsäuremoleküle mit bestimmten Mutationen von Interesse erhöhen.
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Behandlung einer Erkrankung eines Subjekts vor, wie im Ablaufdiagramm 2540 in 25D dargestellt. Das Verfahren kann (a) die Identifizierung des Subjekts für die Behandlung der Erkrankung umfassen, wobei das Subjekt basierend auf der Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus einer Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet wurden, als an der Erkrankung leidend bestimmt wurde (Prozess 2542). Jedes des oder der identifizierten zellfreien Nukleinsäuremoleküle kann eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfassen. Wenigstens ein Teil (z. B. ein Teil oder alle) der Vielzahl von Phasenvarianten kann durch wenigstens ein Nukleotid getrennt sein, so dass eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt sind, wie hierin offenbart. In einigen Fällen ist ein Vorhandensein der Vielzahl von Phasenvarianten indikativ für die Erkrankung (z. B. eine Erkrankung, wie Krebs) des Subjekts. Das Verfahren kann ferner umfassen: (b) Unterziehen des Subjekts der Behandlung basierend auf Schritt (a) (Prozess 2544). Beispiele für eine solche Behandlung der Erkrankung des Subjekts sind an anderer Stelle in der vorliegenden Offenbarung offenbart.
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Überwachung eines Verlaufs (z. B. Progression oder Regression) einer Erkrankung eines Subjekts vor, wie in Ablaufdiagramm 2550 in 25E dargestellt. Das Verfahren kann (a) die Bestimmung eines ersten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines ersten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer ersten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden, umfassen (Prozess 2552). Das Verfahren kann ferner (b) die Bestimmung eines zweiten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines zweiten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer zweiten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden, umfassen (Prozess 2554). Die zweite Vielzahl von zellfreien Nukleinsäuremolekülen kann von dem Subjekt im Anschluss an die Gewinnung der ersten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt werden. Das Verfahren kann optional (c) die Bestimmung des Verlaufs (z. B. Progression oder Regression) der Erkrankung basierend zumindest teilweise auf dem ersten Stadium der Erkrankung und dem zweiten Stadium der Erkrankung umfassen (Prozess 2556). In einigen Fällen kann jedes des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle (z. B. jedes des ersten Satzes eines oder mehrerer identifizierter zellfreier Nukleinsäuremoleküle, jedes des zweiten Satzes eines oder mehrerer identifizierter zellfreier Nukleinsäuremoleküle) eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfassen. Wenigstens ein Teil (z. B. ein Teil oder alle) des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle kann, wie hierin offenbart, durch wenigstens ein Nukleotid getrennt sein. In einigen Fällen kann ein Vorhandensein der Vielzahl von Phasenvarianten indikativ für das Stadium der Erkrankung des Subjekts sein
  • In einigen Fällen kann die erste Vielzahl zellfreier Nukleinsäuremoleküle von dem Subjekt erlangt (z. B. durch eine Blutbiopsie) und analysiert werden, um ein erstes Stadium der Erkrankung (z. B. eine Erkrankung, wie Krebs) des Subjekts zu bestimmen (z. B. zu diagnostizieren). Die erste Vielzahl zellfreier Nukleinsäuremoleküle kann mit einem beliebigen der hierin offenbarten Verfahren (z. B. mit oder ohne Sequenzierung) analysiert werden, um den ersten Satz eines oder mehrerer die Vielzahl von Phasenvarianten umfassender zellfreier Nukleinsäuremoleküle zu identifizieren, und das Vorhandensein oder die Merkmale des ersten Satzes eines oder mehrerer zellfreier Nukleinsäuremoleküle können zur Bestimmung des ersten Stadiums der Erkrankung (z. B. einer ersten Diagnose) des Subjekts verwendet werden. Basierend auf dem ermittelten ersten Stadium der Erkrankung kann der Proband einer oder mehreren Behandlungen (z. B. Chemotherapie) unterzogen werden, wie hierin offenbart. Im Anschluss an die eine oder die mehreren Behandlungen kann die zweite Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt werden.
  • In einigen Fällen kann der Proband wenigstens oder bis zu etwa 1 Behandlung, wenigstens oder bis zu etwa 2 Behandlungen, wenigstens oder bis zu etwa 3 Behandlungen, wenigstens oder bis zu etwa 4 Behandlungen, wenigstens oder bis zu etwa 5 Behandlungen, wenigstens oder bis zu etwa 6 Behandlungen, wenigstens oder bis zu etwa 7 Behandlungen, wenigstens oder bis zu etwa 8 Behandlungen, wenigstens oder bis zu etwa 9 Behandlungen oder wenigstens oder bis zu etwa 10 Behandlungen basierend auf dem ermittelten ersten Stadium der Erkrankung unterzogen werden. In einigen Fällen kann der Proband basierend auf dem ermittelten ersten Stadium der Erkrankung einer Vielzahl von Behandlungen unterzogen werden, und eine erste Behandlung der Vielzahl von Behandlungen und eine zweite Behandlung der Vielzahl von Behandlungen können um wenigstens oder bis zu etwa 1 Tag, wenigstens oder bis zu etwa 7 Tage, wenigstens oder bis zu etwa 2 Wochen, wenigstens oder bis zu etwa 3 Wochen, wenigstens oder bis zu etwa 4 Wochen, wenigstens oder bis zu etwa 2 Monate, wenigstens oder bis zu etwa 3 Monate, wenigstens oder bis zu etwa 4 Monate, wenigstens oder bis zu etwa 5 Monate, wenigstens oder bis zu etwa 6 Monate, wenigstens oder bis zu etwa 12 Monate, wenigstens oder bis zu etwa 2 Jahre, wenigstens oder bis zu etwa 3 Jahre, wenigstens oder bis zu etwa 4 Jahre, wenigstens oder bis zu etwa 5 Jahre, oder wenigstens oder bis zu etwa 10 Jahre auseinander liegen. Die Vielzahl der Behandlungen für den Subjekt kann die gleiche sein. Alternativ kann sich die Vielzahl der Behandlungen durch die Art des Medikaments (z. B. verschiedene Chemotherapeutika), die Dosierung des Medikaments (z. B. Erhöhung der Dosierung, Verringerung der Dosierung), das Vorhandensein oder Fehlen eines Co-Therapeutikums (z. B. Chemotherapie und Immuntherapie), die Art der Verabreichung (z. B. intravenöse oder orale Verabreichung), die Häufigkeit der Verabreichung (z. B. täglich, wöchentlich, monatlich) usw. unterscheiden.
  • In einigen Fällen kann und muss der Proband zwischen der Bestimmung des ersten Stadiums der Erkrankung und der Bestimmung des zweiten Stadiums der Erkrankung nicht gegen die Erkrankung behandelt werden. Zum Beispiel kann die zweite Vielzahl zellfreier Nukleinsäuremoleküle ohne eine beliebige Behandlung von dem Subjekt erlangt werden (z. B. durch eine Flüssigbiopsie), um zu bestätigen, ob der Proband immer noch Anzeichen für das erste Stadium der Erkrankung aufweist.
  • In einigen Fällen kann die zweite Vielzahl zellfreier Nukleinsäuremoleküle von dem Subjekt (z. B, mittels Blutbiopsie) wenigstens oder bis zu etwa 1 Tag, wenigstens oder bis zu etwa 7 Tage, wenigstens oder bis zu etwa 2 Wochen, wenigstens oder bis zu etwa 3 Wochen, wenigstens oder bis zu etwa 4 Wochen, wenigstens oder bis zu etwa 2 Monate, wenigstens oder bis zu etwa 3 Monate, wenigstens oder bis zu etwa 4 Monate ,wenigstens oder etwa 5 Monate, wenigstens oder bis zu etwa 6 Monate, wenigstens oder bis zu etwa 12 Monate, wenigstens oder bis zu etwa 2 Jahre, wenigstens oder bis zu etwa 3 Jahre, wenigstens oder bis zu etwa 4 Jahre, wenigstens oder bis zu etwa 5 Jahre oder wenigstens oder bis zu etwa 10 Jahre nach dem Gewinnen der ersten Vielzahl zellfreier Nukleinsäuremoleküle von dem Subjekt erlangt werden.
  • In einigen Fällen können wenigstens oder bis zu etwa 2, wenigstens oder bis zu etwa 3, wenigstens oder bis zu etwa 4, wenigstens oder bis zu etwa 5, wenigstens oder bis zu etwa 6, wenigstens oder bis zu etwa 7, wenigstens oder bis zu etwa 8, wenigstens oder bis zu etwa 9 oder wenigstens oder bis zu etwa 10 verschiedene Proben, umfassend eine Vielzahl von Nukleinsäuremolekülen (z. B. wenigstens die erste Vielzahl zellfreier Nukleinsäuremoleküle und die zweite Vielzahl zellfreier Nukleinsäuremoleküle), im Laufe der Zeit (z. B. einmal pro Monat für 6 Monate, einmal alle zwei Monate für ein Jahr, einmal alle drei Monate für ein Jahr, einmal alle 6 Monate für ein oder mehrere Jahre, usw.) erlangt werden, um den Verlauf der Erkrankung des Subjekts zu beobachten, wie hierin offenbart.
  • In einigen Fällen kann der Schritt der Bestimmung des Verlaufs der Erkrankung basierend auf dem ersten Stadium der Erkrankung und dem zweiten Stadium der Erkrankung den Vergleich eines oder mehrerer Merkmale des ersten Stadiums und des zweiten Stadiums der Erkrankung umfassen, wie beispielsweise (i) eine Gesamtzahl zellfreier Nukleinsäuremoleküle, die als die Vielzahl von Phasenvarianten in jedem Stadium umfassend identifiziert wurden (z. B. pro gleichem Gewicht oder Volumen der biologischen Ausgangsprobe, pro gleicher Anzahl von anfänglich analysierten zellfreien Nukleinsäuremolekülen usw.), (ii) eine durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro zellfreiem Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten umfassend identifiziert wurde (d. h. zwei oder mehr Phasenvarianten), oder (iii) eine Anzahl zellfreier Nukleinsäuremoleküle, die als die Vielzahl von Phasenvarianten umfassend identifiziert wurden, geteilt durch eine Gesamtzahl zellfreier Nukleinsäuremoleküle, die eine Mutation umfassen, die sich mit einigen der Vielzahl von Phasenvarianten überschneidet (d. h. Allelfrequenz der Phasenvariante). Basierend auf einem solchen Vergleich kann die MRD der Erkrankung (z. B. Krebs oder Tumor) des Subjekts bestimmt werden. Basierend auf einem solchen Vergleich kann zum Beispiel die Tumor- oder Krebsbelastung des Subjekts ermittelt werden.
  • In einigen Fällen kann der Verlauf der Erkrankung eine Progression oder Verschlimmerung der Erkrankung sein. In einem Beispiel kann die Verschlimmerung der Erkrankung die Entwicklung einer Krebserkrankung von einem früheren Stadium zu einem späteren Stadium umfassen, wie etwa von Krebs im Stadium I zu Krebs im Stadium III. In einem anderen Beispiel kann die Verschlimmerung der Erkrankung eine Vergrößerung (z. B. des Volumens) eines soliden Tumors umfassen. In noch einem anderen Beispiel kann die Verschlimmerung der Erkrankung darin bestehen, dass sich Krebsmetastasen von einer Stelle zu einer anderen Stelle im Körper des Subjekts ausbreiten.
  • In einigen Beispielen kann (i) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem zweiten Stadium der Erkrankung des Subjekts umfassend identifiziert wurden, um wenigstens oder bis zu etwa das 0,1-fache, wenigstens oder bis zu etwa 0,2-fache, wenigstens oder bis zu etwa 0,3-fache, wenigstens oder bis zu etwa 0,4-fache, wenigstens oder bis zu etwa 0,5-fache, wenigstens oder bis zu etwa 0,6-fache, wenigstens oder bis zu etwa 0,7-fache, wenigstens oder bis zu etwa 0,8-fache, wenigstens oder bis zu etwa 0,9-fache, wenigstens oder bis zu etwa 1-fache, wenigstens oder bis zu etwa 2-fache, wenigstens oder bis zu etwa 3-fache, wenigstens oder bis zu etwa 4-fache, wenigstens oder bis zu etwa 5-fache, wenigstens oder bis zu etwa 6-fache, wenigstens oder bis zu etwa 7-fache, wenigstens oder bis zu etwa 8-fache, wenigstens oder bis zu etwa 9-fache, wenigstens oder bis zu etwa 10-fache, wenigstens oder bis zu etwa 15-fache, wenigstens oder bis zu etwa 20-fache, wenigstens oder bis zu etwa 30-fache, wenigstens oder bis zu etwa 40-fache, wenigstens oder bis zu etwa 50-fache, wenigstens oder bis zu etwa 60-fache, wenigstens oder bis zu etwa 70-fache, wenigstens oder bis zu etwa 80-fache, wenigstens oder bis zu etwa 90-fache, wenigstens oder bis zu etwa 100-fache, wenigstens oder bis zu etwa 200-fache, wenigstens oder bis zu etwa 300-fache, wenigstens oder bis zu etwa 400-fache, oder wenigstens oder bis zu etwa 500-fache höher sein als (ii) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem ersten Stadium der Erkrankung des Subjekts umfassend identifiziert wurden.
  • In einigen Beispielen kann (i) die durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem zweiten Stadium der Erkrankung des Subjekts umfassend identifiziert wurde, um wenigstens oder bis zu etwa das 0,1-fache, wenigstens oder bis zu etwa 0,2-fache, wenigstens oder bis zu etwa 0,3-fache, wenigstens oder bis zu etwa 0,4-fache, wenigstens oder bis zu etwa 0,5-fache, wenigstens oder bis zu etwa 0,6-fache, wenigstens oder bis zu etwa 0,7-fache, wenigstens oder bis zu etwa 0,8-fache, wenigstens oder bis zu etwa 0,9-fache, wenigstens oder bis zu etwa 1-fache, wenigstens oder bis zu etwa 2-fache, wenigstens oder bis zu etwa 3-fache, wenigstens oder bis zu etwa 4-fache, wenigstens oder bis zu etwa 5-fache, wenigstens oder bis zu etwa 6-fache, wenigstens oder bis zu etwa 7-fache, wenigstens oder bis zu etwa 8-fache, wenigstens oder bis zu etwa 9-fache, wenigstens oder bis zu etwa 10-fache, wenigstens oder bis zu etwa 15-fache, wenigstens oder bis zu etwa 20-fache, wenigstens oder bis zu etwa 30-fache, wenigstens oder bis zu etwa 40-fache, wenigstens oder bis zu etwa 50-fache, wenigstens oder bis zu etwa 60-fache, wenigstens oder bis zu etwa 70-fache, wenigstens oder bis zu etwa 80-fache, wenigstens oder bis zu etwa 90-fache, wenigstens oder bis zu etwa 100-fache, wenigstens oder bis zu etwa 200-fache, wenigstens oder bis zu etwa 300-fache, wenigstens oder bis zu etwa 400-fache, oder wenigstens oder bis zu etwa 500-fache höher sein als (ii) die durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem ersten Stadium der Erkrankung des Subjekts umfassend identifiziert wurde.
  • In einigen Fällen kann der Verlauf der Erkrankung eine Regression oder zumindest eine teilweise Remission der Erkrankung sein. In einem Beispiel kann die zumindest teilweise Remission der Erkrankung ein Downstaging einer Krebserkrankung von einem späteren Stadium in ein früheres Stadium, beispielsweise von einem Krebs im Stadium IV zu einem Krebs im Stadium II, umfassen. Alternativ kann es sich bei der zumindest teilweisen Remission der Erkrankung auch um eine vollständige Remission der Krebserkrankung handeln. In einem anderen Beispiel kann die zumindest teilweise Remission der Erkrankung eine Verringerung der Größe (z. B. des Volumens) eines soliden Tumors umfassen.
  • In einigen Beispielen kann (i) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem zweiten Stadium der Erkrankung des Subjekts umfassend identifiziert wurden, um wenigstens oder bis zu etwa das 0,1-fache, wenigstens oder bis zu etwa 0,2-fache, wenigstens oder bis zu etwa 0,3-fache, wenigstens oder bis zu etwa 0,4-fache, wenigstens oder bis zu etwa 0,5-fache, wenigstens oder bis zu etwa 0,6-fache, wenigstens oder bis zu etwa 0,7-fache, wenigstens oder bis zu etwa 0,8-fache, wenigstens oder bis zu etwa 0,9-fache, wenigstens oder bis zu etwa 1-fache, wenigstens oder bis zu etwa 2-fache, wenigstens oder bis zu etwa 3-fache, wenigstens oder bis zu etwa 4-fache, wenigstens oder bis zu etwa 5-fache, wenigstens oder bis zu etwa 6-fache, wenigstens oder bis zu etwa 7-fache, wenigstens oder bis zu etwa 8-fache, wenigstens oder bis zu etwa 9-fache, wenigstens oder bis zu etwa 10-fache, wenigstens oder bis zu etwa 15-fache, wenigstens oder bis zu etwa 20-fache, wenigstens oder bis zu etwa 30-fache, wenigstens oder bis zu etwa 40-fache, wenigstens oder bis zu etwa 50-fache, wenigstens oder bis zu etwa 60-fache, wenigstens oder bis zu etwa 70-fache, wenigstens oder bis zu etwa 80-fache, wenigstens oder bis zu etwa 90-fache, wenigstens oder bis zu etwa 100-fache, wenigstens oder bis zu etwa 200-fache, wenigstens oder bis zu etwa 300-fache, wenigstens oder bis zu etwa 400-fache, oder wenigstens oder bis zu etwa 500-fache niedriger sein als (ii) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem ersten Stadium der Erkrankung des Subjekts umfassend identifiziert wurden.
  • In einigen Beispielen kann (i) die durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem zweiten Status der Erkrankung des Subjekts umfassend identifiziert wurde, um wenigstens oder bis zu etwa das 0,1-fache, wenigstens oder bis zu etwa 0,2-fache, wenigstens oder bis zu etwa 0,3-fache, wenigstens oder bis zu etwa 0,4-fache, wenigstens oder bis zu etwa 0,5-fache, wenigstens oder bis zu etwa 0,6-fache, wenigstens oder bis zu etwa 0,7-fache, wenigstens oder bis zu etwa 0,8-fache, wenigstens oder bis zu etwa 0,9-fache, wenigstens oder bis zu etwa 1-fache, wenigstens oder bis zu etwa 2-fache, wenigstens oder bis zu etwa 3-fache, wenigstens oder bis zu etwa 4-fache, wenigstens oder bis zu etwa 5-fache, wenigstens oder bis zu etwa 6-fache, wenigstens oder bis zu etwa 7-fache, wenigstens oder bis zu etwa 8-fache, wenigstens oder bis zu etwa 9-fache, wenigstens oder bis zu etwa 10-fache, wenigstens oder bis zu etwa 15-fache, wenigstens oder bis zu etwa 20-fache, wenigstens oder bis zu etwa 30-fache, wenigstens oder bis zu etwa 40-fache, wenigstens oder bis zu etwa 50-fache, wenigstens oder bis zu etwa 60-fache, wenigstens oder bis zu etwa 70-fache, wenigstens oder bis zu etwa 80-fache, wenigstens oder bis zu etwa 90-fache, wenigstens oder bis zu etwa 100-fache, wenigstens oder bis zu etwa 200-fache, wenigstens oder bis zu etwa 300-fache, wenigstens oder bis zu etwa 400-fache, oder wenigstens oder bis zu etwa 500-fache niedriger sein als (ii) die durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem ersten Status der Erkrankung des Subjekts umfassend identifiziert wurde.
  • In einigen Fällen kann der Verlauf der Erkrankung zwischen den beiden Stadien der Erkrankung des Subjekts im Wesentlichen gleich bleiben. In einigen Beispielen kann (i) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem zweiten Stadium der Erkrankung des Subjekts umfassen identifiziert wurden, etwa gleich sein wie (ii) die Gesamtzahl der zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten aus dem ersten Stadium der Erkrankung des Subjekts umfassend identifiziert wurden. In einigen Beispielen kann (i) eine durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem zweiten Stadium der Erkrankung des Subjekts umfassend identifiziert wurde, etwa gleich sein wie (ii) eine durchschnittliche Anzahl der Vielzahl von Phasenvarianten pro jedem zellfreien Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten aus dem ersten Stadium der Erkrankung des Subjekts umfassend identifiziert wurde.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können das eine oder die mehreren zellfreien Nukleinsäuremoleküle, die die Vielzahl der Phasenvarianten umfassen, aus der Vielzahl der zellfreien Nukleinsäuremoleküle durch ein oder mehrere Sequenzierungsverfahren identifiziert werden. Alternativ oder zusätzlich können das eine oder die mehreren zellfreien Nukleinsäuremoleküle, die die Vielzahl der Phasenvarianten umfassen, durch Pull down von (oder Erfassung von) der Vielzahl der zellfreien Nukleinsäuremoleküle mit einem Satz von Nukleinsäuresonden identifiziert werden. Das Pull-Down-(oder Capture-)Verfahren über den Satz von Nukleinsäuresonden kann zur Identifizierung der einen oder mehreren zellfreien Nukleinsäuremoleküle von Interesse ohne Sequenzierung ausreichen. In einigen Fällen kann der Satz von Nukleinsäuresonden zur Hybridisierung mit wenigstens einem Teil zellfreier Nukleinsäuremoleküle (z. B. cfDNA-Moleküle) aus einem oder mehreren mit der Erkrankung des Subjekts assoziierten Genombereichen ausgelegt sein. Daher kann ein Vorhandensein eines oder mehrerer von den Nukleinsäuresonden heruntergezogener zellfreier Nukleinsäuremoleküle indikativ dafür sein, dass das eine oder die mehreren zellfreien Nukleinsäuremoleküle aus der Erkrankung (z .B. ctDNA oder ctRNA) abgeleitet sind. Weitere Einzelheiten zu dem Satz von Nukleinsonden sind an anderer Stelle der vorliegenden Offenbarung offenbart.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können, basierend auf den von dem Subjekt erlangten oder abgeleiteten Sequenzierungsdaten aus der Vielzahl zellfreier Nukleinsäuremoleküle (z. B. cfDNA), (i) das eine oder die mehreren zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten umfassend identifiziert wurden, in silico von (ii) einem oder mehreren anderen zellfreien Nukleinsäuremolekülen, die nicht als die Vielzahl der Phasenvarianten umfassend identifiziert wurden (oder einem oder mehreren anderen zellfreien Nukleinsäuremolekülen, die nicht die Vielzahl der Phasenvarianten umfassen), getrennt werden. In einigen Fällen kann das Verfahren ferner die Erzeugung zusätzlicher Daten umfassen, die Sequenzierungsinformationen nur für (i) das eine oder die mehreren zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten umfassend identifiziert wurden, umfassen. In einigen Fällen kann das Verfahren ferner die Erzeugung anderer Daten umfassen, die Sequenzierungsinformationen nur für (ii) das eine oder die mehreren anderen zellfreien Nukleinsäuremoleküle, die nicht als die Vielzahl von Phasenvarianten umfassend identifiziert wurden (oder das eine oder die mehreren anderen zellfreien Nukleinsäuremoleküle, die nicht die Vielzahl von Phasenvarianten umfassen) umfassen.
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Bestimmung einer Erkrankung eines Subjekts vor, wie im Ablaufdiagramm 2560 in 25F dargestellt. Das Verfahren kann umfassen: (a) Bereitstellen eines Gemischs, umfassend (1) einen Satz von Nukleinsäuresonden und (2) eine Vielzahl von von dem Subjekt erlangter oder abgeleiteter zellfreier Nukleinsäuremoleküle (Prozess 2562). In einigen Fällen kann eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatz zur Hybridisierung mit einem zellfreien Zielnukleinsäuremolekül gestaltet sein, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind. So können eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt sein, wie hierin offenbart. In einigen Fällen kann die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens enthalten. Das aktivierbare Reporteragens kann entweder durch (i) Hybridisierung der individuellen Nukleinsäuresonde mit der Vielzahl von Phasenvarianten oder (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die mit der Vielzahl von Phasenvarianten hybridisiert wurde, aktiviert werden. Das Verfahren kann ferner (b) den Nachweis des aktivierten Reporteragens zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle umfassen (Prozess 2564). Jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle kann die Vielzahl der Phasenvarianten umfassen. Das Verfahren kann optional (c) die Analyse wenigstens eines Teils der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle zur Bestimmung der Erkrankung des Subjekts umfassen (Prozess 2566).
  • In einem Aspekt sieht die vorliegende Offenbarung ein Verfahren zur Bestimmung einer Erkrankung eines Subjekts vor, wie im Ablaufdiagramm 2570 in 25G dargestellt. Das Verfahren kann umfassen: (a) Bereitstellen eines Gemischs, umfassend (1) einen Satz von Nukleinsäuresonden und (2) eine Vielzahl von von dem Subjekt erlangter oder abgeleiteter zellfreier Nukleinsäuremoleküle (Prozess 2572). In einigen Fällen kann eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatz zur Hybridisierung mit einem zellfreien Zielnukleinsäuremolekül gestaltet sein, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst. In einigen Fällen kann die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens enthalten. Das aktivierbare Reporteragens kann entweder durch (i) Hybridisierung der individuellen Nukleinsäuresonde mit der Vielzahl von Phasenvarianten oder (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die mit der Vielzahl von Phasenvarianten hybridisiert wurde, aktiviert werden. Das Verfahren kann ferner (b) den Nachweis des aktivierten Reporteragens zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle umfassen (Prozess 2574). Jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle kann die Vielzahl der Phasenvarianten umfassen, und ein LOD des Identifizierungsschritts kann weniger als etwa 1 aus 50.000 zellfreien Nukleinsäuremolekülen der Vielzahl der zellfreien Nukleinsäuremoleküle betragen, wie hierin offenbart. Das Verfahren kann optional (c) die Analyse wenigstens eines Teils der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle zur Bestimmung der Erkrankung des Subjekts umfassen (Prozess 2576).
  • In einigen Fällen ist eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt, wie hierin offenbart.
  • In einigen Fällen kann die LOD des Schritts der Identifizierung des einen oder der mehreren zellfreien Nukleinsäuremoleküle, wie hierin offenbart, weniger als etwa 1 aus 60.000, weniger als 1 aus 70.000, weniger als 10 aus 80.000, weniger als 1 aus 90.000, weniger als 1 aus 100.000, weniger als 1 aus 150.000, weniger als 1 aus 200.000, weniger als 1 aus 300.000, weniger als 1 aus 400.000, weniger als 1 aus 500.000, weniger als 1 aus 600.000, weniger als 1 aus 700.000, weniger als 1 aus 800.000, weniger als 1 aus 900.000, weniger als 1 aus 1.000.000, weniger als 1 aus 1.000.000, weniger als 1 aus 1.100.000, weniger als 1 aus 1.200.000, weniger als 1 aus 1.300.000, weniger als 1 aus 1.400.000, weniger als 1 aus 1.500.000, weniger als 1 aus 2.000.000, weniger als 1 aus 2.500.000, weniger als 1 aus 3.000.000, weniger als 1 aus 4.000.000 oder weniger als 1 aus 5.000.000 zellfreie Nukleinsäuremoleküle der Vielzahl zellfreier Nukelinsäuremokelüle betragen. Im Allgemeinen hat ein Verfahren mit einer niedrigeren LOD eine höhere Empfindlichkeit für einen solchen Nachweis.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das Verfahren ferner das Mischen (1) des Satzes von Nukleinsäuresonden und (2) der Vielzahl von zellfreien Nukleinsäuremolekülen umfassen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das aktivierbare Reporteragens einer Nukleinsäuresonde bei der Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl der Phasenvarianten aktiviert werden. Nicht einschränkende Beispiele für solche Nukleinsäuresonden können einen molekularen Beacon (Signalortungsgerät), eine Eclipse-Sonde, eine Amplifluor-Sonde, einen Skorpion-PCR-Primer und einen fluorogenen PCR-Primer mit Licht nach Erweiterung (LUX-Primer) beinhalten.
  • Beispielsweise kann die Nukleinsäuresonde ein molekulare Beacon sein, wie in 26A dargestellt. Der molekulare Beacon kann eine fluoreszenzmarkierte (z. B. farbstoffmarkierte) Oligonukleotidsonde sein, die Komplementarität zu einem gezielten zellenfreien Nukleinsäuremolekül 2603 in einem Bereich aufweist, der die Vielzahl der Phasenvarianten umfasst. Der molekulare Beacon kann eine Länge zwischen etwa 25 Nukleotiden und etwa 50 Nukleotiden haben. Der molekulare Beacon kann auch gestaltet sein, um teilweise selbst-komplementär zu sein, sodass er eine Haarnadelstruktur mit einem Stamm 2601a und einer Schleife 2601b bildet. Die 5'- und 3'-Enden der molekularen Beacon-Sonde können komplementäre Sequenzen (z. B. etwa 5-6 Nukleotide) aufweisen, die die Stammstruktur 2601a bilden. Der Schleifenabschnitt 2601b der Haarnadel kann zur spezifischen Hybridisierung mit einem Abschnitt (z. B. etwa 15-30 Nukleotide) der Zielsequenz, die zwei oder mehr Phasenvarianten umfasst, gestaltet sein. Die Haarnadel kann zur Hybridisierung mit einem Abschnitt gestaltet sein, der wenigstens 2, 3, 4, 5 oder mehr Phasenvarianten umfasst. Ein fluoreszierendes Reportermolekül kann an das 5'-Ende der molekularen Beacon-Sonde gebunden sein und ein Quencher, der die Fluoreszenz des fluoreszierenden Reporters quencht, kann an das 3'-Ende der molekularen Beacon-Sonde gebunden sein. Die Bildung der Haarnadel kann daher den fluoreszierenden Reporter und den Quencher zusammenbringen, sodass keine Fluoreszenz emittiert wird. Während des Annealing-(Glüh-)Vorgangs der Amplifikationsreaktion der von einem Subjekt erlangten oder abgeleiteten Vielzahl zellfreier Nukleinsäuremoleküle kann der Schleifenabschnitt des molekularen Beacons jedoch an seine Zielsequenz binden, wodurch der Stamm denaturiert wird. Auf diese Weise können der Reporter und der Quencher getrennt werden, wodurch das Quenching aufgehoben wird und der fluoreszierende Reporter aktiviert und nachweisbar ist. Da die Fluoreszenz des fluoreszierenden Reporters nur dann von der molekularen Beacon-Sonde emittiert wird, wenn die Sonde an die Zielsequenz gebunden ist, kann die Menge oder der Grad der nachgewiesenen Fluoreszenz proportional zur Menge des Ziels in der Reaktion sein (z. B. (i) einer Gesamtzahl zellfreier Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten in jedem Stadium umfassend identifiziert wurden oder (ii) einer durchschnittlichen Anzahl der Vielzahl von Phasenvarianten pro zellfreiem Nukleinsäuremolekül, das als die Vielzahl von Phasenvarianten umfassend identifiziert wurde, wie hierin offenbart).
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das aktivierbare Reporteragens bei der Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl der Phasenvarianten hybridisiert wurde, aktiviert werden. Mit anderen Worten, sobald die individuelle Nukleinsäuresonde mit dem Teil des zellfreien Zielnukleinsäuremoleküls hybridisiert ist, der die Vielzahl der Phasenvarianten umfasst, kann die Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde und der zellfreien Zielnukleinsäure das aktivierbare Reporteragens aktivieren. Nicht einschränkende Beispiele für derartige Nukleinsäuresonden können eine Hydrolysesonde (z. B. TaqMan-Sonde), duale Hybridisierungssonden und QZyme PCR-Primer beinhalten.
  • Beispielsweise kann die Nukleinsäuresonde eine Hydrolysesonde sein, wie in 26B dargestellt. Die Hydrolysesonde 2611 kann eine fluoreszenzmarkierte Oligonukleotidsonde sein, die spezifisch an einen Teil (z. B. zwischen etwa 10 und etwa 25 Nukleotiden) des zellfreien Zielnukleinsäuremoleküls 2613 hybridisieren kann, wobei der hybridisierte Teil zwei oder mehr Phasenvarianten umfasst. Die Hydrolysesonde 2611 kann mit einem fluoreszierenden Reporter am 5'-Ende und einem Quencher am 3'-Ende markiert sein. Ist die Hydrolysesonde intakt (z. B. nicht gespalten), wird die Fluoreszenz des Reporters aufgrund seiner Nähe zum Quencher gequencht ( 26B). Während des Annealing-Vorgangs der Amplifikationsreaktion der Vielzahl der von dem Subjekt erlangten oder abgeleiteten zellfreier Nukleinsäuremolekülen 5' → 3' Exonukleaseaktivität bestimmter thermostabiler Polymerasen (z. B. Taq oder Tth). Die Amplifikationsreaktion der Vielzahl der vom Subjekt erlangten oder abgeleiteten zellfreien Nukleinsäuremoleküle kann einen kombinierten Annealing-/Extensionsvorgang beinhalten, bei dem die Hydrolysesonde an das zellfreie Zielnukleinsäuremolekül hybridisiert und die dsDNA-spezifische 5' → 3'-Exonukleaseaktivität einer thermostabilen Polymerase (z. B. Taq oder Tth) den fluoreszierenden Reporter von der Hydrolysesonde abspaltet. Als Ergebnis wird der fluoreszierende Reporter vom Quencher getrennt, was zu einem Fluoreszenzsignal führt, das proportional zur Menge des Ziels in der Probe ist (z. B. (i) einer Gesamtzahl zellfreier Nukleinsäuremoleküle, die als die Vielzahl von Phasenvarianten in jedem Stadium umfassend identifiziert wurden, oder (ii) einer durchschnittlichen Anzahl der Vielzahl von Phasenvarianten für jedes zellfreie Nukleinsäuremolekül, das als eine Vielzahl von Phasenvarianten umfassend identifiziert wurde, wie hierin offenbart).
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das Reporteragens einen Fluoreszenzreporter umfassen. Nicht einschränkende Beispiele für einen fluoreszierenden Reporter beinhalten Fluoresceinamidit (FAM, 2-[3-(Dimethylamino)-6-dimethyliminio-xanthen-9-yl]benzoat TAMRA, (2E)-2-[(2E,4E)-5-(2-tert-butyl-9-ethyl-6,8,8-trimethyl-pyrano[3,2-g]quinolin-1-ium-4-yl)penta-2,4-dienylidene]-1-(6-hydroxy-6-oxo-hexyl)-3,3-Dimethyl-indolin-5-sulfonat Dy 750, 6-Carboxy-2',4,4',5',7,7'-hexachlorofluorescein, 4,5,6,7-Tetrachlorofluorescein TET™, Sulforhodamin 101 Säurechlorid-Succinimidylester Texas Red-X, ALEXA-Farbstoffe, Bodipy-Farbstoffe, Cyanin-Farbstoffe, Rhodamin 123 (Hydrochlorid), Well RED-Farbstoffe, MAX und TEX 613. In einigen Fällen umfasst das Reporteragens außerdem einen Quencher, wie hierin offenbart. Nicht einschränkende Beispiele für einen Quencher können Black Hole Quencher, Iowa Black Quencher und 4-Dimethylaminoazobenzol-4'-sulfonylchlorid (DABCYL) beinhalten.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann jede den Nukleinsäuresondensatz verwendende PCR-Reaktion mittels Echtzeit-PCR (qPCR) durchgeführt werden. Alternativ kann die PCR-Reaktion unter Verwendung des Nukleinsäuresondensatzes mittels digitaler PCR (dPCR) durchgeführt werden.
  • 24 zeigt ein beispielhaftes Ablaufdiagramm eines Verfahrens zur Durchführung einer klinischen Intervention und/oder Behandlung basierend auf dem Nachweis zirkulierender Nukleinsäuren in der biologischen Probe einer Person. In mehreren Ausführungsformen wird der Nachweis von zirkulierenden Tumor-Nukleinsäuren durch den Nachweis somatischer Varianten in Phase in einer zellfreien Nukleinsäureprobe bestimmt. In vielen Ausführungsformen zeigt der Nachweis von zirkulierenden Nukleinsäuren indikativ ein Vorliegen von Krebs an, sodass eine entsprechende klinische Intervention und/oder Behandlung durchgeführt werden kann.
  • Unter Bezugnahme auf 24 kann der Prozess 2400 mit der Gewinnung, Aufbereitung und Sequenzierung (2401) zellfreier Nukleinsäuren beginnen, die aus einer nichtinvasiven Biopsie (z. B. Flüssigkeits- oder Ausscheidungsbiopsie) erlangt wurden, wobei ein Erfassungssequenzierungsansatz für Bereiche verwendet wird, die nachweislich eine Vielzahl genetischer Mutationen oder Varianten beherbergen, die in Phase auftreten. In mehreren Ausführungsformen wird cfDNA und/oder cfRNA aus Plasma, Blut, Lymphe, Speichel, Urin, Stuhl und/oder anderen geeigneten Körperflüssigkeiten extrahiert. Zellfreie Nukleinsäuren können auf beliebige geeignete Weise isoliert und gereinigt werden. In einigen Ausführungsformen wird die Säulenreinigung verwendet (z. B. QIAamp Circulating Nucleic Acid Kit der Firma Qiagen, Hilden, Deutschland). In einigen Ausführungsformen können isolierte RNA-Fragmente zur weiteren nachgeordneten Analyse in komplementäre DNA umgewandelt werden.
  • In einigen Ausführungsformen wird vor einer Krebsindikation eine Biopsie entnommen. In einigen Ausführungsformen wird eine Biopsie entnommen, um ein frühes Screening zum Nachweis einer Krebserkrankung durchzuführen. In einigen Ausführungsformen wird eine Biopsie entnommen, um zu ermitteln, ob im Anschluss an eine Behandlung noch eine Krebserkrankung vorhanden ist. In einigen Ausführungsformen wird während der Behandlung eine Biopsie entnommen, um zu ermitteln, ob die Behandlung die gewünschte Reaktion hervorruft. Es kann ein Screening auf beliebige Krebsarten durchgeführt werden. In einigen Ausführungsformen wird ein Screening zum Nachweis einer Krebserkrankung durchgeführt, die somatische Phasenvarianten in stereotypen Bereichen des Genoms entwickelt, wie (beispielsweise) das Lymphom. In einigen Ausführungsformen wird ein Screening zum Nachweis einer Krebserkrankung durchgeführt, bei der somatische Phasenvarianten unter Verwendung einer zuvor entnommenen Krebsbiopsie entdeckt wurden.
  • In einigen Ausführungsformen wird eine Biopsie von einer Person entnommen, bei der ein bestimmtes Risiko für die Entwicklung einer Krebserkrankung besteht, wie z. B. bei Personen mit einer familiären Vorgeschichte der Erkrankung oder mit bestimmten Risikofaktoren (z. B. Exposition gegenüber Karzinogenen). In vielen Fällen wird eine Biopsie von einer beliebigen Person aus der Allgemeinbevölkerung entnommen. In einigen Ausführungsformen wird eine Biopsie von Personen entnommen, die einer bestimmten Altersgruppe mit erhöhtem Krebsrisiko angehören, wie beispielsweise ältere Personen über 50 Jahre. In einigen Ausführungsformen wird eine Biopsie von einer Person entnommen, bei der Krebs diagnostiziert und behandelt wurde.
  • In einigen Ausführungsformen werden extrahierte zellfreie Nukleinsäuren für die Sequenzierung vorbereitet. Dementsprechend werden zellfreie Nukleinsäuren zur Sequenzierung in eine Molekularbibliothek umgewandelt. In einigen Ausführungsformen werden Adapter und/oder Primer an zellfreie Nukleinsäuren angehängt, um die Sequenzierung zu ermöglichen. In einigen Ausführungsformen ist eine gezielte Sequenzierung bestimmter genomischer Loci durchzuführen, sodass bestimmte Sequenzen, die den bestimmten Loci entsprechen, vor der Sequenzierung durch Hybridisierung erfasst werden (z. B. Erfassungssequenzierung). In einigen Ausführungsformen wird die Erfassungssequenzierung unter Verwendung einer Reihe von Sonden durchgeführt, die Bereiche herunterziehen (oder erfassen), von denen bekannt ist, dass sie häufig Phasenvarianten für einen bestimmten Krebs (z. B. Lymphom) beherbergen. In einigen Ausführungsformen wird die Erfassungssequenzierung unter Verwendung eines Sondensatzes durchgeführt, der Bereiche herunterzieht (oder erfasst), die nachweislich Phasenvarianten beherbergen, die zuvor durch die Sequenzierung einer Biopsie des Krebses bestimmt wurden. Eine ausführlichere Beschreibung der Erfassungssequenzierung und der Sonden ist im Abschnitt „Erfassungssequenzierung“ bereitgestellt.
  • In einigen Ausführungsformen kann jede geeignete Sequenzierungstechnik verwendet werden, mit der Phasenvarianten nachgewiesen werden können, die indikativ für zirkulierende Tumor-Nukleinsäuren sind. Sequenzierungstechniken beinhalten (sind aber nicht beschränkt auf) 454-Sequenzierung, Illumina-Sequenzierung, SOLiD-Sequenzierung, Ion-Torrent-Sequenzierung, Single-Read-Sequenzierung, Paired-End-Sequenzierung, usw.
  • Prozess 2400 analysiert (2403) das Ergebnis der zellfreien Nukleinsäure-Sequenzierung zum Nachweis zirkulierender Tumor-Nukleinsäuresequenzen, die durch den Nachweis somatischer, in der Phase auftretender Varianten bestimmt werden. Da Krebs aktiv wächst und sich ausbreitet, geben neoplastische Zellen häufig Biomoleküle (insbesondere Nukleinsäuren) in das Gefäßsystem, die Lymphe und/oder Ausscheidungssysteme ab. Darüber hinaus brechen neoplastische Zellen aufgrund biophysikalischer Zwänge in ihrer lokalen Umgebung häufig auf und geben ihren inneren Zellinhalt in das Gefäßsystem, die Lymphe und/oder Ausscheidungssysteme ab. Dementsprechend ist der Nachweis distaler Primärtumore und/oder Metastasen aus einer Flüssigkeits- oder Ausscheidungsbiopsie möglich.
  • Der Nachweis zirkulierender Tumor-Nukleinsäuresequenzen deutet darauf hin, dass bei dem untersuchten Individuum ein Krebs vorliegt. Dementsprechend kann basierend auf dem Nachweis von zirkulierenden Tumor-Nukleinsäuren eine klinische Intervention und/oder Behandlung durchgeführt werden (2405). In einer Anzahl von Ausführungsformen wird ein klinisches Verfahren durchgeführt, wie (zum Beispiel) ein Bluttest, ein Gentest, eine medizinische Bildgebung, eine körperliche Untersuchung, eine Tumorbiopsie oder eine beliebige Kombination davon. In einigen Ausführungsformen werden Diagnosen zur Bestimmung des jeweiligen Krebsstadiums durchgeführt. In einer Anzahl von Ausführungsformen wird eine Behandlung durchgeführt, wie (zum Beispiel) Chemotherapie, Radiotherapie, Chemoradiotherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie, Operation, Transplantation, Transfusion, medizinische Überwachung oder eine beliebige Kombination davon. In einigen Ausführungsformen wird ein Individuum von medizinischem Fachpersonal, wie etwa einem Arzt, Mediziner, medizinischen Fachangestellten, einer Krankenschwester, einem Pfleger, Ernährungsberater oder dergleichen.
  • Verschiedene Ausführungsformen der vorliegenden Offenbarung zielen darauf ab, den Nachweis von Krebs zur Durchführung klinischer Interventionen zu nutzen. In einer Reihe von Ausführungsformen wird eine Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums mit den hierin beschriebenen Verfahren gescreent und verarbeitet, um anzuzeigen, dass das Individuum Krebs hat und daher eine Intervention durchzuführen ist. Klinische Interventionen beinhalten klinische Verfahren und Behandlungen. Klinische Verfahren beinhalten (sind aber nicht beschränkt auf) Bluttests, Gentests, medizinische Bildgebung, körperliche Untersuchungen und Tumorbiopsien. Behandlungen beinhalten (sind aber nicht beschränkt auf) Chemotherapie, Radiotherapie, Chemoradiotherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie, Chirurgie, Transplantation, Transfusion und medizinische Überwachung. In einigen Ausführungsformen werden Diagnosen zur Bestimmung des jeweiligen Krebsstadiums durchgeführt. In einigen Ausführungsformen wird ein Individuum von medizinischem Fachpersonal, wie etwa einem Arzt, Mediziner, medizinischen Fachangestellten, einer Krankenschwester, einem Pfleger, Ernährungsberater oder dergleichen.
  • In mehreren hierin beschriebenen Ausführungsformen kann ein Krebs anhand eines Sequenzierungsergebnisses von zellfreien Nukleinsäuren aus Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl nachgewiesen werden. In vielen Ausführungsformen wird Krebs nachgewiesen, wenn ein Sequenzierungsergebnis eine oder mehrere somatische Varianten aufweist, die innerhalb eines kurzen genetischen Fensters, z. B. der Länge eines zellfreien Moleküls (z. B. etwa 170 bp), in Phase vorliegen. In zahlreichen Ausführungsformen wird ein statistisches Verfahren zur Bestimmung verwendet, ob das Vorhandensein von Phasenvarianten aus einer kanzerogenen Quelle abgeleitet ist (im Gegensatz zu einem molekularen Artefakt oder einer anderen biologischen Quelle). In verschiedenen Ausführungsformen wird eine Monte-Carlo-Probennahme als statistisches Verfahren verwendet, um zu bestimmen, ob ein Sequenzierungsergebnis zellfreier Nukleinsäuren Sequenzen zirkulierender Tumor-Nukleinsäuren beinhaltet, basierend auf einem Score, der durch das Vorhandensein von Phasenvarianten bestimmt wird. Dementsprechend werden in einer Reihe von Ausführungsformen zellfreie Nukleinsäuren extrahiert, verarbeitet und sequenziert, und das Sequenzierungsergebnis wird zum Nachweis von Krebs analysiert. Dieses Verfahren ist besonders im klinischen Umfeld nützlich, um einen diagnostischen Scan bereitzustellen.
  • Ein beispielhaftes Verfahren für einen diagnostischen Scan eines Individuums auf B-Zell-Krebs ist wie folgt:
    1. (a) Entnahme einer Flüssigkeits- oder Ausscheidungsbiopsie vom Individuum,
    2. (b) Vorbereitung und Durchführung einer gezielten Sequenzierung zellfreier Nukleinsäuren aus der Biopsie unter Verwendung von Nukleinsäuresonden, die für den B-Zell-Krebs spezifisch sind,
    3. (c) Nachweisen von Phasenvarianten in den Sequenzierungsergebnissen, die indikativ für zirkulierende Tumor-Nukleinsäuresequenzen sind, und
    4. (d) Durchführen einer klinischen Intervention basierend auf dem Nachweis zirkulierender Tumor-Nukleinsäuresequenzen.
  • Ein beispielhaftes Verfahren für einen personalisierten diagnostischen Scan eines Individuums für einen Krebs, der zuvor zum Nachweis von Phasenvarianten in bestimmten genomischen Loci sequenziert wurde, ist wie folgt:
    • Entnahme einer Krebsbiopsie von dem Individuum
    • Sequenzieren der Krebsbiopsie zum Nachweis von Phasenvarianten, die sich in dem Krebs angesammelt haben
      1. (a) Entwickeln und Synthetisieren von Nukleinsäuresonden für genomische Loci, die die Positionen der nachgewiesenen Phasenvarianten beinhalten,
      2. (b) Entnahme einer Flüssigkeits- oder Ausscheidungsbiopsie vom Individuum,
      3. (c) Präparieren und Durchführen einer gezielten Sequenzierung zellfreier Nukleinsäuren aus der Biopsie unter Verwendung der gestalteten und synthetisierten Nukleinsäuresonden,
      4. (d) Nachweisen von Phasenvarianten in den Sequenzierungsergebnissen, die indikativ für zirkulierende Tumor-Nukleinsäuresequenzen sind, und
      5. (e) Durchführen einer klinischen Intervention basierend auf dem Nachweis zirkulierender Tumor-Nukleinsäuresequenzen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann wenigstens ein Teil des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle, die die Vielzahl der Phasenvarianten umfassen, zur Ermittlung der Erkrankung des Subjekts weiter analysiert werden. In dieser Analyse können (i) die identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle und (ii) andere zellfreie Nukleinsäuremoleküle der Vielzahl von zellfreien Nukleinsäuremolekülen, die nicht die Vielzahl von Phasenvarianten umfassen, als unterschiedliche Variablen analysiert werden. In einigen Fällen kann ein Verhältnis von (i) der Anzahl der identifizierten ein oder mehreren zellfreien Nukleinsäuremoleküle und (ii) der Anzahl der anderen zellfreien Nukleinsäuremoleküle der Vielzahl von zellfreien Nukleinsäuremolekülen, die nicht die Vielzahl von Phasenvarianten umfassen, als Faktor zur Bestimmung der Erkrankung des Subjekts verwendet werden. In einigen Fällen kann der Vergleich (i) einer oder mehrerer Position(en) des oder der identifizierten zellfreien Nukleinsäuremoleküle relativ zu der Referenzgenomsequenz und (ii) einer oder mehrerer Position(en) der anderen zellfreien Nukleinsäuremoleküle der Vielzahl zellfreier Nukleinsäuremoleküle, die nicht die Vielzahl der Phasenvarianten umfassen, relativ zu der Referenzgenomsequenz als Faktor zur Bestimmung der Erkrankung des Subjekts verwendet werden.
  • Alternativ kann und muss die Analyse des identifizierten einen oder der mehreren zellfreien Nukleinsäuremoleküle, die die Vielzahl von Phasenvarianten umfassen, zur Bestimmung der Erkrankung des Subjekts nicht auf den anderen zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen basieren, die nicht die Vielzahl von Phasenvarianten umfassen. Wie hierin offenbart, können nicht-einschränkende Beispiele von Informationen oder Merkmalen des einen oder der mehreren zellfreien Nukleinsäuremoleküle, die die Vielzahl von Phasenvarianten umfassen, (i) eine Gesamtzahl solcher zellfreier Nukleinsäuremoleküle und (ii) eine durchschnittliche Anzahl der Vielzahl von Phasenvarianten für jedes Nukleinsäuremolekül in der Population der identifizierten zellfreien Nukleinsäuremoleküle beinhalten.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann daher eine Anzahl der Vielzahl von Phasenvarianten aus dem einen oder den mehreren als die Vielzahl von Phasenvarianten umfassend identifizierten zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts sein. In einigen Fällen kann ein Verhältnis von (i) der Anzahl der Vielzahl von Phasenvarianten aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen und (ii) einer Anzahl von Einzelnukleotidvarianten aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts sein. So kann beispielsweise eine bestimmte Erkrankung (z. B. das follikuläre Lymphom) ein anderes Signaturverhältnis aufweisen als eine andere Erkrankung (z. B. Brustkrebs). In einigen Beispielen für Krebs oder solide Tumore kann das hierin offenbarte Verhältnis zwischen etwa 0,01 und etwa 0,20 liegen. In einigen Beispielen für Krebs oder solide Tumore kann das hierin offenbarte Verhältnis etwa 0,01, etwa 0,02, etwa 0,03, etwa 0,04, etwa 0,05, etwa 0,06, etwa 0,07, etwa 0,08, etwa 0,09, etwa 0,10, etwa 0,11, etwa 0,12, etwa 0,13, etwa 0,14, etwa 0,15, etwa 0,16, etwa 0,17, etwa 0,18, etwa 0,19 oder etwa 0,20 betragen. In einigen Beispielen für Krebs oder solide Tumore kann das hierin offenbarte Verhältnis wenigstens oder bis zu etwa 0,01, wenigstens oder bis zu etwa 0,02, wenigstens oder bis zu etwa 0,03, wenigstens oder bis zu etwa 0,04, wenigstens oder bis zu etwa 0,05, wenigstens oder bis zu etwa 0,06, wenigstens oder bis zu etwa 0,07, wenigstens oder bis zu etwa 0,08, wenigstens oder bis zu etwa 0,09, wenigstens oder bis zu etwa 0,10, wenigstens oder bis zu etwa 0,11, wenigstens oder bis zu etwa 0,12, wenigstens oder bis zu etwa 0,13, wenigstens oder bis zu etwa 0,14, wenigstens oder bis zu etwa 0,15, wenigstens oder bis zu etwa 0,16, wenigstens oder bis zu etwa 0,17, wenigstens oder bis zu etwa 0,18, wenigstens oder bis zu etwa 0,19, oder wenigstens oder bis zu etwa 0,20 betragen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Häufigkeit der Vielzahl von Phasenvarianten in dem einen oder den mehreren identifizierten zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts sein. In einigen Fällen kann basierend auf den hierin offenbarten Sequenzierungsdaten eine durchschnittliche Häufigkeit der Vielzahl von Phasenvarianten pro vorbestimmter Bin-Länge (z. B. ein Bin von etwa 50 Basenpaaren) innerhalb jedes der identifizierten zellfreien Nukleinsäuremoleküle indikativ für die Erkrankung des Subjekts sein. In einigen Fällen kann basierend auf den hierin offenbarten Sequenzierungsdaten eine durchschnittliche Häufigkeit der Vielzahl von Phasenvarianten pro vorbestimmter Bin-Länge (z. B. ein Bin von etwa 50 Basenpaaren) innerhalb jedes der identifizierten zellfreien Nukleinsäuremoleküle, die mit einem bestimmten Gen (z. B. BCL2, PIM1) assoziiert sind, indikativ für die Erkrankung des Subjekts sein. Die Größe der Bin kann etwa 30, etwa 40, etwa 50, etwa 60, etwa 70 oder etwa 80 betragen.
  • In einigen Beispielen kann eine erste Erkrankung (z. B. Hodgkin-Lymphom oder HL) eine erste Durchschnittshäufigkeit und eine zweite Erkrankung (z. B. DLBCL) eine andere Durchschnittshäufigkeit aufweisen, wodurch die Identifizierung und/oder Bestimmung ermöglicht wird, ob der Proband eine bestimmte Erkrankung hat oder der Verdacht auf eine solche besteht. In einigen Beispielen kann eine erste Unterart einer Krankheit eine erste Durchschnittshäufigkeit und eine zweite Unterart derselben Krankheit eine andere Durchschnittshäufigkeit aufweisen, wodurch die Identifizierung und/oder Bestimmung ermöglicht wird, ob der Proband an einer bestimmten Unterart der Krankheit leidet oder der Verdacht darauf besteht. Zum Beispiel kann der Proband DLBCL haben, und ein oder mehrere zellfreie Nukleinsäuremoleküle, die von Keimzentrum-B-Zell-(GCB-)DLBCL oder aktiviertem B-Zell-(ABC-)DLBCL abgeleitet sind, können eine unterschiedliche durchschnittliche Häufigkeit der Vielzahl von Phasenvarianten pro vorbestimmter Bin-Länge aufweisen, wie hierin offenbart.
  • In einigen Beispielen kann eine Erkrankung des Subjekts eine vorbestimmte Anzahl von Phasenvarianten aufweisen, die sich über vorbestimmte genomische Loci erstrecken (d .h. eine vorbestimmte Häufigkeit von Phasenvarianten). Stimmt die vorbestimmte Häufigkeit der Phasenvarianten mit einer Häufigkeit der Vielzahl von Phasenvarianten in dem einen oder den mehreren zellfreien Nukleinsäuremolekülen überein, die aus einer Vielzahl von zellfreien Nukleinsäuremolekülen des Subjekts identifiziert wurden, kann dies indikativ für die Erkrankung des Subjekts sein.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können das eine oder die mehreren zellfreien Nukleinsäuremoleküle, die als die Vielzahl der Phasenvarianten umfassend identifiziert wurden, analysiert werden, um ihren genomischen Ursprung zu bestimmen (z. B. von welchem Genort sie stammen). Der genomische Ursprung des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle kann indikativ für die Erkrankung des Subjekts sein, da verschiedene Erkrankungen die Vielzahl von Phasenvarianten in verschiedenen Signaturgenen aufweisen können. Zum Beispiel kann ein Proband GCB DLBCL haben, und ein oder mehrere aus GCBs des Subjekts stammende zellfreie Nukleinsäuremoleküle können die Phasenvarianten im BCL2-Gen aufweisen, während ein oder mehrere aus ABCs desselben Subjekt stammende zellfreie Nukleinsäuremoleküle möglicherweise nicht so viele Phasenvarianten im BCL2-Gen aufweisen wie die aus GCBs. Andererseits kann ein Proband ABC DLBCL haben, und ein oder mehrere aus ABCs des Subjekts stammende zellfreie Nukleinsäuremoleküle können die Phasenvarianten im PIM1-Gen aufweisen, während ein oder mehrere aus GCBs desselben Subjekt stammende zellfreie Nukleinsäuremoleküle möglicherweise nicht so viele Phasenvarianten im PIM1-Gen aufweisen wie die aus ABCs.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 %, wenigstens oder bis zu etwa 50 %, wenigstens oder bis zu etwa 55 %, wenigstens oder bis zu etwa 60 %, wenigstens oder bis zu etwa 65 %, wenigstens oder bis zu etwa 70 %, wenigstens oder bis zu etwa 75 %, wenigstens oder bis zu etwa 80 %, wenigstens oder bis zu etwa 85 %, wenigstens oder bis zu etwa 90 %, wenigstens oder bis zu etwa 95 %, wenigstens oder bis zu etwa 99 % oder etwa 100 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 2 Nukleotide von einer benachbarten SNV entfernt ist.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % der einen oder mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 3 Nukleotide von einer benachbarten SNV entfernt ist.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 4 Nukleotide von einer benachbarten SNV entfernt ist.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 5 Nukleotide von einer benachbarten SNV entfernt ist.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 6 Nukleotide von einer benachbarten SNV entfernt ist.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 7 Nukleotide von einer benachbarten SNV entfernt ist.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 8 Nukleotide von einer benachbarten SNV entfernt ist.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 9 Nukleotide von einer benachbarten SNV entfernt ist.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 % oder wenigstens oder bis zu etwa 50 % des einen oder der mehreren die Vielzahl der Phasenvarianten umfassenden zellfreien Nukleinsäuremoleküle eine Einzelnukleotidvariante (SNV) umfassen, die wenigstens 10 Nukleotide von einer benachbarten SNV entfernt ist.
  • C. Referenzgenomsequenz
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Referenzgenomsequenz wenigstens ein Teil einer Nukleinsäure-Sequenzdatenbank (d. h. eines Referenzgenoms) sein, die aus genetischen Daten zusammengesetzt ist und das Genom einer Referenzkohorte darstellen soll. In einigen Fällen kann eine Referenzkohorte eine Sammlung von Individuen mit einem/einer spezifischen oder variierenden Genotyp, Haplotyp, Demographie, Geschlecht, Nationalität, Alter, ethnischer Zugehörigkeit, Verwandtschaft, körperlicher Verfassung (z. B. gesund oder mit der gleichen oder einer anderen Erkrankung diagnostiziert, wie einer spezifischen Art von Krebs) oder anderen Gruppierungen sein. Eine wie hierin offenbarte Referenzgenomsequenz kann ein Mosaik (oder eine Konsensussequenz) der Genomen von zwei oder mehr Individuen sein. Die Referenzgenomsequenz kann wenigstens einen Teil eines öffentlich zugänglichen Referenzgenoms oder eines privaten Referenzgenoms umfassen. Nicht einschränkende Beispiele für ein menschliches Referenzgenom beinhalten hg19, hg18, hg17, hg16 und hg38.
  • In einigen Beispielen kann die Referenzgenomsequenz wenigstens oder bis zu etwa 500 Nukleobasen, wenigstens oder bis zu etwa 1 Kilobase (kb), wenigstens oder bis zu etwa 2 kb, wenigstens oder bis zu etwa 3 kb, wenigstens oder bis zu etwa 4 kb, wenigstens oder bis zu etwa 5 kb, wenigstens oder bis zu etwa 6 kb, wenigstens oder bis zu etwa 7 kb, wenigstens oder bis zu etwa 8 kb, wenigstens oder bis zu etwa 9 kb, wenigstens oder bis zu etwa 10 kb, wenigstens oder bis zu etwa 20 kb, wenigstens oder bis zu etwa 30 kb, wenigstens oder bis zu etwa 40 kb, wenigstens oder bis zu etwa 50 kb, wenigstens oder bis zu etwa 60 kb, wenigstens oder bis zu etwa 70 kb, wenigstens oder bis zu etwa 80 kb, wenigstens oder bis zu etwa 90 kb, wenigstens oder bis zu etwa 100 kb, wenigstens oder bis zu etwa 200 kb, wenigstens oder bis zu etwa 300 kb, wenigstens oder bis zu etwa 400 kb, wenigstens oder bis zu etwa 500 kb, wenigstens oder bis zu etwa 600 kb, wenigstens oder bis zu etwa 700 kb, wenigstens oder bis zu etwa 800 kb, wenigstens oder bis zu etwa 900 kb, wenigstens oder bis zu etwa 1.000 kb, wenigstens oder bis zu etwa 2.000 kb, wenigstens oder bis zu etwa 3.000 kb, wenigstens oder bis zu etwa 4.000 kb, wenigstens oder bis zu etwa 5.000 kb, wenigstens oder bis zu etwa 6.000 kb, wenigstens oder bis zu etwa 7.000 kB, wenigstens oder bis zu etwa 8.000 kb, wenigstens oder bis zu etwa 9.000 kb, wenigstens oder bis zu etwa 10.000 kb, wenigstens oder bis zu etwa 20.000 kb, wenigstens oder bis zu etwa 30.000 kb, wenigstens oder bis zu etwa 40.000 kb, wenigstens oder bis zu etwa 50.000 kb, wenigstens oder bis zu etwa 60.000 kb, wenigstens oder bis zu etwa 70.000 kb, wenigstens oder bis zu etwa 80.000 kb, wenigstens oder bis zu etwa 90.000 kb, oder wenigstens oder bis zu etwa 100.000 kb umfassen.
  • In einigen Fällen kann es sich bei der Referenzgenomsequenz um das gesamte Referenzgenom oder um einen Teil (z. B. einen für die Erkrankung relevanten Teil) des Genoms handeln. Die Referenzgenomsequenz kann zum Beispiel aus wenigstens 1, 2, 3, 4, 5 oder mehr Genen bestehen, die bei bestimmten Arten von Krebs eine aberrante somatische Hypermutation aufweisen. In einigen Fällen kann die Referenzgenomsequenz eine ganze chromosomale Sequenz oder ein Fragment davon sein. In einigen Fällen kann die Referenzgenomsequenz zwei oder mehr (z. B. wenigstens 2, 3, 4, 5 oder mehr) verschiedene Teile des Referenzgenoms umfassen, die nicht nebeneinander liegen (z. B. innerhalb desselben Chromosoms oder von verschiedenen Chromosomen).
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Referenzgenomsequenz wenigstens ein Teil eines Referenzgenoms eines ausgewählten Individuums sein, wie etwa eines gesunden Individuums oder des Subjekts eines der hierin offenbarten Verfahren.
  • In einigen Fällen kann die Referenzgenomsequenz von einem Individuum abgeleitet werden, das kein Proband ist (z. B. von einem gesunden Kontrollindividuum). In einigen Fällen kann die Referenzgenomsequenz alternativ aus einer Probe des Subjekts abgeleitet werden. In einigen Beispielen kann die Probe eine gesunde Probe des Subjekts sein. Die gesunde Probe des Subjekts kann jede beliebige Zelle des Subjekts sein, die gesund ist, z. B. ein gesundes Leukozyt. Durch den Vergleich der Sequenzierungsdaten der Vielzahl zellfreier Nukleinsäuremoleküle (z. B. cfDNA-Moleküle) des Subjekts mit wenigstens einem Teil der genomischen Sequenz einer gesunden Zelle desselben Subjekt können, wie hierin offenbart, ein oder mehrere die Vielzahl von Phasenvarianten enthaltende zellfreie Nukleinsäuremoleküle identifiziert und analysiert werden. In einigen Beispielen kann es sich bei der Probe um eine erkrankte Probe des Subjekts, wie etwa eine erkrankte Zelle (z. B. eine Tumorzelle) oder einen soliden Tumor handeln. Die Referenzgenomsequenz kann durch Sequenzierung wenigstens eines Teils einer erkrankten Zelle des Subjekts oder durch Sequenzierung einer Vielzahl von zellfreien Nukleinsäuremolekülen erlangt werden, die aus dem soliden Tumor des Subjekts erlangt wurden. Sobald bei dem Subjekt eine bestimmte Erkrankung)z. B. eine Erkrankung) diagnostiziert wurde, kann die Referenzgenomsequenz des Subjekts, die die Vielzahl der Phasenvarianten umfasst, zur Ermittlung verwendet werden, ob der Proband zu zukünftigen Zeitpunkten immer noch die gleichen Phasenvarianten aufweist. In diesem Zusammenhang können beliebige neue Phasenvarianten, die zwischen der „erkrankten“ Referenzgenomsequenz des Subjekts und neuen zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet wurden, identifiziert wurden, indikativ für ein geringeres Ausmaß aberranter somatischer Hypermutation in bestimmten genomischen Loci sein (z. B. wenigstens eine Teilremission).
  • In verschiedenen Ausführungsformen können diagnostische Scans für beliebige Neoplasmentypen durchgeführt werden, einschließlich (aber nicht beschränkt auf) akute lymphatische Leukämie (ALL), akute myeloische Leukämie (AML), Analkrebs, Astrozytome, Basalzellkarzinom, Gallengangskrebs, Blasenkrebs, Brustkrebs, Burkitt-Lymphom, Gebärmutterhalskrebs, chronische lymphozytäre Leukämie (CLL), chronische myeloische Leukämie (CML), chronische myeloproliferative Neoplasmen, Darmkrebs, diffuses großzelliges B-Zell-Lymphom, Endometriumkrebs, Ependymom, Speiseröhrenkrebs, Östhesioneuroblastom, Ewing-Sarkom, Eileiterkrebs, follikuläres Lymphom, Gallenblasenkrebs, Magenkrebs, gastrointestinaler Karzinoidtumor, Haarzellenleukämie, Leberzellkrebs, Hodgkin-Lymphom, Hypopharynxkrebs, Kaposi-Sarkom, Nierenkrebs, Langerhans-Zell-Histiozytose, Kehlkopfkrebs, Leukämie, Leberkrebs, Lungenkrebs, Lymphom, Melanom, Merkel-Zell-Krebs, Mesotheliom, Mundkrebs, Neuroblastom, Non-Hodgkin-Lymphom, nicht-kleinzelliger Lungenkrebs, Osteosarkom, Eierstockkrebs, Bauchspeicheldrüsenkrebs, neuroendokrine Tumore der Bauchspeicheldrüse, Rachenkrebs, Hypophysentumor, Prostatakrebs, Rektumkarzinom, Nierenzellkrebs, Retinoblastom, Hautkrebs, kleinzelliger Lungenkrebs, Dünndarmkrebs, Plattenepithelkarzinom des Halses, T-Zell-Lymphom, Hodenkrebs, Thymom, Schilddrüsenkrebs, Gebärmutterkrebs, Vaginalkrebs und vaskuläre Tumore.
  • In einer Reihe von Ausführungsformen wird ein diagnostischer Scan zum frühen Nachweis von Krebs eingesetzt. In einigen Ausführungsformen weist ein diagnostischer Scan Krebs bei Individuen mit Krebs im Stadium I, II oder III nach. In einigen Ausführungsformen wird ein diagnostischer Scan zum Nachweis von MRD oder Tumorlast verwendet. In einigen Ausführungsformen wird ein diagnostischer Scan verwendet, um den Verlauf (z. B. Progression oder Regression) der Behandlung zu ermitteln. Basierend auf dem diagnostischen Scan kann ein klinisches Verfahren und/oder eine Behandlung durchgeführt werden.
  • D. Nukleinsäuresonden
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz basierend auf einer der Subjekt-Referenzgenomsequenzen der vorliegenden Offenbarung gestaltet werden. In einigen Fällen kann der Nukleinsäuresondensatz basierend auf der Vielzahl von Phasenvarianten gestaltet werden, die durch den Vergleich von (i) Sequenzierungsdaten aus einem soliden Tumor des Subjekts und (ii) Sequenzierungsdaten aus einer gesunden Zelle des Subjekts oder einer gesunden Kohorte, wie hierin offenbart identifiziert wurden. Der Nukleinsäuresondensatz kann basierend auf der Vielzahl von Phasenvarianten gestaltet werden, die durch den Vergleich von (i) Sequenzierungsdaten aus einem soliden Tumor des Subjekts und (ii) Sequenzierungsdaten aus einer gesunden Zelle des Subjekts identifiziert wurden. Der Nukleinsäuresondensatz kann basierend auf der Vielzahl von Phasenvarianten gestaltet werden, die durch den Vergleich von (i) Sequenzierungsdaten aus einem soliden Tumor des Subjekts und (ii) Sequenzierungsdaten aus einer gesunden Zelle einer gesunden Kohorte identifiziert wurden.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren ist der Nukleinsäuresondensatz zur Hybridisierung mit Sequenzen der mit der Erkrankung assoziierten genomischen Loci gestaltet. Wie hierin offenbart, können die mit der Erkrankung assoziierten genomischen Loci als eine aberrante somatische Hypermutation erfahrend oder aufweisend bestimmt werden, wenn der Proband die Erkrankung hat. Alternativ dazu sind die Nukleinsäuresondensätze zur Hybridisierung mit Sequenzen stereotyper Bereiche gestaltet.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz zur Hybridisierung mit wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 %, wenigstens etwa 95 %, wenigstens etwa 99 % oder wenigstens etwa 100 % der in Tabelle 1 identifizierten Genombereiche gestaltet sein.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz zur Hybridisierung mit wenigstens einem Teil der zellfreien Nukleinsäure (z. B. cfDNA-)Molekülen gestaltet sein, die von wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 %, wenigstens etwa 95 %, wenigstens etwa 99 % oder etwa 100 % der in Tabelle 1 identifizierten Genombereiche abgeleitet sind.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann jede Nukleinsäuresonde des Nukleinsäuresondensatzes wenigstens etwa 50 %, wenigstens etwa 55 %, wenigstens etwa 60 %, wenigstens etwa 65 %, wenigstens etwa 70 %, wenigstens etwa 75 %, wenigstens etwa 80 %, wenigstens etwa 85 %, wenigstens etwa 90 % , wenigstens etwa 95 % Sequenzidentität, wenigstens etwa 99 % oder wenigstens etwa 100 % Sequenzidentität mit einer aus Tabelle 6 ausgewählten Sondensequenz aufweisen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz wenigstens etwa 1 %, wenigstens etwa 2 %, wenigstens etwa 3 %, wenigstens etwa 4 %, wenigstens etwa 5 %, wenigstens etwa 6 %, wenigstens etwa 7 %, wenigstens etwa 8 %, wenigstens etwa 9 %, wenigstens etwa 10 %, wenigstens etwa 15 %, wenigstens etwa 20 %, wenigstens etwa 25 %, wenigstens etwa 30 %, wenigstens etwa 35 %, wenigstens etwa 40 %, wenigstens etwa 45 %, wenigstens etwa 50 %, wenigstens etwa 55 %, wenigstens etwa 60 %, wenigstens etwa 65 %, wenigstens etwa 70 %, wenigstens etwa 75 %, wenigstens etwa 80 %, wenigstens etwa 85 %, wenigstens etwa 90 %, wenigstens etwa 95 %, wenigstens etwa 99 % oder etwa 100 % der Sondensequenzen in Tabelle 6 umfassen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz zur Abdeckung eines oder mehrerer Zielgenombereich gestaltet sein, die wenigstens oder bis zu etwa 500 Nukleobasen, wenigstens oder bis zu etwa 1 Kilobase (kb), wenigstens oder bis zu etwa 2 kb, wenigstens oder bis zu etwa 3 kb, wenigstens oder bis zu etwa 4 kb, wenigstens oder bis zu etwa 5 kb, wenigstens oder bis zu etwa 6 kb, wenigstens oder bis zu etwa 7 kb, wenigstens oder bis zu etwa 8 kb umfassen, wenigstens oder bis zu etwa 9 kb, wenigstens oder bis zu etwa 10 kb, wenigstens oder bis zu etwa 20 kb, wenigstens oder bis zu etwa 30 kb, wenigstens oder bis zu etwa 40 kb, wenigstens oder bis zu etwa 50 kb, wenigstens oder bis zu etwa 60 kb, wenigstens oder bis zu etwa 70 kb, wenigstens oder bis zu etwa 80 kb, wenigstens oder bis zu etwa 90 kb, wenigstens oder bis zu etwa 100 kb, wenigstens oder bis zu etwa 200 kb, wenigstens oder bis zu etwa 300 kb, wenigstens oder bis zu etwa 400 kb, oder wenigstens oder bis zu etwa 500 kb umfassen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann ein Zielgenombereich (z. B. ein genomischer Ziellocus) des einen oder mehrerer Zielgenombereiche höchstens etwa 200 Nukleobasen, höchstens etwa 300 Nukleobasen, 400 Nukleobasen, höchstens etwa 500 Nukleobasen, höchstens etwa 600 Nukleobasen, höchstens etwa 700 Nukleobasen, höchstens etwa 800 Nukleobasen, höchstens etwa 900 Nukleobasen, höchstens etwa 1 kb, höchstens etwa 2 kb, höchstens etwa 3 kb, höchstens etwa 4 kb, höchstens etwa 5 kb, höchstens etwa 6 kb, höchstens etwa 7 kb, höchstens etwa 8 kb, höchstens etwa 9 kb, höchstens etwa 10 kb, höchstens etwa 11 kb, höchstens etwa 12 kb, höchstens etwa 13 kb, höchstens etwa 14 kb, höchstens etwa 15 kb, höchstens etwa 16 kb, höchstens etwa 17 kb, höchstens etwa 18 kb, höchstens etwa 19 kb, höchstens etwa 20 kb, höchstens etwa 25 kb, höchstens etwa 30 kb, höchstens etwa 35 kb, höchstens etwa 40 kb, höchstens etwa 45 kb, höchstens etwa 50 kb, oder höchstens etwa 100 kb umfassen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz wenigstens oder bis zu etwa 10, wenigstens oder bis zu etwa 20, wenigstens oder bis zu etwa 30, wenigstens oder bis zu etwa 40, wenigstens oder bis zu etwa 50, wenigstens oder bis zu etwa 60, wenigstens oder bis zu etwa 70, wenigstens oder bis zu etwa 80, wenigstens oder bis zu etwa 90, wenigstens oder bis zu etwa 100, wenigstens oder bis zu etwa 200, wenigstens oder bis zu etwa 300, wenigstens oder bis zu etwa 400, wenigstens oder bis zu etwa 500, wenigstens oder bis zu etwa 600, wenigstens oder bis zu etwa 700, wenigstens oder bis zu etwa 800, wenigstens oder bis zu etwa 900, wenigstens oder bis zu etwa 1.000, wenigstens oder bis zu etwa 2.000, wenigstens oder bis zu etwa 3.000, wenigstens oder bis zu etwa 4.000 oder wenigstens oder bis zu etwa 5.000 verschiedene Nukleinsäuresonden umfassen, die zur Hybridisierung mit verschiedenen Ziel-Nukleinsäuresequenzen gestaltet sind.
  • In einigen Ausführungsformen eines der hierin offenbarten Verfahren kann der Nukleinsäuresondensatz eine Länge von wenigstens oder bis zu etwa 50, wenigstens oder bis zu etwa 55, wenigstens oder bis zu etwa 60, wenigstens oder bis zu etwa 65, wenigstens oder bis zu etwa 70, wenigstens oder bis zu etwa 75, wenigstens oder bis zu etwa 80, wenigstens oder bis zu etwa 85, wenigstens oder bis zu etwa 90, wenigstens oder bis zu etwa 95, oder wenigstens oder bis zu etwa 100 Nukleotiden aufweisen.
  • In einem Aspekt sieht die vorliegende Offenbarung eine Zusammensetzung vor, umfassend einen Ködersatz, umfassend einen beliebigen Satz der hierin offenbaren Nukleinsäuresondensätze. Die einen solchen Ködersatz umfassende Zusammensetzung kann für beliebige der hierin offenbarten Verfahren verwendet werden. In einigen Fällen kann der Nukleinsäuresondensatz für das Pull-Down (oder die Erfassung) von cfDNA-Molekülen gestaltet sein. In einigen Fällen kann der Nukleinsäuresondensatz für das Pull-Down (oder die Erfassung) von cfRNA-Molekülen gestaltet sein.
  • In einigen Ausführungsformen kann der Ködersatz einen Nukleinsäuresondensatz umfassen, der für das Pull-Down zellfreier Nukleinsäuremoleküle (z. B. cfDNA-Moleküle), die aus den in Tabelle 1 aufgeführten Genombereichen abgeleitet sind, gestaltet ist. Der Nukleinsäuresondensatz kann für das Pull-Down zellfreier Nukleinsäuremoleküle gestaltet sein, die aus wenigstens oder bis zu etwa 1 %, wenigstens oder bis zu etwa 2 %, wenigstens oder bis zu etwa 3 %, wenigstens oder bis zu etwa 4 %, wenigstens oder bis zu etwa 5 %, wenigstens oder bis zu etwa 6 %, wenigstens oder bis zu etwa 7 %, wenigstens oder bis zu etwa 8 %, wenigstens oder bis zu etwa 9 %, wenigstens oder bis zu etwa 10 %, wenigstens oder bis zu etwa 15 %, wenigstens oder bis zu etwa 20 %, wenigstens oder bis zu etwa 25 %, wenigstens oder bis zu etwa 30 %, wenigstens oder bis zu etwa 35 %, wenigstens oder bis zu etwa 40 %, wenigstens oder bis zu etwa 45 %, wenigstens oder bis zu etwa 50 %, wenigstens oder bis zu etwa 55 %, wenigstens oder bis zu etwa 60 %, wenigstens oder bis zu etwa 65 %, wenigstens oder bis zu etwa 70 %, wenigstens oder bis zu etwa 75 %, wenigstens oder bis zu etwa 80 %, wenigstens oder bis zu etwa 85 %, wenigstens oder bis zu etwa 90 %, wenigstens oder bis zu etwa 95 %, wenigstens oder bis zu etwa 99 % oder etwa 100 % der in Tabelle 1 aufgeführten Genombereiche abgeleitet sind. In einigen Fällen kann der Nukleinsäuresondensatz für das Pull-Down von cfDNA-Molekülen gestaltet sein. In manchen Fällen kann der Nukleinsäuresondensatz für das Pull-Down von cfRNA-Molekülen gestaltet sein.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen kann eine individuelle Nukleinsäuresonde (oder jede Nukelinsäuresonde) des Nukleinsäuresondensatzes ein Pull-Down-Tag umfassen. Der Pull-Down-Tag kann zur Anreicherung einer Probe (z. B. einer die Vielzahl von Nukleinsäuremolekülen umfassenden Probe, die von dem Subjekt erlangt oder abgeleitet wurde) für eine spezifische Untergruppe verwendet werden (z. B. für zellfreie Nukleinsäuremoleküle, die die Vielzahl von Phasenvarianten umfassen, wie hierin offenbart).
  • In einigen Fällen kann das Pull-Down-Tag einen Nukleinsäure-Barcode umfassen (z. B. auf einer oder beiden Seiten der Nukleinsäuresonde). Durch die Verwendung von Kügelchen oder Substraten, die Nukleinsäuresequenzen mit Komplementarität zum Nukleinsäure-Barcode enthalten, kann der Nukleinsäure-Barcode zum Pull-Down und Anreichern für beliebige Nukleinsäuresonden verwendet werden, die an ein zellfreies Zielnukleinsäuremolekül hybridisiert sind. Alternativ oder zusätzlich kann der Nukleinsäure-Barcode zur Identifizierung des zellfreien Zielnukleinsäuremoleküls aus beliebigen Sequenzierungsdaten (z. B. Sequenzierung durch Amplifikation) verwendet werden, die durch Verwendung eines der hierin offenbaren Nukleinsäuresondensätze erlangt wurden.
  • In einigen Fällen kann der Pull-Down-Tag Affinitätszielgruppe umfassen, die von einer Affinitätsbindungsgruppe spezifisch erkannt und gebunden werden kann. Die Affinitätsbindungsgruppe kann die Affinitätszielgruppe zur Bildung eines Affinitätspaares spezifisch binden. In einigen Fällen kann die Affinitätszielgruppe durch Verwendung von Kügelchen oder Substraten, die die Affinitätsbindungsgruppe umfassen, zum Pull-Down und zur Anreicherung beliebiger Nukleinsäuresonden verwendet werden, die an ein zellfreies Zielnukleinsäuremolekül hybridisiert sind. Alternativ kann der Pull-Down-Tag die Affinitätsbindungsgruppe umfassen, während die Kügelchen/Substrate die Affinitätszielgruppe umfassen können. Nicht einschränkende Beispiele für das Affinitätspaar können Biotin/Avidin, Antikörper/Antigen, Biotin/Streptavidin, Metall/Chelator, Ligand/Rezeptor, Nukleinsäure und Bindungsprotein sowie komplementäre Nukleinsäuren beinhalten. In einem Beispiel kann der Pull-Down-Tag Biotin umfassen.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen kann die Länge eines zellfreien Zielnukleinsäuremoleküls (z. B. cfDNA-Molekül), das von einer beliebigen Subjektnukleinsäuresonde heruntergezogen werden soll, etwa 100 Nukleotide bis etwa 200 Nukleotide betragen. Die Länge des zellfreien Zielnukleinsäuremoleküls kann wenigstens etwa 100 Nukleotide betragen. Die Länge des zellfreien Zielnukleinsäuremoleküls kann höchstens etwa 200 Nukleotide betragen. Die Länge des zellfreien Zielnukleinsäuremoleküls kann etwa 100 Nukleotide bis etwa 110 Nukleotide, etwa 100 Nukleotide bis etwa 120 Nukleotide, etwa 100 Nukleotide bis etwa 130 Nukleotide, etwa 100 Nukleotide bis etwa 140 Nukleotide, etwa 100 Nukleotide bis etwa 150 Nukleotide, etwa 100 Nukleotide bis etwa 160 Nukleotide betragen, etwa 100 Nukleotide bis etwa 170 Nukleotide, etwa 100 Nukleotide bis etwa 180 Nukleotide, etwa 100 Nukleotide bis etwa 190 Nukleotide, etwa 100 Nukleotide bis etwa 200 Nukleotide, etwa 110 Nukleotide bis etwa 120 Nukleotide, etwa 110 Nukleotide bis etwa 130 Nukleotide, etwa 110 Nukleotide bis etwa 140 Nukleotide, etwa 110 Nukleotide bis etwa 150 Nukleotide, etwa 110 Nukleotide bis etwa 160 Nukleotide, etwa 110 Nukleotide bis etwa 170 Nukleotide, etwa 110 Nukleotide bis etwa 180 Nukleotide, etwa 110 Nukleotide bis etwa 190 Nukleotide, etwa 110 Nukleotide bis etwa 200 Nukleotide, etwa 120 Nukleotide bis etwa 130 Nukleotide, etwa 120 Nukleotide bis etwa 140 Nukleotide, etwa 120 Nukleotide bis etwa 150 Nukleotide, etwa 120 Nukleotide bis etwa 160 Nukleotide, etwa 120 Nukleotide bis etwa 170 Nukleotide, etwa 120 Nukleotide bis etwa 180 Nukleotide, etwa 120 Nukleotide bis etwa 190 Nukleotide, etwa 120 Nukleotide bis etwa 200 Nukleotide, etwa 130 Nukleotide bis etwa 140 Nukleotide, etwa 130 Nukleotide bis etwa 150 Nukleotide, etwa 130 Nukleotide bis etwa 160 Nukleotide, etwa 130 Nukleotide bis etwa 170 Nukleotide, etwa 130 Nukleotide bis etwa 180 Nukleotide, etwa 130 Nukleotide bis etwa 190 Nukleotide, etwa 130 Nukleotide bis etwa 200 Nukleotide, etwa 140 Nukleotide bis etwa 150 Nukleotide, etwa 140 Nukleotide bis etwa 160 Nukleotide, etwa 140 Nukleotide bis etwa 170 Nukleotide, etwa 140 Nukleotide bis etwa 180 Nukleotide, etwa 140 Nukleotide bis etwa 190 Nukleotide, etwa 140 Nukleotide bis etwa 200 Nukleotide, etwa 150 Nukleotide bis etwa 160 Nukleotide, etwa 150 Nukleotide bis etwa 170 Nukleotide, etwa 150 Nukleotide bis etwa 180 Nukleotide, etwa 150 Nukleotide bis etwa 190 Nukleotide, etwa 150 Nukleotide bis etwa 200 Nukleotide, etwa 160 Nukleotide bis etwa 170 Nukleotide, etwa 160 Nukleotide bis etwa 180 Nukleotide, etwa 160 Nukleotide bis etwa 190 Nukleotide, etwa 160 Nukleotide bis etwa 200 Nukleotide, etwa 170 Nukleotide bis etwa 180 Nukleotide, etwa 170 Nukleotide bis etwa 190 Nukleotide, etwa 170 Nukleotide bis etwa 200 Nukleotide, etwa 180 Nukleotide bis etwa 190 Nukleotide, etwa 180 Nukleotide bis etwa 200 Nukleotide, oder etwa 190 Nukleotide bis etwa 200 Nukleotide betragen. Die Länge des zellfreien Zielnukleinsäuremoleküls kann etwa 100 Nukleotide, etwa 110 Nukleotide, etwa 120 Nukleotide, etwa 130 Nukleotide, etwa 140 Nukleotide, etwa 150 Nukleotide, etwa 160 Nukleotide, etwa 170 Nukleotide, etwa 180 Nukleotide, etwa 190 Nukleotide oder etwa 200 Nukleotide betragen. In einigen Beispielen kann die Länge des zellfreien Zielnukleinsäuremoleküls zwischen etwa 100 Nukleotiden und etwa 180 Nukleotiden liegen.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen können die Genombereiche mit einer Erkrankung assoziiert sein. Die Genombereiche können als aberrante somatische Hypermutation aufweisend bestimmt werden, wenn ein Proband die Erkrankung hat. Die Erkrankung kann zum Beispiel ein B-Zell-Lymphom oder eine Unterform davon umfassen, wie das diffuse großzellige B-Zell-Lymphom, das follikuläre Lymphom, das Burkitt-Lymphom und die chronische lymphatische B-Zell-Leukämie. Weitere Einzelheiten zu dieser Erkrankung sind nachfolgend angegeben.
  • In einigen Ausführungsformen einer beliebigen der hierin offenbarten Zusammensetzungen umfasst die Zusammensetzung ferner eine Vielzahl von zellfreien Nukleinsäuremolekülen (z. B. cfDNA), die von dem Subjekt erlangt oder abgeleitet wurden.
  • E. Diagnostische oder therapeutische Anwendungen
  • Mehrere Ausführungsformen sind auf die Durchführung eines diagnostischen Scans der zellfreien Nukleinsäuren eines Individuums und anschließend, basierend auf den Krebs indizierenden Ergebnissen des Scans, auf die Durchführung weiterer klinischer Verfahren und/oder die Behandlung des Individuums gerichtet. Gemäß verschiedener Ausführungsformen können zahlreiche Arten von Neoplasmen nachgewiesen werden.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren, kann das Verfahren ferner die Bestimmung, dass der Proband die Erkrankung hat oder die Bestimmung eines Grades oder Status der Erkrankung des Subjekts, basierend auf dem einen oder mehreren zellfreien Nukleinsäuremolekülen, die die Vielzahl von Phasenvarianten umfassen, umfassen. In einigen Fällen kann das Verfahren ferner die Bestimmung umfassen, dass das eine oder die mehreren zellfreien Nukleinsäuremoleküle (die jeweils als eine Vielzahl von Phasenvarianten umfassend identifiziert wurden) aus einer mit der Erkrankung (z. B. Krebs) assoziierten Probe abgeleitet sind, basierend auf einer statistischen Modellanalyse (d. h. einer molekularen Analyse). Das Verfahren kann beispielsweise die Verwendung eines oder mehrerer Algorithmen (z. B. Monte-Carlos-Simulation) zur Bestimmung einer ersten Wahrscheinlichkeit, dass eine zellfreie Nukleinsäure, die als eine Vielzahl von Phasenvarianten umfassend identifiziert wurde, mit einer ersten Erkrankung assoziiert ist oder von ihr stammt (z. B. 80%), und einer zweiten Wahrscheinlichkeit, dass dieselbe zellfreie Nukleinsäure mit einer zweiten Erkrankung assoziiert ist oder von einer zweiten Erkrankung (oder von einer gesunden Zelle) stammt ist (z. B. 20%), umfassen. In einigen Fällen kann das Verfahren die Bestimmung einer Wahrscheinlichkeit, dass der Proband eine oder mehrere Erkrankungen hat, basierend auf der Analyse des einen oder der mehreren zellfreien Nukleinsäuremoleküle, von denen jedes als eine Vielzahl von Phasenvarianten umfassend identifiziert wurde, umfassen (d. h. eine Makro- oder globale Analyse). Zum Beispiel kann das Verfahren die Verwendung eines oder mehrerer Algorithmen (z. B. umfassend ein oder mehrere mathematische Modelle, wie hierin offenbart, wie z. B. Binomialstichproben) zur Analyse einer Vielzahl zellfreier Nukleinsäuremoleküle umfassen, von denen jedes als eine Vielzahl von Phasenvarianten umfassend identifiziert wurde, um dadurch eine erste Wahrscheinlichkeit des Subjekts, eine erste Erkrankung zu haben (z. B. 80 %) und eine zweite Wahrscheinlichkeit des Subjekts, eine zweite Erkrankung zu haben (oder gesund zu sein) (z. B. 20 %) zu bestimmen.
  • Die hierin offenbarte statistische Modellanalyse kann eine Näherungslösung durch eine numerische Annäherung wie ein binomiales Modell, ein ternäres Modell, eine Monte-Carlo-Simulation oder ein Finite-Differenzen-Verfahren sein. In einem Beispiel kann die hierin verwendete statistische Modellanalyse eine statistische Monte-Carlo-Analyse sein. In einem anderen Beispiel kann die hierin verwendete statistische Modellanalyse eine binomiale oder ternäre Modellanalyse sein.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das Verfahren die Überwachung eines Verlaufs der Erkrankung des Subjekts basierend auf dem einen oder mehreren identifizierten zellfreien Nukleinsäuremolekülen umfassen, sodass jedes der identifizierten zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten umfasst. In einigen Fällen kann der Verlauf der Erkrankung eine Verschlimmerung der Erkrankung sein, wie in der vorliegenden Offenbarung beschrieben (z. B. die Entwicklung von Krebs im Stadium I zu Krebs im Stadium III). In einigen Fällen kann der Verlauf der Erkrankung wenigstens eine Teilremission der Erkrankung sein, wie in der vorliegenden Offenbarung beschrieben (z. B. Downstaging von Krebs im Stadium IV zu Krebs im Stadium II). Alternativ kann in manchen Fällen der Verlauf der Erkrankung zwischen zwei verschiedenen Zeitpunkten im Wesentlichen gleich bleiben, wie in der vorliegenden Offenbarung beschrieben. In einem Beispiel kann das Verfahren die Bestimmung von Wahrscheinlichkeiten oder Wahrscheinlichkeiten verschiedener Verläufe der Erkrankung des Subjekts umfassen. Das Verfahren kann beispielsweise die Verwendung eines oder mehrerer Algorithmen (z. B. umfassend ein oder mehrere hierin offenbarte mathematische Modelle, wie z. B. Binomialstichproben) zur Bestimmung einer ersten Wahrscheinlichkeit, dass die Erkrankung des Subjekts schlechter ist als zuvor (z. B. 20 %), einer zweiten Wahrscheinlichkeit einer zumindest Teilremission der Erkrankung (z. B. 70 %) und einer dritten Wahrscheinlichkeit, dass die Erkrankung des Subjekts unverändert ist (z. B. 10 %), umfassen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das Verfahren die Durchführung eines anderen Verfahrens (z. B. Folgediagnoseverfahren) umfassen, um die Erkrankung des Subjekts, welche Erkrankung bestimmt wurde und/oder des beobachteteten Verlaufs davon zu bestätigen, wie in der vorliegenden Offenbarung vorgesehen. Nicht einschränkende Beispiele für ein anderes Verfahren können eine körperliche Untersuchung, eine medizinische Bildgebung, einen Gentest, eine Mammographie, eine Endoskopie, eine Stuhlprobe, einen Pap-Test, einen Alpha-Fetoprotein-Bluttest, einen CA-125-Test, einen Test auf prostataspezifisches Antigen (PSA), eine Biopsieentnahme, eine Knochenmarkspunktion und Tests zum Nachweis von Tumormarkern beinhalten. Die medizinische Bildgebung beinhaltet (ist aber nicht beschränkt auf) Röntgen, Magnetresonanztomographie (MRT), Computertomographie (CT), Ultraschall und Positronen-Emissions-Tomographie (PET). Die Endoskopie beinhaltet (ist aber nicht beschränkt auf) Bronchoskopie, Koloskopie, Kolposkopie, Zystoskopie, Ösophagoskopie, Gastroskopie, Laparoskopie, Neuroendoskopie, Proktoskopie und Sigmoidoskopie.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann das Verfahren die Bestimmung einer Behandlung für die Erkrankung des Subjekts basierend auf dem einen oder mehreren identifizierten zellfreien Nukleinsäuremolekülen umfassen, wobei jedes identifizierte zellfreie Nukleinsäuremolekül eine Vielzahl von Phasenvarianten umfasst. In einigen Fällen kann die Behandlung basierend auf (i) der bestimmten Erkrankung des Subjekts und/oder (ii) dem bestimmten Verlauf der Erkrankung des Subjekts bestimmt werden. Darüber hinaus kann die Behandlung basierend auf einem oder mehreren der folgenden zusätzlichen Faktoren bestimmt werden: Geschlecht, Nationalität, Alter, ethnische Zugehörigkeit und andere körperliche Erkrankungen des Subjekts. In einigen Beispielen kann die Behandlung basierend auf einem oder mehreren Merkmalen der Vielzahl von Phasenvarianten der identifizierten zellfreien Nukleinsäuremoleküle, wie hierin offenbart, bestimmt werden.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren darf der Proband keiner Behandlung der Erkrankung unterzogen worden sein, d. h. der Proband darf nicht mit der Erkrankung (z. B. einem Lymphom) diagnostiziert worden sein. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann der Proband vor einem beliebigen Subjektverfahren der vorliegenden Offenbarung einer Behandlung der Erkrankung unterzogen worden sein. In einigen Fällen können die hierin offenbarten Verfahren zur Überwachung des Verlaufs der bei dem Subjekt diagnostizierten Erkrankung durchgeführt werden, um (i) die Wirksamkeit der bisherigen Behandlung zu bestimmen und (ii) zu beurteilen, ob die Behandlung beibehalten, modifiziert oder zugunsten einer neuen Behandlung abgebrochen werden soll.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren können nicht einschränkende Beispiele für eine Behandlung (z. B. frühere Behandlung, neue Behandlung, die basierend auf den Verfahren der vorliegenden Offenbarung zu bestimmen ist, usw.) Chemotherapie, Radiotherapie, Chemoradiotherapie, Immuntherapie, adoptive Zelltherapie (z. B. chimäre Antigenrezeptor-(CAR-)T-Zelltherapie, CAR-NK-Zelltherapie, modifizierte T-Zellrezeptor-(TCR-)T-Zelltherapie usw.), Hormontherapie, gezielte Arzneimitteltherapie, Operation, Transplantation, Transfusion oder medizinische Überwachung beinhalten.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Erkrankung eine Erkrankung umfassen. In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Erkrankung Neoplasma, Krebs oder Tumor umfassen. In einem Beispiel kann die Erkrankung einen soliden Tumor umfassen. In einem anderen Beispiel kann die Erkrankung ein Lymphom, wie das B-Zell-Lymphom (BCL), umfassen. Nicht einschränkende Beispiele für BCL können das diffuse großzellige B-Zell-Lymphom (DLBCL), das follikuläre Lymphom (FL), das Burkitt-Lymphom (BL), die chronische lymphatische B-Zell-Leukämie (CLL), das Marginalzonen-B-Zell-Lymphom (MZL) und das Mantelzell-Lymphom (MCL) beinhalten.
  • Wie hierin offenbart, kann die Behandlung einer Erkrankung eines Subjekts die Verabreichung eines oder mehrerer therapeutischer Mittel an den Subjekt umfassen. Das eine oder die mehreren therapeutischen Arzneimittel können dem Subjekt auf eine oder mehrere der folgenden Arten verabreicht werden: oral, intraperitoneal, intravenös, intraarteriell, transdermal, intramuskulär, liposomal, über eine lokale Verabreichung mittels Katheter oder Stent, subkutan, intraadiposal und intrathekal.
  • Nicht einschränkende Beispiele für therapeutische Arzneimittel können zytotoxische Wirkstoffe, Chemotherapeutika, wachstumshemmende Wirkstoffe, in der Strahlentherapie verwendete Wirkstoffe, Anti-Angiogenese-Wirkstoffe, apoptotische Wirkstoffe, Anti-Tubulin-Wirkstoffe und andere Wirkstoffe zur Behandlung von Krebs beinhalten, zum Beispiel Anti-CD20-Antikörper, Anti-PD1-Antikörper (z. B., Pembrolizumab), Thrombozyten-Wachstumsfaktor-Inhibitoren (z. B. GLEEVEC™ (Imatinib Mesylat)), ein COX-2-Inhibitor (z. B. Celecoxib), Interferone, Zytokine, Antagonisten (z. B. neutralisierende Antikörper), die an eines oder mehrere der folgenden Ziele binden PDGFR-ß, BlyS, APRIL, BCMA-Rezeptor(en), TRAIL/Apo2, andere bioaktive und organischchemische Wirkstoffe und dergleichen.
  • Nicht einschränkende Beispiele für ein zytotoxisches Agens können radioaktive Isotope (z. B. At211, I131, 1125, Y90, Re186, Re188, Sm153, Bi212, P32 und radioaktive Isotope von Lu), Chemotherapeutika, z. B., Methotrexat, Adriamycin, Vinca-Alkaloide (Vincristin, Vinblastin, Etoposid), Doxorubicin, Melphalan, Mitomycin C, Chlorambucil, Daunorubicin oder andere Interkalationsmittel, Enzyme und Fragmente davon wie nukleolytische Enzyme, Antibiotika und Toxine wie niedermolekulare Toxine oder enzymatisch aktive Toxine bakteriellen, pilzlichen, pflanzlichen oder tierischen Ursprungs beinhalten.
  • Nicht einschränkende Beispiele eines chemotherapeutischen Agens können Alkylierungsmittel wie Thiotepa und CYTOXAN® Cyclophosphamid; Alkylsulfonate wie Busulfan, Improsulfan und Piposulfan; Aziridine wie Benzodopa, Carboquon, Meturedopa und Uredopa; Ethylenimine und Methylamelamine einschließlich Altretamin, Triethylenemelamin, Triethylenphosphoramid, Triethiylenthiophosphoramid und Trimethylolmelamin; Acetogenine (insbesondere Bullatacin und Bullatacinon); Delta-9-Tetrahydrocannabinol (Dronabinol, MARINOL®); Beta-Lapachon; Lapachol; Colchicine; Betulinsäure; Camptothecin (einschließlich des synthetischen Analogons Topotecan (HYCAMTIN®), CPT-11 (Irinotecan, CAMPTOSAR®), Acetylcamptothecin, Scopolectin und 9-Aminocamptothecin); Bryostatin; Callystatin; CC-1065 (einschließlich seiner synthetischen Analoga Adozelesin, Carzelesin und Bizelesin); Podophyllotoxin; Podophyllinsäure; Teniposid; Cryptophycine (insbesondere Cryptophycin 1 und Cryptophycin 8); Dolastatin; Duocarmycin (einschließlich der synthetischen Analoga KW-2189 und CB1-TM1); Eleutherobin; Pancratistatin; ein Sarkodictyin; Spongistatin; Stickstoffsenf wie Chlorambucil, Chlornaphazin, Cyclophosphamid, Estramustin, Ifosfamid, Mechlorethamin, Mechlorethaminoxidhydrochlorid, Melphalan, Novembichin, Phenesterin, Prednimustin, Trofosfamid, Uracil Senf; Nitrosoharnstoffe wie Carmustin, Chlorozotocin, Fotemustin, Lomustin, Nimustin und Ranimnustin; Antibiotika wie die Enediyne-Antibiotika; Dynemicin, einschließlich Dynemicin A; ein Espiramicina; sowie Neocarzinostatin Chromophor und verwandte Chromoproteine enediyne Antibiotika-Chromophore), Aclacinomycine, Actinomycin, Anthramycin, Azaserin, Bleomycine, Cactinomycin, Carabicin, Carminomycin, Carzinophilin, Chromomycinis, Dactinomycin, Daunorubicin, Detorubicin, 6-Diazo-5-oxo-L-Norleucin, ADRIAMYCIN® Doxorubicin (einschließlich Morpholino-Doxorubicin, Cyanomorpholino-Doxorubicin, 2-Pyrrolino-Doxorubicin und Deoxydoxorubicin), Epirubicin, Esorubicin, Idarubicin, Marcellomycin, Mitomycine wie Mitomycin C, Mycophenolsäure, Nogalamycin, Olivomycine, Peplomycin, Potfiromycin, Puromycin, Quelamycin, Rodorubicin, Streptonigrin, Streptozocin, Tubercidin, Ubenimex, Zinostatin, Zorubicin; Anti-Metaboliten wie Methotrexat und 5-Fluorouracil (5-FU); Folsäure-Analoga wie Denopterin, Methotrexat, Pteropterin, Trimetrexat; Purin-Analoga wie Fludarabin, 6-Mercaptopurin, Thiamiprin, Thioguanin; Pyrimidin-Analoga wie Ancitabin, Azacitidin, 6-Azauridin, Carmofur, Cytarabin, Dideoxyuridin, Doxifluridin, Enocitabin, Floxuridin; Androgene wie Calusteron, Dromostanolonpropionat, Epitiostanol, Mepitiostan, Testolacton; Antiadrenale wie Aminoglutethimid, Mitotan, Trilostan; Folsäureauffüller wie Folinsäure; Aceglatone; Aldophosphamidglykosid; Aminolävulinsäure; Eniluracil; Amsacrine; Bestrabucil; Bisantren; Edatraxat; Defofamin; Demecolcin; Diaziquon; Eflornithin; Elliptiniumacetat; ein Epothilon; Etoglucid; Galliumnitrat; Hydroxyharnstoff; Lentinan; Lonidainin; Maytansinoide wie Maytansin und Ansamitocine; Mitoguazon; Mitoxantron; Mopidanmol; Nitraerin; Pentostatin; Phenamet; Pirarubicin; Losoxantron; 2-Ethylhydrazid; Procarbazin; PSK® Polysaccharid-Komplex (JHS Natural Products, Eugene, Oreg.); Razoxan; Rhizoxin; Sizofiran; Spirogermanium; Tenuazonsäure; Triazichon; 2,2',2''-Trichlortriethylamin; Trichothecene (insbesondere T-2-Toxin, Verrucarin A, Roridin A und Anguidin); Urethan; Vindesin (ELDISINE®, FILDESIN®); Dacarbazin; Mannomustin; Mitobronitol; Mitolactol; Pipobroman; Gacytosin; Arabinosid („Ara-C“); Thiotepa; Taxoide, zum Beispiel Taxane, die TAXOL® Paclitaxel (Bristol-Myers Squibb Oncology, Princeton, N. J.), ABRAXANE™ Cremophor-freie, Albuminentwickelte Nanopartikel-Formulierung von Paclitaxel (American Pharmaceutical Partners, Schaumberg, Ill.) und TAXOTEREE Docetaxel (Rhöne-Poulenc Rorer, Antony, Frankreich); Chlorambucil; Gemcitabin (GEMZAR®); 6-Thioguanin; Mercaptopurin; Methotrexat; Platinanaloga wie Cisplatin und Carboplatin; Vinblastin (VELBAN®); Platin; Etoposid (VP-16); Ifosfamid; Mitoxantron; Vincristin (ONCOVIN®); Oxaliplatin; Leucovovin; Vinorelbin (NAVELBINE®); Novantron; Edatrexat; Daunomycin; Aminopterin; Ibandronat; Topoisomerasehemmer RFS 2000; Difluormethylornithin (DMFO); Retinoide wie Retinsäure; Capecitabin (XELODA®); pharmazeutisch verträgliche Salze, Säuren oder Derivate beliebiger der Vorgenannten; sowie Kombinationen von zwei oder mehreren der Vorgenannten wie CHOP, eine Abkürzung für eine kombinierte Therapie aus Cyclophosphamid, Doxorubicin, Vincristin und Prednisolon, und FOLFOX, eine Abkürzung für ein Behandlungsschema mit Oxaliplatin (ELOXATlN™) in Kombination mit 5-FU und Leucovorin, beinhalten.
  • Beispiele für ein chemotherapeutisches Agens können auch „antihormonelle Agenzien“ oder „endokrine Therapeutika“ beinhalten, die darauf abzielen, die Wirkung von Hormonen, die das Krebswachstum fördern können, zu regulieren, zu reduzieren, zu blockieren oder zu hemmen, und die häufig in Form einer systemischen oder Ganzkörperbehandlung verabreicht werden. Sie können selbst Hormone sein. Beispiele beinhalten Anti-Östrogene und selektive Östrogenrezeptormodulatoren (SERMs), einschließlich beispielsweise Tamoxifen (einschließlich NOLVADEX® Tamoxifen), EVISTA® Raloxifen, Droloxifen, 4-Hydroxytamoxifen, Trioxifen, Keoxifen, LY117018, Onapriston und FARESTON® Toremifen; Anti-Progesterone; Östrogenrezeptor-Down-Regulatoren (ERDs); Agenzien zur Unterdrückung oder Abschaltung der Eierstöcke, zum Beispiel Leutinisierungshormon-Releasing-Hormon-(LHRH-)Agonisten wie LUPRON® und ELIGARD), Leuprolidacetat, Goserelinacetat, Buserelinacetat und Tripterelin; andere Antiandrogene wie Flutamid, Nilutamid und Bicalutamid; und Aromatasehemmer, die das die Östrogenproduktion in den Nebennieren regulierende Enzym Aromatase hemmen, wie z. B. 4(5)-Imidazole, Aminoglutethimid, MEGASEE Megestrolacetat, AROMASIN® Exemestan, Formestanie, Fadrozol, RIVISOR® Vorozol, FEMARAE Letrozol und ARIMIDEX® Anastrozol. Darüber hinaus beinhaltet diese Definition von chemotherapeutischen Agenzien Bisphosphonate wie Clodronat (zum Beispiel BONEFOS® oder OSTAC®), DIDROCAL® Etidronat, NE-58095, ZOMFTA® Zoledronsäure/Zoledronat, FOSAMAX® Alendronat, AREDIA® Pamidronat, SKELID® Tiludronat oder ACTONEL® Risedronat; sowie Troxacitabin (ein 1,3-Dioxolan-Nukleosid-Cytosin-Analogon); Antisense-Oligonukleotide, insbesondere solche, die die Expression von Genen in Signalwegen hemmen, die an der abnormen Zellproliferation beteiligt sind, wie z.B. PKC-alpha, Raf, H-Ras und der epidermale Wachstumsfaktor-Rezeptor (EGFR); Impfstoffe wie THERATOPE®-Impfstoff und Gentherapie-Impfstoffe, z.B. ALLOVECTIN®-Impfstoff, LEUVECTIN®-Impfstoff und VAXID®-Impfstoff; LURTOTECAN®-Topoisomerase-1-Inhibitor; ABARELIX® rmRH; Lapatinib-Ditosylat (ein niedermolekularer ErbB-2- und EGFR-Dual-Tyrosinkinase-Inhibitor, der auch als GW572016 bekannt ist); und pharmazeutisch verträgliche Salze, Säuren oder Derivate beliebiger der Vorgenannten.
  • Beispiele für ein chemotherapeutisches Agens können auch Antikörper wie Alemtuzumab (Campath), Bevacizumab (AVASTIN®, Genentech); Cetuximab (ERBITUX®, Imclone); Panitumumab (VECTIBIX®, Amgen), Rituximab (RITUXAN®, Genentech/Biogen Idee), Pertuzumab (OMNITARG®, 2C4, Genentech), Trastuzumab (HERCEPTIN®, Genentech), Tositumomab (Bexxar, Corixia) und das Antikörper-Konjugat Gemtuzumab Ozogamicin (MYLOTARG®, Wyeth) beinhalten. Weitere humanisierte monoklonale Antikörper mit therapeutischem Potenzial als Agenzien in Kombination mit den Verbindungen der Erfindung beinhalten: Apolizumab, Aselizumab, Atlizumab, Bapineuzumab, Bivatuzumab Mertansin, Cantuzumab Mertansin, Cedelizumab, Certolizumab Pegol, Cidfusituzumab, Cidtuzumab, Daclizumab, Eculizumab, Efalizumab, Epratuzumab, Erlizumab, FeMzumab, Fontolizumab, Gemtuzumab Ozogamicin, Inotuzumab Ozogamicin, Ipilimumab, Labetuzumab, Lintuzumab, Matuzumab, Mepolizumab, Motavizumab, Motovizumab, Natalizumab, Nimotuzumab, Nolovizumab, Numavizumab, Ocrelizumab, Omalizumab, Palivizumab, Pascolizumab, Pecfusituzumab, Pectuzumab, Pexelizumab, Ralivizumab, Ranibizumab, Reslivizumab, Reslizumab, Resyvizumab, Rovelizumab, Ruplizumab, Sibrotuzumab, Siplizumab, Sontuzumab, Tacatuzumab Tetraxetan, Tadocizumab, Talizumab, Tefibazumab, Tocilizumab, Toralizumab, Tucotuzumab Celmoleukin, Tucusituzumab, Umavizumab, Urtoxazumab, Ustekinumab, Visilizumab und das Anti-Interleukin-12 (ABT-874/J695, Wyeth Research und Abbott Laboratories), bei dem es sich um einen rekombinanten, ausschließlich humanen IgG1λ-Antikörper in voller Länge handelt, der genetisch modifiziert wurde, um das Interleukin-12 p40-Protein zu erkennen.
  • Beispiele für ein chemotherapeutisches Agens können auch „Tyrosinkinase-Inhibitoren“ wie ein EGFR-Targeting-Agens (z. B. kleines Molekül, Antikörper, usw.); einen niedermolekularen HER2-Tyrosinkinase-Inhibitor wie TAK165 von Takeda; CP-724.714, einen oralen selektiven Inhibitor der ErbB2-Rezeptor-Tyrosinkinase (Pfizer und OSI); Dual-HER-Inhibitoren wie EKB-569 (erhältlich von Wyeth), der bevorzugt EGFR bindet, aber sowohl HER2 als auch EGFR-überexprimierende Zellen inhibiert; Lapatinib (GSK572016; erhältlich von Glaxo-SmithKline), einen oralen HER2- und EGFR-Tyrosinkinase-Inhibitor; PKI-166 (erhältlich von Novartis); Pan-HER-Inhibitoren wie Canertinib (CI-1033; Pharmacia); Raf-1-Inhibitoren wie der von ISIS Pharmaceuticals erhältliche Antisense-Wirkstoff ISIS-5132, der die Raf-1-Signalübertragung inhibiert; nicht-HER-zielgerichtete TK-Hemmer wie Imatinib-Mesylat (GLEEVEC®, erhältlich von Glaxo SmithKline); Multi-Targeting-Tyrosinkinase-Inhibitoren wie Sunitinib (SUTENT®, erhältlich von Pfizer); VEGF-Rezeptor-Tyrosinkinase-Inhibitoren wie Vatalanib (PTK787/ZK222584, erhältlich von Novartis/Schering AG); MAPK extrazellulärer regulierter Kinase-I-Inhibitor CI-1040 (erhältlich von Pharmacia); Chinazoline wie PD 153035,4-(3-Chloranilino)-chinazolin; Pyridopyrimidine; Pyrimidopyrimidine; Pyrrolopyrimidine, wie CGP 59326, CGP 60261 und CGP 62706; Pyrazolopyrimidine, 4-(Phenylamino)-7H-Pyrrolo[2,3-d]pyrimidine; Curcumin (Diferuloylmethan, 4,5-bis-(4-fluoranilino)phthalimid); Tyrphostine mit Nitrothiophenanteilen; PD-0183805 (Warner-Lamber); Antisense-Moleküle (z. B. die an HERkodierende Nukleinsäure binden); Chinoxaline ( US-Pat. Nr. 5,804,396 ); Tryphostine ( US-Pat. Nr. 5,804,396 ); ZD6474 (Astra Zeneca); PTK-787 (Novartis/Schering AG); Pan-HER-Inhibitoren wie CI-1033 (Pfizer); Affinitac (ISIS 3521; Isis/Lilly); Imatinib-Mesylat (GLEEVEC®); PKI 166 (Novartis); GW2016 (Glaxo SmithKline); CI-1033 (Pfizer); EKB-569 (Wyeth); Semaxinib (Pfizer); ZD6474 (AstraZeneca); PTK-787 (Novartis/Schering AG); INC-1C11 (Imclone); und Rapamycin (Sirolimus, RAPAMUNE®) beinhalten.
  • Beispiele für ein chemotherapeutisches Agens können auch Dexamethason, Interferone, Colchicin, Metoprin, Cyclosporin, Amphotericin, Metronidazol, Alemtuzumab, Alitretinoin, Allopurinol, Amifostin, Arsentrioxid, Asparaginase, BCG live, Bevacuzimab, Bexarotene, Cladribin, Clofarabin, Darbepoetin alfa, Denileukin, Dexrazoxan, Epoetin alfa, Elotinib, Filgrastim, Histrelinacetat, Ibritumomab, Interferon alfa-2a, Interferon alfa-2b, Lenalidomid, Levamisol, Mesna, Methoxsalen, Nandrolon, Nelarabin, Nofetumomab, Oprelvekin, Palifermin, Pamidronat, Pegademase, Pegaspargase, Pegfilgrastim, Pemetrexed Dinatrium, Plicamycin, Porfimer-Natrium, Quinacrin, Rasburicase, Sargramostim, Temozolomid, VM-26, 6-TG, Toremifen, Tretinoin, ATRA, Valrubicin, Zoledronat und Zoledronsäure und pharmazeutisch akzeptable Salze davon beinhalten
  • Beispiele für ein chemotherapeutisches Agens können auch Hydrocortison, Hydrocortisonacetat, Cortisonacetat, Tixocortolpivalat, Triamcinolonacetonid, Triamcinolonalkohol, Mometason, Amcinonid, Budesonid, Desonid, Fluocinonid, Fluocinolonacetonid, Betamethason, Betamethason-Natriumphosphat, Dexamethason, Dexamethason-Natriumphosphat, Fluocortolon, Hydrocortison-17-butyrat, Hydrocortison-17-valerat, Aclometasondipropionat, Betamethasonvalerat, Betamethasondipropionat, Prednicarbat, Clobetason-17-butyrat, Clobetasol-17-propionat, Fluocortoloncaproat, Fluocortolonpivalat und Fluprednidenacetat: immunselektive entzündungshemmende Peptide (ImSAIDs) wie Phenylalanin-Glutamin-Glycin (FEG) und seine D-isomere Form (feG) (IMULAN BioTherapeutics, LLC); Antirheumatika wie Azathioprin, Ciclosporin (Cyclosporin A), D-Penicillamin, Goldsalze, Hydroxychloroquin, Leflunomideminocyclin, Sulfasalazin, Tumornekrosefaktor-alpha (TNFa)-Blocker wie Etanercept (ENBREL®), Infliximab (REMICADE®), Adalimumab (HUMIRA®), Certolizumab Pegol (CIMZIA®), Golimumab (SIMPONI®), Interleukin 1-(IL-1-)Blocker wie Anakinra (KINERET®), T-Zell-Kostimulationsblocker wie Abatacept (ORENCIA®), Interleukin 6-(IL-6-)Blocker wie Tocilizumab (ACTEMERA®); Interleukin 13-(IL-13-)Blocker wie Lebrikizumab; Interferon alpha-(IFN-)Blocker wie Rontalizumab; Beta-7-Integrin-Blocker wie rhuMAb Beta7; IgE-Signalweg-Blocker wie Anti-M1 prime; sekretierte homotrimere LTa3- und membrangebundene heterotrimere LTa/ß2-Blocker wie Anti-lymphotoxin alpha (LTa); verschiedene Prüfagenzien wie Thioplatin, PS-341, Phenylbutyrat, ET-18-OCH3 oder Famesyltransferase-Inhibitoren (L-739749, L-744832); Polyphenole wie Quercetin, Resveratrol, Piceatannol, Epigallocatechingallat, Theaflavine, Flavanole, Procyanidine, Betulinsäure und Derivate davon; Autophagie-Inhibitoren wie Chloroquin; Delta-9-Tetrahydrocannabinol (Dronabinol, MARINOL®); Beta-Lapachon; Lapachol; Colchicine; Betulinsäure; Acetylcamptothecin, Scopolectin und 9-Aminocamptothecin); Podophyllotoxin; Tegafur (UFTORAL®); Bexarotin (TARGRETIN®); Bisphosphonate wie Clodronat (zum Beispiel BONEFOS® oder OSTAC®), Etidronat (DIDROCAL®), NE-58095, Zoledronsäure/Zoledronat (ZOMETA®), Alendronat (FOSAMAX®), Pamidronat (AREDIA®), Tiludronat (SKELID®) oder Risedronat (ACTONEL®); und epidermaler Wachstumsfaktor-Rezeptor (EGF-R); Impfstoffe wie der THERATOPE®-Impfstoff; Perifosin, COX-2-Inhibitoren (z. g., Celecoxib oder Etoricoxib), Proteosom-Inhibitor (z. B., PS341); CCI-779; Tipifamib (R11577); Orofenib, ABT510; Bcl-2-Inhibitor wie Oblimersen-Natrium (GENASENSE®); Pixantron; Famesyltransferase-Inhibitoren wie Lonafamib (SCH 6636, SARASAR™); und pharmazeutisch verträgliche Salze, Säuren oder Derivate beliebiger der oben genannten; sowie Kombinationen von zwei oder mehreren der oben genannten beinhalten.
  • Gemäß vieler Ausführungsformen kann, sobald eine Krebsdiagnose indiziert ist, eine Reihe von Behandlungen durchgeführt werden, einschließlich (aber nicht beschränkt auf) Operation, Resektion, Chemotherapie, Strahlentherapie, Immuntherapie, gezielte Therapie, Hormontherapie, Stammzellentransplantation und Bluttransfusion. In einigen Ausführungsformen wird ein Antikrebs- und/oder chemotherapeutisches Agens verabreicht, einschließlich (aber nicht beschränkt auf) alkylierende Agenzien, Platin-Agenzien, Taxane, Vinca-Agenzien, Anti-Östrogen-Medikamente, Aromatase-Inhibitoren, Ovarial-Suppressions-Agenzien, endokrine/hormonelle Agenzien, Bisphophonat-Therapie-Agenzien und gezielte biologische Therapie-Agenzien. Medikamente beinhalten (sind aber nicht beschränkt auf) Cyclophosphamid, Fluorouracil (oder 5-Fluorouracil oder 5-FU), Methotrexat, Thiotepa, Carboplatin, Cisplatin, Taxane, Paclitaxel, proteingebundenes Paclitaxel, Docetaxel, Vinorelbin, Tamoxifen, Raloxifen, Toremifen, Fulvestrant, Gemcitabin, Irinotecan, Ixabepilon, Temozolomid, Topotecan, Vincristin, Vinblastin, Eribulin, Mutamycin, Capecitabin, Capecitabin, Anastrozol, Exemestan, Letrozol, Leuprolid, Abarelix, Buserelin, Goserelin, Megestrolacetat, Risedronat, Pamidronat, Ibandronat, Alendronat, Zoledronat, Tykerb, Daunorubicin, Doxorubicin, Epirubicin, Idarubicin, Valrubicin Mitoxantron, Bevacizumab, Cetuximab, Ipilimumab, Ado-Trastuzumab Emtansin, Afatinib, Aldesleukin, Alectinib, Alemtuzumab, Atezolizumab, Avelumab, Axtinib, Belimumab, Belinostat, Bevacizumab, Blinatumomab, Bortezomib, Bosutinib, Brentuximab Vedotin, Brigatinib, Cabozantinib, Canakinumab, Carfilzomib, Certinib, Cetuximab, Cobimetinib, Crizotinib, Dabrafenib, Daratumumab, Dasatinib, Denosumab, Dinutuximab, Durvalumab, Elotuzumab, Enasidenib, Erlotinib, Everolimus, Gefitinib, Ibritumomab Tiuxetan, Ibrutinib, Iidelalisib, Imatinib, Ipilimumab, Ixazomib, Lapatinib, Lenvatinib, Midostaurin, Necitumumab, Neratinib, Nilotinib, Niraparib, Nivolumab, Obinutuzumab, Ofatumumab, Olaparib, Olaratumab, Osimertinib, Palbociclib, Panitumumab, Panobinostat, Pembrolizumab, Pertuzumab, Ponatinib, Ramucirumab, Regorafenib, Ribociclib, Rituximab, Romidepsin, Rucaparib, Ruxolitinib, Siltuximab, Sipuleucel-T, Sonidegib, Sorafenib, Temsirolimus, Tocilizumab, Tofacitinib, Tositumomab, Trametinib, Trastuzumab, Vandetanib, Vemurafenib, Venetoclax, Vismodegib, Vorinostat und Ziv-Aflibercept. Gemäß verschiedener Ausführungsformen kann ein Individuum mit einem einzelnen Medikament oder einer Kombination von hierin beschriebenen Medikamenten behandelt werden. Eine gängige Behandlungskombination ist Cyclophosphamid, Methotrexat und 5-Fluorouracil (CMF).
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann jedes der zellfreien Nukleinsäuremoleküle (z. B. cfDNA, cfRNA) aus einer Zelle abgeleitet werden. Zum Beispiel kann eine Zell- oder Gewebeprobe von einem Subjekt erlangt und zur Entfernung aller Zellen aus der Probe verarbeitet werden, wodurch zellfreie Nukleinsäuremoleküle aus der Probe abgeleitet werden.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann eine Referenzgenomsequenz aus einer Zelle eines Individuums abgeleitet werden. Das Individuum kann eine gesunde Kontrolle oder der Proband sein, der den hierin offenbarten Verfahren zur Bestimmung oder Überwachung des Verlaufs einer Erkrankung unterzogen wird.
  • Eine Zelle kann eine gesunde Zelle sein. Alternativ kann eine Zelle eine erkrankte Zelle sein. Eine erkrankte Zelle kann veränderte Stoffwechsel-, Genexpressions- und/oder morphologische Merkmale aufweisen. Eine erkrankte Zelle kann eine Krebszelle, eine diabetische Zelle oder eine apoptotische Zelle sein. Eine erkrankte Zelle kann eine Zelle von einem erkrankten Subjekt sein. Beispielhafte Krankheiten können Blutkrankheiten, Krebskrankheiten, Stoffwechselstörungen, Augenkrankheiten, Organstörungen, Krankheiten des Bewegungsapparats, Herzkrankheiten und dergleichen beinhalten.
  • Eine Zelle kann eine Säugetierzelle sein oder aus einer Säugetierzelle abgeleitet sein. Eine Zelle kann eine Nagetierzelle sein oder aus einer Nagetierzelle abgeleitet sein. Eine Zelle kann eine menschliche Zelle sein oder aus einer menschlichen Zelle abgeleitet sein. Eine Zelle kann eine prokaryotische Zelle sein oder aus einer prokaryotischen Zelle abgeleitet sein. Eine Zelle kann eine bakterielle Zelle sein oder aus einer bakteriellen Zelle abgeleitet sein. Eine Zelle kann eine archäische Zelle sein oder aus einer archäischen Zelle abgeleitet sein. Eine Zelle kann eine eukaryotische Zelle sein oder aus einer eukaryotischen Zelle abgeleitet sein. Eine Zelle kann eine pluripotente Stammzelle sein. Eine Zelle kann eine Pflanzenzelle sein oder aus einer Pflanzenzelle abgeleitet sein. Eine Zelle kann eine tierische Zelle sein oder aus einer tierischen Zelle abgeleitet sein. Eine Zelle kann eine Wirbellosen-Zelle sein oder aus einer Wirbellosen-Zelle abgeleitet sein. Eine Zelle kann eine Wirbeltierzelle sein oder aus einer Wirbeltierzelle abgeleitet sein. Eine Zelle kann eine Mikrobenzelle sein oder aus einer Mikrobenzelle abgeleitet sein. Eine Zelle kann eine Pilzzelle sein oder aus einer Pilzzelle abgeleitet sein. Eine Zelle kann aus einem spezifischen Organ oder Gewebe stammen.
  • Nicht einschränkende Beispiele für eine oder mehrere Zellen können lymphoide Zellen beinhalten, wie B-Zellen, T-Zellen (zytotoxische T-Zellen, natürliche Killer-T-Zellen, regulatorische T-Zellen, T-Helferzellen), natürliche Killerzellen, Zytokin-induzierte Killerzellen (CIK); myeloische Zellen, wie Granulozyten (Basophile Granulozyten, Eosinophile Granulozyten, Neutrophile Granulozyten/Hypersegmentierte Neutrophile), Monozyten/Makrophagen, Erythrozyten (Retikulozyten), Mastzellen, Thrombozyten/Megakaryozyten, Dendritische Zellen; Zellen des endokrinen Systems, einschließlich Schilddrüsenzellen (Schilddrüsenepithelzellen, parafollikuläre Zellen), Nebenschilddrüsenzellen (Nebenschilddrüsenhauptzellen, oxyphile Zellen), Nebennierenzellen (Chromaffinzellen), Zirbeldrüsenzellen (Pinealozyten); Zellen des Nervensystems, einschließlich Gliazellen (Astrozyten, Mikroglia), Magnozelluläre neurosekretorische Zelle, Stellat-Zelle, Boettcher-Zelle und Hypophyse (Gonadotropin, Corticotropin, Thyrotropin, Somatotropin, Laktotropin); Zellen des Atmungssystems, einschließlich Pneumozyt (Typ-I-Pneumozyt, Typ-II-Pneumozyt), Clara-Zelle, Becherzelle, Staubzelle; Zellen des Kreislaufsystems, einschließlich Myokardiozyt, Perizyt; Zellen des Verdauungssystems, einschließlich Magen (Magenhauptzelle, Parietalzelle), Becherzelle, Paneth-Zelle, G-Zellen, D-Zellen, ECL-Zellen, I-Zellen, K-Zellen, S-Zellen; enteroendokrine Zellen, einschließlich enterochromaffme Zelle, APUD-Zelle, Leber (Hepatozyt, Kupffer-Zelle), Knorpel/Knochen/Muskel; Knochenzellen, einschließlich Osteoblast, Osteozyt, Osteoklast, Zähne (Zementoblast, Ameloblast); Knorpelzellen, einschließlich Chondroblast, Chondrozyt; Hautzellen, einschließlich Trichozyt, Keratinozyt, Melanozyt (Naevuszelle); Muskelzellen, einschließlich Myozyt; Zellen des Harnsystems, einschließlich Podozyt, Juxtaglomeruläre Zelle, Intraglomeruläre Mesangialzelle/Extraglomeruläre Mesangialzelle, Bürstensaumzelle des proximalen Tubulus der Niere, Macula densa-Zelle; Zellen des Fortpflanzungssystems, einschließlich Spermatozoon, Sertoli-Zelle, Leydig-Zelle, Ovum; und andere Zellen, einschließlich Adipozyt, Fibroblast, Sehnenzelle, epidermaler Keratinozyt (differenzierende epidermale Zelle), epidermale Basalzelle (Stammzelle), Keratinozyt der Finger- und Zehennägel, Nagelbettbasalzelle (Stammzelle), medulläre Haarschaftzelle, kortikale Haarschaftzelle, kutikuläre Haarschaftzelle, Kutikuläre Haarwurzelscheidenzelle, Haarwurzelscheidenzelle der Huxley-Schicht, Haarwurzelscheidenzelle der Henle-Schicht, Äußere Haarwurzelscheidenzelle, Haarmatrixzelle (Stammzelle), Feuchte geschichtete Barriere-Epithelzellen, Oberflächenepithelzelle des geschichteten Plattenepithels von Hornhaut, Zunge, Mundhöhle, Speiseröhre, Analkanal, distaler Harnröhre und Vagina, Basalzelle (Stammzelle) der Epithelien von Hornhaut, Zunge, Mundhöhle, Speiseröhre, Analkanal, distaler Harnröhre und Vagina, Harnröhrenepithelzelle (Auskleidung der Harnblase und der Harnwege), Exokrine sekretorische Epithelzellen, Speicheldrüsenschleimhautzelle (polysaccharidreiches Sekret), Seröse Zelle der Speicheldrüse (glykoproteinreiche Sekretion), Von-Ebner-Drüsenzelle in der Zunge (wäscht die Geschmacksknospen), Brustdrüsenzelle (Milchsekretion), Tränendrüsenzelle (Tränensekretion), Ceruminöse Drüsenzelle im Ohr (Wachssekretion), Dunkle Zelle der ekkrinen Schweißdrüse (Glykoproteinsekretion), Klare Zelle der ekkrinen Schweißdrüse (Sekretion kleiner Moleküle). Apokrine Schweißdrüsenzelle (Geruchssekretion, sexualhormonempfindlich), Moll-Drüsenzelle im Augenlid (spezialisierte Schweißdrüse), Talgdrüsenzelle (lipidreiche Talgsekretion), Bowman-Drüsenzelle in der Nase (wäscht das Geruchsepithel), Brunnersche Drüsenzelle im Zwölffingerdarm (Enzyme und alkalischer Schleim), Samenblasenzelle (sondert Bestandteile der Samenflüssigkeit ab, einschließlich Fruktose für schwimmende Spermien), Prostatadrüsenzelle (sondert Bestandteile der Samenflüssigkeit ab), Bulbourethraldrüsenzelle (Schleimabsonderung), Bartholin-Drüsenzelle (vaginale Gleitmittelsekretion), Littre-Drüsenzelle (Schleimsekretion), Gebärmutterschleimhautzelle (Kohlenhydratsekretion), Isolierte Becherzelle der Atemwege und des Verdauungstraktes (Schleimsekretion), Magenschleimhautzelle (Schleimsekretion), Zymogene Zelle der Magendrüse (Pepsinogensekretion), Oxyntische Zelle der Magendrüse (Salzsäuresekretion), Azinuszelle der Bauchspeicheldrüse (Sekretion von Bikarbonat und Verdauungsenzymen), Paneth-Zelle des Dünndarms (Lysozymsekretion), Typ-II-Pneumozyt der Lunge (Surfactant-Sekretion), Clara-Zelle der Lunge, Hormonzellen, Hypophysenvorderzellen, Somatotrope, Laktotrope, Thyreotrope, Gonadotrope, Corticotrope, Hypophysenzwischenzellen, Magnozelluläre neurosekretorische Zellen, Darm- und Atemwegszellen, Schilddrüsenzellen, Schilddrüsenepithelzellen, parafollikuläre Zellen, Nebenschilddrüsenzellen, Nebenschilddrüsenhauptzellen, oxyphile Zellen, Nebennierenzellen, chromaffine Zellen, Ley dig Zellen der Hoden, Theca interna-Zelle des Ovarialfollikels, Corpus luteum-Zelle des gerissenen Ovarialfollikels, Granulosa-Lutein-Zellen, Theca-Lutein-Zellen, Juxtaglomeruläre Zelle (Reninsekretion), Macula densa-Zelle der Niere, Stoffwechsel- und Speicherzellen, Zellen mit Barrierefunktion (Lunge, Darm, exokrine Drüsen und Urogenitaltrakt), Niere, Typ-I-Pneumozyt (Auskleidung des Luftraums der Lunge), Duktuszelle der Bauchspeicheldrüse (zentroazinäre Zelle), nicht gestreifte Duktuszelle (der Schweißdrüse, Speicheldrüse, Brustdrüse usw.), Ductuszellen (der Samenblase, der Prostata, etc.)), Epithelzellen, die geschlossene innere Körperhöhlen auskleiden, Flimmerzellen mit Antriebsfunktion, Zellen, die extrazelluläre Matrix sezernieren, kontraktile Zellen; Skelettmuskelzellen, Stammzellen, Herzmuskelzellen, Blut- und Immunsystemzellen, Erythrozyten (rote Blutkörperchen), Megakaryozyten (Thrombozytenvorläufer), Monozyten, Bindegewebsmakrophagen (verschiedene Typen), epidermale Langerhans-Zellen, Osteoklasten (in Knochen), dendritische Zellen (in lymphoidem Gewebe), Mikrogliazellen (im zentralen Nervensystem), neutrophile Granulozyten, eosinophile Granulozyten, basophile Granulozyten, Mastzellen, Helfer-T-Zellen, Suppressor-T-Zellen, zytotoxische T-Zellen, natürliche Killer-T-Zellen, B-Zellen, natürliche Killerzellen, Retikulozyten, Stammzellen und engagierte Vorläuferzellen für das Blut und das Immunsystem (verschiedene Typen), Pluripotente Stammzellen, Totipotente Stammzellen, Induzierte pluripotente Stammzellen, Adulte Stammzellen, Sinneswandlerzellen, Autonome Neuronenzellen, Sinnesorgane und periphere Neuronen unterstützende Zellen, Neuronen und Gliazellen des zentralen Nervensystems, Linsenzellen, Pigmentzellen, Melanozyten, Retinale pigmentierte Epithelzelle, Keimzellen, Oogonium/Oozyt, Spermatid, Spermatozyt, Spermatogoniumzelle (Stammzelle für Spermatozyt), Spermatozoon, Ammenzellen, Ovarialfollikelzelle, Sertoli-Zelle (im Hoden), Thymusepithelzelle, Interstitielle Zellen und Interstitielle Nierenzellen.
  • In einigen Ausführungsformen eines beliebigen der hierin offenbarten Verfahren kann die Erkrankung ein Krebs oder ein Tumor sein. Nicht einschränkende Beispiele für solche Erkrankungen können Akanthom, Akinzellkarzinom, Akustikusneurinom, akrales lentiginöses Melanom, Akrospirom, akute eosinophile Leukämie, akute lymphoblastische Leukämie, akute megakaryoblastische Leukämie, akute monozytäre Leukämie, akute myeloblastische Leukämie mit Reifung, akute myeloische dendritische Zellleukämie, akute myeloische Leukämie, akute promyelozytische Leukämie, Adamantinom, Adenokarzinom, adenoides zystisches Karzinom, Adenom, Adenomatoider odontogenen Tumor, adrenokortikales Karzinom, adulte T-Zell-Leukämie, aggressive NK-Zell-Leukämie, AIDS-bezogene Krebserkrankungen, AIDS-bezogenes Lymphom, alveoläres Weichteilsarkom, ameloblastisches Fibrom, Analkrebs, anaplastisches großzelliges Lymphom, anaplastischen Schilddrüsenkrebs, angioimmunoblastisches T-Zell-Lymphom, Angiomyolipom, Angiosarkom, Blinddarmkrebs, Astrozytom, atypischen teratoiden rhabdoiden Tumor, Basalzellkarzinom, basal-ähnliches Karzinom, B-Zell-Leukämie, B-Zell-Lymphom, Bellini-Gang-Karzinom, Gallengangskrebs, Blasenkrebs, Blastom, Knochenkrebs, Knochentumor, Hirnstamm-Gliom, Hirntumor, Brustkrebs, Brenner-Tumor, Bronchialtumor, bronchioloalveoläres Karzinom, Brauner Tumor, Burkitt-Lymphom, Krebs mit unbekanntem Entstehungsort, karzinoiden Tumor, Karzinom, Karzinom in situ, Karzinom des Penis, Karzinom mit unbekanntem Entstehungsort, Karzinosarkom, Castleman-Erkrankung, embryonalen Tumor des Zentralnervensystems, zerebelläres Astrozytom, zerebrales Astrozytom, Gebärmutterhalskrebs, Cholangiokarzinom, Chondrom, Chondrosarkom, Chordom, Choriokarzinom, Choroidplexuspapillom, chronische lymphozytäre Leukämie, chronische monozytäre Leukämie, chronische myeloische Leukämie, chronische myeloproliferative Erkrankung, chronische neutrophile Leukämie, Klarzellentumor, Dickdarmkrebs, Darmkrebs, Kraniopharyngiom, kutanes T-Zell-Lymphom, Degos-Erkrankung, Dermatofibrosarcoma protuberans, Dermoidzyste, Desmoplastischer kleiner Rundzellentumor, Diffuses großes B-Zell-Lymphom, dysembryoplastischen neuroepithelialen Tumor, embryonales Karzinom, endodermalen Sinustumor, Endometriumkrebs, endometrialen Gebärmutterkrebs, endometrioiden Tumor, enteropathie-assoziiertes T-Zell-Lymphom, Ependymoblastom, Ependymom, epithelioides Sarkom, Erythroleukämie, Speiseröhrenkrebs, Esthesioneuroblastom, Ewing-Familie der Tumore, Ewing-Familie-Sarkom, Ewing-Sarkom, extrakraniellen Keimzelltumor, extragonadalen Keimzelltumor, extrahepatischen Gallengangskrebs, extramammäres Paget-Syndrom, Eileiterkrebs, Fetus in fetu, Fibrom, Fibrosarkom, follikuläres Lymphom, follikulären Schilddrüsenkrebs, Gallenblasenkrebs, Gallenblasenkrebs, Gangliogliom, Ganglioneurom, Magenkrebs, Magenlymphom, Magen-DarmKrebs, gastrointestinalen Karzinoid-Tumor, gastrointestinalen Stromatumor, gastrointestinalen Stromatumor, Keimzelltumor, Germinom, Gestations-Choriokarzinom, Gestations-trophoblastischen Tumor, Riesenzelltumor des Knochens, Glioblastoma multiforme, Gliom, Gliomatosis cerebri, Glomustumor, Glucagonom, Gonadoblastom, Granulosazelltumor, Haarzellenleukämie, Haarzellenleukämie, Kopf- und Halskrebs, Kopf- und Halskrebs, Herzkrebs, Hämangioblastom, Hämangioperizytom, Hämangiosarkom, hämatologische Malignität, hepatozelluläres Karzinom, hepatosplenisches T-Zell-Lymphom, hereditäres Brust-Eierstockkrebs-Syndrom, Hodgkin-Lymphom, Hodgkin-Lymphom, Hypopharynxkrebs, hypothalamisches Gliom, entzündlichen Brustkrebs, intraokulares Melanom, Inselzellkarzinom, Inselzelltumor, juvenile myelomonozytäre Leukämie, Kaposi-Sarkom, Kaposi-Sarkom, Nierenkrebs, Klatskin-Tumor, Krukenberg-Tumor, Kehlkopfkrebs, Kehlkopfkrebs, Lentigo-maligna-Melanom, Leukämie, Leukämie, Lippen- und Mundhöhlenkrebs, Liposarkom, Lungenkrebs, Luteom, Lymphangiom, Lymphangiosarkom, Lymphoepitheliom, Lymphoide Leukämie, Lymphom, Makroglobulinämie, bösartiges fibröses Histiozytom, bösartiges fibröses Histiozytom, bösartiges fibröses Histiozytom des Knochens, bösartiges Gliom, bösartiges Mesotheliom, bösartigen peripheren Nervenscheidentumor, bösartigen rhabdoiden Tumor, bösartigen Triton-Tumor, MALT-Lymphom, Mantelzell-Lymphom, Mastzell-Leukämie, mediastinalen Keimzelltumor, mediastinalen Tumor, medulläres Schilddrüsenkarzinom, Medulloblastom, Medulloepitheliom, Melanom, Melanom, Meningiom, Merkelzell-Karzinom, Mesotheliom, Mesotheliom, metastasierendes Plattenepithelkarzinom mit okkultem Primärtumor, metastasierendes Urothelkarzinom, gemischten Mullertumor, monozytäre Leukämie, Mundkrebs, muzinösen Tumor, multiples endokrines Neoplasie-Syndrom, multiples Myelom, Mycosis Fungoides, Mycosis fungoides, myelodysplastische Erkrankung, myelodysplastische Syndrome, myeloische Leukämie, myeloisches Sarkom, myeloproliferative Erkrankung, Myxom, Nasenhöhlenkrebs, Nasopharynxkrebs, Nasopharynxkarzinom, Neoplasma, Neurinom, Neuroblastom, Neurofibrom, Neurom, noduläres Melanom, Non-Hodgkin-Lymphom, Non-Hodgkin-Lymphom, Nonmelanom-Hautkrebs, Nichtkleinzelligen Lungenkrebs, Augenonkologie, Oligoastrozytom, Oligodendrogliom, Onkozytom, Sehnervenscheidenmeningeom, Mundkrebs, Mundkrebs, Oropharynxkrebs, Osteosarkom, Osteosarkom, Eierstockkrebs, Eierstockkrebs, Eierstockepithelkrebs, Eierstockkeimzelltumor, Eierstocktumor mit geringem malignen Potential, Paget'sche Erkrankung der Brust, Pancoast-Tumor, Bauchspeicheldrüsenkrebs, Bauchspeicheldrüsenkrebs, papillaren Schilddrüsenkrebs, Papillomatose, Paragangliom, Nasennebenhöhlenkrebs, Nebenschilddrüsenkrebs, Peniskrebs, perivaskulären epithelioiden Zelltumor, Pharynxkrebs, Pharynxkrebs, Pharynxkrebs, pinealen parenchymalen Tumor der intermediären Differenzierung, Pineoblastom, Pituizytom, Hypophysenadenom, Hypophysentumor, Plasmazellneoplasma, pleuropulmonales Blastom, Polyembryom, Vorläufer-T-Lymphom, primäres Lymphom des Zentralnervensystems, primäres Ergusslymphom, primäres Leberzellkarzinom, primäres Peritonealkarzinom, primitiven neuroektodermalen Tumor, Prostatakrebs, Pseudomyxoma peritonei, Rektalkrebs, Nierenzellkarzinom, Atemwegskarzinom mit Beteiligung des NUT-Gens auf Chromosom 15, Retinoblastom, Rhabdomyom, Rhabdomyosarkom, Richter-Transformation, Teratom des Sakrokokzygeums, Speicheldrüsenkrebs, Sarkom, Schwannomatose, Talgdrüsenkarzinom, sekundäre Neoplasie, Seminom, serösen Tumor, Sertoli-Leydig-Zelltumor, Geschlechtsstrangstromatumor, Sezary-Syndrom, Siegelringzellkarzinom, Hautkrebs, kleinzelligen Rundzellentumor, kleinzelliges Karzinom, kleinzelligen Lungenkrebs, kleinzelliges Lymphom, Dünndarmkrebs, Weichteilsarkom, Somatostatinom, Rußwarze, Rückenmarkstumor, Wirbelsäulentumor, Milzrandzonen-Lymphom, Plattenepithelkarzinom, Magenkrebs, oberflächlich streuendes Melanom, supratentorialen primitiven neuroektodermalen Tumor, oberflächenepithelialen Stromatumor, synoviales Sarkom, akute lymphoblastische Leukämie der T-Zelle, großkörnige lymphatische Leukämie der T-Zelle, T-Zell-Leukämie, T-Zell-Lymphom, Prolymphozytäre Leukämie der T-Zelle, Teratom, lymphatischen Krebs im Endstadium, Hodenkrebs, Thekoma, Kehlkopfkrebs, Thymuskarzinom, Thymom, Schilddrüsenkrebs, Übergangszellkarzinom von Nierenbecken und Harnleiter, Übergangszellkarzinom, Urachuskarzinom, Harnröhrenkrebs, urogenitales Neoplasma, Uterus-Sarkom, Aderhautmelanom, Vaginalkrebs, Verner-Morrison-Syndrom, verruköses Karzinom, Sehbahn-Gliom, Vulvakrebs, Waldenstrom-Makroglobulinämie, Warthins Tumor und Wilms-Tumor beinhalten.
  • Gemäß verschiedener Ausführungsformen können zahlreiche Arten von Neoplasmen nachgewiesen werden, einschließlich (aber nicht beschränkt auf) akute lymphatische Leukämie (ALL), akute myeloische Leukämie (AML), Analkrebs, Astrozytome, Basalzellkarzinom, Gallengangskrebs, Blasenkrebs, Brustkrebs, Burkitt-Lymphom, Gebärmutterhalskrebs, chronische lymphozytäre Leukämie (CLL), chronische myeloische Leukämie (CML), chronische myeloproliferative Neoplasmen, Darmkrebs, diffuses großzelliges B-Zell-Lymphom, Endometriumkrebs, Ependymom, Speiseröhrenkrebs, Osthesioneuroblastom, Ewing-Sarkom, Eileiterkrebs, follikuläres Lymphom, Gallenblasenkrebs, Magenkrebs, gastrointestinaler Karzinoidtumor, Haarzellenleukämie, Leberzellkrebs, Hodgkin-Lymphom, Hypopharynxkrebs, Kaposi-Sarkom, Nierenkrebs, Langerhans-Zell-Histiozytose, Kehlkopfkrebs, Leukämie, Leberkrebs, Lungenkrebs, Lymphom, Melanom, Merkel-Zell-Krebs, Mesotheliom, Mundkrebs, Neuroblastom, Non-Hodgkin-Lymphom, nichtkleinzelliger Lungenkrebs, Osteosarkom, Eierstockkrebs, Bauchspeicheldrüsenkrebs, neuroendokrine Tumore der Bauchspeicheldrüse, Rachenkrebs, Hypophysentumor, Prostatakrebs, Rektumkarzinom, Nierenzellkrebs, Retinoblastom, Hautkrebs, kleinzelliger Lungenkrebs, Dünndarmkrebs, Plattenepithelkarzinom des Halses, T-Zell-Lymphom, Hodenkrebs, Thymom, Schilddrüsenkrebs, Gebärmutterkrebs, Vaginalkrebs und vaskuläre Tumore.
  • Viele Ausführungsformen beziehen sich auf diagnostische oder begleitende diagnostische Scans, die während der Krebsbehandlung eines Individuums durchgeführt werden. Bei der Durchführung diagnostischer Scans während der Behandlung kann die Fähigkeit des Agens zur Behandlung des Krebswachstums beobachtet werden. Die meisten Krebstherapeutika führen zum Absterben und zur Nekrose neoplastischer Zellen, wodurch größere Mengen an Nukleinsäuren aus diesen Zellen in die untersuchten Proben freigesetzt werden sollten. Dementsprechend kann der Spiegel der zirkulierenden Nukleinsäuren im Laufe der Zeit beobachtet werden, da der Spiegel während der ersten Behandlungen ansteigen und mit der Abnahme der kanzerogenen Zellen abnehmen sollte. In einigen Ausführungsformen werden die Behandlungen basierend auf dem Behandlungseffekt auf die Krebszellen angepasst. Wirkt die Behandlung beispielsweise nicht zytotoxisch auf neoplastische Zellen, kann die Dosis erhöht oder ein Agens mit höherer Zytotoxizität verabreicht werden. Alternativ kann, wenn die Zytotoxizität der Krebszellen gut ist, jedoch die unerwünschten Nebenwirkungen hoch sind, die Dosierung verringert werden oder ein Agens mit weniger Nebenwirkungen verabreicht werden.
  • Verschiedene Ausführungsformen sind auch auf diagnostische Scans gerichtet, die nach der Behandlung eines Individuums durchgeführt werden, um eine Restkrankheit und/oder ein Wiederauftreten von Krebs nachzuweisen. Deutet ein diagnostischer Scan auf einen Krebsrückstand und/oder ein Wiederauftreten des Krebses hin, können weitere diagnostische Tests und/oder Behandlungen wie hierin beschrieben durchgeführt werden. Ist der Krebs und/oder das Individuum anfällig für ein Wiederauftreten, können diagnostische Scans zur Überwachung eines eventuellen Rückfalls häufig durchgeführt werden.
  • F. Computersysteme
  • In einem Aspekt sieht die vorliegende Offenbarung ein Computerprogrammprodukt vor, umfassend ein nichtflüchtiges, computerlesbares Medium mit darin codiertem, computerausführbarem Code, wobei der computerausführbare Code zur Ausführung zur Implementierung eines beliebigen der vorangehenden Verfahren angepasst ist.
  • Die vorliegende Offenbarung stellt Computersysteme zur Verfügung, die zur Implementierung der Verfahren der Offenbarung programmiert sind. Das System kann in einigen Fällen Komponenten wie einen Prozessor, ein Eingabemodul zur Eingabe von Sequenzierungsdaten oder davon abgeleiteter Daten, ein computerlesbares Medium, das Anweisungen enthält, die bei Ausführung durch den Prozessor einen Algorithmus für die Eingabe in Bezug auf ein oder mehrere zellfreie Nukleinsäuremoleküle durchführen, und ein Ausgabemodul, das ein oder mehrere mit der Erkrankung verbundene Indizien bereitstellt, beinhalten.
  • 27 zeigt ein Computersystem 2701, das zur Implementierung eines Teils oder aller hierin offenbarten Verfahren programmiert oder anderweitig konfiguriert ist. Das Computersystem 2701 kann verschiedene Aspekte der vorliegenden Offenbarung regeln, wie zum Beispiel (i) Identifizieren eines oder mehrerer zellfreier Nukleinsäuremoleküle, die die Vielzahl von Phasenvarianten umfassen, aus Sequenzierungsdaten, die von einer Vielzahl zellfreier Nukleinsäuremoleküle abgeleitet sind, (ii) Analysieren beliebiger der identifizierten zellfreien Nukleinsäuremoleküle, (iii) Ermitteln einer Erkrankung des Subjekts, basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen, (iv) Überwachen eines Verlaufs der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen, (v) Identifizieren des Subjekts zumindest teilweise basierend auf den identifizierten zellfreien Nukleinsäuremolekülen, oder (vi) Ermitteln einer geeigneten Behandlung der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen. Das Computersystem 2701 kann ein elektronisches Gerät eines Benutzers oder ein Computersystem sein, das sich in Bezug auf das elektronische Gerät entfernt von diesem befindet. Das elektronische Gerät kann ein mobiles elektronisches Gerät sein.
  • Das Computersystem 2701 beinhaltet eine zentrale Verarbeitungseinheit (CPU, hierin auch „Prozessor“ und „Computerprozessor“) 2705, die ein Einzelkern- oder Mehrkernprozessor oder eine Vielzahl von Prozessoren für die Parallelverarbeitung sein kann. Das Computersystem 2701 beinhaltet ebenfalls einen Speicher oder Speicherplatz 2710 (z. B. Direktzugriffsspeicher, Festwertspeicher, Flash-Speicher), eine elektronische Speichereinheit 2715 (z. B. Festplatte), eine Kommunikationsschnittstelle 2720 (z. B. Netzwerkadapter) zur Kommunikation mit einem oder mehreren anderen Systemen und periphere Geräte 2725, wie z. B. Cache, andere Speicher, Datenspeicher und/oder elektronische Anzeigeadapter. Der Speicher 2710, die Speichereinheit 2715, die Schnittstelle 2720 und die Peripheriegeräte 2725 stehen über einen Kommunikationsbus (durchgezogene Linien), wie etwa eine Hauptplatine, mit der CPU 2705 in Verbindung. Die Speichereinheit 2715 kann eine Datenspeichereinheit (oder ein Datenrepository) zum Speichern von Daten sein. Das Computersystem 2701 kann mit Hilfe der Kommunikationsschnittstelle 2720 mit einem Computernetzwerk („Netzwerk“) 2730 wirkverbunden sein. Das Netzwerk 2730 kann das Internet, ein Internet und/oder Extranet oder ein Intranet und/oder Extranet sein, das mit dem Internet in Verbindung steht. In einigen Fällen ist das Netzwerk 2730 ein Telekommunikations- und/oder Datennetzwerk. Das Netzwerk 2730 kann einen oder mehrere Computerserver beinhalten, die eine verteilte Datenverarbeitung, wie beispielsweise Cloud Computing, ermöglichen können. Das Netzwerk 2730 kann in einigen Fällen mit Hilfe des Computersystems 2701 ein Peer-to-Peer-Netzwerk implementieren, das es den mit dem Computersystem 2701 verbundenen Geräten ermöglicht, sich als Client oder Server zu verhalten.
  • Die CPU 2705 kann eine Sequenz von maschinenlesbaren Anweisungen ausführen, die in einem Programm oder einer Software verkörpert sein können. Die Anweisungen können an einem Speicherplatz, wie etwa dem Speicher 2710, gespeichert werden. Die Anweisungen können an die CPU 2705 geleitet werden, die anschließend die CPU 2705 zur Implementierung der Verfahren der vorliegenden Offenbarung programmieren oder anderweitig konfigurieren kann. Beispiele für von der CPU 2705 durchgeführte Vorgänge können das Abrufen, Dekodieren, Ausführen und Zurückschreiben beinhalten.
  • Die CPU 2705 kann Teil einer Schaltung, beispielsweise einer integrierten Schaltung, sein. Eine oder mehrere andere Komponenten des Systems 2701 können in der Schaltung beinhaltet sein. In einigen Fällen ist die Schaltung eine anwendungsspezifische integrierte Schaltung (ASIC).
  • Die Speichereinheit 2715 kann Dateien, wie zum Beispiel Treiber, Bibliotheken und gespeicherte Programme, speichern. Die Speichereinheit 2715 kann Benutzerdaten wie z. B. Benutzereinstellungen und Benutzerprogramme speichern. In einigen Fällen kann das Computersystem 2701 eine oder mehrere zusätzliche, sich außerhalb des Computersystems 2701 befindliche Datenspeichereinheiten beinhalten, die sich beispielsweise auf einem entfernten Server befinden, der über ein Intranet oder das Internet mit dem Computersystem 2701 kommuniziert.
  • Das Computersystem 2701 kann über das Netzwerk 2730 mit einem oder mehreren entfernten Computersystemen kommunizieren. Das Computersystem 2701 kann beispielsweise mit einem entfernten Computersystem eines Benutzers kommunizieren. Beispiele für entfernte Computersysteme beinhalten PCs (z. B. tragbare PCs), Slate- oder Tablet-PCs (z. B. Apple® iPad, Samsung® Galaxy Tab), Telefone, Smartphones (z. B. Apple® iPhone, Android-fähige Geräte, Blackberry®) oder persönliche digitale Assistenten. Der Benutzer kann über das Netzwerk 2730 auf das Computersystem 2701 zugreifen.
  • Hierin beschriebene Verfahren können mittels eines maschinell (z. B. durch einen Computerprozessor) ausführbaren Codes implementiert werden, der in einem elektronischen Speicherplatz des Computersystems 2701, wie etwa im Speicher 2710 oder der elektronischen Speichereinheit 2715, gespeichert ist. Der maschinenausführbare oder maschinenlesbare Code kann in Form von Software bereitgestellt werden. Während der Nutzung kann der Code vom Prozessor 2705 ausgeführt werden. In einigen Fällen kann der Code aus der Speichereinheit 2715 abgerufen und für den schnellen Zugriff durch den Prozessor 2705 im Speicher 2710 abgelegt werden. In einigen Situationen kann die elektronische Speichereinheit 2715 ausgeschlossen werden, und maschinenausführbare Anweisungen werden im Speicher 2710 gespeichert.
  • Der Code kann vorkompiliert und für die Verwendung mit einer Maschine konfiguriert sein, die über einen Prozessor verfügt, der zur Ausführung des Codes geeignet ist, oder er kann während der Laufzeit kompiliert werden. Der Code kann in einer Programmiersprache bereitgestellt werden, die ausgewählt werden kann, damit der Code vorkompiliert oder wie kompiliert ausgeführt werden kann.
  • Aspekte der hierin vorgesehenen Systeme und Verfahren, wie zum Beispiel das Computersystem 2701, können als Programmierung verkörpert sein. Verschiedene Aspekte der Technologie können als „Produkte“ oder „Fertigungsartikel“ betrachtet werden, üblicherweise in Form von maschinen-(oder prozessor-)ausführbarem Code und/oder zugehörigen Daten, die auf einer Art von maschinenlesbarem Medium gespeichert oder darin verkörpert sind. Maschinenausführbarer Code kann in einer elektronischen Speichereinheit wie einem Speicher (z. B. Festwertspeicher, Direktzugriffsspeicher, Flash-Speicher) oder auf einer Festplatte gespeichert werden. Medien vom Typ „Speicher“ können beliebige oder alle greifbaren Speicher der Computer, Prozessoren oder dergleichen oder zugehörige Module davon beinhalten, wie beispielsweise verschiedene Halbleiterspeicher, Bandlaufwerke, Diskettenlaufwerke und dergleichen, die jederzeit nichtflüchtigen Speicher für die Softwareprogrammierung bereitstellen können. Die gesamte Software oder Teile davon können zeitweise über das Internet oder verschiedene andere Telekommunikationsnetze übertragen werden. Eine solche Kommunikation kann zum Beispiel das Laden der Software von einem Computer oder Prozessor auf einen anderen, zum Beispiel von einem Management-Server oder Host-Computer auf die Computerplattform eines Anwendungsservers, ermöglichen. So beinhaltet ein weiterer Medientyp, der die Softwareelemente tragen kann, optische, elektrische und elektromagnetische Wellen, wie sie über physische Schnittstellen zwischen lokalen Geräten, über kabelgebundene und optische Festnetze und über verschiedene Luftverbindungen verwendet werden. Die physischen Elemente, die diese Wellen tragen, wie beispielsweise drahtgebundene oder drahtlose Verbindungen, optische Verbindungen oder dergleichen, können ebenfalls als Träger der Software betrachtet werden. Wie hierin verwendet, beziehen sich Begriffe wie „Computer“ oder „maschinenlesbares Medium“ auf beliebige Medien, die an der Bereitstellung von Anweisungen für einen Prozessor zur Ausführung beteiligt sind, es sei denn, sie beschränken sich auf nicht-transitorische, greifbare „Speichermedien“.
  • Ein maschinenlesbares Medium, wie etwa ein computerausführbarer Code, kann daher viele Formen annehmen, einschließlich, aber nicht beschränkt auf ein materielles Speichermedium, ein Trägerwellenmedium oder ein physikalisches Übertragungsmedium. Nichtflüchtige Speichermedien beinhalten zum Beispiel optische oder magnetische Festplatten, wie beliebige Speichervorrichtungen in Computern oder dergleichen, die zur Implementierung der in den Zeichnungen gezeigten Datenbanken usw. verwendet werden können. Flüchtige Speichermedien beinhalten einen dynamischen Speicher, wie den Hauptspeicher einer solchen Computerplattform. Materielle Übertragungsmedien beinhalten Koaxialkabel, Kupferdraht und Glasfaserkabel, einschließlich der Drähte, die einen Bus innerhalb eines Computersystems umfassen. Trägerwellen können in Form elektrischer oder elektromagnetischer Signale, akustischer Wellen oder Lichtwellen übertragen werden, wie sie bei der Datenkommunikation über Hochfrequenz (RF) und Infrarot (IR) entstehen. Gängige Formen computerlesbarer Medien beinhalten daher beispielsweise: eine Diskette, eine flexible Platte, eine Festplatte, ein Magnetband, ein beliebiges anderes magnetisches Medium, eine CD-ROM, eine DVD oder DVD-ROM, ein beliebiges anderes optisches Medium, Lochkarten, Lochstreifen, ein beliebiges anderes physikalisches Speichermedium mit Lochmustern, einen RAM, einen ROM, einen PROM und EPROM, einen FLASH-EPROM, einen beliebigen anderen Speicherchip oder eine Kassette, eine Trägerwelle, die Daten oder Befehle transportiert, Kabel oder Verbindungen, die eine solche Trägerwelle transportieren, oder ein beliebiges anderes Medium, von dem ein Computer Programmiercode und/oder Daten lesen kann. Viele dieser Formen von computerlesbaren Medien können dazu dienen, eine oder mehrere Sequenzen von einer oder mehreren Anweisungen zur Ausführung an einen Prozessor zu übertragen.
  • Das Computersystem 2701 kann eine elektronische Anzeige 2735 beinhalten oder mit dieser in Verbindung stehen, die eine Benutzerschnittstelle (UI) 2740 zur Bereitstellung beispielsweise (i) einer Analyse beliebiger zellfreier Nukleinsäuremoleküle, (ii) einer Bestimmung der Erkrankung des Subjekts, die zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen basiert, (iii) eines ermittelten Verlaufs der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen, (iv) eines identifizierten Subjekts, bei dem zumindest teilweise basierend auf den identifizierten zellfreien Nukleinsäuremolekülen ein Verdacht auf die Erkrankung besteht, oder (v) einer ermittelten Behandlung der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen, umfasst. Beispiele für Benutzeroberflächen beinhalten, ohne Einschränkung, eine grafische Benutzeroberfläche (GUI) und eine webbasierte Benutzeroberfläche.
  • Verfahren und Systeme der vorliegenden Offenbarung können mittels eines oder mehrerer Algorithmen implementiert werden. Ein Algorithmus kann bei der Ausführung durch die zentrale Verarbeitungseinheit 2705 als Software implementiert werden. Der Algorithmus kann zum Beispiel (i) aus Sequenzierungsdaten, die von einer Vielzahl von zellfreien Nukleinsäuremolekülen abgeleitet sind, ein oder mehrere zellfreie Nukleinsäuremoleküle identifizieren, die die Vielzahl von Phasenvarianten umfassen, (ii) beliebige der identifizierten zellfreien Nukleinsäuremoleküle analysieren, (iii) eine Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen bestimmen, (iv) einen Verlauf der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen beobachten, (v) den Subjekt zumindest teilweise basierend auf den identifizierten zellfreien Nukleinsäuremolekülen identifizieren, oder (vi) eine geeignete Behandlung der Erkrankung des Subjekts basierend zumindest teilweise auf den identifizierten zellfreien Nukleinsäuremolekülen bestimmen.
  • BEISPIELE
  • Die folgenden Beispiele sind repräsentativ für Ausführungsformen der hierin beschriebenen Stimulationen, Systeme und Verfahren und sind in keiner Weise als einschränkend zu verstehen.
  • Beispiel 1: Genomische Verteilung von Phasenvarianten
  • Beschrieben ist eine Alternative zur Duplex-Sequenzierung zur Verringerung der Hintergrundfehlerrate, die den Nachweis von „Phasenvarianten“ (PVs) umfasst, wobei zwei oder mehr Mutationen in cis auftreten (d. h. auf demselben DNA-Strang 1A und 1E). Ähnlich wie bei der Duplex-Sequenzierung bietet dieses Verfahren niedrigere Fehlerprofile aufgrund des übereinstimmenden Nachweises von zwei separaten Nicht-Referenzereignissen in einzelnen Molekülen. Anders als bei der Duplex-Sequenzierung finden jedoch beide Ereignisse auf demselben Sequenzierlesepaar statt, wodurch die Effizienz der Genomrückgewinnung erhöht wird. Phasenmutationen kommen bei verschiedenen Krebsarten vor, treten jedoch, wahrscheinlich aufgrund von zielgerichteter und aberranter somatischer Hypermutation (aSHM), die durch die aktivierungsinduzierte Deaminase (AID) angetrieben wird, in stereotypen Teilen des Genoms bei B-Zell-Malignomen auf. Die am weitesten verbreiteten Bereiche von aSHM in B-Zell-Non-Hodgkin-Lymphomen (NHL) sind identifiziert. Hierin beschrieben ist Phasenvarianten-Anreicherung und Nachweis-Sequenzierung (PhasED-Seq.), ein neuartiges Verfahren zum Nachweis von ctDNA durch Phasenvarianten in Tumorfraktionen in der Größenordnung von Teilen pro Million. Hierin beschrieben ist eine Demonstration, dass PhasED-Seq. den Nachweis von ctDNA in klinischen Proben sowohl während der Therapie als auch vor einem Krankheitsrückfall bedeutend verbessern kann.
  • Zur Identifizierung von Malignomen, bei denen PVs den Krankheitsnachweis möglicherweise verbessern können, wurde die Häufigkeit von PVs bei verschiedenen Krebsarten untersucht. Öffentlich verfügbare Ganzgenom-Sequenzierungsdaten wurden zur Identifizierung von Variantensätzen analysiert, die in einem Abstand von < 170bp voneinander auftreten, was der üblichen Länge eines einzelnen cfDNA-Fragments entspricht, das aus einem einzelnen Kern-Nukleosom und einem zugehörigen Linker besteht. Die Häufigkeit dieser „putativen Phasenvarianten“ (Beispiel 10) für die Gesamtzahl der SNV von 2538 Tumoren in 24 Krebshistologien einschließlich solider Tumoren und hämatologischer Malignome (1B, 5 und Tabelle 1) wurde identifiziert und zusammengefasst. PVs waren am signifikantesten in zwei B-Zell-Lymphomen angereichert (DLBCL und follikuläres Lymphom, FL, P < 0,05 im Vergleich zu allen anderen Histologien), einer Gruppe von Krankheiten mit Hypermutation, die durch AID/AICDA angetrieben wird.
  • Beispiel 2: PVs zugrundeliegende Mutationsmechanismen
  • Zur Untersuchung des Ursprungs der PVs wurden die Mutationssignaturen der Einzelbasensubstitution (SBS), die zu den innerhalb von 170 bp einer anderen SNV auftretenden SNV beitragen, und die isoliert auftretenden SNV (z. B. ohne eine andere SNV innerhalb von 170 bp) verglichen (Beispiel 10). Wie erwartet waren PVs in mehreren, mit gruppierten Mutationen assoziierten Mutationssignaturen stark angereichert. Signaturen von mit der Aktivität von AID assoziierten gruppierten Mutationen (SBS84 und SBS85) waren signifikant in PVs von B-Zell-Lymphomen und CLL angereichert, während Signaturen, die mit der Aktivität von APOBEC3B (SBS2 und SBS13) - einem weiteren Mechanismus der Kataegis-Hypermutation - assoziiert sind, signifikant in PVs von mehreren soliden Krebs-Histologien, einschließlich Eierstock-, Pankreas-, Prostata- und Brust-Adenokarzinomen, angereichert waren (1C und 6A-6WW). Signaturen von mit der Aktivität von AID assoziierten gruppierten Mutationen (SBS84 und SBS85) waren in PVs angereichert, die in Lymphomen und CLL vorkommen, während Signaturen, die mit der Aktivität von APOBEC3B (SBS2 und SBS13) assoziiert sind, signifikant in Brustkrebs angereichert waren (1C und 6A-6WW). PVs von mehreren Tumorarten wurden auch mit SBS4 assoziiert, einer mit dem Tabakkonsum assoziierten Signatur. Darüber hinaus wurde unter den PVs in verschiedenen Tumorhistologien eine neuartige Anreicherung in mehreren anderen Signaturen ohne eindeutig zugehörige Mechanismen beobachtet (z. B. SBS24, SBS37, SBS38 und SBS39). Im Gegensatz dazu waren altersassoziierte Mutationssignaturen wie SBS1 und SBS5 in isolierten SNV deutlich angereichert.
  • Beispiel 3: PVs treten in stereotypen Genombereichen bei lymphatischen Krebsarten auf
  • Zur Beurteilung der genomischen Verteilung der putativen PVs wurden diese Ereignisse zunächst in 1-kb-Bereiche eingeteilt, um ihre Häufigkeit in verschiedenen Tumortypen zu visualisieren. Es wurde eine auffallend stereotype Verteilung von PVs in einzelnen lymphatischen Neoplasmen (z. B. DLBCL, FL, Burkitt-Lymphom (BL) und chronischer lymphatischer Leukämie (CLL); 1D und 7) beobachtet. Im Gegensatz dazu wiesen nichtlymphatische Krebsarten in der Regel kein wesentliches Rezidiv von gruppierten PVs in stereotypisierten Bereichen auf. Dieses Fehlen von Stereotypen in Bezug auf die Position von PVs war auch bei der Betrachtung von Melanomen und Lungenkrebs, Krankheiten mit häufigen PVs, festzustellen.
  • Auffällig ist, dass die Mehrzahl der hypermutierten Bereiche allen drei Lymphom-Subtypen gemeinsam war, wobei die höchsten Dichten in bekannten Zielen von aSHM, einschließlich BCL2, BCL6 und MYC, sowie in den die schweren und leichten Ketten IGH, IGK und IGL codierenden Immunglobulin-(Ig-)Loci zu beobachten waren (Tabelle 2). Markant ist, dass bestimmte Bereiche innerhalb der Ig-Loci bei fast allen Lymphompatienten und auch bei Patienten mit CLL dicht mutiert waren (1D). Unter den Lymphom-Subtypen wiesen die DLBCL-Tumore die meisten 1-kb-Bereiche auf, die rezidivierende PVs enthielten (8A), was mit der höchsten Anzahl an rezidivierend mutierten Genen in diesem Tumortyp übereinstimmt. Insgesamt wurden 1639 eindeutige 1-kb-Bereiche identifiziert, die rezidivierende PVs in B-Lymphoid-Malignität enthalten. Von diesen Lymphom-assoziierten 1-kb-Bereichen fiel fast ein Drittel in Genombereiche, die zuvor mit physiologischer oder aberranter SHM in B-Zellen assoziiert waren. Genauer gesagt befanden sich 19 % (315/1639) in Ig-Bereichen, während 13 % (218/1639) in Teilen von 68 zuvor identifizierten Zielen von aSHM lagen (Tabelle 2). Während die meisten PVs in nicht-codierende Bereiche des Genoms fielen, wurden auch zusätzliche, rezidivierend betroffene Loci identifiziert, die bisher nicht als Ziele von aSHM beschrieben worden waren, einschließlich unter anderem XBP1, LPP und AICDA.
  • Die Verteilung der PVs innerhalb jeder lymphoiden Malignität korrelierte mit onkogenen Merkmalen, die mit der unterschiedlichen Pathophysiologie der entsprechenden Krankheit verbunden sind. Beispielsweise enthielten Fälle von FL - bei denen mehr als 90 % der Tumore onkogene BCL2-Fusionen aufweisen - mit signifikant höherer Wahrscheinlichkeit Phasenvarianten von BCL2 als andere lymphoide Malignitäten (1D und 8B). In ähnlicher Weise wiesen signifikant mehr Burkitt-Lymphome (BL) PVs in MYC und ID3 auf, zwei Treibergene, die stark mit der BL-Pathogenese assoziiert sind, als andere lymphoide Malignitäten (1D und 8C-8D). Die mit unterschiedlichen Ursprungszellen assoziierten molekularen DLBCL-Subtypen zeigten ebenfalls unterschiedliche Verteilungen von PVs (Tabelle 2). Während Keimzentrums-B-Zellen-ähnliche (GCB) und aktivierte B-Zellen-ähnliche (ABC) DLBCLs insgesamt eine ähnliche Häufigkeit von PVs aufwiesen (Median 798 vs. 516, P = 0,37), wurde eine signifikante Anreicherung von PVs in den telomeren IGH-Klassenwechselbereichen (Sγ1 und Sγ3) bei ABC-DLBCLs gefunden, was im Einklang mit früheren Berichten41 steht (8E). Umgekehrt wiesen GCB-DLBCLs mehr Phasenhaplotypen in zentromerischen IGH-Klassenwechselbereichen (Sα2 und Sε) und in BCL2 auf.
  • Beispiel 4: Gestaltung und Validierung eines PhasED-Seq. Panels für Lymphom
  • Um diese PV-reichen Bereiche zu validieren und ihren Nutzen für den Nachweis von Krankheiten anhand von ctDNA zu bewerten, wurde ein Sequenzierungspanel gestaltet, das auf putative PVs abzielt, die in WGS aus drei unabhängigen Kohorten von Patienten mit DLBCL sowie bei Patienten mit CLL identifiziert wurden (2A und Beispiel 10). Dieses endgültige Panel für Phasenvarianten-Anreicherung und -Nachweis (PhasED-Seq.) zielte auf ~115kb genomischen Raum, der sich auf PVs konzentrierte, zusammen mit zusätzlichen ~200kb, die auf Gene abzielten, die rezidiv in B-NHLs mutiert sind (Tabelle 3). Während der für PV-Erfassungsziele vorgesehene Raum von 115 kb nur 0,0035 % des menschlichen Genoms abdeckt, werden 26 % der in reifen B-Zell-Neoplasmen mit WGS-Profilen beobachteten Phasenvarianten erfasst (9A), was zu einer ~7500-fachen PV-Anreicherung durch PhasED-Seq. im Vergleich zu WGS führt.
  • Die erwartete SNV- und PV-Rückgewinnung wurde mit dem zuvor berichteten CAPP-Seq.-Selektor verglichen, der zur Maximierung der SNV pro Patient bei B-Zell-Lymphomen gestaltet wurde (9A-C). Bei Berücksichtigung diverser B-NHLs mit verfügbaren WGS-Daten konnte PhasED-Seq. im medianen Fall 3,0-mal mehr SNV (81 vs. 27) und 2,9-mal mehr PVs (50 vs. 17) rückgewinnen als das vorherige CAPP-Seq.-Panel. Diese Beobachtung betont die Wichtigkeit, nicht-codierende Teile des Genoms für eine maximale Mutationsrückgewinnung einzuschließen. Zur Validierung dieser Ertragsverbesserungen wurden 16 Tumor- oder Plasma-DNA-Proben von Patienten mit DLBCL (Tabelle 4) vor der Behandlung mit einem Profil versehen. Sowohl CAPP-Seq- als auch PhasED-Seq.-Panels wurden parallel auf jede Probe angewendet und danach bis zu einer hohen eindeutigen molekularen Tiefe sequenziert (2B). Verglichen mit der durch WGS etablierten erwarteten Anreicherung wurden ähnliche Verbesserungen bei der Ausbeute an SNV durch PhasED-Seq. im Vergleich zu CAPP-Seq. (2,7x; Median 304,5 vs. 114) beobachtet. Bei der Auszählung der in individuellen sequenzierten DNA-Fragmenten beobachteten PVs wurde jedoch eine Verbesserung zugunsten von PhasED-Seq. festgestellt, die über die erwartete Verbesserung durch WGS hinausging (7,7x; Median 5554 vs. 719,5 PVs/Fall). Diese Verbesserung ist möglicherweise entweder 1) auf die höhere Sequenzierungstiefe bei der gezielten Sequenzierung zurückzuführen, die zu einer Verbesserung des Nachweises seltener Allele führt, oder 2) auf die Auszählung von PVs höherer Ordnung bei der gezielten Sequenzierung mit PhasED-Seq. oder CAPP-Seq, die beim WGS-Design nicht berücksichtigt wurde (d. h. > 2 SNV pro Fragment; 9D-9F). Darüber hinaus wurde über 1-kb-Fenster im Panel eine robuste Korrelation zwischen der Häufigkeit putativer PVs in WGS-Daten und PVs aus der gezielten Sequenzierung durch PhasED-Seq. über 101 DLBCL-Proben (2C) beobachtet, was die Häufigkeit und Verteilung von PVs in B-Zell-Malignitäten weiter validiert.
  • Beispiel 5: Unterschiede bei Phasenvarianten zwischen Lymphom-Subtypen
  • Nach der Validierung des PhasED-Seq.-Panels wurden die biologischen Unterschiede in PVs zwischen verschiedenen B-Zell-Malignitäten, einschließlich DLBCL (n=101), primärem mediastinalem B-Zell-Lymphom (PMBCL) (n=16) und klassischem Hodgkin-Lymphom (cHL) (n=23), untersucht. Die Anzahl der pro Fall identifizierten SNV unterschied sich nicht signifikant zwischen den Lymphom-Subtypen (9G-9K). Bei Berücksichtigung der Mutationshaplotypen wies cHL jedoch eine deutlich geringere Last an PVs auf als DLBCL oder PMBCL. Zusätzlich zu dieser quantitativen Diskrepanz wurden auch Unterschiede in der genomischen Lage der PVs zwischen verschiedenen B-Zell-Lymphom-Subtypen beobachtet (2D-2E und 10-12). Dies beinhaltete bereits zuvor etablierte biologische Assoziationen in DLBCL-Subtypen, einschließlich häufigerer PVs in BCL2 bei DLBCL vom GCB-Typ als vom ABC-Typ, wobei die umgekehrte Assoziation für PIM1 beobachtet wurde. Es wurden auch häufigere PVs in CIITA bei PMBCL im Vergleich zu DLBCL beobachtet, einem Gen, in dem Bruchpunkte bei PMBCL häufig sind. Relative Anreicherungen wurden auch im gesamten IGH Locus beobachtet, mit häufigeren PVs in den Bereichen Sy3 und Sγ1 bei ABC-DLBCL (im Vergleich zu GCB-DLBCL) und interessanterweise häufigeren PVs im Locus Sε bei cHL im Vergleich zu DLBCL (2E und 13). Insgesamt wurden nach Korrektur zur Prüfung multipler Hypothesen signifikante relative Anreicherungen in 25 genetischen Loci zwischen ABC- und GCB-DLBCL, 24 zwischen DLBCL und PMBCL und 40 zwischen DLBCL und cHL gefunden (10-12).
  • Beispiel 6: Rückgewinnung von Phasenvarianten durch PhasED-Seq.
  • Um den Nachweis von ctDNA mit Hilfe von PVs zu erleichtern, ist eine effiziente Rückgewinnung von DNA-Molekülen erforderlich. Die Hybrid-Capture-Sequenzierung ist potenziell empfindlich gegenüber DNA-Unstimmigkeiten, da mit zunehmenden Mutationen die Hybridisierungseffizienz abnimmt. In der Tat können AID-Hotspots eine lokale Mutationsrate von 5-10 % aufweisen, mit noch höheren Raten in bestimmten Bereichen der IGH. Zur empirischen Bewertung der Auswirkungen der Mutationsrate auf die Capture-Effizienz wurde die DNA-Hybridisierung von 150-meren mit unterschiedlichen Mutationsraten in silico simuliert. Wie erwartet, nahm die vorhergesagte Bindungsenergie mit zunehmender Anzahl von Mutationen ab (14A). Insbesondere hatten zufällig verteilte Mutationen eine größere Auswirkung auf die Bindungsenergie als gruppierte Mutationen. Zur Beurteilung der Auswirkung dieser verminderten Bindungsaffinität wurden 150-mer-DNA-Oligonukleotide mit 0 bis 10 % Abweichung von der Referenzsequenz in MYC und BCL6, zwei Loci, die Ziele von aSHM sind, synthetisiert. Zur Beurteilung des Worst-Case-Szenarios für die Hybridisierung wurden die Nicht-Referenzbasen nicht in Gruppen, sondern zufällig verteilt (Beispiel 10). Eine äquimolare Mischung dieser Oligonukleotide wurde dann mit dem PhasED-Seq.-Panel erfasst. In Übereinstimmung mit den In silico-Vorhersagen führte eine höhere Mutationsrate zu einer geringeren Erfassungseffizienz (3A). Moleküle mit einer Mutationsrate von 5 % wurden mit einer Effizienz von 85 % im Vergleich zu ihren Gegenstücken im Wildtyp erfasst, während Moleküle mit einer Mutationsrate von 10 % mit einer relativen Effizienz von nur 27 % erfasst wurden. Zur Beurteilung der Prävalenz dieses Mutationsgrades in menschlichen Tumoren wurde die Verteilung der Varianten im Panel bei 140 Patienten mit B-Zell-Lymphomen untersucht, wobei der Anteil der mutierten Basen in sich überlappenden 151-bp-Fenstern berechnet wurde (Beispiel 10). Nur 7 % (10/140) der Patienten hatten ein beliebiges 151-bp-Fenster mit einer Mutationsrate von über 10 % (14B-C). In der Tat wurde bei dem Versuch mit synthetischen Oligonukleotiden eine 5 %ige Mutationsrate fast genauso effizient rückerlangt wie die Wildtyp-Sequenz. In mehr als der Hälfte aller betrachteten Fälle wies kein Locus eine Mutationsrate von > 5 % in einem beliebigen Fenster auf, während in allen Fällen > 90 % der Fenster < 5 % Mutationen aufwiesen. Insgesamt deuten diese Beobachtungen daraufhin, dass, trotz der Hybridisierungsverzerrungen, die Mehrheit der Phasenmutationen durch effiziente Hybriderfassung rückerlangt werden kann.
  • Beispiel 7: Fehlerprofil und Nachweisgrenze für Phasenvarianten-Sequenzierung
  • Bisherige Verfahren zur hochgradig fehlerunterdrückten Sequenzierung von cfDNA haben entweder eine Kombination aus molekularen und In silico-Verfahren zur Fehlerunterdrückung (z. B. integrierte digitale Fehlerunterdrückung, iDES) oder molekulare Duplex-Rückgewinnung angewandt. Beide haben jedoch ihre Grenzen, sei es beim Nachweis von Ereignissen bei extrem niedrigen Tumorfraktionen oder bei der effizienten Rückgewinnung der ursprünglichen DNA-Moleküle, was für die cfDNA-Analyse, bei der die Ausgangs-DNA begrenzt ist, von großer Bedeutung ist. Das Fehlerprofil und die Rückgewinnung von Ausgangsgenomen aus cfDNA-Plasmaproben von 12 gesunden Erwachsenen durch PhasED-Seq. wurden mit iDES-CAPP-Seq. und Duplex-Sequenzierung verglichen. Während die iDES-angereicherte CAPP-Seq. ein geringeres Hintergrundfehlerprofil aufwies als die Barcode-Deduplikation allein, bot die Duplex-Sequenzierung die niedrigste Hintergrundfehlerrate für nicht-referenzielle Einzelnukleotid-Substitutionen (3B, 3,3 × 10-5 vs. 1,2 × 10-5, P < 0,0001). Die Rate der Phasenfehler - z. B. mehrere Nicht-Referenzbasen auf demselben Sequenzierungsfragment - war jedoch deutlich niedriger als die Rate der Einzelfehler in iDES-angereicherten CAPP-Seq- oder Duplex-Sequenzierungsdaten. Dies galt sowohl für das Vorkommen von zwei (2-fach oder ,Dublett`-PVs) als auch von drei (3-fach oder ,Triplett‘-PVs) Substitutionen auf ein und demselben DNA-Molekül (3B, 8,0 × 10-7 bzw. 3,4 × 10-8, P < 0,0001). Phasenfehler, die Substitutionen von C zu T oder T zu C enthalten, waren häufiger als andere Arten von PVs (14D). Bemerkenswert ist, dass die Fehlerrate der Dublett-PVs in cfDNA auch mit dem Abstand zwischen Positionen korreliert, wobei die höchste PV-Fehlerrate aus benachbarten SNV (z. B. DNVs) besteht und die Fehlerrate mit zunehmendem Abstand zwischen den einzelnen Varianten abnimmt (14E). Unter Berücksichtigung der eindeutigen molekularen Tiefe wurden bei der Duplex-Sequenzierung nur 19 % aller eindeutigen cfDNA-Fragmente rückerlangt (3C). Im Gegensatz dazu war die eindeutige Tiefe der PVs innerhalb eines genomischen Abstands von <20 bp fast identisch mit der Tiefe der individuellen Positionen (z. B. der Moleküle, die individuelle SNV abdecken). In ähnlicher Weise wiesen PVs mit einer Größe von bis zu 80 bps eine Tiefe von mehr als 50 % des Medians der eindeutigen molekularen Tiefe für eine Probe auf. Wichtig ist, dass fast die Hälfte (48 %) aller PVs innerhalb von 80 bp voneinander lagen, was ihren Nutzen für den Krankheitsnachweis aus ausgangsbegrenzten cfDNA-Proben zeigt (3D).
  • Zum quantitativen Vergleich der Leistung von PhasED-Seq. mit alternativen Verfahren zum Nachweis von ctDNA wurden limitierende Verdünnungen von ctDNA von 3 Lymphompatienten mit gesunder Kontroll-cfDNA hergestellt, was zu erwarteten Tumoranteilen zwischen 0,1 % und 0,00005 % (1 Teil in 2.000.000; (Beispiel 10) führte. Der erwartete Tumoranteil wurde mit dem geschätzten Tumorgehalt in jeder dieser Verdünnungen unter Verwendung von PhasED-Seq. verglichen, um vom Tumor abgeleitete PVs zu verfolgen, sowie mit fehlerunterdrückten Nachweisen in Abhängigkeit von einzelnen SNV (z. B. iDES-angereicherter CAPP-Seq. oder Duplex-Sequenzierung; 3E). Alle Verfahren funktionierten gleich gut bis zu Tumoranteilen von 0,01 % (1 Teil in 10.000). Unterhalb dieses Wertes (z. B. 0,001 %, 0,0002 %, 0,0001 % und 0,00005 %) waren jedoch sowohl die PhasED-Seq. als auch die Duplex-Sequenzierung der iDES-angereicherten CAPP-Seq. deutlich überlegen (P<0,0001 für Duplex, ,2x`-PhasED-Seq. und ,3x'-PhasED-Seq.; 3E). Zusätzlich identifizierte die Verfolgung von 2 oder 3 Varianten in Phase (z. B. 2x- und 3x-PhasED-Seq.) im Vergleich zur Duplex-Sequenzierung den erwarteten Tumorgehalt genauer, mit einer überlegenen Linearität von bis zu 1 Teil in 2.000.000 (P = 0,005 für Duplex vs. 2x-PhasED-Seq., P = 0,002 für 3x-PhasED-Seq.) (Beispiel 10). Die Spezifität der PVs wurde durch die Suche nach Hinweisen auf vom Tumor abgeleitete SNV oder PVs in cfDNA-Proben von 12 nicht verwandten gesunden Subjekt und der für die Grenzverdünnung verwendeten gesunden Kontrolle bewertet. Auch hier zeigten sowohl die 2x-als auch die 3x-PhasED-Seq. signifikant niedrigere Hintergrundsignalwerte als die CAPP-Seq. und die Duplex-Sequenzierung (3F). Diese niedrigere Fehlerrate und der Hintergrund von PVs verbessert die Nachweisgrenze für den Nachweis von ctDNA-Krankheiten. In einigen Fällen erfordert das hierin beschriebene Verfahren der auf Sequenzierung basierenden cfDNA-Assays (z. B. das in 3E und 3F dargestellte Verfahren) keine molekularen Barcodes, um eine exquisite Fehlerunterdrückung und niedrige Nachweisgrenzen zu erreichen. Bei der Beurteilung des Signals durch das Verfahren ohne Barcode wurden Verdünnungsreihen von 1 : 1.000 bis 5 : 10.000.000 und „leere“ Kontrollen verwendet (23A-23B).
  • Diese Verdünnungsreihe wurde zur Beurteilung der Nachweisgrenze für eine gegebene Anzahl von PVs verwendet (3G-3I). Bei Berücksichtigung eines Satzes von PVs innerhalb von Bereichen mit 150 Basenpaaren (bp) kann die Wahrscheinlichkeit des Nachweises für eine gegebene Probe durch Binomialstichproben genau modelliert werden, wobei sowohl die Tiefe der Sequenzierung als auch die Anzahl der 150bp-Bereiche mit PVs berücksichtigt werden (Beispiel 10).
  • Beispiel 8: Verbesserungen beim Nachweis einer minimalen Resterkrankung mit geringer Last
  • Um den Nutzen der mit PhasED-Seq. gebotenen niedrigeren LOD für den Nachweis von MRD mit sehr geringer Last aus cfDNA zu prüfen, wurden serielle zellfreie DNA-Proben von einem Patienten sequenziert, der sich einer Erstlinientherapie für DLBCL unterzieht (4A). Mithilfe von CAPP-Seq. war bei diesem Patienten nach nur einem Therapiezyklus keine ctDNA mehr nachweisbar, und mehrere nachfolgende Proben während und nach der Behandlung blieben ebenfalls nicht nachweisbar. Bei diesem Patienten kam es > 250 Tage nach Therapiebeginn zu einem erneuten Auftreten von nachweisbarer ctDNA und schließlich 5 Monate später zu einer klinischen und radiologischen Progression der Krankheit, was auf falsch-negative Serienmessungen mit CAPP-Seq. hindeutet. Auffallend ist, dass alle vier Plasmaproben, die während und nach der Behandlung durch CAPP-Seq. nicht nachweisbar waren, durch PhasED-Seq. nachweisbare ctDNA-Spiegel aufwiesen, mit mittleren Allelfraktionen von nur 6 Teilen in 1.000.000. Diese erhöhte Empfindlichkeit verbesserte im Vergleich zur radiologischen Überwachung die Vorlaufzeit für den Krankheitsnachweis durch ctDNA von 5 mit CAPP-Seq. auf 10 Monate mit PhasED-Seq.
  • Anschließend wurde die Leistung des PhasED-Seq.-ctDNA-Nachweises in einer Kohorte aus 107 Patienten mit großzelligen B-Zell-Lymphomen und Blutproben, die nach 1 oder 2 Zyklen einer Standard-Immunchemotherapie verfügbar waren, beurteilt. Wichtig ist, dass die mit PhasED-Seq. gemessenen ctDNA-Konzentrationen stark mit denen korrelierten, die mit CAPP-Seq. gemessen wurden. Insgesamt wurden 443 Tumor-, Keimbahn- und zellfreie DNA-Proben, einschließlich cfDNA vor der Therapie (n=107) und nach 1 oder 2 Behandlungszyklen (n=82 und 89), ausgewertet. Vor der Therapie waren patientenspezifische PVs durch PhaseED-Seq. in 98 % der Proben nachweisbar, mit 95 % Spezifität in cfDNA von gesunden Kontrollen (15 und 16A). Wichtig ist, dass die mit PhasED-Seq. gemessenen ctDNA-Werte stark mit den mit CAPP-Seq. gemessenen Werten korrelierten, unter Berücksichtigung sowohl der Proben vor der Behandlung als auch der Proben nach der Behandlung (Spearman Rho=0,91, 16B). Als Nächstes wurden die quantitativen Spiegel von ctDNA, die mittels PhasED-Seq. und CAPP-Seq. aus cfDNA-Proben nach Beginn der Therapie gemessen wurden, verglichen. Insgesamt wurden 72 % (78/108) der durch PhasED-Seq. nach 1 oder 2 Zyklen nachweisbaren ctDNA-Proben auch durch konventionelle CAPP-Seq. nachgewiesen (4B). Unter den mit PhasED-Seq. nachgewiesenen 108 Proben war die Krankheitslast bei denjenigen mit durch CAPP-Seq. nicht nachweisbaren (28 %) gegenüber nachweisbaren (72 %) ctDNA-Spiegeln signifikant geringer, mit einem > 10-fachen Unterschied in den medianen ctDNA-Spiegeln (Tumorfraktion 2,2 × 10-4 gegenüber 1,2 × 10-5, P < 0,001, 4B). Insgesamt wiesen weitere 16 % (13/82) der Proben nach 1 Therapiezyklus und 19 % (17/89) der Proben nach 2 Therapiezyklen beim Vergleich von PhasED-Seq. mit CAPP-Seq. nachweisbare ctDNA auf (4C).
  • Die Kriterien für die molekulare Remission der ctDNA wurden zuvor für DLBCL-Patienten unter Verwendung von CAPP-Seq. beschrieben und beinhalten die eindeutige molekulare Remission (Major Molecular Resopnse, MMR), definiert als eine 2,5-log-Reduktion in ctDNA nach 2 Therapiezyklen22. Während die MMR zu diesem Zeitpunkt prognostisch für das Ergebnis ist, haben viele Patienten zu diesem Meilenstein nicht durch CAPP-Seq nachweisbare ctDNA (4D-4E). Wichtig ist, dass selbst bei Patienten mit nicht durch CAPP-Seq. nachweisbarer ctDNA der Nachweis von okkulten ultraniedrigen ctDNA-Spiegeln durch PhasED-Seq. prognostisch für Ergebnisse war, die das ereignisfreie und das Gesamtüberleben beinhalten (4D). Tatsächlich wiesen 58 % (52/89) der 89 Patienten mit zu diesem Zeitpunkt verfügbaren Proben bei der MMR-Zwischenbeurteilung nach Abschluss von 2 von 6 geplanten Therapiezyklen nicht durch CAPP-Seq. nachweisbare ctDNA auf. Bei der Verwendung von PhasED-Seq wiesen 33 % (17/52) der nicht durch CAPP-Seq. nachgewiesenen Proben Hinweise auf ctDNA auf, die durch PVs nachgewiesen wurden, mit Spiegeln von bis zu ~3:1.000.000 (17A-17D) - diese 17 Fälle, die zusätzlich durch PhasED-Seq. nachgewiesen wurden, stellen potenzielle falsch-negative Tests durch CAPP-Seq. dar. Ähnliche Ergebnisse wurden zum Zeitpunkt der frühen molekularen Remission (EMR) beobachtet (d. h. nach 1 Zyklus der Therapie, 18A-18H).
  • Während der Nachweis von ctDNA bei DLBCL nach 1 oder 2 Therapiezyklen ein bekannter negativer prognostischer Marker ist, sind die Ergebnisse für Patienten mit nicht nachweisbarer ctDNA zu diesen Zeitpunkten heterogen (4E und 18F). Wichtig ist, dass selbst bei Patienten mit nicht durch CAPP-Seq nachweisbarer ctDNA nach 1 oder 2 Therapiezyklen der Nachweis von extrem niedrigen ctDNA-Werten durch PhasED-Seq eine starke Prognose für die Ergebnisse einschließlich des ereignisfreien Überlebens beinhaltete (4F, 17C-D, 18C-D und 18G). Bei der Kombination des Nachweises durch PhasED-Seq. mit dem zuvor beschriebenen MMR-Schwellenwert konnten die Patienten in drei Gruppen eingeteilt werden: Patienten, die keine MMR erreichten, Patienten, die eine MMR erreichten, jedoch persistierende ctDNA aufwiesen, und Patienten mit nicht nachweisbarer ctDNA (4G). Interessanterweise hatten Patienten, die keine MMR erreichten, trotz zusätzlicher geplanter Erstlinientherapie (z. B. innerhalb des ersten Jahres der Behandlung) ein besonders hohes Risiko für frühe Ereignisse, während Patienten mit anhaltend niedrigen ctDNA-Werten offenbar ein höheres Risiko für spätere Rückfälle oder Progressionen hatten. Im Gegensatz dazu hatten Patienten mit nicht nachweisbarer ctDNA nach 2 Therapiezyklen durch PhasED-Seq. überwältigend günstige Ergebnisse, wobei 95 % ereignisfrei waren und 97 % eine Gesamtüberlebenszeit von 5 Jahren aufwiesen. Ähnliche Ergebnisse wurden zum EMR-Zeitpunkt nach 1 Zyklus der Therapie beobachtet (18H).
  • Beispiel 9: Beispielhafte Ausführungsformen des Mutationsnachweises mittels Next-Generation-Sequenzierung (NGS), wenn es sich bei der Mutation nicht um eine einzelne Basensubstation, sondern um ein Mutationspaar handelt
  • In vielen Fällen kann eine Einschränkung der cfDNA-Verfolgung darin bestehen, dass nur eine begrenzte Anzahl von Molekülen für den Nachweis zur Verfügung steht. Darüber hinaus gibt es mehrere potenzielle Einschränkungen bei der Verfolgung von Tumormolekülen aus zellfreier DNA, die nicht nur das Fehlerprofil bei der Sequenzierung, sondern auch die Anzahl der für den Nachweis verfügbaren Moleküle beinhalten. Die Anzahl der für den Nachweis verfügbaren Moleküle - hier als Anzahl der „auswertbaren Fragmente“ bezeichnet - kann sowohl als Funktion der Anzahl der rückerlangten eindeutigen Genome (z. B. der eindeutigen Sequenzierungstiefe) als auch der Anzahl der verfolgten somatischen Mutationen betrachtet werden. Genauer gesagt, die Anzahl der auswertbaren Fragmente ist gleich: EF = d * n.
  • Wobei d = die berücksichtigte eindeutige molekulare Tiefe und n = die Anzahl der verfolgten somatischen Veränderungen ist. Für die typischen zellfreien DNA-Proben werden oft weniger als 10.000 eindeutige Genome rückerlangt (d), sodass ein beliebiges empfindliches Verfahren zur Verfolgung von Mehrfachveränderungen erforderlich ist (n). Darüber hinaus besteht, wie bereits erwähnt, die größte Einschränkung bei der Duplex-Sequenzierung in der Schwierigkeit, eine ausreichende molekulare Tiefe (d) zu erhalten. So gibt es von einer typischen Plasmaprobe mit einer Duplex-Tiefe von ~1.500x, selbst wenn 100 somatische Veränderungen vorliegen, nur 150.000 auswertbare Fragmente. In diesem Szenario wird die Empfindlichkeit also durch die Anzahl der für den Nachweis verfügbaren Moleküle begrenzt. Im Gegensatz dazu berücksichtigen andere Verfahren wie iDES-angereicherte CAPP-Seq. alle rückerlangten Moleküle. Hier können bis zu 5.000-6.000x eindeutige haploide Genome rückerlangt werden. Daher kann die Anzahl der auswertbaren Fragmente, die dieselben 100 somatischen Veränderungen aufweisen, 500.000-600.000x sein. Das Fehlerprofil der einzelsträngigen Sequenzierung erlaubt jedoch selbst mit Fehlerunterdrückung einen Nachweis von bestenfalls 1 Teil in 50.000. Daher müssen Verfahren, die auf eine Verbesserung der Nachweisgrenzen für ctDNA abzielen, sowohl das Fehlerprofil der Sequenzierung als auch die Rückgewinnung einer ausreichenden Anzahl auswertbarer Fragmente überwinden, um diese niedrigeren Fehlerprofile zu nutzen.
  • Um diesen offensichtlichen Mangel zu beheben, ist das Verfahren der PhasED-Seq., wie es in der vorliegenden Offenbarung beschrieben wird, auf lymphoide Malignitäten und auf andere Krebshistologien anwendbar (z. B. mit einem „personalisierten“ Ansatz). Für einen personalisierten Ansatz wurden personalisierte Hybrid-Capture-Oligonukleotide (oder Primer für PCR-Amplikons) verwendet, um personalisierte somatische Mutationen zu erfassen, die bei der Sequenzierung des gesamten Exoms oder Genoms identifiziert wurden. Der PCAWG-Datensatz, der auf SNV untersucht wurde, die in einem Abstand von weniger als 170bp im genomischen Raum auftreten, wurde erneut analysiert. Es wurde festgestellt, dass bei 14 von 24 berücksichtigten Krebshistologien der mediane Fall > 100 mögliche Phasenvarianten enthielt, was mehrere solide Tumore wie Melanome (Median 2072), Plattenepithelkarzinome der Lunge (1268), Adenokarzinome der Lunge (644,5) und kolorektale Adenokarzinome (216,5) beinhaltete.
  • Anschließend wurde die erwartete Nachweisgrenze in allen Fällen des PCAWG-Datensatzes entweder unter Verwendung von Duplex-Sequenzierung oder PhasED-Seq. bewertet. Auch hier wurde die Nachweisgrenze durch die erwartete Anzahl auswertbarer Fragmente definiert und hängt somit sowohl von der Anzahl der verfolgten Varianten als auch von der erwarteten Tiefe der Sequenzierung ab. Unter Verwendung der Daten aus optimierten Hybriderfassungsbedingungen wurde ein Modell zur Vorhersage der erwarteten deduplizierten (einzelsträngigen) und duplexen (doppelsträngigen) molekularen Tiefe bei einem gegebenen DNA-Eingang und einer gegebenen Anzahl von Sequenzierungslesungen erstellt. Daraus und aus der Anzahl der SNV oder möglichen PVs aus dem PCAWG-Datensatz wurde für jeden Fall beurteilt, welches Verfahren zu einer größeren Anzahl auswertbarer Fragmente und damit zu einer höheren Nachweisgrenze führen würde. Die Ergebnisse dieser Übung, die von 64 Nanogramm (ng) cfDNA-Input und insgesamt 20 Millionen Sequenzierungsauslesungen ausgeht, sind in 19 dargestellt. Bemerkenswert ist, dass PhasED-Seq. bei den meisten Krebsarten (18/24 Histologien) eine niedrigere Nachweisgrenze hatte als die Duplex-Sequenzierung. Dies beinhaltete nicht nur B-Zell-Lymphome, sondern auch häufige solide Tumore, darunter Plattenepithelkarzinome und Adenokarzinome der Lunge, kolorektale Adenokarzinome, Adenokarzinome der Speiseröhre und des Magens sowie Adenokarzinome der Brust, um nur einige zu nennen. Am Beispiel von Lungenkrebs wurde eine fast 10-fach niedrigere Nachweisgrenze für den Plattenepithel- und Adenokarzinom-Lungenkrebsfall mit PhasED-Seq. im Vergleich zur Duplex-Sequenzierung festgestellt (20). Sowohl die PhasED-Seq. als auch die Duplex-Sequenzierung mit einem personalisierten Ansatz wiesen eine niedrigere Nachweisgrenze auf als nicht-personalisierte Ansätze (z. B. iDES-angereicherte CAPP-Seq.).
  • Zur weiteren Bestätigung der Anwendbarkeit von Phasenvarianten und PhasED-Seq. bei verschiedenen soliden Tumoren wurde WGS (20-30x) an gepaarter Tumor- und normaler DNA durchgeführt, um PVs von fünf soliden Tumorpatienten zu identifizieren, bei denen vor der Behandlung eine geringe ctDNA-Belastung vorhergesagt wurde (Lungenkrebs (n=5)). Nach der Identifizierung putativer PVs in jedem Fall wurde anschließend ein Satz personalisierter Hybrid-Capture Oligonukleotide gestaltet, um eine gezielte Resequenzierung von Tumor- und normaler DNA zur Validierung der Kandidaten-PVs durchzuführen. Abschließend wurden die Plasmaproben aller 5 Patienten mit Hilfe der personalisierten PhasED-Seq. zum Nachweis von ctDNA mit hoher molekularer Tiefe sequenziert. Unter Berücksichtigung dieser fünf Lungenkrebsfälle erzielte der PhasED-Seq.-Ansatz eine ~10-fache Verbesserung der analytischen Sensitivität und erreichte einen medianen LOD von 0,00018 % im Vergleich zu 0,0019 % bei der Verwendung der personalisierten CAPP-Seq. ( 21).
  • Um die klinische Bedeutung dieser verbesserten Nachweisgrenze für ctDNA aus PhasED-Seq. bei soliden Tumoren zu demonstrieren, wurden serielle Plasmaproben eines Patienten mit Adenokarzinom der Lunge im Stadium 3, der mit Chemoradiotherapie mit kurativer Absicht behandelt wurde (LUP814), sowohl mit CAPP-Seq. als auch mit PhasED-Seq. analysiert. Wie oben beschrieben, quantifizierten sowohl CAPP-Seq. als auch PhasED-Seq. eine ähnliche Menge an ctDNA vor der Therapie (~1 % Tumorfraktion). Bei 3 weiteren Proben nach Beginn der Therapie war die ctDNA jedoch mit der Standard-CAPP-Seq. nicht nachweisbar, was Proben während und nach der Chemobestrahlung und während der adjuvanten Immuntherapie mit Durvalumab beinhaltete. Trotz des fehlenden Nachweises einer Krankheit durch CAPP-Seq. hatte der Patient nach einem anfänglichen radiologischen Ansprechen eine bioptisch bestätigte rezidivierende Krankheit. Bei der Analyse derselben Proben mit PhasED-Seq. wurde jedoch in 3/3 (100 %) der Proben eine molekulare Restkrankheit nachgewiesen, wobei die mittlere Tumorfraktion bei nur 0,00016 % (1,6 Teile pro Million) lag. Darüber hinaus spiegelte der Trend in der ctDNA-Quantifizierung den Krankheitsverlauf des Patienten wider, mit einem anfänglichen Ansprechen auf die Chemoradiotherapie, aber einer Progression der Krankheit während der Immuntherapie. Wichtig ist, dass die Krankheit dieses Patienten zu allen Zeitpunkten nachweisbar blieb, mit nachweisbarer Krankheit bei Abschluss der Chemoradiotherapie 8 Monate vor der durch Biopsie bestätigten Krankheitsprogression des Patienten (22).
  • Beispiel 10: Verfahren zur Phasenvariante-Anreicherung für einen verbesserten Nachweis von Krankheiten aus zellfreier DNA
  • 10(a): Analyse der Gesamtgenomsequenzierung
  • 10(a)(1): Gesamtgenom-Sequenzierungsdaten putativer Phasenvarianten-Identifikation
  • Die Gesamtgenom-Sequenzierungsdaten wurden aus zwei Quellen erlangt. Die Daten für lymphoide Malignitäten (diffuses großzelliges B-Zell-Lymphom, DLBCL; follikuläres Lymphom, FL; Burkitt-Lymphom, BL; chronische lymphatische Leukämie, CLL) wurden am 7. Mai 2018 vom Datenportal des International Cancer Genome Consortium (ICGC) heruntergeladen. Die Daten aller anderen Histologien waren Teil der Pan-Krebs-Analyse von ganzen Genomen (pan-Cancer analysis of whole genomes, PCAWG) und wurden am 11. November 2019 heruntergeladen. Es wurden nur Krebshistologien mit mindestens 35 verfügbaren Fällen berücksichtigt. Einzelheiten zu dem berücksichtigten Datensatz sind in Tabelle 1 aufgeführt. Alle Proben wiesen somatische Mutationen auf, die durch WGS unter Verwendung abgestimmter Tumor- und Normalgenotypisierungen ermittelt wurden. Die Abfragen beschränkten sich auf Basensubstitutionen, die aus WGS erlangt wurden (Einzel-, Doppel-, Dreifach- und Oligonukleotidvarianten; SNV, DNVs, TNVs und ONVs). Nachdem die Fälle und Varianten von Interesse identifiziert waren, wurde als nächstes die Anzahl der putativen Phasenvarianten (PVs) in jedem Tumor identifiziert. Um als PV auf einem einzelnen zellfreien DNA-Molekül (cfDNA) zu funktionieren, müssen zwei Varianten, wie etwa zwei Einzelnukleotidvarianten (SNV), im Allgemeinen innerhalb eines genomischen Abstands auftreten, der geringer ist als die Länge eines typischen cfDNA-Moleküls (~170bp). Daher wurden putative PVs als zwei Varianten definiert, die auf demselben Chromosom innerhalb eines genomischen Abstands von < 170bp auftreten. DNVs, TNVs und ONVs wurden als Satz ihrer jeweiligen Komponenten-SNV betrachtet. Die Anzahl der SNV sowie die Identität der putativen PVs für jeden Fall sind in Tabelle 1 aufgeführt. Die Rohanzahl der SNV und der putativen PVs sowie die Anzahl der putativen PVs unter Berücksichtigung der Anzahl der SNV ist dargestellt in 5A-C.
  • 10(a)(2): Mutationssignaturen von Phasenvarianten aus WGS
  • Zur Beurteilung der Mutationsprozesse, die mit Phasen- und Nicht-Phasen-Mutationen in verschiedenen Krebsarten/Subtypen verbunden sind, wurden die Mutationssignaturen einzelner Basensubstitutionen (SBS) für jeden oben beschriebenen WGS-Fall mit dem R-Paket ,deconstructSigs' ausgezählt. Die Liste der SNV für jeden Patienten wurde zunächst in zwei Gruppen aufgeteilt: 1) SNV, die innerhalb einer möglichen PV enthalten sind, d. h. mit einer benachbarten oder „nächsten Nachbar“-SNV in einer Entfernung von < 170bp, und 2) isolierte SNV (d. h. ohne Phase), die als in einem Abstand von ≥ 170bp zur nächstgelegenen SNV auftretend definiert sind. Anschließend wurde ,DeconstructSigs' unter Verwendung der 49 in COSMIC beschriebenen SBS-Signaturen (mit Ausnahme von Signaturen, die mit möglichen Sequenzierungsartefakten verbunden sind) angewendet, um den Beitrag jeder SBS-Signatur sowohl zu den Kandidaten für phasierte SNV als auch für nicht-phasierte SNV für jeden Patienten zu beurteilen. Um den Beitrag jeder SBS-Signatur zu den phasierten und isolierten SNV zu vergleichen, wurde ein Wilcoxon-Vorzeichen Rang-Test durchgeführt, um den relativen Beitrag jeder SBS-Signatur zwischen diesen beiden Kategorien für jede Krebsart zu vergleichen (6A-6WW). Zur Berücksichtigung mehrerer Hypothesen wurde die Bonferroni-Korrektur angewandt, indem jede beliebige SBS-Signatur, die sich in ihrem Beitrag zu den phasierten gegenüber den nichtphasierten SNV unterschied, als signifikant angesehen wurde, wenn der Wilcoxon-Vorzeichen Rang-Test einen P-Wert von < 0,05 / 49 oder 0,001 ergab. Die Verteilungen dieser Vergleiche sowie die Signifikanzprüfung sind in den 6A-6WW dargestellt. Eine Zusammenfassung dieser Analyse ist auch in 1C anhand einer Wärmebild-Darstellung dargestellt, wobei die „Wärme“ die Differenz zwischen dem mittleren Beitrag der SBS-Signatur zu Phasenvarianten und dem mittleren Beitrag zu isolierten/nicht-phasierten Varianten darstellt.
  • 10(a) (3): Genomische Verteilung von Phasenvarianten aus WGS
  • Die Rezidivhäufigkeit für PVs wurde bei jedem Krebstyp über das gesamte Genom innerhalb jedes Tumortyps untersucht. Insbesondere wurde das menschliche Genom (Build GRCh37/hg19) zunächst in 1-kb-Bins (insgesamt 3.095.689 Bins) unterteilt. Danach wurde für jede Probe die Anzahl der in jedem 1-kb-Bin enthaltenen PVs (wie oben definiert) gezählt. Für diese Analyse wurden beliebige PVs mit mindestens einem ihrer Bestandteil-SNV innerhalb des 1-kb-Bins von Interesse einbezogen. Anschließend wurde für jeden Krebstyp in jedem genomischen Bin der Anteil der Patienten berechnet, deren Tumor eine PV aufwies. Zur Identifizierung von 1-kb-Bins, die rezidiv PVs in Patienten enthalten, wurde die Anteil der Patienten, die PVs in jedem 1-kb-Bin enthalten, gegen die genomischen Koordinaten (1D und 7) aufgetragen. Für diese Analyse wurden nur Bins aufgezeichnet, in denen mindestens 2 % der Proben bei mindestens einem Krebssubtyp eine PV enthielten.
  • 10(a)(4): Identifizierung rezidiver 1-kb-Bins mit Phasenvarianten
  • Zur Identifizierung von 1-kb-Bins die rezidivierende PVs in B-Lymphoid-Malignitäten enthalten, wurden WGS-Daten der folgenden Krankheiten verwendet: DLBCL, FL, BL und CLL. Jede beliebige 1-kb-Bin, in der > 1 Probe aus diesen Tumortypen enthalten war, wurde als rezidiv PVs aus B-Lymphoid-Malignitäten enthaltend betrachtet. Die genomischen Koordinaten von 1kb-Bins, die rezidivierende PVs in lymphoiden Malignitäten enthalten, sind in Tabelle 2 aufgezählt und in 8A aufgezeichnet.
  • 10(b): Gestaltung eines PhasED-Seq.-Panels für B-Lymphoid-Malignitäten
  • 10(b)(1): Identifikation von rezidivierenden PVs aus WGS-Daten mit höherer Auflösung.
  • Angesichts der Prävalenz rezidivierender putativer PVs aus WGS-Daten bei B-Zell-Malignitäten wurde ein gezielter Sequenzierungsansatz für deren hybridisierungsvermitteltes Capture gestaltet - die Phasenvarianten-Anreicherungssequenzierung (Phased Variant Enrichment Sequencing, PhasED-Seq) -, um diese spezifischen PV-Ereignisse aus Tumor- oder zellfreier DNA anzureichern. Zusätzlich zu den vorstehend beschriebenen ICGC-Daten wurden in dieser Gestaltung auch WGS-Daten aus anderen Quellen verwendet, einschließlich sowohl B-Zell-NHLs als auch CLL.
  • Untersucht wurden auch frühere Erfahrungen mit der gezielten Sequenzierung von cfDNA bei NHLs. Es wurden Paare von SNV identifiziert, die in jeder B-Zell-Tumorprobe in einem Abstand von < 170bp voneinander auftreten. Anschließend wurden die genomischen „Fenster“, die PVs enthielten, wie folgt identifiziert: Für jedes Chromosom wurden die PVs nach genomischen Koordinaten relativ zu dem Referenzgenom sortiert. Daraufhin wurde die niedrigste (d. h. die am weitesten links liegende) Position für jeden beliebigen PV bei einem beliebigen Patienten identifiziert. Dies definierte die linke (5') Koordinate, die ein gewünschtes Fenster von Interesse darstellt, das aus dem Genom zu erfassen ist. Dieses Fenster wurde dann durch Wachstum seines 3'-Endes erweitert, um sukzessive PVs zu erfassen, bis eine Lücke von ≥340bp erreicht war, wobei 340-bp als Erfassung von zwei sukzessiven Fragmenten in Chromatosomengröße von ~170-bp gewählt wurde. Wurde eine solche Lücke erreicht, wurde ein neues Fenster begonnen und dieser iterative Prozess des Hinzufügens benachbarter PVs wurde erneut wiederholt, bis die nächste Lücke von ≥340bp erreicht war. Das Ergebnis ist eine BED-Datei mit genomischen Fenstern, die alle möglichen PVs aus allen berücksichtigten Proben enthält. Abschließend wurde jedes Fenster zusätzlich um 50bp auf jeder Seite aufgefüllt, um eine effiziente Erfassung flankierender Sequenzen in seltenen Fällen zu ermöglichen, in denen repetitive oder schlecht abbildende dazwischenliegende Sequenzen ihre direkte Anzielung zur Anreicherung ausschließen könnten.
  • Nach der Identifizierung der Bereiche von Interesse, die putative PVs enthalten, wurde dann jedes Fenster in 170bp-Segmente unterteilt (z. B. die ungefähre Größe eines chromatosomalen cfDNA-Moleküls). Danach wurde die Anzahl der eine PV enthaltenden Fälle in jedem Fall ausgezählt. Für jeden 170bp-Bereich wurde der Bereich in die endgültige Gestaltung des Panels einbezogen, wenn eines oder mehrere der folgenden Kriterien erfüllt waren: 1) mindestens ein Patient enthielt eine PV in dem 170bp-Bereich in 3 von 5 unabhängigen Datensätzen, 2) mindestens ein Patient enthielt eine PV in dem Bereich in 2 von 5 unabhängigen Datensätzen, wenn ein Datensatz vorherige CAPP-Seq-Erfahrung war, oder 3) mindestens ein Patient enthielt eine PV in dem Bereich in 2 von 5 unabhängigen Datensätzen, wobei insgesamt mindestens 3 Patienten eine PV in dem Bereich enthielten. Daraus ergaben sich 691 ,Kacheln‘, wobei jede Kachel einen 170bp großen Genombereich repräsentiert. Diese Kacheln wurden zusammen mit einem zusätzlichen ~200kb genomischen Raum, der in B-NHL rezidivierend mutierte Treibergene anzielt, zu einem einheitlichen gezielten Sequenzierungspanel kombiniert, wie es zuvor sowohl für die Tumor- als auch für die cfDNA-Genotypisierung mit NimbleDesign (Roche NimbleGen) beschrieben wurde. Die endgültigen Koordinaten dieses Panels sind in Tabelle 3 angegeben.
  • 10(b)(2): Vergleich der Leistung, von PhasED-Seq und CAPP-Seq bei PV-Ertrag
  • Zur Bewertung der Leistung von PhasED-Seq. bei der Erfassung von SNV und PVs im Vergleich zum zuvor berichteten CAPP-Seq.-Selektor für B-Zell-Lymphome wurde die vorhergesagte Anzahl von SNV und PVs, die mit jedem Panel durch Beschränkung von WGS in silico auf die Erfassungsziele jedes Ansatzes (9A-C) rückerlangt werden können, quantifiziert. Die vorhergesagte Anzahl der Varianten wurde dann unter Verwendung des Wilcoxon-Vorzeichen Rang-Tests verglichen. Sowohl CAPP-Seq. als auch PhasED-Seq. wurden auch an 16 Proben von Patienten mit DLBCL durchgeführt. In diesen Proben wurde die Tumor- oder Plasma-DNA zusammen mit der entsprechenden Keimbahn-DNA sequenziert. Die sich daraus ergebende Anzahl von Varianten wurde erneut mit dem Wilcoxon-Vorzeichen-Rang-Test verglichen (2B, und 9D-9E). Die Sequenzierungstiefe für die in dieser Analyse enthaltenen Proben ist in Tabelle 4 angegeben.
  • 10(c): Identifikation von Phasenvarianten aus gezielten Sequenzierungsdaten 10(c)(1): Patientenaufnahme und Entnahme klinischer Proben
  • Patienten mit B-Zell-Lymphomen, die sich einer Erstlinientherapie unterziehen, wurden von sechs Zentren in Nordamerika und Europa in diese Studie aufgenommen, darunter die Stanford University, das MD Anderson Cancer Center, das National Cancer Institute, die Universität Ost-Piemont (Italien), das Universitätsklinikum Essen (Deutschland) und CHU Dijon (Frankreich). Insgesamt wurden 343 zellfreie DNA-, 73 Tumor- und 183 Keimbahnproben von 183 Patienten in diese Studie einbezogen. Alle Patientenproben wurden mit einer schriftlichen Einverständniserklärung für die Verwendung zu Forschungszwecken entnommen und von den entsprechenden Prüfungsausschüssen (Institutional Review Boards) in Übereinstimmung mit der Deklaration von Helsinki genehmigt. Zellfreie, Tumor- und Keimbahn-DNA wurden wie zuvor beschrieben isoliert. Alle Röntgenuntersuchungen wurden im Rahmen der klinischen Standardversorgung durchgeführt.
  • 10(c)(2): Präparation der Bibliothek und Sequenzierung
  • Zur Erzeugung von Sequenzierungsbibliotheken und gezielten Sequenzierungsdaten wurde CAPP-Seq. wie zuvor beschrieben angewendet. Kurz gesagt wurden zellfreie, Tumor- und Keimbahn-DNA zum Aufbau von Sequenzierbibliotheken durch Endreparatur, A-Tailing und Adapterligierung gemäß den Anweisungen des Herstellers des KAPA Hyper Prep Kits verwendet, wobei die Ligation über Nacht bei 4 °C durchgeführt wurde. CAPP-Seq.-Adapter mit eindeutigen molekularen Identifikatoren (UMIDs) wurden für die Barcodierung eindeutiger DNA-Duplexe und die anschließende Deduplizierung von Sequenzierlesepaaren verwendet. Anschließend wurde unter Verwendung des vorstehend beschriebenen PhasED-Seq.-Panels eine Hybriderfassung durchgeführt (SeqCap EZ Choice; NimbleGen). Die Affinitätserfassung wurde gemäß des Herstellerprotokolls durchgeführt, wobei alle Hybridisierungen bei 47 °C auf einem Eppendorf-Thermocycler stattfanden. Nach der Anreicherung wurden die Bibliotheken unter Verwendung eines Illumina HiSeq4000 Instruments mit 2×150bp Paired-End-Lesungen sequenziert.
  • 10(c)(3): Vorverarbeitung und Ausrichtung.
  • Die FASTQ-Dateien wurden demultiplexiert und die UMIDs wurden mithilfe einer benutzerdefinierten Pipeline extrahiert, wie zuvor beschrieben. Nach der Demultiplexierung wurden die Lesungen mit Hilfe von BWA ALN an das menschliche Genom (Build GRCh37/hgl9) ausgerichtet. Die molekulare Barcode-vermittelte Fehlerunterdrückung und das Hintergrundpolieren (d. h. die integrierte digitale Fehlerunterdrückung; iDES) wurden dann wie zuvor beschrieben durchgeführt.
  • 10(c)(4): Identifikation von Phasenvarianten und allelische Quantifizierung
  • Nach der Erstellung von UMID-fehlerbereinigten Ausrichtungsdateien (z. B. BAM-Dateien) wurden die PVs aus jeder Probe wie folgt identifiziert. Zunächst wurde eine abgestimmte Keimbahnsequenzierung von unbeteiligten mononukleären Zellen des peripheren Blutes (Peripheral Blood Mononuclear Cells, PBMCs) durchgeführt, um patientenspezifische konstitutionelle Einzelnukleotid-Polymorphismen (Single Nucleotide Polymorphisms, SNPs) zu identifizieren. Diese wurden definiert als Nichtreferenzpositionen mit einer Varianten-Allel-Anteil (VAF) von über 40 % bei einer Tiefe von wenigstens 10 oder einem VAF von über 0,25 % bei einer Tiefe von wenigstens 100. Als Nächstes wurden PVs anhand von Leseebenedaten für eine Probe von Interesse identifiziert. Nach der UMID-vermittelten Fehlersuppression verwendeten jede einzelne Paired-End (PE)-Lesung und alle identifizierten Nichtreferenzpositionen ,samtools calmd‘. Zur Identifizierung von Varianten, die auf demselben Vorlagen-DNA-Molekül vorkommen, die dann entweder in Lesung 1 oder in Lesung 2 fallen können, wurden anstelle einzelner Lesungen PE-Daten verwendet. Jedes Lesepaar, das ≥2 Nichtreferenzpositionen enthielt, wurde als mögliche somatische PV betrachtet. Für Lesungen mit > 2 Nichtreferenzpositionen wurde jede Permutation der Größe ≥ 2 unabhängig berücksichtigt: d. h. wenn 4 Nichtreferenzpositionen in einem Lesepaar identifiziert wurden, wurden alle Kombinationen von 2 SNV (d. h. ,Doublett‘-Phasenvarianten) und alle Kombinationen von 3 SNV (d. h. ,Triplett`-Phasenvarianten) unabhängig berücksichtigt. PVs, die putative Keimbahn-SNPs enthalten, wurden ebenfalls wie folgt entfernt: Wenn in einem gegebenen n-Mer (d. h. n SNV in Phase auf einem gegebenen Molekül) ≥n-1 der Komponentenvarianten als Keimbahn-SNPs identifiziert wurden, wurde die PV redigiert. Diese Filterstrategie stellt sicher, dass für beliebige verbleibende PV mindestens 2 der Komponenten-SNV nicht in der Keimbahn zu finden sind, was sowohl für die Sensitivität als auch für die Spezifität von Bedeutung ist.
  • Putative somatische PVs wurden unter Verwendung eines heuristischen Sperrlisten-Ansatzes unter Berücksichtigung der Sequenzierungsdaten von 170 Keimbahn-DNA-Proben, die als Kontrollen dienten, herausgefiltert. In jeder dieser Proben wurden PVs auf Lesepaaren wie vorstehend beschrieben identifiziert, jedoch ohne Filterung nach übereinstimmenden Keimlinien. Jede beliebige PV, die in einer oder mehreren dieser Kontrollproben in einem oder mehreren Paired-End-Lesungen auftrat, wurde in die Sperrliste eingeschlossen und aus den patientenspezifischen somatischen PV-Listen entfernt.
  • Zur Berechnung des VAF jeder PV wurde ein Zähler, der die Anzahl der eine PV von Interesse enthaltenden DNA-Moleküle darstellt, über einen Nenner, der die Gesamtzahl der den Genombereich von Interesse abdeckenden DNA-Moleküle darstellt, berechnet. Das heißt, der Zähler ist einfach die Gesamtzahl der einen gegebenen PV enthaltenden deduplizierten Lesepaare, während der Nenner die Anzahl der den genomischen Locus eines gegebenen PV umfassenden Lesepaare ist.
  • 10(c)(5): Genotypisierung von Phasenvarianten aus Vorbehandlungsvroben
  • Die obige Strategie führte zu einer Liste von PVs mit einer Lesetiefe von≥1 in jeder Probe. Zur Identifizierung von PVs, die als tumorspezifische somatische Reporter für die Überwachung der Krankheit dienen, wurde für jeden Fall eine beste Genotypisierungs'-Probe identifiziert - entweder DNA aus einer Tumorgewebebiopsie (bevorzugt) oder zellfreie DNA aus der Vorbehandlungsphase. Nach der Identifizierung aller möglichen PVs in der ,besten Genotypisierungsprobe‘ wurde die Liste für die Spezifität wie folgt weiter gefiltert. Wenn für einen beliebigen n-Mer-PV-Satz ≥n-1 der konstituierenden SNV als Keimbahn-SNPs in den zuvor beschriebenen 170 Kontrollproben vorhanden waren, wurde die PV entfernt. Zudem wurden nur PVs berücksichtigt, die die folgenden Kriterien erfüllen: 1) AF > 1%; 2) Tiefe des PV-Locus von ≥100 Lesepaaren, und 3) mindestens eine Komponenten-SNV muss im Zielraum liegen. Schließlich, 4) jede beliebige PV, die diese Kriterien erfüllte, wurde in einer Kohorte von 12 gesunden cfDNA-Kontrollproben auf Leseunterstützung untersucht. Wenn eine beliebige Leseunterstützung in > 1 dieser 12 Proben vorhanden war, wurde die PV entfernt. Für die Genotypisierung zellfreier DNA-Proben, die durch SNV als geringe Tumorfraktion identifiziert wurden (d. h. < 1 % mittlere AF über alle SNV), wurde der AF-Schwellenwert für die Bestimmung der PVs auf > 0,2 % gelockert. Diese Filterung führte zu den PV-Listen, die für die Überwachung der Krankheit und den Nachweis von MRD verwendet wurden.
  • 10(c)(6): Bestimmung der Tumorfraktion in einer Probe aus Phasenvarianten
  • Bei der Bewertung einer Probe für den Nachweis einer minimalen Restkrankheit (MRD) mit vorheriger Kenntnis des Tumorgenotyps kann das Vorhandensein beliebiger PV, die in der besten Genotypisierungsprobe vor der Behandlung identifiziert wurden, in der MRD-Probe von Interesse bewertet werden. Anhand einer Liste von k möglichen tumorabgeleiteten PVs, die in der besten Genotypisierungsprobe beobachtet wurden, wurden alle Lesepaare ermittelt, die mindestens 1 der k möglichen PVs abdecken. Dieser Wert, d, kann als die aggregierte informative Tiefe‘ über alle von cfDNA-Molekülen überspannten PVs in einem PhasED-Seq-Versuch betrachtet werden. Anschließend wurde untersucht, wie viele dieser d Lesepaare tatsächlich 1 oder mehr der k möglichen PVs enthielten - dieser Wert, x, steht für die Anzahl der tumorabgeleiteten Moleküle, die somatische PVs in einer gegebenen Probe enthalten. Die Anzahl der tumorabgeleiteten Moleküle, die PVs enthalten, geteilt durch die informative Tiefe - x/d - ist daher die Phasenvarianten-Tumorfraktion (PVAF) in einer gegebenen Probe. Zum Nachweis von MRD in jeder Probe wurde die PVAF unabhängig für Dublett-, Triplett- und Quadruplett-PVs berechnet.
  • 10(c)(7): Monte-Carlo-Simulation zur empirischen Signifikanz des PV-Nachweises innerhalb einer Probe
  • Zur Beurteilung der statistischen Signifikanz des Nachweises von tumorabgeleiteten PVs in einer beliebigen Probe wurde ein empirischer Signifikanztest durchgeführt. Eine Teststatistik ƒ wurde zunächst wie folgt definiert - aus einer gegebenen Liste von k möglichen tumorabgeleiteten PVs, die in der besten Genotypisierungsprobe beobachtet wurden, wurde das arithmetische Mittel der Allelfraktionen über alle k PVs berechnet (Allelfraktion definiert als die Anzahl der Lesepaare, die eine individuelle PV (xi) enthalten, im Verhältnis zur Anzahl der Lesepaare, die die PV-Positionen (di) umfassen): f = i = 1 k x i d i k
    Figure DE112020005433T5_0001
    zur Bewertung der Hypothese, dass ƒ sich nicht signifikant von der Hintergrundfehlerrate ähnlicher PVs unterscheidet, die aus derselben Probe bewertet wurden. Zur Entwicklung einer Nullverteilung und Durchführung der statistischen Tests wurde ein Monte-Carlo-Ansatz verwendet:
    1. 1. Bei einer Gruppe von k PVs {pv1 ...pv1 ...pvk} wurde eine ,alternative‘ Liste von PVs {pv'1 ... pv'i ... pv' k} erstellt, sodass für jede alternative PV dieselbe Art von Basenänderung und derselbe Abstand zwischen SNV wie für die Test-PV vorlag. Wurde beispielsweise in der Genotypisierungsprobe eine Dublett-PV, chr14:106329929 C>T und chr14: 106329977 G>A, identifiziert und nach zwei alternativen Positionen im gleichen genomischen Abstand (hier 48bp) mit den Referenzbasen C und G gesucht und nach Lesepaaren mit den gleichen Arten von Basenveränderungen (d. h. C>T und G>A) bewertet, wird das unten stehende heuristische Suchschema verwendet.
    2. 2. Für jeden Tumor pvi in der Gruppe von k wurden 50 solcher Alternativen identifiziert. Dies wurde mit einem zufälligen Suchalgorithmus durchgeführt, um den genomischen Raum zu scannen und Alternativen zu identifizieren. Um diese 50 Alternativen zu finden, wurde eine zufällige Position auf demselben Chromosom wie der Test pvi identifiziert und dann nach denselben Arten von Referenzbasen im selben genomischen Abstand wie oben beschrieben gesucht. Die Syntenie der beobachteten/alternativen PVs wurde zur Kontrolle der Variation in den Bereichen in SHM/aSHM sowie der Kopienzahlvariation als potenzielle Störfaktoren der Nullverteilung verwendet. Alternative Positionen, die als Keimbahn-SNP identifiziert wurden, d. h. mit einer AF > 5 %, wurden ausgeschlossen.
    3. 3. Nach der Identifizierung von 50 solcher Alternativen für jede pvi wurden 10.000 zufällige Permutationen von 1 Alternative für jede der k Original-PVs erzeugt und die Phasenvariantenfraktion ƒ' für diese alternativen Listen in der Probe von Interesse, die auf das Vorhandensein von MRD ausgewertet wird, wie vorstehend beschrieben, berechnet.
    4. 4. Es wurde ein empirischer P-Wert berechnet, der definiert ist als die Anteil der Fälle, in denen die wahre Phasenvariante ƒ als kleiner oder gleich der alternativen ƒ' über die 10.000 zufälligen PV-Listen als empirisches Maß für die Signifikanz der MRD-Signifikanz in der Blutprobe von Interesse beobachtet wird.
  • Während dieser Vergleich ein Maß für die Signifikanz des PV-Nachweises der Tumor-Reporter-Liste im Vergleich zur empirisch definierten Hintergrund-PV-Fehlerrate innerhalb der Probe von Interesse ist, wurde seine Beziehung zur Spezifität des Nachweises über Fälle und Kontrollproben hinweg ebenfalls bewertet, wie nachstehend beschrieben.
  • 10(c)(8): Bewertung, der Spezifität von PhasED-Seq.
  • Zur Bestimmung der Spezifität des Nachweises von Krankheiten und MRD während PhasED-Seq. wurden zunächst patientenspezifische PVs von 107 Patienten mit DLBCL anhand von Tumor- oder Plasma-DNA aus der Vorbehandlung zusammen mit gepaarten Keimbahnproben identifiziert. Anschließend wurden 40 unabhängige Plasma-DNA-Proben von gesunden Individuen auf das Vorhandensein dieser patientenspezifischen PVs untersucht, wobei der oben beschriebene Monte-Carlo-Ansatz verwendet wurde. Ein Schwellenwert für die P-Werte wurde empirisch mit Hilfe von Monte Carlo ermittelt, sodass eine 95%ige Spezifität für den Nachweis von Krankheiten aus Dublett-, Triplett- und Quadruplett-PVs erreicht wurde. Der Schwellenwert für den P-Wert, der eine ≥95%ige Spezifität für jede Größe der PV ergibt, war wie folgt: < 0,041 für Dubletten, < 1 für Tripletten und < 1 für Quadrupletten. Die Ergebnisse dieser Spezifität bei der cfDNA-Kontrollanalyse sind in 15 und 16 dargestellt.
  • 10(c)(9): Berechnung der Fehlerraten
  • Zur Bewertung des Fehlerprofils sowohl von isolierten SNV als auch von PVs wurde die Nicht-Referenzbasis-Beobachtungsrate jeder Art von Variante über alle Lesungen hinweg untersucht. Für isolierte SNV wurde die Fehlerrate für jede mögliche Basenveränderung en1>n1' als der Anteil der Zielbasen mit dem Referenzallel n1 berechnet, die zum alternativen Allel n1' mutiert sind, wenn alle möglichen Basenveränderungen des Referenzallels berücksichtigt werden. Positionen mit einer Nicht-Referenz-Allel-Rate von mehr als 5 % wurden als wahrscheinliche Keimbahnereignisse eingestuft und aus der Fehlerratenanalyse ausgeschlossen. Eine globale Fehlerrate, definiert als die Mutationsrate vom hg 19-Referenzallel zu einem beliebigen alternativen Allel, wurde ebenfalls berechnet.
  • Für Phasenvarianten wurde eine ähnliche Berechnung durchgeführt. Für die Fehlerrate einer gegebenen Art von Phasenvariante, die sich aus k konstituierenden Basisänderungen {en1>n1' ... enk>nk'} zusammensetzt, wurde die Fehlerrate berechnet, indem sowohl die Anzahl der Instanzen der Art der Basisänderung (d. h. der Zähler) als auch die Anzahl der möglichen Instanzen für die Basisänderung (d. h. der Nenner) bestimmt wurde. Zur Berechnung des Zählers, N, wurde die Anzahl des Auftretens der PV von Interesse über alle Lesepaare in einer gegebenen Probe gezählt. Um beispielsweise die Fehlerrate von C>T- und G>A-Phasendubletts zu berechnen, wurde zunächst die Anzahl der Lesepaare gezählt, die sowohl ein zu einem T mutiertes Referenz-C als auch ein zu einem A mutiertes Referenz-G beinhalten.
  • Zur Berechnung des Nenners D wurde auch die Anzahl der möglichen Instanzen dieser Art von Phasenvariante berechnet; dies wurde zunächst für jedes Lesepaar i durchgeführt und dann über alle Lesepaare summiert. Eine PV mit k Komponenten kann als eine bestimmte Menge von Referenzbasen PA, PC, PG, PT aufweisend zusammengefasst werden, wobei pN die Anzahl der einzelnen Referenzbasen in der PV ist. In ähnlicher Weise enthält ein gegebenes Lesepaar einen bestimmten Satz von Referenzbasen bA, bC, bG, bT, wobei bN die Nummer jeder Referenzbase im Lesepaar ist. Daher kann für jedes Lesepaar in einer gegebenen Probe die Anzahl möglicher Vorkommnisse des PV-Typs von Interesse kombinatorisch wie folgt berechnet werden: D i = ( b A p A ) ( b C p C ) ( b G p G ) ( b T p T )
    Figure DE112020005433T5_0002
  • Betrachtet wird zum Beispiel ein Lesepaar mit 40 Referenz-As, 50 Referenz-Cs, 45 Referenz-Gs und 35 Referenz-Ts. Die Anzahl der Positionen für eine C>T- und G>A-PV ist: D i = ( 40 0 ) ( 50 1 ) ( 45 1 ) ( 35 0 ) = 2250
    Figure DE112020005433T5_0003
  • Der aggregierte Nenner, D, für die Berechnung der Fehlerrate ist dann einfach die Summe dieses Wertes über alle Lesepaare. Die Fehlerrate für diese Art von PV ist dann einfach N/D.
  • 10(d): Unterschiede bei Phasenvarianten zwischen Lymphom-Subtypen
  • Um die Verteilung der Phasenvarianten in verschiedenen Lymphomtypen zu vergleichen, wurden tumorspezifische PVs bei 101 DLBCL-, 16 PMBCL- und 23 cHL-Patienten durch Sequenzierung von Tumorbiopsieproben und/oder zellfreier DNA aus der Zeit vor der Behandlung sowie von gepaarten Keimbahnproben identifiziert. Nach der Identifizierung dieser tumorspezifischen PVs wurde ihre Verteilung im gesamten Panel für die gezielte Sequenzierung bewertet. Das Panel wurde zunächst in 50bp-Bins unterteilt. Anschließend wurde für jeden Patienten ermittelt, ob er Anzeichen einer PV innerhalb des 50bp-Bins aufwies, d. h. ob mindestens eine Komponente der PV innerhalb des Bins lag. Basierend auf der GENCODEv 19-Annotation des Referenzgenoms wurde das nächstgelegene Gen zu jedem 50bp-Bin bestimmt.
  • Um zu bewerten, wie die Verteilung der PVs zwischen den Subtypen von Lymphomen auf der Ebene spezifischer Gene variiert, wurde die Verteilung der PVs über die 50bp-Bins untersucht, die jedes Gen (oder das nächstgelegene Gen) umfassen. Betrachtet wird zum Beispiel ein gegebenes Gen mit n solcher 50bp-Bins, die im gezielten Sequenzierungspanel vertreten sind. Für jede Bin wurde zunächst die Anteil der Patienten, ƒ, in jedem Lymphomtyp mit einer innerhalb die 50bp-Bin fallenden PV bestimmt - d. h. Bestimmung von {ƒtype1,1, ... ƒtype1,n} und {ƒtype2,1' ... ƒtype2,n}. Anschließend wurden zwei beliebige Histologien hinsichtlich der Anteil der Fälle verglichen, die PVs in den jedem Gen zugewiesenen Satz von 50bp-Bins aufweisen. Diese Vergleiche sind für einzelne Gene in genspezifischen Diagrammen in 2D und 10-12 dargestellt.
  • Die Anreicherung von PVs wurde statistisch für einen bestimmten Lymphomtyp oder - subtyp im Vergleich zu einem anderen verglichen, indem die Differenz in der Anteil der Patienten berechnet wurde, die eine PV in jedem 50bp-Bin über alle Bins enthalten, die einem Gen zugeordnet sind (d.h. ein gegebenes Gen überlappen oder mit einem gegebenen nächstgelegenen Gen). Insbesondere wurde für jeden beliebigen Vergleich zwischen zwei Lymphomtypen (type1 und type2) dieser Satz von Unterschieden in der PV-Rate zunächst zwischen Histologien {ƒtype1,1 - ftype2,1, ... ƒtype1,n - ƒtype2,n} identifiziert. Dieser Satz gen-spezifischer Unterschiede in der Häufigkeit von PVs wurden dann zwischen den Lymphomtypen mit der Verteilung aller anderen 50bp-Bins im SequenzierungsPanel durch den Wilcoxon-Rangsummentest verglichen. Für diesen Test wurde der Satz von n 50bp-Bins, die einem gegebenen Gen zugeordnet sind, mit allen anderen 50bp-Bins verglichen (d. h. 6755 - n, da es 6755 50bp-Bins im Sequenzierpanel gibt). Dieser P-Wert ist zusammen mit dem mittleren Unterschied in der Anteil der Patienten mit einer PV in jedem Bin für jedes Gen zwischen den Histologien als Vulkan-Diagramm in 2E dargestellt. Zur Berücksichtigung der globalen Differenz in der Rate der PVs zwischen verschiedenen Histologien wurde die mittlere Differenz in der Anteil der Patienten mit einer PV zwischen den Histologien auf 0 zentriert, indem die mittlere Differenz zwischen allen Genen abgezogen wurde.
  • 10(e): Hybridisierungsbias
  • Zur Beurteilung der Auswirkungen von Mutationen auf die Hybridisierungseffizienz wurde zunächst die Affinität mutierter Moleküle zu Erfassungsködern des Wildtyps in silico geschätzt, indem DNA-Fragmente berücksichtigt wurden, die 0-30 % Mutationen im gesamten Fragment aufweisen. Für jeden Mutationszustand in diesem Bereich wurden zunächst 10.000 Bereiche mit einer Länge von jeweils 150 bp aus dem gesamten Genom zufällig ausgewählt. Diese 150-Mere wurden dann in silico zur Simulierung der gewünschten Mutationsrate auf 3 verschiedene Arten mutiert: 1) Mutation von ,gruppierten‘ oder zusammenhängenden Basen, ausgehend von den Enden einer Sequenz, 2) Mutation von gruppierten Basen, ausgehend von der Mitte der Sequenz, oder 3) Mutation von Basen, die an zufälligen Positionen in der Sequenz ausgewählt wurden. Danach wurde das Paket energy.c zur Berechnung der theoretischen Bindungsenergie (kcal/mol) zwischen den mutierten und den Wildtyp-Sequenzen verwendet, wobei auf ein Nearest-Neighbor-Modell zurückgegriffen wurde, das etablierte thermodynamische Parameter verwendet (14A).
  • Dieser In silico-Versuch wurde dann durch Testen der Auswirkungen der gleichen Mutationsraten in vitro repliziert. Insbesondere wurden Oligonukleotide (IDT) synthetisiert und zur Bildung von DNA-Duplexen, die 0-10 % Mutationen an definierten Positionen im Vergleich zur menschlichen Referenzgenomsequenz aufweisen, angelagert. Diese synthetischen DNA-Moleküle wurden daraufhin zusammen in äquimolaren Konzentrationen erfasst und die relative Erfassungseffizienz der mutierten Duplexe im Vergleich zu den nicht mutierten Wildtyp-Spezies quantifiziert (3A). Zwei Sätze von Oligonukleotidsequenzen wurden zur Erfassung von AIDvermittelten aberranten somatischen Hypermutationen, die mit jedem Gen verbunden sind, aus den kodierenden Bereichen von BCL6 und MYC ausgewählt (Tabelle 5). Die erhaltene Zuordnungsfähigkeit der mutierten Spezies wurde durch BWA ALN sichergestellt. Diese synthetischen Oligonukleotid-Duplexe wurden anschließend einer Bibliothekspräparation unterzogen und mit Hilfe von PhasED-Seq. erfasst und sequenziert, durchgeführt in Triplikaten unter Verwendung verschiedener Proben. Dies ermöglichte die Bewertung der relativen Effizienz der Hybriderfassung und der molekularen Rückgewinnung im direkten Vergleich zu Wildtyp-Molekülen, die mit dem Referenzgenom identisch sind.
  • 10(f): Beurteilung der Nachweisgrenze mit limitierenden Verdünnungsreihen
  • Zur empirischen Bestimmung der analytischen Sensitivität der PhasED-Seq. wurde eine limitierte Verdünnungsreihe zellfreier DNA von 3 Patienten verwendet, die mit gesunder zellfreier Kontroll-DNA in definierten Konzentrationen versetzt wurde. Die Verdünnungsreihe enthielt Proben mit einer erwarteten mittleren Tumorfraktion von 0,1 %, 0,01 %, 0,001 %, 0,0002 %, 0,0001 % und 0,00005 % oder im Bereich von 1 Teil in 1.000 bis 1 Teil in 2.000.000. Die Sequenzierungscharakteristika und die Quantifizierung der ctDNA mittels CAPP-Seq., Duplex-Sequenzierung und PhasED-Seq. sind bereitgestellt. Zum Vergleich der Leistung der einzelnen Verfahren wurde die Differenz, δ, zwischen der beobachteten und der erwarteten Tumorfraktion für jeden Patienten i bei jeder Verdünnungskonzentration j berechnet: δ i , j = t u m o r f r a c ^ l , J t u m o r f r a c i , j
    Figure DE112020005433T5_0004
  • Dieser Wert wurde für Patienten i = {1,2,3} und Konzentrationen j = {0.001%, 0.0002%, 0.0001%, 0.00005% } für jedes ctDNA-Nachweisverfahren (CAPP-Seq., Duplex, Dublett-PhasED-Seq. und Triplett-PhasED-Seq.) berechnet. Die Leistung der einzelnen Verfahren wurde dann mittels eines gepaarten t-Tests für diesen Satz von Patienten und Konzentrationen miteinander verglichen.
  • 10(g): Modell zur Vorhersage der Wahrscheinlichkeit des Nachweises für einen gegebenen Satz von Phasenvarianten
  • Um ein mathematisches Modell zur Vorhersage der Nachweiswahrscheinlichkeit für eine gegebene Probe von Interesse zu erstellen, wurde zunächst von der allgemeinen Annahme ausgegangen, dass der cfDNA-Nachweis als ein Zufallsprozess betrachtet werden kann, der auf einer binomialen Probenahme basiert. Im Gegensatz zu SNV, die in großen genomischen Abständen voneinander auftreten, kann der Nachweis von PVs jedoch stark voneinander abhängig sein, insbesondere wenn PVs degeneriert sind (d. h. wenn zwei PVs gemeinsame Komponenten-SNV haben) oder in unmittelbarer Nähe auftreten. Um dies zu berücksichtigen, wurden nur PVs, die > 150bp voneinander entfernt auftreten, als unabhängige ,Tumor-Reporter‘ betrachtet. Die Anzahl der ,Tumor-Reporter‘, die einen Nachweis der Krankheit in einer gegebenen Probe ermöglichen, kann somit wie folgt bestimmt werden. Das PhasED-Seq.-Panel wurde in 150bp-Bins aufgeteilt. Jede PV in einer Reporterliste eines gegebenen Patienten wurde dann in eine BED-Koordinate umgewandelt, die aus der Startposition (definiert als die am weitesten links stehende Komponente SNV) und der Endposition (definiert als die am weitesten rechts stehende Komponente SNV) besteht. Für jede PV wurde die 150bp-Bin aus dem die PV enthaltenden PhasED-Seq-Selektor-Panel bestimmt. Wenn eine PV zwei oder mehr 150bp-Bins umfasste, wurde sie beiden Bins zugewiesen. Die Anzahl der unabhängigen Tumor-Reporter wurde dann als die Anzahl der separaten 150bp-Bins definiert, die eine tumorspezifische PV enthalten.
  • Anschließend wurde ein mathematisches Modell entwickelt, das die erwartete Wahrscheinlichkeit des Nachweises für eine gegebene Probe mit einem gegebenen Tumoranteil mit einer gegebenen Anzahl unabhängiger Tumor-Reporter (z. B. 150 bp Bins) vergleicht. Bei einer gegebenen Anzahl von Tumor-Reportern r, bei einer gegebenen Tumorfraktion ƒ, mit einer gegebenen Sequenzierungstiefe d, kann die Wahrscheinlichkeit des Nachweises von 1 oder mehreren zellfreien DNA-Molekülen, die eine tumorspezifische PV enthalten, definiert werden als: P r ( d e t e c t i o n ) = 1 P r ( n o n d e t e c t i o n )
    Figure DE112020005433T5_0005
    = 1 ( d r 0 ) ƒ 0 ( 1 ƒ ) d r
    Figure DE112020005433T5_0006
    basierend auf einer einfachen binomialen Probenahme. Da das Verfahren zum Nachweis von ctDNA jedoch auf eine Falsch-Positiv-Rate von 5 % trainiert wurde, wurde dieser Term für die Falsch Positiv-Rate ebenfalls in das Modell aufgenommen: P r ( d e t e c t i o n ) = 1 P r ( n o n d e t e c t i o n ) + 0.05 ( n o n d e t e c t i o n )
    Figure DE112020005433T5_0007
    P r ( d e t e c t i o n ) = 1 0.95 P r ( n o n d e t e c t i o n )
    Figure DE112020005433T5_0008
    = 1 0.95 ( d r 0 ) ƒ 0 ( 1 ƒ ) d r
    Figure DE112020005433T5_0009
    3G zeigt die Ergebnisse dieses Modells für eine Auswahl von Tumor-Reportern r von 3 bis 67 in einer Tiefe d von 5000. Die Konfidenzhüllkurve in diesem Diagramm zeigt Lösungen für einen Tiefenbereich d von 4000 bis 6000.
  • Zur empirischen Validierung dieses Modells zur Bewertung der Wahrscheinlichkeit des Krankheitsnachweises wurden Proben aus limitierenden Verdünnungsreihen verwendet. In dieser Verdünnungsreihe wurden 3 Patienten-cfDNA-Proben, die jeweils patientenspezifische PVs enthielten, mit gesunder Kontroll-cfDNA verschnitten. Für jede Liste patientenspezifischer PVs wurden 25 zufällige Teilproben der 150bp-Bins mit patientenspezifischen PVs durchgeführt, um Reporterlisten mit einer variablen Anzahl tumorspezifischer Reporter zu erstellen. Es wurde eine maximale Bin-Anzahl von 67 gewählt, um eine Probenahme aus allen 3 patientenspezifischen PV-Listen zu ermöglichen, gefolgt von einer Reduzierung der Anzahl der Bins um 2x oder 3x je Vorgang. Dies führte zu Reporterlisten, die patientenspezifische PVs aus 3, 6, 17, 34 oder 67 unabhängigen 150bp-Bins enthielten. Der Krankheitsnachweis wurde dann anhand jeder dieser patientenspezifischen PV-Listen mit zunehmender Größe in jeder der „nassen“ limitierenden Verdünnungsproben von 1: 1.000 bis 1: 1.000.000 bewertet (3H, geschlossene Kreise). In silico-Mischungen wurden ferner unter Verwendung von Sequenzierungs-Lesungen aus limitierten Verdünnungsproben mit unterschiedlichem erwarteten Tumorgehalt erstellt und erneut auf die Wahrscheinlichkeit des Nachweises von Krankheiten unter Verwendung von patientenspezifischen Teilproben von PV-Reporterlisten unterschiedlicher Länge (offene Kreise) geprüft. Für diesen Versuch wurden sowohl die ,Nass`- als auch die ,In silico‘-Verdünnungs-Bam-Dateien abwärtskonvertiert, um eine Tiefe von ~4000-6000x zu erreichen, die der modellierten Tiefe entspricht. Der endgültige Mittelwert und die Standardabweichung der Tiefe über alle abwärts konvertierten Bam-Dateien betrug 4214x± 789. Die Wahrscheinlichkeit des Nachweises wurde über alle Tests bei einer gegebenen erwarteten Tumorfraktion für eine gegebene patientenspezifische PV-Liste zusammengefasst. Für jede gegebene Verdünnung wurden mehrere unabhängig voneinander abgetastete Sätze von Lesungen betrachtet, um eine bessere Schätzung der tatsächlichen Wahrscheinlichkeit des Nachweises zu ermöglichen. Im Einzelnen wurde die folgende Anzahl von Replikaten bei jeder angegebenen Verdünnung in Tabelle 7. betrachtet. Tabelle 7. Replikate bei jeder Verdünnung zur Vorhersage der Wahrscheinlichkeit des Nachweises für einen gegebenen Satz von Phasenvarianten.
    Verdünnung Replikate Anzahl der Tests (Replikate * 25) Nass oder in silico
    1 : 1.000 1 25 Nass
    5 : 10.000 3 75 In silico
    3,5 : 10.000 3 75 In silico
    2 : 10.000 3 75 In silico
    1 : 10.000 3 75 Nass
    5 : 100.000 3 75 In silico
    3,5 : 100.000 3 75 In silico
    2 : 100.000 3 75 In silico
    1 : 100.000 3 75 Nass
    5 : 1.000.000 8 200 In silico
    3,5 : 1.000.000 8 200 In silico
    2 : 1.000.000 8 200 Nass
    1 : 1.000.000 8 200 Nass
  • Die Gesamtzahl der Tests für jede patientenspezifische PV-Liste ist daher die Anzahl der zufällig unterabgetasteten PV-Listen (z. B. 25) multipliziert mit der Anzahl der unabhängig herunterabgetasteten Bam-Dateien; diese Zahl ist in der vorstehenden Tabelle angegeben. In 3H stellen die Punkte und Fehlerbalken den Mittelwert, das Minimum und das Maximum über alle drei Patienten dar. Die Übereinstimmung zwischen der vorhergesagten Wahrscheinlichkeit des Krankheitsnachweises aus dem theoretischen mathematischen Modell und den Nass- und In silico-Proben, die dieses Modell validieren, ist in 3I dargestellt.
  • 10(h): Statistische Analysen und Software-Verfügbarkeit
  • Alle in diesem Schriftstück angegebenen P-Werte sind, sofern nicht anders angegeben, 2-seitig. Vergleiche von übereinstimmenden Proben und Populationen wurden mit dem Wilcoxon-Vorzeichen Rang-Test durchgeführt; Vergleiche von Proben, die aus nicht verwandten Populationen stammen, wurden mit dem Wilcoxon-Rangsummentest durchgeführt. Vergleiche von gepaarten Proben wurden mittels eines gepaarten t-Tests durchgeführt. Die Überlebenswahrscheinlichkeiten wurden mit dem Kaplan-Meier-Verfahren geschätzt; das Überleben von Patientengruppen basierend auf den ctDNA-Werten wurde mit dem Log-Rang-Test verglichen. Andere statistische Tests sind bei Verwendung im Schiftstücktext vermerkt. Alle Analysen wurden unter Verwendung von MATLAB, Version 2018b, R Statistical Software, Version 3.4.1, und GraphPad Prism, Version 8.0.2, durchgeführt. Der Beitrag bekannter Mutationsprozesse zu phasierten und isolierten SNV aus WGS wurde mit dem Paket ,deconstruct Sigs R' unter Verwendung des COSMIC-Signaturensets (v2) wie beschrieben bewertet. Die Berechnung der AUC unter Berücksichtigung von Überleben und Zensur wurde mit dem Paket ,RsurvivalROC‘ Version 1.0.3 mit Standardeinstellungen durchgeführt. Eine ausführbare Version der PhasED-Seq.-Software, die in C++17 entwickelt wurde, ist unter phasedseq(dot)stanford(dot)edu verfügbar.
  • Beispiel 11
  • Weitere Einzelheiten zu den in der vorliegenden Offenbarung beschriebenen Tabellen sind hierin bereitgestellt:
  • TABELLE 1: 1000bp-Bereiche von Interesse im gesamten Genom, die putative Phasenvarianten (PV) in verschiedenen lymphoiden Neoplasmen enthalten. Es sind nur Bereiche dargestellt, die > 1 Proband mit einer PV enthalten. Koordinaten sind in hg 19. Bereiche von Genen, die zuvor als Ziele der aktivierungsinduzierten Deaminase (AID) identifiziert wurden, sind markiert. Bereiche, die in > 5 % das Subjekt beliebiger Histologie (BL, CLL, DLBCL, FL) PVs enthalten, sind ebenfalls markiert. BL, Burkitt-Lymphom, CLL, chronische lymphatische Leukämie, DLBCL, diffuses großzelliges B-Zell-Lymphom, FL, follikuläres Lymphom.
  • TABELLE 2: 1000bp-Bereiche von Interesse im gesamten Genom, die putative Phasenvarianten (PV) in den ABC- und GCB-Subtypen des DLBCL enthalten. Es sind nur Bereiche dargestellt, die > 1 Proband mit einer PV enthalten. Koordinaten sind in hg 19. Bereiche von Genen, die zuvor als Ziele von AID identifiziert wurden, sind markiert. ABC, aktivierter B-Zell-Subtyp; GCB, Keimzentrum-B-Zell-Subtyp.
  • TABELLE 3: Die Bereiche, die für das in dieser Veröffentlichung beschriebene PhasED-Seq.-Fängerreagenz verwendet wurden, konzentrierten sich auf lymphoide Malignitäten. Koordinaten sind in hg 19. Das nächstgelegene Gen und der Grund für die Aufnahme (Phasenvariante vs. allgemeine DLBCL-Genotypisierung) ist ebenfalls angegeben.
  • TABELLE 4: Anreicherung von PVs an genetischen Loci über das gesamte PhasED-Seq.gezielte Sequenzierungspanel für verschiedene Arten von B-Zell-Lymphomen (DLBCL einschließlich ABC- und GCB-Subtypen, PMBCL und cHL). Der PhasED-Seq.-Selektor wurde in 50bp-Bins in hgl9-Koordinaten gegliedert und jede Bin wurde nach Gen oder nächstgelegenem Gen beschriftet. Der Mittelwert der Anteil der Fälle einer gegebenen Histologie mit einer PV über alle 50bp-Bins ist dargestellt. Die Signifikanz wurde durch einen Rangsummentest (Mann-Whitney U-Test) von 50bp-Bins für ein gegebenes Gen im Vergleich zum Rest des Sequenzierpanels bestimmt. Unkorrigierte P-Werte sind angegeben, die Korrektur der multiplen Hypothesentests wurde mit dem Bonferroni-Verfahren durchgeführt. DLBCL, diffuses großzelliges B-Zell-Lymphom, PMBCL, primäres mediastinales B-Zell-Lymphom, cHL, klassisches Hodgkin-Lymphom, ABC, aktiviertes B-Zell-DLBCL, GCB, Keimzentrum-B-Zell-DLBCL.
  • TABELLE 5: Sequenzen von Oligonukleotiden, die zur Beurteilung der Hybridisierung und der molekularen Rückgewinnung mit zunehmender Mutationslast synthetisiert wurden (SEQ-ID NR. 1331-1358).
  • TABELLE 6: Nukleinsäuresonden für die Erfassungssequenzierung von B-Zell-Krebsen (SEQ-ID NRn. 0001-1330).
  • Obwohl hierin bevorzugte Ausführungsformen der vorliegenden Erfindung gezeigt und beschrieben wurden, wird es für den Fachmann offensichtlich sein, dass diese Ausführungsformen nur als Beispiel dienen. Eine Einschränkung der Erfindung durch die in der Patentschrift aufgeführten Beispiele ist nicht beabsichtigt. Während die Erfindung unter Bezugnahme auf die vorgenannte Patentschrift beschrieben wurde, sind die Beschreibungen und Abbildungen der Ausführungsformen hierin nicht in einem einschränkenden Sinne zu verstehen. Dem Fachmann werden zahlreiche Variationen, Änderungen und Substitutionen einfallen, ohne von der Erfindung abzuweichen. Darüber hinaus versteht sich, dass alle Aspekte der Erfindung nicht auf die hierin dargelegten spezifischen Darstellungen, Konfigurationen oder relativen Verhältnisse beschränkt sind, die von einer Vielzahl von Bedingungen und Variablen abhängen. Es versteht sich, dass verschiedene Alternativen zu den hierin beschriebenen Ausführungsformen der Erfindung bei der Durchführung der Erfindung verwendet werden können. Es ist daher vorgesehen, dass die Erfindung auch beliebige derartige Alternativen, Modifikationen, Variationen oder Äquivalente umfasst. Es ist beabsichtigt, dass die folgenden Ansprüche den Umfang der Erfindung definieren und dass Verfahren und Strukturen innerhalb des Umfangs dieser Ansprüche und ihrer Äquivalente dadurch umfasst werden.
  • Figure DE112020005433T5_0010
    Figure DE112020005433T5_0011
    Figure DE112020005433T5_0012
    Figure DE112020005433T5_0013
    Figure DE112020005433T5_0014
    Figure DE112020005433T5_0015
    Figure DE112020005433T5_0016
    Figure DE112020005433T5_0017
    Figure DE112020005433T5_0018
    Figure DE112020005433T5_0019
    Figure DE112020005433T5_0020
    Figure DE112020005433T5_0021
    Figure DE112020005433T5_0022
    Figure DE112020005433T5_0023
    Figure DE112020005433T5_0024
    Figure DE112020005433T5_0025
    Figure DE112020005433T5_0026
    Figure DE112020005433T5_0027
    Figure DE112020005433T5_0028
    Figure DE112020005433T5_0029
    Figure DE112020005433T5_0030
    Figure DE112020005433T5_0031
    Figure DE112020005433T5_0032
    Figure DE112020005433T5_0033
    Figure DE112020005433T5_0034
    Figure DE112020005433T5_0035
    Figure DE112020005433T5_0036
    Figure DE112020005433T5_0037
    Figure DE112020005433T5_0038
    Figure DE112020005433T5_0039
    Figure DE112020005433T5_0040
    Figure DE112020005433T5_0041
    Figure DE112020005433T5_0042
    Figure DE112020005433T5_0043
    Figure DE112020005433T5_0044
    Figure DE112020005433T5_0045
    Figure DE112020005433T5_0046
    Figure DE112020005433T5_0047
    Figure DE112020005433T5_0048
    Figure DE112020005433T5_0049
    Figure DE112020005433T5_0050
    Figure DE112020005433T5_0051
    Figure DE112020005433T5_0052
    Figure DE112020005433T5_0053
  • Figure DE112020005433T5_0054
    Figure DE112020005433T5_0055
    Figure DE112020005433T5_0056
    Figure DE112020005433T5_0057
    Figure DE112020005433T5_0058
    Figure DE112020005433T5_0059
    Figure DE112020005433T5_0060
    Figure DE112020005433T5_0061
    Figure DE112020005433T5_0062
    Figure DE112020005433T5_0063
    Figure DE112020005433T5_0064
    Figure DE112020005433T5_0065
    Figure DE112020005433T5_0066
    Figure DE112020005433T5_0067
    Figure DE112020005433T5_0068
    Figure DE112020005433T5_0069
    Figure DE112020005433T5_0070
    Figure DE112020005433T5_0071
    Figure DE112020005433T5_0072
    Figure DE112020005433T5_0073
    Figure DE112020005433T5_0074
    Figure DE112020005433T5_0075
    Figure DE112020005433T5_0076
    Tabelle 3
    # Chromosom Regionsbeginn Regionsende Am nächsten liegendes Gen Grund für Einschluss
    1 chr1 2306311 2306832 MORN1 Genotypisierung
    2 chr1 2334441 2334664 RER1 Genotypisierung
    3 chr1 2334671 2335161 RER1 Genotypisierung
    4 chr1 2488006 2488247 TNFRSF14 Phasenvarianten
    5 chr1 2489111 2489330 TKFRSF14 Genotypisierung
    6 chr1 2489726 2489973 TNFRSF14 Genotypisierung
    7 chr1 2491206 2491455 TNFRSF14 Genotypisierung
    8 chr1 2492036 2492175 TNFRSF14 Genotypisierung
    9 chr1 2493051 2493333 TNFRSF14 Genotypisierung
    10 chr1 2494241 2494376 TNFRSF14 Genotypisierung
    11 chr1 2494556 2494745 TNFRSF14 Genotypisierung
    12 chr1 3547350 3547715 WRAP73 Genotypisierung
    13 chr1 3747620 3747798 CEP104 Genotypisierung
    14 chr1 3800045 3800148 DFFB Genotypisierung
    15 chr1 3800155 3800363 DFFB Genotypisierung
    16 chr1 4472438 4472621 AJAP1 Genotypisierung
    17 chr1 4476348 4476627 AJAP1 Genotypisierung
    18 chr1 9784432 9784540 PIK3CD Genotypisierung
    19 chr1 23885407 23885541 ID3 Genotypisierung
    20 chr1 23885582 23885938 ID3 Genotypisierung
    21 chr1 27059146 27059321 ARID1A Genotypisierung
    22 chr1 27101071 27101294 ARID1A Genotypisierung
    23 chr1 27101401 27101613 ARID1A Genotypisierung
    24 chr1 27105466 27105671 ARID1A Genotypisierung
    25 chr1 27106311 27106523 ARID1A Genotypisierung
    26 chr1 27106711 27106920 ARID1A Genotypisierung
    27 chr1 29069531 29070185 YTHDF2 Genotypisierung
    28 chr1 34404022 34404171 CSMD2 Phasenvarianten
    29 chr1 35472492 35472739 ZMYM6 Genotypisierung
    30 chr1 61553802 61554330 NFIA Genotypisierung
    31 chr1 72334891 72335045 NEGR1 Phasenvarianten
    32 chr1 72335051 72335120 NEGR1 Phasenvarianten
    33 chr1 85733207 85733640 BCL10 Phasenvarianten
    34 chr1 85736272 85736619 BCL10 Genotypisierung
    35 chr1 85741932 85742068 BCL10 Genotypisierung
    36 chr1 86591437 86591909 COL24A1 Genotypisierung
    37 chr1 107866871 107867579 NTNG1 Genotypisierung
    38 chr1 109649126 109649304 Clorfl94 Genotypisierung
    39 chr1 109822181 109822805 PSRC1 Genotypisierung
    40 chr1 110561141 110561757 AHCYL1 Genotypisierung
    41 chr1 111441722 111442219 CD53 Genotypisierung
    42 chr1 111715727 111715908 CEPT1 Genotypisierung
    43 chr1 117078642 117078856 CD58 Genotypisierung
    44 chr1 117086927 117087172 CD58 Genotypisierung
    45 chr1 120457960 120459297 NOTCH2 Genotypisierung
    46 chr1 160319283 160319532 NCSTN Genotypisierung
    47 chr1 181452914 181453131 CACNA1E Genotypisierung
    48 chr1 185833555 185833832 HMCN1 Genotypisierung
    49 chr1 185972790 185973006 HMCN1 Genotypisierung
    50 chr1 186062580 186062797 HMCN1 Genotypisierung
    51 chr1 186083050 186083301 HMCN1 Genotypisierung
    52 chr1 186143590 186143828 HMCN1 Genotypisierung
    53 chr1 186158895 186159102 HMCN1 Genotypisierung
    54 chr1 190067139 190068194 FAM5C Genotypisierung
    55 chr1 201038552 201038756 CACNA1S Genotypisierung
    56 chr1 203274697 203275926 BTG2 Phasenvarianten
    57 chr1 203276207 203276586 BTG2 Genotypisierung
    58 chr1 226923691 226925200 ITPKB Phasenvarianten
    59 chr1 227842646 227842718 ZNF678 Genotypisierung
    60 chr2 1652010 1652858 PXDN Genotypisierung
    61 chr2 48027958 48028159 MSH6 Genotypisierung
    62 chr2 48059883 48060051 FBXO11 Genotypisierung
    63 chr2 48065973 48066184 FBXO11 Genotypisierung
    64 chr2 55237198 55237610 RTN4 Genotypisierung
    65 chr2 56149510 56150116 EFEMP 1 Genotypisierung
    66 chr2 58520800 58521222 FANCL Genotypisierung
    67 chr2 59821914 59822083 BCL11A Genotypisierung
    68 chr2 60773084 60773479 BCL11A Genotypisierung
    69 chr2 61118794 61118998 REL Genotypisierung
    70 chr2 61145504 61145785 REL Genotypisierung
    71 chr2 61148869 61149644 REL Genotypisierung
    72 chr2 61441169 61441870 USP34 Genotypisierung
    73 chr2 61719434 61719642 XPO1 Genotypisierung
    74 chr2 62934009 62934460 EHBP1 Genotypisierung
    75 chr2 63217829 63218002 EHBP1 Genotypisierung
    76 chr2 63335242 63335600 WDPCP Genotypisierung
    77 chr2 63631157 63631817 WDPCP Genotypisierung
    78 chr2 63826277 63826429 MDH1 Genotypisierung
    79 chr2 65258145 65258367 SLC1A4 Phasenvarianten
    80 chr2 65593035 65593153 SPRED2 Phasenvarianten
    81 chr2 65593180 65593250 SPRED2 Phasenvarianten
    82 chr2 77746602 77746988 LRRTM4 Genotypisierung
    83 chr2 80801235 80801513 CTNNA2 Genotypisierung
    84 chr2 88906681 88906861 EIF2AK3 Phasenvarianten
    85 chr2 89127261 89127335 IGKC Phasenvarianten
    86 chr2 89127461 89127946 IGKC Phasenvarianten
    87 chr2 89128431 89128574 IGKC Phasenvarianten
    88 chr2 89131726 89132295 IGKC Phasenvarianten
    89 chr2 89140556 89140755 IGKC Phasenvarianten
    90 chr2 89140886 89141350 IGKC Phasenvarianten
    91 chr2 89157326 89157609 IGKC Phasenvarianten
    92 chr2 89157626 89158011 IGKC Phasenvarianten
    93 chr2 89158036 89158938 IGKC Phasenvarianten
    94 chr2 89158941 89159493 IGKJ5 Phasenvarianten
    95 chr2 89159511 89161445 IGKJ1 Phasenvarianten
    96 chr2 89161926 89162149 IGKJ1 Phasenvarianten
    97 chr2 89162776 89163285 IGKJ1 Phasenvarianten
    98 chr2 89163306 89163837 IGKJ1 Phasenvarianten
    99 chr2 89163861 89164838 IGKJ1 Phasenvarianten
    100 chr2 89164866 89165181 IGKJ1 Phasenvarianten
    101 chr2 89165191 89165644 IGKJ 1 Phasenvarianten
    102 chr2 89184966 89185186 IGKV4-1 Phasenvarianten
    103 chr2 89185196 89185704 IGKV4-1 Phasenvarianten
    104 chr2 89196226 89196411 1GKV5-2 Phasenvarianten
    105 chr2 89196851 89197324 IGKV5-2 Phasenvarianten
    106 chr2 89214836 89215040 IGKV5-2 Phasenvarianten
    107 chr2 89246681 89246772 IGKV1-5 Phasenvarianten
    108 chr2 89246786 89246857 IGKV1-5 Phasenvarianten
    109 chr2 89246911 89247053 IGKV1 -5 Phasenvarianten
    110 chr2 89247096 89247215 IGKV1-5 Phasenvarianten
    111 chr2 89247526 89247628 IGKV1-5 Phasenvarianten
    112 chr2 89247641 89247735 IGKV1-5 Phasenvarianten
    113 chr2 89247831 89248010 IGKV1-5 Phasenvarianten
    114 chr2 89265756 89265829 IGKV1-6 Genotypisierung
    115 chr2 89265936 89266013 IGKV1-6 Genotypisierung
    116 chr2 89291906 89291981 IGKV1-8 Phasenvarianten
    117 chr2 89292131 89292217 IGKV1-8 Phasenvarianten
    118 chr2 89442291 89442561 IGKV3-20 Phasenvarianten
    119 chr2 89442616 89443259 IGKV3-20 Phasenvarianten
    120 chr2 89475781 89476009 IGKV2-24 Genotypisierung
    121 chr2 89476041 89476122 IGKV2-24 Genotypisierung
    122 chr2 89544331 89544608 IGKV2-30 Genotypisierung
    123 chr2 89544656 89544899 IGKV2-30 Phasenvarianten
    124 chr2 89976276 89976426 IGKV2D-30 Genotypisierung
    125 chr2 89986776 89987023 IGKV2D-29 Genotypisierung
    126 chr2 89987031 89987108 IGKV2D-29 Genotypisierung
    127 chr2 90025206 90025289 IGKV2D-26 Genotypisierung
    128 chr2 90025296 90025378 IGKV2D-26 Genotypisierung
    129 chr2 90025471 90025554 IGKV2D-26 Genotypisierung
    130 chr2 90077981 90078054 IGKV3D-20 Genotypisierung
    131 chr2 90078136 90078222 IGKV3D-20 Genotypisierung
    132 chr2 90078251 90078335 IGKV3D-20 Genotypisierung
    133 chr2 90121891 90122008 IGKV1D-17 Genotypisierung
    134 chr2 90122021 90122157 IGKV1D-17 Genotypisierung
    135 chr2 90212016 90212093 IGKV3D-11 Genotypisierung
    136 chr2 90212196 90212278 IGKV3D-11 Genotypisierung
    137 chr2 90249151 90249275 IGKV1D-43 Genotypisierung
    138 chr2 90249346 90249419 IGKV1D-43 Genotypisierung
    139 chr2 90259931 90260059 JGKV1D-8 Genotypisierung
    140 chr2 90260181 90260258 IGKV1D-8 Genotypisierung
    141 chr2 96809889 96810144 DUSP2 Genotypisierung
    142 chr2 96810164 96810374 DUSP2 Phasenvarianten
    143 chr2 100758483 100758660 AFF3 Phasenvarianten
    144 chr2 103148733 103148948 SLC9A4 Genotypisierung
    145 chr2 117951919 117952057 DDX18 Phasenvarianten
    146 chr2 136872525 136872740 CXCR4 Genotypisierung
    147 chr2 136874415 136874797 CXCR4 Phasenvarianten
    148 chr2 136874920 136875662 CXCR4 Phasenvarianten
    149 chr2 141245127 141245373 LRP1B Genotypisierung
    150 chr2 145162401 145162624 ZEB2 Genotypisierung
    151 chr2 145187091 145187638 ZEB2 Genotypisierung
    152 chr2 145270956 145271394 ZEB2 Genotypisierung
    153 chr2 145275631 145275744 ZEB2 Genotypisierung
    154 chr2 145275756 145276174 ZEB2 Genotypisierung
    155 chr2 145278026 145278305 ZEB2 Genotypisierung
    156 chr2 145278311 145278659 ZEB2 Genotypisierung
    157 chr2 145692901 145693081 ZEB2 Genotypisierung
    158 chr2 148680516 148680692 ACVR2A Genotypisierung
    159 chr2 169781120 169781352 ABCB11 Genotypisierung
    160 chr2 170101185 170101401 LRP2 Genotypisierung
    161 chr2 198950434 198951003 PLCL1 Genotypisierung
    162 chr2 242793232 242793447 PDCD1 Genotypisierung
    163 chr2 242794037 242794192 PDCD1 Genotypisierung
    164 chr2 242794317 242794537 PDCD1 Genotypisierung
    165 chr2 242794822 242795040 PDCD1 Genotypisierung
    166 chr2 242800887 242801093 PDCD1 Genotypisierung
    167 chr3 7620223 7620990 GRM7 Genotypisierung
    168 chr3 16419204 16419479 RFTN1 Phasenvarianten
    169 chr3 38180129 38180549 MYD88 Genotypisierung
    170 chr3 38181334 38181509 MYD88 Genotypisierung
    171 chr3 38181854 38182099 MYD88 Genotypisierung
    172 chr3 38182194 38182407 MYD88 Genotypisierung
    173 chr3 38182554 38182844 MYD88 Genotypisierung
    174 chr3 49397608 49397717 RHOA Genotypisierung
    175 chr3 49397718 49397827 RHOA Genotypisierung
    176 chr3 49399903 49400084 RHOA Genotypisierung
    177 chr3 49405833 49406013 RHOA Genotypisierung
    178 chr3 49412838 49413046 RHOA Genotypisierung
    179 chr3 64547204 64547477 ADAMTS9 Genotypisierung
    180 chr3 64579889 64580094 ADAMTS9 Genotypisierung
    181 chr3 71551101 71551497 EIF4E3 Phasenvarianten
    182 chr3 140281598 140281875 CLSTN2 Genotypisierung
    183 chr3 164730700 164730888 S1 Genotypisierung
    184 chr3 165548198 165548680 BCHE Genotypisierung
    185 chr3 176750699 176750928 TBL1XR1 Genotypisierung
    186 chr3 176767759 176767977 TBL1X-R1 Genotypisierung
    187 chr3 176769304 176769543 TBL1XR1 Genotypisierung
    188 chr3 176771659 176771732 TBL1XR1 Genotypisierung
    189 chr3 183209758 183209937 KLHL6 Genotypisierung
    190 chr3 183210258 183210544 KLHL6 Genotypisierung
    191 chr3 183272308 183272521 KLHL6 Phasenvarianten
    192 chr3 183273063 183273456 KLHL6 Phasenvarianten
    193 chr3 184580663 184580872 VPS8 Genotypisierung
    194 chr3 185146278 185146873 MAP3K13 Genotypisierung
    195 chr3 185197923 185198317 MAP3K13 Genotypisierung
    196 chr3 185236908 185237109 LIPH Genotypisierung
    197 chr3 185446223 185446389 C3orf65 Genotypisierung
    198 chr3 185538773 185538951 IGF2BP2 Genotypisierung
    199 chr3 185697423 185697669 TRA2B Genotypisierung
    200 chr3 186714604 186715001 ST6GAL1 Phasenvarianten
    201 chr3 186782529 186782790 ST6GAL1 Phasenvarianten
    202 chr3 186783389 186784291 ST6GAL1 Phasenvarianten
    203 chr3 187440189 187440445 BCL6 Genotypisierung
    204 chr3 187442669 187442920 BCL6 Genotypisierung
    205 chr3 187443239 187443438 BCL6 Genotypisierung
    206 chr3 187446814 187447831 BCL6 Genotypisierung
    207 chr3 187449434 187449655 BCL6 Genotypisierung
    208 chr3 187451284 187451667 BCL6 Genotypisierung
    209 chr3 187460134 187460530 BCL6 Phasenvarianten
    210 chr3 187460824 187461302 BCL6 Phasenvarianten
    211 chr3 187461319 187461381 BCL6 Phasenvarianten
    212 chr3 187461454 187461918 BCL6 Phasenvarianten
    213 chr3 187461924 187462343 BCL6 Phasenvarianten
    214 chr3 187462374 187462887 BCL6 Phasenvarianten
    215 chr3 187462924 187462999 BCL6 Phasenvarianten
    216 chr3 187463004 187463525 BCL6 Phasenvarianten
    217 chr3 187463709 187463781 BCL6 Phasenvarianten
    218 chr3 187463794 187464109 BCL6 Phasenvarianten
    219 chr3 187619334 187619708 BCL6 Phasenvarianten
    220 chr3 187660817 187661390 BCL6 Phasenvarianten
    221 chr3 187957432 187957507 AC022498.1 Phasenvarianten
    222 chr3 187957512 187957754 AC022498.1 Phasenvarianten
    223 chr3 187957767 187958110 AC022498.1 Phasenvarianten
    224 chr3 187958282 187958675 AC022498.1 Phasenvarianten
    225 chr3 187958787 187959184 AC022498.1 Phasenvarianten
    226 chr3 187959462 187959686 AC022498.1 Phasenvarianten
    227 chr3 188299217 188299605 LPP Phasenvarianten
    228 chr3 188471412 188471549 LPP Phasenvarianten
    229 chr3 188471567 188471937 LPP Phasenvarianten
    230 chr4 7728456 7728661 SORCS2 Genotypisierung
    231 chr4 40198810 40199653 N4BP2 Phasenvarianten
    232 chr4 40199660 40199873 N4BP2 Phasenvarianten
    233 chr4 40199990 40200211 N4BP2 Phasenvarianten
    234 chr4 40200505 40200727 RHOH Phasenvarianten
    235 chr4 40200730 40201571 RHOH Phasenvarianten
    236 chr4 80327792 80328151 GK2 Genotypisierung
    237 chr4 88011077 88011285 AFF1 Genotypisierung
    238 chr4 106157604 106157813 TET2 Genotypisierung
    239 chr4 134727698 134727916 PABPC4L Phasenvarianten
    240 chr4 153249285 153249507 FBXW7 Genotypisierung
    241 chr4 154624670 154625050 TLR2 Genotypisierung
    242 chr4 187509884 187510410 FAT1 Genotypisierung
    243 chr4 187557779 187557985 FAT1 Genotypisierung
    244 chr4 188924114 188924897 ZFP42 Genotypisierung
    245 chr5 5182145 5182494 ADAMTS16 Genotypisierung
    246 chr5 11110990 11111137 CTNND2 Genotypisierung
    247 chr5 11236740 11236956 CTNND2 Genotypisierung
    248 chr5 11364700 11364923 CTNND2 Genotypisierung
    249 chr5 11397080 11397377 CTNND2 Genotypisierung
    250 chr5 11411600 11411807 CTNND2 Genotypisierung
    251 chr5 13864465 13864696 DNAH5 Genotypisierung
    252 chr5 21783415 21783668 CDH12 Genotypisierung
    253 chr5 54964698 54964921 SLC38A9 Phasenvarianten
    254 chr5 67590966 67591183 PIK3R1 Genotypisierung
    255 chr5 75913716 75914448 F2RL2 Genotypisierung
    256 chr5 83258967 83259183 EDIL3 Genotypisierung
    257 chr5 112176756 112176958 APC Genotypisierung
    258 chr5 124079827 124080721 ZNF608 Phasenvarianten
    259 chr5 131825017 131825239 IRF1 Genotypisierung
    260 chr5 135381969 135382218 TGFBI Genotypisierung
    261 chr5 137801487 137801637 EGR1 Genotypisierung
    262 chr5 137801697 137801804 EGR1 Genotypisierung
    263 chr5 140208033 140208874 PCDHA6 Genotypisierung
    264 chr5 158527642 158528019 EBF1 Phasenvarianten
    265 chr5 176522449 176522613 FGFR4 Genotypisierung
    266 chr6 392760 392967 IRF4 Phasenvarianten
    267 chr6 393090 393309 IRF4 Phasenvarianten
    268 chr6 394815 395025 IRF4 Genotypisierung
    269 chr6 14117992 14118654 CD83 Phasenvarianten
    270 chr6 14131732 14132021 CD83 Genotypisierung
    271 chr6 14133857 14133996 CD83 Genotypisierung
    272 chr6 14135317 14135496 CD83 Genotypisierung
    273 chr6 26020709 26020958 HIST1H3A Genotypisierung
    274 chr6 26032014 26032217 HIST1H3B Genotypisierung
    275 chr6 26045744 26046077 HIST1H3C Genotypisierung
    276 chr6 26056034 26056315 HIST1H1C Genotypisierung
    277 chr6 26056319 26056558 HIST1H1C Genotypisierung
    278 chr6 26123614 26123778 HIST1H2BC Phasenvarianten
    279 chr6 26123879 26124098 HIST1H2BC Genotypisierung
    280 chr6 26124544 26124640 HJSTIH2AC Genotypisierung
    281 chr6 26124714 26124889 HIST1H2AC Genotypisierung
    282 chr6 26156649 26157377 HIST1H1E Phasenvarianten
    283 chr6 26158529 26158608 HIST1H2BD Genotypisierung
    284 chr6 26158739 26158835 HIST1H2BD Genotypisierung
    285 chr6 26197104 26197182 HIST1H3D Genotypisierung
    286 chr6 26197189 26197465 HIST1H3D Genotypisierung
    287 chr6 26216779 26216920 HIST1H2BG Genotypisierung
    288 chr6 26217214 26217431 HIST1H2AE Genotypisierung
    289 chr6 26234654 26234976 HIST1H1D Genotypisierung
    290 chr6 26250459 26250537 HIST1H3F Genotypisierung
    291 chr6 26250594 26250703 HIST1H3F Genotypisierung
    292 chr6 26252154 26252232 HIST1H2BH Genotypisierung
    293 chr6 27100079 27100185 HIST1H2BJ Genotypisierung
    294 chr6 27100939 27101039 HIST1H2AG Genotypisierung
    295 chr6 27101159 27101300 HIST1H2AG Genotypisierung
    296 chr6 27114004 27114216 HIST1H2BK Phasenvarianten
    297 chr6 27114319 27114396 HIST1H2BK Genotypisierung
    298 chr6 27114494 27114592 HIST1H2BK Genotypisierung
    299 chr6 27277284 27277495 POM121L2 Genotypisierung
    300 chr6 27777783 27777900 HIST1H3H Genotypisierung
    301 chr6 27777928 27778106 HIST1H3H Genotypisierung
    302 chr6 27782718 27782926 HIST1H2BM Genotypisierung
    303 chr6 27799168 27799381 HIST1H4K Genotypisierung
    304 chr6 27833408 27833516 HIST1H2AL Genotypisierung
    305 chr6 27834968 27835075 HIST1H1B Genotypisierung
    306 chr6 27839658 27839805 HIST1H3I Genotypisierung
    307 chr6 27860479 27860659 HIST1H2AM Genotypisierung
    308 chr6 27860794 27860938 HIST1H2AM Genotypisierung
    309 chr6 27861244 27861344 HIST1H2BO Genotypisierung
    310 chr6 27861399 27861485 HIST1H2BO Genotypisierung
    311 chr6 37138284 37139559 PIM1 Phasenvarianten
    312 chr6 37140749 37140956 PIM1 Genotypisierung
    313 chr6 37141679 37141903 PIM1 Genotypisierung
    314 chr6 41903611 41903834 CCND3 Genotypisierung
    315 chr6 41904271 41904477 CCND3 Genotypisierung
    316 chr6 41904941 41905155 CCND3 Genotypisierung
    317 chr6 419080171 41908365 CCND3 Genotypisierung
    318 chr6 41909196 41909441 CCND3 Genotypisierung
    319 chr6 75965846 75966046 TMEM30A Genotypisierung
    320 chr6 75969006 75969288 TMEM30A Genotypisierung
    321 chr6 91004618 91004828 MAP3K7 Phasenvarianten
    322 chr6 91005793 91005998 MAP3K7 Phasenvarianten
    323 chr6 94120219 94120743 EPHA7 Genotypisierung
    324 chr6 106534266 106534477 PRDM1 Genotypisierung
    325 chr6 106536046 106536340 PRDM1 Genotypisierung
    326 chr6 106543466 106543637 PRDM1 Genotypisierung
    327 chr6 106547146 106547437 PRDM1 Genotypisierung
    328 chr6 106552761 106552932 PRDM1 Genotypisierung
    329 chr6 106552961 106553841 PRDM1 Genotypisierung
    330 chr6 106554221 106554400 PRDM1 Genotypisierung
    331 chr6 106554766 106555383 PRDM1 Genotypisierung
    332 chr6 108040228 108040856 SCML4 Genotypisierung
    333 chr6 108041553 108042219 SCML4 Genotypisierung
    334 chr6 1 10777718 110778244 SLC22A16 Genotypisierung
    335 chr6 134491382 134491589 SGK1 Genotypisierung
    336 chr6 134491892 134492111 SGK1 Genotypisierung
    337 chr6 134492132 134492333 SGK1 Genotypisierung
    338 chr6 134492717 134492923 SHK1 Genotypisierung
    339 chr6 134493307 134493474 SGK1 Genotypisierung
    340 chr6 134493732 134494308 SGK1 Phasenvarianten
    341 chr6 134494342 134494514 SGK1 Genotypisierung
    342 chr6 134494552 134494718 SGK1 Phasenvarianten
    343 chr6 134494722 134494795 SGK1 Phasenvarianten
    344 chr6 134494967 134495974 SGK1 Phasenvarianten
    345 chr6 138188483 138188650 TNFAIP3 Genotypisierung
    346 chr6 138192338 138192683 TNFAIP3 Genotypisierung
    347 chr6 138195963 138196172 TNFAIP3 Genotypisierung
    348 chr6 138196803 138197021 TNFAIP3 Genotypisierung
    349 chr6 138197108 138197313 TNFAIP3 Genotypisierung
    350 chr6 138198193 138198407 TNFAIP3 Genotypisierung
    351 chr6 138199548 138200525 TNFAIP3 Genotypisierung
    352 chr6 138201178 138201404 TNFAIP3 Genotypisierung
    353 chr6 138202138 138202494 TNFAIP3 Genotypisierung
    354 chr6 150954420 150954823 PLEKHG1 Phasenvarianten
    355 chr6 159238415 159238794 EZR Phasenvarianten
    356 chr7 2963818 2963952 CARD11 Genotypisierung
    357 chr7 2963953 2964056 CARD11 Genotypisierung
    358 chr7 2969593 2969738 CARD11 Genotypisierung
    359 chr7 2976668 2976876 CARD11 Genotypisierung
    360 chr7 2977493 2977712 CARD11 Genotypisierung
    361 chr7 2978258 2978502 CARD11 Genotypisierung
    362 chr7 2979398 2979601 CARD11 Genotypisierung
    363 chr7 2983918 2984199 CARD11 Genotypisierung
    364 chr7 2985403 2985610 CARD11 Genotypisierung
    365 chr7 2987163 2987382 CARD11 Genotypisierung
    366 chr7 5569095 5569200 ACTB Genotypisierung
    367 chr7 5569210 5569359 ACTB Genotypisierung
    368 chr7 80285799 80286074 CD36 Genotypisierung
    369 chr7 82387830 82388061 PCLO Genotypisierung
    370 chr7 82453520 82453733 PCLO Genotypisierung
    371 chr7 82763800 82764050 PCLO Genotypisierung
    372 chr7 82784490 82784643 PCLO Genotypisierung
    373 chr7 106508490 106509161 PIK3CG Genotypisierung
    374 chr7 110545276 110545445 IMMP2L Phasenvarianten
    375 chr7 110697971 110698144 LRRN3 Phasenvarianten
    376 chr7 110737411 110737634 LRRN3 Phasenvarianten
    377 chr7 110746681 110746893 LRRN3 Phasenvarianten
    378 chr7 110762936 110764629 LRRN3 Genotypisierung
    379 chr7 110764636 110764981 LRRN3 Genotypisierung
    380 chr7 119915406 119915800 KCND2 Genotypisierung
    381 chr7 122634905 122635140 TAS2R16 Genotypisierung
    382 chr7 140453012 140453121 BRAF Genotypisierung
    383 chr7 140453162 140453268 BRAF Genotypisierung
    384 chr7 146997183 146997422 CNTNAP2 Genotypisierung
    385 chr7 148506318 148506416 EZH2 Genotypisierung
    386 chr7 148506448 148506551 EZH2 Genotypisierung
    387 chr7 148508658 148508867 EZH2 Genotypisierung
    388 chr7 148513738 148513900 EZH2 Genotypisierung
    389 chr7 148523533 148523743 EZH2 Genotypisierung
    390 chr7 151943421 151943500 KMT2C Phasenvarianten
    391 chr8 623880 624090 ERICH1 Genotypisierung
    392 chr8 3141724 3141942 CSMD1 Genotypisierung
    393 chr8 4494931 4495105 CSMD1 Genotypisierung
    394 chr8 8748687 8749284 MFHAS1 Genotypisierung
    395 chr8 8750067 8750281 MFHAS1 Genotypisierung
    396 chr8 18729445 18729937 PSD3 Genotypisierung
    397 chr8 75898190 75898400 CRISPLD1 Genotypisierung
    398 chr8 101730376 101730457 PABPC1 Genotypisierung
    399 chr8 103663491 103664160 KLF10 Genotypisierung
    400 chr8 104897561 104898479 RIMS2 Genotypisierung
    401 chr8 113308014 113308283 CSMD3 Genotypisierung
    402 chr8 113364624 113364791 CSMD3 Genotypisierung
    403 chr8 113568994 113569205 CSMD3 Genotypisierung
    404 chr8 116616145 116616886 TRPS1 Genotypisierung
    405 chr8 122626847 122627163 HAS2 Genotypisierung
    406 chr8 128492947 128493338 POU5F1B Genotypisierung
    407 chr8 128746807 128748893 MYC Genotypisierung
    408 chr8 128748902 128749969 MYC Genotypisierung
    409 chr8 128750367 128751183 MYC Phasenvarianten
    410 chr8 128752612 128753235 MYC Genotypisierung
    411 chr8 128754007 128754731 MYC Genotypisierung
    412 chr8 128754752 128756424 MYC Genotypisierung
    413 chr8 128756707 128756931 MYC Genotypisierung
    414 chr8 128756947 128757361 MYC Genotypisierung
    415 chr8 128757737 128757921 MYC Genotypisierung
    416 chr8 128764072 128764292 MYC Genotypisierung
    417 chr8 128951724 128951896 TMEM75 Genotypisierung
    418 chr8 130692149 130692503 GSDMC Genotypisierung
    419 chr8 130760594 130761023 GSDMC Genotypisierung
    420 chr8 131373024 131373443 ASAP1 Genotypisierung
    421 chr8 136569669 136569842 KHDRBS3 Genotypisierung
    422 chr8 136659204 136659414 KHDRBS3 Genotypisierung
    423 chr8 137101252 137101464 KHDRBS3 Genotypisierung
    424 chr8 137528187 137528570 KHDRBS3 Genotypisierung
    425 chr8 138849937 138850149 FAM135B Genotypisierung
    426 chr8 139600457 139601255 COL22A1 Genotypisierung
    427 chr8 139601392 139601569 COL22A1 Genotypisierung
    428 chr9 5450474 5450616 CD274 Genotypisierung
    429 chr9 5456059 5456200 CD274 Genotypisierung
    430 chr9 5457054 5457446 CD274 Genotypisierung
    431 chr9 5462809 5463160 CD274 Genotypisierung
    432 chr9 5465489 5465622 CD274 Genotypisierung
    433 chr9 5466724 5466867 CD274 Genotypisierung
    434 chr9 5467814 5468022 CD274 Genotypisierung
    435 chr9 5510589 5510804 PDCD1LG2 Genotypisierung
    436 chr9 5522484 5522636 PDCD1LG2 Genotypisierung
    437 chr9 5534764 5535047 PDCD1LG2 Genotypisierung
    438 chr9 5549309 5549627 PDCD1LG2 Genotypisierung
    439 chr9 5557589 5557762 PDCD1LG2 Genotypisierung
    440 chr9 5563119 5563251 PDCD1LG2 Genotypisierung
    441 chr9 5569929 5570140 PDCD1LG2 Genotypisierung
    442 chr9 13222185 13222409 MPDZ Genotypisierung
    443 chr9 16435498 16436307 BNC2 Genotypisierung
    444 chr9 19957356 19958178 SLC24A2 Genotypisierung
    445 chr9 20820916 20821095 FOCAD Genotypisierung
    446 chr9 20946676 20946849 FOCAD Genotypisierung
    447 chr9 21808814 21808891 MTAP Genotypisierung
    448 chr9 21808894 21808973 MTAP Genotypisierung
    449 chr9 21859249 21859469 MTAP Genotypisierung
    450 chr9 21970834 21971023 CDKN2A Genotypisierung
    451 chr9 21971069 21971170 CDKN2A Genotypisierung
    452 chr9 21974409 21974881 CDKN2A Genotypisierung
    453 chr9 21989304 21989976 CDKN2A Genotypisierung
    454 chr9 21994084 21994405 CDKN2A Genotypisierung
    455 chr9 22005929 22006067 CDKN2B Genotypisierung
    456 chr9 22006109 22006187 CDKN2B Genotypisierung
    457 chr9 22008649 22009012 CDKN2B Genotypisierung
    458 chr9 24545399 24545922 IZUMO3 Genotypisierung
    459 chr9 24905444 24905729 IZUMO3 Genotypisierung
    460 chr9 27950144 27950532 LINGO2 Genotypisierung
    461 chr9 37024919 37025642 PAX5 Phasenvarianten
    462 chr9 37025829 37025996 PAX5 Phasenvarianten
    463 chr9 37026269 37027015 PAX5 Phasenvarianten
    464 chr9 37033619 37033797 PAX5 Phasenvarianten
    465 chr9 37293169 37293378 ZCCHC7 Phasenvarianten
    466 chr9 37371494 37371879 ZCCHC7 Phasenvarianten
    467 chr9 37384684 37384911 ZCCHC7 Phasenvarianten
    468 chr9 37407369 37407588 GRHPR Phasenvarianten
    469 chr9 78686579 78686854 PCSK5 Genotypisierung
    470 chr9 139390582 139390950 NOTCH1 Genotypisierung
    471 chr9 139390952 139391172 NOTCH1 Genotypisierung
    472 chr9 139402662 139402868 NOTCH1 Genotypisierung
    473 chr10 5755066 5755273 FAM208B Phasenvarianten
    474 chr10 89500957 89501139 PAPSS2 Genotypisierung
    475 chr10 89603602 89604077 KLLN Genotypisierung
    476 chr10 89624272 89624350 PTEN Genotypisierung
    477 chr10 89653752 89653825 PTEN Genotypisierung
    478 chr10 89653832 89653909 PTEN Genotypisierung
    479 chr10 89685272 89685379 PTEN Genotypisierung
    480 chr10 89690752 89690894 PTEN Genotypisierung
    481 chr10 89692737 89692810 PTEN Genotypisierung
    482 chr10 89692877 89692951 PTEN Genotypisierung
    483 chr10 89692972 89693037 PTEN Genotypisierung
    484 chr10 89711837 89711966 PTEN Genotypisierung
    485 chr10 89711982 89712058 PTEN Genotypisierung
    486 chr10 89717577 89717714 PTEN Genotypisierung
    487 chr10 89717742 897117811 PTEN Genotypisierung
    488 chr10 89720637 89720904 PTEN Genotypisierung
    489 chr10 90074239 90074419 RNLS Genotypisierung
    490 chr10 90537736 90538027 LIPN Genotypisierung
    491 chr10 90579966 90580319 LIPM Genotypisierung
    492 chr10 90699126 90699647 ACTA2 Genotypisierung
    493 chr10 90773866 90774076 FAS Genotypisierung
    494 chr10 91092211 91092423 IFIT3 Genotypisierung
    495 chr10 91358986 91359298 PANK1 Genotypisierung
    496 chr10 131640289 131640505 EBF3 Genotypisierung
    497 chr11 58978692 58978791 MPEG1 Genotypisierung
    498 chr11 58978927 58979095 MPEG1 Genotypisierung
    499 chr11 58979112 58979365 MPEG1 Genotypisierung
    500 chr11 65190342 65190557 FRMD8 Phasenvarianten
    501 chr11 65266552 65266924 SCYL1 Phasenvarianten
    502 chr11 65267397 65267603 SCYL1 Phasenvarianten
    503 chr11 65623422 65623506 CFL1 Genotypisierung
    504 chr11 69346691 69346940 CCN D1 Genotypisierung
    505 chr11 102188381 102188945 BIRC3 Phasenvarianten
    506 chr11 111234536 111235068 POU2AF1 Genotypisierung
    507 chr11 111249311 111249530 POU2AF1 Phasenvarianten
    508 chr11 111613196 111613432 PPP2R1B Genotypisierung
    509 chr11 111781036 111781641 CRYAB Genotypisierung
    510 chr11 111904096 111904291 DLAT Genotypisierung
    511 chr11 112405016 112405330 AP002884.2 Genotypisierung
    512 chr11 112405341 112405621 AP002884.2 Genotypisierung
    513 chr11 117101043 117101217 PCSK7 Genotypisierung
    514 chr11 117712683 117712997 FXYD6 Genotypisierung
    515 chr11 118754793 118755011 CXCR5 Phasenvarianten
    516 chr11 118764838 118765408 CXCR5 Genotypisierung
    517 chr11 118967323 118968029 DPAGT1 Genotypisierung
    518 chr11 120127163 120127588 POU2F3 Genotypisierung
    519 chr11 120189028 120189629 POU2F3 Genotypisierung
    520 chr11 125472640 125472915 STT3A Genotypisierung
    521 chr11 128391383 128391629 ETS1 Phasenvarianten
    522 chr11 128391648 128392132 ETS1 Phasenvarianten
    523 chr11 129739778 129740102 NFRKB Genotypisierung
    524 chr11 131747549 1317418030 NTM Genotypisierung
    525 chr11 134027789 134027980 NCAPD3 Genotypisierung
    526 chr11 134118684 134118873 THYN1 Genotypisierung
    527 chr11 134129469 134130211 ACAD8 Genotypisierung
    528 chr11 134130464 134131097 ACAD8 Genotypisierung
    529 chr11 134133389 134133972 ACAD8 Genotypisierung
    530 chr12 6439713 6439920 TNFRSF1A Genotypisierung
    531 chr12 15813487 15813687 EPS8 Genotypisierung
    532 chr12 18534682 18534856 PIK3C2G Genotypisierung
    533 chr12 18544037 18544241 PIK3C2G Genotypisierung
    534 chr12 18573807 18574017 PIK3C2G Genotypisierung
    535 chr12 18699197 18699459 PIK3C2G Genotypisierung
    536 chr12 18747397 18747562 PIK3C2G Genotypisierung
    537 chr12 18800762 18801046 PIK3C2G Genotypisierung
    538 chr12 18891267 18891560 CAPZA3 Genotypisierung
    539 chr12 25205888 25206105 LRMP Phasenvarianten
    540 chr12 25206398 25206616 LRMP Phasenvarianten
    541 chr12 25206748 25206877 LRMP Phasenvarianten
    542 chr12 25207088 25207474 LRMP Phasenvarianten
    543 chr12 25398218 25398299 KRAS Genotypisierung
    544 chr12 48190731 48190983 HDAC7 Genotypisierung
    545 chr12 49415991 49416144 KMT2D Genotypisierung
    546 chr12 49418306 49418550 KMT2D Genotypisierung
    547 chr12 49420531 49420750 KMT2D Genotypisierung
    548 chr12 49426451 49426592 KMT2D Genotypisierung
    549 chr12 49427886 49428116 KMT2D Genotypisierung
    550 chr12 49433331 49433507 KMT2D Genotypisierung
    551 chr12 49437926 49438391 KMT2D Genotypisierung
    552 chr12 49444391 49444595 KMT2D Genotypisierung
    553 chr12 49447196 49447491 KMT2D Genotypisierung
    554 chr12 57496552 57496735 STAT6 Genotypisierung
    555 chr12 57498222 57498396 STAT6 Genotypisierung
    556 chr12 57498912 57499150 STAT6 Genotypisierung
    557 chr12 86198698 86199622 RASSF9 Genotypisierung
    558 chr12 92537875 92538647 BTG1 Phasenvarianten
    559 chr12 92538790 92539374 BTG1 Phasenvarianten
    560 chr12 113495364 113496458 DTX1 Phasenvarianten
    561 chr12 113496509 113496679 DTX1 Phasenvarianten
    562 chr12 113496694 113496945 DTX1 Phasenvarianten
    563 chr12 113497059 113497278 DTX1 Phasenvarianten
    564 chr12 113515199 113515658 DTX1 Genotypisierung
    565 chr12 113515664 113515934 DTX1 Genotypisierung
    566 chr12 113530924 113531055 DTX1 Genotypisierung
    567 chr12 113531319 113531531 DTX1 Genotypisierung
    568 chr12 113531799 113531930 DTX1 Genotypisierung
    569 chr12 113532569 113532781 DTX1 Genotypisierung
    570 chr12 113532809 113533032 DTX1 Genotypisierung
    571 chr12 113533099 113533237 DTX1 Genotypisierung
    572 chr12 113534494 113534778 DTX1 Genotypisierung
    573 chr12 122458781 122459524 BCL7A Phasenvarianten
    574 chr12 122460811 122461193 BCL7A Phasenvarianten
    575 chr12 122461316 122461882 BCL7A Phasenvarianten
    576 chr12 122462001 122462210 BCL7A Phasenvarianten
    577 chr12 122462716 122462935 BCL7A Phasenvarianten
    578 chr12 122463031 122463137 BCL7A Phasenvarianten
    579 chr13 32907206 32907376 BRCA2 Genotypisierung
    580 chr13 32912226 32912828 BRCA2 Genotypisierung
    581 chr13 41133662 41133842 FOXO1 Genotypisierung
    582 chr13 41133922 41135026 FOXO1 Genotypisierung
    583 chr13 41239682 41239755 FOXO1 Genotypisierung
    584 chr13 41239827 41240356 FOXO1 Genotypisierung
    585 chr13 41240362 41240788 FOXO1 Genotypisierung
    586 chr13 46959165 46959379 KIAA0226L Phasenvarianten
    587 chr13 46961680 46962067 KIAA0226L Phasenvarianten
    588 chr13 51915233 51915552 SERPINE3 Genotypisierung
    589 chr13 58207131 58209129 PCDH17 Genotypisierung
    590 chr13 84453542 84455255 SLITRK 1 Genotypisierung
    591 chr13 113516229 113516436 ATP11A Phasenvarianten
    592 chr14 23344697 23345206 LRP10 Genotypisierung
    593 chr14 32615405 32615617 ARHGAP5 Genotypisierung
    594 chr14 35873671 35873838 NFKBIA Genotypisierung
    595 chr14 64330252 64330462 SYNE2 Phasenvarianten
    596 chr14 69258238 69259642 ZFP36L1 Phasenvarianten
    597 chr14 84420586 84420796 FLRT2 Phasenvarianten
    598 chr14 96179592 96180295 TCL1A Phasenvarianten
    599 chr14 106048955 106049032 IGHA2 Phasenvarianten
    600 chr14 106054695 106055541 IGHA2 Genotypisierung
    601 chr14 106055740 106055827 IGHA2 Genotypisierung
    602 chr14 106055910 106055995 IGHA2 Genotypisierung
    603 chr14 106056035 106056121 IGHA2 Genotypisierung
    604 chr14 106068705 106068911 IGHE Phasenvarianten
    605 chr14 106069045 106069384 IGHE Phasenvarianten
    606 chr14 106071060 106071135 IGHE Phasenvarianten
    607 chr14 106071190 106071271 IGHE Phasenvarianten
    608 chr14 106092380 106092608 IGHG4 Genotypisierung
    609 chr14 106092670 106093406 IGHG4 Genotypisierung
    610 chr14 106093435 106093575 IGHG4 Genotypisierung
    611 chr14 106093610 106094215 IGHG4 Genotypisierung
    612 chr14 106094235 106094479 IGHG4 Genotypisierung
    613 chr14 106094580 106094654 IGHG4 Genotypisierung
    614 chr14 106094675 106094915 IGHG4 Genotypisierung
    615 chr14 106095335 106095417 IGHG4 Phasenvarianten
    616 chr14 106095480 106095560 IGHG4 Phasenvarianten
    617 chr14 106110675 106110814 IGHG2 Phasenvarianten
    618 chr14 106110830 106110904 IGHG2 Phasenvarianten
    619 chr14 106110950 106111025 IGHG2 Phasenvarianten
    620 chr14 106111100 106111311 IGHG2 Genotypisierung
    621 chr14 106111390 106112121 IGHG2 Genotypisierung
    622 chr14 106112160 106112302 IGHG2 Genotypisierung
    623 chr14 106112335 106113010 IGHG2 Phasenvarianten
    624 chr14 106113020 106113438 IGHG2 Phasenvarianten
    625 chr14 106113450 106113625 IGHG2 Phasenvarianten
    626 chr14 106113695 106113901 IGHG2 Phasenvarianten
    627 chr14 106113905 106113984 IGHG2 Phasenvarianten
    628 chr14 106114175 106114414 IGHG2 Phasenvarianten
    629 chr14 106174970 106175819 IGHA1 Genotypisierung
    630 chr14 106175820 106176042 IGHA1 Genotypisierung
    631 chr14 106176070 106176217 IGHA1 Genotypisierung
    632 chr14 106176235 106176320 ICHA1 Genotypisierung
    633 chr14 106176375 106176932 IGHA1 Phasenvarianten
    634 chr14 106176985 106177069 IGHA1 Phasenvarianten
    635 chr14 106177425 106177536 IGHA1 Genotypisierung
    636 chr14 106211960 106212864 IGHG1 Phasenvarianten
    637 chr14 106212870 106212948 IGHG1 Phasenvarianten
    638 chr14 106212980 106213124 IGHG1 Phasenvarianten
    639 chr14 106213125 106213200 IGHG1 Phasenvarianten
    640 chr14 106213210 106213525 IGHG1 Phasenvarianten
    641 chr14 106213660 106214042 IGHG1 Phasenvarianten
    642 chr14 106239250 106239357 IGHG3 Phasenvarianten
    643 chr14 106239455 106239900 IGHG3 Phasenvarianten
    644 chr14 106239990 106240155 IGHG3 Phasenvarianten
    645 chr14 106240170 106240815 IGHG3 Phasenvarianten
    646 chr14 106240820 106240892 IGHG3 Phasenvarianten
    647 chr14 106240915 106241118 IGHG3 Phasenvarianten
    648 chr14 106241200 106241278 IGHG3 Phasenvarianten
    649 chr14 106241345 106241627 IGHG3 Phasenvarianten
    650 chr14 106241630 106241705 IGHG3 Genotypisierung
    651 chr14 106241710 106241975 IGHG3 Genotypisierung
    652 chr14 106318100 106318327 IGHM Phasenvarianten
    653 chr14 106322055 106322271 IGHM Phasenvarianten
    654 chr14 106322905 106323129 IGHM Phasenvarianten
    655 chr14 106323470 106323656 IGHM Phasenvarianten
    656 chr14 106323805 106323896 IGHM Phasenvarianten
    657 chr14 106324010 106324087 IGHM Phasenvarianten
    658 chr14 106324155 106324245 IGHM Phasenvarianten
    659 chr14 106324290 106324369 IGHM Phasenvarianten
    660 chr14 106324490 106324577 IGHM Phasenvarianten
    661 chr14 106324750 106325340 IGHM Phasenvarianten
    662 chr14 106325360 106325513 IGHM Phasenvarianten
    663 chr14 106325515 106325791 IGHM Phasenvarianten
    664 chr14 106325820 106326095 IGHJ6 Phasenvarianten
    665 chr14 106326245 106326338 IGHJ6 Phasenvarianten
    666 chr14 106326450 106331808 IGHD7-27 Phasenvarianten
    667 chr14 106357890 106357967 IGHD6-19 Phasenvarianten
    668 chr14 106380360 106380541 IGHD3-3 Phasenvarianten
    669 chr14 106380550 106380901 IGHD3-3 Phasenvarianten
    670 chr14 106380910 106381109 IGHD3-3 Phasenvarianten
    671 chr14 106381275 106381351 IGHD3-3 Phasenvarianten
    672 chr14 106381485 106381633 IGHD2-2 Phasenvarianten
    673 chr14 106381655 106381724 IGHD2-2 Phasenvarianten
    674 chr14 106381890 106381968 IGHD2-2 Phasenvarianten
    675 chr14 106381990 106382161 IGHD2-2 Phasenvarianten
    676 chr14 106382325 106382403 IGHD2-2 Phasenvarianten
    677 chr14 106382905 106383014 IGHD2-2 Phasenvarianten
    678 chr14 106383030 106383140 IGHD2-2 Phasenvarianten
    679 chr14 106383980 106384142 IGHD1-1 Phasenvarianten
    680 chr14 106384630 106384702 IGHD1-1 Phasenvarianten
    681 chr14 106384720 106384798 IGHD1-1 Phasenvarianten
    682 chr14 106384825 106384957 IGHD1-1 Phasenvarianten
    683 chr14 106405615 106405963 IGHV6-1 Genotypisierung
    684 chr14 106452660 106452748 IGHV1-2 Genotypisierung
    685 chr14 106452755 106452907 IGHV1-2 Genotypisierung
    686 chr14 106452940 106453023 IGHV1-2 Genotypisierung
    687 chr14 106471395 106471476 IGHV1-3 Genotypisierung
    688 chr14 106471510 106471609 IGHV1-3 Genotypisierung
    689 chr14 106494090 106494168 IGHV2-5 Phasenvarianten
    690 chr14 106494210 106494365 IGHV2-5 Phasenvarianten
    691 chr14 106494445 106494553 IGHV2-5 Phasenvarianten
    692 chr14 106494565 106494640 IGHV2-5 Phasenvarianten
    693 chr14 106494650 106494806 IGHV2-5 Phasenvarianten
    694 chr14 106518495 106518570 IGHV3-7 Phasenvarianten
    695 chr14 106518855 106518962 IGHV3-7 Phasenvarianten
    696 chr14 106518970 106519111 IGHV3-7 Phasenvarianten
    697 chr14 106539175 106539315 IGHV1-8 Genotypisierung
    698 chr14 106552365 106552502 IGHV3-9 Genotypisierung
    699 chr14 106573315 106573414 IGHV3-11 Genotypisierung
    700 chr14 106573445 106573524 IGHV3-11 Genotypisierung
    701 chr14 106573540 106573645 IGHV3-11 Phasenvarianten
    702 chr14 106573685 106574021 IGHV3-11 Phasenvarianten
    703 chr14 106586200 106586343 IGHV3-13 Genotypisierung
    704 chr14 106610380 106610479 IGHV3-15 Genotypisierung
    705 chr14 106610480 106610557 IGHV3-15 Genotypisierung
    706 chr14 106610690 106610765 IGHV3-15 Phasenvarianten
    707 chr14 106621885 106622026 IGHV3-16 Genotypisierung
    708 chr14 106622035 106622108 IGHV3-16 Genotypisierung
    709 chr14 106641655 106641789 IGHV1-18 Genotypisierung
    710 chr14 106642110 106642265 IGHV1-18 Phasenvarianten
    711 chr14 106667545 106667628 IGHV3-20 Genotypisierung
    712 chr14 106667675 106667750 IGHV3-20 Genotypisierung
    713 chr14 106667805 106667882 IGHV3-20 Genotypisierung
    714 chr14 106691755 106691904 IGHV3-21 Genotypisierung
    715 chr14 106725295 106725442 IGHV3-23 Phasenvarianten
    716 chr14 106725550 106725663 IGHV3-23 Phasenvarianten
    717 chr14 106725780 106725952 IGHV3-23 Phasenvarianten
    718 chr14 106725995 106726188 IGHV3-23 Phasenvarianten
    719 chr14 106732970 106733077 IGHV1-24 Phasenvarianten
    720 chr14 106733185 106733270 IGHV1-24 Phasenvarianten
    721 chr14 106733275 106733487 IGHV1-24 Phasenvarianten
    722 chr14 106757725 106757888 IGHV2-26 Genotypisierung
    723 chr14 106758470 106758653 IGHV2-26 Phasenvarianten
    724 chr14 106780610 106780752 IGHV4-28 Genotypisierung
    725 chr14 106791090 106791169 IGHV3-30 Phasenvarianten
    726 chr14 106805290 106805428 IGHV4-31 Genotypisierung
    727 chr14 106805945 106806076 IGHV4-31 Phasenvarianten
    728 chr14 106806120 106806219 IGHV-4-31 Phasenvarianten
    729 chr14 106815805 106815910 IGHV3-33 Phasenvarianten
    730 chr14 106829685 106829757 IGHV4-34 Phasenvarianten
    731 chr14 106829765 106829986 IGHV4-34 Phasenvarianten
    732 chr14 106830125 106830196 IGHV4-34 Phasenvarianten
    733 chr14 106830240 106830312 IGHV4-34 Phasenvarianten
    734 chr14 106830315 106830884 IGHV4-34 Phasenvarianten
    735 chr14. 106831185 106831594 IGHV4-34 Phasenvarianten
    736 chr14 106845300 106845540 IGHV3-35 Genotypisierung
    737 chr14 106846385 106846557 IGHV3-35 Phasenvarianten
    738 chr14 106866380 106866461 IGHV3-38 Genotypisierung
    739 chr14 106866475 106866638 IGHV3-38 Genotypisierung
    740 chr14 106877715 106877858 IGHV4-39 Phasenvarianten
    741 chr14 106877930 106878498 IGHV4-39 Phasenvarianten
    742 chr14 106878540 106878612 IGHV4-39 Phasenvarianten
    743 chr14 106878680 106878759 IGHV4-39 Phasenvarianten
    744 chr14 106926180 106926405 IGHV3-43 Genotypisierung
    745 chr14 106962965 106963167 IGHV1-45 Genotypisierung
    746 chr14 106963170 106963280 IGHV1-45 Genotypisierung
    747 chr14 106967130 106967209 IGHV1-46 Genotypisierung
    748 chr14 106967315 106967397 IGHV1-46 Genotypisierung
    749 chr14 106994300 106994376 IGHV3-48 Phasenvarianten
    750 chr14 106994430 106994534 IGHV3-48 Phasenvarianten
    751 chr14 106994545 106994618 IGHV3-48 Phasenvarianten
    752 chr14 106994660 106994745 IGHV3-48 Phasenvarianten
    753 chr14 106994760 106994904 IGHV3-48 Phasenvarianten
    754 chr14 107013035 107013204 IGHV3-49 Genotypisierung
    755 chr14 107034665 107034845 IGHV5-51 Genotypisierung
    756 chr14 107034955 107035097 IGHV5-51 Genotypisierung
    757 chr14 107078455 107078631 IGHV1-58 Genotypisierung
    758 chr14 107083565 107083726 IGHV4-59 Phasenvarianten
    759 chr14 107083790 107083923 IGHV4-59 Phasenvarianten
    760 chr14 107113405 107113560 IGHV3-64 Phasenvarianten
    761 chr14 107113820 107113922 IGHV3-64 Phasenvarianten
    762 chr14 107114095 107114238 IGHV3-64 Phasenvarianten
    763 chr14 107136755 107136899 IGHV3-66 Phasenvarianten
    764 chr14 107169645 107169841 IGHV1-69 Phasenvarianten
    765 chr14 107169970 107170195 IGHV1-69 Phasenvarianten
    766 chr14 107170220 107170472 IGHV1-69 Phasenvarianten
    767 chr14 107170475 107170563 IGHV1-69 Phasenvarianten
    768 chr14 107170660 107170871 IGHV1-69 Phasenvarianten
    769 chr14 107178305 107178377 IGHV2-70 Phasenvarianten
    770 chr14 107178415 107178869 IGHV2-70 Phasenvarianten
    771 chr14 107178880 107179116 IGHV2-70 Phasenvarianten
    772 chr14 107179130 107179339 IGHV2-70 Phasenvarianten
    773 chr14 107179360 107180001 IGHV2-70 Phasenvarianten
    774 chr14 107199020 107199094 IGHV3-72 Genotypisierung
    775 chr14 107199095 107199173 IGHV3-72 Genotypisierung
    776 chr14 107210955 107211159 IGHV3-73 Genotypisierung
    777 chr14 107218755 107218891 IGHV3-74 Genotypisierung
    778 chr14 107258910 107259078 IGHV7-81 Phasenvarianten
    779 chr14 107259100 107259206 IGHV7-81 Phasenvarianten
    780 chr14 107259235 107239444 IGHV7-81 Phasenvarianten
    781 chr14 107259555 107259635 IGHV7-81 Phasenvarianten
    782 chr14 107282770 107282884 IGHV7-81 Genotypisierung
    783 chr14 107282945 107283018 IGHV7-81 Genotypisierung
    784 chr15 45003678 45003861 B2M Genotypisierung
    785 chr15 45007718 45007927 B2M Genotypisierung
    786 chr15 45008463 45008603 B2M Genotypisierung
    787 chr15 66727354 66727536 MAP2K1 Genotypisierung
    788 chr15 66729014 66729123 MAP2K1 Genotypisierung
    789 chr15 66729139 66729292 MAP2K1 Genotypisierung
    790 chr15 86312062 86312565 KLHL25 Genotypisierung
    791 chr16 2812096 2812786 SRRM2 Genotypisierung
    792 chr16 3779106 3779320 CREBBP Genotypisierung
    793 chr16 3781171 3781464 CREBBP Genotypisierung
    794 chr16 3781756 3781972 CREBBP Genotypisierung
    795 chr16 3786011 3786223 CREBBP Genotypisierung
    796 chr16 3786591 3786885 CREBBP Genotypisierung
    797 chr16 3788511 3788716 CREBBP Genotypisierung
    798 chr16 3789521 3789770 CREBBP Genotypisierung
    799 chr16 3790376 3790580 CREBBP Genotypisierung
    800 chr16 3794846 3794994 CREBBP Genotypisierung
    801 chr16 3808801 3809009 CREBBP Genotypisierung
    802 chr16 3817706 3817915 CREBBP Genotypisierung
    803 chr16 3823711 3823942 CREBBP Genotypisierung
    804 chr16 3824536 3824719 CREBBP Genotypisierung
    805 chr16 3832716 3832942 CREBBP Genotypisierung
    806 chr16 3900236 3900462 CREBBP Genotypisierung
    807 chr16 3900561 3900914 CREBBP Genotypisierung
    808 chr16 10971440 10973882 CIITA Phasenvarianten
    809 chr16 10973885 10974203 CIITA Phasenvarianten
    810 chr16 11348520 11349249 SOCS1 Phasenvarianten
    811 chr16 30093722 30093935 PPP4C Genotypisierung
    812 chr16 33523607 33523675 IGHV30R16-12 Phasenvarianten
    813 chr16 81946175 81946356 PLCG2 Genotypisierung
    814 chr16 81953055 81953307 PLCG2 Genotypisierung
    815 chr16 81962120 81962263 PLCG2 Genotypisierung
    816 chr16 85933003 85933569 IRF8 Phasenvarianten
    817 chr16 85936563 85936836 IRF8 Genotypisierung
    818 chr16 85942563 85942821 IRF8 Genotypisierung
    819 chr16 85945108 85945330 IRF8 Genotypisierung
    820 chr16 85946708 85946887 IRF8 Genotypisierung
    821 chr16 85948018 85948170 IRF8 Genotypisierung
    822 chr16 85951993 85952448 IRF8 Genotypisierung
    823 chr16 85953683 85953837 IRF8 Genotypisierung
    824 chr16 85954723 85954937 IRF8 Genotypisierung
    825 chr17 5366796 5367031 DHX3 3 Genotypisierung
    826 chr17 7576949 7577197 TP53 Genotypisierung
    827 chr17 7577444 7577683 TP53 Genotypisierung
    928 chr17 7578129 7578336 TP53 Genotypisierung
    829 chr17 7578344 7578591 TP53 Genotypisierung
    830 chr17 7579259 7579428 TP53 Genotypisierung
    831 chr17 18001529 18001704 DRG2 Genotypisierung
    832 chr17 18022119 18022791 MYO15A Genotypisierung
    833 chr17 40467709 40467857 STAT3 Genotypisierung
    834 chr17 40469104 40469321 STAT3 Genotypisierung
    835 chr17 40474309 40474530 STAT3 Genotypisierung
    836 chr17 40474974 40475190 STAT3 Genotypisierung
    837 chr17 40475254 40475394 STAT3 Genotypisierung
    838 chr17 40478074 40478252 STAT3 Genotypisierung
    839 chr17 40485844 40486132 STAT3 Genotypisierung
    840 chr17 40489754 40489903 STAT3 Genotypisierung
    841 chr17 40491284 40491489 STAT3 Genotypisierung
    842 chr17 41847058 41847241 DUSP3 Genotypisierung
    843 chr17 51900441 51900897 KIF2B Genotypisierung
    844 chr17 56408574 56408755 BZRAP1 Phasenvarianten
    845 chr17 56408884 56409615 BZR-AP1 Phasenvarianten
    846 chr17 62006520 62006919 CD79B Genotypisierung
    847 chr17 62007105 62007279 CD79B Genotypisierung
    848 chr17 62007410 62007761 CD79B Genotypisierung
    849 chr17 62008645 62008786 CD79B Genotypisierung
    850 chr17 62009505 62009659 CD79B Genotypisierung
    851 chr17 63010240 63010308 GNA13 Phasenvarianten
    852 chr17 63010315 63010973 GNA13 Phasenvarianten
    853 chr17 63014313 63014461 GNA13 Genotypisierung
    854 chr17 63049573 63049774 GNA13 Genotypisierung
    855 chr17 63052443 63052678 GNA13 Genotypisierung
    856 chr17 75447868 75448421 9-Sep Phasenvarianten
    857 chr17 78343503 78343715 RNF213 Genotypisierung
    858 chr17 79478953 79479026 ACTG1 Genotypisierung
    859 chr18 1477565 1477666 ADCYAP1 Phasenvarianten
    860 chr18 6947104 6947347 LAMA1 Genotypisierung
    861 chr18 6980464 6980680 LAMA1 Genotypisierung
    862 chr18 13825915 13826461 MC5R Genotypisierung
    863 chr18 30349775 30350300 AC012123.1 Phasenvarianten
    864 chr18 48231684 48232112 MAPK4 Genotypisierung
    865 chr18 48327694 48327901 MRO Genotypisierung
    866 chr18 48512954 48513347 ELAC1 Genotypisierung
    867 chr18 48591759 48592011 SMAD4 Genotypisierung
    868 chr18 48593364 48593571 SMAD4 Genotypisierung
    869 chr18 48604604 48604852 SMAD4 Genotypisierung
    870 chr18 48703169 48703965 MEX3C Genotypisierung
    871 chr18 53804515 53804796 TXNL1 Genotypisierung
    872 chr18 55274405 55274580 NARS Genotypisierung
    873 chr18 55319680 55319999 ATP8B1 Genotypisierung
    874 chr18 55329690 55329857 ATP8B1 Genotypisierung
    875 chr18 55359005 55359259 ATP8B1 Genotypisierung
    876 chr18 56054915 56055594 NEDD4L Genotypisierung
    877 chr18 56063365 56063826 NEDD4L Genotypisierung
    878 chr18 60763829 60764032 BCL2 Genotypisierung
    879 chr18 60764299 60764540 BCL2 Genotypisierung
    880 chr18 60774414 60774660 BCL2 Genotypisierung
    881 chr18 60793369 60793654 BCL2 Genotypisierung
    882 chr18 60795829 60796006 BCL2 Genotypisierung
    883 chr18 60806264 60806836 BCL2 Phasenvarianten
    884 chr18 60983784 60983991 BCL2 Phasenvarianten
    885 chr18 60984454 60986731 BCL2 Phasenvarianten
    886 chr18 60986844 60987047 BCL2 Phasenvarianten
    887 chr18 60987964 60988511 BCL2 Phasenvarianten
    888 chr18 64172116 64172531 CDH19 Genotypisierung
    889 chr18 64176241 64176518 CDH19 Genotypisierung
    890 chr18 64239166 64239357 CDH19 Genotypisierung
    891 chr18 65179856 65181824 DSEL Genotypisierung
    892 chr18 73944893 73945380 ZNF516 Genotypisierung
    893 chr18 75683734 75684502 GALR1 Genotypisierung
    894 chr18 77092820 77093034 ATP9B Genotypisierung
    895 chr18 77170715 77171032 NFATC1 Genotypisierung
    896 chr18 77208755 77208996 NFATC1 Genotypisierung
    897 chr18 77227415 77227661 NFATC1 Genotypisierung
    898 chr18 77288040 77288611 NFATC1 Genotypisierung
    899 chr18 77794425 77795130 RBFA Genotypisierung
    900 chr19 1376440 1376662 MUM1 Genotypisierung
    901 chr19 6586161 6586445 CD70 Genotypisierung
    902 chr19 6590026 6590238 CD70 Genotypisierung
    903 chr19 6590786 6591079 CD70 Genotypisierung
    904 chr19 8028408 8028583 ELAVL1 Genotypisierung
    905 chr19 10334563 10335187 S1PR2 Genotypisierung
    906 chr19 10335308 10335585 S1PR2 Genotypisierung
    907 chr19 10340823 10341376 S1PR2 Phasenvarianten
    908 chr19 10341833 10341984 S1PR2 Genotypisierung
    909 chr19 12902574 12902861 JUNB Genotypisierung
    910 chr19 19256469 19256851 MEF2B Genotypisierung
    911 chr19 19257044 19257222 MEF2B Genotypisierung
    912 chr19 19257339 19257480 MEF2B Genotypisierung
    913 chr19 19257489 19257741 MEF2B Genotypisierung
    914 chr19 19257824 19258036 MEF2B Genotypisierung
    915 chr19 19258484 19258662 MEF2B Genotypisierung
    916 chr19 19259984 19260176 MEF2B Genotypisierung
    917 chr19 19261414 19261588 MEF2B Genotypisierung
    918 chr19 19293309 19293478 MEF2BNB Genotypisierung
    919 chr19 42599890 42600121 POU2F2 Genotypisierung
    920 chr19 51525626 51525937 KLK11 Genotypisierung
    921 chr19 51559441 51560040 KLK13 Genotypisierung
    922 chr19 51561771 51561943 KLK13 Genotypisierung
    923 chr19 52381611 52381786 ZNF577 Genotypisierung
    924 chr19 52403336 52403586 ZNF649 Genotypisierung
    925 chr19 52961146 52961224 ZNF534 Genotypisierung
    926 chr19 52961226 52961578 ZNF534 Genotypisierung
    927 chr19 53598586 53599055 ZNF160 Genotypisierung
    928 chr20 23028372 23028858 THBD Genotypisierung
    929 chr20 25003526 25003774 ACSS1 Genotypisierung
    930 chr20 46131072 46131213 NCOA3 Phasenvarianten
    931 chr20 46131217 46131287 NCOA3 Phasenvarianten
    932 chr21 18981233 18981504 BTG3 Genotypisierung
    933 chr21 28213258 28213536 ADAMTS1 Genotypisierung
    934 chr21 28216763 28217005 ADAMTS1 Genotypisierung
    935 chr22 22380472 22381038 IGLV4-69 Phasenvarianten
    936 chr22 22385622 22385767 IGLV4-69 Genotypisierung
    937 chr22 22385777 22385898 IGLV4-69 Genotypisierung
    938 chr22 22453287 22453502 IGLV8-61 Genotypisierung
    939 chr22 22453527 22453608 IGLV8-61 Genotypisierung
    940 chr22 22516707 22516785 IGLV4-60 Phasenvarianten
    941 chr22 22516827 22517113 IGLV4-60 Phasenvarianten
    942 chr22 22550337 22550812 IGLV6-57 Genotypisierung
    943 chr22 22556227 22556630 IGLV11-55 Genotypisierung
    944 chr22 22569332 22569655 IGLV10-54 Genotypisierung
    945 chr22 22673242 22673607 IGLV5-52 Genotypisierung
    946 chr22 22677077 22677216 IGLV1-51 Phasenvarianten
    947 chr22 22677227 22677337 IGLV1-51 Genotypisierung
    948 chr22 22681927 22682007 IGLV1-50 Genotypisierung
    949 chr22 22682097 22682213 IGLV1-50 Genotypisierung
    950 chr22 22697727 22698123 IGLV9-49 Genotypisierung
    951 chr22 22707427 22707509 IGLV5-48 Genotypisierung
    952 chr22 22707517 22707658 IGLV5-48 Phasenvarianten
    953 chr22 22707742 22707823 IGLV5-48 Genotypisierung
    954 chr22 22712077 22712496 IGLV1-47 Phasenvarianten
    955 chr22 22712512 22712625 IGLV1-47 Genotypisierung
    956 chr22 22723897 22724189 IGLV7-46 Phasenvarianten
    957 chr22 22724207 22724494 IGLV7-46 Phasenvarianten
    958 chr22 22730452 22730552 IGLV5-45 Phasenvarianten
    959 chr22 22730607 22730756 IGLV5-45 Phasenvarianten
    960 chr22 22730887 22730955 IGLV5-45 Phasenvarianten
    961 chr22 22735417 22735604 IGLV1-44 Phasenvarianten
    962 chr22 22735792 22735878 IGLV1-44 Phasenvarianten
    963 chr22 22749602 22749701 IGLV7-43 Phasenvarianten
    964 chr22 22749732 22749853 IGLV7-43 Phasenvarianten
    965 chr22 22749857 22749939 IGLV7-43 Phasenvarianten
    966 chr22 22749942 22750074 IGLV7-43 Phasenvarianten
    967 chr22 22750092 22750342 IGLV7-43 Phasenvarianten
    968 chr22 22758647 22759294 IGLV1-40 Phasenvarianten
    969 chr22 22759297 22759377 IGLV1-40 Phasenvarianten
    970 chr22 22764167 22764309 IGLV1-40 Phasenvarianten
    971 chr22 22764367 22764450 IGLV1-40 Phasenvarianten
    972 chr22 22764552 22764634 IGLV1-40 Phasenvarianten
    973 chr22 22782037 22782325 IGLV5-37 Genotypisierung
    974 chr22 22786477 22786702 IGLV1-36 Genotypisierung
    975 chr22 22786727 22786842 IGLV1-36 Genotypisierung
    976 chr22 22930852 22931173 IGLV2-33 Genotypisierung
    977 chr22 22937192 22937341 IGLV3-32 Genotypisierung
    978 chr22 22937347 22937548 IGLV3-32 Genotypisierung
    979 chr22 23010977 23011143 IGLV3-27 Genotypisierung
    980 chr22 23011172 23011316 IGLV3-27 Genotypisierung
    981 chr22 23029497 23029581 IGLV3-25 Genotypisierung
    982 chr22 23029622 23029778 IGLV3-25 Genotypisierung
    983 chr22 23040452 23040527 IGLV2-23 Phasenvarianten
    984 chr22 23040592 23040811 IGLV2-23 Phasenvarianten
    985 chr22 23040852 23041365 IGLV2-23 Phasenvarianten
    986 chr22 23047067 23047329 IGLV3-22 Genotypisierung
    987 chr22 23055367 23055445 IGLV3-21 Genotypisierung
    988 chr22 23055497 23055577 IGLV3-21 Phasenvarianten
    989 chr22 23055727 23055857 IGLV3-21 Phasenvarianten
    990 chr22 23063307 23063661 IGLV3-19 Genotypisierung
    991 chr22 23077337 23077435 IGLV2-18 Genotypisierung
    992 chr22 23077537 23077615 IGLV2-18 Genotypisierung
    993 chr22 23090122 23090205 IGLV3-16 Genotypisierung
    994 chr22 23090287 23090372 IGLV3-16 Genotypisierung
    995 chr22 23101392 23101473 IGLV2-14 Phasenvarianten
    996 chr22 23101532 23101605 IGLV2-14 Phasenvarianten
    997 chr22 23101652 23101735 IGLV2-14 Genotypisierung
    998 chr22 23114792 23114874 IGLV3-12 Genotypisierung
    999 chr22 23114947 23115052 IGLV3-12 Genotypisierung
    1000 chr22 23135152 23135230 IGLV2-11 Genotypisierung
    1001 chr22 23135247 23135399 IGLV2-11 Genotypisierung
    1002 chr22 23135437 23135521 IGLV2-11 Genotypisierung
    1003 chr22 23154347 23154477 IGLV3-10 Phasenvarianten
    1004 chr22 23154597 23154815 IGLV3-10 Phasenvarianten
    1005 chr22 23161917 23162052 IGLV3-9 Genotypisierung
    1006 chr22 23162072 23162290 IGLV3-9 Genotypisierung
    1007 chr22 23165422 23165496 IGLV2-8 Phasenvarianten
    1008 chr22 23165542 23165680 IGLV2-8 Phasenvarianten
    1009 chr22 23165727 23165811 IGLV2-8 Phasenvarianten
    1010 chr22 23192412 23192818 IGLV4-3 Phasenvarianten
    1011 chr22 23197917 23198053 IGLV4-3 Phasenvarianten
    1012 chr22 23198067 23198475 IGLV4-3 Phasenvarianten
    1013 chr22 23198587 23198732 IGLV4-3 Phasenvarianten
    1014 chr22 23198797 23198869 IGLV4-3 Phasenvarianten
    1015 chr22 23199022 23199127 IGLV4-3 Phasenvarianten
    1016 chr22 23199182 23199261 IGLV4-3 Phasenvarianten
    1017 chr22 23199277 23199671 IGLV4-3 Phasenvarianten
    1018 chr22 23213857 23214141 IGLV4-3 Genotypisierung
    1019 chr22 23214167 23214249 IGLV4-3 Genotypisierung
    1020 chr22 23222927 23223065 IGLV3-1 Phasenvarianten
    1021 chr22 23223077 23223319 IGLV3-1 Phasenvarianten
    1022 chr22 23223327 23224010 IGLV3-1 Phasenvarianten
    1023 chr22 23227062 23227279 IGLL5 Phasenvarianten
    1024 chr22 23227567 23227896 IGLL5 Phasenvarianten
    1025 chr22 23227897 23228624 IGLL5 Phasenvarianten
    1026 chr22 23229332 23229550 IGLL5 Phasenvarianten
    1027 chr22 23229562 23229739 IGLL5 Phasenvarianten
    1028 chr22 23230012 23231063 IGLL5 Phasenvarianten
    1029 chr22 23231072 23231764 IGLL5 Phasenvarianten
    1030 chr22 23231927 23232005 IGLL5 Phasenvarianten
    1031 chr22 23232062 23232346 IGLL5 Phasenvarianten
    1032 chr22 23232362 23232465 IGLL5 Phasenvarianten
    1033 chr22 23232517 23232737 IGLL5 Phasenvarianten
    1034 chr22 23234612 23235837 IGLJ1 Phasenvarianten
    1035 chr22 23235847 23236276 IGLJ1 Phasenvarianten
    1036 chr22 23236277 23236378 IGLJ1 Phasenvarianten
    1037 chr22 23236387 23236526 IGLJ1 Phasenvarianten
    1038 chr22 23236557 23236851 IGLJ1 Phasenvarianten
    1039 chr22 23236877 23237366 IGLC1 Phasenvarianten
    1040 chr22 23241762 23241835 IGLJ2 Genotypisierung
    1041 chr22 23242602 23242981 IGLC2 Phasenvarianten
    1042 chr22 23244157 23244373 IGLC2 Phasenvarianten
    1043 chr22 23247137 23247209 IGLJ3 Genotypisierung
    1044 chr22 23247257 23247444 IGLJ3 Phasenvarianten
    1045 chr22 23247467 23247630 IGLJ3 Phasenvarianten
    1046 chr22 23248182 23248404 IGLC3 Phasenvarianten
    1047 chr22 23252687 23252824 IGLJ4 Genotypisierung
    1048 chr22 23256362 23256504 IGLJ5 Genotypisierung
    1049 chr22 23260267 23260399 IGLJ6 Genotypisierung
    1050 chr22 23263507 23263653 IGLJ7 Genotypisierung
    1051 chr22 23263872 23264263 IGLJ7 Phasenvarianten
    1052 chr22 23278157 23278381 IGLC7 Phasenvarianten
    1053 chr22 23282767 23282839 IGLC7 Phasenvarianten
    1054 chr22 23282842 23282956 IGLC7 Phasenvarianten
    1055 chr22 23523567 23524204 BCR Genotypisierung
    1056 chr22 23524212 23524419 BCR Genotypisierung
    1057 chr22 23610547 23610791 BCR Genotypisierung
    1058 chr22 29191136 29191455 XBP1 Genotypisierung
    1059 chr22 29191461 29191746 XBP1 Genotypisierung
    1060 chr22 29192006 29192215 XBP1 Genotypisierung
    1061 chr22 29193041 29193205 XBP1 Genotypisierung
    1062 chr22 29196261 29196547 XBP1 Genotypisierung
    1063 chr22 41513340 41513562 EP300 Genotypisierung
    1064 chr22 41525845 41526047 EP300 Genotypisierung
    1065 chr22 41527440 41527664 EP300 Genotypisierung
    1066 chr22 41536110 41536291 EP300 Genotypisierung
    1067 chr22 41545740 41545940 EP300 Genotypisierung
    1068 chr22 41545995 41546223 EP300 Genotypisierung
    1069 chr22 41565485 41565650 EP300 Genotypisierung
    1070 chr22 41566385 41566592 EP300 Genotypisierung
    1071 chr22 41568480 41568693 EP300 Genotypisierung
    1072 chr22 41569600 41569814 EP300 Genotypisierung
    1073 chr22 41572225 41572436 EP300 Genotypisierung
    1074 chr22 41572800 41573022 EP300 Genotypisierung
    1075 chr22 41573300 41573515 EP300 Genotypisierung
    1076 chr22 41574255 41574486 EP300 Genotypisierung
    1077 chr22 41574685 41574904 EP300 Genotypisierung
    1078 chr22 47570209 47570414 TBC1D22A Phasenvarianten
    1079 chrX 1584324 1585521 P2RY8 Genotypisierung
    1080 chrX 1655789 1656029 AKAP17A Genotypisierung
    1081 chrX 12993264 12993539 TMSB4X Phasenvarianten
    1082 chrX 12993544 12994173 TMSB4X Phasenvarianten
    1083 chrX 12994289 12994397 TMSB4X Phasenvarianten
    1084 chrX 12994444 12994514 TMSB4X Phasenvarianten
    1085 chrX 33146106 33146490 DMD Phasenvarianten
    1086 chrX 35820576 35821268 MAGEB16 Genotypisierung
    1087 chrX 70347816 70348034 MED12 Genotypisierung
    1088 chrX 70612661 70612778 TAF1 Genotypisierung
    1089 chrX 73962123 73963110 KIAA2022 Genotypisierung
    1090 chrX 86772953 86773345 KLHL4 Genotypisierung
    1091 chrX 90026453 90026652 PABPC5 Phasenvarianten
    1092 chrX 100610984 100611308 BTK Genotypisierung
    1093 chrX 119509280 119509492 ATP1B4 Genotypisierung
    1094 chrX 141291052 141291326 MAGEC2 Genotypisierung
    1095 chrX 141291357 141291566 MAGEC2 Genotypisierung
    1096 chrX 153997383 153997622 DKC1 Genotypisierung
    Figure DE112020005433T5_0077
    Figure DE112020005433T5_0078
    Figure DE112020005433T5_0079
    Figure DE112020005433T5_0080
    Figure DE112020005433T5_0081
    Figure DE112020005433T5_0082
    Figure DE112020005433T5_0083
    Figure DE112020005433T5_0084
    Figure DE112020005433T5_0085
    Figure DE112020005433T5_0086
    Figure DE112020005433T5_0087
    Figure DE112020005433T5_0088
    Figure DE112020005433T5_0089
    Figure DE112020005433T5_0090
    Figure DE112020005433T5_0091
    Figure DE112020005433T5_0092
    Figure DE112020005433T5_0093
    Figure DE112020005433T5_0094
    Figure DE112020005433T5_0095
    Figure DE112020005433T5_0096
    Figure DE112020005433T5_0097
    Figure DE112020005433T5_0098
    Figure DE112020005433T5_0099
    Figure DE112020005433T5_0100
    Figure DE112020005433T5_0101
    Figure DE112020005433T5_0102
    Figure DE112020005433T5_0103
    Figure DE112020005433T5_0104
    Figure DE112020005433T5_0105
    Figure DE112020005433T5_0106
    Figure DE112020005433T5_0107
    Figure DE112020005433T5_0108
    Figure DE112020005433T5_0109
    Figure DE112020005433T5_0110
    Figure DE112020005433T5_0111
    Figure DE112020005433T5_0112
    Figure DE112020005433T5_0113
    Figure DE112020005433T5_0114
    Figure DE112020005433T5_0115
    Figure DE112020005433T5_0116
    Figure DE112020005433T5_0117
    Figure DE112020005433T5_0118
    Figure DE112020005433T5_0119
    Figure DE112020005433T5_0120
    Figure DE112020005433T5_0121
    Figure DE112020005433T5_0122
    Figure DE112020005433T5_0123
    Figure DE112020005433T5_0124
    Figure DE112020005433T5_0125
    Figure DE112020005433T5_0126
    Figure DE112020005433T5_0127
    Figure DE112020005433T5_0128
    Figure DE112020005433T5_0129
    Figure DE112020005433T5_0130
    Figure DE112020005433T5_0131
    Figure DE112020005433T5_0132
    Figure DE112020005433T5_0133
    Figure DE112020005433T5_0134
    Figure DE112020005433T5_0135
    Figure DE112020005433T5_0136
    Figure DE112020005433T5_0137
    Figure DE112020005433T5_0138
    Figure DE112020005433T5_0139
    Figure DE112020005433T5_0140
    Figure DE112020005433T5_0141
    Figure DE112020005433T5_0142
    Figure DE112020005433T5_0143
    Figure DE112020005433T5_0144
    Figure DE112020005433T5_0145
    Figure DE112020005433T5_0146
    Figure DE112020005433T5_0147
    Figure DE112020005433T5_0148
    Figure DE112020005433T5_0149
    Figure DE112020005433T5_0150
    Figure DE112020005433T5_0151
    Figure DE112020005433T5_0152
    Figure DE112020005433T5_0153
    Figure DE112020005433T5_0154
    Figure DE112020005433T5_0155
    Figure DE112020005433T5_0156
    Figure DE112020005433T5_0157
    Figure DE112020005433T5_0158
    Figure DE112020005433T5_0159
    Figure DE112020005433T5_0160
    Figure DE112020005433T5_0161
    Figure DE112020005433T5_0162
    Figure DE112020005433T5_0163
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • US 62/931688 [0001]
    • CA 233975 [0003]
    • CA 241076 [0003]
    • CA 188298 [0003]
    • US 5804396 [0240]

Claims (115)

  1. Verfahren, umfassend: (a) Gewinnen von Sequenzierungsdaten, die von einer Vielzahl zellfreier Nukleinsäuremoleküle abgeleitet sind, die von einem Subjekt erlangt oder abgeleitet wurden, durch ein Computersystem; (b) Verarbeiten der Sequenzierungsdaten durch das Computersystem, um ein oder mehrere zellfreie Nukleinsäuremoleküle der Vielzahl zellfreier Nukleinsäuremoleküle zu identifizieren, wobei jedes der einen oder mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, wobei mindestens etwa 10 % der einen oder mehreren zellfreien Nukleinsäuremoleküle eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten umfassen, die durch wenigstens ein Nukleotid getrennt sind; und (c) Analysieren des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle durch das Computersystem zur Bestimmung einer Erkrankung des Subjekts.
  2. Verfahren nach Anspruch 1, wobei die wenigstens etwa 10 % der zellfreien Nukleinsäuremoleküle wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % oder etwa 100 % der einen oder mehreren zellfreien Nukleinsäuremoleküle umfassen.
  3. Verfahren, umfassend: (a) Gewinnen von Sequenzierungsdaten, die von einer Vielzahl zellfreier Nukleinsäuremoleküle abgeleitet sind, die von einem Subjekt erlangt oder abgeleitet wurden, durch ein Computersystem; (b) Verarbeiten der Sequenzierungsdaten durch das Computersystem, um ein oder mehrere zellfreie Nukleinsäuremoleküle der Vielzahl zellfreier Nukleinsäuremoleküle zu identifizieren, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind; und (c) Analysieren des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle durch das Computersystem zur Bestimmung einer Erkrankung des Subjekts.
  4. Verfahren, umfassend: (a) Gewinnen von Sequenzierungsdaten, die von einer Vielzahl von zellfreien Nukleinsäuremolekülen abgeleitet sind, die von einem Subjekt erlangt oder abgeleitet sind; (b) Verarbeiten der Sequenzierungsdaten zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle mit einer Nachweisgrenze von weniger als etwa 1 aus 50.000 Beobachtungen aus den Sequenzierungsdaten; und (c) Analysieren des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle zur Bestimmung einer Erkrankung des Subjekts.
  5. Verfahren nach Anspruch 4, wobei die Nachweisgrenze des Identifizierungsschritts bei weniger als etwa 1 von 100.000, weniger als etwa 1 von 500.000, weniger als etwa 1 von 1.000.000, weniger als etwa 1 von 1.500.000 oder weniger als etwa 1 von 2.000.000 Beobachtungen aus den Sequenzierungsdaten liegt.
  6. Verfahren nach einem beliebigen der Ansprüche 4-5, wobei jedes der ein oder mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst.
  7. Verfahren nach Anspruch 6, wobei eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt ist.
  8. Verfahren nach einem beliebigen der Ansprüche 4 bis 7, wobei (a) bis (c) von einem Computersystem durchgeführt werden.
  9. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten basierend auf der Nukleinsäure-Amplifikation erzeugt werden.
  10. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten basierend auf der Polymerase-Kettenreaktion erzeugt werden.
  11. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten basierend auf der Amplikon-Sequenzierung erzeugt werden.
  12. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten basierend auf der Next-Generation-Sequenzierung (NGS) erzeugt werden.
  13. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten basierend auf einem nicht-hybridisierungsbasierten NGS erzeugt werden.
  14. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten ohne Verwendung einer molekularen Barcodierung von wenigstens einem Teil der Vielzahl von zellfreien Nukleinsäuremolekülen erzeugt werden.
  15. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten ohne Verwendung einer Probenbarcodierung von wenigstens einem Teil der Vielzahl von zellfreien Nukleinsäuremolekülen erlangt werden.
  16. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Sequenzierungsdaten ohne In silico-Entfernung oder Unterdrückung von (i) Hintergrundfehlern oder (ii) Sequenzierungsfehlern erlangt werden.
  17. Verfahren zur Behandlung einer Erkrankung eines Subjekts, das Verfahren umfassend: (a) Identifizierung des Subjekts für die Behandlung der Erkrankung, wobei der Proband basierend auf der Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus einer Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet wurden, als an der Erkrankung leidend bestimmt wurde. wobei jedes des einen oder der mehreren identifizierten zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind, und wobei das Vorhandensein der Vielzahl der Phasenvarianten indikativ für die Erkrankung des Subjekts ist; und (b) Unterziehen des Subjekts der Behandlung basierend auf der Identifizierung in (a).
  18. Verfahren zur Überwachung eines Verlaufs einer Erkrankung eines Subjekts, das Verfahren umfassend: (a) Bestimmen eines ersten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines ersten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer ersten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden; (b) Bestimmen eines zweiten Stadiums der Erkrankung des Subjekts basierend auf der Identifizierung eines zweiten Satzes von einem oder mehreren zellfreien Nukleinsäuremolekülen aus einer zweiten Vielzahl von zellfreien Nukleinsäuremolekülen, die von dem Subjekt erlangt oder abgeleitet werden, wobei die zweite Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt im Anschluss an die Gewinnung der ersten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt wird; und (c) Bestimmen des Verlaufs der Erkrankung basierend auf dem ersten Stadium der Erkrankung und dem zweiten Stadium der Erkrankung, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind.
  19. Verfahren nach Anspruch 18, wobei der Verlauf der Erkrankung eine Verschlechterung der Erkrankung ist.
  20. Verfahren nach Anspruch 18, wobei der Verlauf der Erkrankung zumindest eine Teilremission der Erkrankung ist.
  21. Verfahren nach einem beliebigen der Ansprüche 18-20, wobei ein Vorhandensein der Vielzahl von Phasenvarianten indikativ für den ersten Status oder den zweiten Status der Erkrankung des Subjekts ist.
  22. Verfahren nach einem beliebigen der Ansprüche 18-21, wobei die zweite Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt wenigstens etwa 1 Woche, wenigstens etwa 2 Wochen, wenigstens etwa 3 Wochen, wenigstens etwa 4 Wochen, wenigstens etwa 2 Monate oder wenigstens etwa 3 Monate nach der Gewinnung der ersten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt erlangt wird.
  23. Verfahren nach einem beliebigen der Ansprüche 18-22, wobei der Proband einer Behandlung der Erkrankung (i) vor der Gewinnung der zweiten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt und (ii) im Anschluss an die Gewinnung der ersten Vielzahl von zellfreien Nukleinsäuremolekülen von dem Subjekt unterzogen wird.
  24. Verfahren nach einem der Ansprüche 18 bis 23, wobei der Verlauf der Erkrankung indikativ für eine minimale Resterkrankung der Erkrankung des Subjekts ist.
  25. Verfahren nach einem der Ansprüche 18 bis 24, wobei der Verlauf der Erkrankung indikativ für die Tumorlast oder Krebslast des Subjekts ist.
  26. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei das eine oder die mehreren zellfreien Nukleinsäuremoleküle aus der Vielzahl der zellfreien Nukleinsäuremoleküle mit einem Satz von Nukleinsäuresonden erfasst, wobei der Satz von Nukleinsäuresonden zur Hybridisierung mit wenigstens einem Teil der zellfreien Nukleinsäuremoleküle ausgelegt ist, die eine oder mehrere mit der Erkrankung assoziierte Genombereiche umfassen.
  27. Verfahren, umfassend: (a) Bereitstellen eines Gemisches, umfassend (1) einen Nukleinsäuresondensatz und (2) eine Vielzahl von von dem Subjekt erlangter oder abgeleiteter zellfreier Nukleinsäuremoleküle, wobei eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatzes zur Hybridisierung mit wenigstens einem Teil eines zellfreien Zielnukleinsäuremoleküls gestaltet ist, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, die durch wenigstens ein Nukleotid getrennt sind, und wobei die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens umfasst, wobei die Aktivierung des aktivierbaren Reporteragens ausgewählt ist aus der Gruppe bestehend aus: (i) Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl von Phasenvarianten und (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl von Phasenvarianten hybridisiert wurde; (b) Nachweis des aktivierbaren Reporteragens, das zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle aus der Vielzahl zellfreier Nukleinsäuremoleküle aktiviert ist, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle die Vielzahl der Phasenvarianten umfasst; und (c) Analysieren des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle zur Bestimmung einer Erkrankung des Subjekts.
  28. Verfahren, umfassend: (a) Bereitstellen eines Gemisches, umfassend (1) einen Nukleinsäuresondensatz und (2) eine Vielzahl von von dem Subjekt erlangter oder abgeleiteter zellfreier Nukleinsäuremoleküle, wobei eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatzes zur Hybridisierung mit wenigstens einem Teil eines zellfreien Zielnukleinsäuremoleküls gestaltet ist, das eine Vielzahl von Phasenvarianten relativ zu einer Referenzgenomsequenz umfasst, und wobei die individuelle Nukleinsäuresonde ein aktivierbares Reporteragens umfasst, wobei die Aktivierung des aktivierbaren Reporteragens ausgewählt ist aus der Gruppe bestehend aus: (i) Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl von Phasenvarianten und (ii) Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl von Phasenvarianten hybridisiert wurde; (b) Nachweisen des aktivierbaren Reporteragens, das zur Identifizierung eines oder mehrerer zellfreier Nukleinsäuremoleküle der Vielzahl zellfreier Nukleinsäuremoleküle aktiviert ist, wobei jedes des einen oder der mehreren zellfreien Nukleinsäuremoleküle die Vielzahl von Phasenvarianten umfasst, wobei eine Nachweisgrenze des Identifizierungsschritts weniger als etwa 1 von 50.000 zellfreien Nukleinsäuremolekülen der Vielzahl zellfreier Nukleinsäuremoleküle beträgt; und (c) Analysieren des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle zur Bestimmung einer Erkrankung des Subjekts.
  29. Verfahren nach Anspruch 28, wobei die Nachweisgrenze des Identifizierungsschritts weniger als etwa 1 von 100.000, weniger als etwa 1 von 500.000, weniger als etwa 1 von 1.000.000, weniger als etwa 1 von 1.500.000 oder weniger als etwa 1 von 2.000.000 zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen beträgt.
  30. Verfahren nach Anspruch 28 oder 29, wobei eine erste Phasenvariante der Vielzahl von Phasenvarianten und eine zweite Phasenvariante der Vielzahl von Phasenvarianten durch wenigstens ein Nukleotid getrennt ist.
  31. Verfahren nach einem beliebigen der Ansrpüche 27-30, wobei das aktivierbare Reporteragens bei der Hybridisierung der individuellen Nukleinsäuresonde an die Vielzahl der Phasenvarianten aktiviert wird.
  32. Verfahren nach einem beliebigen der Ansprüche 27-30, wobei das aktivierbare Reporteragens bei der Dehybridisierung wenigstens eines Teils der individuellen Nukleinsäuresonde, die an die Vielzahl der Phasenvarianten hybridisiert wurde, aktiviert wird.
  33. Verfahren nach einem beliebigen der Ansprüche 27 bis 32, ferner umfassend das Mischen (1) des Nukleinsäuresondensatzes und (2) der Vielzahl von zellfreien Nukleinsäuremolekülen.
  34. Verfahren nach einem beliebigen der Ansprüche 27 bis 33, wobei das aktivierbare Reporteragens ein Fluorophor ist.
  35. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Analyse des identifizierten einen oder der mehreren zellfreien Nukleinsäuremoleküle die Analyse (i) des identifizierten einen oder der mehreren zellfreien Nukleinsäuremoleküle und (ii) anderer zellfreier Nukleinsäuremoleküle der Vielzahl zellfreier Nukleinsäuremoleküle, die nicht die Vielzahl der Phasenvarianten als unterschiedliche Variablen umfassen.
  36. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Analyse des identifizierten einen oder der mehreren zellfreien Nukleinsäuremoleküle nicht auf anderen zellfreien Nukleinsäuremolekülen der Vielzahl von zellfreien Nukleinsäuremolekülen, die nicht die Vielzahl von Phasenvarianten umfassen, basiert.
  37. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei eine Anzahl der Vielzahl von Phasenvarianten aus dem identifizierten einen oder den identifizierten mehreren zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts ist.
  38. Verfahren nach Anspruch 37, wobei ein Verhältnis von (i) der Anzahl der Vielzahl von Phasenvarianten aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen und (ii) einer Anzahl von Einzelnukleotidvarianten (SNV) aus dem einen oder den mehreren zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts ist.
  39. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei eine Häufigkeit der Vielzahl von Phasenvarianten in dem identifizierten einen oder den identifizierten mehreren zellfreien Nukleinsäuremolekülen indikativ für die Erkrankung des Subjekts ist.
  40. Verfahren nach Anspruch 39, wobei die Häufigkeit indikativ für eine mit der Erkrankung verbundene kranke Zelle ist.
  41. Verfahren nach Anspruch 40, wobei die Erkrankung ein diffuses großzelliges B-Zell-Lymphom ist, und wobei die Häufigkeit indikativ dafür ist, ob das eine oder die mehreren zellfreien Nukleinsäuremoleküle von Keimzentrum-B-Zellen (GCB) oder aktivierten B-Zellen (ABC) abgeleitet sind.
  42. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei der genomische Ursprung des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle indikativ für die Erkrankung des Subjekts ist.
  43. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die erste und die zweite Phasenvariante durch wenigstens 2, wenigstens 3, wenigstens 4, wenigstens 5, wenigstens 6, wenigstens 7 oder wenigstens 8 Nukleotide getrennt sind.
  44. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die erste und die zweite Phasenvariante durch höchstens etwa 180, höchstens etwa 170, höchstens etwa 160, höchstens etwa 150 oder höchstens etwa 140 Nukleotide getrennt sind.
  45. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 % oder wenigstens etwa 50 % des einen oder der mehreren zellfreien Nukleinsäuremoleküle, die eine Vielzahl von Phasenvarianten umfassen, eine Einzelnukleotidvariante (SNV), die wenigstens 2 Nukleotide von einer benachbarten SNV entfernt ist, umfassen.
  46. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Vielzahl der Phasenvarianten wenigstens 3, wenigstens 4, wenigstens 5, wenigstens 10, wenigstens 15, wenigstens 20 oder wenigstens 25 Phasenvarianten innerhalb desselben zellfreien Nukleinsäuremoleküls umfasst.
  47. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei das eine oder die mehreren identifizierten zellfreien Nukleinsäuremoleküle wenigstens 2, wenigstens 3, wenigstens 4, wenigstens 5, wenigstens 10, wenigstens 50, wenigstens 100, wenigstens 500 oder wenigstens 1.000 zellfreie Nukleinsäuremoleküle umfassen.
  48. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Referenzgenomsequenz von einer Referenzkohorte abgeleitet ist.
  49. Verfahren nach Anspruch 48, wobei die Referenzgenomsequenz eine Konsensussequenz aus der Referenzkohorte umfasst.
  50. Verfahren nach Anspruc 48, wobei die Referenzgenomsequenz wenigstens einen Teil des menschlichen hg19-Genoms, hg18-Genoms, hg17-Genoms, hg16-Genoms oder hg38-Genoms umfasst.
  51. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Referenzgenomsequenz von einer Probe des Subjekts abgeleitet ist.
  52. Verfahren nach Anspruch 51, wobei die Probe eine gesunde Probe ist.
  53. Verfahren nach Anspruch 52, wobei die Probe eine gesunde Zelle umfasst.
  54. Verfahren nach Anspruch 53, wobei die gesunde Zelle einen gesunden Leukozyten umfasst.
  55. Verfahren nach Anspruch 51, wobei die Probe eine erkrankte Probe ist.
  56. Verfahren nach Anspruch 55, wobei die erkrankte Probe eine erkrankte Zelle umfasst.
  57. Verfahren nach Anspruch 56, wobei die erkrankte Zelle eine Tumorzelle umfasst.
  58. Verfahren nach Anspruch 55, wobei die erkrankte Probe einen soliden Tumor umfasst.
  59. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei der Satz von Nukleinsäuresonden basierend auf der Vielzahl von Phasenvarianten konstruiert ist, die durch den Vergleich von (i) Sequenzierungsdaten aus einem soliden Tumor, Lymphom oder Bluttumor des Subjekts und (ii) Sequenzierungsdaten aus einer gesunden Zelle des Subjekts oder einer gesunden Kohorte identifiziert werden.
  60. Verfahren nach Anspruch 59, wobei die gesunde Zelle von dem Subjekt stammt.
  61. Verfahren nach Anspruch 59, wobei die gesunde Zelle aus der gesunden Kohorte stammt.
  62. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei der Satz von Nukleinsäuresonden zur Hybridisierung mit wenigstens einem Teil der Sequenzen der mit der Erkrankung assoziierten genomischen Loci bestimmt ist.
  63. Verfahren nach Anspruch 62, wobei bekannt, dass die mit der Erkrankung assoziierten genomischen Loci eine aberrante somatische Hypermutation aufweisen, wenn der Proband die Erkrankung hat.
  64. Das Verfahren nach einem beliebigen der vorhergehenden Ansprüche, wobei der Satz von Nukleinsäuresonden zur Hybridisierung an wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % oder etwa 100 % (i) der in Tabelle 1 identifizierten Genombereiche, (ii) der in Tabelle 3 identifizierten Genombereiche oder (iii) der in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereiche, konzipiert ist.
  65. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei jede Nukleinsäuresonde des Satzes von Nukleinsäuresonden wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % Sequenzübereinstimmung, wenigstens etwa 95 % Sequenzübereinstimmung oder etwa 100 % Sequenzübereinstimmung mit einer aus Tabelle 6 ausgewählten Sondensequenz aufweist.
  66. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei der Satz von Nukleinsäuresonden wenigstens etwa 5 %, wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 % oder wenigstens etwa 90 % der Sondensequenzen in Tabelle 6 umfasst.
  67. Verfahren nach einem beliebigen der vorstehenden Ansprüche, ferner umfassend die Bestimmung, dass der Proband die Erkrankung hat oder die Bestimmung eines Grades oder Status der Erkrankung des Subjekts, basierend auf dem identifizierten einen oder den identifizierten mehreren zellfreien Nukleinsäuremolekülen, die die Vielzahl von Phasenvarianten umfassen.
  68. Verfahren nach Anspruch 67, ferner umfassend das Bestimmen, dass das eine oder die mehreren zellfreien Nukleinsäuremoleküle aus einer mit der Erkrankung assoziierten Probe abgeleitet ist/sind, basierend auf der Durchführung einer statistischen Modellanalyse des identifizierten einen oder der identifizierten mehreren zellfreien Nukleinsäuremoleküle.
  69. Verfahren nach Anspruch 68, wobei die statistische Modellanalyse eine statistische Monte-Carlo-Analyse umfasst.
  70. Verfahren nach einem beliebigen der vorstehenden Ansprüche, ferner umfassend die Überwachung eines Verlaufs der Erkrankung des Subjekts basierend auf dem identifizierten einen oder den identifizierten mehreren zellfreien Nukleinsäuremolekülen.
  71. Verfahren nach einem beliebigen der vorstehenden Ansprüche, ferner umfassend die Durchführung eines anderen Verfahrens zur Bestätigung der Erkrankung des Subjekts.
  72. Verfahren nach Anspruch 71, wobei das andere Verfahren einen Bluttest, einen Gentest, eine medizinische Bildgebung, eine körperliche Untersuchung oder eine Gewebebiopsie umfasst.
  73. Verfahren nach einem beliebigen der vorstehenden Ansprüche, ferner umfassend die Bestimmung einer Behandlung für die Erkrankung des Subjekts basierend auf dem identifizierten einen oder den identifizierten mehreren zellfreien Nukleinsäuremolekülen.
  74. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei der Proband vor (a) einer Behandlung der Erkrankung unterzogen wurde.
  75. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Behandlung Chemotherapie, Radiotherapie, Chemoradiotherapie, Immuntherapie, adoptive Zelltherapie, Hormontherapie, gezielte Arzneimitteltherapie, Operation, Transplantation, Transfusion oder medizinische Überwachung umfasst.
  76. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Vielzahl der zellfreien Nukleinsäuremoleküle eine Vielzahl von zellfreien Desoxyribonukleinsäuremolekülen (DNA-Molekülen) umfasst.
  77. Das Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Erkrankung eine Erkrankung umfasst.
  78. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Vielzahl der zellfreien Nukleinsäuremoleküle von einer Körperprobe des Subjekts abgeleitet ist.
  79. Verfahren nach Anspruch 78, wobei die Körperprobe Plasma, Serum, Blut, Liquor, Lymphflüssigkeit, Speichel, Urin oder Stuhl umfasst.
  80. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei der Proband ein Säugetier ist.
  81. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei der Proband ein Mensch ist.
  82. Das Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Erkrankung ein Neoplasma, Krebs oder einen Tumor umfasst.
  83. Verfahren nach Anspruch 82, wobei die Erkrankung einen soliden Tumor umfasst.
  84. Verfahren nach Anspruch 82, wobei die Erkrankung ein Lymphom umfasst.
  85. Verfahren nach Anspruch 84, wobei die Erkrankung ein B-Zell-Lymphom umfasst.
  86. Verfahren nach Anspruch 85, wobei die Erkrankung einen Untertyp des B-Zell-Lymphoms, ausgewählt aus der Gruppe bestehend aus diffusem großzelligem B-Zell-Lymphom, follikulärem Lymphom, Burkitt-Lymphom und chronische lymphatische B-Zell-Leukämie, umfasst.
  87. Verfahren nach einem beliebigen der vorstehenden Ansprüche, wobei die Vielzahl der Phasenvarianten zuvor durch Sequenzierung einer früheren Tumorprobe oder einer zellfreien Nukleinsäureprobe als tumorabgeleitet identifiziert wurde.
  88. Zusammensetzung, die einen Ködersatz umfasst, der einen Satz von Nukleinsäuresonden umfasst, die zum Erfassen von zellfreien DNA-Molekülen konzipiert sind, die von wenigstens etwa 5 % der Genombereiche, die von in (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen aufgeführt sind, abgeleitet sind.
  89. Zusammensetzung nach Anspruch 88, wobei der Satz von Nukleinsäuresonden für das Pull-Down von zellfreien DNA-Molekülen ausgelegt ist, die von wenigstens etwa 10 %, wenigstens etwa 20 %, wenigstens etwa 30 %, wenigstens etwa 40 %, wenigstens etwa 50 %, wenigstens etwa 60 %, wenigstens etwa 70 %, wenigstens etwa 80 %, wenigstens etwa 90 % oder etwa 100 % von in (i) der in Tabelle 1 identifizierten Genombereiche, (ii) der in Tabelle 3 identifizierten Genombereiche oder (iii) der in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereiche festgelegten Genombereichen abgeleitet sind.
  90. Zusammensetzung nach einem der Ansprüche 88-89, wobei der Satz von Nukleinsäuresonden zum Erfassen des einen oder der mehreren zellfreien DNA-Molekülen ausgelegt ist, die von höchstens etwa 10 %, höchstens etwa 20 %, höchstens etwa 30 %, höchstens etwa 40 %, höchstens etwa 50 %, höchstens etwa 60 %, höchstens etwa 70 %, höchstens etwa 80 %, höchstens etwa 90 % oder etwa 100 % von in (i) der in Tabelle 1 identifizierten Genombereiche, (ii) der in Tabelle 3 identifizierten Genombereiche oder (iii) der in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereiche festgelegten Genombereichen abgeleitet sind.
  91. Zusammensetzung nach einem beliebigen der Ansprüche 88 bis 90, wobei der Ködersatz höchstens 5, höchstens 10, höchstens 50, höchstens 100, höchstens 500, höchstens 1000 oder höchstens 2000 Nukleinsäuresonden umfasst.
  92. Zusammensetzung nach einem der Ansprüche 88 bis 91, wobei eine individuelle Nukleinsäuresonde des Nukleinsäuresondensatzes einen Pull-Down-Tag umfasst.
  93. Zusammensetzung nach einem beliebigen der Ansprüche 88 bis 92, wobei der Pull-Down-Tag einen Nukleinsäure-Barcode umfasst.
  94. Zusammensetzung nach einem beliebigen der Ansprüche 88 bis 93, wobei der Pull-Down-Tag Biotin umfasst.
  95. Zusammensetzung nach einem der Ansprüche 88 bis 94, wobei jedes der zellfreien DNA-Moleküle zwischen etwa 100 Nukleotiden und etwa 180 Nukleotiden lang ist.
  96. Zusammensetzung nach einem beliebigen der Ansprüche 88 bis 95, wobei die Genombereiche mit einer Erkrankung assoziiert sind.
  97. Zusammensetzung nach einem der Ansprüche 88 bis 96, wobei die Genombereiche eine aberrante somatische Hypermutation aufweisen, wenn ein Proband die Erkrankung hat.
  98. Zusammensetzung nach einem der Ansprüche 88 bis 97, wobei die Erkrankung ein B-Zell-Lymphom umfasst.
  99. Zusammensetzung nach Anspruch 98, wobei die Erkrankung eine Unterart des B-Zell-Lymphoms, die ausgewählt ist aus der Gruppe bestehend aus diffusem großzelligem B-Zell-Lymphom, follikulärem Lymphom, Burkitt-Lymphom und chronisch lymphatischer B-Zell-Leukämie umfasst.
  100. Zusammensetzung nach einem der Ansprüche 88 bis 99, ferner umfassend eine Vielzahl zellfreier DNA-Moleküle, die von einem Subjekt erlangt oder abgeleitet wurden.
  101. Verfahren zur Durchführung eines klinischen Verfahrens bei einem Individuum, das Verfahren umfassend: erlangen oder erlangt haben eines gezielten Sequenzierungsergebnisses einer Sammlung zellfreier Nukleinsäuremoleküle, wobei die Sammlung zellfreier Nukleinsäuremoleküle aus einer Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums stammt, und wobei die gezielte Sequenzierung unter Verwendung von Nukleinsäuresonden zum Herunterziehen von Sequenzen genomischer Loci durchgeführt wird, von denen bekannt ist, dass sie eine aberrante somatische Hypermutation in einem B-Zell-Krebs aufweisen; Identifizieren einer identifiziert haben einer Vielzahl von Varianten in Phase innerhalb des zellfreien Nukleinsäure-Sequenzierungsergebnisses; bestimmen oder bestimmt haben, unter Verwendung eines statistischen Modells und der identifizierten Phasenvarianten, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleotide enthält, die von einem Neoplasma abgeleitet sind; und Durchführen eines klinischen Verfahrens an dem Individuum zur Bestätigung des Vorhandenseins des B-Zell-Krebses, basierend auf der Bestimmung, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleinsäuresequenzen enthält, die wahrscheinlich von dem B-Zell-Krebs abgeleitet sind.
  102. Verfahren nach Anspruch 101, wobei die Biopsie eine von Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl ist.
  103. Verfahren nach Anspruch 101, wobei die genomischen Loci ausgewählt sind aus (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen.
  104. Verfahren nach Anspruch 101, wobei die Sequenzen der Nukleinsäuresonden aus Tabelle 6 ausgewählt sind.
  105. Verfahren nach Anspruch 101, wobei das klinische Verfahren ein Bluttest, eine medizinische Bildgebung oder eine körperliche Untersuchung ist.
  106. Verfahren zur Behandlung eines Individuums gegen einen B-Zellen-Krebs, das Verfahren umfassend: erlangen oder erlangt haben eines gezielten Sequenzierungsergebnisses einer Sammlung zellfreier Nukleinsäuremoleküle, wobei die Sammlung zellfreier Nukleinsäuremoleküle aus einer Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums stammt, und wobei die gezielte Sequenzierung unter Verwendung von Nukleinsäuresonden zum Herunterziehen von Sequenzen genomischer Loci durchgeführt wird, von denen bekannt ist, dass sie eine aberrante somatische Hypermutation in einem B-Zell-Krebs aufweisen; Identifizieren einer identifiziert haben einer Vielzahl von Varianten in Phase innerhalb des zellfreien Nukleinsäure-Sequenzierungsergebnisses; bestimmen oder bestimmt haben, unter Verwendung eines statistischen Modells und der identifizierten Phasenvarianten, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleotide enthält, die von einem Neoplasma abgeleitet sind; und die Behandlung des Individuums zur Eindämmung des B-Zell-Krebses, basierend auf der Bestimmung, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleinsäuresequenzen enthält, die von dem B-Zell-Krebs abgeleitet sind.
  107. Verfahren nach Anspruch 106, wobei die Biopsie eine von Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl ist.
  108. Verfahren nach Anspruch 106, wobei die genomischen Loci ausgewählt sind aus (i) den in Tabelle 1 identifizierten Genombereichen, (ii) den in Tabelle 3 identifizierten Genombereichen oder (iii) den in Tabelle 3 als eine Vielzahl von Phasenvarianten aufweisend identifizierten Genombereichen.
  109. Verfahren nach Anspruch 106, wobei die Sequenzen der Nukleinsäuresonden aus Tabelle 6 ausgewählt sind.
  110. Verfahren nach Anspruch 106, wobei die Behandlung eine Chemotherapie, Strahlentherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie oder medizinische Überwachung ist.
  111. Verfahren zum Nachweis einer kanzerogenen minimalen Restkrankheit bei einem Individuum und zur Behandlung des Individuums gegen Krebs, das Verfahren umfassend: erlangen oder erlangt haben eines gezielten Sequenzierungsergebnisses einer Sammlung zellfreier Nukleinsäuremoleküle, wobei die Sammlung zellfreier Nukleinsäuremoleküle aus einer Flüssigkeits- oder Ausscheidungsbiopsie eines Individuums erlangt wird, wobei die Flüssigkeits- oder Ausscheidungsbiopsie nach einer Reihe von Behandlungen zum Nachweis einer minimalen Restkrankheit entnommen wird, und wobei die gezielte Sequenzierung unter Verwendung von Nukleinsäuresonden zum Herunterziehen von Sequenzen genomischer Loci durchgeführt wird, von denen bestimmt wurde, dass sie eine Vielzahl von Varianten in Phase enthalten, wie durch ein früheres Sequenzierungsergebnis an einer früheren von dem Krebs abgeleiteten Biopsie bestimmt; Identifizieren einer identifiziert haben wenigstens eines Satzes der Vielzahl von Varianten in Phase innerhalb des zellfreien Nukleinsäure-Sequenzierungsergebnisses; und die Behandlung des Individuums zur Eindämmung des B-Zell-Krebses, basierend auf der Bestimmung, dass das Ergebnis der zellfreien Nukleinsäure-Sequenzierung Nukleinsäuresequenzen enthält, die von dem Krebs abgeleitet sind.
  112. Verfahren nach Anspruch 111, wobei die Flüssigkeits- oder Abfallbiopsie eine von Blut, Serum, Liquor, Lymphflüssigkeit, Urin oder Stuhl ist.
  113. Verfahren nach Anspruch 111, wobei die Behandlung eine Chemotherapie, Strahlentherapie, Immuntherapie, Hormontherapie, gezielte Arzneimitteltherapie oder medizinische Überwachung ist.
  114. Computerprogrammprodukt, umfassend ein nichtflüchtiges, computerlesbares Medium mit darin codiertem, computerausführbarem Code, wobei der computerausführbare Code zur Ausführung zur Implementierung eines Verfahrens nach einem beliebigen der vorstehenden Ansprüche geeignet ist.
  115. System, umfassend einen oder mehrere Computerprozessoren und einen damit gekoppelten Computerspeicher, wobei der Computerspeicher einen maschinenausführbaren Code umfasst, der bei Ausführung durch den einen oder die mehreren Computerprozessoren ein Verfahren nach einem beliebigen der vorstehenden Ansprüche implementiert.
DE112020005433.0T 2019-11-06 2020-11-06 Verfahren und Systeme zur Analyse von Nukleinsäuremolekülen Pending DE112020005433T5 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962931688P 2019-11-06 2019-11-06
US62/931,688 2019-11-06
PCT/US2020/059526 WO2021092476A1 (en) 2019-11-06 2020-11-06 Methods and systems for analyzing nucleic acid molecules

Publications (1)

Publication Number Publication Date
DE112020005433T5 true DE112020005433T5 (de) 2022-10-06

Family

ID=75848071

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112020005433.0T Pending DE112020005433T5 (de) 2019-11-06 2020-11-06 Verfahren und Systeme zur Analyse von Nukleinsäuremolekülen

Country Status (12)

Country Link
US (14) US20210172022A1 (de)
EP (2) EP4365309A2 (de)
JP (2) JP2023501376A (de)
KR (1) KR20220094218A (de)
CN (1) CN113383085A (de)
AU (1) AU2020378435A1 (de)
BR (1) BR112022008752A2 (de)
CA (1) CA3156589A1 (de)
DE (1) DE112020005433T5 (de)
GB (4) GB2613427B (de)
MX (1) MX2022005588A (de)
WO (1) WO2021092476A1 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11613787B2 (en) 2019-11-06 2023-03-28 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for analyzing nucleic acid molecules
US11783912B2 (en) 2021-05-05 2023-10-10 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for analyzing nucleic acid molecules

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023114426A1 (en) * 2021-12-15 2023-06-22 The Johns Hopkins University Single molecule genome- wide mutation and fragmentation profiles of cell-free dna
CN114974421B (zh) * 2022-05-20 2024-04-30 南开大学 基于扩散-降噪的单细胞转录组测序数据补插方法及系统
KR20230172174A (ko) * 2022-06-15 2023-12-22 주식회사 지씨지놈 무세포 핵산의 단일염기변이를 이용한 암 진단 및 암 종 예측방법
GB202212094D0 (en) * 2022-08-19 2022-10-05 Inivata Ltd Method of detecting cancer DNA in a sample
KR102630597B1 (ko) * 2023-08-22 2024-01-29 주식회사 지놈인사이트테크놀로지 종양 정보를 활용한 미세 잔존 질환 탐지 방법 및 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA188298A (en) 1918-04-08 1919-01-14 William H. Bot Grain separator
CA233975A (en) 1923-09-04 Rightmire Franklin Anti-skid chain tightener
CA241076A (en) 1924-06-24 Carter Formby King Otis Calculating apparatus
US5804396A (en) 1994-10-12 1998-09-08 Sugen, Inc. Assay for agents active in proliferative disorders

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6171856B1 (en) 1997-07-30 2001-01-09 Board Of Regents, The University Of Texas System Methods and compositions relating to no-mediated cytotoxicity
DE10032165A1 (de) 2000-07-01 2002-01-10 Beiersdorf Ag Verwendung von physiologisch verträglichen Sulfinsäuren als Antioxidans oder Radikalfänger in kosmetischen oder dermatologischen Zubereitungen
NZ532780A (en) 2001-12-21 2006-10-27 Wellcome Trust Isolated naturally occurring mutant human B-Raf polypeptides and nucleic acids encoding them
BRPI0508286B8 (pt) 2004-03-31 2021-05-25 Dana Farber Cancer Inst Inc método para determinar a probabilidade de eficácia de um inibidor da tirosina quinase egfr para tratar câncer, uso de um inibidor da tirosina quinase de egfr, sonda, kit, e, par de iniciadores
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
EP2536854B1 (de) 2010-02-18 2017-07-19 The Johns Hopkins University Personalisierte tumor-biomarker
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
ES2523140T3 (es) 2010-09-21 2014-11-21 Population Genetics Technologies Ltd. Aumento de la confianza en las identificaciones de alelos con el recuento molecular
KR20210131432A (ko) 2010-12-30 2021-11-02 파운데이션 메디신 인코포레이티드 종양 샘플의 다유전자 분석의 최적화
ES2625288T3 (es) 2011-04-15 2017-07-19 The Johns Hopkins University Sistema de secuenciación segura
LT3363901T (lt) 2012-02-17 2021-04-12 Fred Hutchinson Cancer Research Center Kompozicijos ir būdai, skirti tiksliam mutacijų nustatymui
ES2828661T3 (es) 2012-03-20 2021-05-27 Univ Washington Through Its Center For Commercialization Métodos para reducir la tasa de error de la secuenciación de ADN masiva en paralelo mediante el uso de la secuenciación de secuencia consenso bicatenaria
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
SG11201501662TA (en) 2012-09-04 2015-05-28 Guardant Health Inc Systems and methods to detect rare mutations and copy number variation
US9128861B2 (en) 2013-01-17 2015-09-08 Personalis, Inc. Methods and systems for genetic analysis
EP2971152B1 (de) 2013-03-15 2018-08-01 The Board Of Trustees Of The Leland Stanford Junior University Identifikation und verwendung von zirkulierenden nukleinsäure-tumormarkern
EP3524694B1 (de) 2013-12-28 2020-07-15 Guardant Health, Inc. Verfahren und systeme für den nachweis genetischer varianten
EP3957749A1 (de) 2014-04-21 2022-02-23 Natera, Inc. Nachweis von tumorspezifischen mutationen in biopsien mittels sequenzierung des gesamten exoms und in zellfreien proben
EP4170044A1 (de) * 2014-06-06 2023-04-26 Cornell University Verfahren zur identifizierung und zählung von nukleinsäuresequenz-, expressions-, kopie- oder dna-methylierungsänderungen mit kombinierten nuklease-, ligase-, polymerase- und sequenzierungsreaktionen
EP3161162A4 (de) * 2014-06-26 2018-01-10 10X Genomics, Inc. Analyse von nukleinsäuresequenzen
CN107075730A (zh) 2014-09-12 2017-08-18 利兰·斯坦福青年大学托管委员会 循环核酸的鉴定及用途
SG11201803289VA (en) 2015-10-19 2018-05-30 Dovetail Genomics Llc Methods for genome assembly, haplotype phasing, and target independent nucleic acid detection
CA3006792A1 (en) 2015-12-08 2017-06-15 Twinstrand Biosciences, Inc. Improved adapters, methods, and compositions for duplex sequencing
WO2017161175A1 (en) * 2016-03-16 2017-09-21 Dana-Farber Cancer Institute, Inc. Methods for genome characterization
EP3465501A4 (de) 2016-05-27 2020-02-26 Personalis, Inc. Personalisierte gentests
US11299783B2 (en) 2016-05-27 2022-04-12 Personalis, Inc. Methods and systems for genetic analysis
US9850523B1 (en) 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
CN110072989A (zh) 2016-10-24 2019-07-30 生物马特里卡公司 核酸在纸上的稳定化
US11342047B2 (en) * 2017-04-21 2022-05-24 Illumina, Inc. Using cell-free DNA fragment size to detect tumor-associated variant
US11542540B2 (en) 2017-06-16 2023-01-03 Life Technologies Corporation Control nucleic acids, and compositions, kits, and uses thereof
CN111278276B (zh) 2017-06-28 2023-05-26 美国陶氏益农公司 用于转基因表达的植物启动子
CN109337983A (zh) * 2018-11-29 2019-02-15 优葆优保健康科技(宁波)有限公司 检测人甲状腺癌循环肿瘤dna的探针组合及其捕获测序系统
EP4353834A3 (de) * 2019-01-25 2024-05-01 Grail, LLC Nachweis von nukleinsäuren aus zellen eines krebstyps
US20220170108A1 (en) * 2019-04-05 2022-06-02 Genopsy, Inc. Method for diagnosing cancer using cfdna
WO2021003485A1 (en) 2019-07-03 2021-01-07 The Board Of Trustees Of The Leland Stanford Junior University Methods to assess clinical outcome based upon updated probabilities and treatments thereof
GB2613427B (en) 2019-11-06 2024-01-17 Univ Leland Stanford Junior Methods and Systems for Analyzing Nucleic Acid Molecules
WO2021173722A2 (en) 2020-02-24 2021-09-02 The Board Of Trustees Of The Leland Stanford Junior University Methods of analyzing cell free nucleic acids and applications thereof
US11783912B2 (en) 2021-05-05 2023-10-10 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for analyzing nucleic acid molecules
AU2022271320A1 (en) 2021-05-05 2023-11-02 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for analyzing nucleic acid molecules

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA233975A (en) 1923-09-04 Rightmire Franklin Anti-skid chain tightener
CA241076A (en) 1924-06-24 Carter Formby King Otis Calculating apparatus
CA188298A (en) 1918-04-08 1919-01-14 William H. Bot Grain separator
US5804396A (en) 1994-10-12 1998-09-08 Sugen, Inc. Assay for agents active in proliferative disorders

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11613787B2 (en) 2019-11-06 2023-03-28 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for analyzing nucleic acid molecules
US11634779B2 (en) 2019-11-06 2023-04-25 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for analyzing nucleic acid molecules
US11851716B2 (en) 2019-11-06 2023-12-26 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for analyzing nucleic acid molecules
US11965215B2 (en) 2019-11-06 2024-04-23 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for analyzing nucleic acid molecules
US11783912B2 (en) 2021-05-05 2023-10-10 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for analyzing nucleic acid molecules

Also Published As

Publication number Publication date
AU2020378435A1 (en) 2022-05-26
US11447833B2 (en) 2022-09-20
GB2623904A (en) 2024-05-01
US20220389518A1 (en) 2022-12-08
US20210172022A1 (en) 2021-06-10
EP4055187A1 (de) 2022-09-14
EP4365309A2 (de) 2024-05-08
US20220208303A1 (en) 2022-06-30
CA3156589A1 (en) 2021-05-14
US20240035095A1 (en) 2024-02-01
JP2024028940A (ja) 2024-03-05
JP2023501376A (ja) 2023-01-18
US20240175088A1 (en) 2024-05-30
US20230250485A1 (en) 2023-08-10
WO2021092476A1 (en) 2021-05-14
GB202404419D0 (en) 2024-05-08
US11634779B2 (en) 2023-04-25
US20230203597A1 (en) 2023-06-29
GB2613427B (en) 2024-01-17
MX2022005588A (es) 2022-08-16
US20220340980A1 (en) 2022-10-27
US20240026460A1 (en) 2024-01-25
GB2595193B (en) 2022-10-12
GB2613427A (en) 2023-06-07
CN113383085A (zh) 2021-09-10
GB202212061D0 (en) 2022-10-05
US20210366571A1 (en) 2021-11-25
US11851716B2 (en) 2023-12-26
GB202112217D0 (en) 2021-10-13
EP4055187A4 (de) 2023-11-01
US11613787B2 (en) 2023-03-28
US20220251664A1 (en) 2022-08-11
KR20220094218A (ko) 2022-07-05
US11965215B2 (en) 2024-04-23
GB202318607D0 (en) 2024-01-17
US20230183816A1 (en) 2023-06-15
US20230124070A1 (en) 2023-04-20
BR112022008752A2 (pt) 2022-08-16
US20220139497A1 (en) 2022-05-05
GB2595193A (en) 2021-11-17

Similar Documents

Publication Publication Date Title
DE112020005433T5 (de) Verfahren und Systeme zur Analyse von Nukleinsäuremolekülen
EP2794907B1 (de) Verfahren und materialien zur bewertung des verlusts der heterozygotie
DE112018002990T5 (de) Systeme und verfahren zum erzeugen, visualisieren und klassifizieren von molekularen funktionellen profilen
Lin et al. Comparison of solid tissue sequencing and liquid biopsy accuracy in identification of clinically relevant gene mutations and rearrangements in lung adenocarcinomas
AU2022271320A1 (en) Methods and systems for analyzing nucleic acid molecules
US20240105281A1 (en) Methods and Systems for Analyzing Nucleic Acid Molecules
Affolter et al. Detection of circulating tumor DNA without a tumor-informed search using next-generation sequencing is a prognostic biomarker in pancreatic ductal adenocarcinoma
WO2023284736A1 (en) Biomarkers for colorectal cancer treatment
WO2023109876A1 (en) Biomarkers for colorectal cancer treatment
WO2023125787A1 (en) Biomarkers for colorectal cancer treatment
Kuligina et al. 1197P Changes in the concentration of EGFR-mutated (EGFR-M+) plasma DNA in the first hours of TKI therapy allow the prediction of tumour response in patients with EGFR-M+ NSCLC
DE102021126650A1 (de) Verfahren zur bestimmung der ansprechwahrscheinlichkeit einer malignen erkrankung auf eine behandlung mit einem pharmazeutischen hemmwirkstoff

Legal Events

Date Code Title Description
R012 Request for examination validly filed