JP2024010242A - 遺伝的バリアントを検出するための方法およびシステム - Google Patents
遺伝的バリアントを検出するための方法およびシステム Download PDFInfo
- Publication number
- JP2024010242A JP2024010242A JP2023192893A JP2023192893A JP2024010242A JP 2024010242 A JP2024010242 A JP 2024010242A JP 2023192893 A JP2023192893 A JP 2023192893A JP 2023192893 A JP2023192893 A JP 2023192893A JP 2024010242 A JP2024010242 A JP 2024010242A
- Authority
- JP
- Japan
- Prior art keywords
- polynucleotide
- sequence
- tagged
- sequencing
- molecules
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title abstract description 278
- 230000002068 genetic effect Effects 0.000 title abstract description 80
- 102000040430 polynucleotide Human genes 0.000 abstract description 624
- 108091033319 polynucleotide Proteins 0.000 abstract description 624
- 239000002157 polynucleotide Substances 0.000 abstract description 624
- 238000012163 sequencing technique Methods 0.000 abstract description 205
- 230000000295 complement effect Effects 0.000 abstract description 80
- 238000013507 mapping Methods 0.000 abstract description 23
- 102000053602 DNA Human genes 0.000 description 217
- 108020004414 DNA Proteins 0.000 description 217
- 239000000523 sample Substances 0.000 description 180
- 239000012634 fragment Substances 0.000 description 171
- 239000002773 nucleotide Substances 0.000 description 124
- 125000003729 nucleotide group Chemical group 0.000 description 124
- 150000007523 nucleic acids Chemical class 0.000 description 91
- 102000039446 nucleic acids Human genes 0.000 description 79
- 108020004707 nucleic acids Proteins 0.000 description 79
- 230000003321 amplification Effects 0.000 description 76
- 238000003199 nucleic acid amplification method Methods 0.000 description 76
- 108090000623 proteins and genes Proteins 0.000 description 74
- 238000012360 testing method Methods 0.000 description 72
- 206010028980 Neoplasm Diseases 0.000 description 62
- 108091035707 Consensus sequence Proteins 0.000 description 55
- 238000006243 chemical reaction Methods 0.000 description 48
- 210000004027 cell Anatomy 0.000 description 43
- 238000003752 polymerase chain reaction Methods 0.000 description 39
- 201000011510 cancer Diseases 0.000 description 34
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 29
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 29
- 230000015654 memory Effects 0.000 description 23
- 108091034117 Oligonucleotide Proteins 0.000 description 22
- 238000001514 detection method Methods 0.000 description 20
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 20
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 20
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 20
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 20
- 239000000047 product Substances 0.000 description 20
- -1 KIT Proteins 0.000 description 19
- 201000010099 disease Diseases 0.000 description 19
- 101000779418 Homo sapiens RAC-alpha serine/threonine-protein kinase Proteins 0.000 description 18
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 18
- 102100033810 RAC-alpha serine/threonine-protein kinase Human genes 0.000 description 18
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 18
- 238000003860 storage Methods 0.000 description 18
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 17
- 102100030708 GTPase KRas Human genes 0.000 description 16
- 238000004891 communication Methods 0.000 description 16
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 15
- 102000001759 Notch1 Receptor Human genes 0.000 description 15
- 108010029755 Notch1 Receptor Proteins 0.000 description 15
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 15
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 15
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 15
- 102100034580 AT-rich interactive domain-containing protein 1A Human genes 0.000 description 14
- 102000036365 BRCA1 Human genes 0.000 description 14
- 108700020463 BRCA1 Proteins 0.000 description 14
- 101150072950 BRCA1 gene Proteins 0.000 description 14
- 101001042041 Bos taurus Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Proteins 0.000 description 14
- 101710098191 C-4 methylsterol oxidase ERG25 Proteins 0.000 description 14
- 102100028914 Catenin beta-1 Human genes 0.000 description 14
- 108091007854 Cdh1/Fizzy-related Proteins 0.000 description 14
- 102000038594 Cdh1/Fizzy-related Human genes 0.000 description 14
- 108010058546 Cyclin D1 Proteins 0.000 description 14
- 108010025464 Cyclin-Dependent Kinase 4 Proteins 0.000 description 14
- 108010025468 Cyclin-Dependent Kinase 6 Proteins 0.000 description 14
- 102000009512 Cyclin-Dependent Kinase Inhibitor p15 Human genes 0.000 description 14
- 108010009356 Cyclin-Dependent Kinase Inhibitor p15 Proteins 0.000 description 14
- 108010009392 Cyclin-Dependent Kinase Inhibitor p16 Proteins 0.000 description 14
- 102100036252 Cyclin-dependent kinase 4 Human genes 0.000 description 14
- 102100026804 Cyclin-dependent kinase 6 Human genes 0.000 description 14
- 102100024458 Cyclin-dependent kinase inhibitor 2A Human genes 0.000 description 14
- 102100028843 DNA mismatch repair protein Mlh1 Human genes 0.000 description 14
- 102100023266 Dual specificity mitogen-activated protein kinase kinase 2 Human genes 0.000 description 14
- 102100028138 F-box/WD repeat-containing protein 7 Human genes 0.000 description 14
- 101710105178 F-box/WD repeat-containing protein 7 Proteins 0.000 description 14
- 102100023600 Fibroblast growth factor receptor 2 Human genes 0.000 description 14
- 101710182389 Fibroblast growth factor receptor 2 Proteins 0.000 description 14
- 102100027842 Fibroblast growth factor receptor 3 Human genes 0.000 description 14
- 101710182396 Fibroblast growth factor receptor 3 Proteins 0.000 description 14
- 102100024165 G1/S-specific cyclin-D1 Human genes 0.000 description 14
- 102100024185 G1/S-specific cyclin-D2 Human genes 0.000 description 14
- 102100037858 G1/S-specific cyclin-E1 Human genes 0.000 description 14
- 102100027541 GTP-binding protein Rheb Human genes 0.000 description 14
- 102100029974 GTPase HRas Human genes 0.000 description 14
- 102100039788 GTPase NRas Human genes 0.000 description 14
- 102100025334 Guanine nucleotide-binding protein G(q) subunit alpha Human genes 0.000 description 14
- 102100032610 Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Human genes 0.000 description 14
- 102100036738 Guanine nucleotide-binding protein subunit alpha-11 Human genes 0.000 description 14
- 102100022057 Hepatocyte nuclear factor 1-alpha Human genes 0.000 description 14
- 102100038970 Histone-lysine N-methyltransferase EZH2 Human genes 0.000 description 14
- 101000924266 Homo sapiens AT-rich interactive domain-containing protein 1A Proteins 0.000 description 14
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 14
- 101000967216 Homo sapiens Eosinophil cationic protein Proteins 0.000 description 14
- 101000980741 Homo sapiens G1/S-specific cyclin-D2 Proteins 0.000 description 14
- 101000738568 Homo sapiens G1/S-specific cyclin-E1 Proteins 0.000 description 14
- 101000584633 Homo sapiens GTPase HRas Proteins 0.000 description 14
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 14
- 101000857888 Homo sapiens Guanine nucleotide-binding protein G(q) subunit alpha Proteins 0.000 description 14
- 101001014590 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms XLas Proteins 0.000 description 14
- 101001014594 Homo sapiens Guanine nucleotide-binding protein G(s) subunit alpha isoforms short Proteins 0.000 description 14
- 101001072407 Homo sapiens Guanine nucleotide-binding protein subunit alpha-11 Proteins 0.000 description 14
- 101001045751 Homo sapiens Hepatocyte nuclear factor 1-alpha Proteins 0.000 description 14
- 101000882127 Homo sapiens Histone-lysine N-methyltransferase EZH2 Proteins 0.000 description 14
- 101000960234 Homo sapiens Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 description 14
- 101000599886 Homo sapiens Isocitrate dehydrogenase [NADP], mitochondrial Proteins 0.000 description 14
- 101000916644 Homo sapiens Macrophage colony-stimulating factor 1 receptor Proteins 0.000 description 14
- 101001014610 Homo sapiens Neuroendocrine secretory protein 55 Proteins 0.000 description 14
- 101000605639 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Proteins 0.000 description 14
- 101000797903 Homo sapiens Protein ALEX Proteins 0.000 description 14
- 101000579425 Homo sapiens Proto-oncogene tyrosine-protein kinase receptor Ret Proteins 0.000 description 14
- 101000712530 Homo sapiens RAF proto-oncogene serine/threonine-protein kinase Proteins 0.000 description 14
- 101000932478 Homo sapiens Receptor-type tyrosine-protein kinase FLT3 Proteins 0.000 description 14
- 101000799466 Homo sapiens Thrombopoietin receptor Proteins 0.000 description 14
- 101000823316 Homo sapiens Tyrosine-protein kinase ABL1 Proteins 0.000 description 14
- 101000997832 Homo sapiens Tyrosine-protein kinase JAK2 Proteins 0.000 description 14
- 101000934996 Homo sapiens Tyrosine-protein kinase JAK3 Proteins 0.000 description 14
- 101001125402 Homo sapiens Vitamin K-dependent protein C Proteins 0.000 description 14
- 102100039905 Isocitrate dehydrogenase [NADP] cytoplasmic Human genes 0.000 description 14
- 102100037845 Isocitrate dehydrogenase [NADP], mitochondrial Human genes 0.000 description 14
- 102000003960 Ligases Human genes 0.000 description 14
- 108090000364 Ligases Proteins 0.000 description 14
- 108010068353 MAP Kinase Kinase 2 Proteins 0.000 description 14
- 102100028198 Macrophage colony-stimulating factor 1 receptor Human genes 0.000 description 14
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 14
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 description 14
- 108010026664 MutL Protein Homolog 1 Proteins 0.000 description 14
- 102000007530 Neurofibromin 1 Human genes 0.000 description 14
- 108010085793 Neurofibromin 1 Proteins 0.000 description 14
- 102100038332 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit alpha isoform Human genes 0.000 description 14
- 102100028286 Proto-oncogene tyrosine-protein kinase receptor Ret Human genes 0.000 description 14
- 102100033479 RAF proto-oncogene serine/threonine-protein kinase Human genes 0.000 description 14
- 101150020518 RHEB gene Proteins 0.000 description 14
- 102100020718 Receptor-type tyrosine-protein kinase FLT3 Human genes 0.000 description 14
- 201000000582 Retinoblastoma Diseases 0.000 description 14
- 102000001332 SRC Human genes 0.000 description 14
- 108060006706 SRC Proteins 0.000 description 14
- 102000013380 Smoothened Receptor Human genes 0.000 description 14
- 101710090597 Smoothened homolog Proteins 0.000 description 14
- 102100034196 Thrombopoietin receptor Human genes 0.000 description 14
- 102100022596 Tyrosine-protein kinase ABL1 Human genes 0.000 description 14
- 102100033444 Tyrosine-protein kinase JAK2 Human genes 0.000 description 14
- 102100025387 Tyrosine-protein kinase JAK3 Human genes 0.000 description 14
- 108010053099 Vascular Endothelial Growth Factor Receptor-2 Proteins 0.000 description 14
- 102100033177 Vascular endothelial growth factor receptor 2 Human genes 0.000 description 14
- 102100029477 Vitamin K-dependent protein C Human genes 0.000 description 14
- 230000008569 process Effects 0.000 description 14
- 238000011282 treatment Methods 0.000 description 14
- 102100033793 ALK tyrosine kinase receptor Human genes 0.000 description 13
- 102000000872 ATM Human genes 0.000 description 13
- 102100034540 Adenomatous polyposis coli protein Human genes 0.000 description 13
- 108010004586 Ataxia Telangiectasia Mutated Proteins Proteins 0.000 description 13
- 102000052609 BRCA2 Human genes 0.000 description 13
- 108700020462 BRCA2 Proteins 0.000 description 13
- 101150008921 Brca2 gene Proteins 0.000 description 13
- ZEOWTGPWHLSLOG-UHFFFAOYSA-N Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F Chemical compound Cc1ccc(cc1-c1ccc2c(n[nH]c2c1)-c1cnn(c1)C1CC1)C(=O)Nc1cccc(c1)C(F)(F)F ZEOWTGPWHLSLOG-UHFFFAOYSA-N 0.000 description 13
- 102100031480 Dual specificity mitogen-activated protein kinase kinase 1 Human genes 0.000 description 13
- 102100023593 Fibroblast growth factor receptor 1 Human genes 0.000 description 13
- 101710182386 Fibroblast growth factor receptor 1 Proteins 0.000 description 13
- 102100025477 GTP-binding protein Rit1 Human genes 0.000 description 13
- 101000574654 Homo sapiens GTP-binding protein Rit1 Proteins 0.000 description 13
- 101000596894 Homo sapiens High affinity nerve growth factor receptor Proteins 0.000 description 13
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 description 13
- 101001109719 Homo sapiens Nucleophosmin Proteins 0.000 description 13
- 101001126417 Homo sapiens Platelet-derived growth factor receptor alpha Proteins 0.000 description 13
- 101000686031 Homo sapiens Proto-oncogene tyrosine-protein kinase ROS Proteins 0.000 description 13
- 101000742859 Homo sapiens Retinoblastoma-associated protein Proteins 0.000 description 13
- 101000628562 Homo sapiens Serine/threonine-protein kinase STK11 Proteins 0.000 description 13
- 101000819111 Homo sapiens Trans-acting T-cell-specific transcription factor GATA-3 Proteins 0.000 description 13
- 108010068342 MAP Kinase Kinase 1 Proteins 0.000 description 13
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 13
- 108010071382 NF-E2-Related Factor 2 Proteins 0.000 description 13
- 102100031701 Nuclear factor erythroid 2-related factor 2 Human genes 0.000 description 13
- 102100022678 Nucleophosmin Human genes 0.000 description 13
- 102100030485 Platelet-derived growth factor receptor alpha Human genes 0.000 description 13
- 102100023347 Proto-oncogene tyrosine-protein kinase ROS Human genes 0.000 description 13
- 101150111584 RHOA gene Proteins 0.000 description 13
- 102100038042 Retinoblastoma-associated protein Human genes 0.000 description 13
- 102100026715 Serine/threonine-protein kinase STK11 Human genes 0.000 description 13
- 102100021386 Trans-acting T-cell-specific transcription factor GATA-3 Human genes 0.000 description 13
- 102100022387 Transforming protein RhoA Human genes 0.000 description 13
- 230000035772 mutation Effects 0.000 description 13
- 108700024394 Exon Proteins 0.000 description 12
- 102100035108 High affinity nerve growth factor receptor Human genes 0.000 description 12
- 101000779641 Homo sapiens ALK tyrosine kinase receptor Proteins 0.000 description 12
- 101000924577 Homo sapiens Adenomatous polyposis coli protein Proteins 0.000 description 12
- 101001087416 Homo sapiens Tyrosine-protein phosphatase non-receptor type 11 Proteins 0.000 description 12
- 108091028043 Nucleic acid sequence Proteins 0.000 description 12
- 102100029981 Receptor tyrosine-protein kinase erbB-4 Human genes 0.000 description 12
- 101710100963 Receptor tyrosine-protein kinase erbB-4 Proteins 0.000 description 12
- 102100033019 Tyrosine-protein phosphatase non-receptor type 11 Human genes 0.000 description 12
- 210000004369 blood Anatomy 0.000 description 12
- 239000008280 blood Substances 0.000 description 12
- 238000009396 hybridization Methods 0.000 description 12
- 230000035945 sensitivity Effects 0.000 description 12
- 102100038595 Estrogen receptor Human genes 0.000 description 11
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 11
- 101000771237 Homo sapiens Serine/threonine-protein kinase A-Raf Proteins 0.000 description 11
- 108700028341 SMARCB1 Proteins 0.000 description 11
- 101150008214 SMARCB1 gene Proteins 0.000 description 11
- 102100025746 SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily B member 1 Human genes 0.000 description 11
- 102100029437 Serine/threonine-protein kinase A-Raf Human genes 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 230000000977 initiatory effect Effects 0.000 description 10
- 238000003780 insertion Methods 0.000 description 10
- 230000037431 insertion Effects 0.000 description 10
- 241000282414 Homo sapiens Species 0.000 description 9
- 239000013068 control sample Substances 0.000 description 9
- 102000012410 DNA Ligases Human genes 0.000 description 8
- 108010061982 DNA Ligases Proteins 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 210000000349 chromosome Anatomy 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- 230000037452 priming Effects 0.000 description 8
- 239000007787 solid Substances 0.000 description 8
- 206010069754 Acquired gene mutation Diseases 0.000 description 7
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 7
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 7
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 239000011324 bead Substances 0.000 description 7
- 229940079593 drug Drugs 0.000 description 7
- 239000003814 drug Substances 0.000 description 7
- 239000002751 oligonucleotide probe Substances 0.000 description 7
- 238000013081 phylogenetic analysis Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000009467 reduction Effects 0.000 description 7
- 229920002477 rna polymer Polymers 0.000 description 7
- 230000037439 somatic mutation Effects 0.000 description 7
- 241000894007 species Species 0.000 description 7
- 108020004635 Complementary DNA Proteins 0.000 description 6
- 102000008158 DNA Ligase ATP Human genes 0.000 description 6
- 108010060248 DNA Ligase ATP Proteins 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 238000010804 cDNA synthesis Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 239000002299 complementary DNA Substances 0.000 description 6
- 230000008878 coupling Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 238000005859 coupling reaction Methods 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 238000012544 monitoring process Methods 0.000 description 6
- 210000002381 plasma Anatomy 0.000 description 6
- 230000008707 rearrangement Effects 0.000 description 6
- 238000003556 assay Methods 0.000 description 5
- 210000001124 body fluid Anatomy 0.000 description 5
- 239000010839 body fluid Substances 0.000 description 5
- 230000004077 genetic alteration Effects 0.000 description 5
- 231100000118 genetic alteration Toxicity 0.000 description 5
- 210000004602 germ cell Anatomy 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 238000011002 quantification Methods 0.000 description 5
- 210000002966 serum Anatomy 0.000 description 5
- 239000007858 starting material Substances 0.000 description 5
- 108700028369 Alleles Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 108091092240 circulating cell-free DNA Proteins 0.000 description 4
- BFSMGDJOXZAERB-UHFFFAOYSA-N dabrafenib Chemical compound S1C(C(C)(C)C)=NC(C=2C(=C(NS(=O)(=O)C=3C(=CC=CC=3F)F)C=CC=2)F)=C1C1=CC=NC(N)=N1 BFSMGDJOXZAERB-UHFFFAOYSA-N 0.000 description 4
- 229960002465 dabrafenib Drugs 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 102000054765 polymorphisms of proteins Human genes 0.000 description 4
- 210000003296 saliva Anatomy 0.000 description 4
- 230000000392 somatic effect Effects 0.000 description 4
- 210000004881 tumor cell Anatomy 0.000 description 4
- 238000005303 weighing Methods 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 3
- 230000004544 DNA amplification Effects 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 206010036790 Productive cough Diseases 0.000 description 3
- 238000011166 aliquoting Methods 0.000 description 3
- 230000004075 alteration Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 239000012472 biological sample Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 3
- 238000002512 chemotherapy Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 210000003722 extracellular fluid Anatomy 0.000 description 3
- 210000003608 fece Anatomy 0.000 description 3
- 230000037442 genomic alteration Effects 0.000 description 3
- 238000007403 mPCR Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000035484 reaction time Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000010008 shearing Methods 0.000 description 3
- 210000003802 sputum Anatomy 0.000 description 3
- 208000024794 sputum Diseases 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 210000002700 urine Anatomy 0.000 description 3
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 101100274894 Arabidopsis thaliana CAMTA3 gene Proteins 0.000 description 2
- 101100496015 Arabidopsis thaliana CIPK14 gene Proteins 0.000 description 2
- 101100182490 Arabidopsis thaliana LECRK13 gene Proteins 0.000 description 2
- 101100043428 Arabidopsis thaliana SR gene Proteins 0.000 description 2
- 101100478293 Arabidopsis thaliana SR34 gene Proteins 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 2
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 description 2
- 206010009944 Colon cancer Diseases 0.000 description 2
- 206010061818 Disease progression Diseases 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 230000010558 Gene Alterations Effects 0.000 description 2
- 101001087394 Homo sapiens Tyrosine-protein phosphatase non-receptor type 1 Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 239000005551 L01XE03 - Erlotinib Substances 0.000 description 2
- 208000000172 Medulloblastoma Diseases 0.000 description 2
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 208000009565 Pharyngeal Neoplasms Diseases 0.000 description 2
- 206010034811 Pharyngeal cancer Diseases 0.000 description 2
- 101100431881 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YDR182W-A gene Proteins 0.000 description 2
- 206010039491 Sarcoma Diseases 0.000 description 2
- 102100033001 Tyrosine-protein phosphatase non-receptor type 1 Human genes 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine group Chemical group [C@@H]1([C@H](O)[C@H](O)[C@@H](CO)O1)N1C=NC=2C(N)=NC=NC12 OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 208000036878 aneuploidy Diseases 0.000 description 2
- 231100001075 aneuploidy Toxicity 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 230000005750 disease progression Effects 0.000 description 2
- AAKJLRGGTJKAMG-UHFFFAOYSA-N erlotinib Chemical compound C=12C=C(OCCOC)C(OCCOC)=CC2=NC=NC=1NC1=CC=CC(C#C)=C1 AAKJLRGGTJKAMG-UHFFFAOYSA-N 0.000 description 2
- 229960001433 erlotinib Drugs 0.000 description 2
- 230000029142 excretion Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000004545 gene duplication Effects 0.000 description 2
- 230000007614 genetic variation Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 208000029340 primitive neuroectodermal tumor Diseases 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 208000000649 small cell carcinoma Diseases 0.000 description 2
- 210000001082 somatic cell Anatomy 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 210000004243 sweat Anatomy 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 210000001138 tear Anatomy 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 238000011269 treatment regimen Methods 0.000 description 2
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 1
- 206010061424 Anal cancer Diseases 0.000 description 1
- 208000007860 Anus Neoplasms Diseases 0.000 description 1
- 101100215673 Arabidopsis thaliana AGL11 gene Proteins 0.000 description 1
- 101100182496 Arabidopsis thaliana LECRK19 gene Proteins 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 108091005940 BB4R Proteins 0.000 description 1
- 206010004146 Basal cell carcinoma Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 206010006143 Brain stem glioma Diseases 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 208000011691 Burkitt lymphomas Diseases 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 206010007275 Carcinoid tumour Diseases 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 201000009047 Chordoma Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 208000009798 Craniopharyngioma Diseases 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 101000836720 Dictyostelium discoideum Aldose reductase A Proteins 0.000 description 1
- 101100310856 Drosophila melanogaster spri gene Proteins 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 102000001301 EGF receptor Human genes 0.000 description 1
- 101150039808 Egfr gene Proteins 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 201000008228 Ependymoblastoma Diseases 0.000 description 1
- 206010014967 Ependymoma Diseases 0.000 description 1
- 206010014968 Ependymoma malignant Diseases 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 208000006168 Ewing Sarcoma Diseases 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 108091008794 FGF receptors Proteins 0.000 description 1
- 206010053717 Fibrous histiocytoma Diseases 0.000 description 1
- 102100021084 Forkhead box protein C1 Human genes 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 208000022072 Gallbladder Neoplasms Diseases 0.000 description 1
- 208000032612 Glial tumor Diseases 0.000 description 1
- 206010018338 Glioma Diseases 0.000 description 1
- 102100039317 HAUS augmin-like complex subunit 3 Human genes 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000986621 Homo sapiens ATP-binding cassette sub-family C member 6 Proteins 0.000 description 1
- 101000851181 Homo sapiens Epidermal growth factor receptor Proteins 0.000 description 1
- 101000818310 Homo sapiens Forkhead box protein C1 Proteins 0.000 description 1
- 101001035819 Homo sapiens HAUS augmin-like complex subunit 3 Proteins 0.000 description 1
- 101000692455 Homo sapiens Platelet-derived growth factor receptor beta Proteins 0.000 description 1
- 101001023770 Homo sapiens Transcription factor NF-E2 45 kDa subunit Proteins 0.000 description 1
- 101000597747 Homo sapiens Transmembrane protein 11, mitochondrial Proteins 0.000 description 1
- 208000019758 Hypergammaglobulinemia Diseases 0.000 description 1
- 206010021042 Hypopharyngeal cancer Diseases 0.000 description 1
- 206010056305 Hypopharyngeal neoplasm Diseases 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 208000037396 Intraductal Noninfiltrating Carcinoma Diseases 0.000 description 1
- 206010073094 Intraductal proliferative breast lesion Diseases 0.000 description 1
- 206010061252 Intraocular melanoma Diseases 0.000 description 1
- 208000007766 Kaposi sarcoma Diseases 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- 101150105104 Kras gene Proteins 0.000 description 1
- 239000002144 L01XE18 - Ruxolitinib Substances 0.000 description 1
- 101100247596 Larrea tridentata RCA2 gene Proteins 0.000 description 1
- 206010023825 Laryngeal cancer Diseases 0.000 description 1
- 206010062038 Lip neoplasm Diseases 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 208000006644 Malignant Fibrous Histiocytoma Diseases 0.000 description 1
- 208000032271 Malignant tumor of penis Diseases 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 208000003445 Mouth Neoplasms Diseases 0.000 description 1
- 208000034578 Multiple myelomas Diseases 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100013967 Mus musculus Gata3 gene Proteins 0.000 description 1
- 101100091501 Mus musculus Ros1 gene Proteins 0.000 description 1
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 1
- 206010028729 Nasal cavity cancer Diseases 0.000 description 1
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 1
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108010047956 Nucleosomes Proteins 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 206010031096 Oropharyngeal cancer Diseases 0.000 description 1
- 206010057444 Oropharyngeal neoplasm Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 241000282577 Pan troglodytes Species 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 206010061332 Paraganglion neoplasm Diseases 0.000 description 1
- 208000000821 Parathyroid Neoplasms Diseases 0.000 description 1
- 208000002471 Penile Neoplasms Diseases 0.000 description 1
- 206010034299 Penile cancer Diseases 0.000 description 1
- 208000007641 Pinealoma Diseases 0.000 description 1
- 208000007913 Pituitary Neoplasms Diseases 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 102100026547 Platelet-derived growth factor receptor beta Human genes 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 208000006265 Renal cell carcinoma Diseases 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 101150073911 STK gene Proteins 0.000 description 1
- 208000004337 Salivary Gland Neoplasms Diseases 0.000 description 1
- 206010061934 Salivary gland cancer Diseases 0.000 description 1
- 208000009359 Sezary Syndrome Diseases 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 208000021712 Soft tissue sarcoma Diseases 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 208000002847 Surgical Wound Diseases 0.000 description 1
- 208000031673 T-Cell Cutaneous Lymphoma Diseases 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- 102100035412 Transcription factor NF-E2 45 kDa subunit Human genes 0.000 description 1
- 102100035320 Transmembrane protein 11, mitochondrial Human genes 0.000 description 1
- 208000037280 Trisomy Diseases 0.000 description 1
- 208000015778 Undifferentiated pleomorphic sarcoma Diseases 0.000 description 1
- 206010046431 Urethral cancer Diseases 0.000 description 1
- 206010046458 Urethral neoplasms Diseases 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 201000005969 Uveal melanoma Diseases 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 206010047741 Vulval cancer Diseases 0.000 description 1
- 208000004354 Vulvar Neoplasms Diseases 0.000 description 1
- 208000008383 Wilms tumor Diseases 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000005299 abrasion Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 208000020990 adrenal cortex carcinoma Diseases 0.000 description 1
- 208000007128 adrenocortical carcinoma Diseases 0.000 description 1
- 239000012491 analyte Substances 0.000 description 1
- 230000033115 angiogenesis Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 201000011165 anus cancer Diseases 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 208000001119 benign fibrous histiocytoma Diseases 0.000 description 1
- 210000001772 blood platelet Anatomy 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 208000002458 carcinoid tumor Diseases 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 201000007241 cutaneous T cell lymphoma Diseases 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 208000028715 ductal breast carcinoma in situ Diseases 0.000 description 1
- 201000007273 ductal carcinoma in situ Diseases 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 108700021358 erbB-1 Genes Proteins 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 208000024519 eye neoplasm Diseases 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 102000052178 fibroblast growth factor receptor activity proteins Human genes 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 201000010175 gallbladder cancer Diseases 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 210000003731 gingival crevicular fluid Anatomy 0.000 description 1
- 210000004209 hair Anatomy 0.000 description 1
- 201000009277 hairy cell leukemia Diseases 0.000 description 1
- 201000010536 head and neck cancer Diseases 0.000 description 1
- 208000014829 head and neck neoplasm Diseases 0.000 description 1
- 201000010235 heart cancer Diseases 0.000 description 1
- 208000024348 heart neoplasm Diseases 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 201000006866 hypopharynx cancer Diseases 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000011221 initial treatment Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- 206010023841 laryngeal neoplasm Diseases 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 1
- 201000006721 lip cancer Diseases 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 1
- 208000026045 malignant tumor of parathyroid gland Diseases 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 201000008203 medulloepithelioma Diseases 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 201000005962 mycosis fungoides Diseases 0.000 description 1
- 201000008026 nephroblastoma Diseases 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 210000001623 nucleosome Anatomy 0.000 description 1
- 201000008106 ocular cancer Diseases 0.000 description 1
- 201000002575 ocular melanoma Diseases 0.000 description 1
- 201000005443 oral cavity cancer Diseases 0.000 description 1
- 201000006958 oropharynx cancer Diseases 0.000 description 1
- 201000008968 osteosarcoma Diseases 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 208000008443 pancreatic carcinoma Diseases 0.000 description 1
- 208000003154 papilloma Diseases 0.000 description 1
- 208000007312 paraganglioma Diseases 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 210000005259 peripheral blood Anatomy 0.000 description 1
- 239000011886 peripheral blood Substances 0.000 description 1
- 208000020943 pineal parenchymal cell neoplasm Diseases 0.000 description 1
- 208000010916 pituitary tumor Diseases 0.000 description 1
- 208000010626 plasma cell neoplasm Diseases 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 208000025638 primary cutaneous T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 208000015347 renal cell adenocarcinoma Diseases 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 1
- HFNKQEVNSGCOJV-OAHLLOKOSA-N ruxolitinib Chemical compound C1([C@@H](CC#N)N2N=CC(=C2)C=2C=3C=CNC=3N=CN=2)CCCC1 HFNKQEVNSGCOJV-OAHLLOKOSA-N 0.000 description 1
- 229960000215 ruxolitinib Drugs 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 208000037968 sinus cancer Diseases 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 201000002314 small intestine cancer Diseases 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 238000001847 surface plasmon resonance imaging Methods 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 208000008732 thymoma Diseases 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 230000004614 tumor growth Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- 208000037965 uterine sarcoma Diseases 0.000 description 1
- 206010046885 vaginal cancer Diseases 0.000 description 1
- 208000013139 vaginal neoplasm Diseases 0.000 description 1
- 201000005102 vulva cancer Diseases 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
Abstract
【課題】ポリヌクレオチド試料における遺伝的バリアント(例えば、コピー数バリエーション)を決定するための方法およびシステムを提供すること。【解決手段】コピー数バリエーションを決定するための方法は、二本鎖ポリヌクレオチドに二重鎖タグをタグ付けするステップと、試料由来のポリヌクレオチドを配列決定するステップと、選択された遺伝子座にマッピングするポリヌクレオチドの総数を推定するステップとを含む。ポリヌクレオチドの総数の推定は、配列リードが生成されていない、本来の試料における二本鎖ポリヌクレオチドの数の推定を伴い得る。この数は、両方の相補鎖のリードが検出されたポリヌクレオチドおよび2本の相補鎖のうち一方のみが検出されたリードの数を使用して生成することができる。【選択図】なし
Description
相互参照
本出願は、米国特許法§119(e)の下、2013年12月28日に出願された米国仮出願第61/921,456号および2014年3月5日に出願され多米国仮出願第61/948,509号の利益を請求し、各々は参照によってその全体が本明細書に組み込まれる。
本出願は、米国特許法§119(e)の下、2013年12月28日に出願された米国仮出願第61/921,456号および2014年3月5日に出願され多米国仮出願第61/948,509号の利益を請求し、各々は参照によってその全体が本明細書に組み込まれる。
ポリヌクレオチドの検出および定量化は、診断等、分子生物学および医学適用に重要である。遺伝子検査は、多数の診断方法に特に有用である。例えば、がんおよび部分的または完全な異数性等、稀な遺伝子変更(例えば、配列バリアント)またはエピジェネティックマーカーの変化が原因の障害は、DNA配列情報により検出またはより正確に特徴付けることができる。
がん等、遺伝性疾患の早期検出およびモニタリングは、多くの場合、該疾患の処置または管理の成功において有用であり必要とされる。アプローチの1つは、異なる種類の体液において見出すことができるポリヌクレオチドの集団である、無細胞(cell-free)核酸
に由来する試料のモニタリングを含むことができる。一部の事例において、疾患は、1種または複数の核酸配列のコピー数バリエーションおよび/または配列バリエーション等、遺伝的異常の検出、または他のある特定の稀な遺伝子変更の発生に基づき特徴付けるまたは検出することができる。無細胞DNA(cfDNA)は、特定の疾患に関連する遺伝的異常を含有することができる。配列決定および核酸を操作する技法における改善に伴い、本技術分野において、無細胞DNAを使用して、疾患を検出およびモニタリングするための改善された方法およびシステムの必要がある。
に由来する試料のモニタリングを含むことができる。一部の事例において、疾患は、1種または複数の核酸配列のコピー数バリエーションおよび/または配列バリエーション等、遺伝的異常の検出、または他のある特定の稀な遺伝子変更の発生に基づき特徴付けるまたは検出することができる。無細胞DNA(cfDNA)は、特定の疾患に関連する遺伝的異常を含有することができる。配列決定および核酸を操作する技法における改善に伴い、本技術分野において、無細胞DNAを使用して、疾患を検出およびモニタリングするための改善された方法およびシステムの必要がある。
具体的には、特に、多くの適用(例えば、出生前、移植、免疫、メタゲノミクスまたはがん診断)に対し、腫瘍由来gDNA等の異種性ゲノム試料またはcfDNAのために、正確なコピー数バリエーション推定のための多くの方法が開発された。これらの方法の大部分は、本来の核酸を配列決定可能なライブラリーに変換する試料調製と、続く大規模並列配列決定と、最終的に1種または複数の遺伝子座におけるコピー数バリエーションを推定するためのバイオインフォマティクスを含む。
これらの方法の多くは、変換および配列決定されたあらゆる分子に対し、試料調製および配列決定プロセスによって導入されるエラーを低下させることまたはこれと戦うことができるが、これらの方法は、変換されたが配列決定されていない分子の計数を推測することができない。変換されたが配列決定されていない分子のこのような計数は、ゲノム領域間で高度に可変性となり得るため、これらの計数は、達成できる感度に劇的かつ有害に影響を与え得る。
この問題に取り組むため、インプット二本鎖デオキシリボ核酸(DNA)は、個々の二本鎖分子の両半分を、一部の事例においては、異なってタグ付けするプロセスによって変換することができる。この操作は、ヘアピン、バブルもしくはフォーク形アダプター(adapter)または二本鎖および一本鎖セグメント(バブル、フォーク形またはヘアピンアダ
プターのハイブリダイズしていない部分は、本明細書において一本鎖と考慮される)を有する他のアダプタ(adaptor)のライゲーションを含む種々の技法を使用して行うことができる。正確にタグ付けされると、インプット二本鎖DNA分子のそれぞれの本来のワトソンおよびクリック(すなわち、鎖)側を異なってタグ付けし、シーケンサーおよびその後のバイオインフォマティクスによって同定することができる。特定の領域におけるあらゆる分子に対し、両方のワトソンおよびクリック側が回収された分子(「ペア(Pair)」)対一方の半分のみが回収された分子(「シングレット(Singlet)」)の計数を記録す
ることができる。未観測(unseen)分子の数は、検出されたペアおよびシングレットの数に基づき推定することができる。
プターのハイブリダイズしていない部分は、本明細書において一本鎖と考慮される)を有する他のアダプタ(adaptor)のライゲーションを含む種々の技法を使用して行うことができる。正確にタグ付けされると、インプット二本鎖DNA分子のそれぞれの本来のワトソンおよびクリック(すなわち、鎖)側を異なってタグ付けし、シーケンサーおよびその後のバイオインフォマティクスによって同定することができる。特定の領域におけるあらゆる分子に対し、両方のワトソンおよびクリック側が回収された分子(「ペア(Pair)」)対一方の半分のみが回収された分子(「シングレット(Singlet)」)の計数を記録す
ることができる。未観測(unseen)分子の数は、検出されたペアおよびシングレットの数に基づき推定することができる。
本開示の態様は、本来のDNA断片の異種性集団における稀なデオキシリボ核酸(DNA)を検出および/または定量化するための方法であって、断片の30%超が、両端においてタグ付けされるように、複数の異なるタグのライブラリーを使用して、単一の反応で本来のDNA断片をタグ付けするステップを含み、タグのそれぞれが、分子バーコードを含む方法を提供する。単一の反応は、単一の反応容器内で行われ得る。断片の50%超が、両端においてタグ付けされてよい。複数の異なるタグは、100、500、1000、10,000または100,000種のうちいずれか以下の異なるタグとなり得る。
別の態様は、目的の分子のタグ付け(例えば、ライゲーション、ハイブリダイゼーション等による)に使用することができるライブラリーアダプタのセットを提供する。ライブラリーアダプタのセットは、分子バーコードを有する複数のポリヌクレオチド分子を含むことができ、複数のポリヌクレオチド分子は、80ヌクレオチド塩基未満またはそれに等しい長さであり、分子バーコードは、少なくとも4ヌクレオチド塩基の長さであり、(a)分子バーコードは、互いに異なり、互いの間に少なくとも1の編集距離を有し、(b)分子バーコードは、それぞれのポリヌクレオチド分子の末端から少なくとも1ヌクレオチド塩基離れて位置し、(c)任意選択で、少なくとも1末端塩基は、ポリヌクレオチド分子の全てにおいて同一であり、(d)ポリヌクレオチド分子のいずれも、完全シーケンサーモチーフを含有しない。
一部の実施形態において、ライブラリーアダプタ(またはアダプター)は、分子バーコードを除いて互いに同一である。一部の実施形態において、複数のライブラリーアダプタのそれぞれは、少なくとも1個の二本鎖部分および少なくとも1個の一本鎖部分(例えば、非相補的部分またはオーバーハング)を含む。一部の実施形態において、二本鎖部分は、異なる分子バーコードのコレクションから選択される分子バーコードを有する。一部の実施形態において、所与の分子バーコードは、ランダマーである。一部の実施形態において、ライブラリーアダプタのそれぞれは、少なくとも1個の一本鎖部分に鎖同定バーコードをさらに含む。一部の実施形態において、鎖同定バーコードは、少なくとも4ヌクレオチド塩基を含む。一部の実施形態において、一本鎖部分は、部分的シーケンサーモチーフを有する。一部の実施形態において、ライブラリーアダプタは、完全シーケンサーモチーフを含まない。
一部の実施形態において、ライブラリーアダプタのいずれも、フローセルにハイブリダイズするためのまたは配列決定のためにヘアピンを形成するための配列を含有しない。
一部の実施形態において、ライブラリーアダプタは全て、同じヌクレオチド(複数可)を有する末端を有する。一部の実施形態において、同一末端ヌクレオチド(複数可)は、2ヌクレオチド塩基またはそれを超える長さに及ぶ。
一部の実施形態において、ライブラリーアダプターのそれぞれは、Y字形、バブル形またはヘアピン形である。一部の実施形態において、ライブラリーアダプターのいずれも、試料同定モチーフを含有しない。一部の実施形態において、ライブラリーアダプターのそれぞれは、ユニバーサルプライマーに選択的にハイブリダイズ可能な配列を含む。一部の実施形態において、ライブラリーアダプターのそれぞれは、少なくとも5、6、7、8、9および10ヌクレオチド塩基の長さの分子バーコードを含む。一部の実施形態において、ライブラリーアダプターのそれぞれは、10ヌクレオチド塩基~80の長さまたは30~70ヌクレオチド塩基の長さまたは40~60ヌクレオチド塩基の長さである。一部の実施形態において、少なくとも1、2、3または4末端塩基が、全ライブラリーアダプタにおいて同一である。一部の実施形態において、少なくとも4末端塩基が、全ライブラリーアダプタにおいて同一である。
一部の実施形態において、ライブラリーアダプターの分子バーコードの編集距離は、ハミング距離である。一部の実施形態において、編集距離は、少なくとも1、2、3、4または5である。一部の実施形態において、編集距離は、複数のポリヌクレオチド分子の個々の塩基に関する。一部の実施形態において、分子バーコードは、アダプターの末端から少なくとも10ヌクレオチド塩基離れて位置する。一部の実施形態において、複数のライブラリーアダプターは、少なくとも2、4、6、8、10、20、30、40もしくは50種の異なる分子バーコード、または2~100、4~80、6~60もしくは8~40種の異なる分子バーコードを含む。本明細書における実施形態のいずれかにおいて、タグ付けが特有ではなくなるように、異なる分子バーコードが存在するよりも多くのタグ付けするべきポリヌクレオチド(例えば、cfDNA断片)が存在する。
一部の実施形態において、アダプタの末端は、(例えば、標的核酸分子への)ライゲーションのために構成される。一部の実施形態において、アダプタの末端は、平滑末端である。
一部の実施形態において、アダプタは、精製および単離される。一部の実施形態において、ライブラリーは、1個または複数の非天然起源の塩基を含む。
一部の実施形態において、ポリヌクレオチド分子は、分子バーコードに関して5’に配置されたプライマー配列を含む。
一部の実施形態において、ライブラリーアダプタのセットは、複数のポリヌクレオチド分子から本質的になる。
別の態様において、方法は、(a)アダプタのライブラリー由来の複数のポリヌクレオチド分子をポリヌクレオチドのコレクションにタグ付けして、タグ付けされたポリヌクレオチドのコレクションを作製するステップと、(b)配列決定アダプタの存在下で、タグ付けされたポリヌクレオチドのコレクションを増幅するステップであって、配列決定アダプタは、複数のポリヌクレオチド分子における相補的配列に選択的にハイブリダイズ可能なヌクレオチド配列を有するプライマーを有するステップを含む。アダプタのライブラリーは、上述または本明細書の他の箇所に記載のものとなり得る。一部の実施形態において、シーケンサーアダプタのそれぞれは、試料同定モチーフとなり得る指標タグをさらに含む。
別の態様は、本来のDNA断片の異種性集団における稀なDNAを検出および/または定量化するための方法であって、稀なDNAは、1%未満である濃度を有し、方法は、(a)本来のDNA断片の30%超が、分子バーコードを含むライブラリーアダプタを両端にタグ付けされるように、単一の反応において本来のDNA断片にタグ付けし、これにより、タグ付けされたDNA断片を用意するステップと、(b)タグ付けされたDNA断片において高忠実度増幅を行うステップと、(c)任意選択で、タグ付けされたDNA断片のサブセットを選択的に濃縮するステップと、(d)タグ付けされ、増幅され、任意選択で選択的に濃縮されたDNA断片の一方または両方の鎖を配列決定して、分子バーコードおよび本来のDNA断片の少なくとも一部分とのヌクレオチド配列を含む配列リードを得るステップと、(e)配列リードから、本来のDNA断片の一本鎖の代表となるコンセンサスリードを決定するステップと、(f)コンセンサスリードを定量化して、99.9%を超える特異性で、稀なDNAを検出および/または定量化するステップとを含む方法を提供する。
一部の実施形態において、(e)は、同じまたは類似の分子バーコードおよび同じまたは類似の断片配列の末端を有する配列リードを比較するステップを含む。一部の実施形態において、比較するステップは、同じまたは類似の分子バーコードを有する配列リードにおける系統発生(phylogentic)解析を実行するステップをさらに含む。一部の実施形態
において、分子バーコードは、最大3の編集距離を有するバーコードを含む。一部の実施形態において、断片配列の末端は、最大3の編集距離を有する断片配列を含む。
において、分子バーコードは、最大3の編集距離を有するバーコードを含む。一部の実施形態において、断片配列の末端は、最大3の編集距離を有する断片配列を含む。
一部の実施形態において、本方法は、配列リードをペア形成されたリードおよびペア形成されないリードへと選別するステップと、1種または複数の遺伝子座のそれぞれにマッピングするペア形成されたリードおよびペア形成されないリードの数を定量化するステップとをさらに含む。
一部の実施形態において、タグ付けは、本来のDNA断片と比較して過剰量のライブラリーアダプタを有することにより起こる。一部の実施形態において、過剰は、少なくとも5倍過剰である。一部の実施形態において、タグ付けは、リガーゼの使用を含む。一部の実施形態において、タグ付けは、平滑末端への取り付けを含む。
一部の実施形態において、本方法は、分子バーコードおよび本来のDNA断片のそれぞれの少なくとも一端由来の配列情報に従って配列リードをビニングして、一本鎖リードのビンを作製するステップをさらに含む。一部の実施形態において、本方法は、各ビンにおいて、配列リードを解析することにより、本来のDNA断片の中の所与の本来のDNA断片の配列を決定するステップをさらに含む。一部の実施形態において、本方法は、タグ付けされ、増幅され、任意選択で濃縮されたDNA断片によって表されるゲノムの各位置において各塩基が生じる回数を比較することにより、稀なDNAを検出および/または定量化するステップをさらに含む。
一部の実施形態において、ライブラリーアダプタは、完全シーケンサーモチーフを含有しない。一部の実施形態において、本方法は、タグ付けされたDNA断片のサブセットを選択的に濃縮するステップをさらに含む。一部の実施形態において、本方法は、濃縮後に、プライマーを含む配列決定アダプタの存在下で、濃縮されたタグ付けされたDNA断片を増幅するステップをさらに含む。一部の実施形態において、(a)は、分子バーコードの2~1000種の異なる組合せを有するタグ付けされたDNA断片をもたらす。
一部の実施形態において、DNA断片は、上述または本明細書の他の箇所に記載のアダプタのライブラリー由来のポリヌクレオチド分子をタグ付けされる。
別の態様において、対象の核酸試料を処理および/または解析するための方法は、(a)核酸試料由来のポリヌクレオチド断片をライブラリーアダプタのセットに曝露して、タグ付けされたポリヌクレオチド断片を生成するステップと、(b)タグ付けされたポリヌクレオチド断片の増幅産物として増幅されたポリヌクレオチド断片を生じる条件下で、タグ付けされたポリヌクレオチド断片を核酸増幅反応に供するステップとを含む。ライブラリーアダプタのセットは、分子バーコードを有する複数のポリヌクレオチド分子を含み、複数のポリヌクレオチド分子は、80ヌクレオチド塩基未満またはそれに等しい長さであり、分子バーコードは、少なくとも4ヌクレオチド塩基の長さであり、(1)分子バーコードは、互いに異なり、互いの間に少なくとも1の編集距離を有し、(2)分子バーコードは、それぞれのポリヌクレオチド分子の末端から少なくとも1ヌクレオチド塩基離れて位置し、(3)任意選択で、少なくとも1末端塩基は、ポリヌクレオチド分子の全てにおいて同一であり、(4)ポリヌクレオチド分子のいずれも、完全シーケンサーモチーフを含有しない。
一部の実施形態において、本方法は、増幅されたタグ付けされたポリヌクレオチド断片のヌクレオチド配列を決定するステップをさらに含む。一部の実施形態において、増幅されたタグ付けされたポリヌクレオチド断片のヌクレオチド配列は、ポリメラーゼ連鎖反応(PCR)なしで決定される。一部の実施形態において、本方法は、プログラムされたコンピュータプロセッサによりヌクレオチド配列を解析して、対象のヌクレオチド試料における1種または複数の遺伝的バリアントを同定するステップをさらに含む。一部の実施形態において、1種または複数の遺伝的バリアントは、塩基変化(複数可)、挿入(複数可)、反復(複数可)、欠失(複数可)、コピー数バリエーション(複数可)およびトランスバージョン(複数可)からなる群から選択される。一部の実施形態において、1種または複数の遺伝的バリアントは、1種または複数の腫瘍関連遺伝子変更を含む。
一部の実施形態において、対象は、疾患であるまたはそうであると疑われる。一部の実施形態において、疾患は、がんである。一部の実施形態において、本方法は、対象から核酸試料を収集するステップをさらに含む。一部の実施形態において、核酸試料は、対象の血液、血漿、血清、尿、唾液、粘膜排泄、痰、糞便、脳脊髄液および涙からなる群から選択される位置から収集される。一部の実施形態において、核酸試料は、無細胞核酸試料である。一部の実施形態において、核酸試料は、対象の100ナノグラム(ng)以下の二本鎖ポリヌクレオチド分子から収集される。
一部の実施形態において、ポリヌクレオチド断片は、二本鎖ポリヌクレオチド分子を含む。一部の実施形態において、(a)において、複数のポリヌクレオチド分子は、平滑末端ライゲーション、粘着末端ライゲーション、分子逆位プローブ、PCR、ライゲーションに基づくPCR、マルチプレックスPCR、一本鎖ライゲーションおよび一本鎖環状化によりポリヌクレオチド断片にカップリングする。一部の実施形態において、核酸試料のポリヌクレオチド断片を複数のポリヌクレオチド分子に曝露するステップは、少なくとも10%の変換効率で、タグ付けされたポリヌクレオチド断片を生じる。一部の実施形態において、タグ付けされたポリヌクレオチド断片の少なくとも5%、6%、7%、8%、9%、10%、20%または25%のいずれかは、共通ポリヌクレオチド分子または配列を共有する。一部の実施形態において、本方法は、核酸試料からポリヌクレオチド断片を生成するステップをさらに含む。
一部の実施形態において、供するステップは、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択される遺伝子に対応する配列からタグ付けされたポリヌクレオチド断片を増幅するステップを含む。
別の態様において、方法は、(a)複数のポリヌクレオチド分子から複数の配列リードを生成するステップであって、複数のポリヌクレオチド分子が、標的ゲノムのゲノム遺伝子座を網羅し、ゲノム遺伝子座が、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択される複数の遺伝子に対応するステップと、(b)コンピュータプロセッサにより、複数の配列リードをファミリーへと群分けするステップであって、各ファミリーが、鋳型ポリヌクレオチドのうち1種に由来する配列リードを含むステップと、(c)ファミリーのそれぞれに対し、配列リードを統合して、コンセンサス配列を生成するステップと、(d)ゲノム遺伝子座の中の所与のゲノム遺伝子座においてコンセンサス配列をコール(call)するステップと、(e)所与のゲノム遺伝子座において、コールの中の遺伝的バリアント、コールの中の遺伝子変更の頻度、コールの総数およびコールの中の変更の総数のいずれかを検出するステップとを含む。
一部の実施形態において、各ファミリーは、鋳型ポリヌクレオチドのうち1種のみに由来する配列リードを含む。一部の実施形態において、所与のゲノム遺伝子座は、少なくとも1核酸塩基を含む。一部の実施形態において、所与のゲノム遺伝子座は、複数の核酸塩基を含む。一部の実施形態において、コールするステップは、所与のゲノム遺伝子座において少なくとも1核酸塩基をコールするステップを含む。一部の実施形態において、コールするステップは、所与のゲノム遺伝子座において複数の核酸塩基をコールするステップを含む。一部の実施形態において、コールするステップは、系統発生解析、投票、秤量、ファミリーにおける遺伝子座における各リードへの確率の割り当て、および最高確率による塩基のコールのうちいずれか1種を含む。
一部の実施形態において、本方法は、ゲノム遺伝子座の中の追加的なゲノム遺伝子座において(d)~(e)を行うステップをさらに含む。一部の実施形態において、本方法は、所与のゲノム遺伝子座および追加的なゲノム遺伝子座における計数に基づき、所与のゲノム遺伝子座および追加的なゲノム遺伝子座のうち1種におけるコピー数のバリエーションを決定するステップをさらに含む。
一部の実施形態において、群分けするステップは、(i)複数のポリヌクレオチド分子にカップリングされた異なる分子バーコードおよび(ii)複数の配列リードの間の類似性を同定することにより、複数の配列リードをファミリーへと分類するステップを含み、各ファミリーは、分子バーコードおよび類似または同一の配列リードの異なる組合せに関連付けられた複数の核酸配列を含む。異なる分子バーコードは、異なる配列を有する。
一部の実施形態において、コンセンサス配列は、配列リードのそれぞれの定量的尺度または統計的有意性レベルを評価することにより生成される。一部の実施形態において、定量的尺度は、二項分布、指数関数的分布、ベータ分布または経験的分布の使用を含む。一部の実施形態において、本方法は、コンセンサス配列を標的ゲノムにマッピングするステップをさらに含む。一部の実施形態において、複数の遺伝子は、群から選択される複数の遺伝子のうち少なくとも2、3、4、5、6、7、8、9、10、20、30、40、50種または全種を含む。
本開示の別の態様は、(a)単一の反応容器内に鋳型ポリヌクレオチド分子およびライブラリーアダプタのセットを用意するステップであって、ライブラリーアダプタが、異なる分子バーコード(例えば、2~1,000種の異なる分子バーコード)を有するポリヌクレオチド分子であり、ライブラリーアダプタのいずれも、完全シーケンサーモチーフを含有しないステップと、(b)単一の反応容器内で、少なくとも10%の効率で、ライブラリーアダプタを鋳型ポリヌクレオチド分子にカップリングし、これにより、複数の異なるタグ付け組合せ(例えば、4~1,000,000種の異なるタグ付け組合せ)の中にあるタグ付け組合せを各鋳型ポリヌクレオチドにタグ付けして、タグ付けされたポリヌクレオチド分子を産生するステップと、(c)タグ付けされたポリヌクレオチド分子の増幅産物として増幅されたポリヌクレオチド分子を生じる条件下で、タグ付けされたポリヌクレオチド分子を増幅反応に供するステップと、(d)増幅されたポリヌクレオチド分子を配列決定するステップとを含む方法を提供する。
一部の実施形態において、鋳型ポリヌクレオチド分子は、平滑末端または粘着末端である。一部の実施形態において、ライブラリーアダプタは、分子バーコードを除いて同一である。一部の実施形態において、ライブラリーアダプタのそれぞれは、二本鎖部分および少なくとも1個の一本鎖部分を有する。一部の実施形態において、二本鎖部分は、複数の分子バーコードの中の1つの分子バーコードを有する。一部の実施形態において、ライブラリーアダプタのそれぞれは、少なくとも1個の一本鎖部分に鎖同定バーコードをさらに含む。一部の実施形態において、一本鎖部分は、部分的シーケンサーモチーフを有する。一部の実施形態において、ライブラリーアダプタは、同じ末端ヌクレオチドの配列を有する。一部の実施形態において、鋳型ポリヌクレオチド分子は、二本鎖である。一部の実施形態において、ライブラリーアダプタは、鋳型ポリヌクレオチド分子の両端にカップリングする。
一部の実施形態において、タグ付けされたポリヌクレオチド分子を増幅反応に供するステップは、タグ付けされたポリヌクレオチド分子を非特異的に増幅するステップを含む。
一部の実施形態において、増幅反応は、タグ付けされたポリヌクレオチド分子のそれぞれを増幅するためのプライミング部位の使用を含む。一部の実施形態において、プライミング部位は、プライマーである。一部の実施形態において、プライマーは、ユニバーサルプライマーである。一部の実施形態において、プライミング部位は、ニックである。
一部の実施形態において、本方法は、(e)に先立ち、(i)増幅されたポリヌクレオチド分子から、1種または複数の所与の配列を含むポリヌクレオチド分子を分離して、濃縮されたポリヌクレオチド分子を産生するステップと、(ii)配列決定アダプタにより濃縮されたポリヌクレオチド分子を増幅するステップとをさらに含む。
一部の実施形態において、効率は、少なくとも30%、40%または50%である。一部の実施形態において、本方法は、増幅されたポリヌクレオチド分子の配列決定の際に遺伝的バリアントを同定するステップをさらに含む。一部の実施形態において、配列決定するステップは、(i)増幅されたポリヌクレオチド分子の増幅産物として追加的な増幅されたポリヌクレオチド分子を生じる条件下で、増幅されたポリヌクレオチド分子を追加的な増幅反応に供するステップと、(ii)追加的な増幅されたポリヌクレオチド分子を配列決定するステップとを含む。一部の実施形態において、追加的な増幅は、配列決定アダプタの存在下で行われる。
一部の実施形態において、(b)および(c)は、タグ付けされたポリヌクレオチド分子をアリコートにすることなく行われる。一部の実施形態において、タグ付けは、非特有のタグ付けである。
別の態様は、対象の標的核酸分子を解析するためのシステムであって、標的ゲノムのゲノム遺伝子座を網羅する複数のポリヌクレオチド分子の核酸配列リードを受け取る通信インターフェイスと;通信インターフェイスによって受け取られた複数のポリヌクレオチド分子の核酸配列リードを記憶するコンピュータメモリと;通信インターフェイスおよびメモリに作動可能にカップリングされ、(i)複数の配列リードを、各ファミリーが、鋳型ポリヌクレオチドのうち1種に由来する配列リードを含むファミリーへと群分けし、(ii)ファミリーのそれぞれに対し、配列リードを統合して、コンセンサス配列を生成し、(iii)ゲノム遺伝子座の中の所与のゲノム遺伝子座においてコンセンサス配列をコールし、(iv)所与のゲノム遺伝子座において、コールの中の遺伝的バリアント、コールの中の遺伝子変更の頻度、コールの総数およびコールの中の変更の総数のいずれかを検出するようにプログラムされたコンピュータプロセッサとを含み、ゲノム遺伝子座が、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択される複数の遺伝子に対応するシステムを提供する。
別の態様において、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択される少なくとも5種の遺伝子に選択的にハイブリダイズするオリゴヌクレオチド分子のセットが提供される。
一部の実施形態において、オリゴヌクレオチド分子は、10~200塩基の長さである。一部の実施形態において、オリゴヌクレオチド分子は、少なくとも5種の遺伝子のエクソン領域に選択的にハイブリダイズする。一部の実施形態において、オリゴヌクレオチド分子は、少なくとも5種の遺伝子における少なくとも30種のエクソンに選択的にハイブリダイズする。一部の実施形態において、複数のオリゴヌクレオチド分子は、少なくとも30種のエクソンのそれぞれに選択的にハイブリダイズする。一部の実施形態において、各エクソンにハイブリダイズするオリゴヌクレオチド分子は、少なくとも1種の他のオリゴヌクレオチド分子と重複する配列を有する。
別の態様において、キットは、それぞれ異なる分子バーコードを有する複数のライブラリーアダプタを含有する第1の容器と、複数の配列決定アダプタを含有する第2の容器であって、各配列決定アダプタが、シーケンサーモチーフの少なくとも一部分および任意選択で試料バーコードを含む第2の容器とを含む。ライブラリーアダプタは、上述または本明細書の他の箇所に記載のものとなり得る。
一部の実施形態において、配列決定アダプタは、試料バーコードを含む。一部の実施形態において、ライブラリーアダプタは、平滑末端およびY字形であり、80核酸塩基未満またはそれに等しい長さである。一部の実施形態において、配列決定アダプタは、末端から末端まで最大70塩基である。
別の態様において、無細胞DNA試料における配列バリアントを検出するための方法であって、99.9%を超える特異性で、1%未満の濃度の稀なDNAを検出するステップを含む方法が提供される。
別の態様において、方法は、少なくとも1%の検出限界および99.9%を超える特異性で、DNAを含む試料における遺伝的バリアントを検出するステップを含む。一部の実施形態において、本方法は、少なくとも30%、40%または50%の変換効率で、cDNA(例えば、cfDNA)をアダプタタグ付けされたDNAに変換し、偽陽性配列リードを排除することにより配列決定ノイズ(または歪み)を低下させるステップをさらに含む。
別の態様は、(a)二本鎖ポリヌクレオチド分子のセットを含む試料を用意するステップであって、各二本鎖ポリヌクレオチド分子が、第1および第2の相補鎖を含むステップと、(b)二本鎖ポリヌクレオチド分子に二重鎖タグのセットをタグ付けするステップであって、各二重鎖タグが、セットにおける二本鎖ポリヌクレオチド分子の第1および第2の相補鎖に異なってタグ付けするステップと、(c)タグ付けされた鎖の少なくとも一部を配列決定して、配列リードのセットを産生するステップと、(d)配列リードのセットにおける冗長性を低下および/または追跡するステップと、(e)配列リードをペア形成されたリードおよびペア形成されないリードへと選別するステップであって、(i)各ペア形成されたリードが、セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なってタグ付けされた相補鎖から生成された配列リードに対応し、(ii)各ペア形成されないリードが、配列リードのセットにおける配列リードの中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なってタグ付けされた相補鎖を持たない第1のタグ付けされた鎖を表すステップと、(f)1種または複数の遺伝子座のそれぞれにマッピングする(i)ペア形成されたリードおよび(ii)ペア形成されないリードの定量的尺度を決定するステップと、(g)プログラムされたコンピュータプロセッサにより、各遺伝子座にマッピングするペア形成されたリードおよびペア形成されないリードの定量的尺度に基づき、1種または複数の遺伝子座のそれぞれにマッピングするセットにおける総二本鎖ポリヌクレオチド分子の定量的尺度を推定するステップとを含む方法を提供する。
一部の実施形態において、本方法は、(h)1種または複数の遺伝子座のそれぞれにおけるステップ(g)において決定された正規化された総定量的尺度を決定し、正規化された尺度に基づきコピー数バリエーションを決定することにより、試料におけるコピー数バリエーションを検出するステップをさらに含む。一部の実施形態において、試料は、無細胞核酸から実質的に供給される二本鎖ポリヌクレオチド分子を含む。一部の実施形態において、二重鎖タグは、配列決定アダプタではない。
一部の実施形態において、配列リードのセットにおける冗長性を低下させるステップは、試料における本来のポリヌクレオチド分子の増幅された産物から産生された配列リードを、本来のポリヌクレオチド分子に戻るよう崩壊させるステップを含む。一部の実施形態において、本方法は、本来のポリヌクレオチド分子のコンセンサス配列を決定するステップをさらに含む。一部の実施形態において、本方法は、配列バリアントを含む1種または複数の遺伝子座におけるポリヌクレオチド分子を同定するステップをさらに含む。一部の実施形態において、本方法は、遺伝子座にマッピングするペア形成されたリードの定量的尺度を決定するステップであって、ペアの両方の鎖は、配列バリアントを含むステップをさらに含む。一部の実施形態において、本方法は、ペア形成された分子の定量的尺度を決定するステップであって、ペアの一方のメンバーのみが配列バリアントを有するステップ、および/または配列バリアントを有するペア形成されない分子の定量的尺度を決定するステップをさらに含む。一部の実施形態において、配列バリアントは、単一ヌクレオチドバリアント、インデル、トランスバージョン、転位置、逆位、欠失、染色体構造変更、遺伝子融合、染色体融合、遺伝子トランケーション、遺伝子増幅、遺伝子重複および染色体病変からなる群から選択される。
別の態様は、コンピュータプロセッサによる実行後に、(a)二重鎖タグをタグ付けされたポリヌクレオチドの配列リードのセットをメモリに受け取るステップと、(b)配列リードのセットにおける冗長性を低下および/または追跡するステップと、(c)配列リードをペア形成されたリードおよびペア形成されないリードへと選別するステップであって、(i)各ペア形成されたリードが、セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なってタグ付けされた相補鎖から生成された配列リードに対応し、(ii)各ペア形成されないリードが、配列リードのセットにおける配列リードの中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なってタグ付けされた相補鎖を持たない第1のタグ付けされた鎖を表すステップと、(d)1種または複数の遺伝子座のそれぞれにマッピングする(i)ペア形成されたリードおよび(ii)ペア形成されないリードの定量的尺度を決定するステップと、(e)各遺伝子座にマッピングするペア形成されたリードおよびペア形成されないリードの定量的尺度に基づき、1種または複数の遺伝子座のそれぞれにマッピングするセットにおける総二本鎖ポリヌクレオチド分子の定量的尺度を推定するステップとを含む方法を実施する機械実行可能コードを含むコンピュータ可読媒体を含むシステムを提供する。
別の態様は、(a)二本鎖ポリヌクレオチド分子のセットを含む試料を用意するステップであって、各二本鎖ポリヌクレオチド分子が、第1および第2の相補鎖を含むステップと、(b)二本鎖ポリヌクレオチド分子に二重鎖タグのセットをタグ付けするステップであって、各二重鎖タグが、セットにおける二本鎖ポリヌクレオチド分子の第1および第2の相補鎖を異なってタグ付けするステップと、(c)タグ付けされた鎖の少なくとも一部を配列決定して、配列リードのセットを産生するステップと、(d)配列リードのセットにおける冗長性を低下および/または追跡するステップと、(e)配列リードをペア形成されたリードおよびペア形成されないリードへと選別するステップであって、(i)各ペア形成されたリードが、セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なってタグ付けされた相補鎖から生成された配列リードに対応し、(ii)各ペア形成されないリードが、配列リードのセットにおける配列リードの中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なってタグ付けされた相補鎖を持たない第1のタグ付けされた鎖を表すステップと、(f)(i)ペア形成されたリード、(ii)1種または複数の遺伝子座のそれぞれにマッピングするペア形成されないリード、(iii)ペア形成されたリードのリード深度および(iv)ペア形成されないリードのリード深度のうち少なくとも2種の定量的尺度を決定するステップとを含む方法を提供する。
一部の実施形態において、(f)は、(i)~(iv)のうち少なくとも3種の定量的尺度を決定するステップを含む。一部の実施形態において、(f)は、(i)~(iv)のうち全ての定量的尺度を決定するステップを含む。一部の実施形態において、本方法は、(g)プログラムされたコンピュータプロセッサにより、各遺伝子座にマッピングするペア形成されたリードおよびペア形成されないリードならびにこれらのリード深度の定量的尺度に基づき、1種または複数の遺伝子座のそれぞれにマッピングするセットにおける総二本鎖ポリヌクレオチド分子の定量的尺度を推定するステップをさらに含む。
別の態様において、方法は、(a)対照親ポリヌクレオチドに第1のタグセットをタグ付けして、タグ付けされた対照親ポリヌクレオチドを産生するステップであって、第1のタグセットが、複数のタグを含み、第1のタグセットにおける各タグが、同じ対照タグおよび同定タグを含み、タグセットが、複数の異なる同定タグを含むステップと、(b)被験親ポリヌクレオチドに第2のタグセットをタグ付けして、タグ付けされた被験親ポリヌクレオチドを産生するステップであって、第2のタグセットが、複数のタグを含み、第2のタグセットにおける各タグが、対照タグおよび同定タグから識別可能な同じ被験タグを含み、第2のタグセットが、複数の異なる同定タグを含むステップと、(c)タグ付けされた対照親ポリヌクレオチドをタグ付けされた被験親ポリヌクレオチドと混合して、プールを形成するステップと、(d)プールにおけるタグ付けされた親ポリヌクレオチドを増幅して、増幅されたタグ付けされたポリヌクレオチドのプールを形成するステップと、(e)増幅されたプールにおける増幅されたタグ付けされたポリヌクレオチドを配列決定して、複数の配列リードを産生するステップと、(f)配列リードをファミリーへと群分けするステップであって、各ファミリーが、同じ親ポリヌクレオチドから生成された配列リードを含み、この群分けが、任意選択で、同定タグおよび親ポリヌクレオチドの開始/終了配列由来の情報に基づくステップと、任意選択で、群における複数の配列リード由来の複数の親ポリヌクレオチドのそれぞれのコンセンサス配列を決定するステップと、(g)被験タグまたは対照タグを有することに基づき、対照親ポリヌクレオチドまたは被験親ポリヌクレオチドとして各ファミリーまたはコンセンサス配列を分類するステップと、(h)少なくとも2種の遺伝子座のそれぞれにマッピングする対照親ポリヌクレオチドおよび対照被験ポリヌクレオチドの定量的尺度を決定するステップと、(i)少なくとも1種の遺伝子座にマッピングする被験親ポリヌクレオチドおよび対照親ポリヌクレオチドの相対的分量に基づき、少なくとも1種の遺伝子座における被験親ポリヌクレオチドにおけるコピー数バリエーションを決定するステップとを含む。
別の態様において、方法は、(a)複数の鋳型ポリヌクレオチドから複数の配列リードを生成するステップであって、各ポリヌクレオチドが、ゲノム遺伝子座にマッピングされるステップと、(b)配列リードをファミリーへと群分けするステップであって、各ファミリーが、鋳型ポリヌクレオチドのうち1種から生成された配列リードを含むステップと、(c)ファミリーのそれぞれに対しゲノム遺伝子座において塩基(または配列)をコールするステップと、(d)ゲノム遺伝子座において、コールの中のゲノム変更、コールの中の遺伝子変更の頻度、コールの総数およびコールの中の変更の総数のいずれかを検出するステップとを含む。
一部の実施形態において、コールは、系統発生解析、投票、秤量、ファミリーにおける遺伝子座における各リードへの確率の割り当ておよび最高確率での塩基のコールのいずれかを含む。一部の実施形態において、本方法は、2種の遺伝子座において行われ、遺伝子座のそれぞれにおける計数に基づき、遺伝子座のうち1種におけるCNVを決定するステップを含む。
別の態様は、試料における二本鎖DNA断片の数を示す定量的尺度を決定するための方法であって、(a)両方の鎖が検出された個々のDNA分子の定量的尺度を決定するステップと、(b)DNA鎖の一方のみが検出された個々のDNA分子の定量的尺度を決定するステップと、(c)上述の(a)および(b)から、どちらの鎖も検出されなかった個々のDNA分子の定量的尺度を推測するステップと、(d)(a)~(c)を使用して、試料における個々の二本鎖DNA断片の数を示す定量的尺度を決定するステップとを含む方法を提供する。
一部の実施形態において、本方法は、1種または複数の遺伝子座のそれぞれにおけるステップ(d)において決定された正規化された定量的尺度を決定し、正規化された尺度に基づきコピー数バリエーションを決定することにより、試料におけるコピー数バリエーションを検出するステップをさらに含む。一部の実施形態において、試料は、無細胞核酸から実質的に供給される二本鎖ポリヌクレオチド分子を含む。
一部の実施形態において、個々のDNA分子の定量的尺度を決定するステップは、DNA分子に二重鎖タグのセットをタグ付けするステップを含み、各二重鎖タグは、試料における二本鎖DNA分子の相補鎖を異なってタグ付けして、タグ付けされた鎖を用意する。一部の実施形態において、本方法は、タグ付けされた鎖の少なくとも一部を配列決定して、配列リードのセットを産生するステップをさらに含む。一部の実施形態において、本方法は、配列リードをペア形成されたリードおよびペア形成されないリードへと選別するステップであって、(i)各ペア形成されたリードは、セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なってタグ付けされた相補鎖から生成された配列リードに対応し、(ii)各ペア形成されないリードは、配列リードのセットにおける配列リードの中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なってタグ付けされた相補鎖を持たない第1のタグ付けされた鎖を表すステップを含む。一部の実施形態において、本方法は、1種または複数の遺伝子座のそれぞれにマッピングする(i)ペア形成されたリードおよび(ii)ペア形成されないリードの定量的尺度を決定して、各遺伝子座にマッピングするペア形成されたリードおよびペア形成されないリードの定量的尺度に基づき、1種または複数の遺伝子座のそれぞれにマッピングする試料における総二本鎖DNA分子の定量的尺度を決定するステップをさらに含む。
別の態様において、配列決定アッセイにおける歪みを低下させるための方法は、(a)対照親ポリヌクレオチドに第1のタグセットをタグ付けして、タグ付けされた対照親ポリヌクレオチドを産生するステップと、(b)被験親ポリヌクレオチドに第2のタグセットをタグ付けして、タグ付けされた被験親ポリヌクレオチドを産生するステップと、(c)タグ付けされた対照親ポリヌクレオチドをタグ付けされた被験親ポリヌクレオチドと混合して、プールを形成するステップと、(d)タグ付けされた対照親ポリヌクレオチドおよびタグ付けされた被験親ポリヌクレオチドの分量を決定するステップと、(e)タグ付けされた対照親ポリヌクレオチドの分量を使用して、タグ付けされた被験親ポリヌクレオチドの分量における歪みを低下させるステップとを含む。
一部の実施形態において、第1のタグセットは、複数のタグを含み、第1のタグセットにおける各タグは、同じ対照タグおよび同定タグを含み、第1のタグセットは、複数の異なる同定タグを含む。一部の実施形態において、第2のタグセットは、複数のタグを含み、第2のタグセットにおける各タグは、同じ被験タグおよび同定タグを含み、被験タグは、対照タグから識別可能であり、第2のタグセットは、複数の異なる同定タグを含む。一部の実施形態において、(d)は、プールにおけるタグ付けされた親ポリヌクレオチドを増幅して、増幅されたタグ付けされたポリヌクレオチドのプールを形成するステップと、増幅されたプールにおける増幅されたタグ付けされたポリヌクレオチドを配列決定して、複数の配列リードを産生するステップとを含む。一部の実施形態において、本方法は、配列リードをファミリーへと群分けするステップをさらに含み、各ファミリーは、同じ親ポリヌクレオチドから生成された配列リードを含み、この群分けは、任意選択で、同定タグおよび親ポリヌクレオチドの開始/終了配列由来の情報に基づくステップと、任意選択で、群における複数の配列リード由来の複数の親ポリヌクレオチドのそれぞれのコンセンサス配列を決定するステップを含む。
一部の実施形態において、(d)は、遺伝子座にマッピングする被験親ポリヌクレオチドおよび対照親ポリヌクレオチドの相対的分量に基づき、1種を超えるまたはそれに等しい遺伝子座における被験親ポリヌクレオチドにおけるコピー数バリエーションを決定するステップを含む。
別の態様は、(a)二本鎖DNAポリヌクレオチド由来の挿入物を含み、4~百万種の間の異なるタグを有するタグ付けされたライブラリーを産生するように、アダプタを二本鎖DNAポリヌクレオチドにライゲーションするステップであって、ライゲーションが、単一の反応容器内で行われ、アダプタが、分子バーコードを含むステップと、(b)タグ付けされたライブラリーにおける二本鎖DNAポリヌクレオチドのそれぞれの複数の配列リードを生成するステップと、(c)タグにおける情報および挿入物の末端における情報に基づき、配列リードをファミリーへと群分けするステップであって、各ファミリーが、二本鎖DNAポリヌクレオチドの中の単一DNAポリヌクレオチドから生成された配列リードを含むステップと、(d)ファミリーのメンバーにおける位置における塩基に基づき、二本鎖DNA分子における各位置における塩基をコールするステップとを含む方法を提供する。一部の実施形態において、(b)は、タグ付けされたライブラリーにおける二本鎖DNAポリヌクレオチド分子のそれぞれを増幅して、増幅産物を生成するステップと、増幅産物を配列決定するステップとを含む。一部の実施形態において、本方法は、二本鎖DNAポリヌクレオチド分子を複数回配列決定するステップをさらに含む。一部の実施形態において、(b)は、挿入物全体を配列決定するステップを含む。一部の実施形態において、(c)は、各ファミリーにおける配列リードを崩壊させて、コンセンサス配列を生成するステップをさらに含む。一部の実施形態において、(d)は、配列リードの少なくともサブセット由来の複数の連続的塩基をコールして、二本鎖DNA分子における単一ヌクレオチドバリエーション(SNV)を同定するステップを含む。
別の態様は、体細胞および疾患細胞由来のポリヌクレオチドを含む試料から疾患細胞異種性を検出する方法を提供する。本方法は、複数の遺伝子座のそれぞれにヌクレオチド配列バリアントを有する試料におけるポリヌクレオチドを定量化するステップと、複数の遺伝子座のそれぞれにおけるコピー数バリエーション(CNV)を決定するステップであって、CNVが、疾患細胞ポリヌクレオチドにおける遺伝子座の遺伝子量を示すステップと、プログラムされたコンピュータプロセッサにより、複数の遺伝子座のそれぞれの遺伝子座における遺伝子量当たりの遺伝子座における配列バリアントを有するポリヌクレオチドの分量の相対的尺度を決定するステップと、複数の遺伝子座のそれぞれにおける相対的尺度を比較するステップであって、異なる相対的尺度が、腫瘍異種性を示すステップとを含む。
別の態様において、方法は、対象を1または複数のパルス治療サイクルに供するステップであって、各パルス治療サイクルが、(a)第1の量で薬物が投与される第1の期間および(b)第2の低下した量で薬物が投与される第2の期間を含むステップを含み、(i)第1の期間は、第1の臨床レベルを上回って検出される腫瘍負荷によって特徴付けられ、(ii)第2の期間は、第2の臨床レベルを下回って検出される腫瘍負荷によって特徴付けられる。
本発明は、例えば、以下の項目を提供する。
(項目1)
試料における個々の二本鎖デオキシリボ核酸(DNA)分子の数を示す定量的尺度を決定するための方法であって、
(a)両方の鎖が検出された個々のDNA分子の定量的尺度を決定するステップと、
(b)DNA鎖の一方のみが検出された個々のDNA分子の定量的尺度を決定するステップと、
(c)上述の(a)および(b)から、どちらの鎖も検出されなかった個々のDNA分子の定量的尺度を推測するステップと、
(d)(a)~(c)を使用して、前記試料における個々の二本鎖DNA分子の数を示す前記定量的尺度を決定するステップと
を含む方法。
(項目2)
1種または複数の遺伝子座のそれぞれにおけるステップ(d)において決定された正規化された定量的尺度を決定し、前記正規化された尺度に基づきコピー数バリエーションを決定することにより、前記試料におけるコピー数バリエーションを検出するステップをさらに含む、項目1に記載の方法。
(項目3)
前記試料が、無細胞核酸から実質的に供給される二本鎖ポリヌクレオチド分子を含む、項目1に記載の方法。
(項目4)
個々のDNA分子の前記定量的尺度を決定するステップが、前記DNA分子に二重鎖タグのセットをタグ付けするステップを含み、各二重鎖タグが、前記試料における二本鎖DNA分子の相補鎖を異なってタグ付けして、タグ付けされた鎖を用意する、項目1に記載の方法。
(項目5)
前記タグ付けされた鎖の少なくとも一部を配列決定して、配列リードのセットを産生するステップをさらに含む、項目4に記載の方法。
(項目6)
配列リードをペア形成されたリードおよびペア形成されないリードへと選別するステップであって、(i)各ペア形成されたリードが、前記セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なってタグ付けされた相補鎖から生成された配列リードに対応し、(ii)各ペア形成されないリードが、配列リードの前記セットにおける前記配列リードの中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なってタグ付けされた相補鎖を持たない第1のタグ付けされた鎖を表すステップをさらに含む、項目5に記載の方法。
(項目7)
1種または複数の遺伝子座のそれぞれにマッピングする(i)前記ペア形成されたリードおよび(ii)前記ペア形成されないリードの定量的尺度を決定して、各遺伝子座にマッピングするペア形成されたリードおよびペア形成されないリードの前記定量的尺度に基づき、前記1種または複数の遺伝子座のそれぞれにマッピングする前記試料における総二本鎖DNA分子の定量的尺度を決定するステップをさらに含む、項目6に記載の方法。
(項目8)
配列決定アッセイにおける歪みを低下させるための方法であって、
(a)対照親ポリヌクレオチドに第1のタグセットをタグ付けして、タグ付けされた対照親ポリヌクレオチドを産生するステップと、
(b)被験親ポリヌクレオチドに第2のタグセットをタグ付けして、タグ付けされた被験親ポリヌクレオチドを産生するステップと、
(c)タグ付けされた対照親ポリヌクレオチドをタグ付けされた被験親ポリヌクレオチドと混合して、プールを形成するステップと、
(d)タグ付けされた対照親ポリヌクレオチドおよびタグ付けされた被験親ポリヌクレオチドの分量を決定するステップと、
(e)タグ付けされた対照親ポリヌクレオチドの前記分量を使用して、タグ付けされた被験親ポリヌクレオチドの前記分量における歪みを低下させるステップと
を含む方法。
(項目9)
前記第1のタグセットが、複数のタグを含み、前記第1のタグセットにおける各タグが、同じ対照タグおよび同定タグを含み、前記第1のタグセットが、複数の異なる同定タグを含む、項目8に記載の方法。
(項目10)
前記第2のタグセットが、複数のタグを含み、前記第2のタグセットにおける各タグが、同じ被験タグおよび同定タグを含み、前記被験タグが、前記対照タグから識別可能であり、前記第2のタグセットが、複数の異なる同定タグを含む、項目9に記載の方法。
(項目11)
(d)が、前記プールにおけるタグ付けされた親ポリヌクレオチドを増幅して、増幅されたタグ付けされたポリヌクレオチドのプールを形成するステップと、前記増幅されたプールにおける増幅されたタグ付けされたポリヌクレオチドを配列決定して、複数の配列リードを産生するステップとを含む、項目9に記載の方法。
(項目12)
配列リードをファミリーへと群分けするステップであって、各ファミリーが、同じ親ポリヌクレオチドから生成された配列リードを含み、この群分けが、任意選択で、同定タグおよび前記親ポリヌクレオチドの開始/終了配列由来の情報に基づくステップと、任意選択で、群における前記複数の配列リード由来の複数の親ポリヌクレオチドのそれぞれのコンセンサス配列を決定するステップとをさらに含む、項目11に記載の方法。
(項目13)
(d)が、遺伝子座にマッピングする被験親ポリヌクレオチドおよび対照親ポリヌクレオチドの相対的分量に基づき、1種を超えるまたはそれに等しい前記遺伝子座における前記被験親ポリヌクレオチドにおけるコピー数バリエーションを決定するステップを含む、項目8に記載の方法。
(項目14)
分子バーコードを有する複数のポリヌクレオチド分子を含むライブラリーアダプタのセットであって、前記複数のポリヌクレオチド分子が、80ヌクレオチド塩基未満またはそれに等しい長さであり、前記分子バーコードが、少なくとも4ヌクレオチド塩基の長さであり、
(a)前記分子バーコードが、互いに異なり、互いの間に少なくとも1の編集距離を有し、
(b)前記分子バーコードが、それぞれのポリヌクレオチド分子の末端から少なくとも1ヌクレオチド塩基離れて位置し、
(c)任意選択で、少なくとも1末端塩基が、前記ポリヌクレオチド分子の全てにおいて同一であり、
(d)前記ポリヌクレオチド分子のいずれも、完全シーケンサーモチーフを含有しない
ライブラリーアダプタのセット。
(項目15)
前記ポリヌクレオチド分子が、前記分子バーコードを除いて同一である、項目14に記載のライブラリーアダプタのセット。
(項目16)
前記複数のポリヌクレオチド分子のそれぞれが、二本鎖部分および少なくとも1個の一本鎖部分を有する、項目14に記載のライブラリーアダプタのセット。
(項目17)
前記二本鎖部分が、複数の前記分子バーコードの中の1つの分子バーコードを有する、項目16に記載のライブラリーアダプタのセット。
(項目18)
前記所与の分子バーコードが、ランダマーである、項目17に記載のライブラリーアダプタのセット。
(項目19)
前記複数のポリヌクレオチド分子のそれぞれが、前記少なくとも1個の一本鎖部分に鎖同定バーコードをさらに含む、項目16に記載のライブラリーアダプタのセット。
(項目20)
前記鎖同定バーコードが、少なくとも4ヌクレオチド塩基を含む、項目19に記載のライブラリーアダプタのセット。
(項目21)
前記一本鎖部分が、部分的シーケンサーモチーフを有する、項目16に記載のライブラリーアダプタのセット。
(項目22)
前記ポリヌクレオチド分子が、同じである末端ヌクレオチドの配列を有する、項目14に記載のライブラリーアダプタのセット。
(項目23)
前記複数のポリヌクレオチド分子のそれぞれが、Y字形、バブル形またはヘアピン形である、項目14に記載のライブラリーアダプタのセット。
(項目24)
前記ポリヌクレオチド分子のいずれも、試料同定モチーフを含有しない、項目14に記載のライブラリーアダプタのセット。
(項目25)
前記分子バーコードが、少なくとも10ヌクレオチド塩基の長さである、項目14に記載のライブラリーアダプタのセット。
(項目26)
前記複数のポリヌクレオチド分子のそれぞれが、10ヌクレオチド塩基~60ヌクレオチド塩基の長さである、項目14に記載のライブラリーアダプタのセット。
(項目27)
前記少なくとも1末端塩基が、前記ポリヌクレオチド分子の全てにおいて同一である、項目14に記載のライブラリーアダプタのセット。
(項目28)
前記分子バーコードが、それぞれのポリヌクレオチド分子の末端から少なくとも10ヌクレオチド塩基離れて位置する、項目14に記載のライブラリーアダプタのセット。
(項目29)
前記複数のポリヌクレオチド分子から本質的になる、項目14に記載のライブラリーアダプタのセット。
(項目30)
(a)項目14に記載のアダプタのライブラリー由来の複数のポリヌクレオチド分子をポリヌクレオチドのコレクションにタグ付けして、タグ付けされたポリヌクレオチドのコレクションを作製するステップと、
(b)配列決定アダプタの存在下で、タグ付けされたポリヌクレオチドの前記コレクションを増幅するステップであって、前記配列決定アダプタが、前記複数のポリヌクレオチド分子における相補的配列に選択的にハイブリダイズ可能なヌクレオチド配列を有するプライマーを有するステップと
を含む方法。
(項目31)
本来のDNA断片の異種性集団における稀なデオキシリボ核酸(DNA)を検出または定量化するための方法であって、前記稀なDNAが、1%未満である濃度を有し、前記方法が、
(a)前記本来のDNA断片の30%超が、分子バーコードを含むライブラリーアダプタを両端にタグ付けされるように、単一の反応において前記本来のDNA断片にタグ付けし、これにより、タグ付けされたDNA断片を用意するステップと、
(b)前記タグ付けされたDNA断片において高忠実度増幅を行うステップと、
(c)任意選択で、前記タグ付けされたDNA断片のサブセットを選択的に濃縮するステップと、
(d)前記タグ付けされ、増幅され、任意選択で選択的に濃縮されたDNA断片の一方または両方の鎖を配列決定して、前記分子バーコードおよび前記本来のDNA断片の少なくとも一部分のヌクレオチド配列を含む配列リードを得るステップと、
(e)前記配列リードから、前記本来のDNA断片の一本鎖の代表となるコンセンサスリードを決定するステップと、
(f)前記コンセンサスリードを定量化して、99.9%を超える特異性で、前記稀なDNAを検出または定量化するステップと
を含む方法。
(項目32)
ステップ(e)が、同じまたは類似の分子バーコードおよび同じまたは類似の断片配列の末端を有する配列リードを比較するステップを含む、項目31に記載の方法。
(項目33)
前記比較するステップが、同じまたは類似の分子バーコードを有する前記配列リードにおける系統発生解析を実行するステップをさらに含む、項目32に記載の方法。
(項目34)
前記分子バーコードが、最大3の編集距離を有するバーコードを含む、項目32に記載の方法。
(項目35)
前記断片配列の末端が、最大3の編集距離を有する断片配列を含む、項目31に記載の方法。
(項目36)
配列リードをペア形成されたリードおよびペア形成されないリードへと選別するステップと、1種または複数の遺伝子座のそれぞれにマッピングするペア形成されたリードおよびペア形成されないリードの数を定量化するステップとをさらに含む、項目31に記載の方法。
(項目37)
前記タグ付けが、本来のDNA断片と比較して過剰量のライブラリーアダプタを有することにより起こる、項目31に記載の方法。
(項目38)
前記分子バーコードおよび前記本来のDNA断片のそれぞれの少なくとも一端由来の配列情報に従って前記配列リードをビニングして、一本鎖リードのビンを作製するステップをさらに含む、項目31に記載の方法。
(項目39)
各ビンにおいて、配列リードを解析することにより、前記本来のDNA断片の中の所与の本来のDNA断片の配列を決定するステップをさらに含む、項目38に記載の方法。
(項目40)
前記タグ付けされ、増幅され、任意選択で濃縮されたDNA断片によって表されるゲノムの各位置において各塩基が生じる回数を比較することにより、前記稀なDNAを検出または定量化するステップをさらに含む、項目39に記載の方法。
(項目41)
前記タグ付けされたDNA断片のサブセットを選択的に濃縮するステップをさらに含む、項目31に記載の方法。
(項目42)
濃縮後に、プライマーを含む配列決定アダプタの存在下で、前記濃縮されたタグ付けされたDNA断片を増幅するステップをさらに含む、項目41に記載の方法。
(項目43)
前記DNA断片が、項目1に記載のアダプタのライブラリー由来のポリヌクレオチド分子をタグ付けされる、項目31に記載の方法。
(項目44)
対象の核酸試料を処理および/または解析するための方法であって、
(a)前記核酸試料由来のポリヌクレオチド断片をライブラリーアダプタのセットに曝露して、タグ付けされたポリヌクレオチド断片を生成するステップと、
(b)前記タグ付けされたポリヌクレオチド断片の増幅産物として増幅されたポリヌクレオチド断片を生じる条件下で、前記タグ付けされたポリヌクレオチド断片を核酸増幅反応に供するステップとを含み、
前記ライブラリーアダプタのセットが、分子バーコードを有する複数のポリヌクレオチド分子を含み、前記複数のポリヌクレオチド分子が、80ヌクレオチド塩基未満またはそれに等しい長さであり、前記分子バーコードが、少なくとも4ヌクレオチド塩基の長さであり、
(1)前記分子バーコードが、互いに異なり、互いの間に少なくとも1の編集距離を有し、
(2)前記分子バーコードが、それぞれのポリヌクレオチド分子の末端から少なくとも1ヌクレオチド塩基離れて位置し、
(3)任意選択で、少なくとも1末端塩基が、前記ポリヌクレオチド分子の全てにおいて同一であり、
(4)前記ポリヌクレオチド分子のいずれも、完全シーケンサーモチーフを含有しない方法。
(項目45)
前記増幅されたタグ付けされたポリヌクレオチド断片のヌクレオチド配列を決定するステップをさらに含む、項目44に記載の方法。
(項目46)
前記増幅されたタグ付けされたポリヌクレオチド断片の前記ヌクレオチド配列が、ポリメラーゼ連鎖反応(PCR)なしで決定される、項目45に記載の方法。
(項目47)
プログラムされたコンピュータプロセッサにより前記ヌクレオチド配列を解析して、前記対象の前記ヌクレオチド試料における1種または複数の遺伝的バリアントを同定するステップをさらに含む、項目45に記載の方法。
(項目48)
前記核酸試料が、無細胞核酸試料である、項目44に記載の方法。
(項目49)
前記核酸試料の前記ポリヌクレオチド断片を前記複数のポリヌクレオチド分子に曝露するステップが、少なくとも10%の変換効率で、前記タグ付けされたポリヌクレオチド断片を生じる、項目44に記載の方法。
(項目50)
前記供するステップが、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択される遺伝子に対応する配列から前記タグ付けされたポリヌクレオチド断片を増幅するステップを含む、項目44に記載の方法。
(項目51)
(a)複数のポリヌクレオチド分子から複数の配列リードを生成するステップであって、前記複数のポリヌクレオチド分子が、標的ゲノムのゲノム遺伝子座を網羅し、前記ゲノム遺伝子座が、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択される複数の遺伝子に対応するステップと、
(b)コンピュータプロセッサにより、前記複数の配列リードをファミリーへと群分けするステップであって、各ファミリーが、鋳型ポリヌクレオチドのうち1種に由来する配列リードを含むステップと、
(c)前記ファミリーのそれぞれに対し、配列リードを統合して、コンセンサス配列を生成するステップと、
(d)前記ゲノム遺伝子座の中の所与のゲノム遺伝子座において前記コンセンサス配列をコールするステップと、
(e)前記所与のゲノム遺伝子座において、
i.前記コールの中の遺伝的バリアント、
ii.前記コールの中の遺伝子変更の頻度、
iii.コールの総数、および
iv.前記コールの中の変更の総数
のいずれかを検出するステップと
を含む方法。
(項目52)
各ファミリーが、前記鋳型ポリヌクレオチドのうち1種のみに由来する配列リードを含む、項目51に記載の方法。
(項目53)
前記ゲノム遺伝子座の中の追加的なゲノム遺伝子座において(d)~(e)を行うステップをさらに含む、項目51に記載の方法。
(項目54)
前記所与のゲノム遺伝子座および追加的なゲノム遺伝子座における計数に基づき、前記所与のゲノム遺伝子座および追加的なゲノム遺伝子座のうち1種におけるコピー数のバリエーションを決定するステップをさらに含む、項目53に記載の方法。
(項目55)
前記群分けするステップが、(i)前記複数のポリヌクレオチド分子にカップリングされた別個の分子バーコードおよび(ii)前記複数の配列リードの間の類似性を同定することにより、前記複数の配列リードをファミリーへと分類するステップを含み、各ファミリーが、分子バーコードおよび類似または同一の配列リードの別個の組合せに関連する複数の核酸配列を含む、項目51に記載の方法。
(項目56)
前記コンセンサス配列が、前記配列リードのそれぞれの定量的尺度または統計的有意性レベルを評価することにより生成される、項目51に記載の方法。
(項目57)
前記複数の遺伝子が、前記群から選択される前記複数の遺伝子のうち少なくとも10種を含む、項目51に記載のシステム。
(項目58)
(a)単一の反応容器内に鋳型ポリヌクレオチド分子およびライブラリーアダプタのセットを用意するステップであって、前記ライブラリーアダプタが、異なる分子バーコードを有するポリヌクレオチド分子であり、前記ライブラリーアダプタのいずれも、完全シーケンサーモチーフを含有しないステップと、
(b)前記単一の反応容器内で、少なくとも10%の効率で、前記ライブラリーアダプタを前記鋳型ポリヌクレオチド分子にカップリングし、これにより、複数の異なるタグ付け組合せの中にあるタグ付け組合せを各鋳型ポリヌクレオチドにタグ付けして、タグ付けされたポリヌクレオチド分子を産生するステップと、
(c)前記タグ付けされたポリヌクレオチド分子の増幅産物として増幅されたポリヌクレオチド分子を生じる条件下で、前記タグ付けされたポリヌクレオチド分子を増幅反応に供するステップと、
(d)前記増幅されたポリヌクレオチド分子を配列決定するステップと
を含む方法。
(項目59)
前記ライブラリーアダプタが、前記分子バーコードを除いて同一である、項目58に記載の方法。
(項目60)
前記ライブラリーアダプタのそれぞれが、二本鎖部分および少なくとも1個の一本鎖部分を有し、前記一本鎖部分が、部分的シーケンサーモチーフを有する、項目58に記載の方法。
(項目61)
前記ライブラリーアダプタが、前記鋳型ポリヌクレオチド分子の両端にカップリングする、項目58に記載の方法。
(項目62)
前記効率が、少なくとも30%である、項目58に記載の方法。
(項目63)
前記増幅されたポリヌクレオチド分子の配列決定の際に遺伝的バリアントを同定するステップをさらに含む、項目58に記載の方法。
(項目64)
前記配列決定するステップが、(i)前記増幅されたポリヌクレオチド分子の増幅産物として追加的な増幅されたポリヌクレオチド分子を生じる条件下で、前記増幅されたポリヌクレオチド分子を追加的な増幅反応に供するステップと、(ii)前記追加的な増幅されたポリヌクレオチド分子を配列決定するステップとを含む、項目58に記載の方法。
(項目65)
前記追加的な増幅が、配列決定アダプタの存在下で行われる、項目64に記載の方法。(項目66)
(b)および(c)が、前記タグ付けされたポリヌクレオチド分子をアリコートにすることなく行われる、項目58に記載の方法。
(項目67)
対象の標的核酸分子を解析するためのシステムであって、
標的ゲノムのゲノム遺伝子座を網羅する複数のポリヌクレオチド分子の核酸配列リードを受け取る通信インターフェイスと、
前記通信インターフェイスによって受け取られた前記複数のポリヌクレオチド分子の前記核酸配列リードを記憶するコンピュータメモリと、
前記通信インターフェイスおよび前記メモリに作動可能にカップリングされ、(i)前記複数の配列リードを、各ファミリーが、前記鋳型ポリヌクレオチドのうち1種に由来する配列リードを含むファミリーへと群分けし、(ii)前記ファミリーのそれぞれに対し、配列リードを統合して、コンセンサス配列を生成し、(iii)前記ゲノム遺伝子座の中の所与のゲノム遺伝子座において前記コンセンサス配列をコールし、(iv)前記所与のゲノム遺伝子座において、前記コールの中の遺伝的バリアント、前記コールの中の遺伝子変更の頻度、コールの総数および前記コールの中の変更の総数のいずれかを検出するようにプログラムされたコンピュータプロセッサと
を含み、前記ゲノム遺伝子座が、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択される複数の遺伝子に対応する
システム。
(項目68)
ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択される少なくとも5種の遺伝子に選択的にハイブリダイズする、オリゴヌクレオチド分子のセット。
(項目69)
前記オリゴヌクレオチド分子が、10~200塩基の長さである、項目68に記載のセット。
(項目70)
前記オリゴヌクレオチド分子が、前記少なくとも5種の遺伝子のエクソン領域に選択的にハイブリダイズする、項目68に記載のキット。
(項目71)
前記オリゴヌクレオチド分子が、前記少なくとも5種の遺伝子における少なくとも30種のエクソンに選択的にハイブリダイズする、項目70に記載のキット。
(項目72)
複数のオリゴヌクレオチド分子が、前記少なくとも30種のエクソンのそれぞれに選択的にハイブリダイズする、項目71に記載のキット。
(項目73)
各エクソンにハイブリダイズする前記オリゴヌクレオチド分子が、少なくとも1種の他のオリゴヌクレオチド分子と重複する配列を有する、項目72に記載のキット。
(項目74)
それぞれ異なる分子バーコードを有する複数のライブラリーアダプタを含有する第1の容器と、
複数の配列決定アダプタを含有する第2の容器であって、各配列決定アダプタが、シーケンサーモチーフの少なくとも一部分および任意選択で試料バーコードを含む第2の容器と
を含むキット。
(項目75)
前記配列決定アダプタが、前記試料バーコードを含む、項目74に記載のキット。
(項目76)
無細胞DNA試料における配列バリアントを検出するための方法であって、99.9%を超える特異性で、1%未満の濃度の稀なDNAを検出するステップを含む、方法。
(項目77)
(a)二本鎖ポリヌクレオチド分子のセットを含む試料を用意するステップであって、各二本鎖ポリヌクレオチド分子が、第1および第2の相補鎖を含むステップと、
(b)前記二本鎖ポリヌクレオチド分子に二重鎖タグのセットをタグ付けするステップであって、各二重鎖タグが、前記セットにおける二本鎖ポリヌクレオチド分子の前記第1および第2の相補鎖を異なってタグ付けするステップと、
(c)前記タグ付けされた鎖の少なくとも一部を配列決定して、配列リードのセットを産生するステップと、
(d)配列リードの前記セットにおける冗長性を低下および/または追跡するステップと、
(e)配列リードをペア形成されたリードおよびペア形成されないリードへと選別するステップであって、(i)各ペア形成されたリードが、前記セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なってタグ付けされた相補鎖から生成された配列リードに対応し、(ii)各ペア形成されないリードが、配列リードの前記セットにおける前記配列リードの中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なってタグ付けされた相補鎖を持たない第1のタグ付けされた鎖を表すステップと、
(f)1種または複数の遺伝子座のそれぞれにマッピングする(i)前記ペア形成されたリードおよび(ii)前記ペア形成されないリードの定量的尺度を決定するステップと、(g)プログラムされたコンピュータプロセッサにより、各遺伝子座にマッピングするペア形成されたリードおよびペア形成されないリードの前記定量的尺度に基づき、前記1種または複数の遺伝子座のそれぞれにマッピングする前記セットにおける総二本鎖ポリヌクレオチド分子の定量的尺度を推定するステップと
を含む方法。
(項目78)
(h)前記1種または複数の遺伝子座のそれぞれにおけるステップ(g)において決定された正規化された総定量的尺度を決定し、前記正規化された尺度に基づきコピー数バリエーションを決定することにより、前記試料におけるコピー数バリエーションを検出するステップをさらに含む、項目77に記載の方法。
(項目79)
前記試料が、無細胞核酸から実質的に供給される二本鎖ポリヌクレオチド分子を含む、項目77に記載の方法。
(項目80)
前記二重鎖タグが、配列決定アダプタではない、項目77に記載の方法。
(項目81)
配列リードの前記セットにおける冗長性を低下させるステップが、前記試料における本来のポリヌクレオチド分子の増幅された産物から産生された配列リードを、前記本来のポリヌクレオチド分子に戻るよう崩壊させるステップを含む、項目77に記載の方法。
(項目82)
前記本来のポリヌクレオチド分子のコンセンサス配列を決定するステップをさらに含む、項目81に記載の方法。
(項目83)
配列バリアントを含む1種または複数の遺伝子座におけるポリヌクレオチド分子を同定するステップをさらに含む、項目82に記載の方法。
(項目84)
遺伝子座にマッピングするペア形成されたリードの定量的尺度を決定するステップであって、前記ペアの両方の鎖が、配列バリアントを含むステップをさらに含む、項目82に記載の方法。
(項目85)
ペア形成された分子の定量的尺度を決定するステップであって、前記ペアの一方のメンバーのみが配列バリアントを有するステップ、および/または配列バリアントを有するペア形成されない分子の定量的尺度を決定するステップをさらに含む、項目84に記載の方法。
(項目86)
(a)シーケンサーからメモリへと、二重鎖タグをタグ付けされたポリヌクレオチドの配列リードのセットを受け取るステップと、
(b)配列リードの前記セットにおける冗長性を低下および/または追跡するステップと、
(c)配列リードをペア形成されたリードおよびペア形成されないリードへと選別するステップであって、(i)各ペア形成されたリードが、前記セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なってタグ付けされた相補鎖から生成された配列リードに対応し、(ii)各ペア形成されないリードが、配列リードの前記セットにおける前記配列リードの中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なってタグ付けされた相補鎖を持たない第1のタグ付けされた鎖を表すステップと、
(d)1種または複数の遺伝子座のそれぞれにマッピングする(i)前記ペア形成されたリードおよび(ii)前記ペア形成されないリードの定量的尺度を決定するステップと、(e)各遺伝子座にマッピングするペア形成されたリードおよびペア形成されないリードの前記定量的尺度に基づき、前記1種または複数の遺伝子座のそれぞれにマッピングする前記セットにおける総二本鎖ポリヌクレオチド分子の定量的尺度を推定するステップと
を含む方法。
(項目87)
(a)二本鎖ポリヌクレオチド分子のセットを含む試料を用意するステップであって、各二本鎖ポリヌクレオチド分子が、第1および第2の相補鎖を含むステップと、
(b)前記二本鎖ポリヌクレオチド分子に二重鎖タグのセットをタグ付けするステップであって、各二重鎖タグが、前記セットにおける二本鎖ポリヌクレオチド分子の前記第1および第2の相補鎖を異なってタグ付けするステップと、
(c)前記タグ付けされた鎖の少なくとも一部を配列決定して、配列リードのセットを産生するステップと、
(d)配列リードの前記セットにおける冗長性を低下および/または追跡するステップと、
(e)配列リードをペア形成されたリードおよびペア形成されないリードへと選別するステップであって、(i)各ペア形成されたリードが、前記セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なってタグ付けされた相補鎖から生成された配列リードに対応し、(ii)各ペア形成されないリードが、配列リードの前記セットにおける前記配列リードの中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なってタグ付けされた相補鎖を持たない第1のタグ付けされた鎖を表すステップと、
(f)(i)前記ペア形成されたリード、(ii)1種または複数の遺伝子座のそれぞれにマッピングする前記ペア形成されないリード、(iii)前記ペア形成されたリードのリード深度および(iv)ペア形成されないリードのリード深度のうち少なくとも2種の定量的尺度を決定するステップと
を含む方法。
(項目88)
(a)対照親ポリヌクレオチドに第1のタグセットをタグ付けして、タグ付けされた対照親ポリヌクレオチドを産生するステップであって、前記第1のタグセットが、複数のタグを含み、前記第1のタグセットにおける各タグが、同じ対照タグおよび同定タグを含み、前記タグセットが、複数の異なる同定タグを含むステップと、
(b)被験親ポリヌクレオチドに第2のタグセットをタグ付けして、タグ付けされた被験親ポリヌクレオチドを産生するステップであって、前記第2のタグセットが、複数のタグを含み、前記第2のタグセットにおける各タグが、前記対照タグおよび同定タグから識別可能な同じ被験タグを含み、前記第2のタグセットが、複数の異なる同定タグを含むステップと、
(c)タグ付けされた対照親ポリヌクレオチドをタグ付けされた被験親ポリヌクレオチドと混合して、プールを形成するステップと、
(d)前記プールにおけるタグ付けされた親ポリヌクレオチドを増幅して、増幅されたタグ付けされたポリヌクレオチドのプールを形成するステップと、
(e)前記増幅されたプールにおける増幅されたタグ付けされたポリヌクレオチドを配列決定して、複数の配列リードを産生するステップと、
(f)配列リードをファミリーへと群分けするステップであって、各ファミリーが、同じ親ポリヌクレオチドから生成された配列リードを含み、この群分けが、任意選択で、同定タグおよび前記親ポリヌクレオチドの開始/終了配列由来の情報に基づくステップと、任意選択で、群における前記複数の配列リード由来の複数の親ポリヌクレオチドのそれぞれのコンセンサス配列を決定するステップと、
(g)被験タグまたは対照タグを有することに基づき、対照親ポリヌクレオチドまたは被験親ポリヌクレオチドとして各ファミリーまたはコンセンサス配列を分類するステップと、
(h)少なくとも2種の遺伝子座のそれぞれにマッピングする対照親ポリヌクレオチドおよび対照被験ポリヌクレオチドの定量的尺度を決定するステップと、
(i)少なくとも1種の遺伝子座にマッピングする被験親ポリヌクレオチドおよび対照親ポリヌクレオチドの相対的分量に基づき、前記少なくとも1種の遺伝子座における前記被験親ポリヌクレオチドにおけるコピー数バリエーションを決定するステップと
を含む方法。
(項目89)
(a)複数の鋳型ポリヌクレオチドから複数の配列リードを生成するステップであって、各ポリヌクレオチドが、ゲノム遺伝子座にマッピングされるステップと、
(b)前記配列リードをファミリーへと群分けするステップであって、各ファミリーが、前記鋳型ポリヌクレオチドのうち1種から生成された配列リードを含むステップと、
(c)前記ファミリーのそれぞれに対し前記ゲノム遺伝子座においてヌクレオチド塩基または配列をコールするステップと、
(d)前記ゲノム遺伝子座において、
i.前記コールの中のゲノム変更、
ii.前記コールの中の遺伝子変更の頻度、
iii.コールの総数、
iv.前記コールの中の変更の総数
のいずれかを検出するステップと
を含む方法。
(項目90)
コールが、系統発生解析、投票、秤量、ファミリーにおける前記遺伝子座における各リードへの確率の割り当ておよび最高確率での前記ヌクレオチド塩基のコールのいずれかを含む、項目89に記載の方法。
(項目91)
2種の遺伝子座において行われ、前記遺伝子座のそれぞれにおける計数に基づき、前記遺伝子座のうち1種におけるCNVを決定するステップを含む、項目89に記載の方法。
(項目92)
(a)二本鎖デオキシリボ核酸(DNA)ポリヌクレオチド由来の挿入物を含み、4~百万種の間の異なるタグを有するタグ付けされたライブラリーを産生するように、アダプタを前記二本鎖DNAポリヌクレオチドにライゲーションするステップであって、ライゲーションが、単一の反応容器内で行われ、前記アダプタが、分子バーコードを含むステップと、
(b)前記タグ付けされたライブラリーにおける前記二本鎖DNAポリヌクレオチドのそれぞれの複数の配列リードを生成するステップと、
(c)タグにおける情報および前記挿入物の末端における情報に基づき、配列リードをファミリーへと群分けするステップであって、各ファミリーが、前記二本鎖DNAポリヌクレオチドの中の単一DNAポリヌクレオチドから生成された配列リードを含むステップと、
(d)ファミリーのメンバーにおける位置におけるヌクレオチド塩基に基づき、前記二本鎖DNA分子における前記各位置におけるヌクレオチド塩基をコールするステップと
を含む方法。
(項目93)
(d)が、前記配列リードの少なくともサブセット由来の複数の連続的塩基をコールして、前記二本鎖DNA分子における単一ヌクレオチドバリエーション(SNV)を同定するステップを含む、項目93に記載の方法。
本発明は、例えば、以下の項目を提供する。
(項目1)
試料における個々の二本鎖デオキシリボ核酸(DNA)分子の数を示す定量的尺度を決定するための方法であって、
(a)両方の鎖が検出された個々のDNA分子の定量的尺度を決定するステップと、
(b)DNA鎖の一方のみが検出された個々のDNA分子の定量的尺度を決定するステップと、
(c)上述の(a)および(b)から、どちらの鎖も検出されなかった個々のDNA分子の定量的尺度を推測するステップと、
(d)(a)~(c)を使用して、前記試料における個々の二本鎖DNA分子の数を示す前記定量的尺度を決定するステップと
を含む方法。
(項目2)
1種または複数の遺伝子座のそれぞれにおけるステップ(d)において決定された正規化された定量的尺度を決定し、前記正規化された尺度に基づきコピー数バリエーションを決定することにより、前記試料におけるコピー数バリエーションを検出するステップをさらに含む、項目1に記載の方法。
(項目3)
前記試料が、無細胞核酸から実質的に供給される二本鎖ポリヌクレオチド分子を含む、項目1に記載の方法。
(項目4)
個々のDNA分子の前記定量的尺度を決定するステップが、前記DNA分子に二重鎖タグのセットをタグ付けするステップを含み、各二重鎖タグが、前記試料における二本鎖DNA分子の相補鎖を異なってタグ付けして、タグ付けされた鎖を用意する、項目1に記載の方法。
(項目5)
前記タグ付けされた鎖の少なくとも一部を配列決定して、配列リードのセットを産生するステップをさらに含む、項目4に記載の方法。
(項目6)
配列リードをペア形成されたリードおよびペア形成されないリードへと選別するステップであって、(i)各ペア形成されたリードが、前記セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なってタグ付けされた相補鎖から生成された配列リードに対応し、(ii)各ペア形成されないリードが、配列リードの前記セットにおける前記配列リードの中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なってタグ付けされた相補鎖を持たない第1のタグ付けされた鎖を表すステップをさらに含む、項目5に記載の方法。
(項目7)
1種または複数の遺伝子座のそれぞれにマッピングする(i)前記ペア形成されたリードおよび(ii)前記ペア形成されないリードの定量的尺度を決定して、各遺伝子座にマッピングするペア形成されたリードおよびペア形成されないリードの前記定量的尺度に基づき、前記1種または複数の遺伝子座のそれぞれにマッピングする前記試料における総二本鎖DNA分子の定量的尺度を決定するステップをさらに含む、項目6に記載の方法。
(項目8)
配列決定アッセイにおける歪みを低下させるための方法であって、
(a)対照親ポリヌクレオチドに第1のタグセットをタグ付けして、タグ付けされた対照親ポリヌクレオチドを産生するステップと、
(b)被験親ポリヌクレオチドに第2のタグセットをタグ付けして、タグ付けされた被験親ポリヌクレオチドを産生するステップと、
(c)タグ付けされた対照親ポリヌクレオチドをタグ付けされた被験親ポリヌクレオチドと混合して、プールを形成するステップと、
(d)タグ付けされた対照親ポリヌクレオチドおよびタグ付けされた被験親ポリヌクレオチドの分量を決定するステップと、
(e)タグ付けされた対照親ポリヌクレオチドの前記分量を使用して、タグ付けされた被験親ポリヌクレオチドの前記分量における歪みを低下させるステップと
を含む方法。
(項目9)
前記第1のタグセットが、複数のタグを含み、前記第1のタグセットにおける各タグが、同じ対照タグおよび同定タグを含み、前記第1のタグセットが、複数の異なる同定タグを含む、項目8に記載の方法。
(項目10)
前記第2のタグセットが、複数のタグを含み、前記第2のタグセットにおける各タグが、同じ被験タグおよび同定タグを含み、前記被験タグが、前記対照タグから識別可能であり、前記第2のタグセットが、複数の異なる同定タグを含む、項目9に記載の方法。
(項目11)
(d)が、前記プールにおけるタグ付けされた親ポリヌクレオチドを増幅して、増幅されたタグ付けされたポリヌクレオチドのプールを形成するステップと、前記増幅されたプールにおける増幅されたタグ付けされたポリヌクレオチドを配列決定して、複数の配列リードを産生するステップとを含む、項目9に記載の方法。
(項目12)
配列リードをファミリーへと群分けするステップであって、各ファミリーが、同じ親ポリヌクレオチドから生成された配列リードを含み、この群分けが、任意選択で、同定タグおよび前記親ポリヌクレオチドの開始/終了配列由来の情報に基づくステップと、任意選択で、群における前記複数の配列リード由来の複数の親ポリヌクレオチドのそれぞれのコンセンサス配列を決定するステップとをさらに含む、項目11に記載の方法。
(項目13)
(d)が、遺伝子座にマッピングする被験親ポリヌクレオチドおよび対照親ポリヌクレオチドの相対的分量に基づき、1種を超えるまたはそれに等しい前記遺伝子座における前記被験親ポリヌクレオチドにおけるコピー数バリエーションを決定するステップを含む、項目8に記載の方法。
(項目14)
分子バーコードを有する複数のポリヌクレオチド分子を含むライブラリーアダプタのセットであって、前記複数のポリヌクレオチド分子が、80ヌクレオチド塩基未満またはそれに等しい長さであり、前記分子バーコードが、少なくとも4ヌクレオチド塩基の長さであり、
(a)前記分子バーコードが、互いに異なり、互いの間に少なくとも1の編集距離を有し、
(b)前記分子バーコードが、それぞれのポリヌクレオチド分子の末端から少なくとも1ヌクレオチド塩基離れて位置し、
(c)任意選択で、少なくとも1末端塩基が、前記ポリヌクレオチド分子の全てにおいて同一であり、
(d)前記ポリヌクレオチド分子のいずれも、完全シーケンサーモチーフを含有しない
ライブラリーアダプタのセット。
(項目15)
前記ポリヌクレオチド分子が、前記分子バーコードを除いて同一である、項目14に記載のライブラリーアダプタのセット。
(項目16)
前記複数のポリヌクレオチド分子のそれぞれが、二本鎖部分および少なくとも1個の一本鎖部分を有する、項目14に記載のライブラリーアダプタのセット。
(項目17)
前記二本鎖部分が、複数の前記分子バーコードの中の1つの分子バーコードを有する、項目16に記載のライブラリーアダプタのセット。
(項目18)
前記所与の分子バーコードが、ランダマーである、項目17に記載のライブラリーアダプタのセット。
(項目19)
前記複数のポリヌクレオチド分子のそれぞれが、前記少なくとも1個の一本鎖部分に鎖同定バーコードをさらに含む、項目16に記載のライブラリーアダプタのセット。
(項目20)
前記鎖同定バーコードが、少なくとも4ヌクレオチド塩基を含む、項目19に記載のライブラリーアダプタのセット。
(項目21)
前記一本鎖部分が、部分的シーケンサーモチーフを有する、項目16に記載のライブラリーアダプタのセット。
(項目22)
前記ポリヌクレオチド分子が、同じである末端ヌクレオチドの配列を有する、項目14に記載のライブラリーアダプタのセット。
(項目23)
前記複数のポリヌクレオチド分子のそれぞれが、Y字形、バブル形またはヘアピン形である、項目14に記載のライブラリーアダプタのセット。
(項目24)
前記ポリヌクレオチド分子のいずれも、試料同定モチーフを含有しない、項目14に記載のライブラリーアダプタのセット。
(項目25)
前記分子バーコードが、少なくとも10ヌクレオチド塩基の長さである、項目14に記載のライブラリーアダプタのセット。
(項目26)
前記複数のポリヌクレオチド分子のそれぞれが、10ヌクレオチド塩基~60ヌクレオチド塩基の長さである、項目14に記載のライブラリーアダプタのセット。
(項目27)
前記少なくとも1末端塩基が、前記ポリヌクレオチド分子の全てにおいて同一である、項目14に記載のライブラリーアダプタのセット。
(項目28)
前記分子バーコードが、それぞれのポリヌクレオチド分子の末端から少なくとも10ヌクレオチド塩基離れて位置する、項目14に記載のライブラリーアダプタのセット。
(項目29)
前記複数のポリヌクレオチド分子から本質的になる、項目14に記載のライブラリーアダプタのセット。
(項目30)
(a)項目14に記載のアダプタのライブラリー由来の複数のポリヌクレオチド分子をポリヌクレオチドのコレクションにタグ付けして、タグ付けされたポリヌクレオチドのコレクションを作製するステップと、
(b)配列決定アダプタの存在下で、タグ付けされたポリヌクレオチドの前記コレクションを増幅するステップであって、前記配列決定アダプタが、前記複数のポリヌクレオチド分子における相補的配列に選択的にハイブリダイズ可能なヌクレオチド配列を有するプライマーを有するステップと
を含む方法。
(項目31)
本来のDNA断片の異種性集団における稀なデオキシリボ核酸(DNA)を検出または定量化するための方法であって、前記稀なDNAが、1%未満である濃度を有し、前記方法が、
(a)前記本来のDNA断片の30%超が、分子バーコードを含むライブラリーアダプタを両端にタグ付けされるように、単一の反応において前記本来のDNA断片にタグ付けし、これにより、タグ付けされたDNA断片を用意するステップと、
(b)前記タグ付けされたDNA断片において高忠実度増幅を行うステップと、
(c)任意選択で、前記タグ付けされたDNA断片のサブセットを選択的に濃縮するステップと、
(d)前記タグ付けされ、増幅され、任意選択で選択的に濃縮されたDNA断片の一方または両方の鎖を配列決定して、前記分子バーコードおよび前記本来のDNA断片の少なくとも一部分のヌクレオチド配列を含む配列リードを得るステップと、
(e)前記配列リードから、前記本来のDNA断片の一本鎖の代表となるコンセンサスリードを決定するステップと、
(f)前記コンセンサスリードを定量化して、99.9%を超える特異性で、前記稀なDNAを検出または定量化するステップと
を含む方法。
(項目32)
ステップ(e)が、同じまたは類似の分子バーコードおよび同じまたは類似の断片配列の末端を有する配列リードを比較するステップを含む、項目31に記載の方法。
(項目33)
前記比較するステップが、同じまたは類似の分子バーコードを有する前記配列リードにおける系統発生解析を実行するステップをさらに含む、項目32に記載の方法。
(項目34)
前記分子バーコードが、最大3の編集距離を有するバーコードを含む、項目32に記載の方法。
(項目35)
前記断片配列の末端が、最大3の編集距離を有する断片配列を含む、項目31に記載の方法。
(項目36)
配列リードをペア形成されたリードおよびペア形成されないリードへと選別するステップと、1種または複数の遺伝子座のそれぞれにマッピングするペア形成されたリードおよびペア形成されないリードの数を定量化するステップとをさらに含む、項目31に記載の方法。
(項目37)
前記タグ付けが、本来のDNA断片と比較して過剰量のライブラリーアダプタを有することにより起こる、項目31に記載の方法。
(項目38)
前記分子バーコードおよび前記本来のDNA断片のそれぞれの少なくとも一端由来の配列情報に従って前記配列リードをビニングして、一本鎖リードのビンを作製するステップをさらに含む、項目31に記載の方法。
(項目39)
各ビンにおいて、配列リードを解析することにより、前記本来のDNA断片の中の所与の本来のDNA断片の配列を決定するステップをさらに含む、項目38に記載の方法。
(項目40)
前記タグ付けされ、増幅され、任意選択で濃縮されたDNA断片によって表されるゲノムの各位置において各塩基が生じる回数を比較することにより、前記稀なDNAを検出または定量化するステップをさらに含む、項目39に記載の方法。
(項目41)
前記タグ付けされたDNA断片のサブセットを選択的に濃縮するステップをさらに含む、項目31に記載の方法。
(項目42)
濃縮後に、プライマーを含む配列決定アダプタの存在下で、前記濃縮されたタグ付けされたDNA断片を増幅するステップをさらに含む、項目41に記載の方法。
(項目43)
前記DNA断片が、項目1に記載のアダプタのライブラリー由来のポリヌクレオチド分子をタグ付けされる、項目31に記載の方法。
(項目44)
対象の核酸試料を処理および/または解析するための方法であって、
(a)前記核酸試料由来のポリヌクレオチド断片をライブラリーアダプタのセットに曝露して、タグ付けされたポリヌクレオチド断片を生成するステップと、
(b)前記タグ付けされたポリヌクレオチド断片の増幅産物として増幅されたポリヌクレオチド断片を生じる条件下で、前記タグ付けされたポリヌクレオチド断片を核酸増幅反応に供するステップとを含み、
前記ライブラリーアダプタのセットが、分子バーコードを有する複数のポリヌクレオチド分子を含み、前記複数のポリヌクレオチド分子が、80ヌクレオチド塩基未満またはそれに等しい長さであり、前記分子バーコードが、少なくとも4ヌクレオチド塩基の長さであり、
(1)前記分子バーコードが、互いに異なり、互いの間に少なくとも1の編集距離を有し、
(2)前記分子バーコードが、それぞれのポリヌクレオチド分子の末端から少なくとも1ヌクレオチド塩基離れて位置し、
(3)任意選択で、少なくとも1末端塩基が、前記ポリヌクレオチド分子の全てにおいて同一であり、
(4)前記ポリヌクレオチド分子のいずれも、完全シーケンサーモチーフを含有しない方法。
(項目45)
前記増幅されたタグ付けされたポリヌクレオチド断片のヌクレオチド配列を決定するステップをさらに含む、項目44に記載の方法。
(項目46)
前記増幅されたタグ付けされたポリヌクレオチド断片の前記ヌクレオチド配列が、ポリメラーゼ連鎖反応(PCR)なしで決定される、項目45に記載の方法。
(項目47)
プログラムされたコンピュータプロセッサにより前記ヌクレオチド配列を解析して、前記対象の前記ヌクレオチド試料における1種または複数の遺伝的バリアントを同定するステップをさらに含む、項目45に記載の方法。
(項目48)
前記核酸試料が、無細胞核酸試料である、項目44に記載の方法。
(項目49)
前記核酸試料の前記ポリヌクレオチド断片を前記複数のポリヌクレオチド分子に曝露するステップが、少なくとも10%の変換効率で、前記タグ付けされたポリヌクレオチド断片を生じる、項目44に記載の方法。
(項目50)
前記供するステップが、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択される遺伝子に対応する配列から前記タグ付けされたポリヌクレオチド断片を増幅するステップを含む、項目44に記載の方法。
(項目51)
(a)複数のポリヌクレオチド分子から複数の配列リードを生成するステップであって、前記複数のポリヌクレオチド分子が、標的ゲノムのゲノム遺伝子座を網羅し、前記ゲノム遺伝子座が、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択される複数の遺伝子に対応するステップと、
(b)コンピュータプロセッサにより、前記複数の配列リードをファミリーへと群分けするステップであって、各ファミリーが、鋳型ポリヌクレオチドのうち1種に由来する配列リードを含むステップと、
(c)前記ファミリーのそれぞれに対し、配列リードを統合して、コンセンサス配列を生成するステップと、
(d)前記ゲノム遺伝子座の中の所与のゲノム遺伝子座において前記コンセンサス配列をコールするステップと、
(e)前記所与のゲノム遺伝子座において、
i.前記コールの中の遺伝的バリアント、
ii.前記コールの中の遺伝子変更の頻度、
iii.コールの総数、および
iv.前記コールの中の変更の総数
のいずれかを検出するステップと
を含む方法。
(項目52)
各ファミリーが、前記鋳型ポリヌクレオチドのうち1種のみに由来する配列リードを含む、項目51に記載の方法。
(項目53)
前記ゲノム遺伝子座の中の追加的なゲノム遺伝子座において(d)~(e)を行うステップをさらに含む、項目51に記載の方法。
(項目54)
前記所与のゲノム遺伝子座および追加的なゲノム遺伝子座における計数に基づき、前記所与のゲノム遺伝子座および追加的なゲノム遺伝子座のうち1種におけるコピー数のバリエーションを決定するステップをさらに含む、項目53に記載の方法。
(項目55)
前記群分けするステップが、(i)前記複数のポリヌクレオチド分子にカップリングされた別個の分子バーコードおよび(ii)前記複数の配列リードの間の類似性を同定することにより、前記複数の配列リードをファミリーへと分類するステップを含み、各ファミリーが、分子バーコードおよび類似または同一の配列リードの別個の組合せに関連する複数の核酸配列を含む、項目51に記載の方法。
(項目56)
前記コンセンサス配列が、前記配列リードのそれぞれの定量的尺度または統計的有意性レベルを評価することにより生成される、項目51に記載の方法。
(項目57)
前記複数の遺伝子が、前記群から選択される前記複数の遺伝子のうち少なくとも10種を含む、項目51に記載のシステム。
(項目58)
(a)単一の反応容器内に鋳型ポリヌクレオチド分子およびライブラリーアダプタのセットを用意するステップであって、前記ライブラリーアダプタが、異なる分子バーコードを有するポリヌクレオチド分子であり、前記ライブラリーアダプタのいずれも、完全シーケンサーモチーフを含有しないステップと、
(b)前記単一の反応容器内で、少なくとも10%の効率で、前記ライブラリーアダプタを前記鋳型ポリヌクレオチド分子にカップリングし、これにより、複数の異なるタグ付け組合せの中にあるタグ付け組合せを各鋳型ポリヌクレオチドにタグ付けして、タグ付けされたポリヌクレオチド分子を産生するステップと、
(c)前記タグ付けされたポリヌクレオチド分子の増幅産物として増幅されたポリヌクレオチド分子を生じる条件下で、前記タグ付けされたポリヌクレオチド分子を増幅反応に供するステップと、
(d)前記増幅されたポリヌクレオチド分子を配列決定するステップと
を含む方法。
(項目59)
前記ライブラリーアダプタが、前記分子バーコードを除いて同一である、項目58に記載の方法。
(項目60)
前記ライブラリーアダプタのそれぞれが、二本鎖部分および少なくとも1個の一本鎖部分を有し、前記一本鎖部分が、部分的シーケンサーモチーフを有する、項目58に記載の方法。
(項目61)
前記ライブラリーアダプタが、前記鋳型ポリヌクレオチド分子の両端にカップリングする、項目58に記載の方法。
(項目62)
前記効率が、少なくとも30%である、項目58に記載の方法。
(項目63)
前記増幅されたポリヌクレオチド分子の配列決定の際に遺伝的バリアントを同定するステップをさらに含む、項目58に記載の方法。
(項目64)
前記配列決定するステップが、(i)前記増幅されたポリヌクレオチド分子の増幅産物として追加的な増幅されたポリヌクレオチド分子を生じる条件下で、前記増幅されたポリヌクレオチド分子を追加的な増幅反応に供するステップと、(ii)前記追加的な増幅されたポリヌクレオチド分子を配列決定するステップとを含む、項目58に記載の方法。
(項目65)
前記追加的な増幅が、配列決定アダプタの存在下で行われる、項目64に記載の方法。(項目66)
(b)および(c)が、前記タグ付けされたポリヌクレオチド分子をアリコートにすることなく行われる、項目58に記載の方法。
(項目67)
対象の標的核酸分子を解析するためのシステムであって、
標的ゲノムのゲノム遺伝子座を網羅する複数のポリヌクレオチド分子の核酸配列リードを受け取る通信インターフェイスと、
前記通信インターフェイスによって受け取られた前記複数のポリヌクレオチド分子の前記核酸配列リードを記憶するコンピュータメモリと、
前記通信インターフェイスおよび前記メモリに作動可能にカップリングされ、(i)前記複数の配列リードを、各ファミリーが、前記鋳型ポリヌクレオチドのうち1種に由来する配列リードを含むファミリーへと群分けし、(ii)前記ファミリーのそれぞれに対し、配列リードを統合して、コンセンサス配列を生成し、(iii)前記ゲノム遺伝子座の中の所与のゲノム遺伝子座において前記コンセンサス配列をコールし、(iv)前記所与のゲノム遺伝子座において、前記コールの中の遺伝的バリアント、前記コールの中の遺伝子変更の頻度、コールの総数および前記コールの中の変更の総数のいずれかを検出するようにプログラムされたコンピュータプロセッサと
を含み、前記ゲノム遺伝子座が、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択される複数の遺伝子に対応する
システム。
(項目68)
ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択される少なくとも5種の遺伝子に選択的にハイブリダイズする、オリゴヌクレオチド分子のセット。
(項目69)
前記オリゴヌクレオチド分子が、10~200塩基の長さである、項目68に記載のセット。
(項目70)
前記オリゴヌクレオチド分子が、前記少なくとも5種の遺伝子のエクソン領域に選択的にハイブリダイズする、項目68に記載のキット。
(項目71)
前記オリゴヌクレオチド分子が、前記少なくとも5種の遺伝子における少なくとも30種のエクソンに選択的にハイブリダイズする、項目70に記載のキット。
(項目72)
複数のオリゴヌクレオチド分子が、前記少なくとも30種のエクソンのそれぞれに選択的にハイブリダイズする、項目71に記載のキット。
(項目73)
各エクソンにハイブリダイズする前記オリゴヌクレオチド分子が、少なくとも1種の他のオリゴヌクレオチド分子と重複する配列を有する、項目72に記載のキット。
(項目74)
それぞれ異なる分子バーコードを有する複数のライブラリーアダプタを含有する第1の容器と、
複数の配列決定アダプタを含有する第2の容器であって、各配列決定アダプタが、シーケンサーモチーフの少なくとも一部分および任意選択で試料バーコードを含む第2の容器と
を含むキット。
(項目75)
前記配列決定アダプタが、前記試料バーコードを含む、項目74に記載のキット。
(項目76)
無細胞DNA試料における配列バリアントを検出するための方法であって、99.9%を超える特異性で、1%未満の濃度の稀なDNAを検出するステップを含む、方法。
(項目77)
(a)二本鎖ポリヌクレオチド分子のセットを含む試料を用意するステップであって、各二本鎖ポリヌクレオチド分子が、第1および第2の相補鎖を含むステップと、
(b)前記二本鎖ポリヌクレオチド分子に二重鎖タグのセットをタグ付けするステップであって、各二重鎖タグが、前記セットにおける二本鎖ポリヌクレオチド分子の前記第1および第2の相補鎖を異なってタグ付けするステップと、
(c)前記タグ付けされた鎖の少なくとも一部を配列決定して、配列リードのセットを産生するステップと、
(d)配列リードの前記セットにおける冗長性を低下および/または追跡するステップと、
(e)配列リードをペア形成されたリードおよびペア形成されないリードへと選別するステップであって、(i)各ペア形成されたリードが、前記セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なってタグ付けされた相補鎖から生成された配列リードに対応し、(ii)各ペア形成されないリードが、配列リードの前記セットにおける前記配列リードの中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なってタグ付けされた相補鎖を持たない第1のタグ付けされた鎖を表すステップと、
(f)1種または複数の遺伝子座のそれぞれにマッピングする(i)前記ペア形成されたリードおよび(ii)前記ペア形成されないリードの定量的尺度を決定するステップと、(g)プログラムされたコンピュータプロセッサにより、各遺伝子座にマッピングするペア形成されたリードおよびペア形成されないリードの前記定量的尺度に基づき、前記1種または複数の遺伝子座のそれぞれにマッピングする前記セットにおける総二本鎖ポリヌクレオチド分子の定量的尺度を推定するステップと
を含む方法。
(項目78)
(h)前記1種または複数の遺伝子座のそれぞれにおけるステップ(g)において決定された正規化された総定量的尺度を決定し、前記正規化された尺度に基づきコピー数バリエーションを決定することにより、前記試料におけるコピー数バリエーションを検出するステップをさらに含む、項目77に記載の方法。
(項目79)
前記試料が、無細胞核酸から実質的に供給される二本鎖ポリヌクレオチド分子を含む、項目77に記載の方法。
(項目80)
前記二重鎖タグが、配列決定アダプタではない、項目77に記載の方法。
(項目81)
配列リードの前記セットにおける冗長性を低下させるステップが、前記試料における本来のポリヌクレオチド分子の増幅された産物から産生された配列リードを、前記本来のポリヌクレオチド分子に戻るよう崩壊させるステップを含む、項目77に記載の方法。
(項目82)
前記本来のポリヌクレオチド分子のコンセンサス配列を決定するステップをさらに含む、項目81に記載の方法。
(項目83)
配列バリアントを含む1種または複数の遺伝子座におけるポリヌクレオチド分子を同定するステップをさらに含む、項目82に記載の方法。
(項目84)
遺伝子座にマッピングするペア形成されたリードの定量的尺度を決定するステップであって、前記ペアの両方の鎖が、配列バリアントを含むステップをさらに含む、項目82に記載の方法。
(項目85)
ペア形成された分子の定量的尺度を決定するステップであって、前記ペアの一方のメンバーのみが配列バリアントを有するステップ、および/または配列バリアントを有するペア形成されない分子の定量的尺度を決定するステップをさらに含む、項目84に記載の方法。
(項目86)
(a)シーケンサーからメモリへと、二重鎖タグをタグ付けされたポリヌクレオチドの配列リードのセットを受け取るステップと、
(b)配列リードの前記セットにおける冗長性を低下および/または追跡するステップと、
(c)配列リードをペア形成されたリードおよびペア形成されないリードへと選別するステップであって、(i)各ペア形成されたリードが、前記セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なってタグ付けされた相補鎖から生成された配列リードに対応し、(ii)各ペア形成されないリードが、配列リードの前記セットにおける前記配列リードの中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なってタグ付けされた相補鎖を持たない第1のタグ付けされた鎖を表すステップと、
(d)1種または複数の遺伝子座のそれぞれにマッピングする(i)前記ペア形成されたリードおよび(ii)前記ペア形成されないリードの定量的尺度を決定するステップと、(e)各遺伝子座にマッピングするペア形成されたリードおよびペア形成されないリードの前記定量的尺度に基づき、前記1種または複数の遺伝子座のそれぞれにマッピングする前記セットにおける総二本鎖ポリヌクレオチド分子の定量的尺度を推定するステップと
を含む方法。
(項目87)
(a)二本鎖ポリヌクレオチド分子のセットを含む試料を用意するステップであって、各二本鎖ポリヌクレオチド分子が、第1および第2の相補鎖を含むステップと、
(b)前記二本鎖ポリヌクレオチド分子に二重鎖タグのセットをタグ付けするステップであって、各二重鎖タグが、前記セットにおける二本鎖ポリヌクレオチド分子の前記第1および第2の相補鎖を異なってタグ付けするステップと、
(c)前記タグ付けされた鎖の少なくとも一部を配列決定して、配列リードのセットを産生するステップと、
(d)配列リードの前記セットにおける冗長性を低下および/または追跡するステップと、
(e)配列リードをペア形成されたリードおよびペア形成されないリードへと選別するステップであって、(i)各ペア形成されたリードが、前記セットにおける二本鎖ポリヌクレオチド分子に由来する第1のタグ付けされた鎖および第2の異なってタグ付けされた相補鎖から生成された配列リードに対応し、(ii)各ペア形成されないリードが、配列リードの前記セットにおける前記配列リードの中に表される二本鎖ポリヌクレオチド分子に由来する第2の異なってタグ付けされた相補鎖を持たない第1のタグ付けされた鎖を表すステップと、
(f)(i)前記ペア形成されたリード、(ii)1種または複数の遺伝子座のそれぞれにマッピングする前記ペア形成されないリード、(iii)前記ペア形成されたリードのリード深度および(iv)ペア形成されないリードのリード深度のうち少なくとも2種の定量的尺度を決定するステップと
を含む方法。
(項目88)
(a)対照親ポリヌクレオチドに第1のタグセットをタグ付けして、タグ付けされた対照親ポリヌクレオチドを産生するステップであって、前記第1のタグセットが、複数のタグを含み、前記第1のタグセットにおける各タグが、同じ対照タグおよび同定タグを含み、前記タグセットが、複数の異なる同定タグを含むステップと、
(b)被験親ポリヌクレオチドに第2のタグセットをタグ付けして、タグ付けされた被験親ポリヌクレオチドを産生するステップであって、前記第2のタグセットが、複数のタグを含み、前記第2のタグセットにおける各タグが、前記対照タグおよび同定タグから識別可能な同じ被験タグを含み、前記第2のタグセットが、複数の異なる同定タグを含むステップと、
(c)タグ付けされた対照親ポリヌクレオチドをタグ付けされた被験親ポリヌクレオチドと混合して、プールを形成するステップと、
(d)前記プールにおけるタグ付けされた親ポリヌクレオチドを増幅して、増幅されたタグ付けされたポリヌクレオチドのプールを形成するステップと、
(e)前記増幅されたプールにおける増幅されたタグ付けされたポリヌクレオチドを配列決定して、複数の配列リードを産生するステップと、
(f)配列リードをファミリーへと群分けするステップであって、各ファミリーが、同じ親ポリヌクレオチドから生成された配列リードを含み、この群分けが、任意選択で、同定タグおよび前記親ポリヌクレオチドの開始/終了配列由来の情報に基づくステップと、任意選択で、群における前記複数の配列リード由来の複数の親ポリヌクレオチドのそれぞれのコンセンサス配列を決定するステップと、
(g)被験タグまたは対照タグを有することに基づき、対照親ポリヌクレオチドまたは被験親ポリヌクレオチドとして各ファミリーまたはコンセンサス配列を分類するステップと、
(h)少なくとも2種の遺伝子座のそれぞれにマッピングする対照親ポリヌクレオチドおよび対照被験ポリヌクレオチドの定量的尺度を決定するステップと、
(i)少なくとも1種の遺伝子座にマッピングする被験親ポリヌクレオチドおよび対照親ポリヌクレオチドの相対的分量に基づき、前記少なくとも1種の遺伝子座における前記被験親ポリヌクレオチドにおけるコピー数バリエーションを決定するステップと
を含む方法。
(項目89)
(a)複数の鋳型ポリヌクレオチドから複数の配列リードを生成するステップであって、各ポリヌクレオチドが、ゲノム遺伝子座にマッピングされるステップと、
(b)前記配列リードをファミリーへと群分けするステップであって、各ファミリーが、前記鋳型ポリヌクレオチドのうち1種から生成された配列リードを含むステップと、
(c)前記ファミリーのそれぞれに対し前記ゲノム遺伝子座においてヌクレオチド塩基または配列をコールするステップと、
(d)前記ゲノム遺伝子座において、
i.前記コールの中のゲノム変更、
ii.前記コールの中の遺伝子変更の頻度、
iii.コールの総数、
iv.前記コールの中の変更の総数
のいずれかを検出するステップと
を含む方法。
(項目90)
コールが、系統発生解析、投票、秤量、ファミリーにおける前記遺伝子座における各リードへの確率の割り当ておよび最高確率での前記ヌクレオチド塩基のコールのいずれかを含む、項目89に記載の方法。
(項目91)
2種の遺伝子座において行われ、前記遺伝子座のそれぞれにおける計数に基づき、前記遺伝子座のうち1種におけるCNVを決定するステップを含む、項目89に記載の方法。
(項目92)
(a)二本鎖デオキシリボ核酸(DNA)ポリヌクレオチド由来の挿入物を含み、4~百万種の間の異なるタグを有するタグ付けされたライブラリーを産生するように、アダプタを前記二本鎖DNAポリヌクレオチドにライゲーションするステップであって、ライゲーションが、単一の反応容器内で行われ、前記アダプタが、分子バーコードを含むステップと、
(b)前記タグ付けされたライブラリーにおける前記二本鎖DNAポリヌクレオチドのそれぞれの複数の配列リードを生成するステップと、
(c)タグにおける情報および前記挿入物の末端における情報に基づき、配列リードをファミリーへと群分けするステップであって、各ファミリーが、前記二本鎖DNAポリヌクレオチドの中の単一DNAポリヌクレオチドから生成された配列リードを含むステップと、
(d)ファミリーのメンバーにおける位置におけるヌクレオチド塩基に基づき、前記二本鎖DNA分子における前記各位置におけるヌクレオチド塩基をコールするステップと
を含む方法。
(項目93)
(d)が、前記配列リードの少なくともサブセット由来の複数の連続的塩基をコールして、前記二本鎖DNA分子における単一ヌクレオチドバリエーション(SNV)を同定するステップを含む、項目93に記載の方法。
本開示の追加的な態様および利点は、当業者であれば、本開示の例示的な実施形態のみが示され記載されている次の詳細な説明から容易に明らかとなるであろう。了解される通り、本開示は、他の異なる実施形態が可能であり、そのいくつかの詳細は、様々な明らかな観点における修正が可能であり、全て本開示から逸脱することはない。したがって、図面および記載は、制限的ではなく例示的な性質として考慮するべきである。
参照による援用
参照による援用
本明細書に言及されているあらゆる刊行物、特許および特許出願は、あたかも個々の刊行物、特許または特許出願のそれぞれが、参照により本明細書に組み込まれると具体的にかつ個々に示されているのと同じ程度まで、参照により本明細書に組み込まれる。
本発明の新規特色を添付の特許請求の範囲において詳細に表記する。本発明の特色および利点のより十分な理解は、本発明の原理が利用される例示的な実施形態を表記する次の詳細な説明および次の添付の図面(本明細書において同様に、図(「figure」および「FIG.」))を参照することにより得られるであろう。
本発明の様々な実施形態を本明細書において示し、記載してきたが、当業者には、かかる実施形態が単なる一例として提供されていることが明らかであろう。当業者であれば、本発明から逸脱することなく多数のバリエーション、変化および置換を思いつくことができる。本明細書に記載されている本発明の実施形態の様々な代替を用いることができることを理解されたい。
用語「遺伝的バリアント」は、本明細書において一般に、対象の核酸試料またはゲノムにおける変更、バリアントまたは多型を指す。かかる変更、バリアントまたは多型は、参照ゲノムに関するものとなることができ、これは、対象または他の個体の参照ゲノムとなることができる。一塩基多型(SNP)は、多型の一形態である。一部の例において、1個または複数の多型は、1個または複数の単一ヌクレオチドバリエーション(SNV)、挿入、欠失、反復、小型の挿入、小型の欠失、小型の反復、構造バリアントジャンクション、可変長タンデム反復および/またはフランキング配列を含む。コピー数バリアント(CNV)、トランスバージョンおよび他の再編成も、遺伝的バリエーションの形態である。ゲノム変更(alternation)は、塩基変化、挿入、欠失、反復、コピー数バリエーショ
ンまたはトランスバージョンとなり得る。
ンまたはトランスバージョンとなり得る。
用語「ポリヌクレオチド」は、本明細書において一般に、1個または複数の核酸サブユニットを含む分子を指す。ポリヌクレオチドは、アデノシン(A)、シトシン(C)、グアニン(G)、チミン(T)およびウラシル(U)またはこれらのバリアントから選択される1個または複数のサブユニットを含むことができる。ヌクレオチドは、A、C、G、TもしくはUまたはこれらのバリアントを含むことができる。ヌクレオチドは、成長中の核酸鎖に取り込まれることができるいずれかのサブユニットを含むことができる。かかるサブユニットは、A、C、G、TまたはU、あるいは1個もしくは複数の相補的A、C、G、TもしくはUに特異的な、またはプリン(すなわち、AもしくはGまたはこれらのバリアント)もしくはピリミジン(すなわち、C、TもしくはUまたはこれらのバリアント)に相補的な他のいずれかのサブユニットとなることができる。サブユニットは、個々の核酸塩基または塩基の群(例えば、AA、TA、AT、GC、CG、CT、TC、GT、TG、AC、CAまたはこれらのウラシル対応物)を分解させることができる。一部の例において、ポリヌクレオチドは、デオキシリボ核酸(DNA)もしくはリボ核酸(RNA)またはこれらの誘導体である。ポリヌクレオチドは、一本鎖または二本鎖となり得る。
用語「対象」は、本明細書において一般に、哺乳動物種(例えば、ヒト)もしくは鳥類(例えば、トリ)種等の動物または植物等の他の生物を指す。より具体的には、対象は、脊椎動物、哺乳動物、マウス、霊長類、サルまたはヒトとなり得る。動物として、家畜、競技用動物およびペットが挙げられるがこれらに限定されない。対象は、健康個体、疾患であるもしくは疾患が疑われるもしくは疾患の素因がある個体、または治療法の必要があるもしくは治療法の必要があると疑われる個体となり得る。対象は、患者となり得る。
用語「ゲノム」は一般に、生物の遺伝的な情報の全体を指す。ゲノムは、DNAまたはRNAのいずれかにおいてコードされ得る。ゲノムは、タンパク質をコードするコード領域と共に非コード領域を含むことができる。ゲノムは、生物における全染色体の配列を一体に含むことができる。例えば、ヒトゲノムは、合計46本の染色体を有する。これら全ての配列は一体に、ヒトゲノムを構成する。
用語「アダプタ(複数可)」、「アダプター(複数可)」および「タグ(複数可)」は、本明細書を通して同義的に使用される。ライゲーション、ハイブリダイゼーションまたは他のアプローチを含むいずれかのアプローチにより、アダプタまたはタグをポリヌクレオチド配列にカップリングして、「タグ付け」することができる。
用語「ライブラリーアダプタ」または「ライブラリーアダプター」は、本明細書において一般に、その同一性(例えば、配列)を使用して生物学的試料(本明細書において同様に「試料」)におけるポリヌクレオチドを区別することができる分子(例えば、ポリヌクレオチド)を指す。
用語「配列決定アダプタ」は、本明細書において一般に、配列決定を可能にするための標的ポリヌクレオチドとの相互作用による等、配列決定機器に標的ポリヌクレオチドを配列決定させるように適応された分子(例えば、ポリヌクレオチド)を指す。配列決定アダプタは、配列決定機器による標的ポリヌクレオチドの配列決定を可能にする。一例において、配列決定アダプタは、フローセル等、配列決定システムの固体支持体に取り付けられた捕捉ポリヌクレオチドにハイブリダイズまたは結合するヌクレオチド配列を含む。別の例において、配列決定アダプタは、ポリヌクレオチドにハイブリダイズまたは結合して、配列決定システムによる標的ポリヌクレオチドの配列決定を可能にするヘアピンループを生成するヌクレオチド配列を含む。配列決定アダプタは、他の分子(例えば、ポリヌクレオチド)のフローセル配列に相補的であり、標的ポリヌクレオチドを配列決定するために配列決定システムによって使用可能であるヌクレオチド配列となり得るシーケンサーモチーフを含むことができる。シーケンサーモチーフは、合成による配列決定等、配列決定における使用のためのプライマー配列を含むこともできる。シーケンサーモチーフは、配列決定システムへのライブラリーアダプタのカップリングおよび標的ポリヌクレオチドの配列決定に必要とされる配列(複数可)を含むことができる。
本明細書において、用語「少なくとも」、「多くても」または「約」は、数列に先行する場合、他に同定されていなければ、該数列の各メンバーを指す。
参照数値に関する用語「約」およびその文法的均等は、該値から最大プラス・マイナス10%の値の範囲を含むことができる。例えば、量「約10」は、9~11の量を含むことができる。他の実施形態において、参照数値に関する用語「約」は、該値からプラス・マイナス10%、9%、8%、7%、6%、5%、4%、3%、2%または1%の値の範囲を含むことができる。
参照数値に関する用語「少なくとも」およびその文法的均等は、該参照数値および該値を超えるものを含むことができる。例えば、量「少なくとも10」は、値10、ならびに11、100および1,000等、10を上回るいずれかの数値を含むことができる。
参照数値に関する用語「多くても」およびその文法的均等は、該参照数値および該値未満を含むことができる。例えば、量「多くても10」は、値10、ならびに9、8、5、1、0.5および0.1等、10を下回るいずれかの数値を含むことができる。
1.核酸試料を処理および/または解析するための方法
本開示の態様は、対象の核酸試料におけるゲノム変更を決定するための方法を提供する。図1は、コピー数バリエーション(CNV)を決定する方法を示す。本方法は、SNV等、他のゲノム変更を決定するために実施することができる。
A.ポリヌクレオチド単離
本明細書に開示されている方法は、1種または複数のポリヌクレオチドを単離するステップを含むことができる。ポリヌクレオチドは、いずれかの種類の核酸、例えば、ゲノム核酸の配列または人工配列(例えば、ゲノム核酸には存在しない配列)を含むことができる。例えば、人工配列は、非天然ヌクレオチドを含有することができる。また、ポリヌクレオチドは、いずれかの部分においてゲノム核酸および人工配列の両方を含むことができる。例えば、ポリヌクレオチドは、1~99%のゲノム核酸および99%~1%の人工配列を含むことができ、その合計は最大100%となる。よって、パーセンテージの分数も企図される。例えば、99.1%対0.9%の比が企図される。
ポリヌクレオチドは、DNAおよび/またはRNA等、いずれかの種類の核酸を含むことができる。例えば、ポリヌクレオチドがDNAである場合、これは、ゲノムDNA、相補的DNA(cDNA)または他のいずれかのデオキシリボ核酸となり得る。ポリヌクレオチドは、無細胞DNA(cfDNA)となることもできる。例えば、ポリヌクレオチドは、循環DNAとなり得る。循環DNAは、循環腫瘍DNA(ctDNA)を含むことができる。ポリヌクレオチドは、二本鎖または一本鎖となり得る。あるいは、ポリヌクレオチドは、二本鎖部分および一本鎖部分の組合せを含むことができる。
ポリヌクレオチドは、無細胞である必要はない。一部の事例において、ポリヌクレオチドは、試料から単離することができる。例えば、ステップ(102)において(図1)、二本鎖ポリヌクレオチドは、試料から単離される。試料は、対象から単離されるいずれかの生物学的試料となり得る。例えば、試料は、体液、全血、血小板、血清、血漿、糞便、赤血球細胞、白血球細胞もしくは白血球、内皮細胞、組織生検、滑液、リンパ液、腹水、間質もしくは細胞外液、歯肉溝滲出液を含む細胞間間隙の液、骨髄、脳脊髄液、唾液、粘液、痰、精液、汗、尿または他のいずれかの体液を限定することなく含むことができる。体液は、唾液、血液または血清を含むことができる。例えば、ポリヌクレオチドは、体液、例えば、血液または血清から単離される無細胞DNAとなり得る。試料は、静脈穿刺、排泄、射精、マッサージ、生検、針穿刺吸引、洗浄、擦過、外科的切開もしくは介入または他のアプローチ等が挙げられるがこれらに限定されない、様々なアプローチによって対象から得ることができる腫瘍試料となることもできる。
試料は、ゲノム当量を含有する核酸の様々な量を含むことができる。例えば、約30ng DNAの試料は、約10,000(104)の一倍体ヒトゲノム当量を含有することができ、cfDNAの場合、約2千億(2×1011)個の個々のポリヌクレオチド分子を含有することができる。同様に、約100ngのDNAの試料は、約30,000の一倍体ヒトゲノム当量を含有することができ、cfDNAの場合、約6千億個の個々の分子を含有することができる。
試料は、異なる供給源由来の核酸を含むことができる。例えば、試料は、生殖系列DNAまたは体細胞DNAを含むことができる。試料は、突然変異を保有する核酸を含むことができる。例えば、試料は、生殖系列突然変異および/または体細胞突然変異を保有するDNAを含むことができる。試料は、がん関連突然変異(例えば、がん関連体細胞突然変異)を保有するDNAを含むこともできる。
B.タグ付け
本明細書に開示されているポリヌクレオチドは、タグ付けすることができる。例えば、ステップ(104)(図1)において、二本鎖ポリヌクレオチドは、二重鎖タグ、二本鎖分子の相補鎖(すなわち、「ワトソン」および「クリック」鎖)を異なって標識するタグをタグ付けされる。一実施形態において、二重鎖タグは、相補的および非相補的部分を有するポリヌクレオチドである。
タグは、核酸、化学化合物、蛍光(florescent)プローブまたは放射性プローブ等が挙げられるがこれらに限定されない、ポリヌクレオチドに取り付けられるいずれかの種類の分子となり得る。タグは、オリゴヌクレオチド(例えば、DNAまたはRNA)であってもよい。タグは、公知配列、未知配列またはその両方を含むことができる。タグは、ランダム配列、既定の配列またはその両方を含むことができる。タグは、二本鎖または一本鎖となり得る。二本鎖タグは、二重鎖タグとなり得る。二本鎖タグは、2本の相補鎖を含むことができる。あるいは、二本鎖タグは、ハイブリダイズした部分およびハイブリダイズしていない部分を含むことができる。二本鎖タグは、Y字形となることができ、例えば、ハイブリダイズした部分が、タグの一末端に存在し、ハイブリダイズしていない部分が、タグの反対側の末端に存在する。かかる例の1つは、Illumina配列決定において使用される「Yアダプター」である。他の例として、ヘアピン形アダプターまたはバブル形アダプターが挙げられる。バブル形アダプターは、両サイドにおいて相補的配列に挟まれた非相補的配列を有する。
本明細書に開示されているタグ付けは、いずれかの方法を使用して行うことができる。ポリヌクレオチドは、ハイブリダイゼーションによりアダプタをタグ付けすることができる。例えば、アダプタは、ポリヌクレオチドの配列の少なくとも一部分に相補的なヌクレオチド配列を有することができる。代替として、ポリヌクレオチドは、ライゲーションによりアダプタをタグ付けすることができる。
例えば、タグ付けは、1種または複数の酵素の使用を含むことができる。酵素は、リガーゼとなり得る。リガーゼは、DNAリガーゼとなり得る。例えば、DNAリガーゼは、T4 DNAリガーゼ、E.coli DNAリガーゼおよび/または哺乳動物リガーゼとなり得る。哺乳動物リガーゼは、DNAリガーゼI、DNAリガーゼIIIまたはDNAリガーゼIVとなり得る。リガーゼは、熱安定性リガーゼであってもよい。タグは、ポリヌクレオチドの平滑末端にライゲーションすることができる(平滑末端ライゲーション)。あるいは、タグは、ポリヌクレオチドの粘着末端にライゲーションすることができる(粘着末端ライゲーション)。ライゲーションの効率は、様々な条件を最適化することにより増加され得る。ライゲーションの効率は、ライゲーションの反応時間を最適化することにより増加され得る。例えば、ライゲーションの反応時間は、12時間未満、例えば、1時間未満、2時間未満、3時間未満、4時間未満、5時間未満、6時間未満、7時間未満、8時間未満、9時間未満、10時間未満、11時間未満、12時間未満、13時間未満、14時間未満、15時間未満、16時間未満、17時間未満、18時間未満、19時間未満または20時間未満となり得る。特定の例において、ライゲーションの反応時間は、20時間未満である。ライゲーションの効率は、反応におけるリガーゼ濃度を最適化することにより増加され得る。例えば、リガーゼ濃度は、少なくとも10、少なくとも50、少なくとも100、少なくとも150、少なくとも200、少なくとも250、少なくとも300、少なくとも400、少なくとも500または少なくとも600ユニット/マイクロリットルとなり得る。効率は、ライゲーションに適した酵素、酵素補因子もしくは他の添加物を添加することによりまたはその濃度を変動させることにより、および/または酵素を有する溶液の温度を最適化することにより最適化することもできる。効率は、反応の様々な構成成分の添加順を変動させることにより最適化することもできる。タグ配列の末端は、ライゲーション効率を増加させるためのジヌクレオチドを含むことができる。タグが、非相補的部分を含む場合(例えば、Y字形アダプタ)、タグアダプタの相補的部分における配列は、ライゲーション効率を促進する1種または複数の選択された配列を含むことができる。好ましくは、かかる配列は、タグの末端に位置する。かかる配列は、1、2、3、4、5または6末端塩基を含むことができる。高い粘性(例えば、低いレイノルズ数)を有する反応溶液を使用して、ライゲーション効率を増加させることもできる。例えば、溶液は、3000未満、2000未満、1000未満、900未満、800未満、700未満、600未満、500未満、400未満、300未満、200未満、100未満、50未満、25未満または10未満のレイノルズ数を有することができる。断片の大まかに統一された分布(例えば、緊密な標準偏差)を使用して、ライゲーション効率を増加させることができることも企図される。例えば、断片サイズにおけるバリエーションは、20%未満、15%未満、10%未満、5%未満または1%未満変動し得る。タグ付けは、例えば、ポリメラーゼ連鎖反応(PCR)によるプライマー伸長を含むこともできる。タグ付けは、ライゲーションに基づくPCR、マルチプレックスPCR、一本鎖ライゲーションまたは一本鎖環状化のいずれかを含むこともできる。
一部の事例において、本明細書におけるタグは、分子バーコードを含む。かかる分子バーコードを使用して、試料におけるポリヌクレオチドを区別することができる。好ましくは、分子バーコード同士は、互いに異なる。例えば、分子バーコード同士は、既定の編集距離またはハミング距離によって特徴付けることができる差を互いの間に有することができる。一部の事例において、本明細書における分子バーコードは、1、2、3、4、5、6、7、8、9または10の最小編集距離を有する。タグ付けされていない分子からタグ付けされた分子への変換(例えば、タグ付け)の効率をさらに改善するために、好ましくは、短いタグを利用する。例えば、一部の実施形態において、ライブラリーアダプタータグは、最大65、60、55、50、45、40または35ヌクレオチド塩基の長さとなり得る。かかる短いライブラリーバーコードのコレクションは、好ましくは、1、2、3またはそれを超える最小編集距離で、多数の異なる分子バーコード、例えば、少なくとも2、4、6、8、10、12、14、16、18または20種の異なるバーコードを含む。
よって、分子のコレクションは、1種または複数のタグを含むことができる。一部の事例において、コレクションにおける一部の分子は、コレクションにおける他のいずれかの分子によって共有されない分子バーコード等、同定タグ(「識別子」)を含むことができる。例えば、分子のコレクションの一部の事例において、コレクションにおける分子の少なくとも50%、少なくとも51%、少なくとも52%、少なくとも53%、少なくとも54%、少なくとも55%、少なくとも56%、少なくとも57%、少なくとも58%、少なくとも59%、少なくとも60%、少なくとも61%、少なくとも62%、少なくとも63%、少なくとも64%、少なくとも65%、少なくとも66%、少なくとも67%、少なくとも68%、少なくとも69%、少なくとも70%、少なくとも71%、少なくとも72%、少なくとも73%、少なくとも74%、少なくとも75%、少なくとも76%、少なくとも77%、少なくとも78%、少なくとも79%、少なくとも80%、少なくとも81%、少なくとも82%、少なくとも83%、少なくとも84%、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%または100%は、コレクションにおける他のいずれかの分子によって共有されない識別子または分子バーコードを含むことができる。本明細書において、コレクションにおける分子の少なくとも95%のそれぞれが、コレクションにおける他のいずれかの分子によって共有されない識別子(「特有タグ」または「特有識別子」)を有する場合、分子のコレクションは、「特有にタグ付け」されたと考慮される。コレクションにおける分子の少なくとも1%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、または少なくとも50%もしくは約50%のそれぞれが、コレクションにおける少なくとも1種の他の分子によって共有される同定タグまたは分子バーコード(「非特有タグ」または「非特有識別子」)を有する場合、分子のコレクションは、「非特有にタグ付け」されたと考慮される。したがって、非特有にタグ付けされた集団において、分子の1%以下が、特有にタグ付けされている。例えば、非特有にタグ付けされた集団において、分子の1%、5%、10%、15%、20%、25%、30%、35%、40%、45%または50%以下が、特有にタグ付けされ得る。
試料における分子の推定される数に基づき、多数の異なるタグを使用することができる。一部のタグ付け方法において、異なるタグの数は、試料における分子の推定される数と少なくとも同じものとなり得る。他のタグ付け方法において、異なるタグの数は、試料における分子の推定される数の少なくとも2、3、4、5、6、7、8、9、10、100または1000倍の多さとなり得る。特有のタグ付けにおいて、試料における分子の推定される数の少なくとも2倍(またはそれを超える)の多さの異なるタグを使用することができる。
試料における分子は、非特有にタグ付けすることができる。かかる事例において、試料におけるタグ付けするべき分子の数よりも(then)少ない数のタグまたは分子バーコードが使用される。例えば、100、50、40、30、20または10種以下の特有タグまたは分子バーコードが、多くのより異なる断片を有する無細胞DNA試料等、複合試料のタグ付けに使用される。
タグ付けするべきポリヌクレオチドは、天然に、あるいは例えば剪断等の他のアプローチを使用して断片化することができる。ポリヌクレオチドは、機械的剪断、試料のシリンジ通過、超音波処理、熱処理(例えば、30分間90℃)および/またはヌクレアーゼ処理(例えば、DNase、RNase、エンドヌクレアーゼ、エキソヌクレアーゼおよび/または制限酵素の使用)等が挙げられるがこれらに限定されない、ある特定の方法によって断片化することができる。
ポリヌクレオチド断片(タグ付けに先立つ)は、いずれかの長さの配列を含むことができる。例えば、ポリヌクレオチド断片(タグ付けに先立つ)は、少なくとも50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、255、260、265、270、275、280、285、290、295、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000またはそれを超えるヌクレオチドの長さを含むことができる。ポリヌクレオチド断片は、好ましくは、無細胞DNAの約平均の長さである。例えば、ポリヌクレオチド断片は、約160塩基の長さを含むことができる。ポリヌクレオチド断片は、より大型の断片からより小型の断片に、約160塩基の長さに断片化することもできる。
タグ付けされたポリヌクレオチドは、がんに関連する配列を含むことができる。がん関連配列は、単一ヌクレオチドバリエーション(SNV)、コピー数バリエーション(CNV)、挿入、欠失および/または再編成を含むことができる。
ポリヌクレオチドは、急性リンパ芽球性白血病(ALL)、急性骨髄性白血病(AML)、副腎皮質癌、カポジ肉腫、肛門がん、基底細胞癌、胆管がん、膀胱がん、骨がん、骨肉腫、悪性線維性組織球腫、脳幹神経膠腫、脳腫瘍、頭蓋咽頭腫、上衣芽細胞腫、上衣腫、髄芽腫、髄上皮腫(medulloeptithelioma)、松果体実質腫瘍、乳がん、気管支腫瘍、
バーキットリンパ腫、非ホジキンリンパ腫、カルチノイド腫瘍、子宮頸部がん、脊索腫、慢性リンパ球性白血病(CLL)、慢性骨髄性白血病(CML)、結腸がん、結腸直腸がん、皮膚T細胞リンパ腫、腺管上皮内癌、子宮内膜がん、食道がん、ユーイング肉腫、眼がん、眼球内黒色腫、網膜芽細胞腫、線維性組織球腫、胆嚢がん、胃がん、神経膠腫、ヘアリー細胞白血病、頭頸部がん、心臓がん、肝細胞(肝臓)がん、ホジキンリンパ腫、下咽頭がん、腎臓がん、喉頭がん、口唇がん、口腔がん、肺がん、非小細胞癌、小細胞癌、メラノーマ、口腔内がん、骨髄異形成症候群、多発性骨髄腫、髄芽腫、鼻腔がん、副鼻腔がん、神経芽細胞腫、鼻咽頭がん、口内(oral)がん、中咽頭がん、骨肉腫、卵巣がん、膵がん、乳頭腫、傍神経節腫、副甲状腺がん、陰茎がん、咽頭がん、下垂体腫瘍、形質細胞新生物、前立腺がん、直腸がん、腎細胞がん、横紋筋肉腫、唾液腺がん、セザリー症候群、皮膚がん、非メラノーマ、小腸がん、軟部組織肉腫、扁平上皮癌、精巣がん、咽頭がん、胸腺腫、甲状腺がん、尿道がん、子宮がん、子宮肉腫、腟がん、外陰部がん、ワルデンストレーム高ガンマグロブリン血症および/またはウィルムス腫瘍等、がんに関連する配列を含むことができる。
バーキットリンパ腫、非ホジキンリンパ腫、カルチノイド腫瘍、子宮頸部がん、脊索腫、慢性リンパ球性白血病(CLL)、慢性骨髄性白血病(CML)、結腸がん、結腸直腸がん、皮膚T細胞リンパ腫、腺管上皮内癌、子宮内膜がん、食道がん、ユーイング肉腫、眼がん、眼球内黒色腫、網膜芽細胞腫、線維性組織球腫、胆嚢がん、胃がん、神経膠腫、ヘアリー細胞白血病、頭頸部がん、心臓がん、肝細胞(肝臓)がん、ホジキンリンパ腫、下咽頭がん、腎臓がん、喉頭がん、口唇がん、口腔がん、肺がん、非小細胞癌、小細胞癌、メラノーマ、口腔内がん、骨髄異形成症候群、多発性骨髄腫、髄芽腫、鼻腔がん、副鼻腔がん、神経芽細胞腫、鼻咽頭がん、口内(oral)がん、中咽頭がん、骨肉腫、卵巣がん、膵がん、乳頭腫、傍神経節腫、副甲状腺がん、陰茎がん、咽頭がん、下垂体腫瘍、形質細胞新生物、前立腺がん、直腸がん、腎細胞がん、横紋筋肉腫、唾液腺がん、セザリー症候群、皮膚がん、非メラノーマ、小腸がん、軟部組織肉腫、扁平上皮癌、精巣がん、咽頭がん、胸腺腫、甲状腺がん、尿道がん、子宮がん、子宮肉腫、腟がん、外陰部がん、ワルデンストレーム高ガンマグロブリン血症および/またはウィルムス腫瘍等、がんに関連する配列を含むことができる。
一倍体ヒトゲノム当量は、約3ピコグラムのDNAを有する。約1マイクログラムのDNAの試料は、約300,000一倍体ヒトゲノム当量を含有する。重複または同族ポリヌクレオチドの少なくとも一部が、互いに対して特有の識別子を有する、すなわち、異なるタグを有する限りにおいて、配列決定における改善を達成することができる。しかし、ある特定の実施形態において、使用されるタグの数は、いずれか1つの位置において開始する全重複分子が特有の識別子を有する少なくとも95%確率が存在し得るように選択される。例えば、断片化ゲノムDNA、例えば、cfDNAの約10,000一倍体ヒトゲノム当量を含む試料において、zは、2~8の間であると予想される。かかる集団は、約10~100種の間の異なる識別子、例えば、約2種の識別子、約4種の識別子、約9種の識別子、約16種の識別子、約25種の識別子、約36種の異なる識別子、約49種の異なる識別子、約64種の異なる識別子、約81種の異なる識別子または約100種の異なる識別子をタグ付けすることができる。
分子バーコードを含む同定可能な配列を有する核酸バーコードをタグ付けのために使用することができる。例えば、複数のDNAバーコードは、様々な数のヌクレオチド配列を含むことができる。2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30種またはそれを超える同定可能なヌクレオチド配列を有する複数のDNAバーコードを使用することができる。ポリヌクレオチドの一端のみに取り付けられる場合、複数のDNAバーコードは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30種またはそれを超える異なる識別子を産生することができる。あるいは、ポリヌクレオチドの両端に取り付けられる場合、複数のDNAバーコードは、4、9、16、25、36、49、64、81、100、121、144、169、196、225、256、289、324、361、400種またはそれを超える異なる識別子(これは、DNAバーコードがポリヌクレオチドの1端のみに取り付けられる場合の^2である)を産生することができる。一例において、6、7、8、9または10種の同定可能なヌクレオチド配列を有する複数のDNAバーコードを使用することができる。ポリヌクレオチドの両端に取り付けられる場合、これらは、それぞれ36、49、64、81または100種の可能な異なる識別子を産生する。特定の例において、複数のDNAバーコードは、8種の同定可能なヌクレオチド配列を含むことができる。ポリヌクレオチドの一端のみに取り付けられる場合、複数のDNAバーコードは、8種の異なる識別子を産生することができる。あるいは、ポリヌクレオチドの両端に取り付けられる場合、複数のDNAバーコードは、64種の異なる識別子を産生することができる。かかる仕方でタグ付けされる試料は、約10ngから約100ng、約1μg、約10μgのいずれかまでの範囲の断片化ポリヌクレオチド、例えば、ゲノムDNA、例えば、cfDNAを有する試料となり得る。
ポリヌクレオチドは、様々な仕方で特有に同定することができる。ポリヌクレオチドは、特有のDNAバーコードにより特有に同定することができる。例えば、試料におけるいずれか2種のポリヌクレオチドは、2種の異なるDNAバーコードに取り付けられる。あるいは、ポリヌクレオチドは、DNAバーコードおよびポリヌクレオチドの1種または複数の内在性配列の組合せにより特有に同定することができる。例えば、試料におけるいずれか2種のポリヌクレオチドは、同じDNAバーコードに取り付けることができるが、この2種のポリヌクレオチドは、異なる内在性配列により依然として同定することができる。内在性配列は、ポリヌクレオチドの末端に存在し得る。例えば、内在性配列は、取り付けられたDNAバーコードに隣接(例えば、その間の塩基)することができる。一部の事例において、内在性配列は、少なくとも2、4、6、8、10、20、30、40、50、60、70、80、90または100塩基の長さとなり得る。好ましくは、内在性配列は、解析しようとする断片/ポリヌクレオチドの末端配列である。内在性配列は、配列の長さとなり得る。例えば、8種の異なるDNAバーコードを含む複数のDNAバーコードは、試料における各ポリヌクレオチドの両端に取り付けることができる。試料における各ポリヌクレオチドは、DNAバーコードおよびポリヌクレオチドの末端における約10塩基対の内在性配列の組合せにより同定することができる。理論に制約されることなく、ポリヌクレオチドの内在性配列は、ポリヌクレオチド配列全体となることもできる。
タグ付けされたポリヌクレオチドの組成物も本明細書に開示されている。タグ付けされたポリヌクレオチドは、一本鎖となり得る。あるいは、タグ付けされたポリヌクレオチドは、二本鎖となり得る(例えば、二重鎖タグ付けされたポリヌクレオチド)。したがって、本発明は、二重鎖タグ付けされたポリヌクレオチドの組成物も提供する。ポリヌクレオチドは、いずれかの種類の核酸(DNAおよび/またはRNA)を含むことができる。ポリヌクレオチドは、本明細書に開示されているいずれかの種類のDNAを含む。例えば、ポリヌクレオチドは、DNA、例えば、断片化DNAまたはcfDNAを含むことができる。ゲノム内のマッピング可能な塩基位置にマッピングされる組成物におけるポリヌクレオチドのセットは、非特有にタグ付けされ得る、すなわち、異なる識別子の数は、少なくとも2かつマッピング可能な塩基位置にマッピングされるポリヌクレオチドの数未満となり得る。異なる識別子の数は、少なくとも3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25かつマッピング可能な塩基位置にマッピングされるポリヌクレオチドの数未満となることもできる。
一部の事例において、組成物が、約1ngから約10μgまたはより多くなるにつれて、異なる分子バーコードのより大型のセットを使用することができる。例えば、5~100種の間の異なるライブラリーアダプタを使用して、cfDNA試料におけるポリヌクレオチドにタグ付けすることができる。
本明細書に開示されているシステムおよび方法は、分子バーコードの割り当てに関与する適用において使用することができる。分子バーコードは、本発明において開示されているいずれかの種類のポリヌクレオチドに割り当てることができる。例えば、分子バーコードは、無細胞ポリヌクレオチド(例えば、cfDNA)に割り当てることができる。多くの場合、本明細書に開示されている識別子は、ポリヌクレオチドのタグ付けに使用されるバーコードオリゴヌクレオチドとなり得る。バーコード識別子は、核酸オリゴヌクレオチド(例えば、DNAオリゴヌクレオチド)となり得る。バーコード識別子は、一本鎖となり得る。あるいは、バーコード識別子は、二本鎖となり得る。バーコード識別子は、本明細書に開示されているいずれかの方法を使用してポリヌクレオチドに取り付けることができる。例えば、バーコード識別子は、酵素を使用したライゲーションによりポリヌクレオチドに取り付けることができる。バーコード識別子は、PCRによりポリヌクレオチドに取り込むこともできる。他の事例において、反応は、分析物への直接的な、あるいは同位体で標識したプローブによる、金属同位体の添加を含むことができる。一般に、本開示の反応物における特有または非特有識別子または分子バーコードの割り当ては、例えば、これらそれぞれ、参照により本明細書に全体的に組み込まれる米国特許出願公開第2001/0053519号、同第2003/0152490号、同第2011/0160078号および米国特許第6,582,908号に記載されている方法およびシステムに従うことができる。
本明細書において使用されている識別子または分子バーコードは、完全に内在性となることができ、これにより、個々の断片の環状ライゲーションを行い、続いてランダム剪断または標的化増幅を行うことができる。この場合、分子の新たな開始および停止点ならびに本来の分子内ライゲーション点の組合せは、特異的識別子を形成することができる。
本明細書において使用されている識別子または分子バーコードは、いずれかの種類のオリゴヌクレオチドを含むことができる。一部の事例において、識別子は、既定の、ランダムまたはセミランダム配列オリゴヌクレオチドとなり得る。識別子は、バーコードとなり得る。例えば、バーコードが、複数内で必ずしも互いに特有でないように、複数のバーコードを使用することができる。あるいは、各バーコードが、複数内の他のいずれかのバーコードに特有となるように、複数のバーコードを使用することができる。バーコードは、個々に追跡され得る特異的な配列(例えば、既定の配列)を含むことができる。さらに、バーコードおよびこれがライゲーションされ得る配列の組合せが、個々に追跡され得る特異的な配列を作製するように、バーコードは、個々の分子に取り付けることができる(例えば、ライゲーションにより)。本明細書に記載されている通り、配列リードの始まり(開始)および/または終わり(停止)部分の配列データと組み合わせたバーコードの検出は、特定の分子への特有の同一性の割り当てを可能にすることができる。個々の配列リードの塩基対の長さまたは数を使用して、かかる分子に特有の同一性を割り当てることもできる。本明細書に記載されている通り、特有の同一性を割り当てられた核酸の一本鎖由来の断片は、これにより、親鎖由来の断片のその後の同定を可能にすることができる。このようにして、試料におけるポリヌクレオチドは、特有にまたは実質的に特有にタグ付けすることができる。二重鎖タグは、縮重またはセミ縮重ヌクレオチド配列、例えば、ランダム縮重配列を含むことができる。ヌクレオチド配列は、いずれかの数のヌクレオチドを含むことができる。例えば、ヌクレオチド配列は、1(非天然ヌクレオチドを使用する場合)、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個またはそれを超えるヌクレオチドを含むことができる。特定の例において、配列は、7ヌクレオチドを含むことができる。別の例において、配列は、8ヌクレオチドを含むことができる。配列は、9ヌクレオチドを含むこともできる。配列は、10ヌクレオチドを含むことができる。
バーコードは、近接または非近接配列を含むことができる。4ヌクレオチドが、他のいずれかのヌクレオチドによって中断されていない場合、少なくとも1、2、3、4、5個またはそれを超えるヌクレオチドを含むバーコードは、近接配列または非近接配列である。例えば、バーコードが、配列TTGCを含む場合、バーコードがTTGCであればバーコードは近接している。他方では、バーコードがTTXGC(式中、Xは核酸塩基である)である場合、バーコードは非近接である。
識別子または分子バーコードは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれを超えるヌクレオチドの長さとなり得るn-mer配列を有することができる。本明細書におけるタグは、いずれかの範囲のヌクレオチドの長さを含むことができる。例えば、配列は、2~100、10~90、20~80、30~70、40~60の間または約50ヌクレオチドの長さとなり得る。
タグは、識別子または分子バーコードの下流に二本鎖の固定された参照配列を含むことができる。あるいは、タグは、識別子または分子バーコードの上流または下流に二本鎖の固定された参照配列を含むことができる。二本鎖の固定された参照配列の各鎖は、例えば、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50ヌクレオチドの長さとなり得る。
C.アダプタ
ポリヌクレオチド分子のライブラリーは、配列決定における使用のために合成することができる。例えば、それぞれ、100、90、80、70、60、50、45、40または35核酸(またはヌクレオチド)塩基未満またはそれに等しい長さの複数のポリヌクレオチド分子を含むポリヌクレオチドのライブラリーを作製することができる。複数のポリヌクレオチド分子はそれぞれ、35核酸塩基未満またはそれに等しい長さとなり得る。複数のポリヌクレオチド分子はそれぞれ、30核酸塩基未満またはそれに等しい長さとなり得る。複数のポリヌクレオチド分子は、250、200、150、100もしくは50核酸塩基未満またはそれに等しくなることもできる。その上、複数のポリヌクレオチド分子は、100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、77、76、75、74、73、72、71、70、69、68、67、66、65、64、63、62、61、60、59、58、57、56、55、54、53、52、51、50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11もしくは10核酸塩基未満またはそれに等しくなることもできる。
複数のポリヌクレオチド分子を含むポリヌクレオチドのライブラリーは、少なくとも4核酸塩基に関して別個の(互いに関して)分子バーコード配列(または分子バーコード)を有することもできる。分子バーコード(本明細書において同様に、「バーコード」または「識別子」)配列は、あるポリヌクレオチドを別のポリヌクレオチドから識別するヌクレオチド配列である。他の実施形態において、ポリヌクレオチド分子は、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれを超える核酸塩基に関して異なるバーコード配列を有することもできる。
複数のポリヌクレオチド分子を含むポリヌクレオチドのライブラリーは、複数の異なるバーコード配列を有することもできる。例えば、複数のポリヌクレオチド分子は、少なくとも4種の異なる分子バーコード配列を有することができる。一部の事例において、複数のポリヌクレオチド分子は、2~100、4~50、4~30、4~20または4~10種の異なる分子バーコード配列を有する。複数のポリヌクレオチド分子は、1~4、2~5、3~6、4~7、5~8、6~9、7~10、8~11、9~12、10~13、11~14、12~15、13~16、14~17、15~18、16~19、17~20、18~21、19~22、20~23、21~24または22~25種の異なるバーコード配列等、他の範囲の異なるバーコード配列を有することもできる。他の事例において、複数のポリヌクレオチド分子は、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100種またはそれを超える(more)異なるバーコード配列を有することができる。特定の例において、複数のライブラリーアダプターは、少なくとも8種の異なる配列を含む。
異なるバーコード配列の位置は、複数のポリヌクレオチド内で変動し得る。例えば、異なるバーコード配列は、複数のポリヌクレオチド分子のうちそれぞれ1種の末端から20、15、10、9、8、7、6、5、4、3または2核酸塩基以内となり得る。一例において、複数のポリヌクレオチド分子は、末端から10核酸塩基以内にある別個のバーコード配列を有する。別の例において、複数のポリヌクレオチド分子は、末端から5または1核酸塩基以内にある別個のバーコード配列を有する。他の事例において、別個のバーコード配列は、複数のポリヌクレオチド分子のうちそれぞれ1種の末端に存在することができる。他のバリエーションは、別個の分子バーコード配列が、複数のポリヌクレオチド分子のうちそれぞれ1種の末端から2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39または40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200またはそれを超える核酸塩基以内に存在し得る分子を含む。
複数のポリヌクレオチド分子の末端は、標的核酸分子へのライゲーションに適応させることができる。例えば、末端は、平滑末端となり得る。他の一部の事例において、末端は、標的核酸分子の相補的配列へのハイブリダイゼーションに適応される。
複数のポリヌクレオチド分子を含むポリヌクレオチドのライブラリーは、少なくとも1の編集距離を有することもできる。一部の事例において、編集距離は、複数のポリヌクレオチド分子の個々の塩基に関する。他の事例において、複数のポリヌクレオチド分子は、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50またはそれを超える編集距離を有することができる。編集距離は、ハミング距離となり得る。
一部の事例において、複数のポリヌクレオチドは、配列決定アダプタを含有しない。配列アダプタは、1種または複数の配列決定アダプタまたはプライマーにハイブリダイズする配列を含むポリヌクレオチドとなり得る。配列決定アダプタは、固体支持体、例えば、フローセル配列にハイブリダイズする配列をさらに含むことができる。用語「フローセル配列」およびその文法的均等は、本明細書において、例えば、基板に取り付けられたプライマーにより基板へのハイブリダイゼーションを可能にする配列を指す。基板は、ビーズまたは平面状の表面となり得る。一部の実施形態において、フローセル配列は、フローセルまたは表面(例えば、ビーズの表面、例えば、Illuminaフローセル)へのポリヌクレオチドの取り付けを可能にし得る。
複数のポリヌクレオチド分子が、配列決定アダプタまたはプライマーを含有しない場合、該複数のうち各ポリヌクレオチド分子は、Illumina、SOLiD、Pacific Biosciences、GeneReader、Oxford Nanopore、Complete Genomics、Gnu-Bio、Ion Torrent、Oxford NanoporeまたはGenia等、所与の配列決定アプローチによる標的核酸分子の配列決定を可能にするように適応された核酸配列または他の部分を含有しない。一部の例において、複数のポリヌクレオチド分子が、配列決定アダプタまたはプライマーを含有しない場合、複数のポリヌクレオチド分子は、フローセル配列を含有しない。例えば、複数のポリヌクレオチド分子は、Illuminaフローセルシーケンサーにおいて使用されるもの等、フローセルに結合できない。しかし、これらのフローセル配列は、必要に応じて、PCR増幅またはライゲーション等の方法によって複数のポリヌクレオチド分子に付加することができる。現時点では、Illuminaフローセルシーケンサーを使用することができる。あるいは、複数のポリヌクレオチド分子が、配列決定アダプタまたはプライマーを含有しない場合、複数のポリヌクレオチド分子は、Pacific Bioscience SMRTbell(商標)アダプタ等、ヘアピン形アダプタまたは標的核酸分子においてヘアピンループを生成するためのアダプタを含有しない。しかし、このようなヘアピン形アダプタは、必要に応じて、PCR増幅またはライゲーション等、方法により複数のポリヌクレオチド分子に付加することができる。複数のポリヌクレオチド分子は、環状または直鎖状となり得る。
複数のポリヌクレオチド分子は、二本鎖となり得る。一部の事例において、複数のポリヌクレオチド分子は、一本鎖となり得る、あるいはハイブリダイズされたおよびハイブリダイズされていない領域を含むことができる。複数のポリヌクレオチド分子は、非天然起源のポリヌクレオチド分子となり得る。
アダプタは、ポリヌクレオチド分子となり得る。ポリヌクレオチド分子は、Y字形、バブル形またはヘアピン形となり得る。ヘアピンアダプタは、制限部位(複数可)またはウラシル含有塩基を含有することができる。アダプタは、相補的部分および非相補的部分を含むことができる。非相補的部分は、編集距離(例えば、ハミング距離)を有することができる。例えば、編集距離は、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29または少なくとも30となり得る。アダプタの相補的部分は、ポリヌクレオチドへのライゲーションを可能にするおよび/または促進するために選択される配列、例えば、高収率でのポリヌクレオチドへのライゲーションを可能にするおよび/または促進する配列を含むことができる。
本明細書に開示されている複数のポリヌクレオチド分子は、精製することができる。一部の事例において、本明細書に開示されている複数のポリヌクレオチド分子は、単離されたポリヌクレオチド分子となり得る。他の事例において、本明細書に開示されている複数のポリヌクレオチド分子は、精製および単離されたポリヌクレオチド分子となり得る。
ある特定の態様において、複数のポリヌクレオチド分子のそれぞれは、Y字形またはヘアピン形である。複数のポリヌクレオチド分子のそれぞれは、異なるバーコードを含むことができる。異なるバーコードは、Y字形またはヘアピン形アダプタの相補的部分(例えば、二本鎖部分)におけるランダマーとなり得る。あるいは、異なるバーコードは、非相補的部分(例えば、Y字形アームの1本)の1本の鎖に存在し得る。上に記す通り、異なるバーコードは、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25またはそれを超える(または本願を通して記載されているいずれかの長さの)核酸塩基、例えば、7塩基となり得る。バーコードは、上述の通り、近接または非近接配列となり得る。複数のポリヌクレオチド分子は、10核酸塩基~35核酸塩基の長さ(または上述のいずれかの長さ)である。さらに、複数のポリヌクレオチド分子は、ハミング距離である編集距離(上述)を含むことができる。複数のポリヌクレオチド分子は、末端から10核酸塩基以内の別個のバーコード配列を有することができる。
別の態様において、複数のポリヌクレオチド分子は、配列決定アダプタとなり得る。配列決定アダプタは、1種または複数の配列決定プライマーにハイブリダイズする配列を含むことができる。配列決定アダプタは、固体支持体にハイブリダイズする配列、例えば、フローセル配列をさらに含むことができる。例えば、配列決定アダプタは、フローセルアダプタとなり得る。配列決定アダプタは、ポリヌクレオチド断片の一端または両端に取り付けることができる。別の例において、配列決定アダプタは、ヘアピン形となり得る。例えば、ヘアピン形アダプタは、相補的二本鎖部分およびループ部分を含むことができ、二本鎖部分は、二本鎖ポリヌクレオチドに取り付ける(例えば、ライゲーションする)ことができる。ヘアピン形配列決定アダプタは、ポリヌクレオチド断片の両端に取り付けて、複数回配列決定することができる環状分子を生成することができる。配列決定アダプタは、末端から末端まで、最大10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100またはそれを超える塩基となり得る。例えば、配列決定アダプタは、末端から末端まで最大70塩基となり得る。配列決定アダプタは、末端から末端まで20~30、20~40、30~50、30~60、40~60、40~70、50~60、50~70塩基を含むことができる。特定の例において、配列決定アダプタは、末端から末端まで20~30塩基を含むことができる。別の例において、配列決定アダプタは、末端から末端まで50~60塩基を含むことができる。配列決定アダプタは、1種または複数のバーコードを含むことができる。例えば、配列決定アダプタは、試料バーコードを含むことができる。試料バーコードは、既定の配列を含むことができる。試料バーコードを使用して、ポリヌクレオチドの供給源を同定することができる。試料バーコードは、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25またはそれを超える(または本願を通して記載されているいずれかの長さの)核酸塩基、例えば、少なくとも8塩基となり得る。バーコードは、上述の通り、近接または非近接配列となり得る。
本明細書に記載されている複数のポリヌクレオチド分子は、アダプタとして使用することができる。アダプタは、1種または複数の識別子を含むことができる。アダプタは、ランダム配列を有する識別子を含むことができる。あるいは、アダプタは、既定の配列を有する識別子を含むことができる。一部のアダプタは、ランダム配列を有する識別子および既定の配列を有する別の識別子を含むことができる。識別子を含むアダプタは、二本鎖または一本鎖アダプタとなり得る。識別子を含むアダプタは、Y字形アダプタとなり得る。Y字形アダプタは、ランダム配列を有する1種または複数の識別子を含むことができる。1種または複数の識別子は、Y字形アダプタのハイブリダイズされる(hybrid)部分および/またはハイブリダイズされない部分に存在し得る。Y字形アダプタは、既定の配列を有する1種または複数の識別子を含むことができる。既定の配列を有する1種または複数の識別子は、Y字形アダプタのハイブリダイズされる部分および/またはハイブリダイズされない部分に存在し得る。Y字形アダプタは、ランダム配列を有する1種または複数の識別子および既定の配列を有する1種または複数の識別子を含むことができる。例えば、ランダム配列を有する1種または複数の識別子は、Y字形アダプタのハイブリダイズされる部分および/またはY字形アダプタのハイブリダイズされない部分に存在し得る。既定の配列を有する1種または複数の識別子は、Y字形アダプタのハイブリダイズされる部分および/またはY字形アダプタのハイブリダイズされない部分に存在し得る。特定の例において、Y字形アダプタは、そのハイブリダイズされる部分にランダム配列を有する識別子を含み、そのハイブリダイズされない部分に既定の配列を有する識別子を含むことができる。識別子は、本明細書に開示されているいずれかの長さとなり得る。例えば、Y字形アダプタは、そのハイブリダイズされる部分に7ヌクレオチドのランダム配列を有する識別子を含み、そのハイブリダイズされない部分に8ヌクレオチドの既定の配列を有する識別子を含むことができる。
アダプタは、分子バーコードを有する二本鎖部分および少なくとも1または2個の一本鎖部分を含むことができる。例えば、アダプタは、Y字形となり、二本鎖部分および2個の一本鎖部分を含むことができる。一本鎖部分は、互いに相補的ではない配列を含むことができる。
アダプタは、アダプタがポリヌクレオチドに効率的に(例えば、少なくとも約20%、30%、40%、50%の効率で)ライゲーションされるまたは他の仕方でカップリングされることを可能にするように選択される配列を有する末端を含むことができる。一部の例において、アダプタの二本鎖部分における末端ヌクレオチドは、効率的ライゲーションをもたらすためのプリンおよびピリミジンの組合せから選択される。
一部の例において、ライブラリーアダプタのセットは、分子バーコードを有する複数のポリヌクレオチド分子(ライブラリーアダプタ)を含む。ライブラリーアダプタは、80、70、60、50、45または40ヌクレオチド塩基未満またはそれに等しい長さである。分子バーコードは、少なくとも4ヌクレオチド塩基の長さとなり得るが、4~20ヌクレオチド塩基の長さとなり得る。分子バーコードは、互いに異なり、互いの間に少なくとも1、2、3、4または5の編集距離を有することができる。分子バーコードは、それぞれのライブラリーアダプタの末端から少なくとも1、2、3、4、5、10または20ヌクレオチド塩基離れて位置する。一部の事例において、少なくとも1末端塩基は、全ライブラリーアダプタにおいて同一である。
ライブラリーアダプタは、分子バーコードを除いて同一となり得る。例えば、ライブラリーアダプタは、同一配列を有することができるが、分子バーコードのヌクレオチド配列に関してのみ異なる。
ライブラリーアダプタのそれぞれは、二本鎖部分および少なくとも1個の一本鎖部分を有することができる。「一本鎖部分」とは、非相補性またはオーバーハングの区域を意味する。一部の事例において、ライブラリーアダプタのそれぞれは、二本鎖部分および2個の一本鎖部分を有する。二本鎖部分は、分子バーコードを有することができる。一部の事例において、分子バーコードは、ランダマーである。ライブラリーアダプタのそれぞれは、一本鎖部分に鎖同定バーコードをさらに含むことができる。鎖同定バーコードは、少なくとも4ヌクレオチド塩基、一部の事例において、4~20ヌクレオチド塩基を含むことができる。
一部の例において、ライブラリーアダプタのそれぞれは、分子バーコードを有する二本鎖部分および2個の一本鎖部分を有する。一本鎖部分は、互いにハイブリダイズしなくてよい。一本鎖部分は、互いに完全に相補的でなくてよい。
ライブラリーアダプタは、同じである二本鎖部分に末端ヌクレオチドの配列を有することができる。末端ヌクレオチドの配列は、少なくとも2、3、4、5または6ヌクレオチド塩基の長さとなり得る。例えば、ライブラリーアダプタの二本鎖部分の一方の鎖は、末端に配列ACTT、TCGCまたはTACCを有することができる一方、他方の鎖は、相補的配列を有することができる。一部の事例において、かかる配列は、ライブラリーアダプタが標的ポリヌクレオチドにライゲーションする効率を最適化するように選択される。かかる配列は、ライブラリーアダプタの末端および標的ポリヌクレオチドの間の結合相互作用を最適化するように選択することができる。
一部の事例において、ライブラリーアダプタのいずれも、試料同定モチーフ(または試料分子バーコード)を含有しない。かかる試料同定モチーフは、配列決定アダプタによりもたらすことができる。試料同定モチーフは、所与の試料由来のポリヌクレオチド分子の、他の試料由来のポリヌクレオチド分子からの同定を可能にする少なくとも4、5、6、7、8、9、10、20、30または40ヌクレオチド塩基のシーケンサーを含むことができる。例えば、これは、2名の対象由来のポリヌクレオチド分子が同じプールにおいて配列決定され、該対象の配列リードがその後に同定されることを可能にし得る。
シーケンサーモチーフは、配列決定システムへのライブラリーアダプタのカップリングおよびライブラリーアダプタにカップリングされた標的ポリヌクレオチドの配列決定に必要とされるヌクレオチド配列(複数可)を含む。シーケンサーモチーフは、フローセル配列に相補的な配列および配列決定における使用のためのプライマー(またはプライミング配列)に選択的にハイブリダイズ可能な配列(配列決定開始配列)を含むことができる。例えば、かかる配列決定開始配列は、合成による配列決定(例えば、Illumina)における使用に用いられるプライマーに相補的となり得る。かかるプライマーは、配列決定アダプタに含まれ得る。配列決定開始配列は、プライマーハイブリダイゼーション部位となり得る。
一部の事例において、ライブラリーアダプタのいずれも、完全シーケンサーモチーフを含有しない。ライブラリーアダプタは、部分的シーケンサーモチーフを含有することができる、またはシーケンサーモチーフを含有しない。一部の事例において、ライブラリーアダプタは、配列決定開始配列を含む。ライブラリーアダプタは、配列決定開始配列を含むことができるが、フローセル配列を含まない。配列決定開始配列は、配列決定のためのプライマーに相補的となり得る。プライマーは、配列特異的プライマーまたはユニバーサルプライマーとなり得る。かかる配列決定開始配列は、ライブラリーアダプタの一本鎖部分に位置し得る。代替として、かかる配列決定開始配列は、配列決定の際にポリメラーゼがライブラリーアダプタにカップリングすることを可能にするためのプライミング部位(例えば、ねじれ(kink)またはニック)となり得る。
一部の事例において、部分的または完全シーケンサーモチーフは、配列決定アダプタによってもたらされる。配列決定アダプタは、試料分子バーコードおよびシーケンサーモチーフを含むことができる。配列決定アダプタは、ライブラリーアダプタから離間したセットにおいて提供することができる。所与のセットにおける配列決定アダプタは、同一のものとなり得る - すなわち、同じ試料バーコードおよびシーケンサーモチーフを含有する。
配列決定アダプタは、試料同定モチーフおよびシーケンサーモチーフを含むことができる。シーケンサーモチーフは、配列決定開始配列に相補的なプライマーを含むことができる。一部の事例において、シーケンサーモチーフは、ポリヌクレオチドが、ポリヌクレオチドをシーケンサーによって配列決定させる様式で構成または配置されることを可能にする、フローセル配列または他の配列も含む。
ライブラリーアダプタおよび配列決定アダプタはそれぞれ、部分的アダプタとなることができる、すなわち、配列決定プラットフォームによる配列決定を可能にするために必要な配列の一部を含有するが、その全てを含有する訳ではない。これらは一体になって完全アダプタをもたらす。例えば、ライブラリーアダプタは、部分的シーケンサーモチーフを含むことができる、またはシーケンサーモチーフを含まないが、かかるシーケンサーモチーフは、配列決定アダプタによってもたらされる。
図9A~図9Cは、標的ポリヌクレオチド分子にライブラリーアダプタをタグ付けするための方法を模式的に図解する。図9Aは、鎖の一方にプライマーハイブリダイゼーション部位および別の末端に向かって分子バーコードを含有する部分的アダプタとしてライブラリーアダプタを示す。プライマーハイブリダイゼーション部位は、その後の配列決定のための配列決定開始配列となり得る。ライブラリーアダプタは、80ヌクレオチド塩基未満またはそれに等しい長さである。図9Bにおいて、ライブラリーアダプタは、標的ポリヌクレオチド分子の両端においてライゲーションされて、タグ付けされた標的ポリヌクレオチド分子をもたらす。タグ付けされた標的ポリヌクレオチド分子を核酸増幅に供して、標的のコピーを生成することができる。次に、図9Cにおいて、シーケンサーモチーフを含有する配列決定アダプタが提供され、タグ付けされた標的ポリヌクレオチド分子にハイブリダイズされる。配列決定アダプタは、試料同定モチーフを含有する。配列決定アダプタは、所与のシーケンサーによるタグ付けされた標的の配列決定を可能にするための配列を含有することができる。
D.配列決定
タグ付けされたポリヌクレオチドを配列決定して、配列リードを生成することができる(例えば、ステップ(106)、図1に示す通り)。例えば、タグ付けされた二重鎖ポリヌクレオチドを配列決定することができる。配列リードは、タグ付けされた二重鎖ポリヌクレオチドの一方の鎖のみから生成することができる。あるいは、タグ付けされた二重鎖ポリヌクレオチドの両方の鎖が、配列リードを生成することができる。タグ付けされた二重鎖ポリヌクレオチドの2本の鎖は、同じタグを含むことができる。あるいは、タグ付けされた二重鎖ポリヌクレオチドの2本の鎖は、異なるタグを含むことができる。タグ付けされた二重鎖ポリヌクレオチドの2本の鎖が、異なってタグ付けされた場合、一方の鎖(例えば、ワトソン鎖)から生成された配列リードは、他方の鎖(例えば、クリック鎖)から生成された配列リードから識別することができる。配列決定は、分子毎に複数の配列リードの生成に関与することができる。これは、例えば、配列決定プロセスにおける、例えば、PCRによる個々のポリヌクレオチド鎖の増幅の結果生じる。
本明細書に開示されている方法は、ポリヌクレオチドの増幅を含むことができる。ポリヌクレオチド増幅は、核酸分子またはプライマーへのヌクレオチドの取り込みをもたらし、これにより、鋳型核酸に相補的な新たな核酸分子を形成することができる。新たに形成されたポリヌクレオチド分子およびその鋳型は、追加的なポリヌクレオチドを合成するための鋳型として使用することができる。増幅されているポリヌクレオチドは、ゲノムDNA、cDNA(相補的DNA)、cfDNAおよび循環腫瘍DNA(ctDNA)を含むいずれかの核酸、例えば、デオキシリボ核酸となり得る。増幅されているポリヌクレオチドは、RNAとなることもできる。本明細書において、1回の増幅反応は、DNA複製の多くのラウンドを含むことができる。DNA増幅反応は、例えば、ポリメラーゼ連鎖反応(PCR)を含むことができる。1回のPCR反応は、DNA分子の2~100「サイクル」の変性、アニーリングおよび合成を含むことができる。例えば、増幅ステップにおいて2~7、5~10、6~11、7~12、8~13、9~14、10~15、11~16、12~17、13~18、14~19または15~20サイクルを行うことができる。PCR条件は、プライマーを含む配列のGC含量に基づき最適化することができる。
本明細書に記載されているアッセイと共に、核酸増幅技法を使用することができる。一部の増幅技法は、PCR方法論であり、その例として、溶液PCRおよびin situ
PCRを挙げることができるがこれらに限定されない。例えば、増幅は、PCRに基づく増幅を含むことができる。あるいは、増幅は、PCRに基づかない増幅を含むことができる。鋳型核酸の増幅は、1種または複数のポリメラーゼの使用を含むことができる。例えば、ポリメラーゼは、DNAポリメラーゼまたはRNAポリメラーゼとなり得る。一部の事例において、高忠実度ポリメラーゼ(例えば、Phusion(登録商標)高忠実度DNAポリメラーゼ)またはPCRプロトコールの使用による等、高忠実度増幅が行われる。一部の事例において、ポリメラーゼは、高忠実度ポリメラーゼとなり得る。例えば、ポリメラーゼは、KAPA HiFi DNAポリメラーゼとなり得る。ポリメラーゼは、Phusion DNAポリメラーゼとなることもできる。ポリメラーゼは、例えば、断片長、GC含量等による増幅バイアスを低下または最小化する反応条件下で使用することができる。
PCRを挙げることができるがこれらに限定されない。例えば、増幅は、PCRに基づく増幅を含むことができる。あるいは、増幅は、PCRに基づかない増幅を含むことができる。鋳型核酸の増幅は、1種または複数のポリメラーゼの使用を含むことができる。例えば、ポリメラーゼは、DNAポリメラーゼまたはRNAポリメラーゼとなり得る。一部の事例において、高忠実度ポリメラーゼ(例えば、Phusion(登録商標)高忠実度DNAポリメラーゼ)またはPCRプロトコールの使用による等、高忠実度増幅が行われる。一部の事例において、ポリメラーゼは、高忠実度ポリメラーゼとなり得る。例えば、ポリメラーゼは、KAPA HiFi DNAポリメラーゼとなり得る。ポリメラーゼは、Phusion DNAポリメラーゼとなることもできる。ポリメラーゼは、例えば、断片長、GC含量等による増幅バイアスを低下または最小化する反応条件下で使用することができる。
PCRによるポリヌクレオチドの一本鎖の増幅は、かかる鎖およびその相補体の両方のコピーを生成するであろう。配列決定の際に、鎖およびその相補体の両方が、配列リードを生成するであろう。しかし、例えば、ワトソン鎖の相補体から生成された配列リードは、本来のワトソン鎖にタグ付けされた二重鎖タグの部分の相補体を有するため、そのように同定することができる。対照的に、クリック鎖またはその増幅産物から生成された配列リードは、本来のクリック鎖にタグ付けされた二重鎖タグの部分を有するであろう。このようにして、ワトソン鎖の相補体の増幅された産物から生成された配列リードは、本来の分子のクリック鎖の増幅産物から生成された相補体配列リードから識別することができる。
増幅されたポリヌクレオチドは全て、配列決定のために配列決定装置に提出することができる。あるいは、増幅されたポリヌクレオチドの全てのサンプリング、またはサブセットは、配列決定のために配列決定装置に提出される。いずれか本来の二本鎖ポリヌクレオチドに関して、配列決定に関して3通りの結果が存在し得る。第1に、配列リードは、本来の分子の両方の相補鎖から(すなわち、ワトソン鎖およびクリック鎖の両方から)生成することができる。第2に、配列リードは、2本の相補鎖のうち1本のみから(すなわち、ワトソン鎖またはクリック鎖のいずれかからであって、両方からではない)生成することができる。第3に、配列リードは、2本の相補鎖のいずれから生成することもできない。結果的に、ある遺伝子座にマッピングされる特有の配列リードの計数は、この遺伝子座にマッピングされる本来の試料における二本鎖ポリヌクレオチドの数を過小評価するであろう。未観測および未計数のポリヌクレオチドを推定する方法が、本明細書に記載されている。
配列決定方法は、大規模並列配列決定となり得る、すなわち、少なくとも100、1000、10,000、100,000、100万、1千万、1億または10億ポリヌクレオチド分子のいずれかを同時に(または素早く連続して)配列決定する。配列決定方法として、ハイスループット配列決定、ピロシーケンス、合成による配列決定、単一分子配列決定、ナノポア配列決定、半導体配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、RNA-Seq(Illumina)、Digital Gene Expression(Helicos)、次世代配列決定、合成による単一分子配列決定(SMSS)(Helicos)、大規模並列配列決定、クローナル単一分子アレイ(Solexa)、ショットガン配列決定、マクサム・ギルバートまたはサンガー配列決定、プライマーウォーキング、PacBio、SOLiD、Ion Torrentまたはナノポアプラットフォームを使用した配列決定、および本技術分野で公知の他のいずれかの配列決定方法を挙げることができるがこれらに限定されない。
例えば、二重鎖タグ付けされたポリヌクレオチドは、例えばPCRにより増幅することができる(例えば、図4Aを参照;二重鎖タグ付けされたポリヌクレオチドは、mm’およびnn’と称される)。図4Aにおいて、配列mを含む二重鎖ポリヌクレオチドの鎖は、配列タグwおよびyを有する一方、配列m’を含む二重鎖ポリヌクレオチドの鎖は、配列タグxおよびzを有する。同様に、配列nを含む二重鎖ポリヌクレオチドの鎖は、配列タグaおよびcを有する一方、配列n’を含む二重鎖ポリヌクレオチドの鎖は、配列タグbおよびdを有する。増幅において、各鎖は、それ自身およびその相補的配列を産生する。しかし、例えば、本来の鎖mの後代は、配列5’-y’m’w’-3’を有し、本来のm’鎖1本鎖の後代は、配列5’-zm’x-3’を有するため、相補的配列m’を含む本来の鎖mの増幅後代は、本来の鎖m’の増幅後代から識別可能である。図4Bは、増幅をより詳細に示す。増幅において、ドットによって表されるエラーが、増幅後代に導入され得る。あらゆる鎖が、配列リードを産生するわけではなくなるように、適用後代を配列決定のためにサンプリングし、示されている配列リードをもたらす。配列リードは、鎖またはその相補体のいずれかに起因し得るため、配列および相補体配列の両方が、配列リードのセットに含まれるであろう。ポリヌクレオチドが、各末端に同じタグを有することが可能であることに留意されたい。よって、タグ「a」およびポリヌクレオチド「m」に関して、第1の鎖は、a-m-a’とタグ付けされ、相補体は、a-m’-aとタグ付けされ得る。
E.コンセンサス配列リードの決定
本明細書に開示されている方法は、冗長性を低下または追跡することによる等、配列リードにおけるコンセンサス配列リードを決定するステップを含むことができる(例えば、ステップ(108)、図1に示す通り)。増幅されたポリヌクレオチドの配列決定は、「冗長リード」と称される、同じ本来のポリヌクレオチド由来の数種類の増幅産物のリードを産生することができる。冗長リードを同定することにより、本来の試料における特有の分子を決定することができる。試料における分子が、特有にタグ付けされる場合、単一の特有の本来の分子の増幅から生成されたリードは、それらの別個のバーコードに基づき同定することができる。バーコードを無視すると、特有の本来の分子由来のリードは、任意選択で、リードの長さと組み合わせて、リードの始まりおよび終わりにおける配列に基づき決定することができる。しかし、ある特定の事例において、試料は、同じ開始停止配列および同じ長さを有する複数の本来の分子を有すると予想され得る。バーコーディングなしでは、これらの分子は、互いの識別が困難である。しかし、ポリヌクレオチドのコレクションが、非特有にタグ付けされる場合(すなわち、本来の分子が、少なくとも1種の他の本来の分子と同じ識別子を共有する場合)、開始/停止配列および/またはポリヌクレオチド長と、バーコード由来の情報との組合せは、いずれかの配列リードを本来のポリヌクレオチドへとトレースできる確率を有意に増加させる。これは一部には、特有のタグ付けがなくても、同じ開始/停止配列および長さを有するいずれか2種の本来のポリヌクレオチドが同様に、同じ識別子をタグ付けされる可能性が低いことが理由である。
F.崩壊
崩壊は、プロセスの各ステップにおいて生成されるノイズ(すなわち、バックグラウンド)の低下を可能にする。本明細書に開示されている方法は、コンセンサス配列を崩壊、例えば、複数の配列リードを比較することによりこれを生成するステップを含むことができる。例えば、単一の本来のポリヌクレオチドから生成された配列リードを使用して、かかる本来のポリヌクレオチドのコンセンサス配列を生成することができる。増幅の反復的ラウンドは、後代ポリヌクレオチドにエラーを導入し得る。また、配列決定は、典型的に、完全な忠実度で行われなくてもよいため、配列決定エラーが、同様にこのステージで導入される。しかし、配列バリアントを有する分子を含む、単一の本来の分子に由来する分子の配列リードの比較は、本来のまたは「コンセンサス」配列を決定できるように解析することができる。これは、系統発生的に行うことができる。コンセンサス配列は、種々の方法のいずれかにより配列リードのファミリーから生成することができる。かかる方法は、例えば、デジタルコミュニケーション理論、情報理論またはバイオインフォマティクスに由来するコンセンサス配列構築(投票(例えば、偏った投票)、平均化、統計的、最大事後もしくは最大尤度検出、動的プログラミング、ベイジアン、隠れマルコフまたはサポートベクターマシン方法等)の線形または非線形方法を含む。例えば、本来の分子へと追跡する配列リードの全てまたは大部分が、同じ配列バリアントを有する場合、このバリアントは、本来の分子におそらく存在した。他方では、配列バリアントが、冗長配列リードのサブセットに存在する場合、このバリアントは、増幅/配列決定において導入された可能性があり、本来は存在しないアーチファクトを表す。さらに、本来のポリヌクレオチドのワトソンまたはクリック鎖に由来する配列リードのみが、バリアントを含有する場合、バリアントは、片面の(single-sided)DNA損傷、第1のサイクルのPCRエラーまたは異なる試料から増幅されたポリヌクレオチドの混入により導入された可能性がある。
断片が増幅され、増幅された断片の配列が読み取られて整列された後に、断片は、塩基コーリングに供される、例えば、遺伝子座毎に、最も可能性の高いヌクレオチドを決定する。しかし、増幅された断片および未観測の増幅された断片(例えば、その配列を読み取られていない断片;増幅エラー、配列決定読み取りエラー、長過ぎる、短過ぎる、削られている等、非常に多くの理由が考えられ得る)の数のバリエーションは、塩基コーリングにおいてエラーを導入し得る。観察された増幅された断片(実際に読み取られている増幅された断片)に対してあまりにも多くの未観測の増幅された断片が存在する場合、塩基コーリングの信頼性は、縮小され得る。
したがって、塩基コーリングにおける未観測断片の数を補正する方法が、本明細書に開示されている。例えば、遺伝子座A(任意の遺伝子座)の塩基コーリングの場合、N個の増幅された断片が存在することが先ず想定される。配列リードアウトは、2種類の断片に由来し得る:二本鎖断片および一本鎖断片。したがって、それぞれ二本鎖、一本鎖および未観測断片の数としてN1、N2およびN3を割り当てる。よって、N=N1+N2+N3(N1およびN2は、配列リードアウトから公知であり、NおよびN3は未知である)。式が、N(またはN3)に関して解かれる場合、N3(またはN)が推測される。
確率が使用されて、Nを推定する。例えば、一本鎖の配列リードアウトにおける遺伝子座Aのヌクレオチドを検出した(または読み取った)確率になるように「p」を割り当てる。
二本鎖由来の配列リードアウトに関して、二本鎖の増幅された断片からのヌクレオチドコールは、p*p=p^2の確率を有し、全N1個の二本鎖の観測は、次の方程式を有する:N1=N*(p^2)。
一本鎖由来の配列リードアウトに関する。2本の鎖のうち1本が観測され、他方が未観測であることを想定すると、1本の鎖の観測の確率は「p」であるが、他方の鎖を見失う確率は(1-p)である。さらに、5-プライマー起源および3-プライマー起源の一本鎖を識別しないことにより、因数2が存在する。したがって、一本鎖の増幅された断片由来のヌクレオチドコールは、確率2×p×(1-p)を有する。よって、全N2個の一本鎖の観測は、次の方程式を有する:N2=N×2×p×(1-p)。
「p」も未知である。pを解くために、N1対N2の比を使用して、「p」を解く:
「p」が求められたら、Nを求めることができる。Nが求められた後に、N3=N-N1-N2を求めることができる。
「p」が求められたら、Nを求めることができる。Nが求められた後に、N3=N-N1-N2を求めることができる。
ペア化対非ペア化鎖の比に加えて(崩壊後の尺度)、各遺伝子座における崩壊前リード深度における有用な情報が存在する。この情報を使用して、総分子数のコールをさらに改善するおよび/またはバリアントコールの信頼度を増加させることができる。
例えば、図4Cは、相補的配列が補正された配列リードを実証する。本来のワトソン鎖または本来のクリック鎖から生成された配列は、それらの二重鎖タグに基づいて区別することができる。同じ本来の鎖から生成された配列を群分けすることができる。配列の検査は、本来の鎖の配列(「コンセンサス配列」)の推測を可能にし得る。この場合、例えば、nn’分子における配列バリアントは、全配列リードに含まれるため、コンセンサス配列に含まれるが、他のバリアントは、迷走エラーであると観測される。配列の崩壊後に、それらの相補的配列および二重鎖タグに基づき、本来のポリヌクレオチドペアを同定することができる。
図5は、ワトソンおよびクリック鎖由来のリードをペア形成することによる、配列バリアントの検出における信頼度増加を実証する。配列nn’は、ドットによって示される配列バリアントを含むことができる。一部の事例において、配列pp’は、配列バリアントを含まない。増幅、配列決定、冗長性低下およびペア形成は、配列バリアントを含む同じ本来の分子のワトソンおよびクリック鎖の両方をもたらすことができる。対照的に、増幅および配列決定におけるサンプリングの際に導入されたエラーの結果、ワトソン鎖pのコンセンサス配列は、配列バリアントを含有することができる一方、クリック鎖p’のコンセンサス配列は、これを含有しない。増幅および配列決定が、二重鎖の両方の鎖(nn’配列)に同じバリアントを導入する可能性は、一方の鎖(pp’配列)よりも低い。したがって、pp’配列におけるバリアントは、アーチファクトである可能性が高く、nn’配列におけるバリアントは、本来の分子に存在する可能性が高い。
本明細書に開示されている方法を使用して、実験、例えば、PCR、増幅および/または配列決定に起因するエラーを補正することができる。例えば、かかる方法は、二本鎖ポリヌクレオチドの両端に1種または複数の二本鎖アダプタを取り付け、これにより、タグ付けされた二本鎖ポリヌクレオチドを用意するステップと、二本鎖タグ付けされたポリヌクレオチドを増幅するステップと、タグ付けされたポリヌクレオチドの両方の鎖を配列決定するステップと、一方の鎖とその相補体との配列を比較して、配列決定の際に導入されたいずれかのエラーを決定するステップと、(d)に基づき配列におけるエラーを補正するステップとを含むことができる。本方法において使用されるアダプタは、本明細書に開示されているいずれかのアダプタ、例えば、Y字形アダプタとなり得る。アダプタは、本明細書に開示されているいずれかのバーコード(例えば、別個のバーコード)を含むことができる。
G.マッピング
配列リードまたはコンセンサス配列は、1種または複数の選択された遺伝子座にマッピングすることができる(例えば、ステップ(110)、図1に示す通り)。遺伝子座は、例えば、ゲノム内の特異的なヌクレオチド位置、ヌクレオチドの配列(例えば、オープンリーディングフレーム)、染色体の断片、染色体全体またはゲノム全体となり得る。遺伝子座は、多型遺伝子座となり得る。多型遺伝子座は、配列バリエーションが、集団に存する、および/または対象および/または試料に存する遺伝子座となり得る。多型遺伝子座は、ゲノムの同じ位置に共存する2種またはそれを超える別個の配列によって生成することができる。別個の配列は、いずれかの数のヌクレオチド、一般に、とりわけ50、45、40、35、30、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2または1ヌクレオチド(複数可)未満等、相対的に少数のヌクレオチドの1個または複数のヌクレオチド置換、欠失/挿入および/または重複により、互いに異なることができる。多型遺伝子座は、集団内で変動する単一ヌクレオチド位置により作製することができ、例えば、単一ヌクレオチドバリエーション(SNV)または一塩基多型(SNP)である。
マッピングのための参照ゲノムは、目的のいずれかの種のゲノムを含むことができる。参照として有用なヒトゲノム配列は、hg19アセンブリまたはいずれかの以前のもしくは利用できるhgアセンブリを含むことができる。かかる配列は、genome.ucsc.edu/index.htmlにて利用できるゲノムブラウザを使用して照合することができる。他の種のゲノムは、例えば、PanTro2(チンパンジー)およびmm9(マウス)を含む。
本明細書に開示されている方法において、崩壊は、マッピングの前または後に行うことができる。一部の態様において、崩壊は、マッピング前に行うことができる。例えば、配列リードは、リードがゲノム内にマッピングされる位置を考慮することなく、それらのタグおよび1種または複数の内在性配列に基づき、ファミリーへと群分けすることができる。次に、ファミリーのメンバーは、コンセンサス配列へと崩壊させることができる。コンセンサス配列は、本明細書に開示されているいずれかの崩壊方法を使用して生成することができる。次に、コンセンサス配列は、ゲノム内の位置にマッピングすることができる。遺伝子座にマッピングされたリードは、定量化(例えば、計数)することができる。遺伝子座に突然変異を保有するリードのパーセンテージを決定することもできる。あるいは、崩壊は、マッピング後に行うことができる。例えば、あらゆるリードは、先ず、ゲノムにマッピングすることができる。次に、リードは、それらのタグおよび1種または複数の内在性配列に基づき、ファミリーへと群分けすることができる。リードが、ゲノムにマッピングされたら、各遺伝子座におけるファミリー毎にコンセンサス塩基を決定することができる。他の態様において、コンセンサス配列は、DNA分子の一方の鎖(例えば、ワトソン鎖またはクリック鎖)のために生成することができる。マッピングは、DNA分子の一方の鎖のコンセンサス配列が決定される前または後に行うことができる。ダブレットおよびシングレットの数を決定することができる。これらの数を使用して、未観測分子を計算することができる。例えば、未観測分子は、次の方程式を使用して計算することができる:N=D+S+U;D=Np(2)、S=N2pq(式中、p=1-q、pは、観測の確率であり;qは、鎖を見失う確率である)。
H.群分け
本明細書に開示されている方法は、配列リードを群分けするステップを含むこともできる。配列リードは、様々な種類の配列、例えば、オリゴヌクレオチドタグ(例えば、バーコード)の配列、ポリヌクレオチド断片の配列またはいずれかの組合せに基づき群分けすることができる。例えば、ステップ(112)(図1)に示す通り、配列リードは、次の通りに群分けすることができる:試料における二本鎖ポリヌクレオチドの「ワトソン」鎖から生成された配列リードおよび「クリック」鎖から生成された配列リードは、これらが有する二重鎖タグに基づき同定可能である。このようにして、二重鎖ポリヌクレオチドのワトソン鎖由来の配列リードまたはコンセンサス配列は、その相補的クリック鎖由来の配列リードまたはコンセンサス配列とペア形成することができる。ペア形成された配列リードは、「ペア」と称される。
相補鎖に対応する配列リードが配列リードの中に見出されない配列リードは、「シングレット」と命名される。
2本の相補鎖のどちらの配列リードも生成されなかった二本鎖ポリヌクレオチドは、「未観測」分子と称される。
I.定量化
本明細書に開示されている方法は、配列リードを定量化するステップも含む。例えば、ステップ(114)(図1)に示す通り、選択された遺伝子座または複数の選択された遺伝子座のそれぞれにマッピングするペアおよびシングレットは、定量化される、例えば、計数される。
定量化は、試料におけるポリヌクレオチド(例えば、ペアポリヌクレオチド、シングレットポリヌクレオチドまたは未観測ポリヌクレオチド)の数の推定を含むことができる。例えば、ステップ(116)(図1)に示す通り、配列リードが生成されなかった試料における二本鎖ポリヌクレオチド(「未観測」ポリヌクレオチド)の数が推定される。二本鎖ポリヌクレオチドが配列リードを生成しない確率は、いずれかの遺伝子座におけるペアおよびシングレットの相対数に基づき決定することができる。この確率を使用して、未観測ポリヌクレオチドの数を推定することができる。
ステップ(118)において、選択された遺伝子座にマッピングする試料における二本鎖ポリヌクレオチドの総数の推定は、遺伝子座にマッピングするペアの数、シングレットの数および未観測分子の数の和である。
試料における未観測の本来の分子の数は、ペアおよびシングレットの相対数に基づき推定することができる(図2)。図2を参照すると、一例として、特定のゲノム遺伝子座、遺伝子座Aの計数が記録され、それによると、1000分子がペア形成され、1000分子がペア形成されない。変換後のプロセスを為すために個々のワトソンまたはクリック鎖に対し均一確率、pを想定すると、プロセスを為すことができない(未観測)分子の比率を次の通りに計算することができる:R=ペア形成対ペア形成されない分子の比=1とすると、R=1=p2/(2p(1-p))。これは、p=2/3であることと、失われた分子の分量が、(1-p)2=1/9に等しいことを意味する。よって、この例において、変換された分子のおよそ11%が、失われ、検出されない。同じ試料における別のゲノム遺伝子座、遺伝子座Bを考慮し、これによると、1440分子がペア形成され、720がペア形成されない。同じ方法を使用して、失われた分子の数が僅か4%であることを推測することができる。この2区域を比較すると、遺伝子座Bにおける2160分子と比較して、遺伝子座Aが、2000個の特有の分子を有したことを想定することができる -
ほぼ8%の差。しかし、各領域における失われた分子において正確に加えることにより、遺伝子座Aに2000/(8/9)=2250分子、遺伝子座Bに2160/0.96=2250分子が存在すると推測する。したがって、両方の領域における計数は、実際に等しい。この補正と、したがって、さらにより高い感度は、本来の二本鎖核酸分子を変換し、プロセスの終わりにペア形成されるおよびペア形成されない全分子をバイオインフォマティクスにより追跡維持することにより達成可能である。同様に、同じ手順を使用して、観察された特有の分子の類似の計数を有すると思われる領域における真のコピー数バリエーションを推測することができる。2種またはそれを超える領域における未観測分子の数を考慮に入れることにより、コピー数バリエーションは明らかになる。
ほぼ8%の差。しかし、各領域における失われた分子において正確に加えることにより、遺伝子座Aに2000/(8/9)=2250分子、遺伝子座Bに2160/0.96=2250分子が存在すると推測する。したがって、両方の領域における計数は、実際に等しい。この補正と、したがって、さらにより高い感度は、本来の二本鎖核酸分子を変換し、プロセスの終わりにペア形成されるおよびペア形成されない全分子をバイオインフォマティクスにより追跡維持することにより達成可能である。同様に、同じ手順を使用して、観察された特有の分子の類似の計数を有すると思われる領域における真のコピー数バリエーションを推測することができる。2種またはそれを超える領域における未観測分子の数を考慮に入れることにより、コピー数バリエーションは明らかになる。
二項分布の使用に加えて、未観測分子の数を推定する他の方法は、観察された配列リードの冗長性に基づく指数関数的、ベータ、ガンマまたは経験的分布を含む。後者の場合、ペア形成されたおよびペア形成されない分子のリード計数の分布は、特定の遺伝子座における本来のポリヌクレオチド分子の根底にある分布を推測するために、かかる冗長性に由来し得る。これは多くの場合、未観測分子の数のより優れた推定をもたらし得る。
J.CNV検出
本明細書に開示されている方法は、CNVを検出するステップも含む。例えば、ステップ(120)(図1)に示す通り、遺伝子座にマッピングするポリヌクレオチドの総数が決定されたら、該遺伝子座におけるCNVを決定する標準方法において、この数を使用することができる。定量的尺度は、標準に対し正規化することができる。標準は、いずれかのポリヌクレオチドの量となり得る。一方法において、被験遺伝子座における定量的尺度は、公知のコピー数の遺伝子等、ゲノムにおける対照遺伝子座にマッピングするポリヌクレオチドの定量的尺度に対し標準化することができる。定量的尺度は、本明細書に開示されているいずれかの試料における核酸の量に対し比較することができる。例えば、別の方法において、定量的尺度は、本来の試料における核酸の量に対し比較することができる。例えば、本来の試料が、10,000一倍体遺伝子当量を含有した場合、定量的尺度は、二倍性に予想される尺度に対し比較することができる。別の方法において、定量的尺度は、対照試料由来の尺度に対し正規化することができ、異なる遺伝子座における正規化された尺度を比較することができる。
コピー数バリエーション解析が望まれる一部の事例において、配列データは:1)参照ゲノムと整列することができ;2)フィルターをかけマッピングすることができ;3)配列のウィンドウまたはビンへとパーティションで区切ることができ;4)ウィンドウ毎に計数される被覆リードとなることができ;5)次に、確率論的または統計的モデリングアルゴリズムを使用して、被覆リードを正規化することができ;6)ゲノム内の様々な位置における別々のコピー数状態を反映する出力ファイルを生成することができる。稀な突然変異解析が望まれる他の事例において、配列データは、1)参照ゲノムと整列することができ;2)フィルターをかけマッピングすることができ;3)バリアント塩基の頻度を、この特異的塩基の被覆リードに基づき計算することができ;4)確率論的、統計的または確率的モデリングアルゴリズムを使用してバリアント塩基頻度を正規化することができ;5)ゲノム内の様々な位置における突然変異状態を反映する出力ファイルを生成することができる。
配列リード被覆比が決定されたら、確率論的モデリングアルゴリズムを任意選択で適用して、ウィンドウ領域毎の正規化された比を別々のコピー数状態に変換することができる。一部の事例において、このアルゴリズムは、隠れマルコフモデルを含むことができる。他の事例において、確率論的モデルは、動的プログラミング、サポートベクターマシン、ベイジアンモデリング、確率的モデリング、トレリスデコーディング、ビタビデコーディング、期待値最大化、カルマンフィルタリング方法論またはニューラル・ネットワークを含むことができる。
本明細書に開示されている方法は、ゲノム内の特異的領域におけるSNV、CNV、挿入、欠失および/または再編成を検出するステップを含むことができる。特異的ゲノム領域は、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOAまたはNTRK1等、遺伝子における配列を含むことができる。
一部の事例において、本方法は、1種または複数の遺伝子のエクソンを含むパネルを使用する。パネルは、1種または複数の遺伝子のイントロンも同様に含むことができる。パネルは、1種または複数の遺伝子のエクソンおよびイントロンを含むこともできる。1種または複数の遺伝子は、上に開示されている遺伝子となり得る。パネルは、遺伝子のパネルを網羅する約80,000塩基を含むことができる。パネルは、約1000、2000、3000、4000、5000、10000、15000、20000、25000、30000、35000、40000、45000、50000、55000、60000、65000、70000、75000、80000、85000、90000、95000、100000、105000、110000、115000、120000、125000またはそれを超える塩基を含むことができる。
一部の態様において、遺伝子のコピー数は、試料における遺伝子の遺伝的形態の頻度において反映され得る。例えば、健康個体において、コピー数バリエーションは、試料における検出される分子の約50%において検出される、1本の染色体内の遺伝子におけるバリアントにおいて反映されない(例えば、ヘテロ接合性)。また、健康個体において、バリアントを有する遺伝子の重複は、試料における検出される分子の約66%において検出されるバリアントにおいて反映され得る。したがって、DNA試料における腫瘍負荷が、10%である場合、CNVなしで、がん細胞の1本の染色体内の遺伝子における体細胞突然変異の頻度は、約5%となり得る。異数性の場合、逆も真となり得る。
本明細書に開示されている方法を使用して、配列バリアントが、生殖系列レベルに存在するかまたは例えばがん細胞における体細胞突然変異に起因する可能性がより高いか決定することができる。例えば、生殖系列におけるヘテロ接合性とほぼ間違いなく一貫したレベルで検出される遺伝子における配列バリアントは、該遺伝子においてCNVも検出される場合、体細胞突然変異の産物である可能性がより高い。一部の事例において、生殖系列における遺伝子重複が、遺伝子量と一貫したバリアントを有することが予想される程度まで(例えば、遺伝子座におけるトリソミーに関する66%)、この予想される量から有意に逸脱する配列バリアント用量による遺伝子増幅検出は、CNVが、体細胞突然変異の結果として存在する可能性がより高いことを示す。
本明細書に開示されている方法を使用して、2種の遺伝子における配列バリアントが異なる頻度で検出される状況における腫瘍異種性を推測することもできる。例えば、2種の遺伝子が異なる頻度で検出されるが、それらのコピー数が相対的に等しい場合、腫瘍異種性を推測することができる。あるいは、2種の配列バリアント間の頻度における差が、該2遺伝子のコピー数における差と一貫した場合、腫瘍均一性を推測することができる。よって、例えば、EGFRバリアントが11%で検出され、KRASバリアントが5%で検出され、これらの遺伝子においてCNVが検出されない場合、頻度における差は、腫瘍異種性を反映する可能性がある(例えば、全腫瘍細胞が、EGFR突然変異体を保有し、腫瘍細胞の半分が、KRAS突然変異体も保有する)。あるいは、突然変異体を保有するEGFR遺伝子が、2倍正常コピー数で検出される場合、解釈の1つは、腫瘍細胞の同種集団であり、各細胞が、EGFRおよびKRAS遺伝子に突然変異体を保有するが、このKRAS遺伝子は重複している。
化学療法に応答して、優位な腫瘍型は、がんを治療レジメンに対し無応答性にする突然変異体を保有するがん細胞へとダーウィン淘汰により最終的に取って代わられ得る。これらの抵抗性突然変異体の出現は、本発明の方法により遅延させることができる。本方法の一実施形態において、対象は、1回または複数のパルス治療サイクルに供され、各パルス治療サイクルは、薬物が第1の量で投与される第1の期間と、該薬物が第2の低下した量で投与される第2のサイクルとを含む。第1の期間は、第1の臨床レベルを上回って検出される腫瘍負荷によって特徴付けることができる。第2の期間は、第2の臨床レベルを下回って検出される腫瘍負荷によって特徴付けることができる。第1および第2の臨床レベルは、異なるパルス治療サイクルにおいて異なることができる。例えば、第1の臨床レベルは、後続サイクルにおいてより低くなることができる。複数のサイクルは、少なくとも2、3、4、5、6、7、8またはそれを超えるサイクルを含むことができる。例えば、BRAF突然変異体V600Eは、cfDNAにおける5%の腫瘍負荷を示す量で疾患細胞のポリヌクレオチドにおいて検出することができる。化学療法は、ダブラフェニブと共に開始することができる。その後の検査は、cfDNAにおけるBRAF突然変異体の量が、0.5%を下回って下落するまたは検出不能レベルとなることを示すことができる。この時点で、ダブラフェニブ療法は、停止するまたは有意に短縮させることができる。さらに、その後の検査は、BRAF突然変異を有するDNAが、cfDNAにおけるポリヌクレオチドの2.5%に上昇したことを見出すことができる。この時点で、例えば、初期処置と同じレベルで、ダブラフェニブ療法を再開することができる。その後の検査は、BRAF突然変異を有するDNAが、cfDNAにおけるポリヌクレオチドの0.5%まで減少したことを見出すことができる。再度、ダブラフェニブ療法を停止または低下させることができる。サイクルを多数回反復することができる。
治療介入は、本来の薬物に対し抵抗性の突然変異体型の上昇の検出により変化させることもできる。例えば、EGFR突然変異L858Rを有するがんは、エルロチニブによる治療法に応答する。しかし、EGFR突然変異T790Mを有するがんは、エルロチニブに対し抵抗性である。しかし、これは、ルキソリチニブに対し応答性である。本発明の方法は、腫瘍プロファイルの変化をモニタリングするステップと、薬物抵抗性に関連する遺伝的バリアントが、既定の臨床レベルまで上昇する場合、治療介入を変化させるステップとに関与する。
本発明に開示されている方法は、体細胞および疾患細胞由来のポリヌクレオチドを含む試料から疾患細胞異種性を検出する方法であって、a)複数の遺伝子座のそれぞれに配列バリアントを有する試料におけるポリヌクレオチドを定量化するステップと、b)複数の遺伝子座のそれぞれにおけるCNV、遺伝子座における疾患分子の異なる相対量を決定するステップであって、CNVが、疾患細胞ポリヌクレオチドにおける遺伝子座の遺伝子量を示すステップと、c)複数の遺伝子座のそれぞれの遺伝子座における遺伝子量当たりの遺伝子座に配列バリアントを有するポリヌクレオチドの分量の相対的尺度を決定するステップと、d)複数の遺伝子座のそれぞれにおける相対的尺度を比較するステップであって、異なる相対的尺度が、腫瘍異種性を示すステップとを含む方法を含むことができる。本明細書に開示されている方法において、遺伝子量は、総分子基盤で決定することができる。例えば、第1の遺伝子座に1×総分子が存在し、第2の遺伝子座にマッピングされた1.2×分子が存在する場合、遺伝子量は1.2である。この遺伝子座におけるバリアントは、1.2で割ることができる。一部の態様において、本明細書に開示されている方法を使用して、いずれかの疾患細胞異種性、例えば、腫瘍細胞異種性を検出することができる。本方法を使用して、いずれかの種類のポリヌクレオチド、例えば、cfDNA、ゲノムDNA、cDNAまたはctDNAを含む試料から疾患細胞異種性を検出することができる。本方法において、定量化は、例えば、ポリヌクレオチドの数または相対量の決定を含むことができる。CNVの決定は、遺伝子座に対する異なる相対量の総分子のマッピングおよび正規化を含むことができる。
別の態様において、化学療法に応答して、優位な腫瘍型は、がんを治療レジメンに対し無応答性にする突然変異体を保有するがん細胞へとダーウィン淘汰により最終的に取って代わられ得る。これらの抵抗性突然変異体の出現は、本明細書を通して開示されている方法により遅延させることができる。本明細書に開示されている方法は、a)各パルス治療サイクルが、(i)薬物が第1の量で投与される第1の期間および(ii)薬物が第2の低下した量で投与される第2の期間を含む、対象を1回または複数のパルス治療サイクルに供するステップであって、(A)第1の期間が、第1の臨床レベルを上回って検出される腫瘍負荷によって特徴付けられ、(B)第2の期間が、第2の臨床レベルを下回って検出される腫瘍負荷によって特徴付けられるステップを含む方法を含むことができる。
K.配列バリアント検出
本明細書に開示されているシステムおよび方法を使用して、配列バリアント、例えば、SNVを検出することができる。例えば、配列バリアントは、複数の配列リード、例えば、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、少なくとも24、少なくとも25、少なくとも26、少なくとも27、少なくとも28、少なくとも29、少なくとも30、少なくとも31、少なくとも32、少なくとも33、少なくとも34、少なくとも35、少なくとも36、少なくとも37、少なくとも38、少なくとも39、少なくとも40、少なくとも41、少なくとも42、少なくとも43、少なくとも44、少なくとも45、少なくとも46、少なくとも47、少なくとも48、少なくとも49、少なくとも50、少なくとも51、少なくとも52、少なくとも53、少なくとも54、少なくとも55、少なくとも56、少なくとも57、少なくとも58、少なくとも59、少なくとも60、少なくとも61、少なくとも62、少なくとも63、少なくとも64、少なくとも65、少なくとも66、少なくとも67、少なくとも68、少なくとも69、少なくとも70、少なくとも71、少なくとも72、少なくとも73、少なくとも74、少なくとも75、少なくとも76、少なくとも77、少なくとも78、少なくとも79、少なくとも80、少なくとも81、少なくとも82、少なくとも83、少なくとも84、少なくとも85、少なくとも86、少なくとも87、少なくとも88、少なくとも89、少なくとも90、少なくとも91、少なくとも92、少なくとも93、少なくとも94、少なくとも95、少なくとも96、少なくとも97、少なくとも98、少なくとも99、少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1000、少なくとも2000、少なくとも3000、少なくとも4000、少なくとも5000、少なくとも6000、少なくとも7000、少なくとも8000、少なくとも9000、少なくとも10000種またはそれを超える配列リード由来のコンセンサス配列から検出することができる。コンセンサス配列は、一本鎖ポリヌクレオチドの配列リードに由来し得る。コンセンサス配列は、二本鎖ポリヌクレオチドの一方の鎖の配列リードに由来することもできる(例えば、リードのペア形成)。例示的な方法において、リードのペア形成は、増加した信頼度での、分子における配列バリアントの存在の同定を可能にする。例えば、ペアの両方の鎖が、同じバリアントを含む場合、増幅/配列決定において同じバリアントが両方の鎖に導入される確率は、稀なため、バリアントが、本来の分子に存在したと合理的に確信することができる。対照的に、ペアの一方の鎖のみが、配列バリアントを含む場合、これは、アーチファクトである可能性がより高い。同様に、増幅/配列決定においてバリアントが1回導入され得る確率は、2回よりも高いため、配列バリアントを有するシングレットが、本来の分子に存在した信頼度は、バリアントが二重鎖に存在する場合の信頼度に満たない。
コピー数バリエーション検出および配列バリアント検出の他の方法は、参照により本明細書に全体的に組み込まれるPCT/US2013/058061に記載されている。
配列リードを崩壊させて、コンセンサス配列を生成することができ、これを参照配列にマッピングして、CNVまたはSNV等、遺伝的バリアントを同定することができる。代替として、配列リードは、先にマッピングされる、またはマッピングなしであってもよい。このような場合、配列リードを個々に参照にマッピングして、CNVまたはSNVを同定することができる。
図3は、遺伝子座Aをコードする参照配列を示す。図3におけるポリヌクレオチドは、Y字形となり得る、またはヘアピン等の他の形状を有する。
一部の事例において、SNVまたは複数ヌクレオチドバリアント(MNV)は、遺伝子座に対応する配列リードを整列することにより、所与の遺伝子座(例えば、ヌクレオチド塩基)における複数の配列リードにわたり決定することができる。次に、配列リードの少なくともサブセット由来の複数の連続的ヌクレオチド塩基は、参照にマッピングされて、該リードに対応するポリヌクレオチド分子またはその部分におけるSNVまたはMNVを決定する。複数の連続的ヌクレオチド塩基は、SNVまたはMNVの実際の、推測されるまたは疑われる位置にまたがることができる。複数の連続的ヌクレオチド塩基は、少なくとも3、4、5、6、7、8、9または10ヌクレオチド塩基にまたがることができる。
L.核酸の検出/定量化
本願を通して記載されている方法を使用して、極めて高効率でデオキシリボ核酸(DNA)等の核酸断片をタグ付けすることができる。この効率的なタグ付けは、本来のDNA断片の不均一集団(cfDNA等)における稀なDNAの効率的かつ正確な検出を可能にする。稀なポリヌクレオチド(例えば、稀なDNA)は、10%、5%、4%、3%、2%、1%または0.1%未満の頻度でポリヌクレオチドの集団に生じる遺伝的バリアントを含むポリヌクレオチドとなり得る。稀なDNAは、50%、25%、10%、5%、1%または0.1%未満の濃度で検出可能な特性を有するポリヌクレオチドとなり得る。
タグ付けは、単一の反応において起こり得る。一部の事例において、2回またはそれを超える反応を共に実行およびプールすることができる。単一の反応における本来のDNA断片それぞれのタグ付けは、本来のDNA断片の50%超(例えば、60%、70%、80%、90%、95%または99%)が、分子バーコードを含むタグを両端にタグ付けされるようなタグ付けをもたらし、これにより、タグ付けされたDNA断片を用意することができる。タグ付けは、分子バーコードを含むタグを両端にタグ付けされた、本来のDNA断片の30%、35%、40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%または99%超をもたらすこともできる。タグ付けは、分子バーコードを含むタグを両端にタグ付けされた、本来のDNA断片の100%をもたらすこともできる。タグ付けは、単一末端タグ付けをもたらすこともできる。
タグ付けは、本来のDNA断片と比較して過剰量のタグを使用することにより起こることもできる。例えば、過剰は、少なくとも5倍過剰となり得る。他の事例において、過剰は、少なくとも1.25、1.5、1.75、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100倍またはそれを超えて過剰となり得る。タグ付けは、平滑末端または粘着末端への取り付けを含むことができる。タグ付けは、ハイブリダイゼーションPCRによって行うこともできる。タグ付けは、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99または100ピコおよび/またはマイクロリットル等、少ない反応容量で行うこともできる。
本方法は、タグ付けされたDNA断片において高忠実度増幅を行うステップを含むこともできる。いかなる高忠実度DNAポリメラーゼを使用してもよい。例えば、ポリメラーゼは、KAPA HiFi DNAポリメラーゼまたはPhusion DNAポリメラーゼとなり得る。
さらに、本方法は、タグ付けされたDNA断片のサブセットを選択的に濃縮するステップを含むことができる。例えば、選択的濃縮は、ハイブリダイゼーションまたは増幅技法によって行うことができる。選択的濃縮は、固体支持体(例えば、ビーズ)を使用して行うことができる。固体支持体(例えば、ビーズ)は、プローブ(例えば、ある特定の配列に特異的にハイブリダイズするオリゴヌクレオチド)を含むことができる。例えば、プローブは、ある特定のゲノム領域、例えば、遺伝子とハイブリダイズすることができる。一部の事例において、ゲノム領域、例えば、遺伝子は、疾患、例えば、がんに関連する領域となり得る。濃縮後に、選択された断片は、本発明に開示されているいずれかの配列決定アダプタを取り付けることができる。例えば、配列アダプタは、フローセル配列、試料バーコードまたはその両方を含むことができる。別の例において、配列アダプタは、ヘアピン形アダプタとなり得る、および/または試料バーコードを含む。さらに、得られた断片を増幅および配列決定することができる。一部の事例において、アダプタは、配列決定プライマー領域を含まない。
本方法は、DNA断片の一方または両方の鎖を配列決定するステップを含むことができる。一事例において、DNA断片の両方の鎖は、独立的に配列決定される。タグ付け、増幅および/または選択的に濃縮されたDNA断片を配列決定して、分子バーコードおよび本来のDNA断片の少なくとも一部分の配列情報を含む配列リードを得る。
本方法は、配列リードにおける冗長性(上述の通り)を低下または追跡して、本来のDNA断片の一本鎖の代表となるコンセンサスリードを決定するステップを含むことができる。例えば、冗長性を低下または追跡するために、本方法は、同じまたは類似の分子バーコードおよび同じまたは類似の断片配列の末端を有する配列リードを比較するステップを含むことができる。本方法は、同じまたは類似の分子バーコードを有する配列リードにおいて系統発生解析を行うステップを含むことができる。分子バーコードは、変動する編集距離(本願を通して記載されているいずれかの編集距離を含む)、例えば、最大3の編集距離を有するバーコードを有することができる。断片配列の末端は、変動する距離(本願を通して記載されているいずれかの編集距離を含む)、例えば、最大3の編集距離を有する編集距離を有する断片配列を含むことができる。
本方法は、分子バーコードおよび配列情報に従って配列リードをビニングするステップを含むことができる。例えば、分子バーコードおよび配列情報に従った配列リードのビニングは、本来のDNA断片のそれぞれの少なくとも一端から行って、一本鎖リードのビンを作製することができる。本方法は、各ビンにおいて、配列リードを解析することにより、本来のDNA断片の中の所与の本来のDNA断片の配列を決定するステップをさらに含むことができる。
一部の事例において、各ビンにおける配列リードをコンセンサス配列へと崩壊させ、その後、ゲノムにマッピングすることができる。代替として、配列リードをビニングに先立ちゲノムにマッピングし、その後、コンセンサス配列へと崩壊させることができる。
本方法は、配列リードを、ペア形成されたリードおよびペア形成されないリードへと選別するステップを含むこともできる。選別後に、1種または複数の遺伝子座のそれぞれにマッピングするペア形成されたリードおよびペア形成されないリードの数を定量化することができる。
本方法は、コンセンサスリードを定量化して、本願を通して記載されている稀なDNAを検出および/または定量化するステップを含むことができる。本方法は、タグ付け、増幅および/または濃縮されたDNA断片によって表されるゲノムの各位置において各塩基が生じる回数を比較することにより、稀なDNAを検出および/または定量化するステップを含むことができる。
本方法は、タグのライブラリーを使用して、単一の反応において本来のDNA断片にタグ付けするステップを含むことができる。ライブラリーは、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも5000、少なくとも10000種またはいずれかの数の本願を通して開示されているタグを含むことができる。例えば、タグのライブラリーは、少なくとも8種のタグを含むことができる。タグのライブラリーは、8種のタグを含むことができる(これは、64種の異なる可能な組合せを生成することができる)。本方法は、高パーセンテージの断片、例えば、50%超(または本願を通して記載されているいずれかのパーセンテージ)が両端にタグ付けされるように行うことができ、タグのそれぞれは、分子バーコードを含む。
M.核酸の処理および/または解析
本願を通して記載されている方法は、対象の核酸試料を処理および/または解析するために使用することができる。本方法は、複数のポリヌクレオチド分子への核酸試料のポリヌクレオチド断片を曝露して、タグ付けされたポリヌクレオチド断片を得るステップを含むことができる。使用することができる複数のポリヌクレオチド分子は、本願を通して記載されている。
例えば、複数のポリヌクレオチド分子はそれぞれ、40核酸塩基未満またはそれに等しい長さとなることができ、少なくとも4核酸塩基に関して別個のバーコード配列および少なくとも1の編集距離を有し、別個のバーコード配列のそれぞれは、複数のポリヌクレオチド分子のうちそれぞれ1種の末端から20核酸塩基以内であり、複数のポリヌクレオチド分子は、配列決定アダプタではない。
タグ付けされたポリヌクレオチド断片は、タグ付けされたポリヌクレオチド断片の増幅産物として増幅されたポリヌクレオチド断片を生じる条件下で核酸増幅反応に供することができる。増幅後に、増幅されたタグ付けされたポリヌクレオチド断片のヌクレオチド配列が決定される。一部の事例において、増幅されたタグ付けされたポリヌクレオチド断片のヌクレオチド配列は、ポリメラーゼ連鎖反応(PCR)を使用せずに決定される。
本方法は、プログラムされたコンピュータプロセッサによりヌクレオチド配列を解析して、対象のヌクレオチド試料における1種または複数の遺伝的バリアントを同定するステップを含むことができる。塩基変化(複数可)、挿入(複数可)、反復(複数可)、欠失(複数可)、コピー数バリエーション(複数可)、エピジェネティック修飾(複数可)、ヌクレオソーム結合部位(複数可)、複製起点(複数可)によるコピー数変化(複数可)およびトランスバージョン(複数可)等が挙げられるがこれらに限定されない、いかなる遺伝子変更を同定することもできる。他の遺伝子変更として、1種または複数の腫瘍関連遺伝子変更を挙げることができるがこれらに限定されない。
本方法の対象は、疾患であると疑われ得る。例えば、対象は、がんであると疑われ得る。本方法は、対象から核酸試料を収集するステップを含むことができる。核酸試料は、血液、血漿、血清、尿、唾液、粘膜排泄、痰、糞便、脳脊髄液、皮膚、毛髪、汗および/または涙から収集することができる。核酸試料は、無細胞核酸試料となり得る。一部の事例において、核酸試料は、対象の100ナノグラム(ng)以下の二本鎖ポリヌクレオチド分子から収集される。
ポリヌクレオチド断片は、二本鎖ポリヌクレオチド分子を含むことができる。一部の事例において、複数のポリヌクレオチド分子は、平滑末端ライゲーション、粘着末端ライゲーション、分子逆位プローブ、ポリメラーゼ連鎖反応(PCR)、ライゲーションに基づくPCR、マルチプレックスPCR、一本鎖ライゲーションまたは一本鎖環状化によりポリヌクレオチド断片にカップリングされる。
本明細書に記載されている方法は、核酸の高効率タグ付けをもたらす。例えば、複数のポリヌクレオチド分子への核酸試料のポリヌクレオチド断片の曝露は、少なくとも30%、例えば、少なくとも50%(例えば、60%、70%、80%、90%、95%または99%)の変換効率で、タグ付けされたポリヌクレオチド断片を生じる。少なくとも30%、35%、40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%または99%の変換効率を達成することができる。
本方法は、共通ポリヌクレオチド分子を共有するタグ付けされたポリヌクレオチド断片をもたらすことができる。例えば、タグ付けされたポリヌクレオチド断片の少なくとも5%、6%、7%、8%、9%、10%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%または100%のいずれかは、共通ポリヌクレオチド分子を共有する。本方法は、核酸試料からポリヌクレオチド断片を生成するステップを含むことができる。
一部の事例において、本方法の供するステップは、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択される複数の遺伝子に対応するプライマーの存在下で、タグ付けされたポリヌクレオチド断片を増幅するステップを含む。その上、これらの遺伝子のいずれかの組合せを増幅することができる。例えば、これらの遺伝子のうち1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53種または全54種を増幅することができる。
本明細書に記載されている方法は、複数のポリヌクレオチド分子から複数の配列リードを生成するステップを含むことができる。複数のポリヌクレオチド分子は、標的ゲノムのゲノム遺伝子座を網羅することができる。例えば、ゲノム遺伝子座は、上に収載されている複数の遺伝子に対応することができる。さらに、ゲノム遺伝子座は、これらの遺伝子のいずれかの組合せとなり得る。いずれか所与のゲノム遺伝子座は、少なくとも2個の核酸塩基を含むことができる。いずれか所与のゲノム遺伝子座は、複数の核酸塩基、例えば、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50個またはそれを超える核酸塩基を含むこともできる。
本方法は、コンピュータプロセッサにより、複数の配列リードをファミリーへと群分けするステップを含むことができる。ファミリーのそれぞれは、鋳型ポリヌクレオチドのうち1種に由来する配列リードを含むことができる。各ファミリーは、鋳型ポリヌクレオチドのうち1種のみに由来する配列リードを含むことができる。ファミリーのそれぞれに対し、配列リードを統合して、コンセンサス配列を生成することができる。群分けするステップは、(i)複数のポリヌクレオチド分子にカップリングされた別個の分子バーコードおよび(ii)複数の配列リード間の類似性を同定することにより、複数の配列リードをファミリーへと分類するステップを含むことができ、各ファミリーは、分子バーコードおよび類似または同一の配列リードの別個の組合せに関連する複数の核酸配列を含む。
統合したら、コンセンサス配列をゲノム遺伝子座の中の所与のゲノム遺伝子座においてコールすることができる。いずれか所与のゲノム遺伝子座において、次のうちいずれかを決定することができる:i)コールの中の遺伝的バリアント;ii)コールの中の遺伝子変更の頻度;iii)コールの総数;およびiv)コールの中の変更の総数。コールは、所与のゲノム遺伝子座における少なくとも1個の核酸塩基のコールを含むことができる。コールは、所与のゲノム遺伝子座における複数の核酸塩基のコールを含むことができる。一部の事例において、コールは、系統発生解析、投票(例えば、偏った投票)、秤量、ファミリーにおける遺伝子座における各リードへの確率の割り当て、または最高確率による塩基のコールを含むことができる。コンセンサス配列は、配列リードのそれぞれの定量的尺度または統計的有意性レベルを評価することにより生成することができる。定量的尺度が行われる場合、本方法は、二項分布、指数関数的分布、ベータ分布または経験的分布の使用を含むことができる。しかし、特定の位置における塩基の頻度は、コールするために使用することもでき、例えば、リードの51%またはそれ超が、この位置において「A」である場合、塩基は、該特定の位置において「A」とコールすることができる。本方法は、コンセンサス配列を標的ゲノムにマッピングするステップをさらに含むことができる。
本方法は、ゲノム遺伝子座の中の追加的なゲノム遺伝子座においてコンセンサスコールを行うステップをさらに含むことができる。本方法は、所与のゲノム遺伝子座および追加的なゲノム遺伝子座における計数に基づき、所与のゲノム遺伝子座および追加的なゲノム遺伝子座のうち1種におけるコピー数のバリエーションを決定するステップを含むことができる。
本明細書に記載されている方法は、反応容器に鋳型ポリヌクレオチド分子およびアダプタポリヌクレオチド分子のライブラリーを用意するステップを含むことができる。アダプタポリヌクレオチド分子は、2~1,000種の異なるバーコード配列を有することができ、一部の事例において、配列決定アダプタではない。アダプタポリヌクレオチド分子の他のバリエーションは、本願を通して記載されており、本方法においてこれを使用することもできる。
アダプタのポリヌクレオチド分子は、同じ試料タグを有することができる。アダプタポリヌクレオチド分子は、鋳型ポリヌクレオチド分子の両端にカップリングすることができる。本方法は、少なくとも30%、例えば、少なくとも50%(例えば、60%、70%、80%、90%、95%または99%)の効率で、アダプタポリヌクレオチド分子を鋳型ポリヌクレオチド分子にカップリングし、これにより、4~1,000,000種の異なるタグ付け組合せの中のタグ付け組合せを各鋳型ポリヌクレオチドにタグ付けして、タグ付けされたポリヌクレオチド分子を産生するステップを含むことができる。一部の事例において、反応は、単一の反応容器内で起こることができる。カップリング効率は、少なくとも30%、35%、40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%または99%となることもできる。タグ付けは、非特有タグ付けとなり得る。
次に、タグ付けされたポリヌクレオチド分子は、タグ付けされたポリヌクレオチド分子の増幅産物として増幅されたポリヌクレオチド分子を生じる条件下で、増幅反応に供することができる。鋳型ポリヌクレオチド分子は、二本鎖となり得る。さらに、鋳型ポリヌクレオチド分子は、平滑末端となり得る。一部の事例において、増幅反応は、タグ付けされたポリヌクレオチド分子を非特異的に増幅するステップを含む。増幅反応は、タグ付けされたポリヌクレオチド分子のそれぞれを増幅するためにプライミング部位を使用するステップを含むこともできる。プライミング部位は、プライマー、例えば、ユニバーサルプライマーとなり得る。プライミング部位は、ニックとなることもできる。
本方法は、増幅されたポリヌクレオチド分子を配列決定するステップを含むこともできる。配列決定するステップは、(i)増幅されたポリヌクレオチド分子の増幅産物として追加的な増幅されたポリヌクレオチド分子を生じる条件下で、増幅されたポリヌクレオチド分子を追加的な増幅反応に供するステップおよび/または(ii)追加的な増幅されたポリヌクレオチド分子を配列決定するステップを含むことができる。追加的な増幅は、フローセルに結合することができるポリヌクレオチド分子を産生するフローセル配列を含むプライマーの存在下で行うことができる。追加的な増幅は、ヘアピン形アダプタのための配列を含むプライマーの存在下で行うこともできる。ヘアピン形アダプタをポリヌクレオチド断片の両端に取り付けて、複数回配列決定することができる環状分子を生成することができる。本方法は、増幅されたポリヌクレオチド分子の配列決定の際に遺伝的バリアントを同定するステップをさらに含むことができる。
本方法は、増幅されたポリヌクレオチド分子から、1種または複数の所与の配列を含むポリヌクレオチド分子を分離して、濃縮されたポリヌクレオチド分子を産生するステップをさらに含むことができる。本方法は、フローセル配列を含むプライマーにより、濃縮されたポリヌクレオチド分子を増幅するステップを含むこともできる。フローセル配列を含むプライマーによるこの増幅は、フローセルに結合することができるポリヌクレオチド分子を産生するであろう。増幅は、ヘアピン形アダプタのための配列を含むプライマーの存在下で行うこともできる。ヘアピン形アダプタをポリヌクレオチド断片の両端に取り付けて、複数回配列決定することができる環状分子を生成することができる。
フローセル配列またはヘアピン形アダプタは、かかる配列のライゲーション等、非増幅方法により付加することができる。ハイブリダイゼーション方法等の他の技法、例えば、ヌクレオチドオーバーハングを使用することができる。
本方法は、タグ付けされたポリヌクレオチド分子をアリコートにすることなく行うことができる。例えば、タグ付けされたポリヌクレオチド分子を作製したら、増幅および配列決定は、さらに調製することなく、同じチューブ内で起こることができる。
本明細書に記載されている方法は、単一ヌクレオチドバリエーション(SNV)、コピー数バリエーション(CNV)、挿入、欠失および/または再編成の検出において有用となり得る。一部の事例において、SNV、CNV、挿入、欠失および/または再編成は、疾患、例えば、がんに関連することができる。
N.患者の状態のモニタリング
本明細書に開示されている方法を使用して、患者の疾患状態をモニタリングすることもできる。対象の疾患を経時的にモニタリングして、疾患の進行(例えば、退縮)を決定することができる。疾患を示すマーカーは、無細胞DNA試料等、対象の生物学的試料においてモニタリングすることができる。
例えば、対象のがん状態のモニタリングは、(a)1種もしくは複数のSNVの量または複数の遺伝子(例えば、エクソンにおける)のコピー数の決定、(b)異なる時点におけるかかる決定の反復、ならびに(c)(a)および(b)の間でSNVの数、SNVのレベル、ゲノム再編成の数もしくはレベルまたはコピー数に差があるかに関する決定を含むことができる。遺伝子は、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択され得る。遺伝子は、この群における遺伝子のうちいずれか5、10、15、20、30、40、50種または全種から選択することができる。
O.感度および特異性
本明細書に開示されている方法を使用して、高度な一致で、例えば、高感度および/または特異性で、試料におけるがんポリヌクレオチドおよび対象におけるがんを検出することができる。例えば、かかる方法は、少なくとも99%、99.9%、99.99%、99.999%、99.9999%または99.99999%の特異性で、5%、1%、0.5%、0.1%、0.05%または0.01%未満の濃度で、試料におけるがんポリヌクレオチド(例えば、稀なDNA)を検出することができる。かかるポリヌクレオチドは、がんまたは他の疾患を示すことができる。さらに、かかる方法は、少なくとも90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.9%、99.99%、99.999%または99.9999%の陽性的中率で、試料におけるがんポリヌクレオチドを検出することができる。
現実に陽性である、検査で陽性として同定される対象は、真陽性(TP)と称される。現実には陰性である、検査で陽性として同定される対象は、偽陽性(FP)と称される。現実に陰性である、検査で陰性として同定される対象は、真陰性(TN)と称される。現実には陽性である、検査で陰性として同定される対象は、偽陰性(FN)と称される。感度は、検査で陽性として同定される実際の陽性のパーセンテージである。これは、例えば、がん遺伝的バリアントを見出すべきおよび見出した事例を含む(感度=TP/(TP+FN))。特異性は、検査で陰性として同定される実際の陰性のパーセンテージである。これは、例えば、がん遺伝的バリアントを見出すべきでないおよび見出さなかった事例を含む。特異性は、次の方程式を使用して計算することができる:特異性=TN/(TN+FP)。陽性的中率(PPV)は、真陽性である、検査陽性の対象のパーセンテージによって測定することができる。PPVは、次の方程式を使用して計算することができる:PPV=TP/(TP+FP)。感度(例えば、検出される実際の陽性の確率)および/または特異性(例えば、実際の陰性を陽性と間違えない確率)を増加させることにより、陽性的中率を増加させることができる。
ポリヌクレオチドからアダプタタグ付けされたポリヌクレオチドへの低変換率は、稀なポリヌクレオチド標的を変換、したがって、検出する確率を減少させるため、感度を損ない得る。検査におけるノイズは、検査において検出される偽陽性の数を増加させるため、特異性を損ない得る。低変換率およびノイズの両方は、真陽性のパーセンテージを減少させ、偽陽性のパーセンテージを増加させるため、陽性的中率を損なう。
本明細書に開示されている方法は、高レベルの一致、例えば、感度および特異性を達成することができ、高い陽性的中率をもたらす。感度を増加させる方法は、試料におけるポリヌクレオチドからアダプタタグ付けされたポリヌクレオチドへの高効率変換を含む。特異性を増加させる方法は、例えば、分子追跡により配列決定エラーを低下させるステップを含む。
本開示の方法を使用して、少なくとも99%、99.9%、99.99%、99.999%、99.9999%または99.99999%の特異性で、5%、1%、0.5%、0.1%、0.05%または0.01%未満の濃度で、非特有にタグ付けされた初期出発遺伝的材料における遺伝的バリエーション(例えば、稀なDNA)を検出することができる。一部の態様において、本方法は、少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%または少なくとも90%の効率で、初期出発材料におけるポリヌクレオチドを変換するステップをさらに含むことができる。タグ付けされたポリヌクレオチドの配列リードをその後追跡して、2%、1%、0.1%または0.01%以下のエラー率で、ポリヌクレオチドのコンセンサス配列を生成することができる。
2.プール方法
被験試料における1種または複数の遺伝子座におけるコピー数バリエーションおよび/または配列バリアントを検出する方法が本明細書に開示されている。図8に一実施形態を示す。典型的には、コピー数バリエーションの検出は、被験試料のゲノムにおける目的の遺伝子座にマッピングされるポリヌクレオチドの定量的尺度(例えば、絶対または相対数)の決定と、対照試料における該遺伝子座にマッピングされるポリヌクレオチドの定量的尺度に対するこの数の比較とに関与する。ある特定の方法において、定量的尺度は、目的の遺伝子座にマッピングされる被験試料における分子の数と、参照配列、例えば、野生型の倍数性で存在することが予想される配列にマッピングされる被験試料における分子の数とを比較することにより決定される。一部の例において、参照配列は、HG19、build 37またはbuild 38である。比較は、例えば、比の決定に関与し得る。次に、この尺度は、対照試料において決定される類似の尺度と比較される。そこで、例えば、被験試料が、目的の遺伝子座対参照遺伝子座に関して1.5:1の比を有し、対照試料が、同遺伝子座に関して1:1の比を有する場合、被験試料が、目的の遺伝子座において倍数性を示すと結論することができる。
被験試料および対照試料が、別々に解析される場合、ワークフローは、対照および被験試料における最終的な数の間に歪みを導入し得る。
本明細書に開示されている一方法において(例えば、フローチャート800)、ポリヌクレオチドが、被験および対照試料から用意される(802)。被験試料におけるポリヌクレオチドおよび対照試料におけるポリヌクレオチドは、被験または対照試料に起源をもつとポリヌクレオチドを同定するタグ(供給源タグ)をタグ付けされる(804)。タグは、例えば、供給源を明確に同定するポリヌクレオチド配列またはバーコードとなり得る。
対照および被験試料のそれぞれにおけるポリヌクレオチドは、ポリヌクレオチドのあらゆる増幅後代によって保有される識別子タグをタグ付けすることもできる。ポリヌクレオチドの開始および終止配列ならびに識別子タグからの情報は、本来の親分子から増幅されたポリヌクレオチドから配列リードを同定することができる。各分子は、試料における他の分子と比較して、特有にタグ付けすることができる。あるいは、各分子は、試料における他の分子と比較して、特有にタグ付けする必要はない。すなわち、異なる識別子配列の数は、試料における分子の数よりも少なくなることができる。識別子情報を開始/停止配列情報と組み合わせることにより、同じ開始/停止配列を有する2分子を混同する確率は、有意に縮小される。
核酸(例えば、cfDNA)のタグ付けに使用される異なる識別子の数は、異なる一倍体ゲノム当量の数に依存し得る。異なる識別子を使用して、少なくとも2、少なくとも10、少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500、少なくとも600、少なくとも700、少なくとも800、少なくとも900、少なくとも1,000、少なくとも2,000、少なくとも3,000、少なくとも4,000、少なくとも5,000、少なくとも6,000、少なくとも7,000、少なくとも8,000、少なくとも9,000、少なくとも10,000種またはそれを超える異なる一倍体ゲノム当量にタグ付けすることができる。したがって、500~10,000種の異なる一倍体ゲノム当量の核酸試料、例えば、無細胞DNAのタグ付けに使用される異なる識別子の数は、1、2、3、4および5と、100、90、80、70、60、50、40または30以下のいずれかの間となり得る。例えば、500~10,000種の異なる一倍体ゲノム当量の核酸試料のタグ付けに使用される異なる識別子の数は、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100またはそれに満たなくてよい。
ポリヌクレオチドは、増幅前に、タグまたは識別子を含むアダプタのライゲーションによってタグ付けすることができる。ライゲーションは、酵素、例えば、リガーゼを使用して行うことができる。例えば、タグ付けは、DNAリガーゼを使用して行うことができる。DNAリガーゼは、T4 DNAリガーゼ、E.coli DNAリガーゼおよび/または哺乳動物リガーゼとなり得る。哺乳動物リガーゼは、DNAリガーゼI、DNAリガーゼIIIまたはDNAリガーゼIVとなり得る。リガーゼは、熱安定性リガーゼとなることもできる。タグは、ポリヌクレオチドの平滑末端にライゲーションすることができる(平滑末端ライゲーション)。あるいは、タグは、ポリヌクレオチドの粘着末端にライゲーションすることができる(粘着末端ライゲーション)。ポリヌクレオチドは、アダプタ(例えば、フォーク形末端を有するアダプタ)を使用した平滑末端ライゲーションによりタグ付けすることができる。高効率のライゲーションは、大過剰のアダプタ(例えば、1.5×超、2×超、3×超、4×超、5×超、6×超、7×超、8×超、9×超、10×超、11×超、12×超、13×超、14×超、15×超、20×超、25×超、30×超、35×超、40×超、45×超、50×超、55×超、60×超、65×超、70×超、75×超、80×超、85×超、90×超、95×超または100超)を使用して達成することができる。
ポリヌクレオチドの供給源を同定するタグをタグ付けしたら、異なる供給源(例えば、異なる試料)由来のポリヌクレオチドをプールすることができる。プール後に、異なる供給源(例えば、異なる試料)由来のポリヌクレオチドは、定量的測定のいずれかのプロセスを含む、タグを使用したいずれかの測定により識別することができる。例えば、(806)に示す通り(図8)、対照試料および被験試料由来のポリヌクレオチドをプールすることができる。プールされた分子は、配列決定(808)およびバイオインフォマティクスワークフローに供することができる。両者を、プロセスにおける同じバリエーションに供し、したがって、いかなる差次的バイアスも低下される。対照および被験試料に起源をもつ分子は、異なってタグ付けされるため、定量的測定のいずれかのプロセスにおいて識別することができる。
プールされた対照および被験試料の相対量は、変動し得る。対照試料の量は、被験試料の量と同じになることができる。対照試料の量は、被験試料の量よりも多くなることもできる。あるいは、対照試料の量は、被験試料の量よりも少なくてよい。総計に対し1試料の相対量が少ないほど、本来のタグ付けプロセスにおいて必要とされる同定タグ数は少なくなる。数値は、同じ開始/終了配列を有する2種の親分子が、同じ同定タグを有する確率を許容されるレベルまで低下させるように選択することができる。この確率は、10%未満、1%未満、0.1%未満または0.01%未満となり得る。確率は、25%、24%、23%、22%、21%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%または1%未満となり得る。
本明細書に開示されている方法は、配列リードを群分けするステップを含むこともできる。例えば、バイオインフォマティクスワークフローは、(810)に示す通り(図8)、単一の親分子の後代から産生された配列リードの群分けを含むことができる。これは、本明細書に記載されている冗長性低下方法のいずれかに関与し得る。被験および対照試料から供給された分子は、それらが保有する供給源タグに基づき区別することができる(812)。標的遺伝子座にマッピングされる分子は、被験供給および対照供給分子の両方のために定量化される(812)。これは、例えば、標的遺伝子座における数が、参照遺伝子座における数に対し正規化される、本明細書に記されている正規化方法を含むことができる。
被験および対照試料由来の標的遺伝子座における正規化された(または未加工の)分量を比較して、コピー数バリエーションの存在を決定する(814)。
3.コンピュータ制御システム
本開示は、本開示の方法を実施するようにプログラムされたコンピュータ制御システムを提供する。図6は、本開示の方法を実施するようにプログラムまたは他の仕方で構成されたコンピュータシステム1501を示す。コンピュータシステム1501は、試料調製、配列決定および/または解析の様々な態様を調節することができる。一部の例において、コンピュータシステム1501は、核酸配列決定を含む試料調製および試料解析を行うように構成されている。コンピュータシステム1501は、ユーザーの電子装置または該電子装置に対して遠隔に位置するコンピュータシステムとなり得る。電子装置は、モバイル電子装置となり得る。
コンピュータシステム1501は、シングルコアもしくはマルチコアプロセッサまたは並列処理のための複数のプロセッサとなり得る中央処理装置(CPU、本明細書において同様に、「プロセッサ」および「コンピュータプロセッサ」)1505を含む。コンピュータシステム1501は、メモリまたはメモリ場所1510(例えば、ランダムアクセスメモリ、読み取り専用メモリ、フラッシュメモリ)と、電子記憶ユニット1515(例えば、ハードディスク)と、1個または複数の他のシステムと連絡するための通信インターフェイス1520(例えば、ネットワークアダプター)と、キャッシュ、他のメモリ、データ記憶および/または電子表示アダプター等の周辺装置1525も含む。メモリ1510、記憶ユニット1515、インターフェイス1520および周辺装置1525は、マザーボード等、コミュニケーションバス(実線)を介してCPU1505と連絡している。記憶ユニット1515は、データを記憶するためのデータ記憶ユニット(またはデータリポジトリ)となり得る。コンピュータシステム1501は、通信インターフェイス1520の助けにより、コンピュータネットワーク(「ネットワーク」)1530に作動可能にカップリングすることができる。ネットワーク1530は、インターネット、インターネットおよび/またはエクストラネット、あるいはインターネットと連絡したイントラネットおよび/またはエクストラネットとなり得る。ネットワーク1530は、一部の事例において、遠隔通信および/またはデータネットワークである。ネットワーク1530は、クラウドコンピューティング等、分散コンピューティングを可能にし得る1個または複数のコンピュータサーバーを含むことができる。ネットワーク1530は、一部の事例において、コンピュータシステム1501の助けにより、コンピュータシステム1501にカップリングされた装置が、クライアントまたはサーバーとして挙動することを可能にし得る、ピアツーピアネットワークを実施することができる。
CPU1505は、プログラムまたはソフトウェアにおいて具体化され得る機械可読命令のシーケンスを実行することができる。命令は、メモリ1510等、メモリ場所において記憶され得る。命令は、CPU1505に向けることができ、これはその後、本開示の方法を実施するようにCPU1505をプログラムまたは他の仕方で構成することができる。CPU1505によって行われる演算の例として、フェッチ、デコード、実行およびライトバックを挙げることができる。
CPU1505は、集積回路等、回路の一部となり得る。システム1501の1種または複数の他の構成成分は、回路に含まれていてよい。一部の事例において、回路は、特定用途向け集積回路(ASIC)である。
記憶ユニット1515は、ドライバ、ライブラリーおよびセーブされたプログラム等、ファイルを記憶することができる。記憶ユニット1515は、ユーザーデータ、例えば、ユーザー選択およびユーザープログラムを記憶することができる。コンピュータシステム1501は、一部の事例において、イントラネットまたはインターネットを介してコンピュータシステム1501と連絡した遠隔サーバーに位置する等、コンピュータシステム1501に対し外部である、1個または複数の追加的なデータ記憶ユニットを含むことができる。
コンピュータシステム1501は、ネットワーク1530を介して1個または複数の遠隔コンピュータシステムと連絡することができる。例えば、コンピュータシステム1501は、ユーザー(例えば、オペレーター)の遠隔コンピュータシステムと連絡することができる。遠隔コンピュータシステムの例として、パーソナルコンピュータ(例えば、ポータブルPC)、スレート(slate)もしくはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(Smart phone)(例えば、Apple(登録商標)iPhone(登録商標)、Android対応装置、Blackberry(登録商標))またはパーソナルデジタルアシスタントが挙げられる。ユーザーは、ネットワーク1530を介してコンピュータシステム1501にアクセスすることができる。
本明細書に記載されている方法は、例えば、メモリ1510または電子記憶ユニット1515等のコンピュータシステム1501の電子記憶場所に記憶された機械(例えば、コンピュータプロセッサ)実行可能コードによって実施することができる。機械実行可能または機械可読コードは、ソフトウェアの形態で提供することができる。使用の際に、コードは、プロセッサ1505によって実行され得る。一部の事例において、コードは、記憶ユニット1515から検索され、プロセッサ1505による即時アクセスのためにメモリ1510に記憶され得る。一部の状況において、電子記憶ユニット1515が妨げられる場合があり、機械実行可能命令は、メモリ1510に記憶される。
コードは、コードの実行に適応されたプロセッサを有する機械による使用のために事前にコンパイルおよび構成され得る、あるいはランタイムにおいてコンパイルされ得る。コードは、事前にコンパイルされたまたはアズコンパイルされた(as-compiled)様式での
コードの実行を可能にするために選択され得るプログラミング言語で供給され得る。
コードの実行を可能にするために選択され得るプログラミング言語で供給され得る。
コンピュータシステム1501等、本明細書に提供されているシステムおよび方法の態様は、プログラミングにおいて具体化することができる。技術の様々な態様は、典型的に、ある種類の機械可読媒体において保有または具体化される機械(またはプロセッサ)実行可能コードおよび/または関連するデータの形態の「産物」または「製造品」であると考えることができる。機械実行可能コードは、メモリ(例えば、読み取り専用メモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスク等、電子記憶ユニットに記憶され得る。「記憶」型の媒体は、ソフトウェアプログラミングのいずれかの時点で非一過性記憶を提供できる、様々な半導体メモリ、テープドライブ、ディスクドライブその他等、コンピュータ、プロセッサその他の有形的メモリ、またはその関連するモジュールのいずれかまたは全てを含むことができる。ソフトウェアの全体または部分は、時に、インターネットまたは様々な他の遠隔通信ネットワークを介して連絡することができる。かかる連絡は、例えば、あるコンピュータまたはプロセッサから別のコンピュータまたはプロセッサへの、例えば、管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームへのソフトウェアのローディングを可能にし得る。よって、ソフトウェアエレメントを有することができる別の種類の媒体は、ローカル装置間の物理インターフェイスを通して使用される、有線および光固定電話回線ネットワークを介する、ならびに様々なエアリンクを通す等、光、電気および電磁波を含む。有線または無線リンク、光リンクその他等、かかる波を保有する物理的エレメントも、ソフトウェアを有する媒体として考慮することができる。本明細書において、非一過性、有形的「記憶」媒体に制限されない限り、コンピュータまたは機械「可読媒体」等の用語は、実行のためのプロセッサへの命令の提供に関与するいずれかの媒体を指す。
したがって、コンピュータ実行可能コード等、機械可読媒体は、有形的記憶媒体、搬送波媒体または物理的伝送媒体等が挙げられるがこれらに限定されない、多くの形態を採ることができる。不揮発性記憶媒体は、図面に示されている、データベース等の実施に使用できる等、いずれかのコンピュータ(複数可)その他における記憶装置のいずれか等、例えば、光または磁気ディスクを含む。揮発性記憶媒体は、かかるコンピュータプラットフォームのメインメモリ等、動的メモリを含む。有形的伝送媒体は、コンピュータシステム内のバスを含むワイヤーを含む、同軸ケーブル;銅線および光ファイバーを含む。搬送波伝送媒体は、電気もしくは電磁シグナル、またはラジオ周波数(RF)および赤外線(IR)データコミュニケーションにおいて生成されるもの等、音波もしくは光波の形態を採ることができる。したがって、コンピュータ可読媒体の一般的な形態は、例えば:フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、他のいずれかの磁気媒体、CD-ROM、DVDもしくはDVD-ROM、他のいずれかの光媒体、パンチカード紙テープ、孔のパターンによる他のいずれかの物理的記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH-EPROM、他のいずれかのメモリチップもしくはカートリッジ、データもしくは命令を輸送する搬送波、かかる搬送波を輸送するケーブルもしくはリンク、またはコンピュータが、プログラミングコードおよび/またはデータを読み取ることができる他のいずれかの媒体を含む。コンピュータ可読媒体のこれらの形態のうち多くは、実行のためのプロセッサへの1種または複数の命令の1種または複数のシーケンスの保有に関与し得る。
コンピュータシステム1501は、ユーザーインターフェイス(UI)1540を含む電子表示1535を含む、またはこれと連絡することができる。UIは、ユーザーに、本明細書に記載されている方法のための様々な条件、例えば、PCRまたは配列決定条件を設定させることができる。UIの例として、グラフィカルユーザーインターフェイス(GUI)およびウェブに基づくユーザーインターフェイスを限定することなく挙げられる。
本開示の方法およびシステムは、1種または複数のアルゴリズムによって実施することができる。アルゴリズムは、中央処理装置1505による実行により、ソフトウェアによって実施することができる。アルゴリズムは、例えば、リードを処理して、結果的に配列を生成することができる。
図7は、対象由来の核酸を含む試料を解析するための別のシステムを模式的に図解する。本システムは、シーケンサーと、バイオインフォマティクスソフトウェアと、例えば、ハンドヘルド装置またはデスクトップコンピュータによる報告解析のためのインターネット接続とを含む。
対象の標的核酸分子を解析するためのシステムであって、標的ゲノムのゲノム遺伝子座を網羅する複数のポリヌクレオチド分子の核酸配列リードを受け取る通信インターフェイスと、通信インターフェイスによって受け取られた複数のポリヌクレオチド分子の核酸配列リードを記憶するコンピュータメモリと、通信インターフェイスおよびメモリに作動可能にカップリングされ、(i)複数の配列リードを、各ファミリーが、鋳型ポリヌクレオチドのうち1種に由来する配列リードを含むファミリーへと群分けし、(ii)ファミリーのそれぞれに対し、配列リードを統合して、コンセンサス配列を生成し、(iii)ゲノム遺伝子座の中の所与のゲノム遺伝子座においてコンセンサス配列をコールし、(iv)所与のゲノム遺伝子座において、コールの中の遺伝的バリアント、コールの中の遺伝子変更の頻度、コールの総数およびコールの中の変更の総数のいずれかを検出するようにプログラムされたコンピュータプロセッサとを含み、ゲノム遺伝子座が、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択される複数の遺伝子に対応するシステムが本明細書に開示されている。本システムの各構成成分の異なるバリエーションは、方法および組成物内の開示を通して記載されている。これらの個々の構成成分およびそのバリエーションも、本システムにおいて適用できる。
4.キット
本明細書に記載されている組成物を含むキット。キットは、本明細書に記載されている方法の実施において有用となり得る。ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRK1からなる群から選択される少なくとも(least)5、6、7、8、9、10、20、30、40種または全遺
伝子に選択的にハイブリダイズする複数のオリゴヌクレオチドプローブを含むキットが本明細書に開示されている。オリゴヌクレオチドプローブが選択的にハイブリダイズできる遺伝子の数は、変動し得る。例えば、遺伝子の数は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53または54を含むことができる。キットは、複数のオリゴヌクレオチドプローブを含む容器と、本明細書に記載されている方法のいずれかを行うための説明書とを含むことができる。
伝子に選択的にハイブリダイズする複数のオリゴヌクレオチドプローブを含むキットが本明細書に開示されている。オリゴヌクレオチドプローブが選択的にハイブリダイズできる遺伝子の数は、変動し得る。例えば、遺伝子の数は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53または54を含むことができる。キットは、複数のオリゴヌクレオチドプローブを含む容器と、本明細書に記載されている方法のいずれかを行うための説明書とを含むことができる。
オリゴヌクレオチドプローブは、遺伝子、例えば、少なくとも5種の遺伝子のエクソン領域に選択的にハイブリダイズすることができる。一部の事例において、オリゴヌクレオチドプローブは、遺伝子、例えば、少なくとも5種の遺伝子の少なくとも30種のエクソンに選択的にハイブリダイズすることができる。一部の事例において、複数のプローブは、少なくとも30種のエクソンのそれぞれに選択的にハイブリダイズすることができる。各エクソンにハイブリダイズするプローブは、少なくとも1種の他のプローブと重複する配列を有することができる。一部の実施形態において、オリゴプローブは、本明細書に開示されている遺伝子の非コード領域、例えば、遺伝子のイントロン領域に選択的にハイブリダイズすることができる。オリゴプローブは、本明細書に開示されている遺伝子のエクソンおよびイントロン領域の両方を含む遺伝子の領域に選択的にハイブリダイズすることもできる。
オリゴヌクレオチドプローブによっていずれかの数のエクソンを標的とすることができる。例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、255、260、265、270、275、280、285、290、295、300、400、500、600、700、800、900、1,000種またはそれを超えるエクソンを標的とすることができる。
キットは、別個の分子バーコードおよび同一の試料バーコードを有する、少なくとも4、5、6、7または8種の異なるライブラリーアダプタを含むことができる。ライブラリーアダプタは、配列決定アダプタであるでなくてもよい。例えば、ライブラリーアダプタは、フローセル配列または配列決定のためのヘアピンループの形成を可能にする配列を含まない。分子バーコードおよび試料バーコードの異なるバリエーションおよび組合せは、本願を通して記載されており、キットに適用できる。さらに、一部の事例において、アダプタは、配列決定アダプタではない。その上、キットにより提供されるアダプタは、配列決定アダプタを含むこともできる。配列決定アダプタは、1種または複数の配列決定プライマーにハイブリダイズする配列を含むことができる。配列決定アダプタは、固体支持体にハイブリダイズする配列、例えば、フローセル配列をさらに含むことができる。例えば、配列決定アダプタは、フローセルアダプタとなり得る。配列決定アダプタは、ポリヌクレオチド断片の一端または両端に取り付けることができる。一部の事例において、キットは、別個の分子バーコードおよび同一の試料バーコードを有する、少なくとも8種の異なるライブラリーアダプタを含むことができる。ライブラリーアダプタは、配列決定アダプタであるでなくてもよい。キットは、ライブラリーアダプタに選択的にハイブリダイズする第1の配列およびフローセル配列に選択的にハイブリダイズする第2の配列を有する配列決定アダプタをさらに含むことができる。別の例において、配列決定アダプタは、ヘアピン形となり得る。例えば、ヘアピン形アダプタは、相補的二本鎖部分およびループ部分を含むことができ、二本鎖部分は、二本鎖ポリヌクレオチドに取り付ける(例えば、ライゲーションする)ことができる。ヘアピン形配列決定アダプタは、ポリヌクレオチド断片の両端に取り付けて、複数回配列決定することができる環状分子を生成することができる。配列決定アダプタは、末端から末端まで最大10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100個またはそれを超える塩基となり得る。配列決定アダプタは、末端から末端まで20~30、20~40、30~50、30~60、40~60、40~70、50~60、50~70塩基を含むことができる。特定の例において、配列決定アダプタは、末端から末端まで20~30塩基を含むことができる。別の例において、配列決定アダプタは、末端から末端まで50~60塩基を含むことができる。配列決定アダプタは、1種または複数のバーコードを含むことができる。例えば、配列決定アダプタは、試料バーコードを含むことができる。試料バーコードは、既定の配列を含むことができる。試料バーコードを使用して、ポリヌクレオチドの供給源を同定することができる。試料バーコードは、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25個またはそれを超える(または本願を通して記載されているいずれかの長さの)核酸塩基、例えば、少なくとも8塩基となり得る。バーコードは、上述の通り、近接または非近接配列となり得る。
ライブラリーアダプタは、平滑末端およびY字形となることができ、40核酸塩基未満またはそれに等しい長さとなり得る。他のバリエーションは、本願を通して見出すことができ、キットに適用できる。
(実施例1)
コピー数バリエーション検出のための方法
コピー数バリエーション検出のための方法
採血
10~30mL血液試料を室温で収集する。試料を遠心分離して、細胞を除去する。遠心分離後に血漿を収集する。
cfDNA抽出
試料をプロテイナーゼK消化に供する。イソプロパノールでDNAを沈殿させる。DNA精製カラム(例えば、QIAamp DNA Blood Mini Kit)においてDNAを捕捉し、100μl溶液中に溶出させる。Ampure SPRI磁気ビーズ捕捉(PEG/塩)により、500bpを下回るDNAを選択する。その結果得られた生産物を30μl H2Oに懸濁する。サイズ分布をチェックし(主ピーク=166ヌクレオチド;小ピーク=330ヌクレオチド)、定量化する。5ngの抽出されたDNAは、およそ1700一倍体ゲノム当量(「HGE」)を含有する。DNAの量およびHGEの間の一般的相関を次に示す:3pg DNA=1 HGE;3ng DNA=1K HGE;3μg DNA=1M HGE;10pg DNA=3 HE;10ng DNA=3K HGE;10μg DNA=3M HGE。
「単一分子」ライブラリープレップ
平滑末端修復およびオーバーロードされたヘアピンアダプタを有する8種の異なる八量体(octomer)(すなわち、64通りの組合せ)とのライゲーションにより、高効率DN
Aタグ付け(>80%)を行う。2.5ng DNA(すなわち、およそ800 HGE)を出発材料として使用する。各ヘアピンアダプタは、その非相補的部分にランダム配列を含む。各DNA断片の両端に、ヘアピンアダプタを取り付ける。各タグ付けされた断片は、ヘアピンアダプタにおけるランダム配列および断片における10p内在性配列によって同定することができる。
Aタグ付け(>80%)を行う。2.5ng DNA(すなわち、およそ800 HGE)を出発材料として使用する。各ヘアピンアダプタは、その非相補的部分にランダム配列を含む。各DNA断片の両端に、ヘアピンアダプタを取り付ける。各タグ付けされた断片は、ヘアピンアダプタにおけるランダム配列および断片における10p内在性配列によって同定することができる。
タグ付けされたDNAを10サイクルのPCRによって増幅して、出発材料における800 HGEのそれぞれのおよそ500コピーを含有する約1~7μg DNAを産生する。
バッファー最適化、ポリメラーゼ最適化およびサイクル低下を行って、PCR反応を最適化することができる。増幅バイアス、例えば、非特異的バイアス、GCバイアスおよび/またはサイズバイアスも最適化によって低下される。ノイズ(複数可)(例えば、ポリメラーゼ導入のエラー)は、高忠実度ポリメラーゼを使用することにより低下される。
ライブラリーは、VerniataまたはSequenom方法を使用して調製することができる。
配列を次の通りに濃縮することができる:目的の領域(ROI)を有するDNAは、ROIに対するプローブによるビオチン標識ビーズを使用して捕捉する。12サイクルのPCRによりROIを増幅して、2000倍増幅を生成する。次に、その結果得られたDNAを変性させ、8pMとなるよう希釈し、Illuminaシーケンサーにロードする。
大規模並列配列決定
試料の0.1~1%(およそ100pg)を配列決定のために使用する。
デジタルバイオインフォマティクス
配列リードを、各ファミリーが約10種の配列リードを有するファミリーへと群分けする。ファミリーにおける各位置の投票(例えば、偏った投票)により、ファミリーをコンセンサス配列へと崩壊させる。8または9メンバーが一致する場合、塩基をコンセンサス配列に対しコールする。メンバーの60%以下が一致する場合、塩基をコンセンサス配列に対しコールしない。
その結果得られたコンセンサス配列を参照ゲノムにマッピングする。コンセンサス配列における各塩基は、約3000種の異なるファミリーによって網羅される。配列毎の品質スコアを計算し、それらの品質スコアに基づき配列にフィルターをかける。
各遺伝子座における塩基の分布を計数することにより、配列バリエーションを検出する。リードの98%が同じ塩基を有し(ホモ接合性)、2%が異なる塩基を有する場合、遺伝子座は、おそらくがんDNA由来の配列バリアントを有する可能性がある。
遺伝子座にマッピングする配列(塩基)の総数を計数し、対照遺伝子座と比較することにより、CNVを検出する。CNV検出を増加させるために、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RB1、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSF1R、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOAまたはNTRK1遺伝子における領域を含む、特異的な領域においてCNV解析を行う。
(実施例2)
試料における未観測分子の総数を決定することにより塩基コーリングを補正するための方法
試料における未観測分子の総数を決定することにより塩基コーリングを補正するための方法
断片を増幅し、増幅された断片の配列を読み取り整列した後に、断片を塩基コーリングに供する。増幅された断片および未観測の増幅された断片の数におけるバリエーションは、塩基コーリングにエラーを導入し得る。このようなバリエーションは、未観測の増幅された断片の数を計算することにより補正される。
遺伝子座A(任意の遺伝子座)の塩基コーリングの場合、N個の増幅された断片が存在することが先ず想定される。配列リードアウトは、2種類の断片に由来し得る:二本鎖断片および一本鎖断片。次に、試料における未観測分子の総数計算の理論上の例を示す。
Nは、試料における分子の総数である。
1000が、検出された二重鎖の数であると想定する。
500が、検出された一本鎖分子の数であると想定する。
Pは、鎖を観測する確率である。
Qは、鎖を検出しない確率である。
1000が、検出された二重鎖の数であると想定する。
500が、検出された一本鎖分子の数であると想定する。
Pは、鎖を観測する確率である。
Qは、鎖を検出しない確率である。
Q=1-Pであるため、
1000=NP(2)
500=N2PQ
1000/P(2)=N
500÷2PQ=N
1000/P(2)=500÷2PQ
1000*2PQ=500P(2)
2000PQ=500P(2)
2000Q=500P
2000(1-P)=500P
2000-2000P=500P
2000=500P+2000P
2000=2500P
2000÷2500=P
0.8=P
1000/P(2)=N
1000÷0.64=N
1562=N
未観測断片の数=62。
1000=NP(2)
500=N2PQ
1000/P(2)=N
500÷2PQ=N
1000/P(2)=500÷2PQ
1000*2PQ=500P(2)
2000PQ=500P(2)
2000Q=500P
2000(1-P)=500P
2000-2000P=500P
2000=500P+2000P
2000=2500P
2000÷2500=P
0.8=P
1000/P(2)=N
1000÷0.64=N
1562=N
未観測断片の数=62。
(実施例3)
患者におけるがん関連体細胞バリアントにおける遺伝的バリアントの同定
患者におけるがん関連体細胞バリアントにおける遺伝的バリアントの同定
アッセイを使用して遺伝子のパネルを解析して、高感度でがん関連体細胞バリアントにおける遺伝的バリアントを同定する。
患者の血漿から無細胞DNAを抽出し、PCRによって増幅する。増幅された標的遺伝子の大規模並列配列決定により、遺伝的バリアントを解析する。ある1セットの遺伝子に対し、全エクソンを配列決定するが、これは、かかる配列決定被覆が、臨床的有用性を有することを示したためである(表1)。別のセットの遺伝子に対し、配列決定被覆は、以前に報告された体細胞突然変異を有するエクソンを含んだ(表2)。最小検出可能突然変異体アレル(検出限界)は、患者試料の無細胞DNA濃度に依存し、これは、末梢血1mL当たり10未満から1,000超のゲノム当量へと変動した。より少量の無細胞DNAおよび/または低レベル遺伝子コピー増幅では、増幅は、試料において検出されない場合がある。低い試料品質または不適切な収集等、ある特定の試料またはバリアント特徴は、分析感度低下をもたらした。
血液中を循環する無細胞DNAにおいて見出される遺伝的バリアントのパーセンテージは、この患者の特有の腫瘍生物学に関連する。血液中の循環無細胞DNAにおいて検出される遺伝的バリアントの量/パーセンテージに影響した要因は、腫瘍成長、ターンオーバー、サイズ、異種性、血管新生、疾患進行または処置を含む。表3は、この患者において検出される変更された循環無細胞DNAのパーセンテージまたはアレル頻度(%cfDNA)をアノテートする。検出された遺伝的バリアントの一部を%cfDNAにより降順で収載する。
遺伝的バリアントは、この患者の血液検体から単離された循環無細胞DNAにおいて検出される。これらの遺伝的バリアントは、がん関連体細胞バリアントであり、その一部は、特異的な処置に対する臨床応答の増加または低下のいずれかに関連付けられてきた。「軽微な変更」は、「大幅な変更」のアレル頻度の10%未満において検出される変更として定義される。これらの変更の検出されたアレル頻度(表3)およびこの患者のための関連する処置をアノテートする。
表1および2に収載されているあらゆる遺伝子は、Guardant360(商標)検査の一部として解析する。この患者の血液検体から単離された循環無細胞DNAにおいて、ERBB2、EGFRまたはMETの増幅は検出されない。
遺伝的バリアントを含む患者検査結果を表4に収載する。
(実施例4)
Guardant360(商標)アッセイによって解析される遺伝子の患者特異的検出限界の決定
Guardant360(商標)アッセイによって解析される遺伝子の患者特異的検出限界の決定
実施例3の方法を使用して、患者の無細胞DNAにおける遺伝子変更を検出する。これらの遺伝子の配列リードは、エクソンおよび/またはイントロン配列を含む。
検査の検出限界を表5に示す。検出限界値は、無細胞DNA濃度および遺伝子毎の配列決定被覆に依存する。
(実施例5)
ワトソンおよびクリック配列を比較した配列エラーの補正
ワトソンおよびクリック配列を比較した配列エラーの補正
患者の血漿から二本鎖無細胞DNAを単離する。特有のバーコードをそれぞれ含む16種の異なるバブル含有アダプタを使用して、無細胞DNA断片にタグ付けする。ライゲーションにより、各無細胞DNA断片の両端にバブル含有アダプタを取り付ける。ライゲーション後に、無細胞DNA断片のそれぞれは、別個のバーコードの配列および無細胞DNA断片の各末端における2個の20bp内在性配列により別個に同定することができる。
タグ付けされた無細胞DNA断片をPCRにより増幅する。がん関連遺伝子の群に特異的に結合するオリゴヌクレオチドプローブを含むビーズを使用して、増幅された断片を濃縮する。したがって、がん関連遺伝子の群由来の無細胞DNA断片が、選択的に濃縮される。
配列決定プライマー結合部位、試料バーコードおよびフローセル(cell-flow)配列をそれぞれ含む配列決定アダプタを、濃縮されたDNA分子に取り付ける。その結果得られた分子をPCRによって増幅する。
増幅された断片の両方の鎖を配列決定する。各バブル含有アダプタは、非相補的部分(例えば、バブル)を含むため、バブル含有アダプタの一方の鎖の配列は、他方の鎖(相補体)の配列とは異なる。したがって、本来の無細胞DNAのワトソン鎖に由来するアンプリコンの配列リードは、取り付けられたバブル含有アダプタ配列によって、本来の無細胞DNAのクリック鎖由来のアンプリコンから識別することができる。
本来の無細胞DNA断片の鎖由来の配列リードを、本来の無細胞DNA断片の他方の鎖由来の配列リードと比較する。バリアントが、本来の無細胞DNA断片の一方の鎖由来の配列リードのみに生じるが、他方の鎖には生じない場合、このバリアントは、真の遺伝的バリアントではなくエラー(例えば、PCRおよび/または増幅に起因する)として同定されるであろう。
配列リードをファミリーへと群分けする。配列リードにおけるエラーを補正する。各ファミリーのコンセンサス配列を崩壊により生成する。
本発明の好まれる実施形態を本明細書に示し、記載してきたが、かかる実施形態が単なる一例として提示されていることは、当業者には明らかであろう。本発明が、本明細書内に提示されている具体例によって限定されることは意図されていない。上述の明細書を参照しつつ本発明を記載してきたが、本明細書における実施形態の記載および図解は、限定的な意味で解釈されることを意味しない。そこで、当業者であれば、本発明から逸脱することなく、多数のバリエーション、変化および置換を思い付くことができよう。さらに、本発明のあらゆる態様が、種々の条件および変数に依存する本明細書に表記されている特異的な描写、構成または相対的比率に限定されないことが理解できよう。本明細書に記載されている本発明の実施形態の様々な代替を本発明の実施において用いてよいことを理解されたい。したがって、本発明が、いかなるかかる代替、修正、バリエーションまたは均等も網羅することが企図される。次の特許請求の範囲が、本発明の範囲を定義すること、また、特許請求の範囲およびその均等の範囲内の方法および構造が、これにより網羅されることが意図される。
Claims (1)
- 明細書に記載の装置。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361921456P | 2013-12-28 | 2013-12-28 | |
US61/921,456 | 2013-12-28 | ||
US201461948509P | 2014-03-05 | 2014-03-05 | |
US61/948,509 | 2014-03-05 | ||
JP2020103559A JP7242609B2 (ja) | 2013-12-28 | 2020-06-16 | 遺伝的バリアントを検出するための方法およびシステム |
JP2021200633A JP2022031905A (ja) | 2013-12-28 | 2021-12-10 | 遺伝的バリアントを検出するための方法およびシステム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021200633A Division JP2022031905A (ja) | 2013-12-28 | 2021-12-10 | 遺伝的バリアントを検出するための方法およびシステム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024010242A true JP2024010242A (ja) | 2024-01-23 |
Family
ID=53479708
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016543068A Active JP6571665B2 (ja) | 2013-12-28 | 2014-12-24 | 遺伝的バリアントを検出するための方法およびシステム |
JP2019066989A Active JP6921888B2 (ja) | 2013-12-28 | 2019-03-29 | 遺伝的バリアントを検出するための方法およびシステム |
JP2020103559A Active JP7242609B2 (ja) | 2013-12-28 | 2020-06-16 | 遺伝的バリアントを検出するための方法およびシステム |
JP2021200633A Withdrawn JP2022031905A (ja) | 2013-12-28 | 2021-12-10 | 遺伝的バリアントを検出するための方法およびシステム |
JP2023192893A Pending JP2024010242A (ja) | 2013-12-28 | 2023-11-13 | 遺伝的バリアントを検出するための方法およびシステム |
Family Applications Before (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016543068A Active JP6571665B2 (ja) | 2013-12-28 | 2014-12-24 | 遺伝的バリアントを検出するための方法およびシステム |
JP2019066989A Active JP6921888B2 (ja) | 2013-12-28 | 2019-03-29 | 遺伝的バリアントを検出するための方法およびシステム |
JP2020103559A Active JP7242609B2 (ja) | 2013-12-28 | 2020-06-16 | 遺伝的バリアントを検出するための方法およびシステム |
JP2021200633A Withdrawn JP2022031905A (ja) | 2013-12-28 | 2021-12-10 | 遺伝的バリアントを検出するための方法およびシステム |
Country Status (9)
Country | Link |
---|---|
US (17) | US9920366B2 (ja) |
EP (4) | EP3771745A1 (ja) |
JP (5) | JP6571665B2 (ja) |
CN (2) | CN106062214B (ja) |
AU (3) | AU2014369841B2 (ja) |
CA (1) | CA2934822A1 (ja) |
ES (3) | ES2822125T3 (ja) |
SG (2) | SG10201804519RA (ja) |
WO (1) | WO2015100427A1 (ja) |
Families Citing this family (139)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9424392B2 (en) | 2005-11-26 | 2016-08-23 | Natera, Inc. | System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals |
US10083273B2 (en) | 2005-07-29 | 2018-09-25 | Natera, Inc. | System and method for cleaning noisy genetic data and determining chromosome copy number |
US10081839B2 (en) | 2005-07-29 | 2018-09-25 | Natera, Inc | System and method for cleaning noisy genetic data and determining chromosome copy number |
US11111543B2 (en) | 2005-07-29 | 2021-09-07 | Natera, Inc. | System and method for cleaning noisy genetic data and determining chromosome copy number |
US11111544B2 (en) | 2005-07-29 | 2021-09-07 | Natera, Inc. | System and method for cleaning noisy genetic data and determining chromosome copy number |
EP2854056A3 (en) | 2009-09-30 | 2015-06-03 | Natera, Inc. | Methods for non-invasive pre-natal ploidy calling |
US11339429B2 (en) | 2010-05-18 | 2022-05-24 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
US10316362B2 (en) | 2010-05-18 | 2019-06-11 | Natera, Inc. | Methods for simultaneous amplification of target loci |
US10179937B2 (en) | 2014-04-21 | 2019-01-15 | Natera, Inc. | Detecting mutations and ploidy in chromosomal segments |
EP2854058A3 (en) | 2010-05-18 | 2015-10-28 | Natera, Inc. | Methods for non-invasive pre-natal ploidy calling |
US11939634B2 (en) | 2010-05-18 | 2024-03-26 | Natera, Inc. | Methods for simultaneous amplification of target loci |
US11322224B2 (en) | 2010-05-18 | 2022-05-03 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
US11326208B2 (en) | 2010-05-18 | 2022-05-10 | Natera, Inc. | Methods for nested PCR amplification of cell-free DNA |
US11408031B2 (en) | 2010-05-18 | 2022-08-09 | Natera, Inc. | Methods for non-invasive prenatal paternity testing |
US11332793B2 (en) | 2010-05-18 | 2022-05-17 | Natera, Inc. | Methods for simultaneous amplification of target loci |
US9677118B2 (en) | 2014-04-21 | 2017-06-13 | Natera, Inc. | Methods for simultaneous amplification of target loci |
US11332785B2 (en) | 2010-05-18 | 2022-05-17 | Natera, Inc. | Methods for non-invasive prenatal ploidy calling |
US20190010543A1 (en) | 2010-05-18 | 2019-01-10 | Natera, Inc. | Methods for simultaneous amplification of target loci |
ES2770342T3 (es) | 2010-12-22 | 2020-07-01 | Natera Inc | Procedimientos para pruebas prenatales no invasivas de paternidad |
KR20140024270A (ko) | 2010-12-30 | 2014-02-28 | 파운데이션 메디신 인코포레이티드 | 종양 샘플의 다유전자 분석의 최적화 |
CN103608818B (zh) | 2011-02-09 | 2017-12-08 | 纳特拉公司 | 非侵入性产前倍性识别装置 |
US9260753B2 (en) | 2011-03-24 | 2016-02-16 | President And Fellows Of Harvard College | Single cell nucleic acid detection and analysis |
EP2697397B1 (en) | 2011-04-15 | 2017-04-05 | The Johns Hopkins University | Safe sequencing system |
SI3363901T1 (sl) | 2012-02-17 | 2021-04-30 | Fred Hutchinson Cancer Research Center | Sestavki in postopki za natančno identifikacijo mutacij |
PT2828218T (pt) | 2012-03-20 | 2020-11-11 | Univ Washington Through Its Center For Commercialization | Métodos para baixar a taxa de erro da sequenciação paralela massiva de adn utilizando sequenciação duplex de consensus |
US20150011396A1 (en) | 2012-07-09 | 2015-01-08 | Benjamin G. Schroeder | Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing |
DE202013012824U1 (de) | 2012-09-04 | 2020-03-10 | Guardant Health, Inc. | Systeme zum Erfassen von seltenen Mutationen und einer Kopienzahlvariation |
US20160040229A1 (en) | 2013-08-16 | 2016-02-11 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
US10876152B2 (en) | 2012-09-04 | 2020-12-29 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
US11913065B2 (en) | 2012-09-04 | 2024-02-27 | Guardent Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
AU2013338393B2 (en) | 2012-10-29 | 2017-05-11 | The Johns Hopkins University | Papanicolaou test for ovarian and endometrial cancers |
US9679104B2 (en) | 2013-01-17 | 2017-06-13 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
US10847251B2 (en) | 2013-01-17 | 2020-11-24 | Illumina, Inc. | Genomic infrastructure for on-site or cloud-based DNA and RNA processing and analysis |
US10068054B2 (en) | 2013-01-17 | 2018-09-04 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
US10691775B2 (en) | 2013-01-17 | 2020-06-23 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
WO2014113736A1 (en) | 2013-01-17 | 2014-07-24 | Edico Genome Corp. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
US9792405B2 (en) | 2013-01-17 | 2017-10-17 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods executed on an integrated circuit processing platform |
US10577655B2 (en) | 2013-09-27 | 2020-03-03 | Natera, Inc. | Cell free DNA diagnostic testing standards |
US10262755B2 (en) | 2014-04-21 | 2019-04-16 | Natera, Inc. | Detecting cancer mutations and aneuploidy in chromosomal segments |
US11286519B2 (en) | 2013-12-11 | 2022-03-29 | Accuragen Holdings Limited | Methods and compositions for enrichment of amplification products |
WO2015089333A1 (en) | 2013-12-11 | 2015-06-18 | Accuragen, Inc. | Compositions and methods for detecting rare sequence variants |
US11859246B2 (en) | 2013-12-11 | 2024-01-02 | Accuragen Holdings Limited | Methods and compositions for enrichment of amplification products |
ES2822125T3 (es) | 2013-12-28 | 2021-04-29 | Guardant Health Inc | Métodos y sistemas para detectar variantes genéticas |
US11085084B2 (en) | 2014-09-12 | 2021-08-10 | The Board Of Trustees Of The Leland Stanford Junior University | Identification and use of circulating nucleic acids |
WO2016078095A1 (zh) * | 2014-11-21 | 2016-05-26 | 深圳华大基因科技有限公司 | 鼓泡状接头元件和使用其构建测序文库的方法 |
US11959141B2 (en) | 2014-12-05 | 2024-04-16 | Foundation Medicine, Inc. | Multigene analysis of tumor samples |
WO2016154154A2 (en) | 2015-03-23 | 2016-09-29 | Edico Genome Corporation | Method and system for genomic visualization |
US10844428B2 (en) * | 2015-04-28 | 2020-11-24 | Illumina, Inc. | Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS) |
JP6995625B2 (ja) | 2015-05-01 | 2022-01-14 | ガーダント ヘルス, インコーポレイテッド | 診断方法 |
WO2016183106A1 (en) | 2015-05-11 | 2016-11-17 | Natera, Inc. | Methods and compositions for determining ploidy |
JP6698708B2 (ja) | 2015-06-09 | 2020-05-27 | ライフ テクノロジーズ コーポレーション | 分子タグ付けのための方法、システム、組成物、キット、装置、及びコンピュータ可読媒体 |
AU2016281718B2 (en) | 2015-06-24 | 2022-03-31 | Dana-Farber Cancer Institute, Inc. | Selective degradation of wild-type DNA and enrichment of mutant alleles using nuclease |
ES2844852T3 (es) * | 2015-07-21 | 2021-07-22 | Guardant Health Inc | Acidos nucleicos bloqueados para capturar genes de fusión |
US11286531B2 (en) | 2015-08-11 | 2022-03-29 | The Johns Hopkins University | Assaying ovarian cyst fluid |
JP7189401B2 (ja) * | 2015-08-12 | 2022-12-14 | サークロジーン・セラノスティクス・インコーポレイテッド | インサイチュ増幅により無細胞核酸分子を調製する方法 |
MX2018003678A (es) * | 2015-09-25 | 2018-08-01 | Contextual Genomics Inc | Metodos moleculares de aseguramiento de la calidad para su uso en la secuenciacion. |
CN114807323A (zh) | 2015-10-09 | 2022-07-29 | 安可济控股有限公司 | 用于富集扩增产物的方法及组合物 |
RU2018121254A (ru) | 2015-11-11 | 2019-12-16 | Резолюшн Байосайенс, Инк. | Высокоэффективное построение библиотек днк |
EP4043584A1 (en) * | 2015-12-08 | 2022-08-17 | Twinstrand Biosciences, Inc. | Improved adapters, methods, and compositions for duplex sequencing |
CN117174167A (zh) * | 2015-12-17 | 2023-12-05 | 夸登特健康公司 | 通过分析无细胞dna确定肿瘤基因拷贝数的方法 |
US20170270245A1 (en) | 2016-01-11 | 2017-09-21 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods for performing secondary and/or tertiary processing |
US10068183B1 (en) | 2017-02-23 | 2018-09-04 | Edico Genome, Corp. | Bioinformatics systems, apparatuses, and methods executed on a quantum processing platform |
CN108474026A (zh) * | 2016-01-29 | 2018-08-31 | 豪夫迈·罗氏有限公司 | 用于核酸测序的新的衔接子和使用方法 |
WO2017161175A1 (en) * | 2016-03-16 | 2017-09-21 | Dana-Farber Cancer Institute, Inc. | Methods for genome characterization |
US11384382B2 (en) | 2016-04-14 | 2022-07-12 | Guardant Health, Inc. | Methods of attaching adapters to sample nucleic acids |
US20190085406A1 (en) * | 2016-04-14 | 2019-03-21 | Guardant Health, Inc. | Methods for early detection of cancer |
CN109511265B (zh) | 2016-05-16 | 2023-07-14 | 安可济控股有限公司 | 通过链鉴定改进测序的方法 |
JP7046007B2 (ja) | 2016-05-26 | 2022-04-01 | ベクトン・ディキンソン・アンド・カンパニー | 分子標識カウントの調節方法 |
WO2018009723A1 (en) | 2016-07-06 | 2018-01-11 | Guardant Health, Inc. | Methods for fragmentome profiling of cell-free nucleic acids |
EP4180539A1 (en) * | 2016-07-12 | 2023-05-17 | Qiagen Sciences, LLC | Single end duplex dna sequencing |
EP3497218B1 (en) * | 2016-08-08 | 2022-03-16 | Karius, Inc. | Reduction of signal from contaminant nucleic acids |
CN117604082A (zh) | 2016-08-10 | 2024-02-27 | 格瑞尔有限责任公司 | 分析核酸片段的方法 |
CA3033749A1 (en) | 2016-08-15 | 2018-02-22 | Accuragen Holdings Limited | Compositions and methods for detecting rare sequence variants |
CN117286217A (zh) | 2016-08-25 | 2023-12-26 | 分析生物科学有限公司 | 用于检测dna样品中基因组拷贝变化的方法 |
US9850523B1 (en) | 2016-09-30 | 2017-12-26 | Guardant Health, Inc. | Methods for multi-resolution analysis of cell-free nucleic acids |
AU2017336153B2 (en) * | 2016-09-30 | 2023-07-13 | Guardant Health, Inc. | Methods for multi-resolution analysis of cell-free nucleic acids |
WO2018067517A1 (en) | 2016-10-04 | 2018-04-12 | Natera, Inc. | Methods for characterizing copy number variation using proximity-litigation sequencing |
CA3041645C (en) | 2016-10-24 | 2021-11-02 | Geneinfosec, Inc. | Concealing information present within nucleic acids |
JP7232180B2 (ja) | 2016-11-08 | 2023-03-02 | ベクトン・ディキンソン・アンド・カンパニー | 発現プロファイル分類の方法 |
CN117056774A (zh) | 2016-11-08 | 2023-11-14 | 贝克顿迪金森公司 | 用于细胞标记分类的方法 |
EP3541951A4 (en) | 2016-11-15 | 2020-06-03 | Personal Genome Diagnostics Inc. | NON-UNIQUE BARCODES IN A GENOTYPING TEST |
US10011870B2 (en) * | 2016-12-07 | 2018-07-03 | Natera, Inc. | Compositions and methods for identifying nucleic acid molecules |
CN110383385B (zh) * | 2016-12-08 | 2023-07-25 | 生命科技股份有限公司 | 从肿瘤样品中检测突变负荷的方法 |
EP3551756A4 (en) * | 2016-12-12 | 2020-07-15 | Dana Farber Cancer Institute, Inc. | COMPOSITIONS AND METHODS FOR MOLECULAR BARCODING OF DNA MOLECULES BEFORE MUTATION ENRICHMENT AND / OR MUTATION DETECTION |
CN106544341A (zh) * | 2017-01-17 | 2017-03-29 | 上海亿康医学检验所有限公司 | 高效检测样本中的ctDNA的方法 |
CA3050247A1 (en) | 2017-01-18 | 2018-07-26 | Illumina, Inc. | Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths |
US10894976B2 (en) | 2017-02-21 | 2021-01-19 | Natera, Inc. | Compositions, methods, and kits for isolating nucleic acids |
EP3601598B1 (en) * | 2017-03-23 | 2022-08-03 | University of Washington | Methods for targeted nucleic acid sequence enrichment with applications to error corrected nucleic acid sequencing |
US11584958B2 (en) | 2017-03-31 | 2023-02-21 | Grail, Llc | Library preparation and use thereof for sequencing based error correction and/or variant identification |
EP3625713A1 (en) * | 2017-05-19 | 2020-03-25 | Guardant Health, Inc. | Methods and systems for detecting insertions and deletions |
GB2578038B (en) | 2017-06-16 | 2022-11-23 | Life Technologies Corp | Control nucleic acids, and compositions, kits, and uses thereof |
US11505826B2 (en) | 2017-07-12 | 2022-11-22 | Agilent Technologies, Inc. | Sequencing method for genomic rearrangement detection |
EP3432176A1 (en) * | 2017-07-20 | 2019-01-23 | Siemens Healthcare GmbH | Scansoft: a method for the detection of genomic deletions and duplications in massive parallel sequencing data |
WO2019023243A1 (en) | 2017-07-24 | 2019-01-31 | Dana-Farber Cancer Institute, Inc. | METHODS AND COMPOSITIONS FOR SELECTING AND AMPLIFYING DNA TARGETS IN A SINGLE REACTION MIXTURE |
CN107858426B (zh) * | 2017-08-22 | 2021-04-09 | 上海派森诺生物科技股份有限公司 | 一种用于肿瘤个体化用药16个基因热点检测的杂交捕获试剂盒及其方法 |
US11447818B2 (en) | 2017-09-15 | 2022-09-20 | Illumina, Inc. | Universal short adapters with variable length non-random unique molecular identifiers |
CA3075932A1 (en) * | 2017-09-20 | 2019-03-28 | Guardant Health, Inc. | Methods and systems for differentiating somatic and germline variants |
CN111247589A (zh) * | 2017-09-25 | 2020-06-05 | 贝克顿迪金森公司 | 免疫受体条形码错误校正 |
AU2018366213A1 (en) | 2017-11-08 | 2020-05-14 | Twinstrand Biosciences, Inc. | Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters |
JP7054133B2 (ja) | 2017-11-09 | 2022-04-13 | 国立研究開発法人国立がん研究センター | 配列解析方法、配列解析装置、参照配列の生成方法、参照配列生成装置、プログラム、および記録媒体 |
CN108154007B (zh) * | 2017-11-28 | 2021-06-29 | 西安电子科技大学 | 一种基于单肿瘤样本拷贝数变异及缺失类型检测方法 |
JP7013490B2 (ja) * | 2017-11-30 | 2022-02-15 | イルミナ インコーポレイテッド | 配列バリアントコールのためのバリデーションの方法及びシステム |
CN108319813B (zh) * | 2017-11-30 | 2020-12-25 | 无锡臻和生物科技有限公司 | 循环肿瘤dna拷贝数变异的检测方法和装置 |
EP4273267A3 (en) | 2017-12-01 | 2023-12-27 | Life Technologies Corporation | Methods, systems, and computer-readable media for detection of internal tandem duplication in the flt3 gene |
JPWO2019132010A1 (ja) * | 2017-12-28 | 2021-01-21 | タカラバイオ株式会社 | 塩基配列における塩基種を推定する方法、装置及びプログラム |
WO2019183640A1 (en) | 2018-03-23 | 2019-09-26 | Board Of Regents, The University Of Texas System | Efficient sequencing of dsdna with extremely low level of errors |
US11203782B2 (en) | 2018-03-29 | 2021-12-21 | Accuragen Holdings Limited | Compositions and methods comprising asymmetric barcoding |
AU2019252947A1 (en) * | 2018-04-13 | 2020-10-29 | Guardant Health, Inc. | Methods for detecting and suppressing alignment errors caused by fusion events |
US10329627B1 (en) * | 2018-04-23 | 2019-06-25 | Inivata Ltd. | Method for predicting and monitoring response to an immune checkpoint inhibitor |
US20210040564A1 (en) * | 2018-04-23 | 2021-02-11 | Inivata Ltd. | Method for predicting and monitoring response to an immune checkpoint inhibitor |
EP3802878A1 (en) | 2018-06-04 | 2021-04-14 | Guardant Health, Inc. | Methods and systems for determining the cellular origin of cell-free nucleic acids |
US11525159B2 (en) | 2018-07-03 | 2022-12-13 | Natera, Inc. | Methods for detection of donor-derived cell-free DNA |
KR20210059694A (ko) * | 2018-07-12 | 2021-05-25 | 트윈스트랜드 바이오사이언시스, 인코포레이티드 | 게놈 편집, 클론 팽창 및 연관된 분야를 규명하기 위한 방법 및 시약 |
WO2020031048A1 (en) | 2018-08-08 | 2020-02-13 | Inivata Ltd. | Method of sequencing using variable replicate multiplex pcr |
WO2020058389A1 (en) * | 2018-09-21 | 2020-03-26 | F. Hoffmann-La Roche Ag | System and method for modular and combinatorial nucleic acid sample preparation for sequencing |
CN113286881A (zh) | 2018-09-27 | 2021-08-20 | 格里尔公司 | 甲基化标记和标靶甲基化探针板 |
US11608524B1 (en) * | 2018-10-25 | 2023-03-21 | Wisconsin Alumni Research Foundation | Methods of analyzing cells |
CA3116176A1 (en) * | 2018-10-31 | 2020-05-07 | Guardant Health, Inc. | Methods, compositions and systems for calibrating epigenetic partitioning assays |
KR20200054430A (ko) * | 2018-11-09 | 2020-05-20 | 주식회사 셀레믹스 | 폐암 조직 내 세포 유래 돌연변이를 검출하기 위한 프로브 제조 및 검출 방법 |
CN113454218A (zh) | 2018-12-20 | 2021-09-28 | 夸登特健康公司 | 用于改进核酸分子的回收的方法、组合物和系统 |
CN109767812A (zh) * | 2018-12-25 | 2019-05-17 | 江苏医联生物科技有限公司 | 用于检测肿瘤外周血样本变异序列的方法 |
EP3918089A1 (en) | 2019-01-31 | 2021-12-08 | Guardant Health, Inc. | Compositions and methods for isolating cell-free dna |
WO2020243678A1 (en) * | 2019-05-31 | 2020-12-03 | North Carolina State University | Compositions and methods related to quantitative reduced representation sequencing |
US11939636B2 (en) | 2019-05-31 | 2024-03-26 | Guardant Health, Inc. | Methods and systems for improving patient monitoring after surgery |
WO2021022237A1 (en) * | 2019-08-01 | 2021-02-04 | Twinstrand Biosciences, Inc. | Methods and reagents for nucleic acid sequencing and associated applications |
GB2595193B (en) | 2019-11-06 | 2022-10-12 | Univ Leland Stanford Junior | Methods and systems for analyzing nucleic acid molecules |
KR102273152B1 (ko) * | 2019-11-11 | 2021-07-05 | 사회복지법인 삼성생명공익재단 | 유전자 변이 검출수단의 검출능력 평가용 조성물의 제조방법 |
US20210238668A1 (en) * | 2020-01-08 | 2021-08-05 | The Chinese University Of Hong Kong | Biterminal dna fragment types in cell-free samples and uses thereof |
US11211144B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Methods and systems for refining copy number variation in a liquid biopsy assay |
US11211147B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing |
US11475981B2 (en) | 2020-02-18 | 2022-10-18 | Tempus Labs, Inc. | Methods and systems for dynamic variant thresholding in a liquid biopsy assay |
WO2022073011A1 (en) | 2020-09-30 | 2022-04-07 | Guardant Health, Inc. | Methods and systems to improve the signal to noise ratio of dna methylation partitioning assays |
CN112592976B (zh) * | 2020-12-30 | 2021-09-21 | 深圳市海普洛斯生物科技有限公司 | 一种检测met基因扩增的方法及装置 |
US11783912B2 (en) | 2021-05-05 | 2023-10-10 | The Board Of Trustees Of The Leland Stanford Junior University | Methods and systems for analyzing nucleic acid molecules |
WO2023018944A1 (en) * | 2021-08-12 | 2023-02-16 | The Johns Hopkins University | Methods for simultaneous mutation detection and methylation analysis |
WO2023023402A2 (en) | 2021-08-20 | 2023-02-23 | Guardant Health, Inc. | Methods for simultaneous molecular and sample barcoding |
WO2023150633A2 (en) | 2022-02-02 | 2023-08-10 | Guardant Health, Inc. | Multifunctional primers for paired sequencing reads |
CN114724628B (zh) * | 2022-04-24 | 2022-11-08 | 华中农业大学 | 一种对多物种进行多核苷酸变异鉴定和注释的方法 |
WO2024006908A1 (en) | 2022-06-30 | 2024-01-04 | Guardant Health, Inc. | Enrichment of aberrantly methylated dna |
Family Cites Families (274)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4725536A (en) | 1985-09-19 | 1988-02-16 | Genetics Institute, Inc. | Reagent polynucleotide complex with multiple target binding regions, and kit and methods |
US6150517A (en) | 1986-11-24 | 2000-11-21 | Gen-Probe | Methods for making oligonucleotide probes for the detection and/or quantitation of non-viral organisms |
US5149625A (en) | 1987-08-11 | 1992-09-22 | President And Fellows Of Harvard College | Multiplex analysis of DNA |
US4942124A (en) | 1987-08-11 | 1990-07-17 | President And Fellows Of Harvard College | Multiplex sequencing |
US5656731A (en) | 1987-10-15 | 1997-08-12 | Chiron Corporation | Nucleic acid-amplified immunoassay probes |
US5124246A (en) | 1987-10-15 | 1992-06-23 | Chiron Corporation | Nucleic acid multimers and amplified nucleic acid hybridization assays using same |
US5871928A (en) | 1989-06-07 | 1999-02-16 | Fodor; Stephen P. A. | Methods for nucleic acid analysis |
US5143854A (en) | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
US6309822B1 (en) | 1989-06-07 | 2001-10-30 | Affymetrix, Inc. | Method for comparing copy number of nucleic acid sequences |
US5744101A (en) | 1989-06-07 | 1998-04-28 | Affymax Technologies N.V. | Photolabile nucleoside protecting groups |
US5925525A (en) | 1989-06-07 | 1999-07-20 | Affymetrix, Inc. | Method of identifying nucleotide differences |
US6040138A (en) | 1995-09-15 | 2000-03-21 | Affymetrix, Inc. | Expression monitoring by hybridization to high density oligonucleotide arrays |
US5800992A (en) | 1989-06-07 | 1998-09-01 | Fodor; Stephen P.A. | Method of detecting nucleic acids |
US6551784B2 (en) | 1989-06-07 | 2003-04-22 | Affymetrix Inc | Method of comparing nucleic acid sequences |
US5424186A (en) | 1989-06-07 | 1995-06-13 | Affymax Technologies N.V. | Very large scale immobilized polymer synthesis |
US5200314A (en) | 1990-03-23 | 1993-04-06 | Chiron Corporation | Polynucleotide capture assay employing in vitro amplification |
US6582908B2 (en) | 1990-12-06 | 2003-06-24 | Affymetrix, Inc. | Oligonucleotides |
DK0834575T3 (da) | 1990-12-06 | 2002-04-02 | Affymetrix Inc A Delaware Corp | Identifikation af nucleinsyrer i prøver |
US5981179A (en) | 1991-11-14 | 1999-11-09 | Digene Diagnostics, Inc. | Continuous amplification reaction |
US5424413A (en) | 1992-01-22 | 1995-06-13 | Gen-Probe Incorporated | Branched nucleic acid probes |
US5573905A (en) | 1992-03-30 | 1996-11-12 | The Scripps Research Institute | Encoded combinatorial chemical libraries |
US6020124A (en) | 1992-04-27 | 2000-02-01 | Trustees Of Dartmouth College | Detection of soluble gene sequences in biological fluids |
US5981176A (en) | 1992-06-17 | 1999-11-09 | City Of Hope | Method of detecting and discriminating between nucleic acid sequences |
DE69431719T2 (de) | 1993-06-25 | 2003-09-18 | Affymetrix Inc N D Ges D Staat | Hybridisierung und sequenzierung von nukleinsäuren |
US5500356A (en) | 1993-08-10 | 1996-03-19 | Life Technologies, Inc. | Method of nucleic acid sequence selection |
US6309823B1 (en) | 1993-10-26 | 2001-10-30 | Affymetrix, Inc. | Arrays of nucleic acid probes for analyzing biotransformation genes and methods of using the same |
US5681697A (en) | 1993-12-08 | 1997-10-28 | Chiron Corporation | Solution phase nucleic acid sandwich assays having reduced background noise and kits therefor |
CH686982A5 (fr) | 1993-12-16 | 1996-08-15 | Maurice Stroun | Méthode pour le diagnostic de cancers. |
US20030017081A1 (en) | 1994-02-10 | 2003-01-23 | Affymetrix, Inc. | Method and apparatus for imaging a sample on a device |
US5714330A (en) | 1994-04-04 | 1998-02-03 | Lynx Therapeutics, Inc. | DNA sequencing by stepwise ligation and cleavage |
US6013445A (en) | 1996-06-06 | 2000-01-11 | Lynx Therapeutics, Inc. | Massively parallel signature sequencing by ligation of encoded adaptors |
US5604097A (en) | 1994-10-13 | 1997-02-18 | Spectragen, Inc. | Methods for sorting polynucleotides using oligonucleotide tags |
US6406848B1 (en) | 1997-05-23 | 2002-06-18 | Lynx Therapeutics, Inc. | Planar arrays of microparticle-bound polynucleotides |
US5695934A (en) | 1994-10-13 | 1997-12-09 | Lynx Therapeutics, Inc. | Massively parallel sequencing of sorted polynucleotides |
US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
US6600996B2 (en) | 1994-10-21 | 2003-07-29 | Affymetrix, Inc. | Computer-aided techniques for analyzing biological sequences |
ATE340866T1 (de) | 1994-10-28 | 2006-10-15 | Gen Probe Inc | Zusammensetzungen und verfahren für die gleichzeitige detektion und quantifizierung von einer mehrheit spezifischer nuklein säure sequenzen |
US5648245A (en) | 1995-05-09 | 1997-07-15 | Carnegie Institution Of Washington | Method for constructing an oligonucleotide concatamer library by rolling circle replication |
US5968740A (en) | 1995-07-24 | 1999-10-19 | Affymetrix, Inc. | Method of Identifying a Base in a Nucleic Acid |
GB9516636D0 (en) | 1995-08-14 | 1995-10-18 | Univ London | In-situ nucleic acid amplification and detection |
US5763175A (en) | 1995-11-17 | 1998-06-09 | Lynx Therapeutics, Inc. | Simultaneous sequencing of tagged polynucleotides |
US5854033A (en) | 1995-11-21 | 1998-12-29 | Yale University | Rolling circle replication reporter systems |
WO1997034015A1 (en) | 1996-03-15 | 1997-09-18 | The Penn State Research Foundation | Detection of extracellular tumor-associated nucleic acid in blood plasma or serum using nucleic acid amplification assays |
PT938320E (pt) | 1996-03-26 | 2010-09-22 | Michael S Kopreski | Método que permite a utilização de arn extracelular extraído de plasma ou de soro para detectar, monitorizar ou avaliar o cancro |
US6458530B1 (en) | 1996-04-04 | 2002-10-01 | Affymetrix Inc. | Selecting tag nucleic acids |
US6300077B1 (en) | 1996-08-14 | 2001-10-09 | Exact Sciences Corporation | Methods for the detection of nucleic acids |
US5935793A (en) | 1996-09-27 | 1999-08-10 | The Chinese University Of Hong Kong | Parallel polynucleotide sequencing method using tagged primers |
US6124092A (en) | 1996-10-04 | 2000-09-26 | The Perkin-Elmer Corporation | Multiplex polynucleotide capture methods and compositions |
US6117631A (en) | 1996-10-29 | 2000-09-12 | Polyprobe, Inc. | Detection of antigens via oligonucleotide antibody conjugates |
US6046005A (en) | 1997-01-15 | 2000-04-04 | Incyte Pharmaceuticals, Inc. | Nucleic acid sequencing with solid phase capturable terminators comprising a cleavable linking group |
WO1999028505A1 (en) | 1997-12-03 | 1999-06-10 | Curagen Corporation | Methods and devices for measuring differential gene expression |
WO2000012687A1 (en) | 1998-08-28 | 2000-03-09 | Invitrogen Corporation | System for the rapid manipulation of nucleic acid sequences |
US6653077B1 (en) | 1998-09-04 | 2003-11-25 | Lynx Therapeutics, Inc. | Method of screening for genetic polymorphism |
US6503718B2 (en) | 1999-01-10 | 2003-01-07 | Exact Sciences Corporation | Methods for detecting mutations using primer extension for detecting disease |
US6573053B1 (en) | 1999-02-05 | 2003-06-03 | Amersham Biosciences Uk Limited | Analysis method |
US6629040B1 (en) | 1999-03-19 | 2003-09-30 | University Of Washington | Isotope distribution encoded tags for protein identification |
EP1165839A2 (en) | 1999-03-26 | 2002-01-02 | Whitehead Institute For Biomedical Research | Universal arrays |
ES2269129T3 (es) | 1999-04-09 | 2007-04-01 | Exact Sciences Corporation | Procedimientos para detectar acidos nucleicos reveladores de cancer. |
US6355431B1 (en) | 1999-04-20 | 2002-03-12 | Illumina, Inc. | Detection of nucleic acid amplification reactions using bead arrays |
CA2304260C (en) | 1999-04-20 | 2009-03-24 | Japan Bioindustry Association | Method for determining a concentration of target nucleic acid molecules, nucleic acid probes for the method and method for analyzing data obtained by the method |
US6242186B1 (en) | 1999-06-01 | 2001-06-05 | Oy Jurilab Ltd. | Method for detecting a risk of cancer and coronary heart disease and kit therefor |
US6326148B1 (en) | 1999-07-12 | 2001-12-04 | The Regents Of The University Of California | Detection of copy number changes in colon cancer |
US6440706B1 (en) | 1999-08-02 | 2002-08-27 | Johns Hopkins University | Digital amplification |
US6586177B1 (en) | 1999-09-08 | 2003-07-01 | Exact Sciences Corporation | Methods for disease detection |
US6849403B1 (en) | 1999-09-08 | 2005-02-01 | Exact Sciences Corporation | Apparatus and method for drug screening |
DE60043896D1 (de) | 1999-12-07 | 2010-04-08 | Exact Sciences Corp | Verfahren zum nachweis von lungenneoplasmen in fäkalen proben |
US6489114B2 (en) | 1999-12-17 | 2002-12-03 | Bio Merieux | Process for labeling a ribonucleic acid, and labeled RNA fragments which are obtained thereby |
AU2001238068A1 (en) | 2000-02-07 | 2001-08-14 | Illumina, Inc. | Nucleic acid detection methods using universal priming |
GB2364054B (en) | 2000-03-24 | 2002-05-29 | Smithkline Beecham Corp | Method of amplifying quinolone-resistance-determining-regions and identifying polymorphic variants thereof |
US20030207300A1 (en) | 2000-04-28 | 2003-11-06 | Matray Tracy J. | Multiplex analytical platform using molecular tags |
EP1158055A1 (fr) | 2000-05-26 | 2001-11-28 | Xu Qi University of Teaxs Laboratoire de Leucémie Chen | Méthode pour le diagnostic de cancers |
ATE380883T1 (de) | 2000-10-24 | 2007-12-15 | Univ Leland Stanford Junior | Direkte multiplex charakterisierung von genomischer dna |
US20020142345A1 (en) | 2000-12-22 | 2002-10-03 | Nelsen Anita J. | Methods for encoding and decoding complex mixtures in arrayed assays |
US20030049616A1 (en) | 2001-01-08 | 2003-03-13 | Sydney Brenner | Enzymatic synthesis of oligonucleotide tags |
US6849404B2 (en) | 2001-05-07 | 2005-02-01 | Bioneer Corporation | Polymerase chain reaction of DNA of which base sequence is completely unidentified |
US7406385B2 (en) | 2001-10-25 | 2008-07-29 | Applera Corporation | System and method for consensus-calling with per-base quality values for sample assemblies |
DE60207979T2 (de) | 2002-03-05 | 2006-09-28 | Epigenomics Ag | Verfahren und Vorrichtung zur Bestimmung der Gewebespezifität von freier DNA in Körperflüssigkeiten |
US20030186251A1 (en) | 2002-04-01 | 2003-10-02 | Brookhaven Science Associates, Llc | Genome sequence tags |
US7727720B2 (en) | 2002-05-08 | 2010-06-01 | Ravgen, Inc. | Methods for detection of genetic disorders |
AU2003291481A1 (en) | 2002-11-11 | 2004-06-03 | Affymetrix, Inc. | Methods for identifying dna copy number changes |
US7822555B2 (en) | 2002-11-11 | 2010-10-26 | Affymetrix, Inc. | Methods for identifying DNA copy number changes |
US10229244B2 (en) | 2002-11-11 | 2019-03-12 | Affymetrix, Inc. | Methods for identifying DNA copy number changes using hidden markov model based estimations |
US7704687B2 (en) | 2002-11-15 | 2010-04-27 | The Johns Hopkins University | Digital karyotyping |
JP2007525151A (ja) | 2003-01-29 | 2007-09-06 | 454 コーポレーション | 一本鎖dnaライブラリーの調製方法 |
EP1606417A2 (en) | 2003-03-07 | 2005-12-21 | Rubicon Genomics Inc. | In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna |
WO2006102264A1 (en) | 2005-03-18 | 2006-09-28 | Fluidigm Corporation | Thermal reaction device and method for using the same |
US20040259118A1 (en) | 2003-06-23 | 2004-12-23 | Macevicz Stephen C. | Methods and compositions for nucleic acid sequence analysis |
CA2531105C (en) | 2003-07-05 | 2015-03-17 | The Johns Hopkins University | Method and compositions for detection and enumeration of genetic variations |
EP1524321B2 (en) | 2003-10-16 | 2014-07-23 | Sequenom, Inc. | Non-invasive detection of fetal genetic traits |
DE10348407A1 (de) | 2003-10-17 | 2005-05-19 | Widschwendter, Martin, Prof. | Prognostische und diagnostische Marker für Zell-proliferative Erkrankungen von Brustgeweben |
US20070111233A1 (en) | 2003-10-30 | 2007-05-17 | Bianchi Diana W | Prenatal diagnosis using cell-free fetal DNA in amniotic fluid |
JP2007524410A (ja) | 2004-01-23 | 2007-08-30 | リングヴィテ エーエス | ポリヌクレオチドライゲーション反応の改良 |
JP2007521833A (ja) | 2004-02-12 | 2007-08-09 | コンパス ジェネティクス エルエルシー | 配列特異的分類による遺伝的分析 |
US20060046258A1 (en) | 2004-02-27 | 2006-03-02 | Lapidus Stanley N | Applications of single molecule sequencing |
US20100216153A1 (en) | 2004-02-27 | 2010-08-26 | Helicos Biosciences Corporation | Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities |
WO2005111242A2 (en) | 2004-05-10 | 2005-11-24 | Parallele Bioscience, Inc. | Digital profiling of polynucleotide populations |
US7378423B2 (en) | 2004-06-11 | 2008-05-27 | Japan Tobacco Inc. | Pyrimidine compound and medical use thereof |
US7276720B2 (en) | 2004-07-19 | 2007-10-02 | Helicos Biosciences Corporation | Apparatus and methods for analyzing samples |
US20060035258A1 (en) | 2004-08-06 | 2006-02-16 | Affymetrix, Inc. | Methods for identifying DNA copy number changes |
US7937225B2 (en) | 2004-09-03 | 2011-05-03 | New York University | Systems, methods and software arrangements for detection of genome copy number variation |
EP1647600A3 (en) | 2004-09-17 | 2006-06-28 | Affymetrix, Inc. (A US Entity) | Methods for identifying biological samples by addition of nucleic acid bar-code tags |
WO2006047787A2 (en) | 2004-10-27 | 2006-05-04 | Exact Sciences Corporation | Method for monitoring disease progression or recurrence |
US7424371B2 (en) | 2004-12-21 | 2008-09-09 | Helicos Biosciences Corporation | Nucleic acid analysis |
US7393665B2 (en) | 2005-02-10 | 2008-07-01 | Population Genetics Technologies Ltd | Methods and compositions for tagging and identifying polynucleotides |
ITRM20050068A1 (it) | 2005-02-17 | 2006-08-18 | Istituto Naz Per Le Malattie I | Metodo per la rivelazione di acidi nucleici di agenti patogeni batterici o di parassiti nelle urine. |
US20060211030A1 (en) | 2005-03-16 | 2006-09-21 | Sydney Brenner | Methods and compositions for assay readouts on multiple analytical platforms |
ATE406463T1 (de) | 2005-04-06 | 2008-09-15 | Maurice Stroun | Methode zur krebsdiagnose mittels nachweis von dna und rna im kreislauf |
US20070020640A1 (en) | 2005-07-21 | 2007-01-25 | Mccloskey Megan L | Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis |
US7666593B2 (en) | 2005-08-26 | 2010-02-23 | Helicos Biosciences Corporation | Single molecule sequencing of captured nucleic acids |
CA2623539C (en) | 2005-09-29 | 2015-12-15 | Keygene N.V. | High throughput screening of mutagenized populations |
US7537897B2 (en) * | 2006-01-23 | 2009-05-26 | Population Genetics Technologies, Ltd. | Molecular counting |
US20070172839A1 (en) | 2006-01-24 | 2007-07-26 | Smith Douglas R | Asymmetrical adapters and methods of use thereof |
US8383338B2 (en) | 2006-04-24 | 2013-02-26 | Roche Nimblegen, Inc. | Methods and systems for uniform enrichment of genomic regions |
US7702468B2 (en) | 2006-05-03 | 2010-04-20 | Population Diagnostics, Inc. | Evaluating genetic disorders |
CN101449162B (zh) | 2006-05-18 | 2013-07-31 | 分子压型学会股份有限公司 | 确定针对病状的个性化医疗介入的系统和方法 |
WO2007147018A1 (en) | 2006-06-14 | 2007-12-21 | Cellpoint Diagnostics, Inc. | Analysis of rare cell-enriched samples |
FR2904833A1 (fr) * | 2006-08-11 | 2008-02-15 | Bioquanta Sarl | Procede de dosage d'acide nuclieque par fluorescence |
DK2518162T3 (en) | 2006-11-15 | 2018-06-18 | Biospherex Llc | Multi-tag sequencing and ecogenomic analysis |
WO2008070144A2 (en) | 2006-12-06 | 2008-06-12 | Duke University | Imprinted genes and disease |
EP2126127B1 (en) | 2007-01-25 | 2016-09-28 | Dana-Farber Cancer Institute, Inc. | Use of anti-egfr antibodies in treatment of egfr mutant mediated disease |
CL2008000717A1 (es) | 2007-03-13 | 2008-09-22 | Amgen Inc | Metodo para pronosticar si un paciente sera no respondedor al tratamiento con un agente de union especifica a un polipeptido de egfr que comprende determinar la presencia o ausencia de una mutacion de k-ras en un tumor del paciente. |
WO2008148072A2 (en) | 2007-05-24 | 2008-12-04 | The Brigham And Women's Hospital, Inc. | Disease-associated genetic variations and methods for obtaining and using same |
JP2010528608A (ja) | 2007-06-01 | 2010-08-26 | 454 ライフ サイエンシーズ コーポレイション | 複合的な混合物から個々の試料を特定するためのシステムおよび方法 |
EP2155855B1 (en) | 2007-06-06 | 2016-10-12 | Pacific Biosciences of California, Inc. | Methods and processes for calling bases in sequence by incorporation methods |
KR20230117256A (ko) | 2007-07-23 | 2023-08-07 | 더 차이니즈 유니버시티 오브 홍콩 | 대규모 병렬 게놈 서열분석을 이용한 태아 염색체 이수성의진단 방법 |
US20100112590A1 (en) | 2007-07-23 | 2010-05-06 | The Chinese University Of Hong Kong | Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment |
US20090053719A1 (en) | 2007-08-03 | 2009-02-26 | The Chinese University Of Hong Kong | Analysis of nucleic acids by digital pcr |
ATE541946T1 (de) * | 2007-09-07 | 2012-02-15 | Fluidigm Corp | Verfahren und system zur bestimmung von genkopiezahlvarianten |
CN102007407A (zh) | 2007-11-21 | 2011-04-06 | 考斯摩斯德公司 | 基因组鉴定系统 |
WO2009102632A2 (en) | 2008-02-12 | 2009-08-20 | Biocept, Inc. | Method for isolating cell free apoptotic or fetal nucleic acids |
US8216789B2 (en) | 2008-02-27 | 2012-07-10 | University Of Washington | Diagnostic panel of cancer antibodies and methods for use |
CA2718137A1 (en) | 2008-03-26 | 2009-10-01 | Sequenom, Inc. | Restriction endonuclease enhanced polymorphic sequence detection |
CN102084001B (zh) | 2008-03-28 | 2015-03-18 | 加利福尼亚太平洋生物科学股份有限公司 | 用于核酸测序的组合物和方法 |
UA103319C2 (en) | 2008-05-06 | 2013-10-10 | Глаксосмитклайн Ллк | Thiazole- and oxazole-benzene sulfonamide compounds |
US20110160290A1 (en) | 2008-05-21 | 2011-06-30 | Muneesh Tewari | Use of extracellular rna to measure disease |
US20090298709A1 (en) | 2008-05-28 | 2009-12-03 | Affymetrix, Inc. | Assays for determining telomere length and repeated sequence copy number |
DE102008025656B4 (de) | 2008-05-28 | 2016-07-28 | Genxpro Gmbh | Verfahren zur quantitativen Analyse von Nukleinsäuren, Marker dafür und deren Verwendung |
US20100041048A1 (en) | 2008-07-31 | 2010-02-18 | The Johns Hopkins University | Circulating Mutant DNA to Assess Tumor Dynamics |
US20100062494A1 (en) | 2008-08-08 | 2010-03-11 | President And Fellows Of Harvard College | Enzymatic oligonucleotide pre-adenylation |
US20100069250A1 (en) | 2008-08-16 | 2010-03-18 | The Board Of Trustees Of The Leland Stanford Junior University | Digital PCR Calibration for High Throughput Sequencing |
EP3216874A1 (en) | 2008-09-05 | 2017-09-13 | TOMA Biosciences, Inc. | Methods for stratifying and annotating cancer drug treatment options |
US8383345B2 (en) | 2008-09-12 | 2013-02-26 | University Of Washington | Sequence tag directed subassembly of short sequencing reads into long sequencing reads |
EP2952589B1 (en) | 2008-09-20 | 2018-02-14 | The Board of Trustees of The Leland Stanford Junior University | Noninvasive diagnosis of fetal aneuploidy by sequencing |
US8236532B2 (en) | 2008-12-23 | 2012-08-07 | Illumina, Inc. | Multibase delivery for long reads in sequencing by synthesis protocols |
US20100323348A1 (en) | 2009-01-31 | 2010-12-23 | The Regents Of The University Of Colorado, A Body Corporate | Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process |
US20120165202A1 (en) | 2009-04-30 | 2012-06-28 | Good Start Genetics, Inc. | Methods and compositions for evaluating genetic markers |
US9085798B2 (en) | 2009-04-30 | 2015-07-21 | Prognosys Biosciences, Inc. | Nucleic acid constructs and methods of use |
US20130143747A1 (en) | 2011-12-05 | 2013-06-06 | Myriad Genetics, Incorporated | Methods of detecting cancer |
US9524369B2 (en) | 2009-06-15 | 2016-12-20 | Complete Genomics, Inc. | Processing and analysis of complex nucleic acid sequence data |
JP2012531202A (ja) | 2009-06-25 | 2012-12-10 | フレッド ハチンソン キャンサー リサーチ センター | 適応免疫を測定する方法 |
US20120220478A1 (en) | 2009-07-20 | 2012-08-30 | Bar Harbor Biotechnology, Inc. | Methods for assessing disease risk |
RS59181B1 (sr) | 2009-10-16 | 2019-10-31 | Novartis Ag | Kombinacija koja sadrži inhibitor mek i inhibitor b-raf |
AU2010311535B2 (en) | 2009-10-26 | 2015-05-21 | Lifecodexx Ag | Means and methods for non-invasive diagnosis of chromosomal aneuploidy |
JP2013510580A (ja) | 2009-11-12 | 2013-03-28 | エソテリックス ジェネティック ラボラトリーズ, エルエルシー | 遺伝子座のコピー数の分析 |
US9023769B2 (en) | 2009-11-30 | 2015-05-05 | Complete Genomics, Inc. | cDNA library for nucleic acid sequencing |
US9752187B2 (en) | 2009-12-11 | 2017-09-05 | Nucleix | Categorization of DNA samples |
US9315857B2 (en) | 2009-12-15 | 2016-04-19 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse label-tags |
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
EP3660165B1 (en) | 2009-12-22 | 2023-01-04 | Sequenom, Inc. | Processes and kits for identifying aneuploidy |
US9260745B2 (en) | 2010-01-19 | 2016-02-16 | Verinata Health, Inc. | Detecting and classifying copy number variation |
AU2010343276B2 (en) | 2010-01-19 | 2015-05-28 | Verinata Health, Inc. | Methods for determining fraction of fetal nucleic acid in maternal samples |
US20120100548A1 (en) | 2010-10-26 | 2012-04-26 | Verinata Health, Inc. | Method for determining copy number variations |
US20110177512A1 (en) | 2010-01-19 | 2011-07-21 | Predictive Biosciences, Inc. | Method for assuring amplification of an abnormal nucleic acid in a sample |
US10388403B2 (en) | 2010-01-19 | 2019-08-20 | Verinata Health, Inc. | Analyzing copy number variation in the detection of cancer |
US20120010085A1 (en) | 2010-01-19 | 2012-01-12 | Rava Richard P | Methods for determining fraction of fetal nucleic acids in maternal samples |
US9323888B2 (en) * | 2010-01-19 | 2016-04-26 | Verinata Health, Inc. | Detecting and classifying copy number variation |
WO2011091046A1 (en) | 2010-01-19 | 2011-07-28 | Verinata Health, Inc. | Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing |
EP2536854B1 (en) | 2010-02-18 | 2017-07-19 | The Johns Hopkins University | Personalized tumor biomarkers |
MX340392B (es) | 2010-02-25 | 2016-07-06 | Dana Farber Cancer Inst Inc | Mutaciones del protooncogen de serina/treonina-proteina cinasa b-raf (braf) que confieren resistencia a los inhibidores del protooncogen de serina/treonina-proteina cinasa b-raf. |
EP2547698B1 (en) | 2010-03-14 | 2015-07-29 | The Translational Genomics Research Institute | Methods of determining susceptibility of tumors to tyrosine kinase inhibitors |
CN101967517B (zh) | 2010-03-19 | 2012-11-07 | 黄乐群 | 一种无需借助pcr的基因检测方法 |
CA2796578C (en) | 2010-04-16 | 2021-11-23 | Chronix Biomedical | Breast cancer associated circulating nucleic acid biomarkers |
US9255291B2 (en) | 2010-05-06 | 2016-02-09 | Bioo Scientific Corporation | Oligonucleotide ligation methods for improving data quality and throughput using massively parallel sequencing |
US20130143214A1 (en) | 2010-06-04 | 2013-06-06 | Chronix Biomedical | Prostate cancer associated circulating nucleic acid biomarkers |
ES2960184T3 (es) | 2010-06-09 | 2024-03-01 | Keygene Nv | Códigos de barras de secuencias combinatorias para el cribado de alto rendimiento |
EP2400035A1 (en) | 2010-06-28 | 2011-12-28 | Technische Universität München | Methods and compositions for diagnosing gastrointestinal stromal tumors |
WO2012006291A2 (en) * | 2010-07-06 | 2012-01-12 | Life Technologies Corporation | Systems and methods to detect copy number variation |
FR2962369B1 (fr) | 2010-07-07 | 2014-03-21 | Michelin Soc Tech | Armature de sommet pour pneumatique d'avion |
SG10201505723UA (en) | 2010-07-23 | 2015-09-29 | Harvard College | Methods for detecting signatures of disease or conditions in bodily fluids |
CN104759297B (zh) | 2010-07-29 | 2018-02-23 | Toto株式会社 | 光催化剂涂装体和光催化剂涂覆液 |
DK2601609T3 (en) | 2010-08-02 | 2017-06-06 | Population Bio Inc | COMPOSITIONS AND METHODS FOR DISCOVERING MUTATIONS CAUSING GENETIC DISORDERS |
US20120034603A1 (en) | 2010-08-06 | 2012-02-09 | Tandem Diagnostics, Inc. | Ligation-based detection of genetic variants |
US11031095B2 (en) | 2010-08-06 | 2021-06-08 | Ariosa Diagnostics, Inc. | Assay systems for determination of fetal copy number variation |
EP2426217A1 (en) | 2010-09-03 | 2012-03-07 | Centre National de la Recherche Scientifique (CNRS) | Analytical methods for cell free nucleic acids and applications |
WO2012034061A2 (en) | 2010-09-09 | 2012-03-15 | Traxxsson, Llc | Combination methods of diagnosing cancer in a patient |
EP3115468B1 (en) | 2010-09-21 | 2018-07-25 | Agilent Technologies, Inc. | Increasing confidence of allele calls with molecular counting |
WO2012042374A2 (en) | 2010-10-01 | 2012-04-05 | Anssi Jussi Nikolai Taipale | Method of determining number or concentration of molecules |
GB2497912B (en) | 2010-10-08 | 2014-06-04 | Harvard College | High-throughput single cell barcoding |
US8725422B2 (en) | 2010-10-13 | 2014-05-13 | Complete Genomics, Inc. | Methods for estimating genome-wide copy number variations |
TR201810530T4 (tr) | 2010-10-22 | 2018-08-27 | Cold Spring Harbor Laboratory | Genomik kopya sayısı bilgisi elde etmek için nükleik asitlerin varyete sayımı. |
WO2012066451A1 (en) | 2010-11-15 | 2012-05-24 | Pfizer Inc. | Prognostic and predictive gene signature for colon cancer |
WO2012071621A1 (en) | 2010-11-30 | 2012-06-07 | The Chinese University Of Hong Kong | Detection of genetic or molecular aberrations associated with cancer |
US9163281B2 (en) | 2010-12-23 | 2015-10-20 | Good Start Genetics, Inc. | Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction |
CA2822439A1 (en) | 2010-12-23 | 2012-06-28 | Sequenom, Inc. | Fetal genetic variation detection |
KR20140024270A (ko) | 2010-12-30 | 2014-02-28 | 파운데이션 메디신 인코포레이티드 | 종양 샘플의 다유전자 분석의 최적화 |
WO2012097053A1 (en) | 2011-01-11 | 2012-07-19 | Via Genomes, Inc. | Methods, systems, databases, kits and arrays for screening for and predicting the risk of and identifying the presence of tumors and cancers |
ES2805874T3 (es) | 2011-01-17 | 2021-02-15 | Life Technologies Corp | Ligación enzimática de ácidos nucleicos |
US20120190020A1 (en) | 2011-01-25 | 2012-07-26 | Aria Diagnostics, Inc. | Detection of genetic abnormalities |
WO2012106559A1 (en) | 2011-02-02 | 2012-08-09 | Translational Genomics Research Institute | Biomarkers and methods of use thereof |
CN103608818B (zh) * | 2011-02-09 | 2017-12-08 | 纳特拉公司 | 非侵入性产前倍性识别装置 |
US20120238464A1 (en) | 2011-03-18 | 2012-09-20 | Baylor Research Institute | Biomarkers for Predicting the Recurrence of Colorectal Cancer Metastasis |
US9260753B2 (en) | 2011-03-24 | 2016-02-16 | President And Fellows Of Harvard College | Single cell nucleic acid detection and analysis |
US20150065358A1 (en) | 2011-03-30 | 2015-03-05 | Verinata Health, Inc. | Method for verifying bioassay samples |
US9411937B2 (en) | 2011-04-15 | 2016-08-09 | Verinata Health, Inc. | Detecting and classifying copy number variation |
EP2697397B1 (en) | 2011-04-15 | 2017-04-05 | The Johns Hopkins University | Safe sequencing system |
EP3395957B1 (en) | 2011-04-25 | 2020-08-12 | Bio-Rad Laboratories, Inc. | Methods and compositions for nucleic acid analysis |
US8697408B2 (en) | 2011-05-06 | 2014-04-15 | New England Biolabs, Inc. | Ligation enhancement |
US9074204B2 (en) | 2011-05-20 | 2015-07-07 | Fluidigm Corporation | Nucleic acid encoding reactions |
WO2012162584A1 (en) * | 2011-05-26 | 2012-11-29 | Synta Pharmaceuticals Corp. | Combination therapy of hsp90 inhibitory compounds with chk inhibitors |
US9752176B2 (en) | 2011-06-15 | 2017-09-05 | Ginkgo Bioworks, Inc. | Methods for preparative in vitro cloning |
KR101454886B1 (ko) | 2011-08-01 | 2014-11-03 | 주식회사 셀레믹스 | 핵산분자의 제조방법 |
US10704164B2 (en) | 2011-08-31 | 2020-07-07 | Life Technologies Corporation | Methods, systems, computer readable media, and kits for sample identification |
US9834766B2 (en) | 2011-09-02 | 2017-12-05 | Atreca, Inc. | DNA barcodes for multiplexed sequencing |
US8712697B2 (en) | 2011-09-07 | 2014-04-29 | Ariosa Diagnostics, Inc. | Determination of copy number variations using binomial probability calculations |
US20130079241A1 (en) | 2011-09-15 | 2013-03-28 | Jianhua Luo | Methods for Diagnosing Prostate Cancer and Predicting Prostate Cancer Relapse |
US10196681B2 (en) * | 2011-10-06 | 2019-02-05 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US10424394B2 (en) | 2011-10-06 | 2019-09-24 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US20140242588A1 (en) | 2011-10-06 | 2014-08-28 | Sequenom, Inc | Methods and processes for non-invasive assessment of genetic variations |
US9367663B2 (en) | 2011-10-06 | 2016-06-14 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US20130102485A1 (en) | 2011-10-19 | 2013-04-25 | Inhan Lee | Method of Determining a Diseased State in a Subject |
NO3051026T3 (ja) | 2011-10-21 | 2018-07-28 | ||
PL2768985T3 (pl) | 2011-10-21 | 2019-10-31 | Chronix Biomedical | Biomarkery będące krążącymi kwasami nukleinowymi związane z rakiem jelita grubego |
US20130122499A1 (en) | 2011-11-14 | 2013-05-16 | Viomics, Inc. | System and method of detecting local copy number variation in dna samples |
JP5418579B2 (ja) * | 2011-12-06 | 2014-02-19 | 株式会社デンソー | 開閉眼検出装置 |
WO2013086352A1 (en) | 2011-12-07 | 2013-06-13 | Chronix Biomedical | Prostate cancer associated circulating nucleic acid biomarkers |
JP6072819B2 (ja) | 2011-12-08 | 2017-02-01 | ファイヴ3 ゲノミクス,エルエルシー | Mdm2を含む二重微小染色体およびその方法 |
CN108611398A (zh) | 2012-01-13 | 2018-10-02 | Data生物有限公司 | 通过新一代测序进行基因分型 |
SI3363901T1 (sl) | 2012-02-17 | 2021-04-30 | Fred Hutchinson Cancer Research Center | Sestavki in postopki za natančno identifikacijo mutacij |
GB2513024B (en) | 2012-02-27 | 2016-08-31 | Cellular Res Inc | A clonal amplification method |
ES2776673T3 (es) | 2012-02-27 | 2020-07-31 | Univ North Carolina Chapel Hill | Métodos y usos para etiquetas moleculares |
WO2013128281A1 (en) | 2012-02-28 | 2013-09-06 | Population Genetics Technologies Ltd | Method for attaching a counter sequence to a nucleic acid sample |
WO2013130791A1 (en) | 2012-02-29 | 2013-09-06 | Dana-Farber Cancer Institute, Inc. | Compositions, kits, and methods for the identification, assessment, prevention, and therapy of cancer |
US9892230B2 (en) | 2012-03-08 | 2018-02-13 | The Chinese University Of Hong Kong | Size-based analysis of fetal or tumor DNA fraction in plasma |
CA2867293C (en) | 2012-03-13 | 2020-09-01 | Abhijit Ajit PATEL | Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing |
WO2013142213A1 (en) | 2012-03-20 | 2013-09-26 | Wake Forest University Health Sciences | Methods, systems, and computer readable media for tracking and verifying receipt of contents of a delivery within an organization |
PT2828218T (pt) | 2012-03-20 | 2020-11-11 | Univ Washington Through Its Center For Commercialization | Métodos para baixar a taxa de erro da sequenciação paralela massiva de adn utilizando sequenciação duplex de consensus |
FI2831279T3 (fi) | 2012-03-26 | 2023-05-23 | Univ Johns Hopkins | Nopea aneuploidian havaitseminen |
US8209130B1 (en) | 2012-04-04 | 2012-06-26 | Good Start Genetics, Inc. | Sequence assembly |
CA2870969C (en) | 2012-04-19 | 2023-10-03 | Aoy Tomita Mitchell | Highly sensitive surveillance using detection of cell free dna |
CA2873585C (en) | 2012-05-14 | 2021-11-09 | Cb Biotechnologies, Inc. | Method for increasing accuracy in quantitative detection of polynucleotides |
WO2013181170A1 (en) * | 2012-05-31 | 2013-12-05 | Board Of Regents, The University Of Texas System | Method for accurate sequencing of dna |
EP2859123A4 (en) | 2012-06-11 | 2015-12-16 | Sequenta Inc | METHOD OF SEQUENCE DETERMINATION USING SEQUENCE TAGS |
US11261494B2 (en) | 2012-06-21 | 2022-03-01 | The Chinese University Of Hong Kong | Method of measuring a fractional concentration of tumor DNA |
WO2014004726A1 (en) | 2012-06-26 | 2014-01-03 | Caifu Chen | Methods, compositions and kits for the diagnosis, prognosis and monitoring of cancer |
EP2875149B1 (en) | 2012-07-20 | 2019-12-04 | Verinata Health, Inc. | Detecting and classifying copy number variation in a cancer genome |
US11180812B2 (en) * | 2012-08-17 | 2021-11-23 | Cornell University | Use of DNA in circulating exosomes as a diagnostic marker for metastatic disease |
US20160040229A1 (en) | 2013-08-16 | 2016-02-11 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
JP2015527374A (ja) | 2012-09-04 | 2015-09-17 | グラクソスミスクライン・リミテッド・ライアビリティ・カンパニーGlaxoSmithKline LLC | アジュバント癌治療の方法 |
US20140066317A1 (en) | 2012-09-04 | 2014-03-06 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
DE202013012824U1 (de) | 2012-09-04 | 2020-03-10 | Guardant Health, Inc. | Systeme zum Erfassen von seltenen Mutationen und einer Kopienzahlvariation |
WO2014093330A1 (en) | 2012-12-10 | 2014-06-19 | Clearfork Bioscience, Inc. | Methods for targeted genomic analysis |
WO2014107548A1 (en) | 2013-01-05 | 2014-07-10 | Foundation Medicine, Inc. | System and method for outcome tracking and analysis |
CA3150658A1 (en) | 2013-01-18 | 2014-07-24 | Foundation Medicine, Inc. | Methods of treating cholangiocarcinoma |
US20160034638A1 (en) | 2013-03-14 | 2016-02-04 | University Of Rochester | System and Method for Detecting Population Variation from Nucleic Acid Sequencing Data |
US9890425B2 (en) | 2013-03-15 | 2018-02-13 | Abbott Molecular Inc. | Systems and methods for detection of genomic copy number changes |
WO2014145078A1 (en) | 2013-03-15 | 2014-09-18 | Verinata Health, Inc. | Generating cell-free dna libraries directly from blood |
EP2971152B1 (en) | 2013-03-15 | 2018-08-01 | The Board Of Trustees Of The Leland Stanford Junior University | Identification and use of circulating nucleic acid tumor markers |
CA2906076A1 (en) | 2013-03-15 | 2014-09-18 | Abvitro, Inc. | Single cell bar-coding for antibody discovery |
GB2528205B (en) | 2013-03-15 | 2020-06-03 | Guardant Health Inc | Systems and methods to detect rare mutations and copy number variation |
EP2977464A4 (en) | 2013-03-19 | 2016-10-19 | Toppan Printing Co Ltd | PROCEDURE FOR PREDICTING SENSITIVITY TO EGFR HEMMER |
EP4321628A3 (en) | 2013-05-23 | 2024-04-24 | The Board of Trustees of the Leland Stanford Junior University | Transposition into native chromatin for personal epigenomics |
JP2015096049A (ja) | 2013-11-15 | 2015-05-21 | 凸版印刷株式会社 | Vegf阻害剤長期奏功性予測方法 |
ES2822125T3 (es) | 2013-12-28 | 2021-04-29 | Guardant Health Inc | Métodos y sistemas para detectar variantes genéticas |
CN106574296B (zh) | 2014-04-14 | 2021-03-02 | 耶路撒冷希伯来大学伊森姆研究发展公司 | 用于测定dna的组织或细胞来源的方法和试剂盒 |
WO2015175705A1 (en) | 2014-05-13 | 2015-11-19 | Board Of Regents, The University Of Texas System | Gene mutations and copy number alterations of egfr, kras and met |
KR102441391B1 (ko) | 2014-07-25 | 2022-09-07 | 유니버시티 오브 워싱톤 | 무세포 dna를 생성하는 조직 및/또는 세포 유형을 결정하는 방법 및 이를 사용하여 질환 또는 장애를 확인하는 방법 |
SI3178941T1 (sl) | 2014-07-25 | 2022-04-29 | Bgi Genomics Co., Limited | Postopek za določanje deleža brezceličnih fetalnih nukleinskih kislin v vzorcu periferne krvi nosečnice in njegova uporaba |
US20160053301A1 (en) | 2014-08-22 | 2016-02-25 | Clearfork Bioscience, Inc. | Methods for quantitative genetic analysis of cell free dna |
US10733903B2 (en) | 2014-09-10 | 2020-08-04 | Pathway Genomics Corporation | Health and wellness management methods and systems useful for the practice thereof |
US11085084B2 (en) | 2014-09-12 | 2021-08-10 | The Board Of Trustees Of The Leland Stanford Junior University | Identification and use of circulating nucleic acids |
CN107771221B (zh) | 2015-02-10 | 2021-11-02 | 香港中文大学 | 用于癌症筛查和胎儿分析的突变检测 |
US10844428B2 (en) | 2015-04-28 | 2020-11-24 | Illumina, Inc. | Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS) |
EP4043584A1 (en) | 2015-12-08 | 2022-08-17 | Twinstrand Biosciences, Inc. | Improved adapters, methods, and compositions for duplex sequencing |
US20190085406A1 (en) | 2016-04-14 | 2019-03-21 | Guardant Health, Inc. | Methods for early detection of cancer |
-
2014
- 2014-12-24 ES ES19163403T patent/ES2822125T3/es active Active
- 2014-12-24 CA CA2934822A patent/CA2934822A1/en active Pending
- 2014-12-24 ES ES18156447T patent/ES2784450T3/es active Active
- 2014-12-24 EP EP20183626.9A patent/EP3771745A1/en active Pending
- 2014-12-24 AU AU2014369841A patent/AU2014369841B2/en active Active
- 2014-12-24 SG SG10201804519RA patent/SG10201804519RA/en unknown
- 2014-12-24 EP EP19163403.9A patent/EP3524694B1/en active Active
- 2014-12-24 JP JP2016543068A patent/JP6571665B2/ja active Active
- 2014-12-24 SG SG11201604923XA patent/SG11201604923XA/en unknown
- 2014-12-24 ES ES14874157.2T patent/ES2660989T3/es active Active
- 2014-12-24 EP EP18156447.7A patent/EP3378952B1/en active Active
- 2014-12-24 EP EP14874157.2A patent/EP3087204B1/en not_active Revoked
- 2014-12-24 CN CN201480076496.9A patent/CN106062214B/zh active Active
- 2014-12-24 CN CN202010408264.6A patent/CN111534580A/zh active Pending
- 2014-12-24 WO PCT/US2014/072383 patent/WO2015100427A1/en active Application Filing
-
2015
- 2015-09-22 US US14/861,989 patent/US9920366B2/en active Active
-
2018
- 2018-02-08 US US15/892,178 patent/US10883139B2/en active Active
-
2019
- 2019-03-29 AU AU2019202216A patent/AU2019202216B2/en active Active
- 2019-03-29 JP JP2019066989A patent/JP6921888B2/ja active Active
- 2019-10-14 US US16/601,168 patent/US10801063B2/en active Active
- 2019-12-13 US US16/714,579 patent/US10889858B2/en active Active
-
2020
- 2020-01-07 US US16/672,267 patent/US11118221B2/en active Active
- 2020-06-16 JP JP2020103559A patent/JP7242609B2/ja active Active
- 2020-07-31 US US16/945,124 patent/US11149306B2/en active Active
-
2021
- 2021-02-04 US US17/167,974 patent/US11149307B2/en active Active
- 2021-03-31 AU AU2021202012A patent/AU2021202012A1/en active Pending
- 2021-08-24 US US17/410,903 patent/US11434531B2/en active Active
- 2021-10-27 US US17/512,581 patent/US11767555B2/en active Active
- 2021-10-27 US US17/512,587 patent/US11767556B2/en active Active
- 2021-12-10 JP JP2021200633A patent/JP2022031905A/ja not_active Withdrawn
- 2021-12-28 US US17/563,781 patent/US11649491B2/en active Active
- 2021-12-28 US US17/563,816 patent/US11667967B2/en active Active
-
2022
- 2022-06-28 US US17/809,544 patent/US11639525B2/en active Active
- 2022-06-30 US US17/810,103 patent/US11639526B2/en active Active
-
2023
- 2023-05-12 US US18/316,864 patent/US11959139B2/en active Active
- 2023-05-12 US US18/316,870 patent/US20240018582A1/en active Pending
- 2023-10-20 US US18/491,071 patent/US20240043922A1/en active Pending
- 2023-11-13 JP JP2023192893A patent/JP2024010242A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7242609B2 (ja) | 遺伝的バリアントを検出するための方法およびシステム | |
US20240132950A1 (en) | Methods and systems for detecting genetic variants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231113 |